Riesgos del navegador Atlas de OpenAI

El portal de noticias tecnológicas WWWhat’s New publicó recientemente un artículo donde se analizaban los riesgos de utilizar el navegador Atlas de OpenAI, que integra ChatGPT en la navegación web.

Atlas permite interactuar con páginas web mediante un modo agente, capaz de ejecutar acciones automáticas: buscar productos, resumir documentos o gestionar tareas en línea. Esta autonomía, aunque útil, también multiplica los riesgos de seguridad.

Atlas vulnerable a la inyección de prompts

El riesgo más grave identificado es la inyección de prompts, donde instrucciones maliciosas se ocultan en textos, estilos invisibles o documentos aparentemente inocuos, manipulando al agente IA para realizar acciones no deseadas. Un ejemplo documentado fue un Google Docs que incluía instrucciones ocultas para cambiar las respuestas del modelo.

Si bien puede parecer una curiosidad, estas técnicas podrían permitir desde exfiltrar información sensible hasta ejecutar acciones no autorizadas en cuentas del usuario.

Medidas de seguridad de OpenAI

OpenAI afirma haber limitado ciertos permisos del modo agente: por ejemplo, la IA no puede ejecutar código directamente en el navegador, ni descargar archivos, ni acceder a otras aplicaciones, contraseñas o datos de autocompletar.

Para que el agente use cuentas personales del usuario, se requiere aprobación explícita.

OpenAI afirma que han realizado pruebas intensivas y entrenado el modelo para que identifique y rechace instrucciones maliciosas ocultas.

También se han aplicado capas de protección superpuestas y sistemas de detección de ataques más avanzados. No obstante, reconocen que la inyección de prompts sigue siendo un problema “sin resolver” y en constante evolución.

El equipo de OpenAI insta a los usuarios a monitorear cuidadosamente las acciones del agente, lo que ya muestra un reconocimiento de que los controles automáticos no son suficientes en la fecha actual.

Fuente: WWWhat’s New

¿Qué es la “inyección de prompts” y por qué es peligrosa en Atlas?

La inyección de prompts consiste en ocultar instrucciones maliciosas dentro de contenido web, texto invisible, estilos tenues, estructura oculta, que el agente IA interpreta como comandos legítimos. En Atlas, esto puede llevar al agente a ejecutar acciones no autorizadas.

¿Atlas puede robar contraseñas o datos sensibles?

En el caso de que el agente sea engañado para actuar sobre sesiones abiertas o pedir credenciales, es posible que el navegador Atlas robe contraseñas o que queden expuestas. Aunque OpenAI afirma que el agente no puede acceder directamente a contraseñas guardadas ni ejecutar código sin permiso.

¿Cómo puedo protegerme si uso Atlas?

Evita activar funciones agente sin supervisión, revisando manualmente cada acción crítica.

No es recomendable llevar a cabo tareas sensibles (banca, acceso a datos personales) dentro del entorno del agente.

Evita pegar contenido de fuentes no confiables si el agente está activo.

Actualiza el navegador siempre que puedas a la última versión, con tal de descargar los parches de seguridad recientes.

Revisa siempre las acciones propuestas antes de que se ejecuten.

En Forlopd ayudamos a empresas de diferentes sectores de actividad y volumen de empleados a mejorar sus procesos para cumplir con las exigencias normativas. Si necesitas saber si tu entidad cumple con ellas, puedes solicitarnos un análisis gratuito y nuestros especialistas te guiarán en el proceso.

Seguridad OpenAI Atlas