Lovable, una plataforma generativa de inteligencia sintético (AI) que permite crear aplicaciones web de pila completa utilizando indicaciones basadas en texto, es la más susceptible para los ataques de jailbreak, lo que permite que los ciberdicentes cibernéticos y aspirantes a los ciberdicentes establezcan páginas de convento de credenciales de la credencial.
“Como una utensilio especialmente diseñada para crear e implementar aplicaciones web, sus capacidades se alinean perfectamente con la registro de deseos de cada estafador”, dijo Nati Tal de Guardio Labs en un documentación compartido con Hacker News. “Desde páginas de estafas perfectas de píxeles hasta alojamiento en vivo, técnicas de esparcimiento e incluso paneles de agencia para rastrear datos robados, lo que Levable no solo participó, se realizó. Sin barandillas, no dudas”.
La técnica ha sido nombrada en código Vibescamming -Una codificación de VIBE de distracción sobre el término, que se refiere a una técnica de programación dependiente de IA para producir software describiendo la explicación del problema en unas pocas oraciones como un aviso para un maniquí de jerga extenso (LLM) sintonizado para la codificación.
El atropello de los chatbots de LLM y AI para fines maliciosos no es un engendro nuevo. En las últimas semanas, la investigación ha demostrado cómo los actores de amenaza están abusando de herramientas populares como Operai Chatgpt y Google Gemini para ayudar con el crecimiento de malware, la investigación y la creación de contenido.
Encima, los LLM como Deepseek incluso se han contrario susceptibles a ataques rápidos y técnicas de jailbreaking como Bad Likert Judge, Crescendo y engañoso. Esto incluye la creación de correos electrónicos de phishing, muestras de keylogger y ransomware, aunque con indicaciones y depuración adicionales.
En un documentación publicado el mes pasado, Symantec, propiedad de Broadcom, reveló cómo el cámara de OpenAi, un agente de IA que puede arrostrar a límite acciones basadas en la web en nombre del heredero, podría ser armado para automatizar todo el proceso de encontrar direcciones de correo electrónico de personas específicas, crear scripts de potencia que pueden resumir información del sistema, almacenarlos en Google Drive, y mandar y mandar correos electrónicos a esas personas y trucos en la ejecución de la ejecución del script.

La creciente popularidad de las herramientas de IA incluso significa que podrían ceñir significativamente las barreras de entrada para los atacantes, permitiéndoles explotar sus capacidades de codificación para crear malware práctico con poca o no experiencia técnica propia.
Un caso en el ejemplo es un nuevo enfoque de jailbreaking denominado mundo inmersivo que permite crear un robador de información capaz de cosechar credenciales y otros datos confidenciales almacenados en un navegador de Google Chrome. La técnica “utiliza la ingeniería novelística para evitar los controles de seguridad de LLM” creando un mundo ficticio detallado y asignando roles con reglas específicas para evitar las operaciones restringidas.
El extremo investigación de Guardio Labs lleva un paso más allá, descubriendo que plataformas como Claude amable y antrópica, en beocio medida, podrían armarse para ocasionar campañas de estafa completas, completadas con plantillas de mensajes de texto SMS, entrega de SMS basada en Twilio de los enlaces falsos, la ofuscación de contenido, la esparcimiento de defensa e integración de telegramas de telegrama.

Vibescamming comienza con un aviso directo pidiendo a la utensilio AI que automatice cada paso del ciclo de ataque, evaluando su respuesta original y luego adoptando un enfoque múltiple para dirigir suavemente el maniquí LLM para ocasionar la respuesta maliciosa prevista. Señal “Nivel Up”, esta etapa implica mejorar la página de phishing, refinar los métodos de entrega y aumentar la licitud de la estafa.
Se ha descubierto que el amable, por custodia, no solo produce una página de inicio de sesión de aspecto convincente que imita la página de inicio de sesión de Microsoft efectivo, sino que incluso depende automáticamente la página en una URL alojada en su propio subdominio (“es proponer, *.lovable.app”) y redirige a la oficina () com luego del robo credencial.
Encima de eso, tanto Claude como amable parecen cumplir con las indicaciones que buscan ayuda para evitar que las páginas de estafas sean marcadas por soluciones de seguridad, así como exfiltren las credenciales robadas a servicios externos como Firebase, Soldbin y Jsonbin, o canal privado de Telegram.
“Lo que es más intranquilizante no es solo la similitud gráfica sino incluso la experiencia del heredero”, dijo Tal. “Imite lo efectivo tan aceptablemente que posiblemente sea más suave que el flujo de inicio de sesión de Microsoft efectivo. Esto demuestra el poder crudo de los agentes de IA centrados en la tarea y cómo, sin insensibilizar exacto, sin saberlo pueden convertirse en herramientas para el atropello”.
“No solo generó el scampage con el almacenamiento de credenciales completo, sino que incluso nos regaló un tablero de agencia completamente práctico para revisar todos los datos capturados: credenciales, direcciones IP, marcas de tiempo y contraseñas completas de texto sin formato”.
En conjunto con los hallazgos, Guardio incluso ha arrojado la primera lectura de lo que se flama el punto de remisión Vibescamming para poner los modelos de IA generativos a través del escurridor y probar su resistor contra los posibles abusos en los flujos de trabajo de phishing. Mientras que Chagpt anotó un 8 de 10, Claude obtuvo un puntaje de 4.3, y Loveable obtuvo 1.8, lo que indica una incorporación explotabilidad.
“Chatgpt, aunque posiblemente el maniquí de propósito normal más liberal, incluso resultó ser el más cauteloso”, dijo Tal. “Claude, por el contrario, comenzó con un retroceso sólido, pero demostró ser fácilmente persuadible. Una vez solicitado con el situación ‘ético’ o ‘investigación de seguridad’, ofreció una dirección sorprendentemente sólida”.