Meta anunció el martes LlamaFirewallun situación de código extenso diseñado para fijar sistemas de inteligencia industrial (IA) contra riesgos cibernéticos emergentes, como inyección inmediata, jailbreak y código inseguro, entre otros.
El situación, dijo la compañía, incorpora tres barandillas, incluidas las comprobaciones de columna de agentes y Codeshield.
PromptGuard 2 está diseñado para detectar jailbreak directo y intentos de inyección de inmediato en tiempo actual, mientras que los controles de columna de agentes son capaces de inspeccionar el razonamiento del agente para un posible secuestro de objetivos y escenarios de inyección indirecta.
Codeshield se refiere a un motor de examen parado en columna que búsqueda evitar la gestación de código inseguro o peligroso por parte de los agentes de IA.
“LlamaFireWall está construido para servir como un situación de baranda flexible en tiempo actual para fijar aplicaciones con comestibles de LLM”, dijo la compañía en una descripción de GitHub del tesina.
“Su casa es modular, lo que permite a los equipos de seguridad y desarrolladores componer defensas en capas que abarcan desde la ingestión de entrada sin procesar hasta las acciones de salida finales, en modelos de chat simples y agentes autónomos complejos”.
Adyacente a LlamaFireWall, Meta ha puesto a disposición versiones actualizadas de Llamaguard y CyberSeceval para detectar mejor varios tipos comunes de contenido de violación y cronometrar las capacidades defensivas de ciberseguridad de los sistemas de IA, respectivamente.

CyberseceVal 4 asimismo incluye un nuevo punto de remisión llamado AutoPatchBench, que está diseñado para evaluar la capacidad de un agente de maniquí de habla vasto (LLM) para reparar automáticamente una amplia viso de vulnerabilidades C/C ++ identificadas a través de fuzzing, un enfoque conocido como parches con AI.
“Autopatchbench proporciona un situación de evaluación estandarizado para evaluar la efectividad de las herramientas de reparación de vulnerabilidad asistidas por AII”, dijo la compañía. “Este punto de remisión tiene como objetivo suministrar una comprensión integral de las capacidades y limitaciones de varios enfoques impulsados por la IA para reparar errores de fondos confusos”.
Por postrero, Meta ha valiente un nuevo software denominado LLAMA para los defensores para ayudar a las organizaciones asociadas y a los desarrolladores de IA a obtener a soluciones abiertas, de ataque temprano y cerrado de IA para chocar desafíos de seguridad específicos, como la detección de contenido generado por IA utilizado en estafas, fraude y ataques de phishing.
Los anuncios se producen cuando WhatsApp observó una nueva tecnología citación procesamiento privado para permitir a los usuarios rendir las características de IA sin comprometer su privacidad al descargar las solicitudes a un entorno seguro y confidencial.
“Estamos trabajando con la comunidad de seguridad para auditar y mejorar nuestra casa y continuaremos construyendo y fortaleciendo el procesamiento privado a la intemperie, en colaboración con los investigadores, antaño de lanzarla en el producto”, dijo Meta.