Meta, el marco de LlamaFireWall para detener los jailbreaks de IA, las inyecciones y el código inseguro

Meta anunció el martes LlamaFirewallun situación de código extenso diseñado para fijar sistemas de inteligencia industrial (IA) contra riesgos cibernéticos emergentes, como inyección inmediata, jailbreak y código inseguro, entre otros.

El situación, dijo la compañía, incorpora tres barandillas, incluidas las comprobaciones de columna de agentes y Codeshield.

PromptGuard 2 está diseñado para detectar jailbreak directo y intentos de inyección de inmediato en tiempo actual, mientras que los controles de columna de agentes son capaces de inspeccionar el razonamiento del agente para un posible secuestro de objetivos y escenarios de inyección indirecta.

Codeshield se refiere a un motor de examen parado en columna que búsqueda evitar la gestación de código inseguro o peligroso por parte de los agentes de IA.

“LlamaFireWall está construido para servir como un situación de baranda flexible en tiempo actual para fijar aplicaciones con comestibles de LLM”, dijo la compañía en una descripción de GitHub del tesina.

“Su casa es modular, lo que permite a los equipos de seguridad y desarrolladores componer defensas en capas que abarcan desde la ingestión de entrada sin procesar hasta las acciones de salida finales, en modelos de chat simples y agentes autónomos complejos”.

Adyacente a LlamaFireWall, Meta ha puesto a disposición versiones actualizadas de Llamaguard y CyberSeceval para detectar mejor varios tipos comunes de contenido de violación y cronometrar las capacidades defensivas de ciberseguridad de los sistemas de IA, respectivamente.

CyberseceVal 4 asimismo incluye un nuevo punto de remisión llamado AutoPatchBench, que está diseñado para evaluar la capacidad de un agente de maniquí de habla vasto (LLM) para reparar automáticamente una amplia viso de vulnerabilidades C/C ++ identificadas a través de fuzzing, un enfoque conocido como parches con AI.

Leer Explotación crítica de SAP, phishing con IA, infracciones importantes, nuevas CVE y más

“Autopatchbench proporciona un situación de evaluación estandarizado para evaluar la efectividad de las herramientas de reparación de vulnerabilidad asistidas por AII”, dijo la compañía. “Este punto de remisión tiene como objetivo suministrar una comprensión integral de las capacidades y limitaciones de varios enfoques impulsados por la IA para reparar errores de fondos confusos”.

Por postrero, Meta ha valiente un nuevo software denominado LLAMA para los defensores para ayudar a las organizaciones asociadas y a los desarrolladores de IA a obtener a soluciones abiertas, de ataque temprano y cerrado de IA para chocar desafíos de seguridad específicos, como la detección de contenido generado por IA utilizado en estafas, fraude y ataques de phishing.

Los anuncios se producen cuando WhatsApp observó una nueva tecnología citación procesamiento privado para permitir a los usuarios rendir las características de IA sin comprometer su privacidad al descargar las solicitudes a un entorno seguro y confidencial.

“Estamos trabajando con la comunidad de seguridad para auditar y mejorar nuestra casa y continuaremos construyendo y fortaleciendo el procesamiento privado a la intemperie, en colaboración con los investigadores, antaño de lanzarla en el producto”, dijo Meta.

𝐒𝐭𝐫𝐚𝐭𝐨𝐧𝐝𝐚𝐢𝐥𝐲 𝐍𝐞𝐰𝐬

𝐒𝐭𝐫𝐚𝐭𝐨𝐧𝐝𝐚𝐢𝐥𝐲 𝐍𝐞𝐰𝐬

𝐒𝐭𝐫𝐚𝐭𝐨𝐧𝐝𝐚𝐢𝐥𝐲 𝐍𝐞𝐰𝐬

𝐒𝐭𝐫𝐚𝐭𝐨𝐧𝐝𝐚𝐢𝐥𝐲 𝐍𝐞𝐰𝐬

el más reciente

ASML va más allá de EUV a medida que se intensifica la carrera armamentista de chips de IA

Ronaldo deja Arabia Saudita para ir a España después de la suspensión de la AFC por la guerra de Irán

Ex-estrella de RHONY regresará a la temporada 16 después de una pausa de 8 años

Google confirma CVE-2026-21385 en componente Qualcomm Android explotado

Relacionada

Google confirma CVE-2026-21385 en componente Qualcomm Android explotado

Google desarrolla certificados Merkle Tree para habilitar HTTPS resistente a Quantum en Chrome

La nueva vulnerabilidad de Chrome permite que las extensiones maliciosas aumenten los privilegios...

APT28 vinculado a CVE-2026-21513 MSHTML de día 0 explotado antes del parche del...

Meta, el marco de LlamaFireWall para detener los jailbreaks de IA, las inyecciones y el código inseguro

El más popular

BCDR tendencias y desafíos para 2025

Cox Automotive: 1 de cada 4 vehículos vendidos en 2025 estarán ‘electrificados’

Tendencias de bodas imprescindibles para 2025: desde brillantes temas del zodíaco hasta buffets voladores especiales

Sobre nosotras

𝐂𝐚𝐭𝐞𝐠𝐨𝐫í𝐚𝐬

𝐏á𝐠𝐢𝐧𝐚𝐬 𝐋𝐞𝐠𝐚𝐥𝐞𝐬

𝐄𝐭𝐢𝐪𝐮𝐞𝐭𝐚𝐬 𝐏𝐨𝐩𝐮𝐥𝐚𝐫𝐞𝐬