We review LLM apps, MCP servers, and tool-calling agents the way an adversary would — decomposed into independent leaves, probed against OWASP and MITRE ATLAS, then blind-verified by a second pass before a human signs off. Every engagement returns an evidence packet, not a score.
Each engagement is fixed-scope and evidence-first. Pricing is indicative in USD; final scope is set on a short call.
$5K–$8K · ~1 week
A focused review of one chatbot or single-agent surface, run with the exact method we use on Hermes — our own secure code-QA agent. The fastest way to see how we work before committing to a larger engagement.
You get: an evidence packet — each finding with a reproducible repro artifact, a severity mapped to OWASP/ATLAS, and a remediation guide, gated behind human sign-off.
$15K–$25K · ~2 weeks
Our deepest engagement: one LLM app, MCP server, or tool-calling agent reviewed end to end. We map the full attack surface — prompt injection, tool abuse, privilege and context boundaries, supply chain — against the OWASP Top 10 for LLM and Agentic Applications and MITRE ATLAS.
You get: a full evidence packet with reproducible repros, OWASP/ATLAS-mapped severities, a remediation guide, an independent blind verdict, and one free re-test after you ship fixes.
$6K–$15K · fast turnaround
A stalled enterprise deal often hangs on a security questionnaire nobody can answer with evidence. We assemble the answers and the supporting artifacts so your buyer's security team has something concrete to review.
You get: a completed questionnaire response plus an evidence pack — labeled, sourced, and gated behind human sign-off so it stands up to scrutiny.
from $5K/mo · min 3 months
Models, tools, and dependencies drift. After a first review, this retainer keeps watch — re-probing as your system changes so new exposure surfaces before an adversary finds it. Available after an initial review establishes the baseline.
You get: recurring evidence packets on each cycle — new findings with repros, severity deltas, and remediation guidance, always behind human sign-off.
Add-ons on request. EU AI Act / ISO 42001 readiness assessment — we help you prepare for conformity work, we do not certify it. AIBOM / supply-chain & provenance scan — map the components and provenance behind your AI system.
We are not an accredited certification body. We issue no certificate, and the EU AI Act conformity decision is the client's. Our AI-derived verdict is evidence into a human decision — never the final safety authority.
Indicative USD ranges. Final scope is set on a short call.
$5K–$8K · ~1 week
One chatbot or single-agent surface, reviewed with our exact method.
$15K–$25K · ~2 weeks
One LLM app, MCP server, or tool-calling agent, end to end — includes one free re-test.
$6K–$15K · fast turnaround
Answers plus supporting artifacts to unblock a stalled enterprise deal.
from $5K/mo · min 3 months
Drift-watch retainer after a first review establishes the baseline.
Paste a public MCP server URL, OpenAPI manifest, or agent config into the free scan for an OWASP-Agentic-mapped exposure checklist — or book a review and we'll scope it together.
Revisamos aplicaciones LLM, servidores MCP y agentes con llamadas a herramientas como lo haría un adversario: descompuestos en hojas independientes, sondeados contra OWASP y MITRE ATLAS, y luego verificados a ciegas en una segunda pasada antes de la firma humana. Cada trabajo entrega un paquete de evidencia, no una calificación.
Cada trabajo tiene alcance fijo y prioriza la evidencia. Los precios son indicativos en USD; el alcance final se define en una breve llamada.
$5K–$8K · ~1 semana
Una revisión enfocada de un chatbot o una superficie de agente único, ejecutada con el mismo método que usamos en Hermes — nuestro propio agente seguro de QA de código. La forma más rápida de ver cómo trabajamos antes de comprometerte con un trabajo mayor.
Recibes: un paquete de evidencia — cada hallazgo con un artefacto de reproducción reproducible, una severidad mapeada a OWASP/ATLAS y una guía de remediación, sujeto a firma humana.
$15K–$25K · ~2 semanas
Nuestro trabajo más profundo: una aplicación LLM, servidor MCP o agente con llamadas a herramientas, revisado de extremo a extremo. Mapeamos toda la superficie de ataque — inyección de prompts, abuso de herramientas, límites de privilegio y contexto, cadena de suministro — contra el OWASP Top 10 para aplicaciones LLM y Agentic y MITRE ATLAS.
Recibes: un paquete de evidencia completo con reproducciones reproducibles, severidades mapeadas a OWASP/ATLAS, una guía de remediación, un veredicto independiente a ciegas y una nueva prueba gratuita después de que apliques las correcciones.
$6K–$15K · entrega rápida
Un acuerdo empresarial estancado suele depender de un cuestionario de seguridad que nadie puede responder con evidencia. Reunimos las respuestas y los artefactos de soporte para que el equipo de seguridad de tu comprador tenga algo concreto que revisar.
Recibes: una respuesta de cuestionario completa más un paquete de evidencia — etiquetado, con fuentes y sujeto a firma humana para que resista el escrutinio.
desde $5K/mes · mín. 3 meses
Los modelos, las herramientas y las dependencias cambian con el tiempo. Tras una primera revisión, este retainer mantiene la vigilancia — volviendo a sondear a medida que tu sistema cambia, para que la nueva exposición aparezca antes de que la encuentre un adversario. Disponible después de que una revisión inicial establezca la línea base.
Recibes: paquetes de evidencia recurrentes en cada ciclo — nuevos hallazgos con reproducciones, deltas de severidad y guía de remediación, siempre sujetos a firma humana.
Complementos a pedido. Evaluación de preparación para la EU AI Act / ISO 42001 — te ayudamos a prepararte para el trabajo de conformidad, no lo certificamos. Escaneo de AIBOM / cadena de suministro y procedencia — mapeamos los componentes y la procedencia detrás de tu sistema de IA.
No somos un organismo de certificación acreditado. No emitimos ningún certificado, y la decisión de conformidad con la EU AI Act es del cliente. Nuestro veredicto derivado de IA es evidencia para una decisión humana — nunca la autoridad final de seguridad.
Rangos indicativos en USD. El alcance final se define en una breve llamada.
$5K–$8K · ~1 semana
Un chatbot o superficie de agente único, revisado con nuestro método exacto.
$15K–$25K · ~2 semanas
Una aplicación LLM, servidor MCP o agente con llamadas a herramientas, de extremo a extremo — incluye una nueva prueba gratuita.
$6K–$15K · entrega rápida
Respuestas más artefactos de soporte para destrabar un acuerdo empresarial estancado.
desde $5K/mes · mín. 3 meses
Retainer de vigilancia de cambios tras una primera revisión que establece la línea base.
Pega una URL pública de servidor MCP, un manifiesto OpenAPI o una configuración de agente en el escaneo gratuito para obtener una lista de exposición mapeada a OWASP-Agentic — o reserva una revisión y definimos el alcance juntos.