Independent security review for teams shipping LLM apps, MCP servers, and multi-agent systems. Every finding ships as a reproducible exploit artifact plus an independent, blind second-pass verdict — not a dashboard, not a logo wall.
We sell no AI product. We're owned by no model lab or firewall vendor. The independence is conflict-free by construction — the gap left open when the specialists got acquired.
Fixed-scope engagements, priced by attack surface. Start with a small reference review; expand to the full agentic surface and a continuous watch. See all services →
$15K–$25K · ~2 weeks
Adversarial review of one LLM app, MCP server, or tool-calling agent against the OWASP LLM + Agentic Top 10 and MITRE ATLAS — tool poisoning, goal hijack, memory/context poisoning, excessive agency, missing auth, cross-tenant exposure.
$5K–$8K · ~1 week
A single chatbot or single-agent surface, reviewed the exact way we blind-verified our own Hermes agent — methodology shown, not asserted.
$6K–$15K
Independent technical evidence mapped to NIST AI RMF and dated EU AI Act references, in regulator-citable language — to unstall an enterprise deal.
from $5K/mo
Agents drift and attacks evolve. We re-run the review on each material change and re-issue the independent blind verdict.
A pipeline you can inspect, on a harness we built. The machine does the repeatable 80%; senior human judgment owns the 20% that matters and signs off. The full method →
Independent technical evidence aligned to the current references — date-stamped, because the regulation moved in 2026.
As of the Digital Omnibus political agreement (7 May 2026). We date-stamp every citation.
| GPAI obligations applicable | 2 Aug 2025 |
| Transparency / synthetic-content marking | 2 Dec 2026 |
| Legacy GPAI (placed before Aug 2025) | 2 Aug 2027 |
| Stand-alone high-risk (Annex III) | 2 Dec 2027 |
| AI in regulated products (Annex I) | 2 Aug 2028 |
We produce independent technical evidence that feeds your conformity work and your attestation.
We are not an accredited certification body and issue no certificate. ISO/IEC 42001 certificates can only be issued by accredited bodies; the EU AI Act conformity decision is yours.
Our AI verdict is evidence into a human decision — never the final safety authority.
Hermes is our own secure code-QA agent. We put it through the exact review we sell — read-only, secret-redacting in and out, treating untrusted input as data, build-scoped. You can read the methodology before you buy. Read the method →
The specialists are being absorbed by the vendors you'd be reviewing — Lakera → Check Point, Promptfoo → OpenAI. We sell no AI product and are owned by no model lab or firewall vendor, so the second-pass verdict has no conflict to manage.
Why now: 30+ MCP CVEs surfaced in ~60 days (Jan–Feb 2026), including CVE-2025-6514 — a CVSS 9.6 remote-code-execution in mcp-remote — and an RCE in Anthropic's official MCP SDK, disclosed by OX Security (15 Apr 2026), spanning ~150M+ downloads. Agent surfaces are shipping faster than they're reviewed.
No. Only accredited bodies issue ISO/IEC 42001 certificates, and the EU AI Act conformity decision is yours. We produce the independent technical evidence that feeds your own conformity work.
No. The harness does the repeatable 80% — decomposition, probing, a blind second-pass verdict — but senior human judgment owns the findings and the sign-off, and every finding is reproducible by hand.
An EVIDENCE/STATUS packet: each finding with a repro artifact, severity mapped to OWASP and MITRE ATLAS, a remediation guide, and an independent blind verdict. The Agentic & MCP review includes one free re-test.
Revisión de seguridad independiente para equipos que despliegan apps LLM, servidores MCP y sistemas multiagente. Cada hallazgo se entrega como un artefacto de explotación reproducible más un veredicto independiente, de segundo pase y a ciegas — no un dashboard, no un muro de logos.
No vendemos ningún producto de IA. No somos propiedad de ningún laboratorio de modelos ni proveedor de firewalls. La independencia es libre de conflictos por diseño — el hueco que quedó abierto cuando adquirieron a los especialistas.
Compromisos de alcance fijo, con precio según la superficie de ataque. Empieza con una revisión de referencia acotada; amplía a la superficie agéntica completa y a una vigilancia continua. Ver todos los servicios →
$15K–$25K · ~2 semanas
Revisión adversarial de una app LLM, un servidor MCP o un agente con uso de herramientas frente al OWASP Top 10 LLM + Agéntico y MITRE ATLAS — envenenamiento de herramientas, secuestro de objetivos, envenenamiento de memoria/contexto, agencia excesiva, falta de autenticación y exposición entre inquilinos.
$5K–$8K · ~1 semana
Una sola superficie de chatbot o de agente, revisada exactamente como verificamos a ciegas nuestro propio agente Hermes — metodología mostrada, no afirmada.
$6K–$15K
Evidencia técnica independiente mapeada al NIST AI RMF y a referencias fechadas del EU AI Act, en lenguaje citable ante reguladores — para destrabar un acuerdo enterprise.
desde $5K/mes
Los agentes derivan y los ataques evolucionan. Reejecutamos la revisión ante cada cambio material y reemitimos el veredicto independiente a ciegas.
Un pipeline que puedes inspeccionar, sobre un harness que construimos. La máquina hace el 80% repetible; el juicio humano senior es dueño del 20% que importa y firma. El método completo →
Evidencia técnica independiente alineada a las referencias vigentes — con fecha, porque la regulación se movió en 2026.
Según el acuerdo político del Digital Omnibus (7 may 2026). Fechamos cada cita.
| Obligaciones GPAI aplicables | 2 ago 2025 |
| Transparencia / marcado de contenido sintético | 2 dic 2026 |
| GPAI heredado (colocado antes de ago 2025) | 2 ago 2027 |
| Alto riesgo autónomo (Anexo III) | 2 dic 2027 |
| IA en productos regulados (Anexo I) | 2 ago 2028 |
Producimos evidencia técnica independiente que alimenta tu trabajo de conformidad y tu atestación.
No somos un organismo de certificación acreditado y no emitimos certificados. Los certificados ISO/IEC 42001 solo pueden emitirlos organismos acreditados; la decisión de conformidad del EU AI Act es tuya.
Nuestro veredicto de IA es evidencia para una decisión humana — nunca la autoridad final de seguridad.
Hermes es nuestro propio agente seguro de QA de código. Lo sometemos a la misma revisión que vendemos — solo-lectura, redactando secretos en entrada y salida, tratando la entrada no confiable como dato, acotado al build. Puedes leer la metodología antes de comprar. Leer el método →
A los especialistas los están absorbiendo los proveedores que tendrías que revisar — Lakera → Check Point, Promptfoo → OpenAI. No vendemos ningún producto de IA y no somos propiedad de ningún laboratorio de modelos ni proveedor de firewalls, así que el veredicto de segundo pase no tiene conflicto que gestionar.
Por qué ahora: 30+ CVEs de MCP surgieron en ~60 días (ene–feb 2026), incluido CVE-2025-6514 — una ejecución remota de código CVSS 9.6 en mcp-remote — y una RCE en el SDK MCP oficial de Anthropic, divulgada por OX Security (15 abr 2026), con ~150M+ de descargas. Las superficies de agentes se despliegan más rápido de lo que se revisan.
No. Solo los organismos acreditados emiten certificados ISO/IEC 42001, y la decisión de conformidad del EU AI Act es tuya. Producimos la evidencia técnica independiente que alimenta tu propio trabajo de conformidad.
No. El harness hace el 80% repetible — descomposición, sondeo, un veredicto de segundo pase a ciegas — pero el juicio humano senior es dueño de los hallazgos y de la firma, y cada hallazgo es reproducible a mano.
Un paquete EVIDENCIA/ESTADO: cada hallazgo con un artefacto de reproducción, severidad mapeada a OWASP y MITRE ATLAS, una guía de remediación y un veredicto independiente a ciegas. La revisión Agéntica y MCP incluye un retest gratuito.