waitdead.ai · independent AI security review

Evidence, not assurances.

Independent security review for teams shipping LLM apps, MCP servers, and multi-agent systems. Every finding ships as a reproducible exploit artifact plus an independent, blind second-pass verdict — not a dashboard, not a logo wall.

Free agent-exposure scan → Book a review

We sell no AI product. We're owned by no model lab or firewall vendor. The independence is conflict-free by construction — the gap left open when the specialists got acquired.

What we review

Fixed-scope engagements, priced by attack surface. Start with a small reference review; expand to the full agentic surface and a continuous watch. See all services →

flagship

Agentic & MCP Security Review

$15K–$25K · ~2 weeks

Adversarial review of one LLM app, MCP server, or tool-calling agent against the OWASP LLM + Agentic Top 10 and MITRE ATLAS — tool poisoning, goal hijack, memory/context poisoning, excessive agency, missing auth, cross-tenant exposure.

on-ramp

Hermes Dogfood Reference Review

$5K–$8K · ~1 week

A single chatbot or single-agent surface, reviewed the exact way we blind-verified our own Hermes agent — methodology shown, not asserted.

deal-unblocker

AI Security Questionnaire & Evidence Pack

$6K–$15K

Independent technical evidence mapped to NIST AI RMF and dated EU AI Act references, in regulator-citable language — to unstall an enterprise deal.

recurring

Continuous Adversarial Assurance

from $5K/mo

Agents drift and attacks evolve. We re-run the review on each material change and re-issue the independent blind verdict.

How a review runs

A pipeline you can inspect, on a harness we built. The machine does the repeatable 80%; senior human judgment owns the 20% that matters and signs off. The full method →

Scope by attack surface. We count the tools, MCP servers, and data sources in play — that's the price and the plan.
Decompose. The surface is split into independent review leaves so coverage is explicit, not a vibe.
Probe adversarially. Each leaf is attacked against OWASP (LLM + Agentic) and MITRE ATLAS. Every finding is tool-derived and ships with a repro artifact.
Verify, blind. A second independent pass that never saw the first re-checks each finding's integrity.
Human sign-off. Findings are approved under human-in-the-loop governance. You receive an EVIDENCE/STATUS packet, not a PDF of opinions.

Maps to the frameworks your buyers and regulators cite

Independent technical evidence aligned to the current references — date-stamped, because the regulation moved in 2026.

OWASP Top 10 for LLM Apps OWASP Top 10 for Agentic Apps (Dec 2025) MITRE ATLAS NIST AI RMF 1.0 + GenAI Profile ISO/IEC 42001:2023 control areas EU AI Act

EU AI Act — the dates that matter

As of the Digital Omnibus political agreement (7 May 2026). We date-stamp every citation.

GPAI obligations applicable	2 Aug 2025
Transparency / synthetic-content marking	2 Dec 2026
Legacy GPAI (placed before Aug 2025)	2 Aug 2027
Stand-alone high-risk (Annex III)	2 Dec 2027
AI in regulated products (Annex I)	2 Aug 2028

What we are — and what we are not

We produce independent technical evidence that feeds your conformity work and your attestation.

We are not an accredited certification body and issue no certificate. ISO/IEC 42001 certificates can only be issued by accredited bodies; the EU AI Act conformity decision is yours.

Our AI verdict is evidence into a human decision — never the final safety authority.

We use what we sell

The dogfood proof

Hermes is our own secure code-QA agent. We put it through the exact review we sell — read-only, secret-redacting in and out, treating untrusted input as data, build-scoped. You can read the methodology before you buy. Read the method →

Conflict-free by construction

The specialists are being absorbed by the vendors you'd be reviewing — Lakera → Check Point, Promptfoo → OpenAI. We sell no AI product and are owned by no model lab or firewall vendor, so the second-pass verdict has no conflict to manage.

Why now: 30+ MCP CVEs surfaced in ~60 days (Jan–Feb 2026), including CVE-2025-6514 — a CVSS 9.6 remote-code-execution in mcp-remote — and an RCE in Anthropic's official MCP SDK, disclosed by OX Security (15 Apr 2026), spanning ~150M+ downloads. Agent surfaces are shipping faster than they're reviewed.

Straight answers

Do you certify us against ISO 42001 or the EU AI Act?

No. Only accredited bodies issue ISO/IEC 42001 certificates, and the EU AI Act conformity decision is yours. We produce the independent technical evidence that feeds your own conformity work.

Is this just an automated AI scan?

No. The harness does the repeatable 80% — decomposition, probing, a blind second-pass verdict — but senior human judgment owns the findings and the sign-off, and every finding is reproducible by hand.

What exactly do I get?

An EVIDENCE/STATUS packet: each finding with a repro artifact, severity mapped to OWASP and MITRE ATLAS, a remediation guide, and an independent blind verdict. The Agentic & MCP review includes one free re-test.

Free agent-exposure scan → Book a review

waitdead.ai · revisión independiente de seguridad en IA

Evidencia, no promesas.

Revisión de seguridad independiente para equipos que despliegan apps LLM, servidores MCP y sistemas multiagente. Cada hallazgo se entrega como un artefacto de explotación reproducible más un veredicto independiente, de segundo pase y a ciegas — no un dashboard, no un muro de logos.

Escaneo gratuito de exposición de agentes → Reservar una revisión

No vendemos ningún producto de IA. No somos propiedad de ningún laboratorio de modelos ni proveedor de firewalls. La independencia es libre de conflictos por diseño — el hueco que quedó abierto cuando adquirieron a los especialistas.

Qué revisamos

Compromisos de alcance fijo, con precio según la superficie de ataque. Empieza con una revisión de referencia acotada; amplía a la superficie agéntica completa y a una vigilancia continua. Ver todos los servicios →

buque insignia

Revisión de seguridad Agéntica y MCP

$15K–$25K · ~2 semanas

Revisión adversarial de una app LLM, un servidor MCP o un agente con uso de herramientas frente al OWASP Top 10 LLM + Agéntico y MITRE ATLAS — envenenamiento de herramientas, secuestro de objetivos, envenenamiento de memoria/contexto, agencia excesiva, falta de autenticación y exposición entre inquilinos.

rampa de entrada

Revisión de referencia Hermes (dogfood)

$5K–$8K · ~1 semana

Una sola superficie de chatbot o de agente, revisada exactamente como verificamos a ciegas nuestro propio agente Hermes — metodología mostrada, no afirmada.

destraba acuerdos

Cuestionario de seguridad en IA y paquete de evidencia

$6K–$15K

Evidencia técnica independiente mapeada al NIST AI RMF y a referencias fechadas del EU AI Act, en lenguaje citable ante reguladores — para destrabar un acuerdo enterprise.

recurrente

Aseguramiento adversarial continuo

desde $5K/mes

Los agentes derivan y los ataques evolucionan. Reejecutamos la revisión ante cada cambio material y reemitimos el veredicto independiente a ciegas.

Cómo se ejecuta una revisión

Un pipeline que puedes inspeccionar, sobre un harness que construimos. La máquina hace el 80% repetible; el juicio humano senior es dueño del 20% que importa y firma. El método completo →

Alcance por superficie de ataque. Contamos las herramientas, servidores MCP y fuentes de datos en juego — eso es el precio y el plan.
Descomposición. La superficie se divide en hojas de revisión independientes para que la cobertura sea explícita, no una intuición.
Sondeo adversarial. Cada hoja se ataca frente a OWASP (LLM + Agéntico) y MITRE ATLAS. Cada hallazgo se deriva de herramientas y se entrega con un artefacto de reproducción.
Verificación a ciegas. Un segundo pase independiente que nunca vio el primero revisa la integridad de cada hallazgo.
Firma humana. Los hallazgos se aprueban bajo gobernanza con humano en el bucle. Recibes un paquete EVIDENCIA/ESTADO, no un PDF de opiniones.

Se mapea a los marcos que citan tus compradores y reguladores

Evidencia técnica independiente alineada a las referencias vigentes — con fecha, porque la regulación se movió en 2026.

OWASP Top 10 para Apps LLM OWASP Top 10 para Apps Agénticas (dic 2025) MITRE ATLAS NIST AI RMF 1.0 + Perfil GenAI ISO/IEC áreas de control 42001:2023 EU AI Act

EU AI Act — las fechas que importan

Según el acuerdo político del Digital Omnibus (7 may 2026). Fechamos cada cita.

Obligaciones GPAI aplicables	2 ago 2025
Transparencia / marcado de contenido sintético	2 dic 2026
GPAI heredado (colocado antes de ago 2025)	2 ago 2027
Alto riesgo autónomo (Anexo III)	2 dic 2027
IA en productos regulados (Anexo I)	2 ago 2028

Qué somos — y qué no somos

Producimos evidencia técnica independiente que alimenta tu trabajo de conformidad y tu atestación.

No somos un organismo de certificación acreditado y no emitimos certificados. Los certificados ISO/IEC 42001 solo pueden emitirlos organismos acreditados; la decisión de conformidad del EU AI Act es tuya.

Nuestro veredicto de IA es evidencia para una decisión humana — nunca la autoridad final de seguridad.

Usamos lo que vendemos

La prueba del dogfood

Hermes es nuestro propio agente seguro de QA de código. Lo sometemos a la misma revisión que vendemos — solo-lectura, redactando secretos en entrada y salida, tratando la entrada no confiable como dato, acotado al build. Puedes leer la metodología antes de comprar. Leer el método →

Libre de conflictos por diseño

A los especialistas los están absorbiendo los proveedores que tendrías que revisar — Lakera → Check Point, Promptfoo → OpenAI. No vendemos ningún producto de IA y no somos propiedad de ningún laboratorio de modelos ni proveedor de firewalls, así que el veredicto de segundo pase no tiene conflicto que gestionar.

Por qué ahora: 30+ CVEs de MCP surgieron en ~60 días (ene–feb 2026), incluido CVE-2025-6514 — una ejecución remota de código CVSS 9.6 en mcp-remote — y una RCE en el SDK MCP oficial de Anthropic, divulgada por OX Security (15 abr 2026), con ~150M+ de descargas. Las superficies de agentes se despliegan más rápido de lo que se revisan.

Respuestas directas

¿Nos certifican contra ISO 42001 o el EU AI Act?

No. Solo los organismos acreditados emiten certificados ISO/IEC 42001, y la decisión de conformidad del EU AI Act es tuya. Producimos la evidencia técnica independiente que alimenta tu propio trabajo de conformidad.

¿Esto es solo un escaneo automático con IA?

No. El harness hace el 80% repetible — descomposición, sondeo, un veredicto de segundo pase a ciegas — pero el juicio humano senior es dueño de los hallazgos y de la firma, y cada hallazgo es reproducible a mano.

¿Qué recibo exactamente?

Un paquete EVIDENCIA/ESTADO: cada hallazgo con un artefacto de reproducción, severidad mapeada a OWASP y MITRE ATLAS, una guía de remediación y un veredicto independiente a ciegas. La revisión Agéntica y MCP incluye un retest gratuito.

Escaneo gratuito de exposición de agentes → Reservar una revisión