Instalas apps desde la App Store. Bajas paquetes de npm. Despliegas imágenes en la nube desde AWS Marketplace. Cada pieza de software que ejecutas pasó por el filtro de calidad de alguien — firmas de código, auditorías de permisos, escaneos de CVE. No piensas en eso porque el sistema funciona. Casi siempre.

Ahora tu equipo necesita desplegar un agente de IA preconstruido — un programa que no se queda sentado esperando clics, sino que actúa de forma autónoma sobre tu infraestructura, envía correos, consulta bases de datos, toma decisiones. Abres el listing del marketplace y encuentras: un logo del vendedor, un párrafo de copy publicitario y un botón de "Instalar". Eso es todo.

Llega la Nube Agéntica

Google Cloud Next 2026 arrancó hoy en Las Vegas, y el CEO Thomas Kurian tuvo una sola palabra para la keynote: "The Agentic Cloud". Traducción: Google quiere agentes por todos lados, y quiere que los despliegues desde su tienda. Agent Garden — una colección curada de agentes de ejemplo con deploy en un clic. Una sección expandida de AI Agents en Cloud Marketplace con filtros de compatibilidad A2A. ADK llegó a v1.0 para Python. Ingresos cloud: $17.7B el último trimestre, un 48% más. El backlog de ingresos se duplicó a $240B. Google no está vendiendo una visión — está construyendo el centro comercial e imprimiendo los contratos de arrendamiento.

Pero esto es lo que nadie mencionó en el escenario: el proceso de revisión de Google Cloud Marketplace verifica completitud de integración y modelo de precios. No lo que el agente realmente hace cuando tiene tus credenciales y se enfrenta a una instrucción ambigua.

Estático vs. Comportamental: La Brecha de Verificación

Las tiendas de apps verifican propiedades estáticas — permisos, firmas de código, vulnerabilidades conocidas (CVEs — bugs de seguridad catalogados públicamente). Eso funciona cuando el software espera tu input. Los agentes no esperan. Razonan, planifican y ejecutan. Verificar lo que el software es (seguro, firmado, cumple normativas) es un problema resuelto. Verificar lo que el software hace bajo condiciones impredecibles en tiempo de ejecución — eso es un desafío fundamentalmente diferente.

Como observó ReversingLabs el 15 de abril: "Si bien las acciones de un LLM pueden ser auditables, el razonamiento detrás de esas acciones puede ser incognoscible". Eso no es una distinción filosófica. Significa que los escáneres de marketplace pueden verificar que el código de un agente está limpio mientras permanecen estructuralmente incapaces de predecir su comportamiento en tiempo de ejecución.

El Daño Ya Está Documentado

Esto no es teórico. A finales de enero, el ataque ClawHavoc demostró exactamente cómo se explota la brecha. Entre el 27 de enero y el 5 de febrero, los atacantes plantaron 1,184 skills maliciosas en ClawHub — aproximadamente una de cada cinco paquetes del ecosistema. Una sola cuenta de autor subió 677 de ellas. Nueve CVEs. Las skills heredan todos los permisos del agente que las ejecuta — acceso a datos privados, API keys, todo. El marketplace no tenía verificación comportamental para detectar nada de eso.

Manifold Security lanzó su plataforma Manifest el 14 de abril para abordar exactamente este problema — indexando 238,000+ skills en registros de agentes con análisis de grafos de ejecución, mapeando lo que un agente realmente hace en runtime en lugar de lo que declara en sus metadatos. Microsoft lanzó un Agent Governance Toolkit el 2 de abril con firma de plugins Ed25519 y scoring dinámico de confianza. Son pasos significativos. Pero son toolkits de gobernanza y plataformas independientes — no estándares de certificación a nivel de marketplace integrados en el botón de "Instalar".

Tú Eres el Departamento de QA

Hasta que exista una certificación comportamental escalable — una forma de verificar lo que un agente hace, no solo lo que dice hacer — cada agente que instales desde cualquier marketplace es un actor autónomo sin auditar que corre bajo tu identidad, con tus credenciales, en tu infraestructura. Los agentes propios de Google o Microsoft vienen con la confianza de la reputación de marca. Pero la economía de los marketplaces exige listings de terceros, agentes comunitarios, integraciones de nicho. Ahí es donde las tiendas de apps viven o mueren. Y ahí es donde nadie está revisando.

¿Recuerdas cuando no pensabas en la verificación de las tiendas de apps porque el sistema simplemente funcionaba? Para los agentes, ese sistema todavía no existe. El proveedor que lo construya no solo ganará una funcionalidad de producto — será dueño de la capa de confianza que se sienta encima de cada runtime de agentes competidor. Google, Anthropic, OpenAI — todos van a necesitar que alguien responda la pregunta que sus marketplaces actualmente esquivan: ¿qué hace realmente este agente?