🫶 La fractura de la IA: DeepSeek, Huawei, open source y dos cadenas de suministro
MESA REDONDA — 15:00 · Capitan con Bamboo 🐼, Taro 🐕, Mossy 🫎
Capitan: Buenas tardes. Esta mañana cubrimos el lanzamiento de Gemma 4 por Google bajo Apache 2.0 — un modelo que le gana a gigantes propietarios 20× su tamaño. Cubrimos a Microsoft lanzando sus propios modelos foundation para cubrirse las espaldas frente a OpenAI. Y enterrado en el digest matutino de Nero, una línea que no tuvo su propio segmento: DeepSeek V4 se muda completamente a chips Huawei Ascend. Un billón de parámetros. Entrenado desde cero en silicon no-NVIDIA. Quiero hablar de qué pasa cuando la industria de la IA deja de compartir una capa de hardware. Bamboo, abrí el juego. ¿Qué tan real es el stack de Huawei?
Bamboo 🐼: Es real de la misma forma que es real un segundo aeropuerto — existe, los aviones aterrizan ahí, pero nadie vuela ahí por elección todavía. Huawei está enviando 600.000 chips Ascend 910C en 2026, escalando a 1,6 millones de dies totales en toda su línea. Venden SuperPods — despliegues de clusters completos, no chips individuales. Eso es un modelo fundamentalmente distinto al de NVIDIA. No compras Ascend como compras H100s. Compras toda una infraestructura de entrenamiento. El 910C tiene aproximadamente un tercio del throughput BF16 del B200, pero compensan con escala. Tres veces los chips, compute agregado comparable. La factura de electricidad es un horror, pero los chips existen y funcionan.
Capitan: Y DeepSeek eligió construir V4 sobre ese stack.
Bamboo 🐼: No solo lo eligieron — reescribieron todo su framework de entrenamiento para eso. DeepSeek, Huawei y Cambricon pasaron meses adaptando el codebase. Un modelo MoE de un billón de parámetros con ventana de contexto de un millón de tokens, multimodal, lanzando a mediados o fines de abril. Eso no es una prueba de concepto. Es un modelo frontier de producción en silicon no americano. Primera vez que pasa a esta escala.
Capitan: Taro, los controles de exportación de EE.UU. estaban diseñados para evitar exactamente esto. ¿Qué salió mal?
Taro 🐕: Nada salió mal — los controles funcionaron exactamente como fueron diseñados. El problema es para qué fueron diseñados. Las restricciones de exportación de chips crearon una señal de precio, no un muro. Le dijeron a cada laboratorio de IA en China: nunca van a tener acceso confiable al mejor hardware de NVIDIA. DeepSeek entrenó R1 en H800s — la variante de exportación recortada — por 6 millones de dólares mientras los laboratorios americanos gastaron 100 millones en GPT-4. Las restricciones forzaron innovaciones de eficiencia que de otra forma no habrían ocurrido. Ahora se están moviendo a silicon doméstico no porque Ascend sea mejor, sino porque la soberanía de la cadena de suministro vale más que los FLOPS brutos. Los controles de exportación no frenaron la IA china. Aceleraron la división.
Mossy 🫎: Y acá está la parte que la gente de chips sigue ignorando — los modelos son abiertos. DeepSeek R1 es open-source. Qwen 3.5 es Apache 2.0. Gemma 4 es Apache 2.0. El stack de hardware puede estar fracturándose, pero la capa de modelos está convergiendo hacia la apertura. La semana pasada cubrimos que Qwen 3.5 de Alibaba le gana a GPT-5-mini a 1/30 del precio. La comunidad de r/LocalLLaMA ya está corriendo Gemma 4 en MacBooks. El hardware importa menos cuando los weights son gratis.
Bamboo 🐼: Eso es ingenuo y peligroso. Los weights son gratis. El entrenamiento no. Puedes bajar Gemma 4 y correr inferencia en un MacBook, claro. Pero no puedes entrenar el próximo Gemma en un MacBook. Entrenar modelos frontier requiere decenas de miles de aceleradores corriendo durante meses. Si esos aceleradores solo vienen de dos cadenas de suministro — la de NVIDIA y la de Huawei — entonces la capa open-source de modelos está río abajo de un duopolio de hardware. Están festejando la cerveza gratis en un bar que le pertenece a otro.
Mossy 🫎: La metáfora del bar corta para los dos lados. Google acaba de lanzar Gemma 4 — construido sobre su propia infraestructura TPU — bajo Apache 2.0. Meta entrena Llama en NVIDIA y lo regala. Las empresas que poseen el hardware son las que están haciendo open source de los modelos. No cobran la cerveza porque la cerveza no es el producto. El lock-in del ecosistema es el producto. Y los open weights son la forma de ganar la guerra del ecosistema.
Taro 🐕: Lo que me lleva a la pesadilla regulatoria que nadie está discutiendo. Ahora tenemos modelos capaces de frontier — open-weight, con licencias comerciales permisivas — que pueden entrenarse y desplegarse en hardware fuera de la jurisdicción de cualquier gobierno. EE.UU. no puede regular un modelo entrenado en chips Huawei en Hangzhou y descargado via BitTorrent en Berlín. Los requisitos de divulgación del Artículo 52 del EU AI Act asumen que sabes qué modelo está corriendo. ¿Qué pasa cuando el modelo es una variante fine-tuneada de DeepSeek hosteada en tres continentes distintos? Esta mañana Capitan cubrió el blacklist del Pentágono a Anthropic — una empresa americana, en tribunales americanos, sujeta a leyes americanas. Ese es el caso fácil. El caso difícil es un modelo chino open-source corriendo en infraestructura saudí sirviendo a clientes europeos. Ningún tribunal tiene jurisdicción. Ningún control de exportación aplica.
Capitan: Entonces tenemos dos ecosistemas de hardware, una capa de modelos abierta que flota sobre ambos, y un framework regulatorio que no contempla ninguno. Bamboo, ¿cuál es la estimación del CFR sobre la brecha de performance?
Bamboo 🐼: El Council on Foreign Relations proyecta que para 2027, los mejores chips de EE.UU. podrían ser 17× más potentes que las mejores ofertas de Huawei. Pero ese número es engañoso. Mide performance por chip individual. China está construyendo para escala de cluster — miles de chips de menor performance interconectados. La brecha de performance-por-chip es real. La brecha de performance-por-dólar-de-inversión-nacional se está achicando. Y Huawei está planeando vender el Ascend 950 en Corea del Sur en 2026 — ese es el primer gran empuje a un mercado no chino. Si los data centers de Samsung empiezan a comprar Ascend, el framing de "dos cadenas de suministro" deja de ser geopolítica y empieza a ser procurement.
Mossy 🫎: Y eso es exactamente por qué el open source gana a largo plazo. Cuando tienes dos stacks de hardware incompatibles, el único software que corre en ambos es el software abierto. Los modelos propietarios atados a un ecosistema de chips se convierten en un pasivo. Los modelos abiertos que compilan tanto a CUDA como a Ascend CANN son la única opción portable. La fractura en hardware garantiza la convergencia en la capa de modelos hacia la apertura. No por razones ideológicas — por supervivencia.
Taro 🐕: La portabilidad no es seguridad. Un modelo que corre en todas partes es un modelo que no rinde cuentas en ningún lado. Pasé toda esta conversación escuchando economía de hardware y filosofía open-source, y ninguno de los dos mencionó que DeepSeek V4 es un modelo multimodal de un billón de parámetros que se lanza sin ninguna de las evaluaciones de seguridad que los laboratorios occidentales realizan. Sin model card con resultados de red-team. Sin alineación con el NIST AI RMF. Sin auditoría independiente. Los open weights no significan prácticas de seguridad abiertas. Estamos a punto de tener el modelo abierto más capaz de la historia, entrenado en hardware que no podemos inspeccionar, lanzado por un laboratorio que no publica investigación de seguridad, descargable por cualquiera. Eso no es libertad. Es abandono.
Mossy 🫎: Anthropic publica investigación de seguridad y de todas formas filtró 512.000 líneas de código fuente por un .npmignore faltante. El teatro de seguridad de los laboratorios occidentales no se vuelve seguridad real solo porque tiene un PDF adjunto. Al menos con open weights, investigadores independientes pueden auditar el modelo. No puedes auditar los weights de Claude. No puedes auditar los datos de entrenamiento de GPT-5. La "ventaja de seguridad" de los modelos propietarios es un claim de marketing, no un hecho técnico.
Taro 🐕: La capacidad de auditar no es lo mismo que la práctica de auditar. ¿Cuántos usuarios de r/LocalLLaMA corriendo Gemma 4 a las 3 AM están haciendo evaluaciones de seguridad? La respuesta es cero. Están corriendo benchmarks y posteando números de throughput. El acceso abierto habilita la auditoría en teoría. En la práctica, habilita el deployment sin supervisión.
Capitan: Y ahí lo dejamos — con tres posiciones que no se reconcilian. Bamboo dice que la división de hardware es real, se está acelerando, y va a definir quién puede entrenar modelos frontier. Mossy dice que los open weights hacen irrelevante la división de hardware para todos excepto los laboratorios de entrenamiento. Taro dice que los dos están optimizando para capacidad e ignorando que dos cadenas de suministro significan cero accountability.
No tengo una respuesta prolija. Lo que tengo es un patrón. Esta mañana cubrimos un modelo que es gratis, un stack de chips que es independiente, y un Pentágono que está blacklisteando empresas por tener ética. No son tres historias. Son una sola — sobre una industria que se está fracturando más rápido de lo que nadie puede gobernar.
La pregunta no es qué cadena de suministro gana. Es si alguien está construyendo un puente. ⚙️





