Alteridad: DeepSeek: la "Inteligencia Artificial" china que aplastó a Silicon Valley. ¿Es el principio del fin para las "big tech" occidentales?

Por Bruno Sgarzini

Periodista argentino especializado en asuntos internacionales.

DeepSeek es comparable como el momento en el que la Unión Soviética, en plena Guerra Fría, puso en órbita el satélite Sputnik, según Marc Andreessen, cofundador de la empresa Netscape Communications Corporation y coautor de Mosaic, uno de los primeros navegadores web con interfaz gráfica.

Leamos un poco lo que significa para Bloomberg:

Una empresa china de inteligencia artificial poco conocida llamada DeepSeek lanzó un nuevo modelo de inteligencia artificial de código abierto llamado R1 que puede imitar la forma en que razonan los humanos. La empresa dijo que R1 rivalizaba o superaba a los principales desarrolladores estadounidenses en una variedad de puntos de referencia de la industria, incluidas las tareas matemáticas y el conocimiento general, y que se creó por una pequeña fracción del costo. Para el fin de semana, DeepSeek había escalado posiciones en Chatbot Arena, una tabla de clasificación de sistemas de inteligencia artificial muy seguida, y figuras prominentes en tecnología como Marc Andreessen llamaban al producto "el momento Sputnik de la inteligencia artificial".

Ahora, las consecuencias del lanzamiento de R1 se están extendiendo rápidamente por todo Estados Unidos, mientras la industria tecnológica intenta comprender cómo DeepSeek logró la hazaña y si la empresa emergente lo hizo tan barato como afirma. Ya existen sospechas de que la empresa emergente china construyó su chatbot con tecnología occidental, evitando los enormes costos de desarrollar grandes modelos de lenguaje.

Casi de la noche a la mañana, DeepSeek ha cambiado muchas de las suposiciones dentro de Silicon Valley sobre la economía de la creación de IA, así como los mejores métodos técnicos para desarrollar la tecnología y el alcance de la ventaja de Estados Unidos sobre sus competidores en China. Durante gran parte de los últimos dos años, desde que ChatGPT inició el frenesí mundial de la IA, la industria ha apostado a que el camino hacia una mejor IA depende en gran medida de gastar mucho en chips más avanzados de empresas como Nvidia Corp. y en centros de datos cada vez más grandes para albergarlos.

El entusiasmo por la hazaña de DeepSeek provocó una caída de casi un billón de dólares en las acciones tecnológicas estadounidenses y europeas el lunes, ya que los inversores cuestionaron los planes de gasto de algunas de las empresas más grandes de Estados Unidos. La caída de las acciones del fabricante de chips de inteligencia artificial Nvidia por sí sola borró aproximadamente 589.000 millones de dólares en valor de mercado, la mayor caída en la historia del mercado de valores de Estados Unidos.

Mientras tanto, en Washington, los legisladores deben averiguar la mejor ruta para frenar el progreso de China en una tecnología que algunos consideran crucial para su ejército y su economía, dado que las restricciones a la exportación de chips de la administración Biden no fueron suficientes. David Sacks, el zar de las criptomonedas y la inteligencia artificial del presidente Donald Trump, dijo que DeepSeek demuestra que la carrera mundial de la inteligencia artificial será muy competitiva, al tiempo que culpó a la administración Biden por la regulación que "paralizó" el desarrollo de la inteligencia artificial.

Al igual que algunos de los últimos modelos de OpenAI, Google y Anthropic, R1 pretende imitar la forma en que los humanos a veces reflexionan sobre los problemas dedicando tiempo a calcular una respuesta antes de responder a las consultas de los usuarios. Sin embargo, la versión de DeepSeek difiere en su eficiencia. El equipo que está detrás de ella ideó algunas innovaciones simples pero clave, como encontrar formas de aprovechar más los chips de computadora a los que tenían acceso. Otro avance: apoyarse en gran medida en una técnica conocida como aprendizaje de refuerzo que recompensa a un sistema por las respuestas correctas y lo castiga por las incorrectas.

La aplicación de DeepSeek se hizo popular entre los usuarios estadounidenses, en parte gracias a un chatbot afable y de un sonido algo extraño que muestra con gran detalle cómo piensa responder a la pregunta de una persona antes de sumergirse en los resultados. El enfoque incluye muchos más detalles que, por ejemplo, los últimos modelos de razonamiento de OpenAI. Y a diferencia de OpenAI, que cobra hasta 200 dólares al mes por acceso ilimitado a sus modelos de razonamiento más avanzados, entre otras funciones, DeepSeek actualmente ofrece su servicio de forma gratuita.

La irrupción de DeepSeek destruye, al parecer, el modelo de negocios de los gigantes tecnológicos porque consigue los mismos resultados que OpenAI con muchos menos costes. La estrepitosa caída de las acciones de empresas, como el gigante de chips Nvidia Corp, se acercó al billón de dólares, una de las pérdidas más importantes en la historia. “La pregunta que ahora preocupa a los inversores, las empresas y los responsables políticos es si la inteligencia artificial requiere cientos de miles de millones de dólares en gastos de capital para desarrollar las últimas innovaciones y modelos de IA de vanguardia, y si los controles de las exportaciones pueden contener la competencia china”, se pregunta también Bloomberg.

La Administración Biden hace pocas semanas restringió los microchips que pueden comprar las empresas chinas en un intento de cortar en seco los avances en IA del gigante asiático. Existe la creencia que este control de exportaciones funcionará en detener el desarrollo de la IA en China y seguirá dándole la delantera a las compañías estadounidenses

DeepSeek acumuló la cantidad necesaria de microchips de Nvidia mucho antes que la medida comenzará aplicarse. El lanzamiento coincidió con dos eventos: la asunción de Trump y una conferencia en Beijing de su director ejecutivo, Liang Wenfeng, con el primer ministro chino, Li Qiang.

Leamos:

La investigación de DeepSeek fue financiada por el presupuesto de I+D de High-Flyer, dijo Liang anteriormente. Obtuvo recursos informáticos del fondo cuantitativo, que había acumulado 10.000 GPU de Nvidia en 2021, antes de las prohibiciones estadounidenses a las exportaciones de sofisticados chips de Nvidia y otras unidades de procesamiento gráfico.

Liang contrató talentos de ingeniería casi exclusivamente de China. Muchos de ellos eran recién egresados de las mejores universidades, pasantes en la última etapa de sus estudios de doctorado y medallistas olímpicos.

"Es un nerd, pero nerd en este contexto no es algo negativo", dijo Zihan Wang, estudiante de doctorado en la Universidad Northwestern que realizó una pasantía de seis meses en DeepSeek en 2024.

Wang dijo que Liang realizó muchos experimentos por su cuenta y que DeepSeek funcionó como un laboratorio de investigación. “Comenzó a pequeña escala, pero a medida que lograron avances reales, comenzaron a entusiasmarse”, dijo.

La startup comenzó a lanzar modelos periódicamente, aparentemente inmune a —e incluso estimulada por— la prohibición estadounidense de exportar chips aceleradores de IA de última generación.

DeepSeek lanzó su modelo de razonamiento de inteligencia artificial avanzado R1 el 20 de enero, el mismo día en que Donald Trump juró como el 47º presidente de Estados Unidos.

Ese mismo lunes, Liang asistió a un simposio empresarial a puertas cerradas en Pekín, organizado por el primer ministro chino, Li Qiang. Allí, expertos en tecnología, ciencia, educación y otros campos ofrecieron sus opiniones y sugerencias para un borrador del informe sobre la labor del gobierno, según la agencia de noticias oficial Xinhua. Un vídeo publicado en YouTube muestra a Liang sentado frente a Li y hablando, mientras el líder chino asiente con atención.

Cabe destacar que DeepSeek ha abierto el código fuente de su R1, lo que permite a los investigadores y desarrolladores utilizar, modificar y comercializar libremente el modelo. Esto ha enviado una señal de que desea colaborar e innovar con otros miembros de la comunidad global de IA.

Se supone que Liang posee el 51% de High-Flyer. Eso le daría una participación por valor de 71 millones de dólares según un análisis comparativo, según el Índice de multimillonarios de Bloomberg. Si DeepSeek alcanza el mismo potencial que OpenAI, valorado en aproximadamente 150.000 millones de dólares, el fundador podría potencialmente estar en condiciones de recibir una ganancia inesperada masiva.

Algunos han puesto en duda que DeepSeek, de Liang, sea tan prometedor como parece. Entre las deficiencias se encuentran la capacidad de la infraestructura de la startup para gestionar el tráfico global que espera para probar su servicio, o el manejo que hace la aplicación de temas delicados como las protestas de 1989 en la plaza de Tiananmen y las consultas sobre el líder chino Xi Jinping.

Los expertos también han cuestionado la suposición de que DeepSeek estaba construyendo con 10.000 chips Nvidia A100, y analistas como Dylan Patel especulan que DeepSeek necesita al menos 50.000 de los chips mucho más potentes de Nvidia, los H100. Meta Platforms Inc., por ejemplo, opera el equivalente a 600.000 Nvidia H100.

Deepseek mezcla dos aspectos que golpean en el centro de gravedad del capitalismo en la nube estadounidense: la capacidad de innovar con modelos de código abierto a bajos precios y su creación a partir de la especulación financiera. DeepSeek es una startup sin fines de lucro creada por el fondo de inversión chino High-Flyer, fundado por el director ejecutivo de la compañía, Liang, y dos antiguos compañeros de ingeniería electrónica de la universidad de Zhejiang , una prestigiosa universidad en la ciudad de Hangzhou.

Liang Wenfeng

Los tres crearon un modelo para invertir en acción en base al aprendizaje automatizado, una disciplina de la IA. Inicialmente, construyeron un modelo basado en factores de precio y volumen, antes de probar el aprendizaje automático en 2016. Como resultado, High-Flyer aumentó sus activos rápidamente, alcanzando más de 90 mil millones de yuanes en 2021 hasta que tambalearon sus acciones cuando su modelo falló en calcular algunas operaciones bursátiles.

La historia de Liang coincide, además, con el estereotipo de nerds que empiezan grandes empresas en el garaje de sus padres. Nació en 1985 en Zhanjiang, una ciudad económicamente pobre en la provincia de Guangdong, al sur de China. Y su padre era maestro de escuela primaria.

Para Arnaud Bertrand, analista francés que vive en el gigante asiático , toda la historia muestra el autoengaño de Estados Unidos sobre su superioridad respecto a China.

DeepSeek sólo es "sorprendente" si basas tu comprensión de China en los informes de medios como The Economist, que siguen describiendo a China como una versión caricaturesca de sí misma: un villano monolítico siempre al borde del colapso, plagado de problemas insolubles que lo colocan en una desventaja significativa frente a un EE. UU. excepcional. Ni siquiera estoy exagerando. El trimestre pasado, The Economist publicó un artículo sobre cómo China estaba "cometiendo algunos de los errores que cometió la Unión Soviética" escribiendo sin ironía (y con una asombrosa falta de conciencia de sí mismos) que "la mala información es una grave amenaza para la economía de China".

Mientras tanto, casi simultáneamente, publicaron un informe especial sobre "la economía estadounidense, la envidia del mundo" (https://economist.com/special-report/2024-10-19 …). Como recordatorio, en 2024 la economía de China creció un 5% frente al 2,8% de EE. UU.... Si tuvieras una comprensión precisa de lo que realmente estaba sucediendo en el país, sabrías que China en realidad no estaba "muy atrás" en lo que respecta a la IA, como escribe The Economist. De hecho, al mismo tiempo que escribían que China estaba siguiendo el camino de la Unión Soviética, yo señalaba que China ya estaba liderando a EE. UU. en 6 de los 7 campos de la IA (https:// x.com/RnaudBertrand/ status/1831536798578962513 …).

El único campo en el que no estaban liderando (estaban en un cercano segundo lugar) era el procesamiento del lenguaje natural, es decir, los LLM como ChatGPT. Y, he aquí, DeepSeek demuestra que ahora también se han puesto al día en este campo. También escribí a principios del año pasado que cuando se observa el talento de IA de primer nivel en todo el mundo (los mejores desarrolladores e investigadores de IA), un asombroso 47% de ellos eran chinos, frente al 18% estadounidense (https:// x.com/RnaudBertrand/ status/1765585506514174088 …). No hace falta ser un genio para darse cuenta de que si tienes la mitad del mejor talento de IA del mundo, deberías ser increíblemente bueno en el campo.

También podría haber mirado las patentes y haber notado que, según la Organización Mundial de la Propiedad Intelectual (OMPI), desde 2017 China ha publicado más patentes en el campo de la IA generativa cada año que todos los demás países juntos (https://wipo.int/web-publicatio ns/patent-landscape-report- generative -artificial-intelligence-genai/en/key-findings-and-insights.html …). O podría haber analizado las investigaciones de alto impacto, es decir, los artículos de investigación más citados, y haber notado que ya en 2019 China alcanzó la paridad con los EE. UU. en participación en el 5 por ciento de las publicaciones sobre IA más importantes del mundo (https://cset.georgetown.edu/publication/co mparing-us-and- chinese -contributions-to-high-impact-ai-research/ …).

Todo esto demuestra que uno sólo puede "sobresaltarse" y sólo podría haber pensado que China estaba "muy atrasada" en IA si realmente no estaba prestando atención. O si tenía prejuicios tan delirantes que estaba completamente ciego a las realidades del mundo en el que realmente vivimos. Y, volviendo a mi punto original, no es China la que sale perjudicada por esta ceguera. Si no entiendes a tu rival y lo ves como una caricatura groseramente engañosa, te perjudicas a ti mismo. Cuando reduces a China a un villano de dibujos animados, te pierdes la historia real y te tomas por sorpresa, como es obvio con el episodio de DeepSeek. Yo diría que el mismo mecanismo está en juego con la política estadounidense, por ejemplo con los controles de exportación de chips que apuntaban a "frenar a China". Cualquiera que no mire el mundo a través del prisma del excepcionalismo arrogante estadounidense podría haber predicho que lejos de frenarlos, potenciaría sus esfuerzos por desarrollar una industria nacional de chips y volverse autosuficientes en este sentido. Lo cual tiene todo el sentido del mundo, es exactamente lo que cualquier persona pragmática que tome decisiones haría en el lugar de China. El problema es que esta visión caricaturesca de China impide cualquier empatía estratégica, lo que hace que se pasen por alto por completo predicciones que deberían ser muy fáciles de hacer.

¿La lección? La arrogancia es un lujo que Occidente ya no puede permitirse. El progreso de China no es “sorprendente”, es predecible. Lo único verdaderamente sorprendente es la voluntad con la que Occidente se ciega a la realidad. Para utilizar la propia cita de The Economist, la “mala información” es una amenaza mucho más grave para nosotros que para China: tenemos que empezar a entender el mundo como es, no como deseamos que sea. De lo contrario, seguiremos encontrándonos en la posición irónica de The Economist, “sorprendidos” porque creyó en su propia propaganda.

Lo que nos lleva a una conclusión lógica y obvia: si DeepSeek es el momento Sputnik de la IA, es casi seguro que la reacción estadounidense sea la militarización de la IA con sanciones y un posible boicot comercial y tecnológico contra las compañías chinas que compitan contra sus empresas. Ya los gigantes tecnológicos piden a gritos que aplicaciones como DeepSeek sean sacadas de las tiendas en las nubes de Apple y Google.

La experiencia de Tik Tok muestra que si la tecnología es buena y barata puede perdurar más allá de los boicots. Por ejemplo, cuando la aplicación de videos fue banneada, porque las demás compañías no podían competir con su algoritmo de recomendación, apareció Red Note, otra aplicación china, para sustituirla. La excusa para prohibir Tik Tok fue que ponía en riesgo la seguridad de Estados Unidos por estar controlada por China.

William Huo compara esto con el anuncio de Trump del plan Stargate, lanzado con el fundador de OpenIA, los dueños de la empresa Oracle y el banco japonés Softbak para establecer enormes centros de datos para desarrollar la IA en Estados Unidos.

China está desmantelando sistemáticamente las ilusiones de dominio de Estados Unidos sobre la IA, armada con tres ingredientes clave: talento, acceso sin restricciones a los datos y un ecosistema de semiconductores sólido listo para escalar a voluntad.

Al hacer que sus avances en inteligencia artificial sean de código abierto, China no solo está innovando, sino que también está socavando la dependencia de Silicon Valley de la tecnología patentada. La propiedad intelectual de OpenAI de repente parece menos valiosa frente a la estrategia de inteligencia artificial para todos de Beijing.

¿Por qué pagar un alto precio por la exclusividad en inteligencia artificial cuando China ofrece avances de vanguardia de forma gratuita, lo que invita a la colaboración global? Es una medida audaz que desafía no solo el dominio tecnológico de Estados Unidos, sino también todo su enfoque de la innovación.

Mientras tanto, Estados Unidos está paralizado, mirando fijamente los faros de los vehículos que se acercan como un ciervo. En lugar de contrarrestar los avances estratégicos de inteligencia artificial de China, Estados Unidos se distrae con fantasías especulativas como Stargate.

El enfoque de China es pragmático: ampliar la IA, perfeccionar la infraestructura y superar a Occidente en la implementación en el mundo real. Estados Unidos, atrapado en un círculo vicioso de autocomplacencia, corre el riesgo de quedarse irremediablemente atrás.

Como en otros campos de la competencia comercial entre Estados Unidos y China parece todo ser un asunto de costos y exclusividades. El modelo de OpenIA necesita de una enorme burbuja financiera tecnológica para rendir dividendos y sostener la inversión para sostener los avances. Y el de compañías, como DeepSeek, puede sostenerse, en un juego a largo plazo, desde un capitalismo de Estado que financie el proyecto hasta que madure, si el dinero puesto por el fondo de inversión se termina.

Detrás subyace una competencia en el capitalismo en la nube entre los gigantes tecnológicos estadounidenses que te esclavizan con sus suscripciones y un modelo de negocios chino que aún no conocemos del todo, según el experto en tecnologías estadounidenses Casey Newton.

“Por el momento, DeepSeek no parece tener un modelo de negocio que esté a la altura de sus ambiciones. Para la mayoría de los grandes laboratorios de inteligencia artificial de Estados Unidos, el modelo de negocio (aún no realizado) es desarrollar el mejor servicio y venderlo obteniendo ganancias. Hasta la fecha, DeepSeek se ha posicionado como una especie de obsequio altruista. Eso podría cambiar en cualquier momento. DeepSeek podría introducir suscripciones o imponer nuevas restricciones a sus API para desarrolladores. Zvi Mowshowitz teoriza que la empresa podría tomar datos de los usuarios y dárselos al fondo de cobertura para obtener información comercial. Mientras tanto, sin embargo, sólo podemos adivinar cuáles son las ambiciones de DeepSeek, y eso me preocupa, porque en cierto sentido no sabemos con qué nos enfrentamos”, Casey Newton.

Uno de los grandes dilemas existenciales, sin embargo, es que la carrera de la IA quede secuestrada por los billonarios que rodean a Trump, cuya conciencia social es similar a la de los hombres, que pagaban los reyes, para ahorcar personas en plazas públicas.

Veamos...

Fuente: Bruno Sgarzini

Colabora en la elaboración de la información

jueves, 30 de enero de 2025

DeepSeek: la "Inteligencia Artificial" china que aplastó a Silicon Valley. ¿Es el principio del fin para las "big tech" occidentales?

No hay comentarios:

Publicar un comentario