Dioses digitales en duelo: Dos modelos; dos mundos

El presente artículo está formado por dos piezas: una, más amplia, a petición del editor de Global Times (Pekín); la otra, solicitada por la editora de la edición internacional (Londres), como parte de un texto con dos prestigiosos académicos chinos sobre la Inteligencia Artificial y la irrupción de DeepSeek. El artículo se tituló «Dioses digitales en duelo: Dos modelos; dos mundos» en su versión extendida en Pekín, mientras que en la edición internacional (Londres) se publicó como parte de un texto del que tuve el honor de ser coautor junto a los prestigiosos académicos Lü Benfu (Profesor de Universidad de la Academia de Ciencias de China y Vicepresidente del Instituto Nacional Chino para la Innovación y el Desarrollo Estratégico) y Wang Jianbin (Profesor en la Academia de Regional y Global Gobernanzas en la Universidad de Estudios Extranjeros de Pekín), titulado «La cooperación China-Europa en Inteligencia Artificial tiene un gran potencial».

DIOSES DIGITALES EN DUELO: DOS MODELOS; DOS MUNDOS
Por Jorge I. Aguadero Casado (19/febrero/2025)

El artículo, publicado en Global Times (China)

En Europa tenemos la sensación de que los gigantes tecnológicos norteamericanos llevan esta última década quemando el camino, enfrentados al mundo para complacer los delirios de una Administración que trata de aplicar la Doctrina Monroe (“América para los americanos”) en la esfera global, dando cuerpo a un hostil imperialismo tecnológico.

No les señalo por amar intensamente el dinero, pero la devoción por el dólar les está llevando a una encrucijada destructiva, pues están perdiendo el afecto de sus tradicionales aliados comerciales. Estas empresas podrían ser unas inspiradoras abanderadas de la humanidad, pero son como esas personas duras en el gesto y terriblemente vulnerables que pierden el dominio de sí mismas en público porque no saben dominar su temperamento. ¿Cómo nos juzgará la historia? Permítanme que me posicione: la Europa y la China de culturas milenarias me inspiran un afecto más profundo.

Desde que la humanidad pasó de la artesanía al maquinismo no se habían visto tantas maravillas y ahora, en el tránsito del maquinismo a la digitalización plena, la maravilla de Internet abre paso al advenimiento de la IA (Inteligencia Artificial). Tenemos la oportunidad de dar este paso evolutivo en valores, más allá de lo contable. Las inversiones multimillonarias en esta tecnología estratégica requieren una gobernanza clara y honrada, pues la dialéctica coste/riesgo/beneficio definirá nuestro porvenir. El de todos. En cada rincón de la casa común que es el planeta azul.

Estábamos en este contexto, con los gigantes del Nasdaq monopolizando la atención mundial sobre los avances en IA, cuando de pronto ha alzado la mano la inteligencia artificial china DeepSeek, cambiando las normas de juego. La partida, por suerte para el mundo, ya no está en manos de un solo jugador, y esto parece no haber gustado mucho en Washington. Les propongo a continuación una reflexión desde Europa, donde hemos puesto a prueba los dos modelos, el norteamericano y el chino, para compararlos.

El desarrollo de la IA

En primer lugar trazaremos un viaje por la evolución de la tecnología de IA, mostrando las etapas que definen los saltos de conocimiento, entre los cuales hay pequeñas aportaciones que van mejorando estos modelos.

La primera etapa se da hasta el año 2000, en la que los algoritmos eran básicamente máquinas estadísticas que agrupaban palabras que aparecían juntas y de forma recurrente en documentos, con lo que trataban de intuir cuál era la temática del mismo.

La segunda etapa abarca hasta 2015, con las redes neuronales recursivas, donde se usan modelos todavía pequeños, de pocos nodos, para tareas muy concretas (por ejemplo, para saber cuáles son las frases más importantes de un texto). Son modelos computacionalmente muy eficientes, la mayoría se pueden ejecutar en el ordenador de cualquier usuario común, pero siempre con la restricción de que es para tareas muy limitadas. Al referirnos a modelos pequeños les sugiero la analogía con un cerebro: la máquina tiene pocas neuronas para aprender y, al grabar ese aprendizaje en su disco duro, gasta poca memoria, lo que la hace más eficiente energéticamente.

Luego viene la época, a partir de 2015, donde empiezan a aparecer los modelos preentrenados. Son modelos que se han entrenado con mucho texto y que, para hacer una tarea, requieren ejemplos con conclusiones. El problema es que son modelos de lenguaje grandes, necesitan ordenadores potentes para ejecutarse. Son computacionalmente muy ineficientes, pues requieren ajustes específicos de la tarea requerida para funcionar de manera óptima.

Finalmente, en 2020, con GPT-3, empezamos a tener los lenguajes LLM (Large Languaje Models), que son aquellos entrenados por billones o trillones de parámetros, cantidades de datos enormes, con la idea de sean genéricos. Es decir, que puedan contestar cualquier pregunta, en cualquier idioma, y que el modelo sea capaz de entender y generar contenido como respuesta (Generative AI), que es donde se encuadra ChatGPT (2022). La parte de chat es simplemente la interfaz, lo que permite al usuario común interactuar con la máquina. Así, los grandes saltos tecnológicos han sido: hasta 2000, en 2015 y en 2020.

El artículo, publicado en Global Times Edición Internacional (Londres)

La comparativa

En Europa consideramos que es muy posible que, debido en gran medida a las restricciones de chips por parte de EE. UU., China haya perfeccionado una tecnología preexistente, la tecnología ARM (un set de instrucciones que se puede usar para el chip), para desarrollar sus propias tarjetas gráficas, pudiendo así prescindir de las de NVIDIA. Esta tecnología, que ya se usaba para pequeños dispositivos, es interesante porque es muy eficiente en el uso energético.

A consultas de este articulista, un académico escandinavo especialista en Ciencias de la Computación (que prefiere no ser citado para evitarse problemas en Occidente) ha confrontado ambos modelos con pequeños experimentos. La gran ventaja que destaca en DeepSeek es el ahorro de energía, con la esperanza de que algún día podamos tener nuestros dispositivos personales de inteligencia artificial general sin necesidad de conectarnos a Internet. En el momento actual, cuando usamos un navegador en Internet hacemos una petición, que va al correspondiente servidor, allí se procesa la respuesta y se nos contesta. Este proceso entraña peligros de seguridad al hacerse con una fuente externa y, además, es lento e ineficiente energéticamente.

“¿Hasta qué punto es grande el salto tecnológico protagonizado por DeepSeek?”, he preguntado. El académico me ha respondido que es una tecnología que está dos años por detrás de la norteamericana en algunos aspectos, pero que sus carencias se pueden resolver muy fácilmente, por lo que en poco tiempo van a estar a la par en ese sentido. “Esto no es un gran fallo de DeepSeek” – dijo-. “Lo que es más determinante es su consumo energético. Es verdad que en el artículo donde mencionan su salto energético, en entreno y en el procesado de cada una de las peticiones, no dan datos concretos de las máquinas donde se ha ejecutado, pero asumimos que eso es correcto porque se ha publicado y por tanto ha pasado un proceso de revisión, por lo que en términos de eficiencia energética DeepSeek tiene una ventaja competitiva importante. En esencia, la tecnología china se va a poner al día en eso y conseguirá mejorar fácilmente, pero en cómo salvar energía no es algo en lo que se hayan centrado mucho los norteamericanos, y les va a costar más”.

En cuanto a tocar temas geopolíticos delicados, el académico escandinavo me manifestó su sorpresa al comprobar que la tecnología china era mucho más suave de lo que él esperaba, pues si bien no entraba en ciertos temas, la IA no censuraba opiniones.

En lo concerniente a la capacidad de computación no encontró diferencias entre ambos modelos, obteniendo datos fiables en operaciones matemáticas y en el acceso a datos históricos. Las dos grandes diferencias que ha observado a favor del modelo norteamericano son la presentación (ofrece tablas para justificar la información en pantalla) y su facilidad para trabajar con imágenes. Otra ventaja de ChatGPT es que tiene menos alucinaciones (la tendencia a inventarse datos), pero conforme más usuarios usen DeepSeek antes se igualarán en esto, por lo que no le parece un hecho determinante (recordemos que, hace 3-4 años, ChatGPT-3 tenía el mismo problema). El principal campo de mejora es que ChatGPT ofrece un 50% de las referencias dando enlaces en sus experimentos (del otro 50% da referencias ambiguas), mientras que DeepSeek no ha dado los enlaces y, por tanto, mi fuente no podía comprobar la exactitud de los datos de manera inmediata (esto no significa en absoluto que fuesen incorrectos). Un aspecto que le ha sorprendido es que el modelo chino, al preguntar sobre información actual, ofrecía principalmente respuestas sobre EE. UU., lo que puede ser debido al idioma (preguntaba en inglés), al entrenamiento (quizás se ha entrenado más con datos de EE. UU. que de otro lugar) o, simplemente, ello puede carecer de significado (pues ha hecho pocas pruebas). Otro hecho interesante es que la máquina china ofrece más información que la norteamericana en sus respuestas, lo que puede gustar más a un tipo de usuario y menos a otro, en función de si desea más explicación o más concreción.

Desde su punto de vista, ante los retos que han de superar ambas tecnologías, le parece mucho más importante la ventaja energética que ha conseguido China. Asumiendo que los chinos pueden hacer ciencia igual de bien que sus rivales estadounidenses, sólo van dos años por detrás. En cuanto a los norteamericanos, sus tarjetas gráficas no especializadas parecen peores que la tecnología ARM que parece desarrollar China.

Conclusiones

En mi opinión, en cuanto a los acuerdos que Donald Trump ha firmado para invertir quinientos mil millones de dólares en una IA superpotente norteamericana, tengo grandes dudas de que eso pueda llevarse a cabo. Sabiendo que todos los modelos desarrollados en EE. UU. son productos de empresas privadas, ¿cómo usaría el dinero? ¿Lo inyectaría en el top-5? ¿Va a crear una agencia gubernamental para contratar a las mentes más brillantes? No lo tengo claro. De hecho, no creo que las empresas tecnológicas puedan desarrollar esos productos más rápido de lo que lo están haciendo, independientemente de los dólares invertidos, pues a esos niveles la ganancia en tiempo de desarrollo no es directamente proporcional al esfuerzo económico. Y tampoco tengo claro que disponga de ese dinero para gastar, especialmente cuando llega la noticia de la primera oleada de despidos masivos de empleados federales. ¿En qué se podría poner ese dinero en caso de ser real? En infraestructuras, servidores, computación… (no cuento los sueldos de los investigadores, irrisorio para este caso). “Eso acelera que la máquina pueda aprender más rápido, pero no acelera el desarrollo de la tecnología. Aparte de eso, creo que DeepSeek, invirtiendo muchísimo menos dinero, puede conseguir el mismo logro”, me indica el académico escandinavo.

EE. UU. y China están haciendo grandes inversiones en esta tecnología que dominará el futuro del mundo, siendo que la Unión Europea también está mostrando notable actividad. La visión del académico al respecto es que Europa tiene un pensamiento más regulador y que también invierte mucho en otras áreas de ciencia (por ejemplo, en proyectos de gran envergadura como la investigación sobre el grafeno y la del mapeado del cerebro humano, que consumen muchos recursos), aunque ha de afrontar ciertas dificultades en materia de financiación.