OpenAI dice que tiene evidencia de que DeepSeek de China utilizó su modelo para entrenar a un competidor

Mantente informado con actualizaciones gratuitas

OpenAI dice que ha encontrado evidencia de que la startup china de inteligencia artificial DeepSeek utilizó los modelos propietarios de la empresa estadounidense para entrenar su propio competidor de código abierto, mientras crecen las preocupaciones sobre una posible violación de propiedad intelectual.

El fabricante de ChatGPT con sede en San Francisco dijo al Financial Times que había visto algunas pruebas de “destilación”, que sospecha que provienen de DeepSeek.

La técnica se utiliza para obtener un mejor rendimiento en modelos más pequeños utilizando salidas de modelos más grandes y capaces, lo que les permite lograr resultados similares en tareas específicas a un costo mucho menor.

La destilación es una práctica común en la industria, pero la preocupación era que DeepSeek podría estar utilizándola para construir su propio modelo rival, lo cual sería una violación de los términos de servicio de OpenAI.

“El problema surge cuando [lo sacas de la plataforma y] lo haces para crear tu propio modelo para tus propios fines”, dijo una persona cercana a OpenAI.

OpenAI se negó a hacer más comentarios o proporcionar detalles de sus pruebas. Sus términos de servicio establecen que los usuarios no pueden “copiar” ninguno de sus servicios o “utilizar la salida para desarrollar modelos que compitan con OpenAI”.

El lanzamiento del modelo de razonamiento R1 de DeepSeek ha sorprendido a los mercados, así como a inversores y empresas tecnológicas en Silicon Valley. Sus modelos construidos con pocos recursos han alcanzado altos rankings y resultados comparables a los principales modelos de Estados Unidos.

LEAR ¿Podrían los carriles para bicicletas remodelar el Los Ángeles obsesionado con los autos?

Las acciones de Nvidia cayeron un 17% el lunes, borrando $589 mil millones de su valor de mercado, debido a los temores de que no se necesitaran grandes inversiones en su costoso hardware de inteligencia artificial. Se recuperaron un 9% el martes, junto con otras acciones tecnológicas.

OpenAI y su socio Microsoft investigaron cuentas que se cree que eran de DeepSeek el año pasado y que estaban utilizando la interfaz de programación de aplicaciones de OpenAI, o API, y bloquearon su acceso por sospecha de destilación que violaba los términos de servicio, agregó otra persona con conocimiento directo. Estas investigaciones fueron reportadas por primera vez por Bloomberg.

Microsoft se negó a hacer comentarios y OpenAI no respondió de inmediato a una solicitud de comentarios sobre este detalle. DeepSeek no respondió a una solicitud de comentarios. China está cerrada por las vacaciones del año nuevo lunar.

Anteriormente, el zar de IA y criptomonedas del presidente Donald Trump, David Sacks, dijo “es posible” que se haya producido robo de propiedad intelectual.

“Hay una técnica en IA llamada destilación… cuando un modelo aprende de otro modelo [y] extrae el conocimiento del modelo padre”, dijo Sacks a Fox News el martes.

“Y hay evidencia sustancial de que lo que hizo DeepSeek aquí es destilar el conocimiento de los modelos de OpenAI, y no creo que OpenAI esté muy feliz al respecto”, agregó, aunque no proporcionó pruebas.

DeepSeek dijo que utilizó solo 2,048 tarjetas gráficas Nvidia H800 y gastó $5.6 millones para entrenar su modelo V3 con 671 mil millones de parámetros, una fracción de lo que OpenAI y Google gastaron para entrenar modelos de tamaño comparable. Algunos expertos dijeron que el modelo generaba respuestas que indicaban que había sido entrenado en salidas de GPT-4 de OpenAI, lo cual violaría sus términos de servicio.

LEAR El gestor de fondos de cobertura Steve Cohen sigue siendo "optimista" sobre la IA después de una gran venta.

Los insiders de la industria dicen que es una práctica común que los laboratorios de IA en China y Estados Unidos utilicen salidas de empresas como OpenAI, que han invertido en contratar personas para enseñar a sus modelos a producir respuestas que suenen más humanas. Esto es costoso y requiere mucho trabajo, y los jugadores más pequeños a menudo se aprovechan de este trabajo, dicen los insiders.

“Es una práctica muy común que las startups y los académicos utilicen salidas de LLM comerciales alineados con humanos, como ChatGPT, para entrenar otro modelo”, dijo Ritwik Gupta, candidato a doctorado en IA en la Universidad de California, Berkeley.

“Eso significa que obtienes este paso de retroalimentación humana de forma gratuita. No me sorprendería que supuestamente DeepSeek estuviera haciendo lo mismo. Si lo estuvieran haciendo, detener esta práctica precisamente podría ser difícil”, agregó.

La práctica destaca la dificultad para las empresas que desean proteger su ventaja técnica. “Sabemos que las empresas con sede en China, y otras, están constantemente tratando de destilar los modelos de las principales empresas de IA de Estados Unidos”, dijo OpenAI en su último comunicado.

Agregó: “Implementamos contramedidas para proteger nuestra propiedad intelectual, incluido un proceso cuidadoso para determinar qué capacidades de vanguardia incluir en los modelos lanzados, y creemos… que es de vital importancia que estemos trabajando estrechamente con el gobierno de Estados Unidos para proteger mejor los modelos más capaces de los esfuerzos de adversarios y competidores por tomar la tecnología estadounidense”.

OpenAI está luchando contra acusaciones de infracción de derechos de autor de su parte de periódicos y creadores de contenido, incluidas demandas de The New York Times y autores prominentes, que acusan a la empresa de entrenar sus modelos en sus artículos y libros sin permiso.

LEAR La actividad en el Reino Unido cae al nivel más bajo en un año mientras las empresas dan un 'pulgar abajo' al presupuesto.