Dirección 

175 Greenwich St, New York, NY 10007

Cómo el start-up chino aí Deepseek está compitiendo con Openai y Google

Cómo el start-up chino aí Deepseek está compitiendo con Openai y Google – MundoDaily


El día después de Navidad, una pequeña empresa china llamada Deepseek presentó un nuevo sistema de IA que podría corresponder a las capacidades de los chatbots de última generación de compañías como OpenAi y Google.

Eso en sí mismo habría sido un hito. Pero el equipo detrás del sistema, llamado Deepseek-V3, describió un paso aún mayor. En uno Trabajo de investigación Al explicar cómo construyeron la tecnología, Deepseek Engineers dijo que usaban solo una fracción de chips informáticos altamente especializados con los que las principales empresas de IA confiaban en capacitar a sus sistemas.

Estos chips están en el centro de una competencia tecnológica tensa entre Estados Unidos y China. Si bien el gobierno de los Estados Unidos trabaja para mantener el liderazgo del país en la raza global de la IA, está tratando de limitar la cantidad de chips poderosos, como los fabricados por la compañía Silicon Valley Nvidia, que se puede vender a China y otros rivales.

Pero el desempeño del modelo Deepseek plantea preguntas sobre las consecuencias involuntarias de las restricciones comerciales del gobierno de los Estados Unidos. Los controles obligaron a los investigadores en China a ser creativos con una amplia gama de herramientas gratuitas disponibles en Internet.

El chatbot de Deepsek respondió preguntas, resolvió problemas lógicos y escribió sus propios programas de computadora tan capaces como cualquier cosa que ya esté en el mercado, de acuerdo con las pruebas de referencia que las compañías de IA estadounidenses están utilizando.

Y fue creado con la idea barata, desafiando la idea predominante de que solo las compañías de tecnología más grandes, todas con sede en los Estados Unidos, podían permitirse crear los sistemas de IA más avanzados. Los ingenieros chinos dijeron que solo necesitaban $ 6 millones en computación bruta para construir su nuevo sistema. Esto es aproximadamente 10 veces menos que el gigante de la tecnología que pasó a construir su última tecnología de IA.

«El número de empresas que tienen $ 6 millones para gastar es mucho mayor que el número de empresas que tienen $ 100 millones o $ 1 mil millones para gastar», dijo Chris V. Nicholson, un inversor de la compañía de capital de riesgos, página uno, que se centra en las tecnologías de IA.

Dado que OpenAi causó el auge de la IA en 2022 con el lanzamiento de ChatGPT, muchos expertos e inversores han concluido que ninguna compañía podría competir con los líderes del mercado sin gastar cientos de millones de dólares en chips especializados.

Las principales compañías de IA del mundo capacitan a sus chatbots utilizando supercomputadoras que usan hasta 16,000 chips si ya no. Los ingenieros de Deepseek, por otro lado, dijeron que solo necesitaban 2,000 chips de computadora especializados de Nvidia.

Las restricciones de China en China obligaron a los ingenieros profundos a «entrenarlo de manera más eficiente para que aún pueda ser competitivo», dijo Jeffrey Ding, profesor asistente en la Universidad George Washington especializado en tecnología emergente y relaciones internacionales.

A principios de este mes, el gobierno de Biden emitió nuevas reglas destinadas a evitar que China obtenga chips de IA avanzados de otros países. Las reglas se basan en varias rondas de restricciones anteriores que impiden que las empresas chinas compren o realicen chips de computadora de recorte. El presidente Trump aún no ha indicado si mantendrá las reglas o las terminará.

El gobierno de los Estados Unidos trató de mantener chips avanzados fuera de manos de las empresas chinas debido a las preocupaciones que podrían usarse para fines militares. En respuesta, algunas compañías de China almacenaron miles de chips, mientras que otras las adquirieron de un próspero mercado de contrabandistas subterráneos.

Deepseek está dirigido por una compañía de negociación de acción cuantitativa llamada High Flyer. En 2021, había canalizado sus ganancias para adquirir miles de chips Nvidia, que solían capacitar a sus modelos anteriores. La compañía, que no respondió a las solicitudes de comentarios, se hizo conocida en China por recopilar el talento de las mejores universidades con la promesa de altos salarios y la capacidad de seguir las preguntas de investigación que más despertan su interés.

Zihan Wang, un ingeniero informático que trabajó en un modelo anterior de Deepseek, dijo que la compañía también contrata a personas sin antecedentes de informática para ayudar a la tecnología a comprender y poder generar preguntas de poesía y as sobre el notoriamente difícil examen de admisión de la facultad china.

Deepseek no fabrica ningún producto para los consumidores, lo que permite que sus ingenieros se concentren por completo en la investigación. Esto significa que su tecnología no está rodeada por el aspecto más duro de las regulaciones de IA de China, que requieren que la tecnología del consumidor cumpla con los controles gubernamentales.

Las principales compañías estadounidenses continúan avanzando en el estado del arte en diciembre, OpenAI presentó un nuevo sistema de «razonamiento» llamado O3 que excede el rendimiento de las tecnologías existentes, aunque aún no está ampliamente disponible fuera de la empresa. Pero Deepseek continúa demostrando que no está mucho atrás. Este mes, lanzó un impresionante modelo de razonamiento.

(New York Times demandó a Openai y a su socio Microsoft, acusándolos de violación de derechos de autor del contenido de noticias relacionados con los sistemas de IA. Openai y Microsoft negaron estas afirmaciones).

Una parte crucial de este mercado global de cambio rápido es una idea antigua: software de código abierto. Al igual que muchas otras compañías, Deepseek ha abordado su último sistema de IA, lo que significa que ha compartido el código subyacente con otras compañías e investigadores. Esto permite a otras personas construir y distribuir sus propios productos utilizando las mismas tecnologías.

Mientras que los empleados de las principales compañías de tecnología china se limitan a colaborar con colegas, «si trabaja en código abierto, trabaja con talentos en todo el mundo», dijo Yineng Zhang, un ingeniero de software líder en Baseten en San Francisco, que trabaja en el proyecto Sglang de código abierto. Ayuda a otras personas y empresas a construir productos utilizando el sistema Deepseek.

El ecosistema de código abierto a la IA ganó vapor en 2023, cuando el objetivo compartió libremente un sistema de IA llamado LHAMA. Muchos asumieron que esta comunidad solo florecería si compañías como los gigantes tecnológicos con enormes centros de datos llenos de chips especializados continúan abriendo sus tecnologías. Pero Deepseek y otros han demostrado que también pueden expandir los poderes de las tecnologías de código abierto. «

Muchos ejecutivos y expertos han argumentado que las grandes empresas estadounidenses no deberían abrir sus tecnologías porque podrían usarse para difundir la información errónea o causar otros daños graves. Algunos legisladores estadounidenses exploraron la posibilidad de prevenir o estrangular la práctica.

Pero otros argumentan que si los reguladores han sofocado el progreso de la tecnología de código abierto en los Estados Unidos, China tendrá una ventaja significativa. Si las mejores tecnologías de código abierto provienen de China, argumentan, los desarrolladores estadounidenses construirán sus sistemas en la parte superior de estas tecnologías. A la larga, esto podría poner a China en el corazón de la investigación y el desarrollo de la IA.

«El centro de gravedad de la comunidad de código abierto se está mudando a China», dijo Ion Stoica, profesor de informática en la Universidad de California, Berkeley. «Esto puede ser un gran peligro para los Estados Unidos» porque permite a China acelerar el desarrollo de nuevas tecnologías.

Horas después de su inauguración, el presidente Trump terminó una orden ejecutiva del gobierno Biden que amenazaba con contener tecnologías de código abierto.

El Dr. Stoica y sus alumnos construyeron recientemente un sistema de IA llamado Sky-T1 que rivaliza con el rendimiento del último sistema Operai, llamado OpenAI O1, en ciertas pruebas de referencia. Necesitaban solo $ 450 en energía de la computadora.

Lo hicieron construyendo en la cima de dos tecnologías de código abierto lanzadas por el gigante de la tecnología china Alibaba.

Su sistema de $ 450 no es tan poderoso como la tecnología de OpenAI o el nuevo sistema Deepsek. Y es poco probable que las técnicas que usan producir sistemas que excedan el rendimiento de las principales tecnologías. Pero el proyecto ha demostrado que incluso los recursos pequeños pueden crear sistemas competitivos.

Reuven Cohen, consultor de tecnología de Toronto, tiene USAEPSEK-V3 desde finales de diciembre. Él dice que es comparable con los últimos sistemas de Openai, Google y Start-Up de St. Francis Anthricic, y mucho más barato de usar.

«Deepseek es una forma de ahorrar dinero», dijo. «Este es el tipo de tecnología que alguien como yo quiere usar».

MundoDaily – #Cómo #startup #chino #aí #Deepseek #está #compitiendo #con #Openai #Google

Publish: 2025-01-27 12:29:00

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *