Esta semana, DeepSeek, una startup de un año de existencia, ha hecho noticia al revelar su modelo de inteligencia artificial llamado R1 , similar a ChatGPT. Lo notable de R1 es que opera a una fracción del costo de los populares modelos de IA de OpenAI, Google o Meta.
DeepSeek logró esto con un gasto de solo 5.6 millones de dólares en potencia informática para su modelo base, utilizando procesadores gráficos H800 de NVIDIA, vendidos exclusivamente en China. Este logro se alcanzó en solo 55 días de trabajo. A pesar de las limitaciones, DeepSeek alcanzó a los principales exponentes de la IA utilizando técnicas como la cuantización de 8 bits , que ahorra un 75% en memoria, y el procesamiento por bloques de texto, lo que aumenta la rapidez.
Para contextualizar, Meta anunció que gastaría más de 65 mil millones de dólares este año en el desarrollo de IA, y Sam Altman, director ejecutivo de OpenAI, dijo que la industria de la IA necesitaría billones de dólares en inversiones. Comparativamente, el costo de DeepSeek representa menos de una décima parte del gasto de sus competidores. Mientras que se estiman necesarias 100 mil GPUs para entrenar un modelo de inteligencia, DeepSeek demostró que es posible lograrlo con solo 2 mil , y además, lo ha hecho open source .
Este anuncio ha impactado el mercado, con una caída del 12% en las acciones de NVIDIA, y también afectó a Meta y Alphabet, la empresa matriz de Google. Esta caída repercutió en el mercado en general, ya que las acciones tecnológicas representan alrededor del 45% del mismo.
En una interacción con DeepSeek V3, se destacaron algunas diferencias con ChatGPT. En términos de idiomas, DeepSeek maneja tanto el inglés como el chino de manera nativa y puede comunicarse en otros idiomas, incluido el español, mientras que ChatGPT se centra en inglés. En funcionalidades, DeepSeek puede cargar texto, imágenes, PDFs y extraer información, mientras que ChatGPT se enfoca en la generación de texto creativo. Además, la base de datos de DeepSeek está actualizada hasta julio de 2024, mientras que la de ChatGPT es hasta octubre de 2023.

Deja un comentario