La carrera por la Inteligencia Artificial (IA), puede sufrir un fuerte revés para el 2026, y esto se debe a la posible falta de datos.
Las diferentes empresas tecnológicas, llámese: Meta (Matriz de Facebook, Instagram y WhatsApp), Google y OpenAI ( Desarrolladora de ChatGPT), de por si el problema ya lo tienen sobre la mesa.
«Las herramientas de inteligencia artificial actuales se entrenaron con la enorme cantidad de información que se encuentra disponible en internet. Sin embargo, para el año 2026, se calcula que todos los datos de alta calidad podrían haberse agotado», comenta Epoch, una firma de investigación especializada en IA.
¿Cómo se pueden aprovechar mejor estos datos?
El verano que paso, el departamento jurídico de Google, pidió a sus trabajadores que ampliaran el uso de datos de los consumidores, dio a conocer en una publicación en el New York Times.
Estos a su vez, fueron informados quela compañía quiere utilizar datos de las versiones gratuitas para los consumidores de Google Docs, Google Sheets, Google Slides.
¿Qué otras acciones se puede hacer para llegar a este problema?
OpenAI, creador de herramientas como ChatGPT o DALL·E, contempló la idea de utilizar información sintética, que son datos generados por los propios sistemas de inteligencia artificial, como una solución para el entrenamiento de sus modelos.
«Siempre y cuando se pueda superar el horizonte de datos sintéticos, en el que el modelo es lo suficientemente inteligente como para generar buenos datos sintéticos, todo irá bien», comento Sam Altman, CEO de OpenAI.
¿Que aplicaciones pueden facilitarnos algunas actividades?
OpenAI, creador de Whisper y GPT-4, utilizó su herramienta de reconocimiento de voz para transcribir más de un millón de horas de videos de YouTube, los cuales fueron empleados para entrenar su último modelo de lenguaje grande.
Greg Brockman, presidente de la empresa detrás de ChatGPT, desempeñó un papel importante en el desarrollo de Whisper. En una entrevista con el New York Times, mencionó que OpenAI utiliza una «variedad de fuentes» de datos para entrenar sus sistemas.
Otra de estas es Photobucket fue en su momento el principal servicio de alojamiento de imágenes a nivel mundial, albergando la mitad del mercado de fotos en línea en Estados Unidos. Esto se atribuyó en parte a su asociación con las primeras redes sociales como Myspace o Friendster.