Reuters / OpenAI, fabricante de ChatGPT, anunció el jueves su intención de colaborar con organizaciones para generar grupos de datos públicos y privados con los que entrenar modelos de inteligencia artificial (IA).

El popular chatbot ChatGPT, capaz de generar poemas y prosa a partir de sencillas instrucciones, utiliza grandes modelos lingüísticos entrenados enteramente con datos de código abierto disponibles en Internet.

Este último esfuerzo podría ayudar a la empresa a producir datos de formación más matizados y con un estilo más conversacional.

“Buscamos datos que expresen la intención humana en cualquier idioma, tema y formato”, indica la empresa en una entrada de su blog.

OpenAI está en la búsqueda de socios que le ayuden a crear un conjunto de datos de código abierto para el entrenamiento de modelos lingüísticos. Este grupo de datos sería público y cualquiera podría utilizarlo para entrenar modelos de IA.

La empresa también está elaborando conjuntos de datos privados para entrenar modelos de IA propios.

Shares: