ChatGPT está recibiendo una gran actualización que le permitirá tener conversaciones de voz con usuarios e interactuar usando imágenes, anunció OpenAI en una publicación de blog.
Estas nuevas funciones —que estarán disponibles para los suscriptores de los planes Plus y Enterprise de ChatGPT en las próximas dos semanas— acercan al chatbot de OpenAI a populares asistentes de IA como los que ya emplean Google y Apple; sin embargo, promete ser mucho más intuitivo.
De acuerdo con OpenAI, la función de voz de ChatGPT «abre las puertas a muchas aplicaciones creativas y centradas en la accesibilidad». Por ejemplo, puede narrar cuentos antes de dormir, resolver debates en la mesa y pronunciar en voz alta las entradas de texto de los usuarios.
Con soporte de imágenes, los usuarios pueden tomar fotografías de las cosas que los rodean y pedirle al chatbot que averigüe por qué su parrilla no enciende o que analice un gráfico complejo en busca de datos relacionados con su trabajo.
Las funciones también pueden integrarse en una sola conversación de ChatGPT. Por ejemplo, podrías tomar una fotografía de algún monumento o punto turístico y tener una conversación con el chatbot sobre este. En casa podrías fotografiar el interior de tu refrigerador o despensa para saber qué alimentos tienes y obtener una receta paso a paso para to cena.
La guerra de las IA está más fuerte que nunca
Desde su debut en noviembre del año pasado, ChatGPT ha sido adoptado por empresas para una amplia gama de tareas: desde resumir documentos hasta escribir códigos informáticos. Esto ha desencadenado una carrera entre las grandes empresas tecnológicas para lanzar sus propias ofertas basadas en IA generativa.
Google, por ejemplo, lanzó Bard en marzo de este año para competir directamente con ChatGPT. Recientemente, la compañía anunció nuevas funciones que le permiten al chatbot integrar información de apps como Gmail, Maps y YouTube (que también presentó nuevas herramientas de IA generativa para la creación de contenido la semana pasada).
Microsoft (uno de los principales inversionistas de OpenAI) también anunció la semana pasada al asistente de inteligencia artificial Copilot, que «incorporará el contexto e inteligencia de la web, los datos de trabajo y lo que el usuario está haciendo en el momento en su PC para proporcionar una mejor asistencia».
Todos estos esfuerzos son parte del objetivo de las grandes empresas de llegar eventualmente a lo que se conoce como inteligencia artificial general, o AGI, que se refiere a la capacidad de los sistemas de IA para realizar procesamientos mentales complejos al nivel humano, pero de manera mucho más rápida.