OpenAI anunció que retrasaría el lanzamiento de su función «Modo voz» para ChatGPT hasta julio debido a problemas técnicos.
La compañía había planeado originalmente implementar la experiencia de conversación de voz realista para un pequeño grupo de usuarios de ChatGPT Plus a fines de junio; sin embargo, en una publicación de X la compañía dijo que retrasaría el lanzamiento porque necesitaba tiempo para alcanzar un mejor estándar.
«Estamos mejorando la capacidad del modelo para detectar y rechazar cierto contenido. También estamos trabajando para mejorar la experiencia del usuario y preparar nuestra infraestructura para escalar a millones mientras mantenemos respuestas en tiempo real», dijo OpenAI.
OpenAI presentó originalmente la función en mayo, junto a su nuevo modelo de IA GPT-4o, capaz de mantener conversaciones de voz realistas y de interactuar a través de texto e imágenes.
Las nuevas capacidades de audio permitirán a los usuarios hablar con ChatGPT y obtener respuestas en tiempo real sin demora, así como interrumpir ChatGPT mientras habla.
La función cuenta con cinco voces distintas; sin embargo, una de ellas, Sky, causó controversia por su parecido a la de la actriz Scarlett Johansson. La compañía posteriormente argumentó que la voz de Sky no es la de Johansson y que no pretendía parecerse a la suya.
De acuerdo con OpenAI, la función se lanzará inicialmente a un pequeño grupo de usuarios para recopilar comentarios y estará disponible para todos los usuarios Plus en otoño de este año, sujeto a controles de seguridad y confiabilidad.
OpenAI también está trabajando en la implementación de nuevas capacidades de video y uso compartido de pantalla.