Hasta ahora, ChatGPT, la popular herramienta conversacional con Inteligencia Artificial desarrollada por sólo era capaz de ofrecer respuestas de texto. Desde septiembre de 2023 se le pueden hacer preguntas vía voz, pero hasta ahora no podía responder a través de la misma vía.
Sin embargo, ahora la empresa creadora de Chat GPT, OpenAI, ha lanzado una nueva funcionalidad multimodal que permite recibirlas en voz alta. Esto puede ser muy útil para cuando, por ejemplo, se está realizando otra tarea mientras se consulta a ChatGPT o no hay posibilidad de mirar una pantalla (o para que el chat se integre en dispositivos que no tengan una). También para que personas con deficiencias visuales puedan emplear la herramienta.
Eso si, llega después de que uno de los competidores de OpenAI, Anthropic, haya añadido también la posibilidad de responder a través de más de un medio (multimodalidad) a sus modelos de Inteligencia Artificial. Combinando la funcionalidad lanzada en septiembre con esta, se puede así «mantener una conversación» con ChatGPT y hacerle preguntas con prompts vía voz y obtener las respuestas en voz alta.
Cómo funciona «Read Aloud» de ChatGPT
La herramienta desarrollada por OpenAI, que recibe el nombre de «Read Aloud», ya está disponible tanto en la versión web de ChatGPT como en las aplicaciones para iOS y Android para ChatGPT. Además, puede emplearse tanto en GPT-4 como en GPT-3.5.
La funcionalidad, como si fuese un GPS, permite al usuario seleccionar cinco opciones de voz diferentes, tanto masculinas como femeninas. «Read Aloud» se puede emplear en 37 idiomas diferentes en el momento de su lanzamiento, aunque la compañía asegura que lanzará más en el futuro.
ChatGPT tiene la capacidad de reconocer automáticamente el idioma en el que se ha escrito el texto. Incluso podría leer en voz altas frases escritas en varios idiomas distintos.
Además, en aplicaciones móviles incorpora más funcionalidades. Por ejemplo, se puede presionar sobre el reproductor de «Read Aloud» para parar la reproducción de texto. También se puede «rebobinar» para comenzar la respuesta de nuevo desde el principio.