Tecnología

Transcribe audios en cualquier idioma desde WhatsApp con esta IA

El chatbot fue desarrollado por una empresa española. (Carina IA)

El chatbot, denominado Carina, es una aplicación de inteligencia artificial que funciona a través de WhatsApp, ampliando las capacidades del servicio de mensajería al ofrecer asistencia en diversas consultas.

Una de las características más destacadas de este chatbot que funciona en WhatsApp es la posibilidad de transcribir mensajes de audio a texto en varios idiomas, incluidos español, inglés, francés, alemán, italiano y portugués.

Cabe destacar que Carina fue desarrollada por una entidad externa a WhatsApp. En concreto, una startup española con sede en Galicia llamada Carina Chat fue la empresa que estuvo detrás de la construcción de esta inteligencia artificial.

Pantalla de una laptop mostrando la interfaz de un chatbot impulsado por Inteligencia Artificial, con líneas de código destacadas. La imagen refleja el impacto de la IA en la evolución tecnológica, simbolizando los avances en programación, robótica y asistencia digital en el campo científico y tecnológico. (Imagen ilustrativa Infobae)
El chatbot tiene información en tiempo real. (Imagen ilustrativa Infobae)

Qué trae Carina IA

Carina es un chatbot desarrollado para operar a través de WhatsApp, cuyas funcionalidades incluyen las características esenciales presentes en otros sistemas de inteligencia artificial similares.

Entre sus capacidades, se encuentra la opción de consultar información sobre el clima y responder a preguntas de diversa índole.

Carina integra datos en tiempo real para proporcionar respuestas actualizadas y precisas. Además, sus respuestas pueden incluir enlaces externos que dirigen a los usuarios hacia fuentes adicionales de información, lo que enriquece la experiencia del usuario al ofrecerle un acceso rápido y directo a datos y recursos relevantes para sus consultas.

Carina comparte enlaces externos. (WhatsApp)
Carina comparte enlaces externos. (WhatsApp)

Probamos su función del clima con un prompt que integraba varias ideas:

“Qué temperatura hay en este momento en la ciudad de méxico? dame tres recomendaciones de outfit basándote en el clima y considerando que mi estilo es boho chic”.

Carina respondió acertadamente la información del clima y proporcionó una respuesta completa en cuanto a las recomendaciones de atuendos.

Este chatbot utiliza un servicio especializado en pronósticos meteorológicos en tiempo real.

La IA comprende prompts con varias sugerencias. (WhatsApp)
La IA comprende prompts con varias sugerencias. (WhatsApp)

Transcripción de audio de Carina

No obstante, la función más destacada de Carina es la transcripción de audios. Esta característica se demuestra bastante precisa al convertir mensajes hablados a texto, facilitando la comunicación en varias situaciones, desde conversaciones cotidianas hasta contextos profesionales.

Aunque no existe un límite en la cantidad de audios que un usuario puede transcribir, es importante tener en cuenta que la duración de estos puede afectar el tiempo de respuesta del chatbot. Mensajes más largos requerirán naturalmente más tiempo para ser procesados y transcritos correctamente.

Asimismo, el chatbot solo soporta audios en formatos MP3, WAV, FLAC. En Infobae probamos la herramienta y no soportó m4a.

El chatbot ofrece resúmenes de los audios en español. (WhatsApp)
El chatbot ofrece resúmenes de los audios en español. (WhatsApp)

Al enviarle un audio en español de 1:15, tardó menos de un minuto en enviar la transcripción y esta fue bastante acertada. Además, envió un resumen de la información contenida en el audio.

Cabe agregar que el audio era una grabación en la que solo estaba la voz del interlocutor y no habían sonidos de terceros.

Luego, se le pidió transcribir un audio en inglés que incluía varias voces, música de fondo y aplausos. El texto que proporcionó fue correcto, sin embargo, el chatbot no distingue entre interlocutores, sólo presenta un párrafo con toda la transcripción.

La IA no distingue voces, solo transcribe. (WhatsApp)
La IA no distingue voces, solo transcribe. (WhatsApp)

Privacidad de los usuarios

La aplicación recaba diversos tipos de información, entre ellos: las páginas y archivos consultados, hora de acceso, versión del navegador, sistema operativo, identificación del dispositivo, páginas visitadas previamente mediante un enlace, dirección IP, información de la aplicación y del dispositivo móvil, ID de sesión, así como cookies.

Además, al interactuar con la funcionalidad de chat, se recopila el número de teléfono del usuario y cualquier dato enviado a través de este medio, incluyendo la voz en caso de solicitar la transcripción de audios y, potencialmente, imágenes presentes en el estado de WhatsApp.

Amazon Web es una de las empresas a las que se comparten datos. (Carina Chat)
Amazon Web es una de las empresas a las que se comparten datos. (Carina Chat)

Es importante que los usuarios estén al tanto de que, para ofrecer el servicio, Carina necesita compartir información identificativa del usuario con ciertas entidades.

Entre estas empresas externas con las que Carina comparte datos para respaldar su aplicación se encuentran: OpenAI OpCo y Amazon Web Services, Inc.

Estas compañías actúan como contratistas, proveedores de servicios y otros terceros usados para el soporte de la aplicación.

Publicaciones relacionadas

Botón volver arriba