Ir al contenido principal
Todas las coleccionesConsulta 1er y 2do NivelMás de consultas
Transcripción automática de notas de voz con Whisper de OpenAI
Transcripción automática de notas de voz con Whisper de OpenAI

10/04/2023 Inclusión de sistema de reconocimiento de voz Whisper para transcripción automática de audios

R
Escrito por Rubén Mosqueda Herrera
Actualizado hace más de un año

Esta mejora se encuentra disponible para aquellos clientes que utilicen la herramienta de Worklist para grabación de notas de voz durante la valoración médica para ingreso de órdenes de voz. También puede ejecutarse desde la ventana Búsqueda de Sección de Formas.

Hemos agregado una nueva opción que le permitirá a los médicos subir sus propias grabaciones de audio donde por medio de la herramienta Whisper de OpenAI para reconocimiento de voz, se pueda generar de manera automática la transcripción de las indicaciones. Anteriormente, las transcripciones debían ingresarse manualmente por lo que era un proceso más elaborado.

Whisper es un sistema de OpenAI para el reconocimiento automático de voz (ASR) entrenado por medio de aprendizaje de casi 680,000 horas de audios multilingües recopilados de la web. Con esta herramienta, los usuarios podrán cargar sus propias notas de voz y generar automáticamente sus transcripciones en su propio idioma y de manera totalmente segura y confidencial. Mira los detalles de esta mejora :

  1. Una vez hayas generado tu nota de voz (que puede ser grabada en la misma ventana de Worklist) y la tengas guardada localmente en tu PC, dirígete a Worklist y haz clic en la opción Transcripciones de Audio del menú contextual :

2. Ahora, haz clic en Cargar Archivo :

3. Luego en Explorar... y selecciona el archivo de audio a importar.

4. Tu archivo aparecerá adjunto, selecciona Cargar Archivo (Upload) :

5. Ahora, selecciona de la lista el idioma en el que se encuentra tu archivo de audio.

6. Por último, haz clic en Transcribir.

La transcripción se generará en el recuadro de texto de la parte inferior de la ventana. Este texto puede ser modificado o corregido.

Configuraciones necesarias :

  • Para ingresar notas de voz es necesario contar con un servidor del tipo FTP para guardado de notas de voz.

  • Para el reconocimiento de voz y su transcripción, es necesario contar con la Clave Secreta Whisper configurada:

Además, hemos realizado una mejora al guardado de notas de voz durante su grabación :

  1. Ahora, al finalizar la grabación de un audio (Detener grabación), deberás hacer clic en Guardar en servidor para que dicha nota de voz se exporte antes de poder descargarla localmente :

2. Verás un mensaje de confirmación de su exportación. Tras esto se habilitará la opción Descargar al dispositivo.

Esto te dará la certeza de que todas las notas de voz que se graben cuentan con un respaldo además del archivo guardado en el dispositivo.

Mejora disponible en otras ventanas:

La mejora de Transcripciones de audio también es accesible desde la pantalla Búsqueda de sección de Formas, en el menú contextual por lo que aún sin acceso a la opción de Worklist, podrás agregar los audios a transcribir con esta herramienta :

Después de hacer clic en el botón, se abrirá esta ventana (puedes moverla y modificar su tamaño) donde se podrá realizar la carga de archivos para su transcripción (ver pasos 1-6 vistos arriba) :

Próximas mejoras :

  • Visualiza en otras pantallas las transcripciones generadas (aún no disponible)

Esperamos que esto mejore tu experiencia con Cirrus. Recuerda compartir esta información y pedir ayuda si necesitas.

Fecha: 10 de abril, 2023.

¿Ha quedado contestada tu pregunta?