Publicaciones sobre Euphonia
Con su ayuda, hemos recopilado más de 1 millón de expresiones (1400 horas de datos) de más de mil oradores. Estos datos nos han permitido perfeccionar nuestros algoritmos de voz para comprender mejor los diferentes tipos de voz. Aquí hay una lista completa de todas las publicaciones de blogs y artículos que hemos publicado relacionados con estos esfuerzos de investigación.
Entradas de blog y anuncios
Investigar
Modelos personalizados de reconocimiento automático de voz a partir de un conjunto de datos grande y diverso de trastornos del habla (2021)
Los trastornos del habla afectan a millones de personas, con causas subyacentes que varían de afecciones neurológicas o genéticas a discapacidades físicas, daños cerebrales o pérdida auditiva. De forma similar, los patrones resultantes del habla son diversos, incluidas la tartamudez, la disartria o la apraxia, y pueden tener un impacto perjudicial en la expresión personal, la participación en la sociedad y en el acceso a tecnologías basadas en la voz.
Publicaciones recientes
ICASSP 2023
Clasificadores de inteligibilidad del habla a partir de medio millón de locuciones
Subhashini Venugopalan, Jimmy Tobin, Samuel J. Yang, Katie Seaver, Richard Cave, Pan-Pan Jiang, Neil Zeghidour, Rus Heywood, Jordan Green y Michael P. Brenner
ICASSP 2023
Un análisis de la degeneración en el habla debido a disartria progresiva en el rendimiento del reconocimiento automático de voz
Katrin Tomanek, Katie Seaver, Pan-Pan Jiang, Richard Cave, Lauren Harrel y Jordan R. Green
Interspeech 2022
Evaluar la calidad del modelo de reconocimiento automático de voz en trastornos del habla usando BERTScore
Jimmy Tobin, Qisheng Li, Subhashini Venugopalan, Katie Seaver, Richard Cave y Katrin Tomanek
ICASSP 2022
Reconocimiento automático y personalizado de voz entrenado con pequeños conjuntos de datos de trastornos del habla
Jimmy Tobin y Katrin Tomanek
FRONTIERS IN COMPUTER SCIENCE, VOL. 4 - 2022
Describir la diversidad de la disartria para el reconocimiento automático de voz: un tutorial desde el punto de vista clínico
Hannah P. Rowe, Sarah E. Gutz, Marc F. Maffei, Katrin Tomanek y Jordan R. Green
EMNLP 2021
Adaptadores residuales de adaptación del reconocimiento automático de voz con parámetros eficientes para el habla atípica y con acento
Katrin Tomanek, Vicky Zayats, Dirk Padfield, Kara Vaillancourt y Fadi Biadsy
Interspeech 2021
Colección de datos de trastornos del habla: lecciones aprendidas tras 1 millón de locuciones de Project Euphonia
Robert L. MacDonald, Pan-Pan Jiang, Julie Cattiau, Rus Heywood, Richard Cave, Katie Seaver, Marilyn A. Ladewig, Jimmy Tobin, Michael P. Brenner, Philip C. Nelson, Jordan R. Green y Katrin Tomanek
Interspeech 2021
Reconocimiento automático de voz en trastornos del habla: los modelos personalizados superan a las personas en frases breves
Jordan R. Green, Robert L. MacDonald, Pan-Pan Jiang, Julie Cattiau, Rus Heywood, Richard Cave, Katie Seaver, Marilyn A. Ladewig, Jimmy Tobin, Michael P. Brenner, Philip C. Nelson y Katrin Tomanek
Interspeech 2021
Comparación de modelos supervisados y representaciones del habla aprendida para clasificar la inteligibilidad de la expresión oral en personas con trastornos del habla en frases concretas
Subhashini Venugopalan, Joel Shor, Manoj Plakal, Jimmy Tobin, Katrin Tomanek, Jordan R. Green y Michael P. Brenner
Interspeech 2021
Un interruptor activado por voz para personas con trastornos motores o del habla: detección de vocales aisladas usando redes neuronales
Shanqing Cai, Lisie Lillianfeld, Katie Seaver, Jordan R. Green, Michael Brenner, Philip Q Nelson y D. Sculley
Interspeech 2019
Personalizar el reconocimiento automático de voz para el habla con disartria o acentos con datos limitados
Joel Shor, Dotan Emanuel, Oran Lang, Omry Tuval, Michael Brenner, Julie Cattiau, Fernando Vieira, Maeve McNally, Taylor Charbonneau, Melissa Nollstadt, Avinatan Hassidim y Yossi Matias