Notícias

Diagnóstico da condição de voz do áudio da chamada

Diagnóstico da condição de voz do áudio da chamada

As linhas vermelha e branca indicam os valores medidos e estimados, respectivamente. (a) Estudos prévios (b) Método proposto. Crédito: Copyright (c) Toyohashi University of Technology. Todos os direitos reservados.

O professor assistente Yuya Hosoda, do Center for IT-Based Education (CITE), da Toyohashi University of Technology, desenvolveu um método para estimar o tom das vibrações das cordas vocais de humanos a partir do áudio da chamada.

Neste método, o tom é estimado integrando as quantidades de características extraídas dos espectros de amplitude e fase da fala no plano complexo. Por meio de experimentos, demonstramos que o método proposto é eficiente não apenas para áudios de chamadas cuja faixa de frequência é restrita por padrões de comunicação, mas também funciona de forma robusta em um ambiente com ruído de fundo. A pesquisa foi publicada na revista Transações IEEE/ACM em processamento de áudio, fala e linguagem.

Para prevenir o agravamento de doenças neurodegenerativas como a doença de Parkinson, é desejável o diagnóstico precoce da disartria, que é um sintoma precoce.

A disartria é caracterizada por tremores na voz e respiração perturbada. Embora os testes clínicos diagnostiquem os sintomas a partir da voz do paciente, eles são demorados e trabalhosos. Além disso, é difícil conduzir entrevistas face a face em locais remotos, como áreas montanhosas. Portanto, nesta pesquisa, visamos desenvolver um sistema que diagnostica automaticamente a disartria por meio da telemedicina, realizando rondas de enfermaria por meio de dispositivos de comunicação.

Em pacientes com disartria, ocorrem anormalidades durante a vocalização, em que a voz é produzida por vibrações das cordas vocais geradas pelo ar liberado dos pulmões na garganta e na cavidade oral. Neste estudo, nosso objetivo é estimar o período de vibração (pitch) para diagnosticar o estado de vibração dessas pregas vocais.

Até agora, um método de medição de pitch robusto contra ruído de fundo foi desenvolvido com base nas quantidades de características do espectro de amplitude obtidas por meio da análise de frequência da fala. No entanto, devido aos padrões de comunicação, o áudio da chamada via telemedicina carece de parte do espectro de amplitude desejado. Assim, extrair quantidades de características de um espectro de amplitude com informações reduzidas pode levar a erros na estimativa de pitch.

Nesta pesquisa, propomos um método para extrair quantidades de características adicionais do espectro de fase, um subproduto da análise de frequência, além do espectro de amplitude. Derivando uma equação relacional entre o deslocamento de fase e o pitch nas direções de tempo e frequência, verificamos que o pitch pode ser estimado aplicando o deslocamento de fase observado à equação relacional.

Com base nessa descoberta, extraímos novas quantidades de recursos do espectro de fase para avaliar quantitativamente o grau de ajuste à equação relacional. Por fim, integrando as quantidades de recursos extraídas do espectro de amplitude no plano complexo, compensamos a falta de quantidades de recursos que ocorrem na estimativa de pitch do áudio da chamada, mantendo a robustez contra o ruído de fundo.

Em estudos anteriores que utilizaram apenas o espectro de amplitude, uma vez que a quantidade de informação foi reduzida pela limitação da banda, o pitch foi estimado acima do valor original. No entanto, no método proposto, o pitch é estimado com precisão a partir do áudio da chamada usando as quantidades de recursos relacionadas aos espectros de amplitude e fase.

Além disso, o erro grosseiro de pitch (GPE), índice de avaliação que indica a porcentagem de segmentos onde ocorreram erros, melhorou para 9,5% no método proposto, comparado a 42,2% no estudo anterior. Além disso, mesmo para áudio de chamada com ruído de fundo, esse método obteve GPE de 15,2%, demonstrando robustez.

Perspectiva futura

Embora este estudo tenha focado na estimativa do pitch para detectar anormalidades nas vibrações das cordas vocais, as anormalidades respiratórias e orais também causam disartria. Para detectar esses sintomas, foram desenvolvidos métodos que extraem quantidades de características do espectro de amplitude. No entanto, o uso do espectro de fase não foi suficientemente validado.

No futuro, trabalharemos na extração de quantidades de características relevantes dos espectros de fase também para os outros casos. Além disso, analisando de forma abrangente essas quantidades de recursos, pretendemos desenvolver um sistema de diagnóstico de disartria que possa funcionar efetivamente com a telemedicina.

Mais Informações:
Yuya Hosoda et al, Algoritmo de estimativa de pitch de domínio complexo para sinais de fala de banda estreita, Transações IEEE/ACM em processamento de áudio, fala e linguagem (2023). DOI: 10.1109/TASLP.2023.3278488

Fornecido pela Universidade de Tecnologia de Toyohashi

Citação: Diagnóstico da condição de voz do áudio da chamada (2023, 18 de agosto) recuperado em 18 de agosto de 2023 em https://medicalxpress.com/news/2023-08-diagnosis-voice-condition-audio.html

Este documento está sujeito a direitos autorais. Além de qualquer negociação justa para fins de estudo ou pesquisa privada, nenhuma parte pode ser reproduzida sem a permissão por escrito. O conteúdo é fornecido apenas para fins informativos.

Looks like you have blocked notifications!

Segue as Notícias da Comunidade PortalEnf e fica atualizado.(clica aqui)

Portalenf Comunidade de Saúde

A PortalEnf é um Portal de Saúde on-line que tem por objectivo divulgar tutoriais e notícias sobre a Saúde e a Enfermagem de forma a promover o conhecimento entre os seus membros.

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *

Este site utiliza o Akismet para reduzir spam. Fica a saber como são processados os dados dos comentários.

Artigos Relacionados

Botão Voltar ao Topo
Keuntungan Bermain Di Situs Judi Bola Terpercaya Resmi slot server jepang
Send this to a friend