Exportar Publicação
A publicação pode ser exportada nos seguintes formatos: referência da APA (American Psychological Association), referência do IEEE (Institute of Electrical and Electronics Engineers), BibTeX e RIS.
Oliveira, C., Albuquerque, L., Hämäläinen, A., Pinto, F., Dias, J., Júdice, A....Teixeira, A. (2013). Tecnologias de fala para pessoas idosas. In António Teixeira, Alexandra Queirós e Nelson Pacheco da Rocha (Ed.), Laboratório vivo de usabilidade. (pp. 167-181).: ARC Publishing.
C. Oliveira et al., "Tecnologias de fala para pessoas idosas", in Laboratório vivo de usabilidade, António Teixeira, Alexandra Queirós e Nelson Pacheco da Rocha, Ed., ARC Publishing, 2013, pp. 167-181
@incollection{oliveira2013_1732211520138, author = "Oliveira, C. and Albuquerque, L. and Hämäläinen, A. and Pinto, F. and Dias, J. and Júdice, A. and Freitas, J. and Pires, C. and Teixeira, V. and Calado, A. and Braga, D. and Teixeira, A.", title = "Tecnologias de fala para pessoas idosas", chapter = "", booktitle = "Laboratório vivo de usabilidade", year = "2013", volume = "", series = "Pharmaceutical Medicine Series", edition = "", pages = "167-167", publisher = "ARC Publishing", address = "", url = "https://arc-publishing.org/assets/files/Laboratorio_Vivo_Usabilidade_Out2013.pdf" }
TY - CHAP TI - Tecnologias de fala para pessoas idosas T2 - Laboratório vivo de usabilidade AU - Oliveira, C. AU - Albuquerque, L. AU - Hämäläinen, A. AU - Pinto, F. AU - Dias, J. AU - Júdice, A. AU - Freitas, J. AU - Pires, C. AU - Teixeira, V. AU - Calado, A. AU - Braga, D. AU - Teixeira, A. PY - 2013 SP - 167-181 SN - 2182-5432 UR - https://arc-publishing.org/assets/files/Laboratorio_Vivo_Usabilidade_Out2013.pdf AB - O envelhecimento é um processo tão natural quanto complexo que implica várias alterações fisiológicas, cognitivas, psicológicas e até sociais. Também a voz vai sofrendo modificações com a idade e, embora as mais significativas aconteçam durante a puberdade, são também observáveis várias alterações na passagem da idade adulta para a terceira idade. Com o decorrer dos anos, fruto das alterações verificadas nas estruturas que participam na produção de fala, mais especificamente nos sistemas respiratório, fonatório (ou laríngeo) e articulatório [1], a qualidade vocal do indivíduo altera-se. Os efeitos das modificações anatomofisiológicas do aparelho fonador fazem sentir-se, essencialmente, na diminuição da taxa de elocução, no aumento das pausas e variações dos parâmetros acústicos (e.g. frequência fundamental). Todas estas modificações são uma consequência natural do envelhecimento humano e não devem ser confundidas com perturbações vocais de causa patológica. As variações da voz relacionadas com a idade têm sido amplamente estudadas desde os anos 60. Alguns estudos têm como propósito a análise dos correlatos acústicos da idade e a identificação dos aspetos do sinal de fala mais afetados pelo envelhecimento, enquanto outros se focam essencialmente em questões percetivas, mais concretamente Tecnologias de Fala para Pessoas Idosas Capítulo 12 Catarina Oliveira1,2, Luciana Albuquerque6 , Annika Hämäläinen3 , Fernando Miguel Pinto3 , Miguel Sales Dias3 , Ana Júdice3 , João Freitas3 , Carlos Galinho Pires3 , Vítor Duarte Teixeira3 , António Calado3,5, Daniela Braga4 , António Teixeira2,5 1 Escola Superior de Saúde da Universidade de Aveiro, Universidade de Aveiro, Aveiro, Portugal. 2 Instituto de Engenharia Eletrónica e Telemática de Aveiro, Universidade de Aveiro, Aveiro, Portugal. 3 Microsoft Language Development Center, Lisboa, Portugal. 4 Microsoft Corporation, Bellevue, WA, Estados Unidos da América. 5 Departamento de Eletrónica, Telecomunicações e Informática, Universidade de Aveiro, Aveiro, Portugal. 6 Mestrado em Ciências da Fala e da Audição, Universidade de Aveiro, Aveiro, Portugal. 168 LABORATÓRIO VIVO DE USABILIDADE nos mecanismos que presidem à identificação da idade de um indivíduo, com base na sua voz. Não obstante as diferenças consideráveis em relação aos métodos e amostras de fala utilizadas, o que dificulta a comparação entre os estudos, os resultados dos testes de perceção sugerem uma taxa de acerto relativamente elevada no que toca ao reconhecimento da idade através da voz [2]. Os julgamentos são, no entanto, afetados por vários fatores, relacionados com o falante (e.g. género, idade), o ouvinte (e.g. género, idade, dialeto), a amostra de fala (e.g. duração dos estímulos) ou a tarefa (e.g. número de estímulos e repetições) [2]. Aparentemente, os ouvintes apoiam os seus julgamentos em diferentes pistas acústicas, como a frequência fundamental, a taxa de elocução ou a frequência dos formantes, embora a relação entre estes parâmetros, bem como a sua potencial contribuição para o reconhecimento da idade permaneça por esclarecer. Embora o número de pessoas idosas que utiliza os computadores esteja a crescer, investigações prévias sugerem que esta população tem mais dificuldades no uso da tecnologia [3, 4]. Para o facto, contribuem a complexidade das interfaces existentes e o conjunto limitado de modalidades de interação disponíveis. A voz é, sem dúvida, a forma mais natural de interação humano- -computador [5], contudo, quando se trata de fala de pessoas idosas, os atuais sistemas de síntese e reconhecimento de fala apresentam limitações de desempenho [6]. Só um conhecimento mais aprofundado da forma como a fala varia com a idade possibilitará o desenvolvimento de tecnologias de fala mais adaptadas ao utilizador final, seja ele uma criança ou uma pessoa idosa. Face ao exposto, este capítulo tem como primeiro objetivo descrever as alterações anatomofisiológicas do aparelho fonador, decorrentes do envelhecimento, e consequentes modificações nos parâmetros acústicos, que contribuem para mudanças na qualidade vocal dos indivíduos. De um modo geral, os efeitos do envelhecimento vocal são mais marcados nos homens do que nas mulheres, pelo que ao longo deste capítulo chamaremos a atenção para as diferenças entre os dois géneros no que ao envelhecimento dos órgãos da fala diz respeito. Na segunda parte do capítulo, daremos conta dos esforços efetuados pelo Microsoft Language Development Center, o centro de investigação e desenvolvimento da Microsoft Portugal, ao longo de dois anos (2010- 2012), no sentido de criar uma base de dados de fala de pessoas idosas suficientemente extensa para permitir o treino de modelos acústicos e o consequente desenvolvimento de tecnologias de reconhecimento da fala de pessoas idosas. Esta iniciativa, desenvolvida no âmbito do Living Usability Lab (LUL), está em linha com outros projetos recentes para recolher corpora de fala de pessoas idosas, tais como o JASMIN-CGN [7] para o holandês e flamengo, ou o S-JNAS [8], para o japonês. Neste capítulo, serão descritos os procedimentos adotados na seleção dos falantes e do corpus, recolha dos dados, transcrição e anotação dos mesmos. Dando seguimento ao propósito principal, estão neste momento a ser treinados e testados pelo Microsoft Language Development Center modelos acústicos específicos para as pessoas idosas, que serão usados no protótipo do Living Home Center [9] e noutras aplicações controladas por voz destinadas a este público-alvo. ER -