Book chapter
Tecnologias de fala para pessoas idosas
Catarina Oliveira (Oliveira, C.); Albuquerque, Luciana (Albuquerque, L.); Annika Hämäläinen (Hämäläinen, A.); Fernando Miguel Pinto (Pinto, F.); Miguel Sales Dias (Dias, J.); Ana Júdice (Júdice, A.); João Freitas (Freitas, J.); Carlos Pires (Pires, C.); Vitor Duarte Teixeira (Teixeira, V.); António Calado (Calado, A.); Daniela Braga (Braga, D.); António Teixeira (Teixeira, A.); et al.
Book Title
Laboratório vivo de usabilidade
Year (definitive publication)
2013
Language
Portuguese
Country
Portugal
More Information
Web of Science®

This publication is not indexed in Web of Science®

Scopus

This publication is not indexed in Scopus

Google Scholar

This publication is not indexed in Google Scholar

Alternative Titles

(English) Living usability lab

Abstract
O envelhecimento é um processo tão natural quanto complexo que implica várias alterações fisiológicas, cognitivas, psicológicas e até sociais. Também a voz vai sofrendo modificações com a idade e, embora as mais significativas aconteçam durante a puberdade, são também observáveis várias alterações na passagem da idade adulta para a terceira idade. Com o decorrer dos anos, fruto das alterações verificadas nas estruturas que participam na produção de fala, mais especificamente nos sistemas respiratório, fonatório (ou laríngeo) e articulatório [1], a qualidade vocal do indivíduo altera-se. Os efeitos das modificações anatomofisiológicas do aparelho fonador fazem sentir-se, essencialmente, na diminuição da taxa de elocução, no aumento das pausas e variações dos parâmetros acústicos (e.g. frequência fundamental). Todas estas modificações são uma consequência natural do envelhecimento humano e não devem ser confundidas com perturbações vocais de causa patológica. As variações da voz relacionadas com a idade têm sido amplamente estudadas desde os anos 60. Alguns estudos têm como propósito a análise dos correlatos acústicos da idade e a identificação dos aspetos do sinal de fala mais afetados pelo envelhecimento, enquanto outros se focam essencialmente em questões percetivas, mais concretamente Tecnologias de Fala para Pessoas Idosas Capítulo 12 Catarina Oliveira1,2, Luciana Albuquerque6 , Annika Hämäläinen3 , Fernando Miguel Pinto3 , Miguel Sales Dias3 , Ana Júdice3 , João Freitas3 , Carlos Galinho Pires3 , Vítor Duarte Teixeira3 , António Calado3,5, Daniela Braga4 , António Teixeira2,5 1 Escola Superior de Saúde da Universidade de Aveiro, Universidade de Aveiro, Aveiro, Portugal. 2 Instituto de Engenharia Eletrónica e Telemática de Aveiro, Universidade de Aveiro, Aveiro, Portugal. 3 Microsoft Language Development Center, Lisboa, Portugal. 4 Microsoft Corporation, Bellevue, WA, Estados Unidos da América. 5 Departamento de Eletrónica, Telecomunicações e Informática, Universidade de Aveiro, Aveiro, Portugal. 6 Mestrado em Ciências da Fala e da Audição, Universidade de Aveiro, Aveiro, Portugal. 168 LABORATÓRIO VIVO DE USABILIDADE nos mecanismos que presidem à identificação da idade de um indivíduo, com base na sua voz. Não obstante as diferenças consideráveis em relação aos métodos e amostras de fala utilizadas, o que dificulta a comparação entre os estudos, os resultados dos testes de perceção sugerem uma taxa de acerto relativamente elevada no que toca ao reconhecimento da idade através da voz [2]. Os julgamentos são, no entanto, afetados por vários fatores, relacionados com o falante (e.g. género, idade), o ouvinte (e.g. género, idade, dialeto), a amostra de fala (e.g. duração dos estímulos) ou a tarefa (e.g. número de estímulos e repetições) [2]. Aparentemente, os ouvintes apoiam os seus julgamentos em diferentes pistas acústicas, como a frequência fundamental, a taxa de elocução ou a frequência dos formantes, embora a relação entre estes parâmetros, bem como a sua potencial contribuição para o reconhecimento da idade permaneça por esclarecer. Embora o número de pessoas idosas que utiliza os computadores esteja a crescer, investigações prévias sugerem que esta população tem mais dificuldades no uso da tecnologia [3, 4]. Para o facto, contribuem a complexidade das interfaces existentes e o conjunto limitado de modalidades de interação disponíveis. A voz é, sem dúvida, a forma mais natural de interação humano- -computador [5], contudo, quando se trata de fala de pessoas idosas, os atuais sistemas de síntese e reconhecimento de fala apresentam limitações de desempenho [6]. Só um conhecimento mais aprofundado da forma como a fala varia com a idade possibilitará o desenvolvimento de tecnologias de fala mais adaptadas ao utilizador final, seja ele uma criança ou uma pessoa idosa. Face ao exposto, este capítulo tem como primeiro objetivo descrever as alterações anatomofisiológicas do aparelho fonador, decorrentes do envelhecimento, e consequentes modificações nos parâmetros acústicos, que contribuem para mudanças na qualidade vocal dos indivíduos. De um modo geral, os efeitos do envelhecimento vocal são mais marcados nos homens do que nas mulheres, pelo que ao longo deste capítulo chamaremos a atenção para as diferenças entre os dois géneros no que ao envelhecimento dos órgãos da fala diz respeito. Na segunda parte do capítulo, daremos conta dos esforços efetuados pelo Microsoft Language Development Center, o centro de investigação e desenvolvimento da Microsoft Portugal, ao longo de dois anos (2010- 2012), no sentido de criar uma base de dados de fala de pessoas idosas suficientemente extensa para permitir o treino de modelos acústicos e o consequente desenvolvimento de tecnologias de reconhecimento da fala de pessoas idosas. Esta iniciativa, desenvolvida no âmbito do Living Usability Lab (LUL), está em linha com outros projetos recentes para recolher corpora de fala de pessoas idosas, tais como o JASMIN-CGN [7] para o holandês e flamengo, ou o S-JNAS [8], para o japonês. Neste capítulo, serão descritos os procedimentos adotados na seleção dos falantes e do corpus, recolha dos dados, transcrição e anotação dos mesmos. Dando seguimento ao propósito principal, estão neste momento a ser treinados e testados pelo Microsoft Language Development Center modelos acústicos específicos para as pessoas idosas, que serão usados no protótipo do Living Home Center [9] e noutras aplicações controladas por voz destinadas a este público-alvo.
Acknowledgements
Este trabalho foi suportado pelo COMPETE (Sistema de Incentivos à Investigação e Desenvolvimento Tecnológico, Projetos de I&DT Empresas em co-promoção) e FEDER da União Europeia, através dos projetos QREN Living Usability Lab for Next Generation Network
Keywords
Living Usability Lab,MLDC,QREN,AAL4ALL,LUL,Fala de idosos
  • Computer and Information Sciences - Natural Sciences
  • Electrical Engineering, Electronic Engineering, Information Engineering - Engineering and Technology
  • Languages and Literature - Humanities

With the objective to increase the research activity directed towards the achievement of the United Nations 2030 Sustainable Development Goals, the possibility of associating scientific publications with the Sustainable Development Goals is now available in Ciência-IUL. These are the Sustainable Development Goals identified by the author(s) for this publication. For more detailed information on the Sustainable Development Goals, click here.