Publicação em atas de evento científico
Enhancing multimodal silent speech interfaces with feature selection
João Freitas (Freitas, J.); António Teixeira (Teixeira, A.); Miguel Sales Dias (Dias, J.); Artur Ferreira (Ferreira, A.); Mário A. T. Figueiredo (Figueiredo, M.A.T.);
15th Annual Conference of the International Speech Communication Association (INTERSPEECH 2014), Proceedings
Ano (publicação definitiva)
2014
Língua
Inglês
País
Singapura
Mais Informação
Web of Science®

N.º de citações: 9

(Última verificação: 2024-05-07 18:14)

Ver o registo na Web of Science®

Scopus

N.º de citações: 15

(Última verificação: 2024-05-07 21:09)

Ver o registo na Scopus


: 0.9
Google Scholar

N.º de citações: 24

(Última verificação: 2024-05-08 17:09)

Ver o registo no Google Scholar

Abstract/Resumo
In research on Silent Speech Interfaces (SSI), different sources of information (modalities) have been combined, aiming at obtaining better performance than the individual modalities. However, when combining these modalities, the dimensionality of the feature space rapidly increases, yielding the well-known "curse of dimensionality". As a consequence, in order to extract useful information from this data, one has to resort to feature selection (FS) techniques to lower the dimensionality of the learning space. In this paper, we assess the impact of FS techniques for silent speech data, in a dataset with 4 non-invasive and promising modalities, namely: video, depth, ultrasonic Doppler sensing, and surface electromyography. We consider two supervised (mutual information and Fisher's ratio) and two unsupervised (meanmedian and arithmetic mean geometric mean) FS filters. The evaluation was made by assessing the classification accuracy (word recognition error) of three well-known classifiers (knearest neighbors, support vector machines, and dynamic time warping). The key results of this study show that both unsupervised and supervised FS techniques improve on the classification accuracy on both individual and combined modalities. For instance, on the video component, we attain relative performance gains of 36.2% in error rates. FS is also useful as pre-processing for feature fusion
Agradecimentos/Acknowledgements
--
Palavras-chave
Multimodal,Silent speech interfaces,Supervised classification,Feature extraction
  • Ciências da Computação e da Informação - Ciências Naturais
  • Engenharia Eletrotécnica, Eletrónica e Informática - Engenharia e Tecnologia
Registos de financiamentos
Referência de financiamento Entidade Financiadora
FCT-PEst-C/EEI/UI0127/2011 Fundação para a Ciência e a Tecnologia

Com o objetivo de aumentar a investigação direcionada para o cumprimento dos Objetivos do Desenvolvimento Sustentável para 2030 das Nações Unidas, é disponibilizada no Ciência-IUL a possibilidade de associação, quando aplicável, dos artigos científicos aos Objetivos do Desenvolvimento Sustentável. Estes são os Objetivos do Desenvolvimento Sustentável identificados pelo(s) autor(es) para esta publicação. Para uma informação detalhada dos Objetivos do Desenvolvimento Sustentável, clique aqui.