Enhancing multimodal silent speech interfaces with feature selection

João Freitas; António Teixeira; Miguel Sales Dias; Artur Ferreira; Mário A. T. Figueiredo

Ciência_Iscte Publicações Descrição Detalhada da Publicação

Publicação em atas de evento científico

Enhancing multimodal silent speech interfaces with feature selection

João Freitas (Freitas, J.); António Teixeira (Teixeira, A.); Miguel Sales Dias (Dias, J.); Artur Ferreira (Ferreira, A.); Mário A. T. Figueiredo (Figueiredo, M.A.T.);

15th Annual Conference of the International Speech Communication Association (INTERSPEECH 2014), Proceedings

Ano (publicação definitiva)

2014

Língua

Inglês

País

Singapura

Mais Informação

Visitar Link

Web of Science®

N.º de citações: 8

(Última verificação: 2026-07-02 17:47)

Ver o registo na Web of Science®

Scopus

N.º de citações: 15

(Última verificação: 2026-06-23 04:26)

Ver o registo na Scopus

Índice de Impacto do Artigo: 0.9

Ver Mais

Google Scholar

N.º de citações: 26

(Última verificação: 2026-07-03 09:14)

Ver o registo no Google Scholar

Overton

Esta publicação não está indexada no Overton

Abstract/Resumo

In research on Silent Speech Interfaces (SSI), different sources of information (modalities) have been combined, aiming at obtaining better performance than the individual modalities. However, when combining these modalities, the dimensionality of the feature space rapidly increases, yielding the well-known "curse of dimensionality". As a consequence, in order to extract useful information from this data, one has to resort to feature selection (FS) techniques to lower the dimensionality of the learning space. In this paper, we assess the impact of FS techniques for silent speech data, in a dataset with 4 non-invasive and promising modalities, namely: video, depth, ultrasonic Doppler sensing, and surface electromyography. We consider two supervised (mutual information and Fisher's ratio) and two unsupervised (meanmedian and arithmetic mean geometric mean) FS filters. The evaluation was made by assessing the classification accuracy (word recognition error) of three well-known classifiers (knearest neighbors, support vector machines, and dynamic time warping). The key results of this study show that both unsupervised and supervised FS techniques improve on the classification accuracy on both individual and combined modalities. For instance, on the video component, we attain relative performance gains of 36.2% in error rates. FS is also useful as pre-processing for feature fusion

Agradecimentos/Acknowledgements

Palavras-chave

Multimodal,Silent speech interfaces,Supervised classification,Feature extraction

Classificação Fields of Science and Technology

Ciências da Computação e da Informação - Ciências Naturais
Engenharia Eletrotécnica, Eletrónica e Informática - Engenharia e Tecnologia

Registos de financiamentos

Referência de financiamento	Entidade Financiadora
FCT-PEst-C/EEI/UI0127/2011	Fundação para a Ciência e a Tecnologia

Contribuições para os Objetivos do Desenvolvimento Sustentável das Nações Unidas

Com o objetivo de aumentar a investigação direcionada para o cumprimento dos Objetivos do Desenvolvimento Sustentável para 2030 das Nações Unidas, é disponibilizada no Ciência_Iscte a possibilidade de associação, quando aplicável, dos artigos científicos aos Objetivos do Desenvolvimento Sustentável. Estes são os Objetivos do Desenvolvimento Sustentável identificados pelo(s) autor(es) para esta publicação. Para uma informação detalhada dos Objetivos do Desenvolvimento Sustentável, clique aqui.

Identificadores da Publicação

WoS (fonte: Ciência_Iscte)	WOS:000395050100238
Scopus (fonte: autor)	2-s2.0-84910070482
Scopus (fonte: Ciência_Iscte)	2-s2.0-84910070482
Handle (fonte: Ciência-IUL)	http://hdl.handle.net/10071/25831
WoS (fonte: autor)	WOS:000395050100238
ID Ciência_Iscte	ci-pub-22958

Outros Detalhes da Publicação

Ano Publicação Online	2014
Editora	Speech and Communication Association
Indexação	Web of Science©; Scopus;
ISSN	2308-457X (print)
ISBN	--
Volume
Número Artigo
Páginas	1169 - 1173	Total Páginas	5
Avaliado Cientificamente	Sim
Meio de Divulgação	Ambos (impresso e digital)
Editores	Chng E.S.,Li H.,Meng H.,Ma B.,Xie L.
Título do Evento
Organizador do Evento	International Speech and Communication Association
Cidade	Singapure
Tipo de Evento	Conferência
Classificação do Evento	Internacional
Ano do Evento	2014
Tipo de Publicação no Evento	Artigo Completo
Repositório ISCTE-IUL	Link para o repositório
Data Publicação (online)
Data Publicação (print)

Altmetric

PlumX Metrics