You are in the accessibility menu

Please use this identifier to cite or link to this item: http://acervodigital.unesp.br/handle/10400.2/6781
Title: 
Aplicação de técnicas de aprendizagem supervisionada a dados de comportamento motor
Author(s): 
Lopes, Jailson Almeida Santos
Abstract: 
  • Neste trabalho pretende-se estabelecer um modelo de classificação multiclasse baseado em técnicas de aprendizagem supervisionada como Máquinas de Vetores Suporte (SVM – Support Vector Machines), em dados de comportamento motor. Para tal, consideramos dados clínicos de duas amostras: 161 sujeitos diagnosticados com a Doença de Parkinson (DP), submetidos a um estudo de evolução desta doença para a função motora, nos seus diferentes estadios; e 98 sujeitos com a DP, que foram submetidos a uma tarefa de visualizar um ponto móvel, onde foram usados 5 conjuntos de features relacionadas à Distância, Amplitude, Área, Velocidade e Frequência de oscilação do referido ponto. Para a primeira amostra foram consideradas as seguintes features de marcha: Comprimento, Largura, Velocidade e Simetria da passada. A partir destes dados o objetivo é assim entender quais destas features mais contribuem para a classificação dos sujeitos nos diferentes estadios da doença. Numa análise preliminar sobre a caracterização da amostra por grupo, foi aplicada a ANOVA simples para igualdade das médias de altura e idade por estadio. De seguida realizaram-se estudos de validação cruzada (cross validation) do modelo SVM para determinar os melhores parâmetros após uma pesquisa em grelha (grid search). Começamos por testar o SVM linear nos dados iniciais para a classificação, passando depois para o não-linear. Uma vez que o algoritmo tendia a classificar todos os elementos como pertencentes à classe com maior dimensão, de seguida testamos para novas amostras com as classes de dimensões equilibradas. Consideramos as features de maior diferença de médias entre as classes, a retirada das features correlacionadas e outliers da amostra, e ainda o caso binário com as classes agrupadas duas a duas, onde 1 e 2 formam a classe A, 3 e 4 a B, para tirar complexidade à classificação. Foi ainda realizada a classificação binária de discinesias do membro superior entre indivíduos diagnosticados com ou sem essa discinesia. Novamente equilibramos as dimensões das classes pelo mesmo motivo acima referido. Na maioria dos casos considerados, o modelo obtido não foi satisfatório para o caso multiclasse, para as duas amostras, pelas taxas de precisão baixa em relação aos dados. A precisão melhorou para o caso binário com as amostras equilibradas, para as features Distâncias, e Amplitudes com a extração das correlacionadas, com 80.77% de precisão com Kernel RBF, em relação aos dados. Concluímos que estas features são as que melhor distinguem os estadios de Parkinson.
  • In this work is intended to establish a classification model multiclasse based on supervised learning techniques such as Support Vector Machines (SVM), in motor behavior data. For this, we consider clinical data from two samples: 161 subjects diagnosed with Parkinson's disease (PD) subjected to a study of evolution of this disease to motor function, in its different status. 98 subjects with the DP, which have been submitted to a task to visualize a moving point, where were used five sets of features related to Distance, Amplitude, Area and Speed of oscillation frequency from that point. For the first sample were considered the following features: Length, Width, Speed and Symmetry of last. From these data the goal is to understand which of these features more contribute to the classification of the subjects in the different status of the disease. A preliminary analysis on the characterization of the sample group, was applied to ANOVA simple equal height and age averages for status. In row, were held cross-validation studies of the SVM model to determine the best parameters after a grid search. We start by testing the linear SVM in the initial data for the classification, then moving on to non-linear. Once the algorithm tended to classify all elements belonging to the class with larger dimension, then we test for new samples with balanced dimensions classes. We consider the features of higher average difference between the classes, the withdrawal of features correlated and outliers of the sample, and then the binary case with the classes combined two by two, where 1 and 2 constitute the class, 3 and 4 a B, to take complexity of the classification. It was further held the dyskinesia binary classification of the upper limb between individuals diagnosed with or without this dyskinesia. One more time we balance the size of classes for the same reason stated above. In most cases considered, the model obtained was not satisfactory for the multiclasse case, for the two sample, the rates of low precision in relation to data. Improved accuracy for the binary case with samples balanced to the features Distance, and Amplitudes with the extraction of correlated with 80.77% accuracy with RBF Kernel, in relation to the data. We conclude that these features are those that best distinguish the Parkinson's status.
Issue Date: 
30-Oct-2017
Citation: 
Lopes, Jailson Almeida Santos - Aplicação de técnicas de aprendizagem supervisionada a dados de comportamento motor [Em linha]. Lisboa: [s.n.], 2017. 143 p.
Keywords: 
  • SVM (Support Vector Machines)
  • Aprendizagem supervisionada
  • Comportamento motor
  • Dados
  • Computação
  • Estatística
  • Otimização
  • Matemática
  • SVM classification model
  • Motor behavior data
  • Discriminant features
  • Learning
URI: 
Rights: 
openAccess
Type: 
outro
Source:
http://repositorioaberto.uab.pt/handle/10400.2/6781
Appears in Collections:Dissertações de Mestrado - Universidade Aberta de Portugal

There are no files associated with this item.
 

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.