Planteamiento III (Support Vector Machine SVM)

En este planteamiento vamos a realizar dos ejercicios por separado, que consistirán en separar por un lado los datos de una taquicardia en concreto (TV ó TSV) y por otro lado, todo lo que no sean esos datos (RS y TV o TSV), es decir, si queremos detectar ejemplos de Taquicardias Ventriculares (TV) separaremos esos datos de los datos de Ritmo Sinusal (RS) y de los de la Taquicardia Supraventricular (TSV). Del mismo modo lo haremos en el caso en el cual queramos detectar Taquicardias Supraventriculares (TSV). 

Este planteamiento lo realizamos con vista a poder detectar los casos de taquicardia, discriminando mejor dichos casos de los casos de RS y el otro tipo de Taquicardia. Tomaremos las muestras con 19 características cada una de ellas (RS, TV y TSV).

En ambos problemas que planteamos (por separado), organizaremos los datos de la siguiente manera, etiquetando los valores de la Taquicardia que queramos detectar con un '1', y todo lo que no sean datos de lo que queramos detectar con un '0':


Nuestras variables independientes o predictoras 'X' serán las características tomadas de cada una de las muestras (datos proporcionados en el fichero de casos de entrenamiento), mientras que nuestra variable categórica 'Y' recogerá las etiquetas que hemos establecido para los datos.


Una vez que tenemos construidas nuestras variables independientes o predictoras 'X' y nuestra variable categórica 'Y' para cada uno de nuestros problemas, vamos a pasar a tratar de configurar tanto el parámetro 'C' presente en nuestra función de minimización y el parámetro "sigma" (σ) presente en nuestra función "kernel" gaussiana. Dichos valores los configuraremos en función de como obtengamos mejores resultados, que en este caso, tras analizar diferentes configuraciones, obtenemos mejores resultados con los siguientes valores (tendremos una configuración para cada problema debido a que tanto nuestras variables predictoras o independientes 'X' como la variable categórica 'Y' son distintas en cada uno de los casos):

   - Problema I: Casos No Taquicardia Ventricular - Casos Taquicardia Ventricular (NoTV/TV):




   - Problema II: Casos No Taquicardia Supraventricular - Casos Taquicardia Supraventricular (NoTSV/TSV):




Una vez que hemos elegido los parámetros configurables de nuestra Máquina de Soporte Vectorial (parámetros de la función a minimizar y de la función "kernel" gaussiana), podemos iniciar el entrenamiento con los datos de las muestras proporcionadas y generar así un modelo óptimo que representa el hiperplano de separación buscado por el algoritmo que maximiza la distancia entre las diferentes clases:



Una vez obtenido el modelo del entrenamiento, podemos cargar los casos de test, y mediante el método "swmPredict" obtener la clasificación/predicción correspondiente en función del modelo construido con los datos de entrenamiento y así poder posteriormente analizar los resultados obtenidos:



En las variables "Group1" y "Group2" devueltas por "svmPredict" están recogidos los valores de las predicciones para los casos de test en función del modelo aprendido en el entrenamiento.



Al aumentar el número de ejemplos de los casos negativos de Taquicardia para el "aprendizaje" , somos capaces de detectar mejor estos casos negativos y distinguirlos así de los casos de Taquicardia (TV ó TSV).

Volver a la Pagina Principal (Inicio)