Topologia aplicada a la ciencia de datos
Luis Alexandher V.G.
FES Acatlan
November 14, 2018
Luis Alexandher V.G. (UNAM) Estadistica y ciencia de datos November 14, 2018 1 / 26
Topologia
Definicion
Rama de las matematicas que estudia las propiedades cualitativas de losespacios topologicos
Luis Alexandher V.G. (UNAM) Estadistica y ciencia de datos November 14, 2018 2 / 26
Clasico ejemplo
Luis Alexandher V.G. (UNAM) Estadistica y ciencia de datos November 14, 2018 3 / 26
Topologia algebraica
Definicion
Forma de relacionar la topologia con el algebra
Componentes conexas
”Pedazos”
Agujeros
Nos interesa estudiar agujeros de los espacios topologicos (dimension0,1,2)
Luis Alexandher V.G. (UNAM) Estadistica y ciencia de datos November 14, 2018 4 / 26
Homologia persistente
Datos
Vectores ∈ Rn
Definicion (homologia persistente)
Medir las caracteristicas topologicas de nuestros datos por medio de unmetodo algebraico (detectar los agujeros)
Luis Alexandher V.G. (UNAM) Estadistica y ciencia de datos November 14, 2018 5 / 26
Complejo simplicial
A nuestros vectores (datos) les asociaremos un espacio topologico llamadocomplejo simplicial
Definicion (complejo simplicial)
Es un tipo particular de espacio topolgico construido mediante el pegadode puntos, segmentos de linea, triangulos, tetraedros
Luis Alexandher V.G. (UNAM) Estadistica y ciencia de datos November 14, 2018 6 / 26
Complejo simplicial
Luis Alexandher V.G. (UNAM) Estadistica y ciencia de datos November 14, 2018 7 / 26
De datos a complejos simpliciales
1.- Cada punto (dato) sera el centro de un circulo de radio r2.- Cuando dos circulos se intersectan se dibuja una linea que une a cadapunto3.- Las lineas son las aristas y los puntos nuestros vertices.
Asi hemos formado nuestro complejo simplicial
Luis Alexandher V.G. (UNAM) Estadistica y ciencia de datos November 14, 2018 8 / 26
Ejemplo
Luis Alexandher V.G. (UNAM) Estadistica y ciencia de datos November 14, 2018 9 / 26
Ejemplo
Luis Alexandher V.G. (UNAM) Estadistica y ciencia de datos November 14, 2018 10 / 26
Ejemplo
Luis Alexandher V.G. (UNAM) Estadistica y ciencia de datos November 14, 2018 11 / 26
Ejemplo
Para una r ”chica”
Luis Alexandher V.G. (UNAM) Estadistica y ciencia de datos November 14, 2018 12 / 26
Ejemplo
Para una r muy grande
Luis Alexandher V.G. (UNAM) Estadistica y ciencia de datos November 14, 2018 13 / 26
Todas las r posibles
Luis Alexandher V.G. (UNAM) Estadistica y ciencia de datos November 14, 2018 14 / 26
”Vida” de agujeros
ESTO ES LA HOMOLOGIA PERSISTENTE
Persistencia de los agujeros. ”Nace” en r1 y muere en r2, es decir, ”vive”un tiempo (r1, r2)
Luis Alexandher V.G. (UNAM) Estadistica y ciencia de datos November 14, 2018 15 / 26
Homologia persistente: Nos interesan los agujeros que mas PERSISTEN
Luis Alexandher V.G. (UNAM) Estadistica y ciencia de datos November 14, 2018 16 / 26
Codigo de barras asociado
Luis Alexandher V.G. (UNAM) Estadistica y ciencia de datos November 14, 2018 17 / 26
Diagrama de persistencia
Diagrama de persistencia (arriba) y codigo de barras asociado (abajo)
Luis Alexandher V.G. (UNAM) Estadistica y ciencia de datos November 14, 2018 18 / 26
En nuestro diagrama vemos que un agujero persiste y el espacio topologicomas simple que tiene un agujero es el circulo.
Luis Alexandher V.G. (UNAM) Estadistica y ciencia de datos November 14, 2018 19 / 26
Un algoritmo
Luis Alexandher V.G. (UNAM) Estadistica y ciencia de datos November 14, 2018 20 / 26
Como curiosidad
Definicion: Sea T un conjunto ordenado. Un modulo de persistencia Vsobre T es una familia indexada de transformaciones lineales deΛ−modulos {Vs |s ∈ T} y una familia doblemente indexada detransformaciones lineales {v ts : Vs → Vt |s ≤ t} tales que v tr ◦ v rs = v tscuando s ≤ r ≤ t. Ademas v tt = idVt .
Luis Alexandher V.G. (UNAM) Estadistica y ciencia de datos November 14, 2018 21 / 26
Otros ejemplos
Luis Alexandher V.G. (UNAM) Estadistica y ciencia de datos November 14, 2018 22 / 26
En R3
Luis Alexandher V.G. (UNAM) Estadistica y ciencia de datos November 14, 2018 23 / 26
En R3
Luis Alexandher V.G. (UNAM) Estadistica y ciencia de datos November 14, 2018 24 / 26
Referencias
[1] Un rol para la curva de Betti en problemas de ciencia de datos, RfaelJose Gonzalez de Gouveia, Tesis para obtener el grado de maestro enciencias.[2] Analisis topologico de datos: Robusticidad y analisis de sensibilidad dealgoritmos, Jesus Manuel Perez Angulo, Tesis para obtener el grado demaestro en ciencias.[3] Barcodes: The persistent topology of data, Robert Ghrist[4] Aspectos computacionales del ”Analisis topologico de datos”, FranciscoValiente Castro
Luis Alexandher V.G. (UNAM) Estadistica y ciencia de datos November 14, 2018 25 / 26
FIN
Luis Alexandher V.G. (UNAM) Estadistica y ciencia de datos November 14, 2018 26 / 26