+ All Categories
Home > Documents > Mineria de datos

Mineria de datos

Date post: 29-Jun-2015
Category:
Upload: angel-garcia
View: 595 times
Download: 4 times
Share this document with a friend
33
1 Introducción a Introducción a la minería de la minería de datos datos MINERÍA DE DATOS LUNES: 14:00:00-14:54:00 / LITI4, MARTES: 14:00:00-14:54:00 / LITI4, MIERCOLES: 14:00:00-14:54:00 / LITI4, JUEVES: 14:00:00- 15:49:00 / LITI4
Transcript
Page 1: Mineria de datos

1

Introducción a la Introducción a la minería de datosminería de datos

MINERÍA DE DATOSLUNES: 14:00:00-14:54:00 / LITI4, MARTES: 14:00:00-14:54:00 / LITI4, MIERCOLES: 14:00:00-14:54:00 / LITI4, JUEVES: 14:00:00-15:49:00 / LITI4

Page 2: Mineria de datos

2

TemarioTemario

¿Qué es minería de datos?¿Qué es minería de datos?¿Quién usa minería de datos?¿Quién usa minería de datos?¿Por qué de la minería de datos?¿Por qué de la minería de datos?Ciclo virtuoso de la minería de datosCiclo virtuoso de la minería de datosResumen de principales técnicas de Resumen de principales técnicas de

minería de datosminería de datos

Page 3: Mineria de datos

3

Definición de minería de Definición de minería de datosdatos

Minería de datos es la exploración y Minería de datos es la exploración y análisis de grandes cantidades de análisis de grandes cantidades de datos con el objeto de encontrar datos con el objeto de encontrar patrones y reglas significativas patrones y reglas significativas (conocimiento)(conocimiento)

Page 4: Mineria de datos

4

Metas de la minería de Metas de la minería de datosdatos

Permitir a una organización Permitir a una organización MEJORAR _____ a través de un MEJORAR _____ a través de un mejor CONOCIMIENTO de _______mejor CONOCIMIENTO de _______

Mejorar la ventaja competitivaMejorar la ventaja competitiva

Page 5: Mineria de datos

5

La minería de datos es un La minería de datos es un campo multidisciplinariocampo multidisciplinario

Minería de datos

InteligenciaArtificial

(“MachineLearning”)

Estadística

Bases deDatos

Graficación yvisualización

Ciencias dela información

Otrasdisciplinas

Page 6: Mineria de datos

6

La minería de datos es un La minería de datos es un subconjunto de la inteligencia subconjunto de la inteligencia

de negociosde negocios

Page 7: Mineria de datos

7

Minería de datosMinería de datos

Proceso de utilizar datos “crudos” para Proceso de utilizar datos “crudos” para inferir importantes relaciones entre ellosinferir importantes relaciones entre ellos

Colección de técnicas poderosas para Colección de técnicas poderosas para analizar grandes volúmenes de datosanalizar grandes volúmenes de datos

No existe un solo enfoque para minería de No existe un solo enfoque para minería de datos sino un conjunto de técnicas que se datos sino un conjunto de técnicas que se pueden utilizar de manera independiente pueden utilizar de manera independiente o en combinacióno en combinación

Existe una relación con la estadística, Existe una relación con la estadística, aunque frecuentemente se separan las aunque frecuentemente se separan las técnicas que no están basadas en métodos técnicas que no están basadas en métodos estadísticosestadísticos

Page 8: Mineria de datos

8

Tipos de aplicaciones de la Tipos de aplicaciones de la minería de datosminería de datos

Aplicaciones o problemas de minería Aplicaciones o problemas de minería de datos pueden clasificarse en las de datos pueden clasificarse en las siguientes categoríassiguientes categoríasClasificaciónClasificaciónEstimaciónEstimaciónPronósticoPronósticoAsociaciónAsociaciónAgrupación o segmentaciónAgrupación o segmentación

Page 9: Mineria de datos

9

ClasificaciónClasificación

Examinar las características de un Examinar las características de un nuevo objeto y asignarle una clase o nuevo objeto y asignarle una clase o categoría de acuerdo a un conjunto categoría de acuerdo a un conjunto de tales objetos previamente de tales objetos previamente definidodefinido

Ejemplos:Ejemplos:Clasificar aplicaciones a crédito como Clasificar aplicaciones a crédito como

bajo, medio y alto riesgobajo, medio y alto riesgoDetectar reclamos fraudulentos de Detectar reclamos fraudulentos de

segurosseguros

Page 10: Mineria de datos

10

EstimaciónEstimación

Relacionado con clasificaciónRelacionado con clasificaciónMientras clasificación asigna un valor Mientras clasificación asigna un valor

discreto, estimación produce un valor discreto, estimación produce un valor continuocontinuo

Ejemplos:Ejemplos:Estimar el precio de una viviendaEstimar el precio de una viviendaEstimar el ingreso total de una familiaEstimar el ingreso total de una familia

Page 11: Mineria de datos

11

PronósticoPronóstico

Predecir un valor futuro con base a Predecir un valor futuro con base a valores pasadosvalores pasados

Ejemplos:Ejemplos:Predecir cuánto efectivo requerirá un Predecir cuánto efectivo requerirá un

cajero automático en un fin de semanacajero automático en un fin de semana

Page 12: Mineria de datos

12

AsociaciónAsociación

Determinar cosas u objetos que van Determinar cosas u objetos que van juntosjuntos

Ejemplo:Ejemplo:Determinar que productos se adquieren Determinar que productos se adquieren

conjuntamente en un supermercadoconjuntamente en un supermercado

Page 13: Mineria de datos

13

Agrupación o Agrupación o segmentaciónsegmentación

Dividir una población en un número Dividir una población en un número de grupos más homogéneosde grupos más homogéneos

No depende de clases pre-definidas No depende de clases pre-definidas a diferencia de clasificacióna diferencia de clasificación

Ejemplo:Ejemplo:Dividir la base de clientes de acuerdo Dividir la base de clientes de acuerdo

con los hábitos de consumocon los hábitos de consumo

Page 14: Mineria de datos

14

Usos de la minería de Usos de la minería de datosdatos

Administración de la relación con los Administración de la relación con los clientes:clientes:Identificar nuevos clientes potenciales Identificar nuevos clientes potenciales

para aumentar ventaspara aumentar ventasAmpliar la base de cliente con la Ampliar la base de cliente con la

mínima inversión por parte de la mínima inversión por parte de la empresaempresa

Retener clientes existentes evitando Retener clientes existentes evitando que se vayan a la competencia que se vayan a la competencia (“attrition”)(“attrition”)

Vender más a clientes existentes Vender más a clientes existentes (“ventas cruzadas”) (“ventas cruzadas”)

Page 15: Mineria de datos

15

Usos de la minería de Usos de la minería de datosdatos

Detección de fraudes en el uso de Detección de fraudes en el uso de tarjetas de créditotarjetas de crédito

Determinar patrones que puedan Determinar patrones que puedan estar relacionados con lavado de estar relacionados con lavado de dinerodinero

Determinar el precio de una casa Determinar el precio de una casa con base en sus características y el con base en sus características y el precio de otras casas vendidasprecio de otras casas vendidas

Page 16: Mineria de datos

16

Ejercicio en gruposEjercicio en grupos

Equipos: 6 personas máximoEquipos: 6 personas máximoObjetivos: Objetivos:

Identificar situaciones concretas para Identificar situaciones concretas para utilizar la minería de datosutilizar la minería de datos

Reportar por escritoReportar por escritoLas situaciones identificadasLas situaciones identificadasTipo de aplicación o problema de minería de Tipo de aplicación o problema de minería de

datos relacionadodatos relacionadoLos beneficios esperados de aplicar la Los beneficios esperados de aplicar la

minería de datosminería de datos

Page 17: Mineria de datos

17

Usos de la minería de Usos de la minería de datosdatos

Usos de la minería de datos se han Usos de la minería de datos se han ampliado con el comercio ampliado con el comercio electrónicoelectrónico

Page 18: Mineria de datos

18

RecomendacionesRecomendaciones

Page 19: Mineria de datos

19

Disponibilidad de datos Disponibilidad de datos de transaccionesde transacciones

Page 20: Mineria de datos

20

¿Por qué de la minería de ¿Por qué de la minería de datos?datos?

Datos se encuentran disponiblesDatos se encuentran disponiblesPoder computacional es cada vez Poder computacional es cada vez

menos costosomenos costosoLas presiones competitivas son Las presiones competitivas son

enormesenormesSoftware para minería de datos se Software para minería de datos se

encuentra disponibleencuentra disponible

Page 21: Mineria de datos

21

Ciclo virtuoso de la minería Ciclo virtuoso de la minería de datosde datos

Page 22: Mineria de datos

22

Principales técnicas de Principales técnicas de minería de datosminería de datos

Análisis de canasta de supermercadoAnálisis de canasta de supermercadoK vecinos más cercanosK vecinos más cercanosDetección de gruposDetección de gruposAnálisis de encadenamientoAnálisis de encadenamientoÁrboles de decisiónÁrboles de decisiónRedes neuronales artificialesRedes neuronales artificialesAlgoritmos genéticosAlgoritmos genéticos

Page 23: Mineria de datos

23

Resumen técnicas de Resumen técnicas de minería de datosminería de datos

Análisis de canasta de supermercadoAnálisis de canasta de supermercadoAgrupar objetos que aparecen juntosAgrupar objetos que aparecen juntosEjemplos:Ejemplos:

Comidas y refrescosComidas y refrescos

Page 24: Mineria de datos

24

Resumen técnicas de Resumen técnicas de minería de datosminería de datos

K vecinos más cercanosK vecinos más cercanosDeterminar los K vecinos más cercanos Determinar los K vecinos más cercanos

en instancias conocidos con el objeto de en instancias conocidos con el objeto de clasificar o hacer una predicción sobre clasificar o hacer una predicción sobre una instancia desconocidauna instancia desconocida

Ejemplo: Dado un reclamo para un Ejemplo: Dado un reclamo para un seguro determinar basado en reclamos seguro determinar basado en reclamos similares (vecinos) si se debe pagar o similares (vecinos) si se debe pagar o investigarinvestigar

Page 25: Mineria de datos

25

Resumen técnicas de Resumen técnicas de minería de datosminería de datos

Detección de gruposDetección de gruposEncontrar objetos similares entre síEncontrar objetos similares entre síEjemplos: tipificar clases de clientesEjemplos: tipificar clases de clientes

Page 26: Mineria de datos

26

Resumen técnicas de Resumen técnicas de minería de datosminería de datos

Análisis de encadenamientoAnálisis de encadenamientoEncuentra relaciones entre objetos de Encuentra relaciones entre objetos de

acuerdo con patronesacuerdo con patronesRelacionado con la teoría de grafosRelacionado con la teoría de grafosEjemplos:Ejemplos:

Relaciones entre individuos basados en Relaciones entre individuos basados en llamadas telefónicasllamadas telefónicas

Relaciones entre casos criminales de Relaciones entre casos criminales de acuerdo con sus característicasacuerdo con sus características

Page 27: Mineria de datos

27

Resumen técnicas de Resumen técnicas de minería de datosminería de datos

Árboles de decisiónÁrboles de decisiónDividir objetos en grupos asociando Dividir objetos en grupos asociando

reglas para la asignación de los objetos reglas para la asignación de los objetos en su correspondiente grupoen su correspondiente grupo

Ejemplos: determinar el sexo o grupo Ejemplos: determinar el sexo o grupo de edad de una persona en función a de edad de una persona en función a una serie de preguntas contestadasuna serie de preguntas contestadas

Page 28: Mineria de datos

28

Resumen técnicas de Resumen técnicas de minería de datosminería de datos

Redes neuronales artificialesRedes neuronales artificialesMás común de las técnicas y para Más común de las técnicas y para

algunos sinónimo de minería de datosalgunos sinónimo de minería de datosModelos simples de interconexiones Modelos simples de interconexiones

neuronales en el cerebro que aprenden neuronales en el cerebro que aprenden de un conjunto de adiestramiento y de un conjunto de adiestramiento y generalizan patrones dentro de él con el generalizan patrones dentro de él con el objeto de clasificar, estimar o predecirobjeto de clasificar, estimar o predecir

Ejemplo: estimar el valor de una casa Ejemplo: estimar el valor de una casa tomando en cuenta el precio pagado por tomando en cuenta el precio pagado por casas similarescasas similares

Page 29: Mineria de datos

29

Resumen técnicas de Resumen técnicas de minería de datosminería de datos

Algoritmos genéticosAlgoritmos genéticosAplican la mecánica de la genética y la Aplican la mecánica de la genética y la

selección natural para encontrar un selección natural para encontrar un conjunto de parámetros óptimos para conjunto de parámetros óptimos para una función predictivauna función predictiva

Utilizados para entrenar redes Utilizados para entrenar redes neuronales artificialesneuronales artificiales

Page 30: Mineria de datos

30

Resumen técnicas de Resumen técnicas de minería de datosminería de datos

Técnicas mencionadas pueden utilizarse Técnicas mencionadas pueden utilizarse en varias aplicaciones o problemas de en varias aplicaciones o problemas de minería de datosminería de datos Ejemplo: árboles de decisión sirven para Ejemplo: árboles de decisión sirven para

detectar grupos, clasificar y predecirdetectar grupos, clasificar y predecir

Varias técnicas pueden ser utilizadas en Varias técnicas pueden ser utilizadas en una misma aplicación o problema de una misma aplicación o problema de minería de datosminería de datos Ejemplo: K vecinos más próximos, árboles de Ejemplo: K vecinos más próximos, árboles de

decisión y redes neuronales artificiales pueden decisión y redes neuronales artificiales pueden utilizarse para clasificaciónutilizarse para clasificación

Page 31: Mineria de datos

BIBLIOGRAFÍA Y REFERENCIAS:

BÁSICA

TÍTULO: Data Clustering: Theory, Algorithms and Applications

AUTOR: Guojun Gan, Chaoqun Ma and jianhong Wu

AÑO: 2007

EDITORIAL O REFERENCIA: ASA-SIAM

LUGAR Y AÑO DE EDICIÓN: USA, 2007

ISBN O REGISTRO:

10: 0898716233

13: 978-0898716238

Page 32: Mineria de datos

TÍTULO:

Data Mining, Practical Machine Learning Tools and Techniques

AUTOR: Ian H. Witten, Eibe Frank, Mark A. Hall

AÑO: 2011

EDITORIAL O REFERENCIA: Morgan Kaufmann Publishers

LUGAR Y AÑO DE EDICIÓN: U.S.A., 2011

ISBN O REGISTRO: 978-0-12-374856-0

TÍTULO:

Data Mining, Concepts and Techniques

AUTOR: Jiawei Han, Micheline Kamber, Jian Pei

AÑO: 2012

EDITORIAL O REFERENCIA: Morgan Kaufmann Publishers

LUGAR Y AÑO DE EDICIÓN: U.S.A., 2012

ISBN O REGISTRO: 978-0-12-381479-1

Page 33: Mineria de datos

Criterios de evaluación:

Exámenes: 40

Tareas:

Prácticas: 35

Proyecto:

Asistencia:


Recommended