Modelos de gestion de la informacion

Post on 13-Jun-2015

5,130 views 5 download

description

Diapositivas Básicas Maestría UPEM

transcript

SISTEMAS DE INFORMACIÓN PARA LA GESTIÓN EMPRESARIAL

M. en I.S.C. Leonardo M. Moreno Villalba

OBJETIVOS GENERALES DE LA ASIGNATURA

• Comprenderá los conceptos básicos de los sistemas de información administrativa y aplicará los aspectos metodológicos para el desarrollo de sistemas de soporte para la toma de decisiones y un mejor funcionamiento.

CRITERIOS Y PROCEDIMIENTOS DE EVALUACIÓN Y ACREDITACIÓN • Entrega de reporte de ejercicios prácticos

realizados en el aula 20%• Entrega de cuadro sinóptico 20%• Entrega de trabajo de investigación

sobre la toma de decisiones 40% • Dos exámenes parciales 40%

TEMAS Y SUBTEMASIntroducción a los sistemas.

Orígenes de los sistemas de información.La toma de decisión basada en computadora.Los subsistemas de la tecnología.

Administración en el sistema organizacional.¿Qué es un sistema?La perspectiva organizacional en la administración de la información.

Sistemas de administración.Teoría de la administración.¿Cuáles son las funciones gerenciales?La información y la toma de decisiones.

El concepto de informática ante la dirección ¿Qué es la tecnología?La Importancia de la información tecnológica.¿Qué es el hardware y que es el software?.

TEMAS Y SUBTEMAS

Administración de la base de datos y telecomunicaciones.¿Cómo administrar una base de datos?Mecanismos para almacenar y procesar la información.Introducción a las telecomunicaciones.Las diferentes topologías de redes.

Generalidades sobre LAN, MAN Y WAN.El origen de la redes.Desarrollo de las redes de computadoraEl software necesario para el enlace y el manejo de datos.

Aplicaciones sobre redes.¿Qué es el downsizing?La aplicabilidad del downsizing y las aplicaciones cliente / servidor.

TEMAS Y SUBTEMASSistemas de información para la administración (MIS).

Subsistemas de información.Subsistemas de mercadotecnia y finanzas.Subsistemas de producción, recursos humanosSistemas de información ejecutiva.

Sistemas de procesamiento de transacciones, soporte a las dicciones, automatización de oficinas y sistemas basados en el conocimiento.

Revisión de sistemas de información (TPS, DSS, OA y KBS).La importancia de lo sistemas para la toma de decisionesAutomatización de oficinas.

Técnicas para el desarrollo de sistemas de información para la toma de decisiones.Análisis de sistema.Mecanismos y métodos para el análisis y el diseño

Diseño de sistemas de usuario final (End User Computing) .¿Qué es el mis?Diseño de sistema.El usuario de computadoras.

Administración de los recursos de información.La importancia de los recursos.La administración eficiente.

Orígenes de los Sistemas de Información

• Que es un Sistema?• Para que me sirve?• Se han utilizado antes

de el surgimiento de la era digital?

• En donde se utilizan actualmente?

Que es un sistema?• Conjunto de

componentes que interactúan entre sí para lograr un objetivo común.

Que es un sistema?• Podemos definir un sistema

como un conjunto de elementos que interaccionan entre sí, orientados a la consecución de un objetivo común.

• Un sistema suele estar situado en un entorno o ambiente con el que interactúa, recibe entradas y produce salidas.

Que es un sistema para una empresa?

• Conjunto de personas, datos y procedimientos que trabajan coordinadamente. Para alcanzar el objetivo de apoyar el funcionamiento de la organización. Haciendo posible que la empresa mantenga contacto con el medio ambiente que la rodea, es decir con: Clientes, Proveedores, Organizaciones Estatales de contralor y recaudación de impuestos y aportes, Funcionarios, Accionistas o propietarios.

Que es un Subsistema?• Se denominan

Subsistemas las partes que conforma un sistema. Cada subsistema tiene su propia vida, pero permite que el sistema sea un todo y produce una serie de variables para establecer el estado del sistema.

Para que me sirve un Subsistema?• La función y estructura de

un sistema puede ser estudiado, analizado y descrito a través de los subsistemas básicos.

Que es la información• La información es una

síntesis o extracto de los datos, pero no contiene redundancias. Por ello, la información puede ser tangible o intangible, pero siempre reducirá la incertidumbre sobre un estado o suceso.

Pero en síntesis que es la información• La información puede

comprenderse como un conjunto de conocimientos o hechos derivados de datos, que son por naturaleza repetitivos y redundantes, que describen un mundo que consiste en procesos y eventos que ocurren una y otra vez con pequeños cambios

De que esta compuesta?• la información la componen datos

que se han colocado en un contexto significativo y útil y se ha comunicado a un receptor, quien la utiliza para tomar decisiones.

• La información implica la comunicación y recepción de inteligencia o conocimiento. Evalúa y notifica, sorprende y estimula, reduce la incertidumbre, revela alternancias adicionales o ayuda a eliminar las irrelevantes o pobres, e influye sobre otros individuos y estimula acción

Orígenes de los Sistemas de Información

• Desde finales del siglo XIX hasta la actualidad, Documentación y tecnologías de la Información han evolucionado enriqueciéndose mutuamente en su desarrollo.

Orígenes de los Sistemas de Información

• Las diferentes etapas históricas por las que ha atravesado la tecnología electrónica han marcado importantes hitos en la historia de la Documentación.

• Al mismo tiempo, el crecimiento de la información y la evidente necesidad de su tratamiento, han provocado la proliferación de líneas de investigación en el campo de las Tecnologías de la Información.

Elementos empresariales

¿Qué es un sistema ERP?• Un sistema ERP es una aplicación informática que

permite gestionar todos los procesos de negocio de una compañía en forma integrada

• Por lo general este tipo de sistemas esta compuesto de módulos como Recursos Humanos, Ventas, Contabilidad y Finazas, Compras, Producción entre otros, brindado información cruzada e integrada de todos los procesos del negocio.

ERP “Personalizado”• Este software debe ser parametrizado y

adaptado para responder a las necesidades especificas de cada organización. Una vez implementado un ERP permite a los empleados de una empresa administrar los recursos de todas las áreas, simular distintos escenarios y obtener información consolidada en tiempo real.

¿A que conlleva la implementación de un ERP?

A un proceso de transformación

A una redefinición de procesos

A un incremento de la eficiencia y

competitividad

¿Que puede abarcar un ERP?

El objetivo de un sistema de ERP es

automatizar los procesos de una empresa

Módulos Principales de un Sistema ERP

1) Negocio

Comercio

Producción

Calidad

Mantenimiento

Módulos Principales de un Sistema ERP (Cont.)

2) Financiero

Gestión Financiera

Activos Fijos Proyectos

Control

Módulos Principales de un Sistema ERP (Cont.)

3) Propósito especial

Recursos humanos

Flujo de Trabajo

Soluciones Sectoriales

SISTEMAS FUNCIONALES DEL NEGOCIO• Los Sistemas Funcionales del Negocio son una variedad de tipos de Sistemas de

Información (conocidos como: procesamiento de transacciones, información gerencial, soporte de decisiones, etc.) caracterizados por el soporte a las funciones del negocio de contabilidad, finanzas, mercadeo, operaciones gerenciales y, gerencia de recursos humanos.

Ejemplos de Sistemas Funcionales del Negocio (O’Brien, 2004)

SISTEMAS DE PROCESAMIENTO DE TRANSACCIONESConocidos comúnmente como TPS (por las siglas en inglés de Transaction Processing Systems), son SI cross-functional que procesan los datos resultado de la ocurrencia de las transacciones (eventos que ocurren como parte del negocio: ventas, compras, depósitos, retiros, devoluciones, pagos, etc.) del negocio.

El ciclo del procesamiento de una transacción (O’Brien, 2004)

SISTEMAS DE SOPORTE DE DECISIONES

• Sistemas de Información basados en computador que proveen información interactiva que soporta a los gerentes y a los profesionales de los negocios durante el proceso de toma de decisiones.

• Los Sistemas de Soporte de Decisiones (DDS, por las siglas en inglés de Decisión Support Systems), usan:– Modelos analíticos,– Bases de datos especializadas,– Juicios y visiones de los propios tomadores de decisiones, y– Un proceso de modelaje interactivo basado en computador para

soportar las tomas de decisiones de negocio, semiestructuradas e inestructuradas.

SISTEMAS DE SOPORTE DE DECISIONES

Componentes de un Sistema de Soporte de Decisiones de Mercadeo Web-enabled(O’Brien 2004)

SISTEMAS EJECUTIVOS DE INFORMACIÓN

• Un Executive Information System (EIS), conocido también como Executive Support System (ESS), es una tecnología que emerge como respuesta a las necesidades de información de altos ejecutivos.

• Proveen rápido acceso a información actualizada, así como a reportes gerenciales.

• Son muy amigables, soportados por facilidades gráficas y proveen capacidades de elaboración de “reportes excepcionales” y de “búsqueda de detalles”.

• Están fácilmente conectados a servicios de información en línea y correo electrónico.

• Incluyen módulos para: soportar el análisis, las comunicaciones, la automatización de oficina y la inteligencia

FUNCIONALIDADES DE LOS EISAunque sus funcionalidades pueden variar, las más comunes son:

– Drill down (búsqueda detallada).– Factores críticos de éxito e indicadores claves de desempeño.– Acceso a estados actuales.– Análisis de tendencias.– Análisis “ad hoc”.– Reportes de excepción.– EIS inteligente.– Integración con un DSS.

Los DSS, los EIS e Internet. El Web es un medio perfecto para desarrollar Sistemas de Soporte a Decisiones y Sistemas Ejecutivos de Información, sobre aspectos globales para toda una organización; además, permite combinar las distintas capacidades de múltiples DSS e EIS, al mismo tiempo y desde cualquier lugar.

PORTALES DE INFORMACIÓN EMPRESARIAL• No confunda portales con los Sistemas Ejecutivos de Información que han

sido usados en algunas industrias por mucho tiempo. Los Portales son para todos en la compañía, y no sólo para ejecutivos. Se quiere gente al frente de las líneas de toma de decisiones usando browsers y portales más que ejecutivos usando software especializado de Sistemas Ejecutivos de Información (Ouellette, 1999).

• Un Portal de Información Empresarial (EIP, por las siglas en inglés de Enterprise Information Portal) es una aplicación Web integrada a la tecnología Intranet y a otras tecnologías, que da a todos los usuarios de la Intranet y a usuarios selectos de la extranet, acceder a una variedad de aplicaciones del negocio internas y externas, así como a servicios.

• Los componentes de un EIP lo pueden identificar como un DSS e-business que puede ser personalizado para ejecutivos, gerentes, empleados, proveedores, consumidores y otros socios de negocios.

PORTALES DE INFORMACIÓN EMPRESARIAL

Componentes de un Portal de Información Empresarial para la toma de decisiones(O’Brien 2004)

Concepto de red.Una red es, en definitiva, como un sistema de dos o más ordenadores (autónomos) que, mediante una serie de protocolos, dispositivos y medios físicos de interconexión, son capaces de comunicarse con el fin de compartir datos, hardware y software, proporcionando así acceso a un mayor número de recursos con un menor coste económico y facilitando su administración y mantenimiento.

TopologíaLa topología define la estructura de una red. La definición de topología puede dividirse en dos partes. la topología física, que es la disposición real de los cables (los medios) y la topología lógica, que define la forma en que los hosts acceden a los medios.

Topologías Físicas

Topologías Lógicas

La topología lógica de una red es la forma en que los hosts se comunican a través del medio. Los dos tipos más comunes de topologías lógicas son broadcast y transmisión de tokens.

Topologías Lógicas

La topología broadcast simplemente significa que cada host envía sus datos hacia todos los demás hosts del medio de red. Las estaciones no siguen ningún orden para utilizar la red, el orden es el primero que entra, el primero que se sirve.

Topologías LógicasLa transmisión de tokens controla el acceso a la red mediante la transmisión de un token electrónico a cada host de forma secuencial. Cuando un host recibe el token, eso significa que el host puede enviar datos a través de la red. Si el host no tiene ningún dato para enviar, transmite el token al siguiente host y el proceso se vuelve a repetir.

Modelo de referencia OSI.El modelo de referencia OSI permite que los usuarios vean las funciones de red que se producen en cada capa. Más importante aún, el modelo de referencia OSI es un marco que se puede utilizar para comprender cómo viaja la información a través de una red.

Modelo de referencia OSI.

En el modelo de referencia OSI, hay siete capas numeradas, cada una de las cuales ilustra una función de red específica. Esta división de las funciones de networking se denomina división en capas.

Los ERP en México(Video)

Caso Exito Implementación de Un ERP (SAP) Hospital Santa fe

Que es un CRM (Video)

Caso Éxito CRM Office Max

A que nos ayudan los ERP

Los sistemas ERP ayudan a la empresa a monitorear en tiempo real los datos generados y, por lo tanto, tenerles más confianza, es decir, que éstos sean más exactos al momento de revisarlos para tomar una decisión.

CRM - Customer Relationship Management

Un CRM se define como “la integración de tecnologías y los procesos de negocios usados para satisfacer las necesidades de los clientes durante cualquier interacción con los mismos

Que involucra un CRM

CRM involucra la adquisición, el análisis y el uso del conocimiento de los clientes con la finalidad de vender más productos o servicios y hacer dicho proceso de forma más eficiente.

CRM Ejemplo Típico

Un ejemplo típico de CRM está presente en algunas redes de supermercados. Con una simple tarjeta, que también facilita el proceso de pago de los clientes, se tiene en realidad la finalidad de permitir el almacenamiento de todas las compras de cada cliente, en cantidad, código, fecha y valor de cada producto adquirido. De esa manera, en una próxima promoción, el marketing será aún más dirigido y eficiente pues se hará con base en estas informaciones.

EL CRM solo se enfoca a la Venta?

La venta no se resume sólo a una simple digitación del pedido y su consecuente emisión de factura y de factura de crédito. Involucra al telemarketing, la preventa, el soporte postventa, la asistencia técnica, el historial de las últimas compras, el control de las pendencias es decir, la dirección y atención personalizada del cliente.

Call Center

Para realizar parte de estas tareas se utiliza el CTI ( Computer Telephone Interface) que pone a disposición la red de teléfonos como terminales de redes de computadoras.

E-commerce y Supply Chain Management (SCM)

En la Gestión de la Cadena de Suministro se añaden funcionalidades para la gestión de la demanda (Demand Planning, DP) y la planificación de las necesidades de distribución (Distribution Requirement Planning, DRP). Con estos módulos adicionales se prevé el cambio de paradigma en la producción: de producir para llenar almacenes (técnica denominada push, o empujar) a producir para satisfacer la demanda (pull, o tirar).

PLM: Product Lifecycle Management. Gestión del Ciclo de Vida del Producto

Tiene como objetivo dotar a las organizaciones de módulos que permitan el desarrollo de los productos, así como vías de comunicación y colaboración en el ciclo de vida del producto.

PLM Principales Módulos(Según SAP)

Gestión de los datos del ciclo de vida: planificar, gestionar y controlar el proceso de desarrollo del producto y permitir compartir procesos de diseño de producción

PLM Principales Módulos(Según SAP) Cont.

Gestión del proyecto y programa de desarrollo del producto: Herramientas asistidas por ordenador de: CAD (diseño), CAM (fabricación), CAE (ingeniería).

Gestión de la colaboración en el ciclo de vida: integra a todos los participantes en el desarrollo del producto (diseñador, proveedor de bienes, fabricante y cliente)

PLM Principales Módulos(Según SAP) Cont.

PLM Principales Módulos(Según SAP) Cont.

Gestión de la calidad: Incluir la gestión de calidad en todo el proceso del producto.

PLM Principales Módulos(Según SAP) Cont.

Gestión de activos en el ciclo de vida: gestionar activos físicos y equipos desde la primera idea de inversión hasta la amortización del activo.

PLM Principales Módulos(Según SAP) Cont.

Política de Seguridad e Higiene en el trabajo: minimizar los riesgos y reducir costes cumpliendo con las normas legales sobre S&H.

CRM una Mirada Organizacional o Tecnológica

Seminario CRM Parte 1

Seminario CRM Parte 2

Antes de implementar un ERP

Evaluar a todas las áreas o departamentos que conforman la estructura

En especial la de recursos humanos, que es la más difícil de implementar

Determinar el costo-beneficio del desarrollo y aplicación de un sistema como éstos.

Puntos a considerar antes de implementar un ERP “Pilares de Selección”

“El producto”: se refiere al sistema ERP,consideraciones técnicas y funcionales.

Primer Pilar.

Puntos a considerar antes de implementar un ERP “Pilares de Selección”

Segundo Pilar.

“Los procesos”: son las funciones que deben ser soportadas por el sistema ERP,.

Puntos a considerar antes de implementar un ERP “Pilares de Selección”

Adaptación: La implementación de un ERP implica una reingeniería de procesos cuyo

objetivo es adaptar a la empresa a los nuevos modelos de negocio.

Tercer Pilar.

Puntos a considerar antes de implementar un ERP “Pilares de Selección”

Las personas son los recursos humanos, los conocimientos y habilidades de los

involucrados en el ciclo de vida del sistema, usuarios, analistas, consultores y

directivos que empujan el proyecto.

Cuarto Pilar.

METODOLOGÍA PARA LASELECCIÓN DE UN SISTEMA ERP

El objetivo fundamental de MSSE es proveer una guía de pasos que ayude en la selección de un sistema ERP y la empresa consultora que se encargará del trabajo de implementación

Estructura de MSSEMSSE se organiza en tres fases las cuales se dividen en actividades:

- Fase 1 – Selección Del ERP

Fase1(Actividades)Actividad 1 – Documentar Necesidado Análisis De Necesidado Determinar Equipo De Proyecto

Fase 1 (Actividades)

Actividad 2 – Primera Seleccióno Búsqueda En El Mercadoo Primer Contacto Con Proveedoreso Entrevistar Posibles Candidatos y Recopilar Informacióno Armado De Listado De Criterios a tener En Cuentao Evaluar Los Candidatoso Documentación De La Selección y Armado Del Plan De Trabajo

Fase 1 (Actividades)

Actividad 3 – Selección Finalo Organizar Visitas A Los Proveedoreso Demostración Del Productoo Decisión Final – Negociación

Fase 2 (Selección Del Equipo De Consultaría)

Fase 2 Documentar Bases De LaBúsqueda

Actividad 1 – Documentar Bases De La Búsquedao Organizar la búsquedao Armar listado de criterios para seleccionar consultora

Fase 2 Documentar Bases De LaBúsqueda

Actividad 2 –Selección De Candidatoso Entrevistar Posibles Candidatos Y Recopilar Informacióno Evaluar Los Candidatoso Decisión Final – Negociación

Fase 3 Presentación y Planificación General Del Proyecto

Lo primero que se realiza es la selección del sistema a implementar (fase 1), luego se busca la empresa que realizará el trabajo (fase 2) y finalmente se hace una presentación conjunta del equipo y se arma un plan general del proyecto con el objetivo de que todas las partes involucradas organicen sus recursos (fase 3).

Fase 3 Presentación y Planificación General Del Proyecto

Si la empresa por decisiones corporativas o de cualquier índole se viera obligada a implementar un sistema ERP específico, MSSE podría ser usada a partir de la fase 2 para seleccionar la consultora. En cuyo caso la metodología puede utilizarse también para verificar 19 que el sistema que se debe implementar cumple con las necesidades de la empresa.

Arquitectura de un sistema ERP

Arquitectura de un sistema ERP

La arquitectura genérica descrita por David Sprott (2000), en esta se muestran todos los componentes que forman un sistema ERP. Los sistemas de ventajas competitivas son la automatización de los procesos de negocio que están soportados en dos infraestructuras:

• la infraestructura operacional de negocios • la infraestructura técnica.

Metodología de implantación de un sistema ERP

El primer paso en la implantación de un sistema ERP consiste en describirlos procesos de negocio que se quieren automatizar. El problema que se enfrenta aquí es: ¿cómo describir un proceso de negocio?

Proceso de negocio

“Un conjunto de tareas lógicamente relacionadas, las cuales atraviesan la estructura organizacional, que existen para conseguir un resultado bien definido dentro de un negocio; por lo tanto toman una entrada y le agregan valor para producir una salida, que puede ser un producto físico o un servicio”.

Etapas en la implantación de un sistema ERP.

Paso 1: Definición de procesos de negocio actualesExisten diferentes métodos para modelar procesos de negocio, uno de los

más reconocidos es el de definición de integración, IDEF (Mayer and deWitte, 1998).

Otra manera de modelar procesos es a través de los diagramas de actividades y casos de uso del lenguaje de modelado unificado UML (OMG, 2000; Busch et al, 1998).

Existen también métodos de descripción de procesos que pertenecen a compañías particulares: ARIS (Architecture of Integrated Information Systems), que basa el modelado de procesos a través de diagramas EPC (Scheer, 1999); o el método de ATT que utiliza en sus metodologías de mejora continua (AT&T Quality Steering Committee, 1988).

¿En que consiste describir un proceso de negocio?

Consiste en capturar el conocimiento de cómo esa organización realiza sus actividades para obtener un bien o un servicio. Una vez que se tiene descrito el proceso, éste puede ser utilizado para:

• Capacitar a nuevos empleados.

• Apoyar a la certificación de calidad de la organización.

• Establecer los requisitos de un sistema de información que lo soporte.

¿Pero que es un Proceso?

Los procesos son el conocimiento de la organización, pues establecen la forma en cómo esa organización trabaja para lograrsus metas. Los procesos se clasifican en diferentes categorías que van desde procesos de manufactura hasta procesos de negocio

Paso 2: Alineamiento de los procesos actuales contra las mejores prácticas implantadas en el sistema ERP

Una vez que los procesos actuales son descritos, se recomienda hacerles un rediseño de mejora. Al tener hechas las mejoras, se comparan contra los procesos denominados “mejores prácticas” que sonlos que un sistema ERP comercial trae programados. A los procesos resultantes de este rediseño y sus comparaciones se les denomina procesos de negocio propuestos.

Paso 2: Alineamiento de los procesos actuales contra las mejores prácticas implantadas en el sistema ERP

Este paso implica que los especialistas funcionales conozcan cómo son las mejores prácticas programadas en el sistema ERP comercial que se haya adquirido o que se contrate este conocimiento con especialistas del proveedor del sistema ERP.

Paso 3: Revisión y autorización de los procesos de negocio propuestosLos procesos de negocio propuestos se presentan para revisión y autorización de sus usuarios y de un conjunto de asesores, según lo establezca la organización. Ésta es una etapa de mucha interacción con los revisores, pues se evalúa la factibilidad de cada una de sus observaciones y, en su caso, se hacen los ajustes en los procesos. Como resultado de esta revisión se obtiene un proceso de negocio revisado.

Paso 4: Plan de trabajo e implantación de los procesos autorizados en el sistema ERP

Una vez que el proceso de negocio está autorizado, se elabora un plan de trabajo que determina cuáles son las tareas a realizar para implantarlo en el sistema ERP. Con este plan se establecen parámetros en el sistema ERP comercial, de tal manera que los procesos de negocio autorizados queden programados.

Paso 4: Plan de trabajo e implantación de los procesos autorizados en el sistema ERP

La determinación de los parámetros implica modificar todo lo referente a los procesos de mejores prácticas, de tal forma que éstos se conviertan en los procesos autorizados.

Paso 5: Evaluación y pruebas del proceso implantado y capacitación

Una vez que los procesos autorizados están programados en el sistema ERP, se tiene que hacer un plan de pruebas y un plan de capacitación de los usuarios finales del sistema. En seguida es necesario llevar a cabo estos planes, ajustando en el sistema ERP las desviaciones que se hayan encontrado en las pruebas.

Paso 6: Puesta en marcha y validación del proceso automatizadoLa puesta en marcha implica hacer los ajustes finales del sistema y transportarlo a la infraestructura computacional de producción. Esta etapa debe estar bien planeada porque es cuando el sistema entra en operación.

El desarrollo en cada una de las etapas plantea diferentes problemas que se deben solucionar de manera integral desde los implantadores del sistema hasta los encargados de tomar las decisiones.

Data warehouseM. En I.S.C. Leonardo M. Moreno V.

Que es un data warehouse?• William Inmon: un almacén de información

temática orientado a cubrir las necesidades de aplicaciones de los sistemas de Soporte de Decisiones (DSS) y de la Información para Directivos (EIS), que permite acceder a la información corporativa para la gestión, control y apoyo a la toma de decisiones.

Data Warehouse (Almacén de Datos)

• Un Almacén de Datos (o Data Warehouse) es una gran colección de datos que recoge información de múltiples sistemas fuentes u operacionales dispersos, y cuya actividad se centra en la “Toma de Decisiones”.

• Una vez reunidos los datos de los sistemas fuentes se guardan durante mucho tiempo, lo que permite el acceso a datos históricos; asílos Almacenes de Datos proporcionan al usuario una interfaz consolidada única para los datos, lo que hace más fácil escribir las consultas para la Toma de Decisiones.

Diferencias entre Base de Datos y Almacén de Datos

Base de Datos Operacional Almacén de Datos

Datos Operacionales Datos del negocio para Información

Orientados a las aplicaciones Orientados al sujeto, orientados al negocio

Información Actual Información actual e histórica

Detalladas Detalladas y resumidas

Cambian constantemente estables

Características del Almacén de Datos• Organizado en torno a temas.La información se clasifica en base a los

aspectos que son de interés para la empresa.• Integrado.Es el aspecto más importante. La integración de datos consiste en

convenciones de nombres, codificaciones consistentes, medida uniforme de variables, etc.

• Dependiente del tiempo. Esta dependencia aparece de tres formas:– La información representa los datos sobre un horizonte largo de tiempo.– Cada estructura clave contiene (implícita o explícitamente) un elemento de tiempo

(día, semana, mes, etc.).– La información, una vez registrada correctamente, no puede ser actualizada.

• No volátil.El Almacén de Datos sólo permite cargar nuevos datos y acceder a los ya almacenados, pero no permite ni borrar ni modificar losdatos.

Arquitectura del Data warehouse

OLTP (On-Line Transaction Processing)

• Son aplicaciones que definen el comportamiento habitual de un entorno operacional de gestión y ejecutan las operaciones del día a día. Algunas de las características más comunes de este tipo de transacciones podrían ser:

• Altas/Bajas/Modificaciones• Consultas rápidas, escuetas y

predecibles• Poco volumen de información

Transacciones rápidas• Gran nivel de concurrencia• Modo de actualización on-line• Baja redundancia de datos

OLAP (On-Line Analytical Process)

• Son aplicaciones que se encargan de analizar datos del negocio para generar información táctica y estratégica que sirve de soporte para la toma de decisiones. Mientras que las transacciones OLTP utilizan Bases de Datos Relacionales u otro tipo de archivos, OLAP logra su máxima eficiencia y flexibilidad operando sobre Bases de datos Multidimensionales

Middleware• Es un software que reside físicamente

entre un Cliente y en un Servidor de Comunicaciones localizado

Aplicaciones• EIS (Executive Information System)

– Son herramientas para proveer información estratégica a los ejecutivos mediante informes, comparativas y cuadros de mando multidimensionales.

• DSS (Decission Support System)– Herramienta de soporte para la toma de decisiones.

Incorpora reglas de decisión y análisis de datos no predefinidos en las posibilidades de un EIS.

Etapas de Diseño del Almacén de Datos• Origen (Source): Define los orígenes de datos del Almacén de Datos,

como los sistemas de Procesamiento de Transacciones en Línea (On-LineTransactionProcessing, OLTP), las fuentes de datos externas (datos sindicados, datos censales), etc.

• Integración (Integration): Define el mapeo entre los orígenes de datos y el propio Almacén de Datos.

• Almacén de Datos (Data Warehouse):Define la estructura del Almacén de Datos.

• Adaptación (Customization): Define el mapeo entre el Almacén de Datos y las estructuras empleadas por el cliente.

• Cliente (Client): Define las estructuras concretas que son empleadas por los clientes para acceder al Almacén de Datos, como Data Marts o aplicaciones OLAP.

Niveles por Etapa del Diseño del Almacén de DatosCada etapa se analiza desde tres niveles o perspectivas que se crean en el siguiente orden:

– Conceptual: Define el Almacén de Datos desde un punto de vista conceptual, es decir, desde el mayor nivel de abstracción y contiene únicamente los objetos y relaciones más importantes.

– Lógico: Abarca aspectos lógicos del diseño del Almacén de Datos, como la definición de las tablas y claves, la definición de los procesos ETL, etc.

– Físico: Define los aspectos físicos del Almacén de Datos, como el almacenamiento de las estructuras lógicas en diferentes discos o la configuración de los servidores de bases de datos que mantienen el almacén de datos.

Diagramas de FormalizaciónCada etapa o nivel necesita formalismos de modelado diferentes. Una aproximación es la siguiente, donde el diseñador del Almacén de Datos no necesita definir todos los diagramas que se especifican:

Estructura lógica del Almacén de Datos• Metadatos. Describen la estructura de los datos contenidos en el almacén.

– Están en una dimensión distinta al resto de niveles.

• Datos detallados actuales. Obtenidos directamente del procesado de los datos.– Forman el nivel más bajo de detalle.– Ocupan mucho espacio.– Se almacenan en disco, para facilitar el acceso.

• Datos detallados históricos. Igual que los anteriores, pero con datos correspondientes al pasado.– Se suelen almacenar en un medio externo, ya que su acceso es poco frecuente.

• Datos ligeramente resumidos. Primer nivel de agregación de los datos detallados actuales.– Corresponden a consultas habituales.– Se almacenan en disco.

• Datos muy resumidos. Son el nivel más alto de agregación.– Corresponden a consultas que se realizan muy a menudo y que se deben obtener muy rápidamente.– Suelen estar separados del Almacén de datos, formando Supermercados de Datos (Data Marts).

Estructura lógica del Almacén de Datos

Estructura física del Almacén de Datos

• La estructura física puede presentar cualquiera de las siguientes configuraciones:– Arquitectura centralizada. Todo el Almacén de datos se encuentra en un

´único servidor.– Arquitectura distribuida. Los datos del Almacén se reparten entre varios

servidores. Asignando cada servidor a uno o varios temas lógicos.– Arquitectura distribuida por niveles. Refleja la estructura lógica del

Almacén, asignando los servidores en función del nivel de agregación de los datos que contienen. Un servidor está dedicado para los datos de detalle, otro para los resumidos y otro para los muy resumidos.

DataMiningMinería de Datos

¿Por qué Data Mining?• El Data Mining es de gran utilidad para

quienes toman decisiones de alto nivel. • Hoy en día la demanda de información

estratégica corresponde a las organizaciones (tanto grandes como pequeñas) que desean obtener ventaja competitiva o bien posicionarse en el mercad

Definiciones de Data Mining• "Proceso de extracción de información oculta (antes

desconocida), de gran interés y potencialmente útil, de bases de datos de gran tamaño".

• “Descubrimiento de patrones ocultos de grandes bases de datos, preferentemente Data Warehouse o Data Marts, con el objetivo de ayudar a las organizaciones a tomar mejores decisiones sobre la base del conocimiento obtenido”

Definiciones de Data Mining• "Búsqueda de relaciones y patrones existentes en grandes

bases de datos pero que se encuentran ‘ocultos’ en grandes volúmenes de datos, como por ejemplo, relaciones entre datos de pacientes y su diagnóstico médico. Estas relaciones representan un conocimiento valioso acerca de la base de datos y los objetos que residen en ellas".

• "Utilización de una gran variedad de técnicas para identificar ‘pepitas’ de información o conocimiento en los datos y extraerlos de manera que puedan ser utilizados en área

Que es Data Mining?• Data Mining es el proceso de extracción de

información oculta y predecible de grandes bases de datos.

• Un Sistema Datamining es una tecnología de soporte para usuario final cuyo objetivo es extraer conocimiento útil y utilizable a partir de la información contenida en las bases de datos de las empresas.

Que hacen las herramientas de Data Mining?

• Las herramientas de Data Mining predicen futuras tendencias y comportamientos, permitiendo en los negocios tomar decisiones proactivas y orientadas por un conocimiento acabado de la información. Las herramientas de Data Mining pueden responder a preguntas de negocios que tradicionalmente consumen demasiado tiempo para poder ser resueltas y a los cuales los usuarios de esta información casi no están dispuestos a aceptar.

¿Qué puede hacer el Data Ming?• Predicción automática de

comportamientos.• Predicción automática de tendencias.• Descubrimiento automático de

comportamientos desconocidos anteriormente.

Técnicas mas comunes del Data Mining.• Redes Neuronales.

– Son modelos no-lineales inspirados en las redes de neuronas biológicas y se usan generalmente en problemas de clasificación y predicción.

• Arboles de decisión. – Son estructuras en forma de árbol que representan conjuntos de decisiones capaces de

generar reglas para la clasificación de los datos.• Algoritmos genéticos.

– Son modelos inspirados en la evolución de las especies y que se aplican generalmente en problemas de optimización. Permiten incluir fácilmente ligaduras complicadas que limitan la solución a un problema.

• Clustering. – Métodos de agrupación de datos que nos permiten clasificar los datos por su similitud entre

ellos. Son utilizadas con frecuencia para entender los grupos naturales de clientes en empresas o bancos

Proceso de Data Mining• El proceso de descubrimiento de conocimiento (KDD

process) se divide en una serie de etapas que permiten identificar el problema a resolver, preparar los datos e interpretar los resultados.

• De manera general, este proceso comprende tres fases genéricas: – Preparación de los datos. – Operaciones de extracción (o minería). – Presentación de los resultados.

Proceso de Data Mining• Las fases genéricas se pueden desglosar en siete etapas que

permiten una mejor comprensión del proceso, estas son:

Proceso de Data Mining• Identificación del problema.

– Para hacer un buen uso del Data Mining, hay que tener muy claro los objetivos que se quieren obtener, estos objetivos deben tener relación con la organización que emprende el proyecto de Data Mining y con los datos con los que se va a trabajar. No todo problema requiere de una solución mediante Data Mining.

Proceso de Data Mining• Selección de los datos:

– Fase que incluye la adquisición de diversos datos que pueden residir en una o más base de datos, pudiendo ser una base de datos transaccional, un Data Warehouse o un Data Mart.

Proceso de Data Mining• Preparación de los datos:

– Esta etapa corresponde a la consolidación de los datos en una sola base de datos. Considera la identificación y corrección de inconsistencias en la definición de los datos, diferencias de codificación y resuelve la discordancia de múltiples valores para un mismo dato.

Proceso de Data Mining• Construcción del modelo:

– Construir un modelo en una situación donde se conoce la respuesta y luego se aplica en otras situaciones en la que se desconoce la respuesta.

– Un modelo es una abstracción de la realidad. No puede predecir todos los eventos individuales, pero un buen modelo es una guía útil para entender la organización y sugerir acciones que permitan lograr el éxito.

Proceso de Data Mining• Construcción del modelo: – Cada una de las diversas técnicas que utiliza el Data Mining genera dos clases

de modelos, el modelo predictivo y el modelo descriptivo.

• Un modelo predictivo utiliza datos con resultados conocidos para predecir valores para diferentes datos y guiar la estrategia y planificación de la organización.

• Los modelos descriptivos describen patrones en datos existentes para guiar la toma de decisiones.

– La principal diferencia entre estos dos modelos, es que los modelos predictivos realizan predicciones explícitas (ejemplo: la probabilidad de un fraude), mientras que los modelos descriptivos realizan predicciones implícitas (asumen que ciertas características pueden presentarse en colecciones de datos similares).

Proceso de Data Mining• Descubrimiento de patrones:

– En esta fase se aplican algoritmos para generar los patrones, esto resultará más efectivo si se aplica un proceso de exploración asistido por el ordenador.

– Es imprescindible conocer que se entiende por patrones y su diferencia con los conceptos de hechos, reglas y excepciones.

Proceso de Data Mining• Descubrimiento de patrones:

– Los patrones corresponden a “un conjunto de filas que comparten los mismos valores en dos o más columnas”. Observando la siguiente tabla que contiene datos generales de alumnos:

Proceso de Data Mining• Descubrimiento de patrones:

– Se tiene que tres filas (1,2,5) comparten los mismos valores en dos columnas (Ciudad y Año Ingreso), de lo cual se pude deducir la siguiente sentencia:

“La mayoría de los alumnos de Lota ingresan en 1995”.

Proceso de Data Mining• Descubrimiento de patrones:

– La confianza es el porcentaje específico de ocurrencia y se expresa como un porcentaje. La confianza de la sentencia anterior se calcula dividiendo el número de filas que tiene el atributo “Lota” y 1995, o sea 3, por el número de filas que tiene “Lota” y cualquier Año de Ingreso, o sea 4, por lo tanto resulta una confianza del 75%. Cuando la confianza es de 100% se utiliza el término “Todos”, por ejemplo:

“Todos los alumnos de Chillan ingresan en 1994”.

– También es posible presentar un patrón especificando su porcentaje, para el ejemplo inicial:

“25% de los alumnos de Lota ingresan en 1994”.

Proceso de Data Mining• Descubrimiento de patrones:

– Las excepciones se definen como un patrón débil que existe junto con las filas de patrones más poderosos.

– Observando la tabla, la fila 3 es una excepción, puesto que es el único registro que no posee en el campo Año Ingreso el valor de “1995”, como en el resto de los casos que tienen en el campo Ciudad el valor de “Lota”, esto también se puede entender como un error.

Proceso de Data Mining• Descubrimiento de patrones:

– Las excepciones se definen como un patrón débil que existe junto con las filas de patrones más poderosos.

– La diferencia entre hecho y regla, esta dado por la representación o forma en cómo se expresa. Por ejemplo las siguientes sentencias representan a un mismo patrón:Hecho:

La mayoría de los alumnos de Lota ingresan en 1995

Regla:

Sí Ciudad = Lota entonces Año Ingreso = 1995

Proceso de Data Mining• Despliegue de patrones:– Posterior a la construcción del modelo y al

descubrimiento de patrones, se debe evaluar sus resultados e interpretar su significado. Cuando se realiza la validación de los patrones, se encuentra una razón de exactitud. Es importante recordar que esta razón se aplica sólo a los datos con los cuales se construyó el modelo.

Proceso de Data Mining• Monitorización del modelo:

– Tal como cambian los procesos de negocio durante el tiempo, la validez de los patrones descubiertos a partir de los datos históricos pueden verse deteriorados. Es muy importante detectar estos cambios lo más temprano posible, a través de la monitorización constante con relación a los nuevos datos.

Pasos del proceso de descubrimiento de conocimiento• Estudio del dominio de aplicación:

– conocimiento previo y objetivos de uso.

• Creación de un juego de datos objetivo: selección de datos.• Data Cleaning (limpieza de datos) y proceso previo:

– ¡(puede ser el 60 % del esfuerzo!).

• Reducción de datos y transformación: Encontrar rasgos útiles, reducir las dimensionalidad/variabilidad y la representación invariante.

• Elegir las funciones de Data Mining para resumir, clasificar, asociar y agrupar datos.

• Elegir los algoritmos de mining.• Data Mining

Pasos del proceso de descubrimiento de conocimiento• Evaluación de modelos y presentación de los conocimientos:

– Visualización, transformación, eliminación de los modelos redundantes, etc.

• Uso del conocimiento descubierto.

¿En qué tipos de datos se usa Data Mining?• Bases de datos relacionales.• Depósitos de datos.• Bases de datos transaccionales.• Bases de datos avanzadas y en depósitos de información:

– Bases de datos orientadas a objetos y bases de datos relacionadas a objetos.

– Bases de datos espaciales. – Datos de series temporales.– Bases de datos de texto y multimedia.– Bases de datos heterogéneas y de herencia.– World Wide Web (WWW).

Clasificación de sistemas Data Mining

• Funcionalidad general:– Data Mining descriptiva.– Data Mining predictiva.

• Según los tipos de bases de datos para ser extraídas o minadas:– Relacionales, transaccionales, orientadas a objetos, relacionalobjeto,

activa, espacial, temporales, de texto, multimedia, heterogéneas, de herencia, WWW, etc.

• Según los tipos de conocimientos para ser descubiertos:– De caracterización, discriminación, asociación, clasificación,agrupación,

tendencias, desviaciones y análisis outlier.– Funciones múltiples integradas y extracciones de niveles múltiples.