+ All Categories
Home > Documents > Tópicos Selectos de Base de Datos

Tópicos Selectos de Base de Datos

Date post: 21-Jan-2016
Category:
Upload: izrael-cervera
View: 1,099 times
Download: 15 times
Share this document with a friend
37
INGENIERIA EN SISTEMAS COMPUTACIONALES FUNDAMENTOS DE BASE DE DATOS TERCER SEMESTRE EJERCICIOS 4 DE LA UNIDAD 1 (INVESTIGACION DE TOPICOS SELECTOS DE BASE DE DATOS) DOCENTE: LIC. ANTONIO DE JESUS CAB BALAM MEDINA CERVERA JAIRO ISRAEL (12070025) TUZ CANCHE ADRIAN NATIVIDAD (12070064) 5-9-2013
Transcript
Page 1: Tópicos Selectos de Base de Datos

INGENIERIA EN SISTEMAS COMPUTACIONALES

FUNDAMENTOS DE BASE DE DATOS

TERCER SEMESTRE

EJERCICIOS 4 DE LA UNIDAD 1 (INVESTIGACION DE TOPICOS

SELECTOS DE BASE DE DATOS)

DOCENTE: LIC. ANTONIO DE JESUS CAB BALAM

MEDINA CERVERA JAIRO ISRAEL (12070025)

TUZ CANCHE ADRIAN NATIVIDAD (12070064)

5-9-2013

Page 2: Tópicos Selectos de Base de Datos

Tópicos Selectos de Base de Datos

Contenido

INTRODUCCION.......................................................................................................................................3

1 ¿QUÉ ES UN SISTEMA GESTOR DE BASE DE DATOS?.......................................................5

1.1. Objetivo de las Bases de Datos...........................................................................................5

1.2. Aplicaciones de los sistemas de Bases de Datos...........................................................6

1.3 Modelos de Datos....................................................................................................................8

1.4 Niveles de abstracción de una Base de Datos.................................................................8

1.5 Lenguajes de Base de Datos..............................................................................................10

1.6 Usuarios y administradores de Base de Datos..............................................................11

1.7 Estructuras de un Sistema de Base de Datos................................................................12

1.7.1 Gestor de almacenamiento.........................................................................................13

1.7.2 Procesador de consultas.............................................................................................13

2. BASE DE DATOS DISTRIBUIDADAS........................................................................................14

3 BODEGA DE DATOS (DATA WAREHOUSES)........................................................................14

3.1 Objetivo de las Data Werehouses......................................................................................14

3.3 Funcionamiento.....................................................................................................................15

4. DATA MARTS.................................................................................................................................16

5. ETL (EXTRACT, TRANSFORM AND LOAD O “EXTRAER, TRANSFORMAR Y CARGAR”)...............................................................................................................................................17

5.1 Descripción de Etapas del ETL..........................................................................................17

6. PROCESAMIENTO ANALITICO EN LINEA ( OLAP)...............................................................18

6.1 Tipos de OLAP.......................................................................................................................19

7. CUBOS (Base de Datos Tridimensionales).............................................................................19

7.1 Operaciones básicas............................................................................................................20

8. MINERIA DE DATOS (DM, DATA MINING)...............................................................................20

8.1 Tareas principales de las minerías de datos..................................................................20

8.2 Técnicas de la minería de datos........................................................................................21

9. BUSINESS INTELLIGENCE (BI)..................................................................................................21

10. SISTEMAS MANEJADORES DE BASE DE DATOS (BUSQUEDAS)...............................21

10.1 Búsqueda secuencial...........................................................................................................22

10.2 Búsqueda binaria...................................................................................................................22

10.3 Búsqueda indexada..............................................................................................................23

Page 3: Tópicos Selectos de Base de Datos

Tópicos Selectos de Base de Datos

CONTENIDO DE IMÁGENES

Imagen 1-------------------------------------------------------------------------------------página 5

Imagen 2-------------------------------------------------------------------------------------página 7

Imagen 3-------------------------------------------------------------------------------------página 9

Imagen 4-------------------------------------------------------------------------------------página 12

Imagen 5-------------------------------------------------------------------------------------página 14

Imagen 6-------------------------------------------------------------------------------------página 15

Imagen 7-------------------------------------------------------------------------------------página 17

Imagen 8-------------------------------------------------------------------------------------página 19

Imagen 9-------------------------------------------------------------------------------------página 20

Page 4: Tópicos Selectos de Base de Datos

Tópicos Selectos de Base de Datos

INTRODUCCION

Un tópico es una idea o un tema en específico, en este caso bases de datos, así que

resumiremos los tópicos más importantes, o selectos de bases de datos.

 Una base de datos es una biblioteca donde ha de mantener listas de los libros que

posee, de los usuarios que tiene de sus productos, ventas y empleados.

A este tipo de información se le llama datos.

Un gestor de base de datos es un programa que permite introducir y almacenar datos,

ordenarlos y manipularlos. Organizarlos de manera significativa para que se pueda

obtener información no visible como totales, tendencias o relaciones de otro tipo. Como

muchos de nosotros conocemos un SGBD cuenta con un modelo y arquitectura; a su

vez conoceremos en donde se pueden aplicar y los distintos tipos de usuarios de las

mismas.

Lo anterior son temas muy comunes de una base de datos, pero hay algunos temas

que no conocemos y están anexadas en este trabajo y se conceptualiza lo que es y

algunas características de las mismas.

Base de datos distribuidos, son como están repartidos los datos; al igual existen

bodegas de datos donde se almacenan información como un recurso en próximas

ocasiones. Existen data marts la cual se le definirá más adelante en el trabajo y se

pueden extraer, transformar y cargar para apoyar el proceso.

Hay formas de procesar una base de datos y uno de ellos es el proceso analítico en

línea es el nombre formal para el análisis de cubos multidimensionales, una forma más

intuitiva de ver la información empresarial.

Page 5: Tópicos Selectos de Base de Datos

Tópicos Selectos de Base de Datos

La extracción de datos tiene un fin de hacer nuevas asociaciones y predecir datos en un

futuro. Para tener un aprovechamiento de datos para hacerla útil en una empresa. En la

organización y la manipulación de datos de volúmenes grandes están los manejadores

de bases de datos.

En si esta es lo que encontrara en este trabajo y están definidos de manera más amplia

como se vaya avanzando en esta investigación.

Page 6: Tópicos Selectos de Base de Datos

Tópicos Selectos de Base de Datos

1 ¿QUÉ ES UN SISTEMA GESTOR DE BASE DE DATOS?

Un sistema gestor de bases de datos (SGBD) consiste en una colección de datos

interrelacionados y un conjunto de programas para acceder a dichos datos. La

colección de datos, normalmente denominada base de datos, contiene información

relevante para una empresa. El objetivo principal de un SGBD es proporcionar una

forma de almacenar y recuperar la información de una base de datos de manera que

sea tanto práctica como eficiente. Los sistemas de bases de datos se diseñan para

gestionar grandes cantidades de información. La gestión de los datos implica tanto la

definición de estructuras para almacenar la información como la provisión de

mecanismos para la manipulación de la información. Además, los sistemas de bases de

datos deben proporcionar la fiabilidad de la información almacenada, a pesar de las

caídas del sistema o los intentos de acceso sin autorización. Si los datos van a ser

compartidos entre diversos usuarios, el sistema debe evitar posibles resultados

anómalos. Dado que la información es tan importante en la mayoría de las

organizaciones, los científicos informáticos han desarrollado un amplio conjunto de

conceptos y técnicas para la gestión de los datos.

Page 7: Tópicos Selectos de Base de Datos

Tópicos Selectos de Base de Datos

1.1. Objetivo de las Bases de Datos.

1 Control centralizado de la información . Los sistemas tradicionales de ficheros nos

permiten centralizar la información por medio de varios programas de diseño.

Ahora bien, siguiendo las normas estandarizadas de las bases de datos actuales

podemos acceder a todos los datos mediante un único programa -administrador

de bases de datos-.

2 Disminuir la redundancia y evitar la inconsistencia . Son objetivos básicos de una

base de datos eficiente. Disminuir la redundancia consiste en agrupar todos los

datos en un mismo objeto sin repetir información. Esto no puede realizarse

siempre, con lo cual hay ocasiones en las que se duplica información.

3 Posibilidad de compartición de datos . Se consigue disminuyendo la redundancia.

4 Mantenimiento de la integridad . Deben existir controles que verifiquen que los

datos introducidos son correctos, para lo cual se comparan con otros datos, se

crean redundancias de control, se hacen validaciones de rango y se permite al

usuario modificar los datos.

5 Disponer de un acceso seguro . Imponer controles para acceder o modificar las

bases de datos tales como claves de acceso.

6 Proporcionar independencia de datos. Establecer una separación entre

programas y datos desde una perspectiva física y lógica, de tal forma que

cualquier cambio físico o lógico en las estructuras de datos no afecten a los

programas de aplicación. Como ejemplo de reestructuración física estaría una

división de uno de los ficheros de datos en dos ficheros. Un cambio lógico en la

estructura sería añadir un nuevo campo en la base de datos.

Page 8: Tópicos Selectos de Base de Datos

Tópicos Selectos de Base de Datos

1.2. Aplicaciones de los sistemas de Bases de Datos.

Las bases de datos son ampliamente usadas. Las siguientes son algunas de sus

aplicaciones más representativas:

Banca. Para información de los clientes, cuentas y préstamos, y transacciones

bancarias.

Líneas aéreas. Para reservas e información de planificación. Las líneas aéreas

fueron de los primeros en usar las bases de datos de forma distribuida

geográficamente (los terminales situados en todo el mundo accedían al sistema

de bases de datos centralizado a través de las líneas telefónicas y otras redes de

datos).

Universidades. Para información de los estudiantes, matrículas de las

asignaturas y cursos.

Transacciones de tarjetas de crédito. Para compras con tarjeta de crédito y

generación mensual de extractos.

Telecomunicaciones. Para guardar un registro de las llamadas realizadas,

generación mensual de facturas, manteniendo el saldo de las tarjetas telefónicas

de prepago y para almacenar información sobre las redes de comunicaciones.

Finanzas. Para almacenar información sobre gran- des empresas, ventas y

compras de documentos formales financieros, como bolsa y bonos.

Ventas. Para información de clientes, productos y compras.

Page 9: Tópicos Selectos de Base de Datos

Tópicos Selectos de Base de Datos

Producción. Para la gestión de la cadena de producción y para el seguimiento de

la producción de elementos en las factorías, inventarios de elementos en

almacenes y pedidos de elementos.

Recursos humanos. Para información sobre los empleados, salarios, impuestos y

beneficios, y para la generación de las nóminas.

Como esta lista ilustra, las bases de datos forman una parte esencial de casi

todas las empresas actuales.

1.3 Modelos de Datos

Bajo la estructura de la base de datos se encuentra el modelo de datos: una colección

de herramientas conceptuales para describir los datos, las relaciones, la semántica y

las restricciones de consistencia. Para ilustrar el concepto de un modelo de datos,

describimos dos modelos de datos en este apartado: el modelo entidad- relación y el

modelo relacional. Los diferentes modelos de datos que se han propuesto se clasifican

en tres grupos diferentes:

1. modelos lógicos basados en objetos: Se usan para describir datos en los niveles

conceptual y de visión

2. modelos lógicos basados en registros: Se usan para especificar la estructura

lógica global de la base de datos y para proporcionar una descripción a nivel más

alto de la implementación.

3. modelos físicos: Se usan para describir a los datos en el nivel más bajo, aunque

existen muy pocos modelos de este tipo, básicamente capturan aspectos de la

implementación de los sistemas de base de datos. Existen dos clasificaciones de

este tipo que son: Modelo unificador y Memoria de elementos.

Page 10: Tópicos Selectos de Base de Datos

Tópicos Selectos de Base de Datos

1.4 Niveles de abstracción de una Base de Datos

El SGDB Definido por la arquitectura en tres niveles de abstracciones distintas:

Nivel interno o físico: el más cercano al almacenamiento físico, es decir, tal y

como están almacenados en el ordenador.

Este esquema se especifica con un modelo físico y describe los detalles de cómo

se almacenan físicamente los datos: los archivos que contienen la información,

su organización, los métodos de acceso a los registros, los tipos de registros, la

longitud, los campos que los componen, etcétera.

Nivel externo o de visión: es el más cercano a los usuarios, es decir, es donde se

describen varios esquemas externos o vistas de usuarios. Cada esquema

describe la parte de la BD que interesa a un grupo de usuarios en este nivel se

representa la visión individual de un usuario o de un grupo de usuarios.

Nivel conceptual: describe la estructura de toda la BD para un grupo de usuarios

mediante un esquema conceptual. Este esquema describe las entidades,

atributos, relaciones, operaciones de los usuarios y restricciones, ocultando los

detalles de las estructuras físicas de almacenamiento. Representa la información

contenida en la BD.

Page 11: Tópicos Selectos de Base de Datos

Tópicos Selectos de Base de Datos

Con la arquitectura a tres niveles se introduce el concepto de independencia de datos,

se definen dos tipos de independencia:

Independencia lógica: La capacidad de modificar el esquema conceptual sin

tener que alterar los esquemas externos ni los programas de aplicación. Se

podrá modificar el esquema conceptual para ampliar la BD o para reducirla.

Independencia física: la capacidad de modificar el esquema interno sin tener que

alterar ni el esquema conceptual, ni los externos.

1.5Lenguajes de Base de Datos

Un sistema de bases de datos proporciona un lenguaje de definición de datos para

especificar el esquema de la base de datos y un lenguaje de manipulación de datos

para expresar las consultas a la base de datos y las modificaciones.

El primero se denomina DDL (Data Definition Language) y es el que provee de

los medios necesarios para definir los datos con precisión, especificando las

distintas estructuras.

El segundo se conoce como DML (Data Manipulation/Management Language) y

es el que facilita a los usuarios el acceso y manipulación de los datos.

1.6 Usuarios y administradores de Base de Datos.

Page 12: Tópicos Selectos de Base de Datos

Tópicos Selectos de Base de Datos

Un objetivo principal de un sistema de bases de datos es recuperar información y

almacenar nueva información en la base de datos. Las personas que trabajan con una

base de datos se pueden catalogar como usuarios de bases de datos o como

administradores de bases de datos.

Hay cuatro diferentes tipos de usuarios de un Sistema de Base de Datos, diferenciados

por la forma en que ellos esperan interactuar con el sistema.

1. Programadores de aplicaciones. Son profesionales informáticos que interactúan

con el sistema a través de llamadas del LMD que están incluidas en un programa

escrito en un lenguaje anfitrión (Cobol, Pascal, PL/I, SQL, VB, Java). Estos

programas se llaman programas de aplicación.

2. Usuarios sofisticados . Interactúan con el sistema sin programas escritos. Ellos

forman sus consultas en un lenguaje de consulta de la base de datos. Cada

consulta se envía al procesador de consultas cuya función es transformar

instrucciones LMD a instrucciones que el gestor de almacenamiento entienda.

3. Usuarios especializados. Escriben aplicaciones de BD especializadas que no son

adecuadas en el marco de procesamiento de datos tradicional. Entre estas

aplicaciones están los sistemas de diseño asistido por computadora, sistemas de

bases de conocimientos y expertos y sistemas de modelado del entorno.

4. Usuarios normales (finales). Son usuarios no sofisticados que interactúan con el

sistema mediante la invocación de los programas de aplicación permanentes que

se han escrito previamente.

Page 13: Tópicos Selectos de Base de Datos

Tópicos Selectos de Base de Datos

La persona que tiene este control central sobre el sistema se llama administrador de

la base de datos (ABD). Las funciones del ABD incluyen las siguientes:

Definición del esquema . El ABD crea el esquema original de la base de

datos escribiendo un con- junto de instrucciones de definición de datos en el

LDD.

Definición de la estructura y del método de acceso.

Modificación del esquema y de la organización física. Los ABD realizan

cambios en el esquema y en la organización física para reflejar las

necesidades cambiantes de la organización, o para alterar la organización

física para mejorar el rendimiento.

Concesión de autorización para el acceso a los datos. La concesión de

diferentes tipos de autorización permite al administrador de la base de datos

determinar a qué partes de la base de datos puede acceder cada usuario.

Mantenimiento rutinario.

1.7 Estructuras de un Sistema de Base de Datos

Un sistema de bases de datos se divide en módulos que se encargan de cada una de

las responsabilidades del sistema completo. Los componentes funcionales de un

sistema de bases de datos se pueden dividir a grandes rasgos en los componentes

gestores de almacenamiento y procesador de consultas. El gestor de consultas es

importante porque las bases de datos requieren normalmente una gran cantidad de

espacio de almacenamiento.

Page 14: Tópicos Selectos de Base de Datos

Tópicos Selectos de Base de Datos

1.7.1 Gestor de almacenamiento

Un gestor de almacenamiento es un módulo de programa que proporciona la interfaz

entre los datos de bajo nivel en la base de datos y los programas de aplicación y

consultas emitidas al sistema. El gestor de almacenamiento es responsable de la

interacción con el gestor de archivos.

Los componentes del gestor de almacenamiento incluyen:

Gestor de autorización e integridad

Gestor de transacciones

Gestor de archivos

Gestor de memoria intermedia

El gestor de almacenamiento implementa varias estructuras de datos como parte de la

implementación física del sistema:

Archivos de datos

Diccionario de datos

Índices

1.7.2 Procesador de consultas

Los componentes del procesador de consultas incluyen:

Intérprete del LDD.

Compilador del LMD.

Motor de evaluación de consultas.

Page 15: Tópicos Selectos de Base de Datos

Tópicos Selectos de Base de Datos

2. BASE DE DATOS DISTRIBUIDADAS

Son un grupo de datos que pertenecen a un sistema pero a su vez está repartido entre

ordenadores de una misma red, ya sea a nivel local o cada uno en una diferente

localización geográfica, cada sitio en la red es autónomo en sus capacidades de

procesamiento y es

capaz de realizar

operaciones locales y en

cada uno de estos

ordenadores debe estar

ejecutándose una

aplicación a nivel global

que permita la consulta

de todos los datos como

si se tratase de uno solo.

3 BODEGA DE DATOS (DATA WAREHOUSES)

Un Data Warehouse (DW) es una base de datos que almacena información para la

toma de decisiones. Dicha información es construida a partir de bases de datos que

registran las transacciones de los negocios de la organización (bases operacionales1).

Page 16: Tópicos Selectos de Base de Datos

Tópicos Selectos de Base de Datos

3.1 Objetivo de las Data Werehouses

Registrar información a través del tiempo.

Tener información accesible, entendible, navegable y con buen desempeño.

Tener información consistente. Significa contabilizada y completa.

Información adaptable y elástica. Diseñado para continuos cambios, permite

nuevas preguntas y nuevos datos.

Proteger la información. Permite buena visibilidad sobre el uso de los datos.

Soportar la toma de decisiones.

3.3 Funcionamiento

Un data warehouse se crea al extraer datos desde una o más bases de datos de

aplicaciones operacionales. Los datos extraídos son transformados para eliminar

inconsistencias y resumir si es necesario y luego, cargados en el data warehouse.

El proceso anterior ETL (extracción, transformación y carga), permite crear el

detalle de tiempo variante, resumir y combinar los extractos de datos, ayudando a

crear el ambiente para el acceso a la información Institucional.

Este nuevo enfoque ayuda a

las personas individuales, en

todos los niveles de la

empresa, a efectuar su toma

de decisiones con más

responsabilidad.

Page 17: Tópicos Selectos de Base de Datos

Tópicos Selectos de Base de Datos

La innovación de la Tecnología de Información dentro de un ambiente data

warehouse, puede permitir a cualquier organización hacer un uso más óptimo de los

datos, como un ingrediente clave para un proceso de toma de decisiones más

efectivo.

Las organizaciones tienen que aprovechar sus recursos de información para crear la

información de la operación del negocio, pero deben considerarse las estrategias

tecnológicas necesarias para la implementación de una arquitectura completa de

data warehouse.

4. DATA MARTS

Se define como un almacén de datos especializado, orientado a un tema, integrado,

volátil, y variante en el tiempo para apoyar un subconjunto especifico de decisiones de

administración. La principal diferencia entre una data marts y una data warehouse es

que la primera es especializada y volátil. Hay tres enfoques para la creación de una

data marts:

Los datos pueden ser simplemente extraídos de la data warehouse.

A pesar del hecho de que la data warehouse pretende proporcionar un punto de

control único una data mart puede ser creado todavía en forma independiente

(es decir, no por medio de la extracción a partir de la data warehouse.

Algunas instalaciones han seguido un enfoque de “primero la data mart” donde

estos son creados conforme van siendo necesarios y la data warehouse general

es creada, como una consolidación de los diversos data mart.

Page 18: Tópicos Selectos de Base de Datos

Tópicos Selectos de Base de Datos

5. ETL (EXTRACT, TRANSFORM AND LOAD O “EXTRAER, TRANSFORMAR Y

CARGAR”)

Es el proceso que permite a las

organizaciones mover datos desde

múltiples fuentes, reformatearlos y

limpiarlos, y cargarlos en otra base de

datos, data mart , o data warehouse

para analizar, o en otro sistema

operacional para apoyar un proceso de

negocio.

5.1Descripción de Etapas del

ETL

Extraer: Consiste en obtener los datos desde los sistemas de origen. La mayoría

de los proyectos de almacenamiento de datos fusionan datos provenientes de

diferentes sistemas de origen. Cada sistema separado puede usar una

organización diferente de los datos o formatos distintos. Los formatos de las

fuentes normalmente se encuentran en bases de datos relacionales o ficheros

planos, pero pueden incluir bases de datos no relacionales u otras estructuras

diferentes. La extracción convierte los datos a un formato preparado para iniciar

el proceso de transformación.

Transformar: La fase de transformación aplica una serie de reglas de negocio o

funciones sobre los datos extraídos para convertirlos en datos que serán

Page 19: Tópicos Selectos de Base de Datos

Tópicos Selectos de Base de Datos

cargados. Algunas fuentes de datos requerirán alguna pequeña manipulación de

los datos.

Cargar: Existen dos formas básicas de desarrollar el proceso de carga:

Acumulación simple: Es la más sencilla y común, y consiste en realizar un

resumen de todas las transacciones comprendidas en el período de

tiempo seleccionado y transportar el resultado como una única

transacción hacia el data warehouse, almacenando un valor calculado que

consistirá típicamente en un sumatorio o un promedio de la magnitud

considerada.

Rolling: Se aplica en los casos en que se opta por mantener varios niveles

de granularidad. Para ello se almacena información resumida a distintos

niveles, correspondientes a distintas agrupaciones de la unidad de tiempo

o diferentes niveles jerárquicos en alguna o varias de las dimensiones de

la magnitud almacenada.

6. PROCESAMIENTO ANALITICO EN LINEA ( OLAP)

Page 20: Tópicos Selectos de Base de Datos

Tópicos Selectos de Base de Datos

El término OLAP puede ser definido como el proceso interactivo de crear, mantener,

analizar y elaborar informes sobre datos y es usual añadir que los datos en cuestión

son percibidos y manejados como si estuvieran almacenados en un arreglo

multidimensional. El primer punto, es que el procesamiento analítico requiere

invariablemente, algún tipo de agregación de datos, por lo general en muchas formas

diferentes. Las desventajas de este enfoque son obvias: la formulación de tantas

consultas similares pero distintas, es tediosa para el usuario y la ejecución de todas

esas consultas es probablemente bastante costosa en tiempo de ejecución. Por lo

tanto, debemos encontrar una forma de solicitar varios niveles de agregación en una

sola consulta y ofrecer a la implementación la oportunidad de calcular todas esas

agregaciones de manera más eficiente.

6.1Tipos de OLAP

ROLAP (Procesamiento Analítico OnLine Relacional)

Se constituye y almacena los datos en un motor relacional, su ventaja es su

capacidad de proveer análisis para volúmenes de datos muy grandes.

MOLAP (Procesamiento Analítico Multidimensional OnLine)

Proporciona el análisis mediante la utilización de Bases de Datos

Multidimensionales.

HOLAP (Procesamiento Analítico OnLine Híbrido)

Almacena los datos tanto en motores relacionados como también en Bases de

Datos Multidimensionales.

Page 21: Tópicos Selectos de Base de Datos

Tópicos Selectos de Base de Datos

7. CUBOS (Base de Datos Tridimensionales)

Una dimensión es una clasificación de alguna actividad en una organización por la cual

se puede medir su éxito.

Hay dos clases de dimensiones que se pueden utilizar:

Dimensiones regulares .- Datos que se quieren medir.

Dimensión de medida .- Números que aparecen en el análisis dependiendo de los

elementos seleccionados en las dimensiones regulares.

7.1 Operaciones básicas

Rotar y Rebanar .- Puede cambiar las dimensiones

del cubo que está viendo y obtener una nueva

vista de información.

Taladrar .- Los datos de las dimensiones

se pueden abrir para obtener más detalle.

Page 22: Tópicos Selectos de Base de Datos

Tópicos Selectos de Base de Datos

8. MINERIA DE DATOS (DM, DATA MINING)

Consiste en la extracción no trivial de información que reside de manera implícita en los

datos. Dicha información era previamente desconocida y podrá resultar útil para algún

proceso. En otras palabras, la minería de datos prepara, sondea y explora los datos

para sacar la información oculta en ellos. Tiene como objetivo encontrar patrones de

comportamiento ocultas en los mismos con el fin de crear nuevas asociaciones,

predecir resultados futuros.

8.1 Tareas principales de las minerías de datos

Análisis de dependencias.

Identificación de clases (agrupamiento de registros en clases).

Descripción de conceptos.

Detección de desviaciones, casos extremos o anomalías.

8.2 Técnicas de la minería de datos

Árboles de decisión y reglas de clasificación

Métodos de clasificación y regresiones no-lineales

Métodos basados en ejemplos prototípicos

Modelos gráficos de dependencias probabilísticas

Modelos relacionales

Page 23: Tópicos Selectos de Base de Datos

Tópicos Selectos de Base de Datos

9. BUSINESS INTELLIGENCE (BI)

Business Intelligence surge para aprovechar toda la información operacional y

convertirla en información estratégica, útil para tomar decisiones de negocio. Por

ejemplo los datos operacionales de una simple aplicación de facturación contienen

información muy valiosa, que puede ayudar a tomar el pulso de la empresa y a llevar a

cabo decisiones de negocio.

10.SISTEMAS MANEJADORES DE BASE DE DATOS (BUSQUEDAS)

Los sistemas manejadores de bases de datos conocidos también como bases de datos

electrónicas, se usan ampliamente para: organizar y manipular grandes volúmenes de

datos de las empresas. Un sistema manejador de base de datos no es más que un

sistema computarizado para llevar registros.

Algunas de las facilidades que proporciona el sistema a los usuarios son:

• Agregar nuevos archivos a la base de datos.

• Agregar nuevos registros a los archivos existentes.

• Recuperación de datos.

• Actualización de datos.

• Borrar registros.

• Borrar archivos.

• Proporcionar los mecanismos para el control del acceso concurrente a los

datos.

Una base de datos es una colección de información útil organizada en una manera

específica.

Page 24: Tópicos Selectos de Base de Datos

Tópicos Selectos de Base de Datos

10.1 Búsqueda secuencial

Este tipo de búsqueda se le conoce como búsqueda secuencial y es la única alternativa

de búsqueda cuando los datos no están ordenados y no se cuenta con estructuras

auxiliares.

10.2 Búsqueda binaria

La ventaja de la búsqueda binaria es que en cada operación el tamaño del problema se

reduce a la mitad.

10.3 Búsqueda indexada

El inconveniente de utilizar una búsqueda binaria es que al hacer altas, bajas y cambios

sobre una tabla ordenada, tenemos que organizar los datos para que se mantengan

ordenados, y esto podría tomar mucho tiempo. Ante este problema una alternativa es la

utilización de un índice (similar al de la parte final de un libro) que contenga el nombre

de la persona y un apuntador a dónde está el elemento dentro de la tabla. Como puede

notarse, los datos en la tabla podrán estar físicamente desordenados, pero a través del

índice se ven lógicamente ordenados.

Page 25: Tópicos Selectos de Base de Datos

Tópicos Selectos de Base de Datos

Conclusión

En esta investigación aprendimos los diferentes tipos de Base de Datos que existen

para ellos conocimos que un tópico es una idea o un tema en específico, en este caso

bases de datos, así que resumiremos los tópicos más importantes, o selectos de bases

de datos.

Comprendimos que la base de datos es una biblioteca donde ha de mantener listas de

los libros que posee, de los usuarios que tiene de sus productos, ventas y empleados.

También conocimos que un gestor de base de datos es un programa que permite

introducir y almacenar datos, ordenarlos y manipularlos.

Organizarlos de manera significativa para que se pueda obtener información no visible

como totales, tendencias o relaciones de otro tipo. Un programa de base de datos

almacena la información que introducimos en forma de tablas. A esta forma de

organizar la base de datos mediante distintas tablas relacionadas por campos comunes

se le llama base de datos relacional.

No todos los programas de gestión de base de datos tienen esta capacidad de manejar

bases de datos relacionales, por eso, antes de elegir uno deberemos considerar si

necesitamos o no esta capacidad.

Podemos comprender de igual manera que una base de datos debe permitir tres cosas

básicas de un gestor de base de datos son: introducir datos, almacenarlos y

recuperarlos.

Al mismo tiempo permiten otra serie de funciones que hacen de ellos herramientas

incomparablemente superiores a los métodos tradicionales de almacenamiento de

datos.

Page 26: Tópicos Selectos de Base de Datos

Tópicos Selectos de Base de Datos

 Cualquier gestor debe permitir ordenar los datos, realizar búsquedas, mostrar distintas

vistas de los datos, realizar cálculos sobre ellos, resumirlos, generar informes a partir de

ellos, importarlos y exportarlos.

Page 27: Tópicos Selectos de Base de Datos

Tópicos Selectos de Base de Datos

Referencias

Libro Digital: Fundamentos de bases de datos (4ta edición) Abraham Silberschatz, Bell

Laboratories, Henry F. Korth, Bell Laboratories, S. Sudarshan, Instituto Indio de

Tecnología, Bombay.

Cruz, M. (10 de Septiembre de 2006). Ingeniería Industrial.

López, J. (17 de Julio de 2005). Danysoft.

Madruga, P. M. (05 de Abril de 2006). Sistema de Gestores de Base de Datos. Obtenido de

http://www.mcgraw-hill.es/bcv/guide/capitulo/8448148797.pdf

Medina, P. M. (26 de Enero de 2011). Universidad Politécnica de Puebla. Obtenido de

http://informatica.uppuebla.edu.mx/~mmedina/tsbd/disBDD.pdf

Pérez, S., & Fernández, N. (29 de Junio de 2006). UTN.

Silberschatz, A., & Korth, H. (2002). Fundamentos de Base de Datos. Aravaca, España: McGraw

Hill.


Recommended