Date post: | 02-Jun-2015 |
Category: |
Technology |
Upload: | brenda-uscanga |
View: | 315 times |
Download: | 0 times |
EQUIPO 5:
CANO MULATO CARLOS FABIÁNNIÑO SUAREZ VERÓNICAUSCANGA COLUNGA BRENDA YURIDIAUTRERA GUEVARA ERICK DE JESÚS
INTEGRACIÓN DE LA INFORMACIÓN
Visión General del Ejecutivo Integración de datos es la primera forma de integración. La información de la empresa se
consolidó en forma de almacenes de datos, los datamarts, y almacenes de datos
operacionales. Si bien estas fuentes de datos físicos consolidados siguen siendo
importantes para las organizaciones, en tiempo real de las tecnologías de integración se
convirtió en muchas más atractivas soluciones.
Integración de datos ha madurado de manera espectacular en los últimos años, en el pasado
fue un punto a punto solución, estrictamente centradas sobre el traslado de bloques de
información de un sistema a otro. Con el movimiento en tiempo real, haciendo hincapié en
la importancia de los metadatos y la necesidad de integrar todas las formas de contenido,
nos encontramos con que la integración de datos es un subconjunto de la mayor área de
integración de la información. En aras de la claridad, definimos el sentido de integración
de datos estructurados, gestionado por bases de datos. Integración de la información
incluye tanto datos estructurados y la información no estructurada como documentos,
gráficos de medios de comunicación.
La integración de datos ha sido por las herramientas ETL. Eran crear un
extracto de la información, transformarla en una visión consolidada y, a
continuación, carga en un almacén de datos en modo de lotes. Para
sincronizar datos a través de sistemas operativos, almacenes de datos
operacionales se han creado la actualización en tiempo real de
información.
Pero el problema con cada una de estas soluciones es la necesidad de
mover físicamente grandes volúmenes de datos procedentes de
sistemas de fuente de múltiples datos consolidados como a los datos
almacenados almacén, datos distribuidos, almacenes de datos
operativos, bases de datos y de análisis multidimensional. Latencias y
contradicciones son mucho más con un determinado tal arquitectura.
La Empresa de Integración de Aplicación (EAI) resolvió el problema de
latencia en la sincronización de los cambios a través de sistemas en
tiempo real, pero menos adecuada a las necesidades y la
consolidación de la agregación de datos y la información en toda la
empresa.
Los mapas de datos de EAI permiten intercambios de datos entre
sistemas, pero no se define una vista agregada de los datos objeto o
entidades comerciales. Sin embargo, un representante de servicio al
cliente quiere ser capaz de hacer una pregunta sobre el cliente, y han
llegado a representar el adecuado sistema sin necesidad de saber qué.
Esto requiere la capacidad de realizar una consulta a través de fuentes
de datos distribuidos que fueron base de datos única.
La Empresa de integración de la información (Ell) es a la vez una antigua y la nueva
idea que proporciona los datos agregados de las antiguas capacidades de
herramientas ETL, pero proporciona acceso en tiempo real a información
precisa, como EAI. También proporciona una infraestructura de gestión de datos
integrada de la empresa. Con EAI, el significado semántico de los datos, la
información corporativa necesaria para la empresa de gestión de la calidad de
los datos se encuentra en las herramientas de mapeo de propiedad. Estas
herramientas están diseñadas para hacer más fácil a los formatos de datos
entre aplicaciones. No fueron diseñados para proporcionar gestión de la
información.
La otra inevitable necesidad de integrar y gestionar información no estructurada.
Documentos, correos electrónicos, gráficos, multimedia, y otros tipos de datos
electrónicos podrían incluirse en aplicaciones Web.
Selección de Integración de Tecnología de la Información
Actualmente, la mayor parte de estas tecnologías no son diferentes de
integración y que cada uno proporciona redundancia y la
superposición de servicios, incluidos los adaptadores de aplicación y
los repositorios de metadatos. Si bien la elección actual de la
tecnología hace que sea imposible evitar la redundancia, un
repositorio de metadatos de la empresa pasará a lo largo de manera
rápida lo que permite la integración de la información en el futuro.
Las empresas debe comenzar la captura de metadatos acerca de las
soluciones integradas en un formato común por lo que esta
información se puede aprovechar y reutilizar en el futuro. Dejando de
esta información en herramientas de mapeo de datos de propiedad
limita la agilidad de negocio.
ETL
Herramientas ETL están ampliamente disponibles, aunque
no existen. Cada producto tiene un ambiente diferente
en el que sobresale, la mayoría debe cumplir muy bien
con las modernas bases de datos relacionales, existen
diferencias muy reales en lo que respecta a los productos
en que los sistemas que apoyen en un entorno
mainframe. p
Además, la integración con las aplicaciones empaquetadas
serán diferentes entre las ofertas. Las herramientas ETL
tienden a ser independiente y orientado a los lotes, y se
centran en el almacén de datos de mercado.
EIILa EII es sólo un mercado emergente. El foco de las
herramientas en este mercado es el acceso a la información
en tiempo real a través de múltiples sistemas de
información.
El corazón de estas soluciones es un repositorio de metadatos
que contiene las definiciones de datos para todos los
sistemas existentes, así como los mecanismos de acceso
para recuperar la información. En la mayoría de los casos,
estas son las entregas en un solo sentido de la información.
Sin embargo, las nuevas implementaciones son las dos vías
de integración.
EIILa otra característica de una herramienta EII es la agregación de
datos de servicio que permite a las nuevas estructuras de datos
crearse a partir de las estructuras existentes. El linaje de datos
del impacto de informes y permite que el sistema para
garantizar que los cambios que pueden evaluarse y gestionarse
a los sistemas existentes.
XML y servicios Web se están convirtiendo rápidamente en las
normas en que se basan estos productos. El Caso de Estudio
11.1 analiza el caso de CompuCredit para examinar los
beneficios empresariales de un enfoque EII (CIO Magazine,
2003).
Caso de Estudio 11. 1 CompuCredtt: Creación de una Empresa de Arquitectura de Datos
En el Caso de Estudio 3.1 en que presentó CompuCredit para ilustrar una organización que
ejecuta una estrategia para hacer que la información esté más fácilmente disponible
para sus usuarios a reducir el análisis de tiempo de meses a semanas. La estrategia de
integración se basa en un patrón de diseño que combina la integración de datos con un
repositorio de metadatos de la empresa (EMR). Las normas son un elemento clave para
la selección de un socio.
XML y servicios web son un factor crítico en la arquitectura y el diseño. La integración de
datos EMR, y las normas fueron combinadas para formar CompuCredlt XML Gateway. La
puerta de enlace XML proporcionado un acceso transparente a la diversidad interna y
externa de fuentes de datos y aplicaciones que son necesarias para reducir el tiempo y
el esfuerzo para adquirir y gestionar el cobro de tarjetas de crédito carteras que están
en el corazón de la empresa.
ECM La mayoría de las organizaciones gastan su dinero en
la gestión de su información estructurada, mientras que la gran cantidad de su información no estructurada es almacenada en discos duros de las computadoras sin ningún tipo de mecanismo para encontrar esta información y la reutilización. El mercado de ECM se orienta a proporcionar soluciones para resolver este problema. No hay ningún producto aceptable común o las normas bajo las cuales estas se desarrollan.
Las arquitecturas suelen utilizar la misma solicitud de integración de componentes de acceso a la información en diferentes plataformas y sistemas. El Caso de Estudio 11.2 examina cómo el Estado de Dakota del Norte aplican un enfoque de ECM para ayudar a sus legislar (Software AG n.d.).
Caso de Estudio 11.2Estado de Dakota del Norte: La sustitución de los volúmenes de papel con la instantánea, el acceso en línea a Bill información
La Legislatura del Estado de Dakota del Norte se reúne cada dos años para aprobar o modificar cientos de
proyectos de ley en un período de sesiones de 80 días. Este es un papel intenso, donde tradicionalmente
un legislador habría un período de dos pies de largo de la carpeta de rodadura de ley libros, con resmas
de información adicional en la oficina. El acceso central de a los proyectos de ley que estaba disponible,
pero no resulta práctico para muchos miembros del personal.
Su contenido es proporcionado a los mismos de una manera integrada con características adicionales, como
el calendario y el correo electrónico, así como otros contenidos de sistemas heredados, como el período
de sesiones y horarios de audiencia de las comparaciones, las transcripciones de las llamadas telefónicas
constituyente, y las votaciones nominales de cada cámara.
Una estrategia de integración de información basada en un modelo de gestión de contenidos empresariales
es el enfoque arquitectónico más relevante dada la necesidad de proporcionar información estructurada
y no estructurada en tiempo real de múltiples fuentes en una visión integrada para los usuarios y las
aplicaciones de usuario.
Especificación de la Aplicación de Integración de Información
Introducción
Esta especificación proporciona orientaciones para la aplicación para el desarrollo de una solución basada en la integración de la información.
Esta sección describe los problemas técnicos específicos que se están abordando en el contexto de dar aplicación a la aplicación concreta.
Especificación de la Aplicación de Integración de Información
Ámbito de Aplicación
El ámbito de aplicación de una especificación de Integración de Información se limita a la especificación de la información y sistemas que se están integrando. Debe referirse a las organizaciones, la información, sistemas, y el resultado final esperado.
Especificación de la Aplicación de Integración de Información
Principales Participantes
Esta sección identifica todas las partes interesadas en la aplicación, incluidos los directivos de las empresas que controlan la totalidad o parte de los sistemas, administradores de datos o los responsables de la calidad de los datos, diseñadores de sistemas y arquitecto (s), y el equipo de desarrollo que ejecutará la aplicación. Todos los demás participantes o interesados también deben ser identificados, entre ellos sus funciones.
Especificación de la Aplicación de Integración de Información
Patrones de Integración de Información y Servicios
Hay varios patrones básicos de aplicación para la solución de integración de la información. Estos patrones son la integración de la información:
Integración de Datos. Integración de contenido no estructurado. Repositorio de Metadatos de Integración.
En esta sección se definen el patrón que se utiliza y proporciona detalles sobre la configuración de los componentes específicos de la aplicación.
Especificación de la Aplicación de Integración de Información
Integración de Datos
Implica la integración de datos estructurados de datos, generalmente se encuentran en diferentes bases de datos en toda la organización. Como se ha indicado anteriormente, las soluciones ETL han dado lugar a tiempo real de integración de información empresarial (EII).
La Arquitectura de Integración de Datos de Referencia (Figura
11-1) muestra los servicios opcionales y para la integración
de datos.
El servicio de consulta representa la posibilidad de acceder a
diferentes fuentes de datos como si se tratara de una única
base de datos (incluyendo la capacidad de hacer una sola
llamada a través de bases de datos SQL) y el apoyo en
tiempo real y consolidado de consultas de datos federadas.
La indexación y almacenamiento en caché representa los
métodos que permitan a las preguntas rápidas en tiempo
real. Las opiniones representan la capacidad de crear
diferentes vistas virtuales de la información consolidada para
simplificar el acceso y apoyo a los usuarios o aplicaciones
específicas.
EI repositorio de metadatos almacena toda la información
pertinente acerca de los objetos de datos. Traducción y
transformación de datos es necesaria para la información del
mapa en la cuenta de ver y hacer cambios a las fuentes.
Limpieza de datos, a menudo parte de un almacén de datos, es
muy importante para mantener la exactitud de la integración de
datos.
La replicación y sincronización de datos ha estado disponible para
los proveedores de la base de datos de un tiempo, y es un
servicio muy útil para la integración de datos. La capa de acceso
a la fuente de datos incluye los adaptadores de aplicación y la
base de datos, tales como puertas de enlace ODBC y JDBC.
Tabla de Aplicación (Figura 11-2, página 224) se especifican todos los servicios de integración en la Arquitectura
de Integración de Información, junto con los detalles de implementación.
Servicio de Integración Vendedor / Producto Notas de la Implementación
Herramienta de integración de datos < Nombre del vendedor /
Nombre del producto >
< Módulos desplegados, el método, (PP virtual, del segmento
de las fuentes de datos, indexación y recuperación) >
EII < Nombre del vendedor /
Nombre del producto >
<Módulos desplegados >
Traducción y la transformación < vendedor de nombre / nombre de producto en
caso de ser diferente del vendedor EII >
Formatos soportados
Fuente de datos de acceso < vendedor de nombre / nombre de producto en
caso de ser diferente del vendedor EII >
< ODBC, JDBC, SOAP, otros métodos de apoyo>
Repositorio de metadatos < vendedor de nombre / nombre de producto en
caso de ser diferente del vendedor EII >
<Tecnología DBMS >
Consulta < vendedor de nombre / nombre de producto en
caso de ser diferente del vendedor EII >
< Una responsabilidad de la empresa información consulta la
red como una sola fuente de datos. Definir lenguaje o método>
Vistas < vendedor de nombre / nombre de producto en
caso de ser diferente del vendedor EII >
<Lista de vistas disponibles para simplificar el uso para
aplicaciones específicas o usuarios>
Servicio de Integración Vendedor / Producto Notas de la ImplementaciónLimpieza de Datos < Nombre del Vendedor /
Nombre del Producto>
<Realizada por la herramienta >
Replicación / sincronización de datos < Nombre del Vendedor /
Nombre del Producto >
< Parte del DB o EII servidor>
Gestión de transacciones < vendedor de nombre / nombre de producto en
caso de ser diferente del vendedor EII >
<Definir o reducir la indemnización>
Seguridad <Vendedor nombre / nombre de producto en caso de
3 ° Parte secutiry vendedor utilizados>
<Métodos y el nivel de seguridad que ofrece>
Integración de Contenido No Estructurado
Si bien la integración de datos proporciona acceso integrado a información en bases de
datos, hay una gran cantidad de datos no estructurados que todos tiene que ser
integrada con portales web y aplicaciones, incluidos documentos, imágenes, fotos,
audio, vídeo y otros medios digitales. Esta información no estructurada exige la misma
capacidad de gestión y consulta de información estructurada como la gestión y la
integración.
El. Servicios prestados por las soluciones de ECM (Figura 11 -3, página 225) incluye
tienda repositorio, de búsqueda (consulta) la capacidad, control de versiones (check-in
/ out), la replicación de los cambios en los contenidos, la integración, el contenido de la
prestación (traducción / transformación), la seguridad, la gestión de procesos, y la
entrega de contenido. La futura dirección es tener tantos datos estructurados y no
estructurados y gestionados a través de una herramienta. Ell Algunos proveedores ya
ofrecen.
El cuadro de información no estructurada (Figura 11-
4, página 226) Detalles de la aplicación. Todos los
servicios pueden provenir de un único proveedor
de ECM, o de una combinación de proveedores.
Proveedores de ECM suelen tener múltiples módulos
y capacidades que pueden ser desplegadas con
flexibilidad, de modo que incluso cuando se utiliza
un único proveedor, es útil para especificar los
servicios o módulos de aplicación.
Integración de Servicios Vendedor / Producto Notas de Implementación
ECM <Nombre del Vendedor / Nombre del Producto>
< Módulos Desplegados>
Renderizado (traducción y transformación) <Nombre del proveedor / nombre de producto diferentes, si los proveedores de ECM>
<Formatos, incluyendo HTML, MS Word, MS Excel, TIFF, JPEG>
Repositorio de contenidos <Nombre del proveedor / nombre de producto diferentes, si los proveedores de ECM>
<Tipos de contenido apoyado incluidos documentos, imágenes, fotos, audio y vídeo>
Metadatos <Tipos de metadatos de apoyo incluyendo descripciones miniaturas, palabras clave, común de gestión de la información de metadatos>
Capacidades de consulta <Capacidad de consulta de los diferentes tipos de contenido con un método común; texto completo de consulta; texto escaneado consulta>
Objetos de Contenido / contenedores (vistas) <Definir el contenido de objetos que contienen otros objetos de contenido, por ejemplo página Web>
Contenido de propagación <Capacidad para propagar los cambios a través de una variedad de fuentes para asegurar el contenido se sincroniza>
Gestión de Procesos <Nombre del proveedor / nombre de producto diferentes, si los proveedores de ECM>
<Módulos desplegados, incluyendo el modelado, la gestión de escritorio, etc>
Seguridad <Nombre del proveedor / nombre de producto en caso de 3 ° parte de proveedores de seguridad utilizados>
<Modelo y el nivel de seguridad que ofrece>
repositorios de metadatos de Integración
Repositorios de metadatos son a menudo parte de los EII y soluciones ECM.
Sin embargo, también se enumeran por separado aquí para llamar la
atención sobre su importancia y al hecho de que la información de
metadatos común es una parte esencial de la integración de infraestructura.
Un depósito de metadatos, es esencialmente una base de datos que contiene
información sobre fuentes de datos (véase el Capítulo 8 para obtener más
información acerca de los metadatos). Lamentablemente, gran parte la
integración de metadatos está enterrado en las herramientas de propiedad.
Con el fin de maximizar la reutilización y el negocio y la agilidad, los metadatos
deben ser administrados constantemente empresa como un valioso recurso.
Repositorio de metadatos de la empresa contiene todos los
metadatos de la información y la aplicación de fuentes.
Una contiene el repositorio de metadatos de mecanismos
de acceso también. El repositorio de metadatos también
contiene nuevas descripciones de metadatos, como el
formato canónico, que pueden asignarse a la fuente de
los metadatos, ya sea directamente o transformación o la
aplicación de normas de cálculo.
Adaptadores de integración u otras tecnologías, incluida la
base de datos y portales de servicios Web entrelaza, se
utilizan para conectarse a las fuentes existentes.
Porque Ell y soluciones ECM podría tener cada uno sus propios metadatos
repositorios, una empresa podría cerrar con múltiples repositorios para la
gestión, y los metadatos que necesita ser integrada y sincronizada.
En principio, el depósito de metadatos, debe proporcionar un nivel de
abstracción que hace que sea más fácil de consolidar, integrar y administrar
información distribuida. En la práctica, la empresa puede crear una
necesidad de varios niveles de arquitectura de metadatos para proporcionar
los niveles de abstracción necesarios para prestar esta agilidad.
El diagrama de la arquitectura y la especificación de mesa deben incluir todos
los metadatos fuentes. Figura 11-5 (página 228) muestra cómo un depósito
de metadatos, la empresa trabajará con EII y de soluciones ECM para facilitar
el acceso a diferentes tipos de información empresarial..
El repositorio de metadatos de aplicación el cuadro (Figura 11a-6o, página 229) define los servicios esenciales de apoyo en tiempo real de acceso a datos distribuidos
Integración de Servicios Vendedor / Producto Notas de la Implementación
Repositorio de Metadatos <Nombre del Vendedor / Nombre del Producto>
<Tipos de contenido apoyado incluidos documentos, imágenes, fotos, audio y vídeo>
Formato Adecuado <XML, de propiedad, otros>Traducción y transformación / formato de la prestación
<Nombre del Vendedor / Nombre del Producto>
<Formato, incluyendo XML, otros formatos de datos, HTML, PDF, MS Word, MS Excel, TIPP, JPEG>
Capacidades de consulta <Idioma (s) Soportados> <SQL; palabra clave de búsqueda, texto completo de consulta, otros>
Capacidades de acceso <Nombre del Vendedor / Nombre del Producto>
<Puerta de enlace, o API de la base de datos, otros>
Réplica <Nombre del Vendedor / Nombre del Producto>
<Mecanismo para la sincronización de los cambios a través de fuentes>
Seguridad <Nombre del proveedor / nombre de producto en caso de 3 ° parte de proveedores de seguridad utilizados>
<Modelo y el nivel de seguridad que ofrece>
Figura 11-6 Tabla de Implementación del Repositorio de Metadatos.
Buenas Prácticas en la Integración de Información
Crear un EMR. Crear un repositorio de metadatos de la empresa que proporciona
información sobre los diferentes tipos de fuentes de información empresarial.
Organizar un "centro de excelencia". Crear una empresa de integración de
competencias centro. La creación de los metadatos repositorio incremental, un
proyecto por proyecto, funcionará bien siempre y cuando un grupo de gestión
centralizada de forma superposiciones e incoherencias pueden ser rápidamente
identificados y resueltos.
Centrarse en la calidad de los datos. Nombrar a los delegados sindicales la
información que son responsables de la calidad de los datos en sistemas de código.
La información de monitores también son responsables de participar en el diseño de
evaluación y garantizar el significado semántico de los datos está asignada
correctamente al formato canónico.
Identificar las "normas de oro" para los datos. Crear
una empresa de arquitectura de la información que
incluye información sobre las fuentes de registro
(autorizada, fuentes de datos) para cada entidad de
negocios que debe ser coherente en toda la empresa.
Garantizar la existencia de pruebas se logra. Crear un
plan de prueba para asegurarse de que las consultas
a una vista de datos consolidada volverán respuestas
correctas.