+ All Categories
Home > Documents > FRAMEWORK PARA EL DESARROLLO DE ARQUITECTURAS DE ...

FRAMEWORK PARA EL DESARROLLO DE ARQUITECTURAS DE ...

Date post: 05-Jan-2022
Category:
Upload: others
View: 0 times
Download: 0 times
Share this document with a friend
287
FRAMEWORK PARA EL DESARROLLO DE ARQUITECTURAS DE INFORMACION EN UN CONTEXTO DE ARQUITECTURA EMPRESARIAL NIXON ALONSO DUARTE ACOSTA UNIVERSIDAD DE LOS ANDES FACULTAD DE INGENIERIA, DEPARTAMENTO DE INGENIERIA DE SISTEMAS Y COMPUTACION MAESTRIA EN INGENIERIA DE SISTEMAS Y COMPUTACION BOGOTA, DC JULIO 2012
Transcript

FRAMEWORK PARA EL DESARROLLO DE ARQUITECTURAS DE

INFORMACION EN UN CONTEXTO DE ARQUITECTURA

EMPRESARIAL

NIXON ALONSO DUARTE ACOSTA

UNIVERSIDAD DE LOS ANDES

FACULTAD DE INGENIERIA, DEPARTAMENTO DE INGENIERIA DE

SISTEMAS Y COMPUTACION

MAESTRIA EN INGENIERIA DE SISTEMAS Y COMPUTACION

BOGOTA, DC

JULIO 2012

FRAMEWORK PARA EL DESARROLLO DE ARQUITECTURAS DE

INFORMACION EN UN CONTEXTO DE ARQUITECTURA EMPRESARIAL

NIXON ALONSO DUARTE ACOSTA

Documento de tesis presentado como requisito parcial para el grado de:

MAESTRIA EN INGENIERIA DE SISTEMAS Y COMPUTACION

Director: Profesor Asociado, PhD. José Abasolo

UNIVERSIDAD DE LOS ANDES

FACULTAD DE INGENIERIA, DEPARTAMENTO DE INGENIERIA DE

SISTEMAS Y COMPUTACION

MAESTRIA EN INGENIERIA DE SISTEMAS Y COMPUTACION

BOGOTA, DC

JULIO 2012

AGRADECIMIENTOS

A Dios y María santísima que me permitieron realizar este estudio de maestría.

A mi esposa Yenny, mis hijos Verónica y Samuel que son mi inspiración, y por

brindarme su apoyo, tolerancia y comprensión durante largas horas de estudio.

Al PhD. José Abasolo, por su confianza y asesoría durante el desarrollo de este

interesante e importante tema.

TABLA DE CONTENIDO

1. INTRODUCCION ..................................................................................... 12

1.1 Justificación ........................................................................................... 14

1.2 Objetivo general ..................................................................................... 15

1.3 Objetivos específicos ............................................................................ 15

1.4 Alcance ................................................................................................... 16

1.5 Estructura del documento..................................................................... 17

2. ESTADO DEL ARTE ............................................................................... 19

2.1 Enfoques de arquitectura empresarial ................................................. 19

2.1.1 Zachman .......................................................................................... 20

2.1.1.1 Las perspectivas ......................................................................... 21

2.1.1.2 Las dimensiones ......................................................................... 22

2.1.1.3 Zachman y la arquitectura de datos ............................................ 23

2.1.2 Framework de arquitectura empresarial federal ........................... 24

2.1.3 TOGAF (The Open Group Architecture Framework) ..................... 30

2.1.3.1 El Ciclo ADM............................................................................... 31

2.1.3.2 Alcance ....................................................................................... 36

2.1.3.3 División de Arquitecturas ............................................................ 39

2.1.3.4 Principios de Datos ..................................................................... 40

2.1.3.5 TOGAF y La Arquitectura de Datos ............................................ 41

2.1.4 Arquitectura de información empresarial según [1] ..................... 44

2.1.4.1 Principios de arquitectura de información ................................... 45

2.1.4.2 Dominios de datos ...................................................................... 45

2.1.4.3 AIE y la arquitectura de datos ..................................................... 60

2.1.5 Análisis ............................................................................................ 61

2.2 GOBIERNO DE DATOS .......................................................................... 63

2.2.1 Diseñando gobierno de datos por Vijay Khatri y Carol V. Brown 63

2.2.1.1 Principios de datos ..................................................................... 65

2.2.1.2 Calidad de los datos ................................................................... 65

2.2.1.3 Metadatos ................................................................................... 65

2.2.1.4 Acceso a Datos ........................................................................... 66

2.2.1.5 Ciclo de Vida de los Datos .......................................................... 66

2.2.2 El proceso unificado de gobierno de datos de IBM ...................... 66

2.2.3 Gobierno de datos: ¿Qué funciona y que no? por Rob Karel ...... 72

2.2.3.1 Catalizadores de Gobierno de Datos .......................................... 73

2.2.3.2 Framework de gobierno de datos................................................ 73

2.2.3.3 Inhibidores de la Adopción de un Gobierno de Datos ................. 73

2.2.3.4 Preparación del gobierno de datos ............................................. 74

2.2.3.5 Diseñe el gobierno basado en la cultura de la empresa .............. 74

2.2.4 Análisis ............................................................................................ 76

3. FRAMEWORK DE ARQUITECTURA DE INFORMACION EN UN

CONTEXTO DE ARQUITECTURA EMPRESARIAL (FAI) ................................... 78

3.1 Elementos estructurales del framework .............................................. 80

3.1.1 Repositorio de recursos ................................................................. 81

3.1.2 Metodologías ................................................................................... 83

3.1.3 Repositorio de arquitectura ............................................................ 83

3.2 Metodologías ......................................................................................... 84

3.2.1 Guía Metodológica para el proyecto inicial ................................... 84

3.2.1.1 Elementos estructurales ............................................................. 85

3.2.1.2 Desarrollo metodológico ............................................................. 86

3.2.2 Guía metodológica para gobierno de datos ................................ 127

3.2.2.1 Preparación .............................................................................. 129

3.2.2.2 Diseño ...................................................................................... 129

3.2.2.3 Evaluación de Madurez ............................................................ 130

3.2.2.4 Mapa de proyectos ................................................................... 131

3.2.2.5 Modelo Organizacional ............................................................. 131

3.2.2.6 Definir Métricas ......................................................................... 132

3.2.2.7 Gobierno de datos maestros ..................................................... 133

3.2.2.8 Gobierno de análisis ................................................................. 133

3.2.2.9 Gestionar la seguridad y privacidad .......................................... 133

3.2.2.10 Medir Resultados ...................................................................... 134

4 APLICACIÓN DE LA GUIA METODOLOGICA PARA EL PROYECTO

INICIAL DE ARQUITECTURA DE INFORMACION EN LA ADMINISTRADORA

COLOMBIANA DE PENSIONES COLPENSIONES .......................................... 135

4.1 ETAPA 1: PREPARACION ................................................................... 136

4.1.1 Conociendo la organización - COLPENSIONES.......................... 136

4.1.2 Grupos de apoyo ........................................................................... 146

4.1.3 Modelos de referencia .................................................................. 147

4.1.4 Alcance de la arquitectura de información.................................. 147

4.1.5 Herramientas y técnicas ............................................................... 148

4.2 ESTADO ACTUAL DE ARQUITECTURA DE INFORMACION ............. 148

4.2.1 Entrevistas ..................................................................................... 149

4.2.2 Entidades de negocio ................................................................... 149

4.2.3 Modelo conceptual ........................................................................ 156

4.2.4 Análisis del estado actual de la AI ............................................... 157

4.2.4.1 Análisis de fuentes de datos ..................................................... 157

4.2.4.2 Gobierno de datos .................................................................... 174

4.2.4.3 Análisis de la Información ......................................................... 176

4.3 ESTADO DESEADO DE ARQUITECTURA DE INFORMACION .......... 240

4.3.1 Blueprint de arquitectura de información.................................... 241

4.4 MAPA DE PROYECTOS ....................................................................... 256

4.4.1 Definición de proyectos ................................................................ 256

4.4.2 Priorización de proyectos ............................................................. 258

5 CONCLUSIONES Y TRABAJO FUTURO ............................................. 260

5.1 CONCLUSIONES DEL TRABAJO REALIZADO .................................. 260

5.2 TRABAJO FUTURO ............................................................................. 262

6 BIBLIOGRAFIA ..................................................................................... 263

ANEXOS ............................................................................................................ 267

TABLA DE PLANTILLAS

Plantilla 1. Procesos vs Entidades ...................................................................... 104

Plantilla 2. Descripción de una entidad de negocio [23] ...................................... 107

Plantilla 3. Inventario de Fuentes de Datos [23] .................................................. 109

Plantilla 4.Entidades de Negocio vs Fuentes de Datos [23] ................................ 110

Plantilla 5. Estado actual de gobierno de datos .................................................. 112

Plantilla 6. Matriz de consolidación de brecha, soluciones dependencias [16] ... 124

Plantilla 7. Definición incremental de arquitectura [16] ....................................... 125

Plantilla 8. Descripción de hallazgo [23] .............................................................. 275

Plantilla 9. Indicadores de calidad de datos [23] ................................................. 275

Plantilla 10. Mediciones de los indicadores de calidad [23] ................................. 276

Plantilla 11. Calculo de Indicadores [23] ............................................................. 277

Plantilla 12. Diagnóstico de calidad [23] .............................................................. 277

TABLA DE FIGURAS

Figura 1. Marco de Referencia de Zachman ......................................................... 21

Figura 2. DRM Áreas de estandarización [35] ....................................................... 27

Figura 3. Contexto de los datos [34] ..................................................................... 28

Figura 4. Descripción de los datos [34] ................................................................. 28

Figura 5. Compartir Datos [34] .............................................................................. 29

Figura 6. Marco de implementación de DRM ....................................................... 29

Figura 7. Arquitectura Empresarial según TOGAF [14] ......................................... 30

Figura 8. El ciclo ADM [16] ................................................................................... 32

Figura 9. Desarrollo incremental de la arquitectura [16] ........................................ 38

Figura 10. Dominios de datos [1] .......................................................................... 46

Figura 11. Modelo de madurez de metadatos [1] .................................................. 47

Figura 12. Representación de la misma persona en diferentes contextos de

aplicación [21] ....................................................................................................... 54

Figura 13. Sistema central de datos maestros [21] ............................................... 56

Figura 14. Sistema maestro principal [21] ............................................................. 57

Figura 15. Repositorio principal ............................................................................ 58

Figura 16. Visión general del proceso unificado de gobierno de datos de IBM ..... 67

Figura 17. Roles y responsabilidades [22] ........................................................... 73

Figura 18. Dimensiones de AE y sus relaciones [27] ............................................ 78

Figura 19. Elementos estructurales del framework de AI ...................................... 80

Figura 20. Repositorio de recursos de AI .............................................................. 82

Figura 21. Metodologías para Proyectos de AI ..................................................... 83

Figura 22. Elementos Estructurales Metodología Proyecto Inicial ......................... 85

Figura 23. Etapa de preparación de la metodología del proyecto inicial................ 86

Figura 24. Actividades en la etapa de preparación ............................................... 87

Figura 25. Grupos de trabajo ................................................................................ 88

Figura 26. Modelo para definir el alcance de la AI ................................................ 92

Figura 27. Dominios de Datos Empresariales ....................................................... 94

Figura 28. Gobierno de Datos Modelo de Referencia ........................................... 95

Figura 29. Etapa de Estado Actual de la metodología del proyecto inicial ............ 99

Figura 30. Actividades de la etapa de Estado Actual .......................................... 100

Figura 31 Modelo Conceptual nivel 0 [23] ........................................................... 105

Figura 32. Actividades del Análisis de Estado Actual de AI................................. 113

Figura 33. Método para análisis de calidad de datos .......................................... 115

Figura 34. Actividades en la etapa de Estado Deseado de AI ............................. 120

Figura 35. Blueprint de Arquitectura de Datos .................................................... 121

Figura 36. Etapa de Mapa de Proyectos en la metodología de proyecto inicial... 123

Figura 37. Actividades de la etapa de Mapa de Proyectos................................. 123

Figura 38. Técnica de evaluación del valor de negocio [16] ................................ 126

Figura 39. Guía Metodológica para Diseño de un Gobierno de Datos ................ 128

Figura 40. Blueprint de AI para Colpensiones .................................................... 242

Figura 41. Estado deseado de los Datos Maestros ............................................. 247

Figura 42. Grafica de evaluación del Riesgo vs Beneficio .................................. 259

LISTA DE TABLAS

Tabla 1. Evaluación de criterios por cada uno de los enfoques de AE .................. 62

Tabla 2. Dominios de decisión para gobierno de datos [18] .................................. 64

Tabla 3. Framework para los dominios de decisión de datos ................................ 64

Tabla 4.Evaluación de criterios por cada uno de las propuestas de gobierno de

datos..................................................................................................................... 77

Tabla 5. Inventario inicial de fuentes de datos .................................................... 165

Tabla 6. Lista de las 16 fuentes de datos más importantes ................................ 167

Tabla 7. Otras fuentes de datos .......................................................................... 168

Tabla 8. Entidades de Negocio vs Fuentes de Datos .......................................... 170

Tabla 9. Matriz de consolidación de brecha, soluciones y dependencia. ............ 257

Tabla 10. Valores de evaluación del Riesgo vs Beneficio ................................... 259

12

1. INTRODUCCION

En un contexto empresarial, la Arquitectura de Información debe organizar,

gestionar y gobernar la totalidad de los datos. Pero esto es un tema bastante

complejo que se plantea en este trabajo desde dos perspectivas: la primera tiene

que ver con la variedad existente de recursos que se deben considerar en un

proyecto de Arquitectura de Información (en adelante AI). La segunda perspectiva

aborda la complejidad que genera el organizar, gestionar y gobernar grandes

volúmenes de información con su diversidad en usos y también su variedad de

formatos en los que esta se puede encontrar almacenada.

Algunos de los recursos con los que se cuenta actualmente para el desarrollo de

una AI abordan temas como técnicas de integración de datos, enfoques

arquitecturales para gestión de datos maestros (MDM por sus siglas en ingles),

propuestas para gobierno de datos, marcos de arquitectura empresarial, aspectos

de seguridad, calidad de datos, fuentes de datos, principios de datos,

herramientas tecnológicas, técnicas de modelado de datos, dimensiones de

calidad de datos, entre otros. Los marcos de Arquitectura Empresarial (en

adelante AE), consideran algunos de los recursos mencionados dentro de sus

propuestas (cada una diferente entre sí), desde un enfoque genérico que no

describe cómo se deben orquestar e implementar estos recursos de forma

organizada.

La variedad de usos y el volumen de información en los contextos empresariales

han crecido considerablemente en los últimos años. Esto porque las empresas

actuales trabajan en línea a nivel mundial y acumulan enormes volúmenes de

información principalmente sobre sus productos, servicios, sus clientes y sus

comportamientos. Adicionalmente, las empresas suman a su entorno información

no tradicional proveniente de redes sociales, multimedia, fuentes de datos

13

heterogéneas y muchas de estas fuentes son desestructuradas. En consecuencia

la complejidad de la información es bastante significativa y las empresas deben

buscar mecanismos que les permitan organizar, gestionar y gobernar la

información como un activo más de la empresa y que pueda ser utilizada como un

insumo que apalanque las estrategias de negocio.

En este trabajo se presenta un Framework para el Desarrollo de Arquitecturas de

Información en un Contexto de Arquitectura Empresarial (en adelante FAI), con el

fin de mitigar las problemáticas antes mencionadas. También con el ánimo de

disminuir el vacío existente en los frameworks de AE para el tema de AI, en lo que

respecta a guías metodológicas y modelos de referencia que faciliten las labores

de organizar, gestionar y gobernar la información. El FAI toma elementos

principalmente de varios Frameworks de Arquitectura Empresarial y de propuestas

de gobierno de datos, para extenderlos y/o adaptarlos a las necesidades

requeridas en proyectos de AI.

El FAI, propone conceptualmente tres elementos estructurales que son el

repositorio de recursos, metodologías y un repositorio de arquitectura de

información.

El repositorio de recursos, en este trabajo se centra principalmente en la

propuesta de modelos de referencia para gobierno de datos, dominios de datos y

alcance de la AI. También se describe un método para la calidad de los datos y se

propone una serie de plantillas como un medio para documentar cada una de las

actividades de acuerdo a la guía metodológica. El modelo de referencia para

gobierno de datos propone los temas principales que se deben considerar en el

desarrollo de AI. Para dominio de datos se propone un enfoque segmentado,

donde para disminuir la complejidad de uso de la información se propone dividir

los datos empresariales en los 5 dominios de datos propuesto en [1]. Para la

definición del alcance de la AI, también se propone un enfoque segmentado y

centrado principalmente en los datos operacionales y analíticos. Se toma como

14

base específicamente los datos operacionales y analíticos, porque se considera

que los metadatos y los datos maestros, aunque se trabajan de forma

independiente, intervienen directamente y son considerados de forma implícita.

En las metodologías se proponen tres guías metodológicas para el desarrollo de

AI, a saber: guía metodológica para el proyecto inicial, para proyectos particulares

y para el gobierno de datos. En la guía metodológica para el proyecto inicial se

proponen cuatro etapas, empezando por la etapa de preparación donde se debe

entender el contexto donde se desarrollara la AI, luego se debe entender el estado

actual de los datos, posteriormente se deben entender las necesidades del

negocio y proponer el estado deseado de los datos, y por último se deben

identificar, priorizar y proponer la ruta de ejecución de los proyectos que ayudaran

a superar la brecha entre el estado actual y el estado deseado.

Este trabajo se enfoca en los datos operacionales, porque fue donde se

identificaron los principales vacíos y por ende problemáticas al momento del

desarrollo de una AI. Los datos analíticos no se consideran en este trabajo, porque

ya existe una metodología completa y bien detallada propuesta por Ralph Kimball

que ya aborda este tema. Los proyectos de datos analíticos se pueden llevar a

cabo independiente del estado de los datos operacionales aunque éstos sean un

completo caos, pero la complejidad de las técnicas de integración es considerable.

Pero, si los datos operacionales son organizados, gestionados y gobernados

adecuadamente, el desarrollo de los proyectos de datos analíticos serán menos

complejos y las técnicas de integración de datos serán relativamente sencillas.

1.1 Justificación

Las necesidades de hoy exigen a las empresas flexibilidad de adaptación,

operación eficiente para disminuir sus costos, heterogeneidad, operación

orientada a los clientes, información precisa y oportuna que le permita hacer

15

monitoreo constante, poder de prevención o reacción en tiempo real, manejo de

indicadores de negocio y evolución en el tiempo. Pero actualmente las empresas

sufren operacional y financieramente por tener silos de negocios soportados por

componentes tecnológicos aislados, generando un alto costo de operación,

integración y estandarización. En consecuencia difícilmente se puede contar con

información actualizada y consolidada que muestre la operación diaria del

negocio. Estos problemas, son generados porque el negocio e IT no tienen o no

comparten la misma visión del negocio y no trabajan en la misma dirección.

Con la propuesta del FAI se busca resolver los problemas operacionales que

presentan actualmente las empresas, por no organizar y gestionar

adecuadamente la información de forma tal que sea un activo más que apoye

adecuadamente las estrategias de negocio.

1.2 Objetivo general

Desarrollar un framework para el desarrollo de arquitecturas de información en un

contexto de arquitectura empresarial.

1.3 Objetivos específicos

Para responder al objetivo general del proyecto se deben cumplir los siguientes

objetivos específicos:

Identificar fortalezas y debilidades desde el punto de vista de la AI de los

frameworks de arquitectura empresarial más utilizados empresarialmente.

Identificar fortalezas y debilidades de las propuestas de gobierno de datos más

representativas y utilizadas por las organizaciones.

Hacer una propuesta para el framework de arquitectura de información que

integre las fortalezas de los frameworks de arquitectura empresarial.

16

Hacer una propuesta de guías metodológicas que faciliten el desarrollo de

arquitecturas de información en un contexto de arquitectura empresarial en su

fase inicial.

Hacer una propuesta de modelos de referencia y plantillas que apoyen el

desarrollo de las guías metodológicas.

1.4 Alcance

Este trabajo de investigación propone un framework para el desarrollo de

arquitecturas de información en un contexto de arquitectura empresarial. El

framework consta estructuralmente de 3 componentes conceptuales, donde el

primer componente es el repositorio de recursos de AI, el segundo las

metodologías y el tercero el repositorio de arquitectura.

En el repositorio de recursos de AI, para el alcance de este trabajo se proponen

modelos de referencia para dominios de datos, gobierno de datos, alcance de la AI

y una serie de plantillas como herramientas para organizar la información

capturada durante el desarrollo de la AI.

Se proponen tres guías metodológicas, una para el proyecto inicial, otra para

proyectos particulares y una tercera para el gobierno de datos. Como parte de

este trabajo solo se propone, desarrolla y valida con un caso de estudio la guía

metodológica para el proyecto inicial de AI. La guía metodológica para proyectos

particulares no se encuentra dentro del alcance y la guía para gobierno de datos

solo se realiza la propuesta.

La aplicación se hará en la Administradora Colombiana de Pensiones

COLPENSIONES, la cual es una empresa del sector público, donde se aplicara la

guía metodológica para el proyecto inicial de la AI. La información utilizada para

ilustrar la aplicación de la propuesta, fue tomada del proyecto desarrollado por el

17

CIFI 1 de la Universidad de los Andes, para la Administradora Colombiana de

Pensiones COLPENSIONES. En este proyecto participo un grupo de profesionales

que crearon una serie de documentos, pero principalmente se utiliza aquí la

información de los documentos [23] y [31]. El documento [31] corresponde a un

estudio previo de COLPENSIONES realizado por el Grupo de la Protección Social.

El repositorio de arquitectura, donde se deben organizar y gestionar los artefactos

generados durante el desarrollo de la AI, no se encuentra en el alcance de este

trabajo.

1.5 Estructura del documento

Los siguientes capítulos de este documento se estructuran como se describe a

continuación:

En el capítulo 2 se presenta el análisis del estado del arte que sustenta la creación

del FAI. A través de este capítulo se presentan dos análisis: en el primer análisis

se realiza una revisión de los framework de arquitectura empresarial y en el

segundo análisis se lleva a cabo una revisión de varias propuestas en el tema de

gobierno de datos.

En el capítulo 3 se presenta el Framework de Arquitectura de Información en un

contexto de Arquitectura Empresarial (FAI). En este capítulo se presentan los

elementos estructurales del framework y se describen tres metodologías que son

los componentes principales de este framework. La primera metodología trata del

primer proyecto que se debe realizar en todo trabajo de AI, la segunda

metodología trata los aspectos de los proyectos particulares que son el resultado

del primer proyecto y la tercera metodología cubre el tema de gobierno de datos.

1 Centro de Estudios e Investigación de la Facultad de Ingeniería

18

En el capítulo 4 se presenta un caso de estudio donde se ilustra la aplica del FAI

con información tomada del proyecto desarrollado por el CIFI de la Universidad de

los Andes, para la Administradora Colombiana de Pensiones COLPENSIONES.

En el capítulo 5 se presentan las conclusiones y se definen los trabajos futuros

para continuar con el desarrollo del FAI en los aspectos que no fueron

desarrollados completamente.

19

2. ESTADO DEL ARTE

El estado del arte se aborda desde dos perspectivas. La primera desde la

Arquitectura Empresarial enfatizando en lo que ofrecen específicamente en el área

de Arquitectura de Datos y la segunda desde el Gobierno de Datos.

En la primera parte se estudian tres enfoques de Arquitectura Empresarial:

TOGAF, Zachman y la propuesta descrita en [1]. También se realiza un análisis

comparativo de estos tres enfoques.

En la segunda parte se aborda el tema de Gobierno de Datos desde tres

perspectivas: Diseñando gobierno de datos por Vijay Khatri y Carol V. Brown, el

Proceso unificado de gobierno de datos de IBM y Gobierno de datos ¿Qué

funciona y que no? por Rob Karel. También se realiza un análisis respectivo de las

tres propuestas.

2.1 Enfoques de arquitectura empresarial

Desde que se publicó el primer artículo en 1987 por J.A. Zachman según [1] se

han publicado o surgido varias metodologías, entre las más reconocidas se

encuentran:

The Open Group Architectural Framework (TOGAF)

The Zachman Framework for Enterprise Architectures (Zachman)

The Federal Enterprise Architecture (FEA)

The Gartner Methodology (formerly Meta Framework)

Para el estudio del estado del arte se tomaran como referencia las tres primeras

propuestas y adicionalmente la propuesta descrita en [1]. Para el alcance de este

20

trabajo solo se analizara la propuesta de cada uno de los enfoques, desde la

perspectiva que cada uno propone para el tema de Arquitectura de Datos.

Ninguna de estas propuestas metodológicas son realmente completas y cada una

tiene una fortaleza diferente a las otras. Otro aspecto a destacar es que estas

propuestas metodológicas son realmente vistas como frameworks de arquitectura

con propuestas macros y no llegan al nivel de explicar metodológicamente con el

nivel de detalle necesario de cómo desarrollar un proyecto de arquitectura de

datos en un contexto de arquitectura empresarial. En la práctica una empresa

necesitaría un complemento de cada una para llevar a cabo un proyecto de

arquitectura de datos, además de la experiencia de los arquitectos empresariales y

de datos. Por estas razones se tomaran las fortalezas de las cuatro propuestas

seleccionadas y adicionalmente se extenderá con el objeto de proponer una

metodología mejorada.

2.1.1 Zachman

Según la propia descripción de John Zachman este enfoque se considera una

taxonomía y no una metodología ni un framework, donde su definición es:

“Una estructura lógica para clasificar y organizar las representaciones descriptivas

de una Empresa, las cuales son especialmente significativas tanto para la

dirección y control de la organización como para el desarrollo de sus sistemas” [4].

Como puede observarse en la Figura 1, el marco de referencia es una matriz de 6

filas (la sexta fila es la empresa en operación) por 6 columnas, donde cada tipo de

artefacto es caracterizado por una celda, la que a su vez es resultado del cruce de

una fila y de una columna. Cada fila representa una perspectiva o vista de cierto

rol participante en la empresa (ejecutivo, negocio, diseñador, constructor,

programador y usuario), la cual es combinada con seis dimensiones expresadas

21

en forma de interrogantes (¿Qué?, ¿Cómo?, ¿Dónde?, ¿Quién?, ¿Cuándo? y

¿Por qué?).

Figura 1. Marco de Referencia de Zachman2

2.1.1.1 Las perspectivas

El Ejecutivo se ocupa del contexto de la empresa, de su entorno competitivo, de

las fuerzas internas y externas que influyen en su competitividad, del

posicionamiento de sus productos y servicios, que lo obligan a especificar sus

alcances a largo plazo; esta perspectiva cubre los componentes del nivel

2 Tomado de http://www.zachman.com/

22

estratégico. El Negocio se interesa en la operación de la empresa, para lo cual

requiere del modelado de la empresa mediante modelos de procesos, de flujos de

trabajo, de logística empresarial, de modelos semánticos y de planes de negocio

que le permitan controlar la operación de la empresa; esta perspectiva se centra

en el proceso de negocio, por lo que constituye en buena medida el nivel de

procesos. El Diseñador o Arquitecto tiene que ver con la especificación de los

planos conceptuales de los sistemas de información que se requieren para

soportar la operación de los procesos. El Constructor o Ingeniero se encarga del

ensamblado y fabricación de los diversos componentes de los sistemas de

información de acuerdo con las restricciones de la tecnología utilizada. El

Programador trabaja en la fabricación de los componentes de acuerdo con las

especificaciones del constructor. Las perspectivas del diseñador, constructor y

programador se ubican claramente en el nivel de sistemas de información [13].

2.1.1.2 Las dimensiones

El Dato responde a la interrogante ¿Qué?, para la perspectiva de nivel ejecutivo

se refiere a la lista de cosas importantes para el negocio como clientes,

proveedores, productos, servicios, contratos, facturas, etc.; conforme se va

descendiendo a las perspectivas inferiores se van teniendo diferentes

descripciones relacionadas con la visión particular de cada perspectiva: desde la

gestión del negocio se ven las cosas como entidades representadas en un modelo

conceptual que caracteriza el negocio, pero al diseñador le interesa un modelo

lógico que pueda conducir a una base de datos para su almacenamiento

correspondiente, lo que la visión del constructor transforma en un modelo físico

como una tabla de base de datos, que para el programador será una entidad de

almacenamiento como un archivo o un registro. La Función se ocupa de la

pregunta ¿Cómo?, cubriendo desde la lista de procesos esenciales del negocio

(perspectiva del planeador), su modelado correspondiente (dueño), hasta la

23

especificación de los programas (programador) asociados a la funcionalidad de

negocio. La Ubicación representa el ¿Dónde?, reflejando desde la lista de las

localidades donde se ubica el negocio (perspectiva del planeador), su modelado

logístico (dueño), hasta la configuración de las direcciones de red (programador).

La Persona tiene que ver con el ¿Quién?, considerando la lista de unidades

organizacionales importantes para el negocio (planeador), su modelo de flujo de

trabajo (dueño), hasta la especificación de las restricciones de seguridad

(programadores y usuarios). El Tiempo captura el ¿Cuándo?, incluyendo desde la

lista de eventos importantes para el negocio (planeador), su modelo de planeación

operacional (dueño), hasta la especificación de temporizadores (programador). La

Motivación explica la interrogante ¿Por qué?, abarcando desde la lista de objetivos

y metas (planeador), su plan de negocio para operar la empresa (dueño), hasta la

especificación de las reglas de negocio correspondientes (programador). [13]

2.1.1.3 Zachman y la arquitectura de datos

El framework de Zachman es considerado como una meta modelo que define una

estructura para clasificar y organizar una serie de artefactos que describen la

empresa. En consecuencia no contempla aspectos de como iniciar un proyecto de

arquitectura de datos, ni mucho menos cuales son las etapas a seguir.

A nivel de datos define la dimensión Datos que corresponde al interrogante

¿Qué?, y a través de las perspectivas, identifica una serie de artefactos,

empezando por la definición del contexto del negocio, seguido por el

modelamiento del contexto, identificación las entidades de negocio y describiendo

como se relacionan entre sí con la ayuda de un modelo conceptual.

Posteriormente se especifica la necesidad de un modelo físico de datos que

después será transformado en la implementación de una fuente de datos.

24

Como se puede observar, este enfoque provee una estructura donde define una

serie de entregables, pero carece de un proceso de transformación y ejecución de

un proyecto de arquitectura de datos en un contexto de arquitectura empresarial.

2.1.2 Framework de arquitectura empresarial federal

El Framework de Arquitectura Empresarial Federal (FEAF por sus siglas en inglés)

proporciona un estándar para el desarrollo y documentación de las descripciones

de la arquitectura de áreas de alta prioridad. Este provee una guía para la

descripción de las arquitecturas de segmentos funcionales de múltiples

organizaciones del gobierno federal.

La Arquitectura Empresarial Federal es una base de información de valor

estratégico que define el negocio, la información necesaria para operar el negocio,

las tecnologías necesarias para apoyar las operaciones del negocio y los procesos

de transición para la aplicación de las nuevas tecnologías en respuesta a las

necesidades cambiantes del negocio.

El CIO Council3 propuso tres enfoques para FEAF4:

Enfoque convencional: este enfoque requiere de un gran esfuerzo en tiempo y

dinero, porque se aborda el problema global para toda la federación. Este

enfoque puede presentar problemas como parálisis por el análisis a

consecuencia de la complejidad del esfuerzo federal.

Enfoque por segmentos: Promueve el desarrollo incremental de los segmentos

de la arquitectura dentro de un marco de arquitectura empresarial estructurada.

Este enfoque se centra en grandes áreas de negocio y es más probable que

tenga éxito, porque el esfuerzo se limita a funciones comunes o empresas

específicas.

3 Chief Information Officer Council

4 Federal Enterprise Architecture Framework

25

Enfoque de Status Quo: Este enfoque representa el funcionamiento normal del

negocio tras el fracaso continuo del esfuerzo por compartir información y poder

hacer frente a la rápida evolución del entorno. Este enfoque daría lugar a

reproceso de negocios, disminución de la productividad y la pérdida de

oportunidades.

FEAF consta de ocho componentes necesarios para el desarrollo y mantenimiento

de la Arquitectura Empresarial Federal según el CIO Council. A continuación se

realiza una descripción general sobre cada uno de estos ocho componentes según

[33]:

Motivadores de Arquitectura: Representa dos tipos de estímulos externos para

la AE, el primero, corresponde a los motivadores de negocio que pueden ser

nueva legislación, fuerzas del mercado, nuevas iniciativas de administración. El

segundo estimulo externo, hace referencia a los motivadores de diseño, lo cual

incluye nuevo y mejoras en el software y hardware.

Dirección Estratégica: guía el desarrollo de la AE deseada y consta de una

visión, principios, metas y objetivos.

Arquitectura Actual: define la situación actual de la AE y está compuesta de

dos partes: la situación actual para el negocio y el diseño de arquitectura que

consta de datos, aplicación y tecnología.

Arquitectura Objetivo: define la situación deseada de la AE y también está

compuesta de dos partes: la situación deseada para el negocio y el diseño de

arquitectura que consta de datos, aplicaciones y tecnología.

Procesos de Transición: soporta la migración de la situación actual a la

situación deseada de la AE. Esto incluye capital IT, planificación de

inversiones, plan de migración, gestión de la configuración y gestión del

cambio.

Segmentos de Arquitectura: un segmento es considerado como una empresa

dentro de la empresa federada. Los segmentos son áreas de negocio

transversales como por ejemplo las compras a través de comercio electrónico.

26

Modelos Arquitectónicos: define los modelos de negocio y diseño que

describen los componentes de los segmentos de la empresa.

Estándares: este se refiere a todos los estándares o normas, directrices y

mejores prácticas.

La arquitectura empresarial federal, consta de cinco modelos de referencia

relacionados entre sí, diseñados para facilitar el análisis y la identificación de

inversiones duplicadas, las carencias y colaboraciones entre las agencias [35].los

cinco modelos de referencia son:

Modelo de referencia del rendimiento (PRM por sus siglas en ingles).

Modelo de referencia del negocio (BRM por sus siglas en ingles).

Modelo de referencia de componentes de servicio (SRM por sus siglas en

ingles).

Modelo de referencia técnico (TRM por sus siglas en ingles).

Modelo de referencia de datos(DRM por sus siglas en ingles).

2.1.2.1 Modelo de Referencia de Datos (DRM)

El DRM es un marco de trabajo flexible basado en estándares que permiten el

intercambio de información y la reutilización para todo el gobierno federal, a través

de la descripción y descubrimiento estándar de datos comunes y la promoción de

prácticas de gestión de datos uniformes [35].

El DRM proporciona un medio estándar a través del cual los datos se pueden

describir, clasificar y compartir (ver Figura 2).

El marco de implementación de DRM se presenta en la Figura 6. Este marco

proporciona un mapa de ruta para ser utilizado por arquitectos empresariales y

arquitectos de datos para guiar sus esfuerzos en el intercambio de datos dentro de

27

las comunidades de interés. El mapa de ruta se basa en las siguientes

afirmaciones básicas [34]:

Figura 2. DRM Áreas de estandarización [35]

El Contexto de los Datos es un área de estandarización de los datos en DRM. Una

comunidad de interés, debe ponerse de acuerdo sobre los datos necesarios para

satisfacer sus necesidades de negocio de misión compartida. Una comunidad de

interés debe ser capaz de responder preguntas básicas acerca de los activos de

datos que administra: ¿Cuáles son los datos que necesita?, ¿Quién es

responsable de mantener los datos?, ¿Cuál es la vinculación con el modelo de

referencia del negocio?, ¿Qué servicios están disponibles para acceder a los

datos?, ¿Cuáles son las fuentes de datos donde se almacenan los datos? [34].

La Descripción de los Datos es un área de estandarización de los datos en DRM,

donde una comunidad de interés debe ponerse de acuerdo en el significado y la

estructura de los datos que necesita, con el fin de utilizar eficazmente los datos.

28

Figura 3. Contexto de los datos [34]

Figura 4. Descripción de los datos [34]

Compartir Datos es un área de estandarización de los datos en DRM, donde se

proporciona una guía para los tipos de servicios que deben ser provisionados en

una comunidad de interés para que el intercambio de información sea posible.

29

Figura 5. Compartir Datos [34]

Figura 6. Marco de implementación de DRM

30

2.1.3 TOGAF (The Open Group Architecture Framework)

Es un frameworks de AE elaborado y aprobado por los miembros del Foro de

Arquitectura The Open Group. Está basado en el Framework de Arquitectura

Técnica para la Gestión de la Información (TAFIM5 por sus siglas en inglés) del

departamento de defensa de los Estados Unidos de América.

Actualmente se encuentra en la versión 9.1. TOGAF es un método detallado y un

conjunto de recursos de apoyo para el desarrollo de una AE. Es uno de los

frameworks de AE mas difundidos debido a que cuenta con una buena cantidad

de información disponible y de acceso público. Este divide la organización en 4

dominios de arquitectura (ver Figura 7): Arquitectura de Negocio, Arquitectura de

Aplicaciones, Arquitectura de Datos y Arquitectura de Tecnología [16].

Figura 7. Arquitectura Empresarial según TOGAF [14]

TOGAF se describe como un framework, pero la parte más importante de TOGAF

es el Architecture Development Method, más conocido como ADM. ADM es como

una receta para la creación de una arquitectura. Una receta puede ser calificada

como un proceso. Dado que ADM es la parte más visible de TOGAF, podemos

5 Technical Architecture Framework for Information Management

31

clasificar a TOGAF como un proceso arquitectónico en lugar de framework, o una

metodología, ya que describe un proceso bien definido como ADM.

TOGAF visto como un proceso arquitectónico, complementa a Zachman;

recordemos, que es una taxonomía de arquitectura. Zachman indica la forma de

clasificar los artefactos. TOGAF le da un proceso de creación de ellos.

La versión 9 de TOGAF cuenta con 6 partes principales [16]:

ADM (Architecture Development Method): Describe 10 fases genéricas para el

desarrollo de una AE.

Directrices y Técnicas para ADM: Conjunto de buenas prácticas para el uso de

ADM.

Framework de Contenido de Arquitectura: Provee un meta modelo conceptual

el cual describe los artefactos de arquitectura.

Enterprise Continuum: Suministra un modelo para estructurar un “repositorio

virtual” que contendrá los elementos de valor reutilizable para la AE como

modelos, patrones y descripciones arquitectónicas entre otros.

Modelos de Referencia: Son arquitecturas genéricas de un alto nivel

abstracción que pueden ser utilizadas para construir la arquitectura de

cualquier sistema.

Framework de Gobierno de Arquitectura: Garantiza que la organización

disponga de una estructura organizacional que permita la ejecución del

proyecto, la cual incluye definición de roles, responsabilidades, recurso

humano capacitado y modelos de certificación, entre otros.

2.1.3.1 El Ciclo ADM

Continuamos con un repaso de ADM porque este contiene una fase C

denominada Arquitectura de Sistemas de Información, donde encontramos la

Arquitectura de Datos (AD), la cual es el componente de referencia más

32

importante en el desarrollo de esta propuesta metodológica. ADM es un método

genérico para el desarrollo de AE, el cual está diseñado para hacer frente a la

mayoría de los requisitos del sistema y de la organización. Sin embargo, a

menudo será necesario modificar o ampliar ADM para adaptarse a necesidades

concretas [16]. El ciclo ADM consta de 10 fases, mostradas en la Figura 8, donde

incrementalmente se define, ejecuta y controla la AE de forma iterativa.

Figura 8. El ciclo ADM [16]

33

Fase Preliminar: en esta fase la empresa se prepara para iniciar el proyecto de

AI, definiendo el alcance, los principios, la estructura de gobierno y principalmente

el compromiso con el nivel estratégico. En esta fase se deben definir los diferentes

ajustes que se le deben hacer a ADM de acuerdo a las necesidades del proyecto.

Fase A. Visión de la Arquitectura: marca el inicio de una iteración ADM al definir

el alcance, restricciones y expectativas. Se realiza una primera validación del

contexto del negocio.

Aclarar y acordar el propósito de los esfuerzos de AE es una de las partes

fundamentales de esta etapa, y el objetivo debe estar claramente reflejado en la

visión que se crea. Los proyectos de arquitectura se realizan con un propósito

específico en mente, un conjunto específico de motivadores de negocio que

representan el retorno de la inversión para los interesados en el desarrollo de la

arquitectura. Aclarar el propósito y demostrar cómo se lograra el desarrollo de la

arquitectura propuesta, es la clave principal de la visión de arquitectura [16].

La visión de negocio define el estado deseado o futuro de una determinada

organización o empresa en términos de su objetivo fundamental o dirección

estratégica. La misión de negocio define el objetivo fundamental de una empresa y

básicamente describe porque existe y como este soporta el avance hacia el logro

de la visión [17].

La declaración de visión y misión de negocio se utilizan a menudo para apoyar

proyectos de mejoramiento. En términos de arquitectura éstos proporcionan un

objetivo estratégico y un medio para validar muchos de los objetivos de la

arquitectura. La visión y misión también ayudan a validar los principios de

arquitectura. Es importante revisar y validar la visión y misión en los compromisos

de la arquitectura que soportan la transformación del negocio, ya que ayudara a la

toma de decisiones en la reestructuración de la empresa [17].

Algunos ejemplos de misiones de negocio son:

34

3M: “Resolver problemas sin resolver de forma innovadora.”

Mary Kay Cosmetics: “Ofrecer oportunidades sin límite a las mujeres.”

Merck: “Preservar y mejorar la vida humana.”

Wal-Mart: “Brindar a la gente común la oportunidad de comprar lo mismo

que los ricos.”

Walt Disney: ”Hacer feliz a las personas.”

Fase B. Arquitectura del Negocio: No es diseñar el negocio es entender su

estructura según el alcance definido en la fase A, se realiza una comprensión de la

organización en aspectos como estructura organizacional, objetivos del negocio,

motivadores, estrategias, funciones, servicios, procesos y la interrelación entre

ellos. El objeto de esta fase es definir una situación actual y un estado deseado

para los procesos de negocio respectivos.

La estrategia de negocio proporciona la dirección y descripción de cómo una

empresa quiere lograr su visión de negocio en un plazo determinado y la forma

como se puede lograr mediante una serie de actividades claves. Es el “Que y

Como”. La estrategia de negocio es importante para la arquitectura a corto y largo

plazo porque brinda un marco de referencia para evaluar como la arquitectura

debe apoyar o alinearse con la estrategia de negocio.

La estrategia de negocio no siempre está disponible, ya que puede ser

información confidencial. Sin embargo para un trabajo de arquitectura como parte

de un proyecto de transformación de la empresa, es importante comprender la

estratégica de negocio, para lo cual es necesario preparar entrevistas con los

ejecutivos principales.

Algunos ejemplos de estrategias de negocio;

Autoservicio.

Flexibilidad.

Automatización de procesos de negocio.

35

Indicadores y control de procesos.

Ajustarse a algún marco de referencia.

Los motivadores de negocio deben ser: específicos, medibles, agresivos pero

viables, orientados al resultado y limitados en el tiempo. Un motivador de negocio

es una descripción corta que define clara y específicamente los resultados

deseados de negocio de una organización así como las actividades necesarias

para lograrlo [19].

Se deben identificar claramente los motivadores de negocio y encontrar las

relaciones entre los motivadores de negocio y los objetivos de la AI.

Fase C. Arquitectura de Sistemas de Información: en esta fase el objetivo es

describir y entender la arquitectura de los sistemas de información que requiere el

negocio para alcanzar su visión, soportando sus estrategias de negocio y

evidenciando su integración. Aquí también se debe establecer el estado actual, el

estado futuro y análisis gap del panorama de los sistemas de información. Esta

fase cubre dos temas principales:

Arquitectura de Aplicaciones: el trabajo en esta etapa corresponde a identificar

cuáles y como son las aplicaciones y su arquitectura que soportan y soportaran

el negocio y su integración.

Arquitectura de Datos: El objetivo de esta etapa es identificar y entender las

entidades de datos relevantes para la empresa, no el diseño de sistemas de

almacenamiento lógico o físico.

Fase D. Arquitectura Tecnológica: el objetivo en esta fase es identificar y definir

los componentes tecnológicos básicos que soportaran la solución a nivel de

sistemas de información. Principalmente se definen plataformas de hardware y

software base.

Fase E. Oportunidades y Soluciones: esta fase se debe evaluar y seleccionar

opciones de implementación, tomar decisiones si se debe comprar o desarrollar

36

internamente. También se debe definir las dependencias de los proyectos, costos

y beneficios con el objeto de crear un plan general de implementación y migración.

Fase F. Planeación de la Migración: en esta fase se debe priorizar los proyectos

de implementación de acurdo a los aspectos definidos en la fase E tales como

dependencia, costos y beneficios de los proyectos de migración, el resultado es

un mapa de proyectos detallado de implementación, calidad de datos y migración.

Fase G. Gobernabilidad de la implementación: el aspecto principal en esta fase

es asegurar que se definan las condiciones de gobierno necesarias para llevar a

cabo los proyectos de implementación, teniendo en cuenta actividades como:

formular recomendaciones para cada proyecto, diseñar y construir los

mecanismos y estructuras de gobierno para los proyectos, definir los roles de

gobierno necesario y asegurar que los proyectos respetaran la arquitectura.

Fase H. Administración del cambio de la Arquitectura: el objetivo principal es

definir los procesos de gestión del cambio necesarios para mantener vigente la

AE, las actividades principales de estos procesos deben ser: monitorear nuevos

desarrollos, monitorear cambios en el entorno del negocio y determinar si es

necesario iniciar un nuevo ciclo de evolución de la AE.

2.1.3.2 Alcance

El alcance de la AI debe ser definido para asegurar el cubrimiento de los temas

relevantes para el negocio. Este determina el nivel de granularidad y detalle para

cada uno de los aspectos de las áreas a cubrir y asegura el apropiado

cumplimiento de las expectativas según el acuerdo con las partes interesadas en

el proyecto de AI. El alcance controla el desarrollo de la arquitectura y asegura

que todas las actividades se enfoquen en solucionar los problemas del negocio. El

alcance de arquitectura es un artefacto obligatorio, porque este define y

37

proporciona un medio para asegurar el cumplimiento de las expectativas de los

interesados en el proyecto de AI [17].

Cuatro dimensiones se suelen utilizar para definir y limitar el alcance de una

arquitectura [16]:

Enfoque o alcance de la empresa: ¿cuál es la extensión total de la empresa y

a cuanto de esa extensión debe enfocarse el esfuerzo de arquitectura?

o Muchas empresas son muy grandes que pueden comprender una

federación de unidades organizativas y que se podrían considerar

empresas con derechos propios.

o Las empresas modernas cada vez se extienden más allá de sus límites

tradicionales de la empresa comercial tradicional para adoptar una

combinación con proveedores, clientes y socios.

Dominios de Arquitectura: una descripción completa de arquitectura

empresarial debe contener los cuatro dominios de arquitectura (negocio,

aplicaciones, datos y tecnología), pero la realidad de las limitaciones de

recursos y tiempo a menudo significa que no hay tiempo o recursos suficientes

para realizar un top-down de la arquitectura que abarque los cuatro dominios.

Alcance vertical o nivel de detalle: se debe tener cuidado para seleccionar el

nivel de detalle adecuado a ser capturado, porque el uso previsto de la

arquitectura y las decisiones se toman basados en este. Es importante que un

nivel coherente y equitativo de la profundidad sea realizado en cada dominio

de la arquitectura. Si se omite un detalle importante, la arquitectura puede ser

no útil. Si se incluyen detalles innecesarios el proyecto de arquitectura puede

exceder el tiempo y los recursos disponibles y la arquitectura resultante puede

ser confusa.

Periodo de tiempo: cuando el alcance de la empresa es grande y la

arquitectura objetivo es particularmente complejas, el desarrollo de la

38

arquitectura, puede encontrarse con grandes dificultades, e incluso resultar

“misión imposible”, especialmente si se lleva a cabo por primera vez. En tales

casos una visión más amplia se puede tomar, por el cual una empresa está

representada por varias instancias de arquitectura diferentes, cada instancia

representa a la empresa en un instante de tiempo determinado. Una instancia

de arquitectura representara el estado actual de la empresa (As-Is), otra

instancia de arquitectura puede definir parcialmente la arquitectura objetivo

(To-Be). Las instancias de arquitecturas de transición o intermedias cada una

compuesta por su propio conjunto de descripciones de la arquitectura objetivo.

Típicamente el alcance de una arquitectura es primero expresada en términos del

alcance de la empresa, periodo de tiempo y nivel de detalle:

Figura 9. Desarrollo incremental de la arquitectura [16]

39

Existen dos enfoques básicos para el desarrollo de arquitecturas:

Vertical: la empresa se divide en segmentos, donde cada segmento

representa una línea de negocio independiente dentro de la empresa en

general y cada uno con su arquitectura empresarial junto con sus cuatro

dominios (negocio, aplicaciones, datos y tecnología), estos dominios de

arquitectura se pueden desarrollar separadamente con miras a una integración

posterior.

Horizontal: la empresa se divide en súper-dominios en el cual cada dominio de

arquitectura (negocio, aplicaciones, datos y tecnología) cubre toda la empresa

en general como un proyecto independiente de los otros, posiblemente con

personal diferente y con miras a una integración posterior.

2.1.3.3 División de Arquitecturas

Es necesario dividir las arquitecturas por las siguientes razones:

Porque abordar los problemas dentro de una única arquitectura es demasiado

complejo.

Para resolver conflictos entre arquitecturas correspondientes a trabajos

realizados en diferentes líneas de tiempo. Esto porque el estado de la empresa

cambia con el tiempo y una arquitectura desarrollada en una línea de tiempo

es muy diferente a otra desarrollada en un momento diferente.

Permite que diferentes personas trabajen en diferentes elementos de

arquitectura al mismo tiempo, además permite la división de arquitectos por

grupos especializados de trabajo en los diferentes segmentos de arquitectura.

Descripción de los criterios de clasificación:

40

Asunto: la división de arquitectura son naturalmente organizadas en grupos de

acuerdo a la gestión operativa o de control. Ejemplos de particiones pueden

ser: aplicaciones, departamentos, productos, servicios, procesos, entre otros.

Punto de vista: Definición del tema específico de acuerdo a los requerimientos

de negocio.

Nivel de detalle: El nivel de detalle dentro de la arquitectura está directamente

relacionado con el grupo de interés en la arquitectura. Las arquitecturas con

menos detalle son de interés para los gerentes o ejecutivos, las arquitecturas

con un incremento en el detalle es de interés para el personal operativo. Para

la definición del nivel de detalle se propone la utilización del framework de

Zachman en la dimensión de Datos para las perspectivas de esquema

Contextual, conceptual, lógico y Físico.

Nivel de abstracción: el nivel de abstracción de una arquitectura tiene una

fuerte influencia sobre la forma en que la arquitectura será usada. Por ejemplo

las arquitecturas que ofrecen una representación muy directa de las soluciones

normalmente se utilizan para la compresión del estado actual y futuro de la

empresa. las arquitecturas con un nivel de abstracción más alto normalmente

se utilizan para comunicar los conceptos o modelos de referencia que se

pueden aplicar a los problemas específicos en arquitecturas futuras.

Precisión: Definición del gobierno y gestión del cambio para garantizar que la

arquitectura evolucione de acuerdo a la realidad cambiante de la empresa, de

tal forma que permita controlar las sucesivas versiones de los artefactos

arquitectónicos.

2.1.3.4 Principios de Datos

Los principios son normas y directrices generales, con la intención de que sean

duraderos y que reara vez sean modificados, para informar y apoyar la forma

que una organización establece para el cumplimiento de su misión. A su vez, los

41

principios pueden ser sólo un elemento en un conjunto estructurado de ideas, que

colectivamente definen y guían a la organización, a través de acciones y

resultados.

Los principios de datos proporcionan orientación sobre el uso y el despliegue de

todos los recursos y activos en toda la empresa, con el fin de hacer el entorno de

la información lo más productivo y rentable como sea posible.

En [1] se encuentra una descripción detallada de ejemplos de principios de datos

propuestos por TOGAF.

2.1.3.5 TOGAF y La Arquitectura de Datos

TOGAF a través del método ADM dedica una sección al tema de arquitectura de

datos donde hace referencia a tres consideraciones principales para Arquitectura

de Datos [16]:

Gestión de Datos: cuando una empresa decide emprender un proyecto de AE,

es importante entender y abordar los problemas de gestión de datos, para lo

cual debe definir un método estructurado y exhaustivo que le permite un uso

eficaz de los datos y aprovechar sus ventajas competitivas. Las

consideraciones que se deben tener en cuenta son:

o Identificar los principales componentes de aplicación que servirán de

referencia en la identificación de los datos maestros de la empresa.

o Identificar estándares propios de la empresa y analizar si es necesario

adoptarlos.

o Entender claramente cómo las entidades de datos son utilizadas por las

funciones de negocio, procesos y servicios.

o Es necesario entender cómo y dónde las entidades de datos de la

empresa se crean, almacenan, transportan y consultan.

42

o Identificar el nivel de complejidad de las transformaciones de datos

necesarias para el intercambio de información entre las aplicaciones.

o Identificar cuáles serán los requerimientos de software necesarios como

apoyo para la integración de datos. Por ejemplo el uso de herramientas

ETL o herramientas de perfilamiento para evaluar la calidad de los

datos.

Migración de datos: cuando existen aplicaciones y es necesario

reemplazarlas, surgirá la necesidad de migrar los datos (maestros,

transaccionales y metadatos) a la nueva aplicación. En consecuencia se deben

identificar las necesidades de migración de datos y establecer indicadores de

transformación y limpieza requerida para obtener los datos en un formato que

cumpla con los requisitos de las nuevas aplicaciones. Aquí es importante

también asegurarse que toda la empresa tenga una definición común de datos.

Gobierno de datos: son las consideraciones para garantizar que la empresa

tiene las dimensiones necesarias que permitan la transformación, de la

siguiente forma:

o Estructura: esta dimensión se refiere a si la empresa tiene la estructura

organizacional necesaria y los organismos de normalización para

gestionar los aspectos de transformación de las entidades de datos.

o Sistema de gestión: en esta dimensión la empresa debe contar con un

sistema que le permita gestionar los aspectos de gobierno sobre las

entidades de datos durante todo su ciclo de vida.

o Personas: esta dimensión se refiere a los datos relacionados con las

habilidades y los roles que la empresa requiere para su transformación.

Si la empresa carece de recursos y habilidades, se debe considerar

tanto la adquisición de las habilidades críticas o de formación de

recursos internos existentes a través de un programa bien definido de

aprendizaje.

43

TOGAF también define una serie de pasos a seguir para la ejecución de la fase de

arquitectura de datos, los pasos son los siguientes:

Seleccionar modelos de referencia, puntos de vista y herramientas: se debe

revisar, validar y definir si es necesario el conjunto de principios de datos (ver

principios de datos). Seleccionar modelos de referencia como por ejemplo

eTOM (enhanced Telecom Operations Map), ARTS Data Model for the Retail

industry, Energistics Data Model for the Petrotechnical industry, entre otros.

Un modelo de referencia es un conjunto de convenciones o patrones usados

para poder medir o determinar la situación actual de una empresa respecto al

modelo de referencia. Esto permite realizar un análisis comparativo y así

determinar o cuantificar la brecha que existe entre la situación actual y el

marco de referencia. Seleccionar puntos de vista relevantes para la

arquitectura de datos, como por ejemplo, puntos de vista de auditores, reportes

de tiempo real entre otros. También se deben identificar las herramientas y

técnicas necesarias que deben ser utilizadas para la captura, modelamiento y

análisis en asociación con los puntos vistas seleccionadas, algunas técnicas de

modelamiento de datos son:

o Diagrama Entidad-Relación

o Diagrama de clases.

o Modelamiento de objetos

o Diagrama de diseminación de datos

o Diagrama de ciclo de vida de datos

o Diagrama de seguridad de datos

o Diagrama de migración de datos

Desarrollo de una descripción de la situación actual de la arquitectura de datos:

desarrollo de una descripción de referencia de la arquitectura de datos

existentes en la medida necesaria para apoyar la arquitectura destino. El

44

alcance y nivel de detalle dependerá del alcance y objetivos del trabajo de

arquitectura.

Descripción del desarrollo de la situación deseada de la arquitectura de datos.

Realizar análisis de brecha.

Definir componentes del mapa de proyectos

Resolver los impactos sobre la arquitectura

Revisión de la conducta formal de los stakeholder

Finalizar la arquitectura de datos

Crear documento de definición de arquitectura

TOGAF ofrece un método en general que aplica para todos los dominios de

arquitectura empresarial, lo que implica un nivel de abstracción muy alto porque la

arquitectura de negocios, aplicaciones, datos e infraestructura, aunque se

relacionan entre sí son aspectos muy diferentes. Además TOGAF se limita a

mencionar los temas que se deben tener en cuenta, pero no proporciona un

método paso a paso con las tareas específicas de cómo, porque y para que

ejecutar cada una de las tareas en el desarrollo de arquitectura de datos.

2.1.4 Arquitectura de información empresarial según [1]

La arquitectura de información empresarial (en adelante AIE) descrita en [1],

describe los principios y directrices que permiten una implementación coherente

de las soluciones de tecnología de la información, de cómo los datos e información

son gobernados y compartidos en toda la empresa, así como también de qué se

necesita para garantizar una visión de confianza sobre la información.

45

2.1.4.1 Principios de arquitectura de información

A continuación se presentan algunos ejemplos de los principios básicos que guían

una arquitectura de la información:

El acceso y el intercambio de información: los servicios de información

deben facilitar el acceso sin restricciones a los usuarios adecuados en el

momento adecuado.

Servicio de reutilización: facilitar el descubrimiento, la selección y

reutilización de los servicios de información y siempre que sea posible

fomentar el uso de interfaces uniformes.

Gestión de la información: tecnología de la información adecuada debe

apoyar la ejecución eficaz de una estrategia de gestión de la información.

Estándares: Un conjunto de normas coherentes para los datos y la tecnología

debe ser definida para promover la simplificación a través de la infraestructura

de la información.

2.1.4.2 Dominios de datos

En una empresa existen varios tipos de datos que pueden ser usados en toda la

empresa, como pueden ser usados solo en una línea de negocio de la empresa.

Los datos pueden ser estructurados o no estructurados y también se pueden ver

desde una perspectiva de cómo son almacenados. A continuación la AIE propone

5 dominios de datos:

46

Figura 10. Dominios de datos [1]

Metadatos

Definidos como datos sobre los datos, los metadatos son la información que

describe las características de los datos corporativos y otras entidades. Los

metadatos son el dominio de datos que convierte datos en información útil sobre

el negocio. Los metadatos pueden ser vistos como una colección de datos e

información utilizada para medir, desarrollar y operar un entorno

empresarial. También incluyen información crítica del negocio o vínculos a la

información que se encuentra fuera de la visión tradicional pura de los datos. Los

metadatos son a menudo divididos en metadatos técnicos y metadatos de

negocio.

Los niveles de madurez de uso en metadatos se pueden ver en la Figura 11:

47

Figura 11. Modelo de madurez de metadatos [1]

Nivel 1: Metadatos Técnicos: Un ejemplo de este nivel más bajo de metadatos,

es el catálogo de DB2, el cual consiste en un conjunto de tablas que contienen

información sobre los datos de control de DB2. Las tablas del catálogo de DB2

contiene información sobre los objetos de DB2 tales como tablas, vistas, índices,

procedimientos almacenados, funciones definidas por el usuario, etc.

Nivel 2: Metadatos de Negocio: Definir y consumir metadatos de negocio es

esencial para las empresas de hoy. Un buen ejemplo de metadatos de negocio es

la descripción de términos y de reglas de negocio.

Nivel 3: Metadatos de Negocio y Técnicos Alineados: El siguiente nivel de

madurez en términos de generación y consumo de metadatos es la alineación. Es

decir, es necesario que haya una relación o vínculo entre los metadatos de

negocio y técnicos. Un ejemplo consistiría en tener un link entre un reporte de BI y

los objetos de IT.

48

Nivel 4: Metadatos Para Gestión del Negocio: El siguiente nivel de uso de los

metadatos es caracterizado por los metadatos de escenarios de casos de uso que

permiten la gestión y optimización del negocio. Esto permite al líder de ventas

expresar requerimientos mediante el uso del lenguaje de negocio, donde a través

del uso de metadatos éstos requerimientos son traducidos al dominio de TI.

Nivel 5: Metadatos Para Innovación del Negocio: Permite mejorar la visión

empresarial, innovación, ideas y oportunidades de negocio. Permitiendo un

análisis y modelo de negocio predictivo. Para seguir analizando y optimizando el

negocio es necesario orquestar todo mediante el uso y exploración de metadatos

de negocio y técnicos.

Hay diferentes niveles de detalle para los metadatos que corresponden a la

arquitectura de información empresarial. Además del nivel conceptual, lógico y

físico, se adiciona un nivel contextual al más alto nivel y un nivel de

implementación al más bajo nivel:

Nivel Contextual: Describe el contexto de todos los objetos de metadatos y

sirve como una base general para describir con más detalle las circunstancias

y condiciones para las especificaciones de los objetos de metadatos en los

niveles posteriores.

Nivel conceptual: Proporciona una descripción de alto nivel de los objetos de

metadatos. Este puede incluir una descripción de alto nivel de las estructuras

de datos y sus relaciones incluyendo taxonomías.

Nivel Lógico: Contiene los datos de nivel lógico de objetos de metadatos,

como los componentes y sus relaciones. Incluye diagramas detallados del

modelo de metadatos, detallando descripciones y las interacciones de los

objetos de metadatos.

Nivel físico: Describe todos los objetos de metadatos del nivel físico. Contiene

los aspectos operativos, tales como quien es el propietario de un objeto de

49

metadato en particular, donde se encuentra (localización), quien está permitido

para consumir los metadatos, etc.

Nivel de Implementación: Contiene el nivel más bajo de descripción de los

objetos de metadatos que están relacionados con aspectos de implementación

y ejecución. Esto también está relacionado con los productos de

implementación y mapeo de los productos.

Los metadatos generalmente se dividen en dos categorías: metadatos de negocio

y metadatos técnicos.

Metadatos de Negocio: Este tipo de metadatos define reglas de negocio

como definiciones de negocio, datos de negocio, terminología y glosario de

negocio, calidad de datos, algoritmos de negocio y utilización de lenguaje de

negocio. Los metadatos de negocio incluyen información contextual acerca de

la información recuperada o consultada, taxonomías que definen la

organización del negocio, jerarquía de productos y vocabulario usado para

definir los términos de negocio.

Los siguientes son ejemplos de metadatos de negocio:

Modelo de negocio: es una descripción general de trabajo que aborda

factores internos y externos de la operación en curso de la empresa. Entre más

maduro el ambiente de arquitectura de negocio, el modelo de negocio se

convierte en un framework que permite la transformación de ideas innovadoras

en valor comercial para la empresa.

Reglas de negocio: estas normas o reglas rigen los procesos de negocio e

incluyen las reglas de validación, reglas de uso y otros imperativos y directrices

para controlar la ejecución correcta de todos los procesos de negocio.

Planeación y gestión del rendimiento del negocio: estos son los

indicadores de rendimiento (KPIs) y otras métricas de rendimiento. Además

incluye metadatos que permite a los canales financieros la planificación,

50

previsión, elaboración de informes y la gestión del rendimiento empresarial.

Esto debe ser apoyado por productos y herramientas.

Reglas de calidad de datos de negocio: hay reglas para gestionar la calidad

de datos de negocio. Por ejemplo, estas reglas permiten la gobernabilidad de

datos de negocio para ser implementados apropiadamente.

Glosario de negocio: esto captura el diccionario de datos de negocio y

vocabulario de negocio, que son las entidades y elementos usados en

esquemas de negocio y otras definiciones de negocio.

Reportes y panel de control: estos metadatos contienen las especificaciones

y definiciones de informes de gestión, panel de control y cuadros de mando

(scorecards). Esto describe el contenido, estructura, coherencia, propietario y

argumento de todos los informes o reportes.

Políticas y procedimientos operacionales: estas son las normas o políticas

que describen los aspectos operacionales de la empresa. Unos ejemplos son:

o Procedimientos para manejar la relación con socios comerciales y

proveedores.

o Políticas de comunicación externa y reportes.

o Pautas de conducta de negocios.

Metadatos Técnicos: Los metadatos técnicos definen las estructura de los

sistemas informáticos, aplicaciones, sistemas de bases de datos, sistemas de

integración de información empresarial (EIIS), sistemas de gestión de datos

maestros (MDM), bodegas de datos (DW), incluyendo data mart y otros medios

técnicos. Idealmente, los metadatos técnicos son derivados de las

especificaciones funcionales y de negocio, donde una porción significante de

los metadatos técnicos son automáticamente generados por los sistemas

mencionados. Los metadatos técnicos se refieren a la ubicación de las fuentes

de datos, protocolos de acceso, esquemas físicos y lógicos de las fuentes de

datos, tales como modelos de entidad-relación, modelos de objetos y modelos

ontológicos. Los siguientes son ejemplos de metadatos técnicos:

51

o Modelo técnico: estos son los modelos de datos lógicos y físicos,

modelos multidimensionales como son procesamiento analítico en línea

(OLAP), procesamiento analítico en línea multidimensional (MOLAP),

procesamiento analítico en línea relacional (ROLAP) y otros cubos,

modelos de data-mining (incluyendo modelos predictivos), modelos de

datos maestros.

o Navegación de metadatos: esto describe la vinculación de datos y el

movimiento de datos dentro de los ambientes mencionados en el punto

anterior e incluye las jerarquías de negocio, lugares de origen y destino,

las especificaciones de asignación, las columnas y campos de origen,

diseño de la fuente de extracción de datos, diseño de transformación y

las especificaciones, normas de calidad de los datos, puntos de diseño,

campos derivados y campos y columnas destino.

o Metadatos operacionales: esto describe como se gestionan los datos

en un sistema desde la creación hasta su punto final. Estos metadatos

se utilizan para describir los aspectos del ciclo de vida de los datos

dentro de un sistema. Esto está relacionado con los trabajos en batchs

de aplicaciones y aplicaciones de integración de datos.

o Metadatos de despliegue: esto incluye artefactos relacionados con

SOA en la empresa, modelos de implementación, modelos de servicios

y su relación con modelos existentes como bases de datos.

o Metadatos de reportes y panel de control: esto incluye

especificaciones de reportes de inteligencia de negocio (BI), la

generación y programación de reportes de BI, el propietario y modelos

de uso.

o Metadatos de seguridad: esto incluye la autorización y autenticación

para acceder y modificar los metadatos, una matriz de seguridad para la

generación de metadatos (basada en sistemas y control de usuarios), y

una matriz de seguridad de uso para la exploración de metadatos.

52

o Metadatos de aplicaciones y sistemas: esto incluye nombre y

descripción, matriz de uso y propietario, datos de uso y alcance, y

control de versiones.

Fuentes de Metadatos: Que son las fuentes de metadatos? En otras palabras

donde suele encontrarse los metadatos de la empresa? Puede ser difícil llegar a

especificar una lista completa de todas las fuentes potenciales de metadatos. Sin

embargo, es posible identificar metadatos en los siguientes sistemas de IT y

partes de la empresa:

Sistemas operacionales: estos son, por ejemplo, sistemas específicos de la

industria como pueden ser sistemas bancarios, sistemas de soporte

operacional en telecomunicaciones y sistemas en el sector de seguros.

Software Middleware: los metadatos también se encuentran en todo el

software middleware, tales como software de integración de información

empresarial (EII), software de integración de aplicaciones empresariales (EAI)

y también en software de administración de contenidos empresariales (ECM).

Sistemas de Bases de Datos: todos los sistemas de gestión de bases de

datos contienen metadatos, tales como descripción de tablas, índices y otros

objetos de bases de datos. Estos metadatos son utilizados con propósitos de

mantenimiento y optimización.

Aplicaciones: esto incluye paquetes de aplicaciones como ERPs, CRMs,

aplicaciones web, aplicaciones móviles, etc.

Bodegas de Datos (DW): esto incluye metadatos contenidos en el DW y data

marts. Un ejemplo de metadatos en este contexto son los cubos OLAP.

Herramientas de reportes de BI: estos metadatos están relacionados con la

generación de tableros de control de inteligencia de negocios, mediciones de

KPIs y otros reportes análisis incluyendo los de propósito de gestión de

rendimiento.

53

Políticas y procedimientos: las políticas o al menos ciertos atributos de las

políticas podría ser considerada como metadatos. Por ejemplo, procedimientos

de copias de seguridad de una base de datos o realizar tareas de

mantenimiento de cualquier sistema o aplicación puede ser visto como una

descripción o un conjunto de órdenes que deben seguirse.

Procesos: esto aplica para procesos de negocio y técnicos por igual. Ellos son

caracterizados a través de atributos y especificaciones detalladas. Los

procesos de negocio también pueden ser vinculados a las regulaciones que se

deben cumplir.

Personas: los directores de proyectos, arquitectos de soluciones, socios y

también los clientes, son una de las mejores fuentes de metadatos y sus

conocimientos sobre los datos influye sobre la ejecución de los procesos de

negocio.

Datos Maestros

Los datos maestros son los objetos de negocio que se utilizan en las diferentes

aplicaciones de la empresa, junto con sus metadatos asociados, características,

definiciones, funciones, conexiones y taxonomías. Los datos maestros son las

“cosas” importantes que se registran en los sistemas operacionales, las que son

medidas y reportadas en los sistemas de información y analizadas en los sistemas

analíticos de la empresa. Algunos ejemplos de datos maestros son [21]:

Clientes

Proveedores

Productos

Cuentas

Contratos

Lugares

54

Los datos maestros tienden a existir en más de una línea de negocio dentro de la

organización, por lo que el cliente puede aparecer en el sistema de ventas como

también en el sistema de finanzas. Los datos maestros tienden a ser relativamente

estáticos y no cambian con frecuencia.

En la Figura 12se consideran los clientes de una empresa, donde cada cliente

puede participar en una serie de operaciones de negocio: ventas, finanzas,

servicio al cliente. Algunos de los clientes pueden participar en diferentes

contextos, tal vez como vendedores o proveedores. En cada uno de estos

contextos, el cliente puede desempeñar un papel diferente, y a su vez, la empresa

puede valorar algunos de los atributos sobre los demás en función del contexto.

Pero claramente quiere asegurarse de que los procesos de negocio no fracasen

porque el cliente aparece varias veces en diferentes conjuntos de datos y que las

actividades del cliente sean finalmente reflejadas en los informes de gestión [21].

Figura 12. Representación de la misma persona en diferentes contextos de aplicación [21]

55

Para el ejemplo anterior es conveniente que todas las aplicaciones de negocio

lleguen a un acuerdo sobre cuáles son las entidades y sus actividades. Podemos

resumir esto en dos objetivos:

Integrar las múltiples variaciones de las entidades empresariales en una sola

fuente de la verdad.

Permitir a las aplicaciones empresariales compartir la misma visión de los

objetos de negocio dentro de la empresa.

En otras palabras, se deben definir datos maestros como solución al ejemplo

mencionado anteriormente.

Gestión de datos maestros: La gestión de datos maestros (ahora en adelante

MDM por sus siglas en ingles), no es una tecnología o un producto específico,

MDM es un conjunto o mezcla de aplicaciones de negocio, métodos y

herramientas. Bajo este contexto se pueden poner en práctica las políticas,

procedimientos e infraestructura que soporte la captura, integración y posterior uso

compartido de datos maestros precisos, oportunos, consistentes y completos.

Enfoques arquitecturales de MDM: Pueden existir muchas formas de

implementar un repositorio de datos maestros. Aquí, analizaremos tres enfoques

arquitectónicos de forma conceptual para el desarrollo de un MDM, cada enfoque

frente a las diferentes necesidades de una organización. Es interesante notar, que

una vez que el concepto de MDM es aceptado dentro de una organización, es

relativamente fácil hacer la transición [22].

1. Sistema central de datos maestros: En un sistema central de datos maestros

(ver Figura 13), cada dominio de datos y cada conjunto de atributos asociados

56

a cada modelo de datos maestros es definido y gestionado dentro de un

sistema maestro único. El repositorio central es la fuente principal para la

gestión de los objetos de datos maestros que posteriormente son publicados a

los sistemas de aplicación. Los atributos básicos se gestionan localmente en

cada aplicación y son ligados a la instancia maestra mediante una llave

primaria global. En este enfoque, las instancias de nuevos datos pueden ser

creadas en cada aplicación, pero deben ser sincronizados con el sistema

central [21].

Figura 13. Sistema central de datos maestros [21]

57

Sistema maestro principal: En un sistema maestro principal (ver Figura 14), un

sistema de aplicación existente es seleccionado para ser el maestro, y otros

sistemas se vuelven dependientes de ese sistema, como el repositorio central. En

este enfoque los atributos básicos son creados y gestionados exclusivamente en

el maestro y debe existir un proceso para mapear objetos entre diferentes

sistemas.

Figura 14. Sistema maestro principal [21]

Repositorio central: Un repositorio central (ver Figura 15) se utiliza para

gestionar el sistema maestro principal y los datos no se replican en otros sistemas.

Las aplicaciones solicitan información al repositorio central y proporcionan

actualizaciones al repositorio central. Dato que solo existe un acopia de los datos

58

maestros, todas las aplicaciones son modificadas para interactuar con el

repositorio central, mediante un enfoque orientado a servicios.

Figura 15. Repositorio principal

Datos Operacionales

El concepto de datos operacionales se aplica a los datos estructurados creados y

utilizados por las transacciones comerciales y por lo tanto también se conoce

como datos transaccionales que describen lo que está pasando en el negocio.

59

Los datos operacionales son el nivel de granularidad de la información que tiene la

finalidad operativa de representar el detalle de la actividad diaria de una empresa.

En muchas industrias, las transacciones comerciales, tales como pedidos, facturas

y la información de cobros se consideran datos operativos.

Los datos operativos a menudo incorporan los datos maestros. Un ejemplo es el

cliente y el producto información utilizada para crear una orden. Sin embargo, al

caracterizar los datos operacionales, los requisitos de exactitud, exhaustividad,

coherencia, oportunidad, relevancia y la confianza a menudo no son tan altos

como para los datos maestros o datos analíticos. Esto es motivado por el hecho

de que los datos operativos se utilizan generalmente en un departamento o unidad

de negocio. Los datos maestros, por ejemplo, se propagan en toda la empresa [1].

Datos no Estructurados

Los datos no estructurados son también conocidos como contenido. Se denomina

datos no estructurados por razones de integridad, ya que es más amplio que lo

gestionado por un ECM. Los datos no estructurados no poseen definiciones de

tipo, no se encuentran organizados bajo algún patrón, no existe el concepto de

variables o atributos. Algunos ejemplos son: documentos de texto, hojas de

cálculo, imágenes de documentos escaneados, e-mail, paginas html, entre otros.

Estos tipos de datos generalmente se encuentran en un repositorio de

información, donde para recuperar este tipo de documentos solo podemos hacerlo

con el nombre del archivo.

Datos Analíticos

Los datos analíticos se derivan generalmente de poner los datos operacionales en

un contexto analítico. En algunos casos, los datos analíticos se producen por la

60

ejecución de informes directamente sobre el sistema operacional. Sin embargo el

caso más común es el movimiento de datos operacionales a sistemas de análisis

como una bodega de datos (de ahora en adelante DW por sus siglas en ingles).

Para un DW en un contexto empresarial, la transferencia de datos desde múltiples

sistemas operacionales hacia el DW, requiere la capacidad de un sistema de

integración de información empresarial (EII) [1].

Para los datos analíticos en un dominio de DW, los requerimientos para exactitud,

consistencia y relevancia son generalmente altos, porque las decisiones se toman

sobre la base de reportes estratégicos y tácticos de inteligencia de negocio (BI).

Por lo tanto los datos operacionales son típicamente estandarizados, limpiados,

organizados y duplicados para asegurar la precisión y consistencia mientras son

movidos a un DW, el cual es requerido para satisfacer las necesidades de

información [1].

Desde un punto de vista de integridad de datos, no todos los atributos son

relevantes para la elaboración de reportes. Por lo tanto, ciertos atributos de las

entidades de negocio como son las facturas o clientes pueden ser no necesarios

en un entorno analítico y se mantienen en sus sistemas operacionales o MDM. La

oportunidad de los datos analíticos depende del propósito analítico. Si un DW, por

ejemplo, es utilizado únicamente para presentar reportes de BI estratégicos o

tácticos, bastaría con cargar los datos operacionales del último mes en el DW, sin

importar los dos últimos días. Sin embargo si es necesario presentar reportes

sobre una base diaria, la oportunidad para obtener los datos operacionales y

moverlos al DW es significativamente mayor.

2.1.4.3 AIE y la arquitectura de datos

Se debe aclarar que la AIE no propone una metodología, ni un método, ni mucho

menos un framework para el desarrollo de proyectos de AI. Pero si define y

61

describe una serie de temas que se deben considerar cuando se habla de AI. A

diferencia de TOGAF y Zachman, en [1] se tocan temas cruciales como modelos

de madurez, dividir los datos empresariales en dominios, también propone un

modelo de referencia para gobierno de datos, a diferencia de TOGAF que solo

menciona este tema y Zachman que sencillamente lo ignora.

El trabajo en [1] es muy importante también porque describe extensamente cada

uno de los dominios de datos y tocando temas como: escenarios de negocio para

cada dominio, escenarios operacionales, diagramas, aseguramiento de calidad y

enfoques arquitecturales entre otros.

2.1.5 Análisis

Como se puede apreciar, las propuestas son diferentes y afirmar que una es mejor

que otra, es muy difícil; la respuesta seria “depende”, depende de las necesidades

de la empresa o proyecto. Los niveles de calificación son una propuesta de Roger

Session para comparar metodologías de AE. Aquí se utilizaran para evaluar las

metodologías de AE particularmente en el aspecto de AI. Los niveles de

calificación son:

1. Hace un trabajo muy pobre en esta área.

2. Hace un mal trabajo en esta área.

3. Hace un trabajo aceptable en esta área.

4. Hace un muy buen trabajo en esta área.

A continuación se realizara una comparación teniendo en cuenta 8 criterios que

son relevantes a la hora de realizar o ejecutar un proyecto de AI:

1. Proveedor neutral: se refiere al hecho de no estar sujeto a un proveedor

específico y estar pagando licencias, mantenimiento o consultorías, siempre a

la misma empresa.

62

2. Información disponible y de acceso público: se refiere al hecho de tener

información disponible sin costo alguno. Información completa de la

metodología.

3. Modelo de Referencia para el alcance del proyecto: se refiere al hecho de

proponer modelos de referencia específicamente para definir el alcance en los

proyectos de AI.

4. Modelo de Referencia para Gobierno de datos: se refiere al hecho de tener un

modelo de referencia para la definición de gobierno de datos en AI.

5. Modelo de Referencia para Datos Empresariales: se refiere al hecho de

proporcionar un modelo de referencia para segmentar o dividir los datos

empresariales en dominios.

6. Modelos de Madurez en Arquitectura de Datos: se refiere al hecho de

proporcionar un modelo que permita definir una medida de avance o progreso

de la AI en la empresa.

7. Guía Metodológica: se refiere al hecho de proporcionar un proceso paso a

paso principalmente del cómo desarrollar un proyecto de AI.

8. Gestión de Datos: se refiere al hecho de proporcionar un método estructurado

que permita entender el uso u operaciones que la empresa realiza sobre los

datos.

CRITERIOS CALIFICACION

TOGAF ZACHMAN AIE FEA

Proveedor neutral 4 1 1 3

Información disponible y de acceso público 4 2 3 4

Modelo de Referencia para el alcance del proyecto 1 1 1 1

Modelo de Referencia para Gobierno de datos 1 1 4 1

Modelo de Referencia para Datos Empresariales 1 1 4 1

Modelos de Madurez en Arquitectura de Datos 1 1 1 1

Guía Metodológica 2 1 1 2

Gestión de Datos 3 1 2 3

Tabla 1. Evaluación de criterios por cada uno de los enfoques de AE

63

En la Tabla 1 se observa que cada una de los enfoques de AE tiene sus fortalezas

y debilidades. Uno de los objetivo de este trabajo es proponer una metodología

que agrupe las fortalezas y además complemente los aspectos que presentan

debilidades en cada uno de los enfoques evaluados en la Tabla 1.

.

2.2 GOBIERNO DE DATOS

El Gobierno de Datos es la disciplina que se encarga de tratarlos datos como un

activo de la empresa. Se trata del ejercicio de las políticas de decisión para

optimizar, proteger y aprovechar los datos como un activo empresarial. Se trata de

la orquestación de las personas, procesos, la tecnología y la política dentro de una

organización, para obtener el óptimo valor de los datos de la empresa. El Gobierno

de Datos desempeña un papel fundamental en la alineación de políticas dispares

ya menudo conflictivas que causan anomalías en los datos maestros. El gobierno

de datos define quien tiene los derechos y la responsabilidad de la toma de

decisiones sobre los datos de una empresa [26].

2.2.1 Diseñando gobierno de datos por Vijay Khatri y Carol V. Brown

El framework para gobierno de datos (ver Tabla 2) incluye 5 dominios de toma de

decisión relacionados entre sí [18]. En la Tabla 3 se resume el alcance de cada

uno de los dominios de decisión con ejemplos de los tipos de decisión que se

deben tomar en cada dominio. En la última columna de la tabla se proporcionan

ejemplos de los posibles roles que pueden ser establecidos para la toma de

decisiones en los diferentes dominios.

64

Tabla 2. Dominios de decisión para gobierno de datos [18]

Tabla 3. Framework para los dominios de decisión de datos

65

2.2.1.1 Principios de datos

Los principios de datos establecen el enlace con el negocio. Para alinear el

negocio con el uso de los datos, los principios de datos establecen la medida de

los datos como un activo de la empresa y por lo tanto definen cuales son las

políticas específicas, normas y directrices adecuadas. Manteniendo la noción de

los datos como un activo los principios de datos también establecen y fomentan

oportunidades para compartir y reusar los datos. Cada principio es apoyado por

una razón fundamental y un conjunto de implicaciones [18].

2.2.1.2 Calidad de los datos

La calidad de los datos impacta a la empresa a nivel operacional y a nivel

estratégico. Una pobre calidad en los datos genera costos operacionales y en lo

estratégico la información no es confiable para la toma de decisiones estratégicas.

La calidad de los datos se refiere a la capacidad que tienen los datos para

satisfacer los requerimientos de uso dentro de la empresa. La calidad de los datos

tiene múltiples dimensiones como: precisión, oportunidad, integridad y credibilidad,

estas dimensiones son relativas y deben ser definidas de acuerdo al contexto de

uso de los datos [18].

2.2.1.3 Metadatos

Se define como los “datos sobre los datos”, los metadatos proporcionan un

mecanismo para obtener una descripción concisa y coherente de los datos,

ayudando así a interpretar el significado o la semántica de los datos [18].

66

2.2.1.4 Acceso a Datos

Acceso a los datos se basa en la capacidad de los beneficiarios de datos para

asignar un valor a las diferentes categorías de datos. Un Análisis de riesgos

efectivo por parte de agentes de seguridad de datos, consiste en identificar las

necesidades de datos de la empresa y definir políticas que garanticen la

confidencialidad, integridad y disponibilidad de los datos.

2.2.1.5 Ciclo de Vida de los Datos

Ser consciente de que todos los datos se mueven a través de las etapas del ciclo

de vida es fundamental para el diseño de la gobernabilidad de datos. Mediante la

comprensión de cómo los datos se utilizan, y cuánto tiempo debe conservarse, las

organizaciones pueden desarrollar métodos para asignar los patrones de uso de

los medios de almacenamiento óptimo, lo que minimiza el costo total de

almacenamiento de datos a través de su ciclo de vida.

2.2.2 El proceso unificado de gobierno de datos de IBM

Muchas empresas vienen de un procedimiento manual que establece los pasos

para implementar un programa de gobierno de datos. Obviamente, todas las

empresas pondrán en práctica la gobernanza de datos de manera diferente, sobre

todo debido a los diferentes objetivos de las empresas. Algunas empresas podrían

centrarse en la calidad de los datos, otros en los clientes, y otros más en asegurar

la privacidad de los datos sensibles de los clientes. Algunas organizaciones

adoptaran un programa de Gobierno de Datos formal, mientras que otras querrán

poner en práctica algo que es más ligero y táctico [26].

67

Figura 16. Visión general del proceso unificado de gobierno de datos de IBM

La Figura 16muestra los diez pasos (pasos del 1-9 y 14) necesarios para sentar

las bases de un efectivo programa de Gobierno de Datos. La empresa entonces

selecciona uno o más de los cuatro pasos opcionales, es decir: Gobierno de Datos

Maestros, Gobierno Analítico, Gestión de Seguridad y Privacidad y la gestión del

Ciclo de Vida de la Información. Finalmente, el proceso unificado de gobierno de

datos necesita ser medido, y los resultados transmitidos periódicamente a los

sponsor ejecutivos [26].

Veamos con más detalle cada uno de los pasos:

Definir el problema de negocio: La razón principal de fracaso de los

programas de gobierno de datos es que no identifican un problema de negocio

tangible. Es imperativo que la organización defina el alcance inicial del

programa de gobierno de datos en torno a un problema de negocio específico,

68

como un problema en auditoría, una pérdida de datos, o la necesidad de

mejorar la calidad de los datos con fines de gestión de riesgos. Una vez que el

programa de gobierno de datos comienza a hacer frente a los problemas

identificados de negocio, este recibirá el apoyo de las funciones de negocio

para ampliar su alcance a otras zonas.

Obtener patrocinio ejecutivo: Es importante establecer el patrocinio

principalmente de ejecutivos de TI y negocio para el programa de gobierno de

datos. La mejor manera de obtener patrocinio es definir el valor en términos de

un caso de negocio. Por ejemplo, el caso de negocio podría ser enfocado en

perfilamiento de clientes, en mejorar la calidad de los datos para apoyar un

programa centrado en el cliente.

Realizar una evaluación de madurez: Toda organización necesita llevar a

cabo una evaluación de madurez de su gobierno, de preferencia sobre un

periodo de tiempo anual. El IBM Data Governance Council ha desarrollado un

modelo de madurez basado en 11 categorías (ver capítulo 5 en [26]), tales

como “Gestión de Riesgos de Datos y Cumplimiento”, “Creación de Valor”, y

“Administración”. La organización de Gobierno de Datos debe evaluar el nivel

actual de madurez (estado actual) y el nivel futuro deseado de la madurez

(estado futuro), que suele ser de 12 a 18 meses por lo menos. Esta duración

debe ser suficiente para producir resultados, pero lo suficientemente corto

como para asegurar la continua aceptación por parte de las principales partes

interesadas.

Construir un mapa de proyectos: La organización de Gobierno de Datos

debe desarrollar un plan de trabajo para cerrar la brecha entre el estado actual

y el estado futuro deseado para las 11 categorías de madurez de la

gobernabilidad de datos. Por ejemplo, la organización de gobierno de datos

podría revisar la brecha de vencimientos para la administración y determinar

que la empresa debe nombrar a los administradores de datos para centrarse

en temas específicos tales como clientes, proveedores, y producto. El

69

programa de gobierno de datos también debe incluir éxitos rápidos, áreas

donde la iniciativa puede generar valor al negocio en plazos cortos.

Establecer un modelo de organización: La organización de gobierno de

datos debe construir un modelo para dirigir sus operaciones, y para asegurar

quien tiene la autoridad suficiente para actuar como árbitro en situaciones

críticas. La organización de gobierno de datos funciona mejor en un formato de

tres niveles. El nivel superior es el Consejo de Gobierno de Datos, que se

compone de los principales líderes funcionales y de negocio que dependen de

los datos como un activo de la empresa. El nivel intermedio es el grupo de

gobierno de datos de trabajo, que consiste en los mandos medios que se

reúnen con más frecuencia. El último nivel consiste en la comunidad de

administradores de datos, que es responsable de la calidad de los datos en el

día a día.

Construir el diccionario de datos: La gestión eficaz de los términos de

negocios puede ayudar a asegurar que el mismo lenguaje descriptivo se aplica

en toda la organización. Un diccionario de datos o glosario de negocio es un

repositorio con las definiciones de los principales términos. Se utiliza para

obtener la consistencia y el acuerdo entre las partes técnicas y de negocio de

una organización. Por ejemplo, ¿cuál es la definición de un “cliente”? Es un

cliente alguien que ha hecho una compra, o alguien que está considerando

hacer una compra? Es un antiguo empleado todavía clasificado como un

“empleado”?, Son los términos “socio” y “distribuidor” sinónimos?, Estas

preguntas pueden ser contestadas mediante la construcción de un diccionario

común de datos. Una vez implementado, el diccionario de datos puede abarcar

toda la organización para asegurar que los términos de negocios están

vinculados a través de metadatos a los términos técnicos, y que la

organización tiene un entendimiento único y común.

Comprender los datos: Alguien dijo una vez: “No se puede gobernar lo que

no entendemos”. Hoy en día existen pocas aplicaciones standalone. Los datos

más bien, se componen de los sistemas, y “sistemas de sistemas”, con

70

aplicaciones y bases de datos esparcidos por toda la empresa, pero

integrados, o están relacionados entre sí por lo menos. El modelo de base de

datos relacional en realidad empeora las cosas mediante la fragmentación de

las entidades de negocio para su almacenamiento. Pero, ¿cómo está todo lo

relacionado? El equipo de gobierno de datos necesita descubrir las relaciones

entre los datos críticos en toda la empresa. El descubrimiento de datos puede

incluir relaciones simples y difíciles de encontrar, así como la ubicación de los

datos sensibles dentro de los sistemas de TI de la empresa.

Crear un repositorio de metadatos: Los metadatos son datos acerca de los

datos. Se trata de información sobre las características de cualquier artefacto

de datos, como su nombre técnico, la razón social, ubicación, la importancia y

relaciones con los artefactos de datos de la empresa. El programa de gobierno

de datos va a generar una gran cantidad de metadatos de negocio desde el

diccionario de datos y una gran cantidad de metadatos técnicos durante la fase

de descubrimiento. Estos metadatos debe ser almacenado en un repositorio

para que pueda ser compartido y aprovechado en varios proyectos.

Definir métricas: El gobierno de datos debe contar con indicadores sólidos

para medir y monitorear el progreso. El equipo de gobierno de datos debe

reconocer que cuando se mide algo, mejora el rendimiento. Como resultado, el

equipo de gobierno de datos debe recoger unos pocos indicadores principales

de rendimiento (KPIs) para medir el desempeño continuo del programa.

Estos son los nueve primeros pasos requeridos. El paso final requerido se discute

más adelante. La empresa también tiene que seleccionar al menos una de los

cuatro pasos de datos opcionales de Gobierno (Gobierno de Datos Maestros,

análisis de Gobierno, Seguridad y privacidad, y la información del ciclo de vida de

Gobierno).

Gobierno de datos maestros: La información más valiosa dentro de una

empresa son los datos críticos de negocio como los clientes, productos,

71

materiales, proveedores y cuentas, que comúnmente se conoce como datos

maestros. A pesar de su importancia, los datos maestros a menudo se replican

y se dispersan a través de procesos de negocio, sistemas y aplicaciones en

toda la empresa. El gobierno de datos maestros es una práctica continua,

mediante el cual los empresarios definen los principios, políticas, procesos,

reglas de negocio y métricas para la consecución de los objetivos de negocio,

mediante la gestión de la calidad de sus datos maestros.

Gobierno de análisis: Las empresas han invertido grandes sumas de dinero

para construir bodegas de datos para obtener una perspectiva competitiva. Sin

embargo, estas inversiones no siempre han dado resultados, como

consecuencia, las empresas están cada vez más examinando sus inversiones

en el análisis. Se define el “Análisis de Gobernabilidad” como el

establecimiento de políticas y procedimientos para alinear mejor a los usuarios

de negocio con las inversiones en infraestructura analítica.

Gestionar la seguridad y privacidad: El líder del gobierno de datos,

especialmente los que informan al jefe de seguridad de la información, a

menudo tienen que lidiar con cuestiones relacionadas con la seguridad de los

datos y la privacidad. Algunos de los retos comunes de seguridad de datos y

desafíos de privacidad que incluyen los siguientes:

o Donde esta nuestra información confidencial?.

o La organización ha enmascarado sus datos confidenciales en los

entornos que no son de producción (desarrollo, pruebas y capacitación)

para cumplir con las regulaciones de privacidad?.

o Están los controles de auditoría de base de datos en el lugar para evitar

el acceso de los usuarios privilegiados, por ejemplo, como

administradores de bases, a los datos privados, como los sueldos de los

empleados y listas de clientes?

Gobierno del ciclo de vida de la información: El ciclo de vida de la

información se inicia con la creación de datos y termina con su extracción de la

72

producción. La organización de gobierno de datos tiene que lidiar con las

siguientes cuestiones relativas al ciclo de vida de la información:

o ¿Cuál es nuestra política respecto a la digitalización de documentos de

papel?

o ¿Cómo introducir los datos estructurados y no estructurados bajo un

marco común de políticas y de gestión?

Medir los resultados: La organización de gobierno de datos debe asegurar la

mejora continua mediante un seguimiento constante de las métricas. En el

paso 9, el equipo de gobierno de datos establece las métricas. En esta etapa,

el equipo de Gobierno Datos informa sobre los avances contra esas métricas a

las partes interesadas de alto nivel de TI y el negocio.

2.2.3 Gobierno de datos: ¿Qué funciona y que no? por Rob Karel

El Gobierno de Datos no es un concepto nuevo. Profesionales de la gestión del

conocimiento y la información han luchado con la calidad y la confidencialidad en

los datos la mayor parte de la historia de la computación. Lo que ha cambiado en

la última década es la constatación de que los datos no sólo tienen valor dentro de

la aplicación y los usuarios que los capturan, sino en toda la organización también.

Esta demanda de funciones y arquitecturas cruzadas de los mismos datos está

obligando a las empresas y los líderes de TI, por primera vez a reconocer las

dependencias y las percepciones de conflicto de valor de los datos. Muchos

gerentes de información están apostando al gobierno de datos para mitigar el

aumento de estos conflictos. Forrester define la gobernabilidad de datos como:

“El proceso por el cual una organización formaliza el deber fiduciario para la

gestión de los activos de datos críticos para su éxito”.

73

2.2.3.1 Catalizadores de Gobierno de Datos

Las iniciativas comunes de gestión de información que impulsan la necesidad de

un gobierno de datos son: cumplimiento de normas o políticas de uso de los datos,

migración de datos legados, fusiones y adquisiciones, BI operacional, data

warehousing empresarial, IaaS, gestión de datos maestros, gestión de metadatos,

entre otros.

2.2.3.2 Framework de gobierno de datos

Varios roles y responsabilidades deben ser definidos y asignados de forma

apropiada en un programa de gobierno de datos, Forrester en la Figura 1 define

cuatro roles principales para el gobierno de datos:

Figura 17. Roles y responsabilidades [22]

2.2.3.3 Inhibidores de la Adopción de un Gobierno de Datos

Los inhibidores del éxito de un gobierno de datos comúnmente son: falta de

participación del negocio, la falta de un modelo de negocio y ambigüedad en el

retorno de la inversión, alcance poco realista, entre otros.

74

2.2.3.4 Preparación del gobierno de datos

Al momento de diseñar una metodología para gobierno de datos para una

empresa, se deben considerar los siguientes temas:

Evangelización: apoyo ejecutivo y definir el enfoque requerido para empezar.

Alcance: como definir el alcance y enfocarse en los datos más críticos?.

Propiedad: quien debe ser el titular o propietario de los datos críticos?

Programa de Gestión: quien lidera el programa el negocio o IT?

Estructura de la empresa: la empresa es centralizada, descentralizada o mixta?

Dotación de Personal: la dedicación de tiempo de los roles es medio tiempo o

tiempo completo? Existe personal con las capacidades adecuadas?

Financiación: de donde vienen los fondos? O se puede sustentar de un proyecto

ya existente?

Motivador de negocio: cuál es el mejor motivador de negocio que ayude a

construir el caso de negocio para el gobierno de datos?.

Inhibidores: cuales son los principales inhibidores?.

Plazo: la empresa está preparada? Si no es ahora entonces cuando?

2.2.3.5 Diseñe el gobierno basado en la cultura de la empresa

Acéptalo desde el principio: la cultura existente de su empresa no va a cambiar

para apoyar el gobierno de datos, así que en su lugar trabajamos para entender su

cultura y aprovechar sus puntos fuertes. Por ejemplo, en una cultura donde cada

unidad de negocio opera de forma independiente y da prioridad a su propia

dirección estratégica, será apropiado fomentar un enfoque de gobierno de datos

75

descentralizado, donde expertos en la materia en diferentes unidades de negocio

colaboren unos con otros, evitando así un rol de liderazgo centralizado pueda ser

visto como una amenaza.

Iniciar poco a poco e ir creciendo: iniciar un programa de gobierno de datos

como parte de un proyecto financiado por la gestión de datos. Muchas empresas

ponen en marcha el gobierno dentro de un proyecto de BI o DW, una iniciativa

MDM, o dentro de un CRM o ERP.

Definir los patrocinadores ejecutivos y administradores de datos desde el

comienzo y utilizarlos como sus evangelistas: El éxito de los programas de

gobierno de datos puede comenzar como un esfuerzo comunitario, pero no muy a

menudo. La mayoría de las organizaciones requieren de arriba hacia abajo las

prioridades para lograr cambios reales en la gestión y calidad de los datos.

No olvidar el caso de negocio: Usar medidas cualitativas y cuantitativas de las

principales funciones de negocio, tales como marketing, finanzas, ventas

y operaciones de call center, para justificar los programas de gobierno.

Incluir la participación en las metas del empleado: Nada mata a un programa

de gestión de datos más rápido que esperar que la participación voluntaria.

Premiar a los administradores en las evaluaciones de su desempeño mediante el

reconocimiento de su participación y las contribuciones. Y si algunos no colaboran,

escalar a su jefe directo.

Dar Prioridad a un Enfoque Centralizado: las decisiones a nivel corporativo

deben ser manejadas de forma centralizada, pero los datos relevantes para una

sola línea de negocio pueden ser manejados de forma descentralizada.

76

2.2.4 Análisis

Se pueden observar que existen diversas propuestas para gobierno de datos y

muy diversas entre sí, cada propuesta aborda el tema desde perspectivas muy

diferentes y abordan temas igualmente importantes. Los niveles de calificación son

una propuesta de Roger Session para comparar metodologías de AE. Aquí se

utilizaran para evaluar las propuestas de Gobierno de Datos. Los niveles de

calificación son:

1. Hace un trabajo muy pobre en esta área.

2. Hace un mal trabajo en esta área.

3. Hace un trabajo aceptable en esta área.

4. Hace un muy buen trabajo en esta área.

A continuación se realizara una comparación teniendo en cuenta 5 criterios que

son relevantes a la hora de iniciar un proyecto de Gobierno de Datos:

1. Guía Metodológica: se refiere al hecho de proporcionar un proceso paso a

paso principalmente del cómo iniciar e implementar un proyecto de Gobierno

de Datos.

2. Modelo de Madurez: se refiere al hecho de proporcionar un modelo que

permita definir una medida de avance o progreso del Gobierno de Datos en la

empresa.

3. Preparación del Gobierno de Datos: se refiere al hecho de proporcionar

información sobre los aspectos que se deben considerar previamente a iniciar

un esfuerzo formal de implantación de un Gobierno de Datos.

4. Diseño del Gobierno de Datos: se refiere al hecho de proporcionar una forma o

método a seguir para diseñar el Gobierno de Datos.

5. Información disponible y de acceso público: se refiere al hecho de tener

información disponible sin costo alguno. Información completa de la

metodología.

77

CRITERIOS CALIFICACION

Vijay Khatri y Carol V. Brown AIE

Rob Karel (Forrester)

Guía metodología 1 4 2

Modelo de madurez 1 4 1

Preparación 1 1 4

Diseño 1 1 4

Información disponible 3 4 3

Tabla 4.Evaluación de criterios por cada uno de las propuestas de gobierno de datos

En la Tabla 4 se puede apreciar que cada una de las propuestas de Gobierno de

Datos tiene aspectos importantes y también podemos observar que la debilidad de

una es la fortaleza de otra. Uno de los objetivo de este trabajo es proponer un

modelo de referencia para Gobierno de Datos, que agrupe las fortalezas y además

complemente eliminando las debilidades que presentan cada una de las

propuestas evaluadas en la Tabla 4.

78

3. FRAMEWORK DE ARQUITECTURA DE INFORMACION EN UN CONTEXTO

DE ARQUITECTURA EMPRESARIAL (FAI)

Se habla de Arquitectura Empresarial porque corresponde a una forma de

representar una empresa donde se consideran todos y cada uno de los elementos

que la componen, incluyendo la relación entre los principales activos como

procesos, estrategias, datos, aplicaciones y tecnología [27]. En la Figura 18 se

observan las dimensiones que componen una Arquitectura Empresarial y sus

respectivas relaciones:

Figura 18. Dimensiones de AE y sus relaciones [27]

Como se puede apreciar en la Figura 18, la arquitectura de información es uno de

los elementos principales en la arquitectura empresarial donde los datos se ven

como un activo más de la empresa otorgando la importancia que realmente tienen

como recurso estratégico para el negocio. En consecuencia es necesario estudiar

diferentes técnicas y tecnologías de integración de datos, enfoques arquitecturales

y productos que pueden ser utilizados para compartir, intercambiar e integrar

datos e información en las empresas.

79

También se puede observar que la arquitectura de información se relaciona

directamente con el negocio, aplicaciones e infraestructura mediante las

relaciones A, C y D respectivamente. Estas relaciones muestran que la

arquitectura de información debe estar alineada con las otras dimensiones y que

cualquier esfuerzo que se realice a nivel de datos debe responder a necesidades

del negocio o de aplicaciones.

En el análisis del estado del arte se analizaron tres enfoques de arquitectura

empresarial y se enfatizó en el tema de Arquitectura de Información (de ahora en

adelante AI) donde se descubrieron vacíos tales como:

Ausencia de una guía metodológica para el desarrollo de proyectos de AI.

Carencia de un modelo de referencia para la definición del alcance de un

proyecto de AI.

Insuficiencia de los modelos de referencia para la definición de un Gobierno

de Datos.

Insuficiencia de las guías metodológicas para el diseño de Gobierno de Datos.

Falta de un repositorio de recursos para el desarrollo de proyectos de AI.

El objetivo principal de esta propuesta es proponer un framework para el

desarrollo de proyectos de AI, que responda a temas como: una guía metodología

para el desarrollo de proyectos de AI, una guía metodológica para el diseño de

gobierno de datos, definición de un repositorio de recursos para el desarrollo de

proyectos de AI y definición de un repositorio de AI.

Con esta propuesta también se quiere dejara un lado el alto nivel de abstracción

existente en los framework de AE y alcanzar el nivel de detalle necesario que le

permita convertirse en una herramienta de apoyo eficiente para el desarrollo de

proyectos de AI.

Los elementos estructurales de esta propuesta fueron tomados de TOGAF [16] e

IBM [1]. Las etapas como: Preparación, Modelos de Referencia, Estado Actual de

80

AI, Estado Deseado de AI y Mapa de Proyectos, son tomadas del Framework de

arquitectura empresarial TOGAF. Pero las actividades que se deben realizar

dentro de cada etapa son propias de esta propuesta metodológica.

A continuación se detalla el contenido de cada una de las secciones de este

capítulo:

En la sección 3.1 se presentan los elementos estructurales del FAI y se hace una

descripción global de cada uno.

En la sección 3.2 se describe y explica paso a paso las metodologías propuestas

para el proyecto inicial y para gobierno de datos. La metodología para proyectos

particulares no está dentro del alcance de este trabajo, pero se hace una

descripción global.

3.1 Elementos estructurales del framework

Consta de tres elementos principales que son el repositorio de recursos, el

repositorio de arquitectura y las metodologías. En la Figura 19 se muestran los

elementos estructurales.

Figura 19. Elementos estructurales del framework de AI

81

Los recursos como modelos de referencia, herramientas tecnológicas, plantillas,

matrices, métodos de calidad de datos, técnicas de integración de datos, entre

otros, son utilizados por las metodologías para el desarrollo del proyecto inicial, los

proyectos particulares y el proyecto de gobierno de datos. Las metodologías

también crean y consultan artefactos del repositorio de arquitectura que son

generados por proyectos finalizados o proyectos en curso de AI.

El principio para organizar el FAI en los elementos estructurales presentados en la

Figura 19 fue tomado de TOGAF, donde se habla de repositorios de arquitectura

que son consumidos durante el desarrollo de las AI, bien sea para consultar, editar

o crear recursos.

3.1.1 Repositorio de recursos

La principal ventaja de crear un repositorio de recursos es poder gestionar, difundir

y facilitar el acceso a material técnico con información de interés para el desarrollo

de proyectos de AI. Una propuesta de lo que se debe encontrar en el repositorio

de recursos es:

Modelos de referencia

o Dominios de datos

o Gobierno de datos

o Alcance de proyectos de AI

o Modelos de madurez

Matrices

Plantillas

Método para calidad de datos

Herramientas tecnológicas

Diagramas

o Modelo conceptual

82

o Ciclo de vida de los datos

o Diseminación de datos

Principios de datos

Enfoques arquitecturales para MDM

Técnicas de integración de datos

Los recursos que aparecen de color negro en la Figura 20, son propuestas que

surgen como producto del análisis de los frameworks de AE en el tema de AI y

que llegan a cubrir varios de los vacíos que presentan estos frameworks.

Figura 20. Repositorio de recursos de AI

83

3.1.2 Metodologías

Se plantean 3 metodologías que se deben considerar en un trabajo de AI. Cada

una de las metodologías consta estructuralmente de una serie de pasos o

actividades que se desarrollan de forma ordenada e iterativa. Por cada actividad

se describe cuáles son las entradas necesarias para la ejecución, cuales son los

roles involucrados y cuáles son los artefactos que produce. En la Figura 21 se

presentan las tres metodologías que hacen parte del FAI.

Figura 21. Metodologías para Proyectos de AI

Estas tres metodologías nacen como producto del análisis de la revisión

bibliográfica, donde se identificó principalmente el vacío de guías metodológicas

con el detalle necesario para facilitar el desarrollo de las AI.

3.1.3 Repositorio de arquitectura

La ejecución de cada una de las metodologías durante el desarrollo de los

proyectos involucrados en la AI, producirá una serie de artefactos como resultado

de los esfuerzos realizados en la ejecución de las actividades propuestas por cada

una de las metodologías. Estos artefactos deben ser almacenados en un

repositorio de arquitectura y TOGAF proporciona un modelo de cómo se debe

84

estructurar y almacenar los artefactos producidos de forma consistente y

estructurada.

El alcance de este trabajo no cubre una descripción y explicación detallada sobre

el repositorio de arquitectura. Pero en TOGAF [16] se puede encontrar mayor

información al respecto.

3.2 Metodologías

En esta sección se describen las tres metodologías que guían paso a paso el

desarrollo de un proyecto de AI. A continuación se describe el contenido de esta

sección:

En la sección 3.2.1 se describe la metodología que se debe seguir en el proyecto

inicial de una AI. Se describen los elementos estructurales de la metodología y las

actividades que los conforman.

En la sección 3.2.2 se describe la metodología que se propone para el diseño y

gestión de un gobierno de datos.

La guía metodología para el desarrollo de los proyectos particulares no está en el

alcance de este trabajo.

3.2.1 Guía Metodológica para el proyecto inicial

El objetivo principal del proyecto inicial es conocer la empresa y entender sus

procesos de negocio, cómo genera valor, cuáles son sus clientes, identificar cual

es la situación actual de los datos en la empresa, cuáles son las necesidades y

situación deseada que demanda el negocio. Además se debe crear un mapa de

proyectos priorizados que permita superar la brecha que existe entre la situación

actual y la deseada.

85

En la elaboración de esta guía metodológica se tomaron elementos de los

frameworks de AE Zachman, FEAF, TOGAF, la propuesta de IBM y también

propuestas originales.

3.2.1.1 Elementos estructurales

En la Figura 22 se muestran los elementos estructurales de la propuesta

metodológica. La primera etapa se realiza una vez y después se ejecutan las

demás etapas iterativamente durante el trabajo de AI. Aunque el proyecto inicial es

uno solo, este se puede dividir en varias etapas que cubren temas específicos

como: dimensiones de datos, dimensiones de calidad de datos, seguridad de los

datos y gobierno de datos.

Figura 22. Elementos Estructurales Metodología Proyecto Inicial

86

3.2.1.2 Desarrollo metodológico

Esta propuesta plantea una secuencia metodológica de 4 etapas (ver Figura 22)

que se aplican al proyecto inicial de AI. Para cada una de las etapas se plantea

una serie de actividades que guían un desarrollo ordenado y estructurado.

También se sugiere el uso de algunas herramientas con fines específicos. Cada

usuario está en libertad de extender o adaptar la metodología según sus

necesidades. Se recomienda que los artefactos generados en cada una de las

actividades sean almacenados en un repositorio empresarial.

El principio para definir las cuatro etapas de Preparación, Estado Actual, Estado

Deseado y Mapa de Proyectos de forma muy general, se toma de TOGAF y FEAF.

Preparación

Como se ilustra en la Figura 23, la etapa de Preparación es el primer paso en la

metodología del proyecto inicial. Este paso dará la orientación que se necesita

para conocer el contexto de la empresa.

Figura 23. Etapa de preparación de la metodología del proyecto inicial

87

En esta etapa se debe tener un primer acercamiento mediante una reunión que

formalice el inicio del proyecto y se presente cada uno de los involucrados en el

proyecto de AI.

El objetivo principal es conocer la empresa y su modelo de negocio, identificando

su naturaleza, a través de su misión, visión, organigrama, motivadores y

estrategias de negocio. En esta etapa es importante identificar dentro de la

empresa los grupos de trabajo implicados en la AI y que apoyaran el grupo

responsable de la AI. También se debe definir el alcance de la AI y las

herramientas y técnicas que deben ser utilizadas. Las actividades a realizar se

muestran en la Figura 24.

Figura 24. Actividades en la etapa de preparación

La etapa de preparación se empieza explicando cuales son los grupos de trabajo

que se deben crear dentro de la empresa para apoyar el desarrollo de la AI. Se

continua con la explicación de lo que se debe hacer para conocer el contexto de la

organización o empresa. Posteriormente se explican tres actividades

complementarias que no tienen un orden de ejecución ni dependencia. En el

Alcance de AI se explica cómo definir el alcance de una AI. En la actividad de

Modelos de Referencia se proponen varios modelos de referencia que apoyaran el

88

desarrollo de la AI y en la actividad de Herramientas y Técnicas se describen

diversas herramientas tecnológicas y técnicas de modelamiento de datos que

existen y ayudaran a entender la complejidad de los datos empresariales.

Grupos de Apoyo

Entradas: Organigrama

Salidas: Definición de grupos de Apoyo.

En esta actividad se identifican los actores a diferentes niveles dentro de la

empresa y que tienen una relación directa con el desarrollo del proyecto de AI. El

objetivo es clasificarlos en grupos de trabajo con responsabilidades definidas

dentro del proyecto de AI, cada uno de estos grupos es un elemento que conoce

el funcionamiento de la empresa desde su perspectiva, ya sea a nivel estratégico,

negocio o técnico.

Los grupos de trabajo apoyaran al grupo de AI a levantar y validar la información

de cómo la empresa funciona en su estado actual, de cuáles son sus motivadores

de negocio, de cómo se visualiza la empresa en un futuro cercano.

Figura 25. Grupos de trabajo

Grupo estrategico

Grupo de negocio

Grupo de arquitectura

89

Los grupos de trabajo o apoyo tienen su origen en la propuesta de IBM, donde

recomienda definir organizacionalmente una estructura con responsabilidades

claras para el desarrollo de una AI.

Grupo estratégico: conformado por los altos ejecutivos de la organización, como

el CEO, FEO, CIO y los dueños de cada uno de los temas estratégicos, como el

aspecto financiero, relación con el cliente y ejecución de procesos principales.

Este grupo es responsable de promover la ejecución de los procesos estratégicos

y lideran el cambio positivo al interior de la organización, mostrando de esta forma

su nivel de compromiso con las metas planteadas.

La responsabilidad de este grupo de apoyo es ayudar al grupo de AI a conocer la

empresa e identificar el modelo de negocio. Para esto es importante suministrar la

información disponible que se encuentre en documentos oficiales de la empresa.

Si no existe la información disponible formalmente en documentos, se debe

programar reuniones, para realizar el levantamiento respectivo de la información

necesaria.

Grupo de negocio: este grupo está integrado por los líderes de las unidades de

negocio, usuarios dueños de procesos y analistas con un alto nivel de experiencia

del negocio y de las operaciones que se realizan. Son quienes en realidad

conocen como funciona la organización.

La responsabilidad de este grupo en el proyecto de AI, es suministrar la

información necesaria para identificar y modelar los procesos de negocio, que

representan la operación diaria del negocio. Esto es vital para poder identificar la

situación actual de la empresa.

Grupo de Arquitectura: los miembros de este grupo conocen a fondo los

recursos de tecnología disponibles en la organización, además de identificar las

tecnologías de información que pudiesen ser adoptadas, para obtener un impacto

positivo en las operaciones que se realizan. El grupo de apoyo está encabezado

90

por los arquitectos empresariales, seguido por quienes ejecuten las funciones de

arquitecto de software, ingeniero de software, arquitecto de datos, data stewart,

stewarship, líder de infraestructura, entre otros.

Con la ayuda de este grupo se debe poder identificar cuáles son los recursos

tecnológicos que se utilizan para apoyar el negocio, específicamente en cada uno

de sus procesos y como éstos recursos soportan los motivadores y estrategias de

negocio.

Conociendo la Organización

Entradas: Misión, visión, organigrama, listado de motivadores, estrategias de

negocio, cadena de valor y canvas.

Grupos de apoyo: estratégico y negocio.

El trabajo en esta actividad consiste en identificar y estudiar la entradas, utilizando

como fuente principal de información el grupo estratégico. La forma de solicitar la

información puede ser directamente, concertando una cita y/o solicitud mediante

un e-mail. La primera vez es recomendable concertar una cita para efectos de

presentación e identificación de los integrantes de los grupos de trabajo,

posteriormente las solicitudes se pueden hacer por medio electrónico y/o también

realizar reuniones cuando sea necesario para aclarar y validar información.

Uno de los objetivos de la misión es definir la razón de ser de la empresa y que

producto o servicio ofrece a sus clientes. La misión es importante porque sirve de

guía para el desarrollo de cualquier actividad en la operación del negocio. La

visión define las metas a mediano y largo plazo de la empresa, además establece

el nivel de posicionamiento en el mercado o de reconocimiento por sus clientes. El

organigrama es un medio grafico que permite tener un conocimiento general de

91

cómo se encuentra estructurada la empresa y de cómo se encuentran definidos

los niveles de responsabilidad y mando.

Los motivadores permiten conocer las razones del cambio o del porque la

empresa desea emprender los proyectos de AI y la estrategia de negocio

proporciona la dirección y descripción de cómo una empresa quiere lograr su

visión de negocio en un plazo determinado y la forma como se puede lograr

mediante una serie de actividades claves. Es el “Que y Como”. La estrategia de

negocio es importante para la arquitectura a corto y largo plazo porque brinda un

marco de referencia para evaluar como la arquitectura debe apoyar o alinearse

con la estrategia de negocio.

En el anexo N° 2 se encuentra información relacionada con el canvas.

Alcance de la AI

Salida: Alcance del proyecto de AI.

Grupos de apoyo: Estratégico y Negocio.

Pensar en realizar un trabajo de arquitectura sobre todos los datos de una

empresa es una aventura épica y con una probabilidad de riesgo bastante alta

para el fracaso del proyecto. En la Figura 6 se propone un modelo de referencia

para definir el alcance de un proyecto de AI.

Este modelo toma el paradigma de diseño de algoritmos llamado divide y vencerás

y lo aplica a la solución de un problema de arquitectura de datos: el algoritmo

consiste en la solución recursiva de un problema (datos empresariales)

dividiéndolo en varios sub-problemas (proyecto inicial y proyectos particulares) y al

final la solución de cada uno de los proyectos se combinan para dar una solución

al problema original [28]. La principal ventaja de esta estrategia es realizar varios

proyectos donde los resultados se reflejen a corto plazo.

92

Figura 26. Modelo para definir el alcance de la AI

Para definir el alcance de un proyecto de AI se aborda el problema desde dos

dominios: datos analíticos y datos operacionales. Los datos maestros y los

metadatos no son explícitos porque se considera que los metadatos y los datos

maestros, aunque se trabajan de forma independiente, intervienen directamente y

son considerados de forma implícita dentro de los datos operacionales y

analíticos.

Lo primero que se debe hacer en AI para el dominio de datos operacionales es

realizar un proyecto inicial. El objetivo principal del proyecto inicial es conocer la

empresa y entender sus procesos de negocio, como genera valor, cuáles son sus

clientes. También en este proyecto se identifica cual es la situación actual de los

datos en la empresa, cuáles son las necesidades y situación deseada que

demanda el negocio. Además se debe crear un mapa de proyectos priorizados

que permita superar la brecha que existe entre la situación actual y la deseada.

93

El mapa de proyecto da origen a los proyectos particulares que son abordados

desde tres perspectivas: datos maestros, datos transaccionales y datos no

estructurados. Para los datos maestros pueden surgir también varios proyectos,

donde cada proyecto se puede realizar para un dato maestro (cliente, proveedor,

producto) en particular o para un grupo y cada uno de estos proyectos particulares

puede abordar aspectos de calidad, seguridad, gestión, migración o integración.

Para los datos transaccionales también se pueden considerar los mismos

aspectos referidos para datos maestros, pero si se debe hacer claridad y enfatizar

principalmente en la solución de problemáticas como: datos que se necesitan y no

están completos o no se encuentran, datos con múltiples fuentes de datos,

asegurar una sola fuente de datos con información correcta, datos que no son

necesarios, datos que no son creados, datos que no son consumidos y datos que

no se encuentran donde se necesitan.

En este trabajo se propone una guía metodológica para el desarrollo del proyecto

inicial y otra guía metodológica para el desarrollo de los proyectos particulares. La

guía metodológica explica detalladamente que actividades se deben ejecutar para

el desarrollo de cada uno de los proyectos.

En este trabajo el alcance no cubre el desarrollo de proyectos de datos analíticos,

porque ya existe una metodología bastante madura propuesta por Ralph Kimball.

La propuesta de este modelo de referencia es original, producto del trabajo

realizado.

Modelo de referencia de información empresarial

Como se puede apreciar en la Figura 27, esta propuesta divide los datos

empresariales en 5 dominios que permiten visualizar los datos existentes en una

empresa desde 5 grandes perspectiva que son importantes en el momento de

definir el alcance de una AI.

94

Iniciar un proyecto de AI sobre todos los datos de una empresa es un esfuerzo

muy costoso financieramente, y los resultados o retorno de la inversión se

reflejarían a largo plazo y esto puede llevar al fracaso del proyecto. Si

visualizamos los datos de una empresa desde 5 dominios, estaríamos partiendo

desde uno de los más importantes paradigmas de diseño de algoritmos llamado

divide y vencerás, que consiste en la solución recursiva de un problema

(Información empresarial) dividiéndolo en varios subproblemas (dominios de

datos) y al final la solución de cada uno de los subproblemas se combinan para

dar una solución al problema original [28].Esta es una forma de realizar proyectos

donde los resultados se reflejen a corto plazo.

Como referencia para los dominios de información en una empresa, se tomó el

modelo definido en [1] donde definen los 5 dominios de datos.

Figura 27. Dominios de Datos Empresariales

En [1] se puede consultar más información sobre cada uno de los dominios de

datos.

Datos Analíticos

Datos Operacionales

Datos Maestros

Metadatos

Datos No Estructurados

95

Modelo de referencia de gobierno de datos

Así como existe gobierno para recursos humanos, financieros, para activos fijos y

corrientes, gobierno de tecnología y de sistemas de información, donde el objetivo

principal es generar confianza entre los diferentes actores como empleados,

socios, proveedores, clientes y demás, se hace necesario definir un gobierno que

le permita a la empresa ver a los datos como un activo más de la empresa y le dé

la importancia que realmente tienen los datos como recurso estratégico para el

negocio y que le permita tener a disposición información de calidad, suficiente y

oportuna.

El gobierno de datos permite a una empresa definir principios, procesos,

estándares, técnicas de integración, enfoques arquitecturales, quiénes (roles) y

responsabilidades, que garanticen la toma de decisiones correctas de los

diferentes actores o usuarios de los datos a cualquier nivel de la empresa y esto

solo se puede cumplir si se cuenta con datos e información oportuna y con altos

estándares de calidad. El fundamento principal de esta propuesta para gobierno

de datos, es proponer un enfoque fraccionado e iterativo que permita a la empresa

centrarse en los problemas fundamentales y guie la toma de decisiones que

deben ser ejecutadas. Se propone el siguiente (ver Figura 28)modelo de

referencia donde se consideran los principales temas que se deben abordar en un

gobierno de datos:

Diseño Organizacional

Principios de Datos Roles y Responsabilidades

Seguridad y

Privacidad

Dominios de Datos Calidad de Datos

Métricas

Figura 28. Gobierno de Datos Modelo de Referencia

96

En la Figura 28 se observan los 7 temas que aborda el modelo de referencia

propuesto para gobierno de datos, a continuación se describe cada uno:

Diseño organizacional: en [22] habla del diseño de gobierno de datos donde se

deben considerar aspectos como: evangelización, alcance, propiedad de los

datos, gestión del proyecto, dedicación de tiempo de los roles, financiación,

motivador de negocio, inhibidores y principalmente conocer la cultura de la

empresa para conocer su forma de operar, que puede ser centralizada,

descentralizada o mixta. Entonces en una cultura donde cada unidad de negocio

opera de forma independiente y da prioridad a su propia dirección estratégica,

será apropiado fomentar un enfoque de gobierno de datos descentralizado [22]. Es

de aclarar que aunque los datos relevantes para una línea de negocio pueden ser

manejados de forma centralizada, las decisiones a nivel corporativo deben ser

manejadas de forma centralizada.

Principios de datos: Los principios de datos según [16] nos permiten comunicar

al negocio cuales son las medidas establecidas sobre los datos, que los definen

como un activo para la empresa. La importancia radica en las políticas, normas y

directrices que fomentan y establecen la forma de compartir y reusar los datos a

nivel empresarial. Los principios de datos sugeridos son los establecidos según

[16]: Los datos son un activo, los datos son compartidos, los datos son accesibles,

vocabulario y definición de datos común, los datos son gestionados y los datos

son protegidos. Aquí se referencian varios principios de datos, pero es decisión del

usuario tomar éstos como una referencia y utilizarlos o crear sus propios principios

de datos.

Roles y responsabilidades: La organización de gobierno de datos debe construir

un modelo para dirigir sus operaciones, y para asegurar quien tiene la autoridad

suficiente para actuar como árbitro en situaciones críticas [1]. En consecuencia,

varios roles y responsabilidades deben ser definidos y asignados de forma

apropiada en un programa de gobierno de datos, en [22] se definen cuatro roles y

97

sus principales responsabilidades para un gobierno de datos: el patrocinador

ejecutivo, el director del programa de gobierno de datos, un director representante

del negocio y un director representante del área de IT.

Seguridad y privacidad: según [1] en este tema se debe lidiar con algunos retos

comunes de seguridad de datos, desafíos de privacidad y que debe incluir la

respuesta a los siguientes interrogantes:

¿Dónde está nuestra información confidencial?

¿La organización ha enmascarado sus datos confidenciales en los entornos

que no son de producción (desarrollo, pruebas y capacitación) para cumplir con

las regulaciones de privacidad?

¿Están los controles de auditoría de base de datos en el lugar para evitar el

acceso de los usuarios privilegiados, por ejemplo como: administradores de

bases a los datos privados, como los sueldos de los empleados y listas de

clientes?

Dominios de datos: para dominios de datos ver en este documento la sección de

Modelo de referencia de información empresarial.

Calidad de datos: La calidad de los datos se refiere a la capacidad que tienen los

datos para satisfacer los requerimientos de uso dentro de la empresa. La calidad

de los datos tiene múltiples dimensiones como: precisión, oportunidad, integridad,

credibilidad, entre otros. Ver [29] para más información sobre dimensiones y

métricas. Estas dimensiones son relativas y deben ser definidas de acuerdo al

contexto de uso de los datos [18]. En este documento en la sección de Análisis de

la información, se propone un método de calidad de datos que consiste en un

proceso iterativo y continúo para alcanzar la calidad de datos.

Métricas: Es importante que el gobierno de datos cuente con indicadores sólidos

para medir y monitorear el progreso. El equipo de gobierno de datos debe

98

reconocer que cuando se mide algo, mejora el rendimiento. Como resultado, el

equipo de gobierno de datos debe recoger unos pocos indicadores principales de

rendimiento (KPIs) para medir el desempeño continuo del programa [1]. Aquí se

debe realizar un diagnóstico que ayude a medir la calidad actual de la información

crítica, identificando donde se encuentran los mayores problemas y priorizando las

áreas con las que hay que abordar primero en el proyecto de AI. Para mayor

detalle ver en la sección de repositorio de recursos el método de calidad de datos.

Como complemento del modelo de referencia, se presenta una metodología para

el diseño y gestión del gobierno de datos en la sección 3.2.2.

Este modelo de referencia es producto de la revisión y análisis del estado del arte

para el tema de gobierno de datos. Aquí se toman elementos de las tres

propuestas analizadas.

Herramientas Tecnológicas y Técnicas de Modelamiento

Es importante, seleccionar herramientas y técnicas de modelamiento que permitan

mitigar la creciente complejidad de las fuentes de datos y el contexto de las

empresas. Los arquitectos de datos enfrentan desafíos únicos y uno de los más

grandes es adquirir una comprensión minuciosa de la gran cantidad de datos

atesorados de la empresa y cómo están relacionados entre sí. El correcto

modelado es esencial si se está realizando un trabajo de arquitectura desde el

principio o sobre fuentes de datos existente, porque este impactará directamente

la calidad de los datos.

Las herramientas para el trabajo de AI deben permitir principalmente lo siguiente:

crear modelos de datos conceptuales y físicos.

explorar y visualizar la estructura de las fuentes de datos.

Relacionar fuentes de datos.

comparar estructuras de fuentes de datos.

99

Descubrir similitudes entre fuentes de datos.

Analizar modelos y fuentes de datos para validar estándares.

En el anexo N° 3 se presentan varias soluciones que existen en el mercado y que

facilitan las actividades a desarrollaren una AI.

En las técnicas de modelamiento se encuentran los diagramas que son la

representación conceptual y grafica de los datos de una empresa. Los diagramas

facilitan la comprensión de los datos más importantes, desde cómo se relacionan,

cuáles son sus características, como se almacenan y cuál es su ciclo de vida. Es

por esto que es importante definir las técnicas apropiadas de modelamiento de

datos que se usaran durante la captura, modelamiento y análisis de datos. En el

anexo N° 4 se presentan algunas técnicas de modelamiento.

El principio de esta actividad es tomado de TOGAF, pero se extiende en este

trabajo.

Estado Actual de Arquitectura de Información

Figura 29. Etapa de Estado Actual de la metodología del proyecto inicial

100

Como se ilustra en la Figura 29, la etapa de Estado Actual es el segundo paso en

la metodología del proyecto inicial. Esta etapa dará la orientación que se necesita

para conocer el estado actual de la información en la empresa.

El objetivo fundamental de esta etapa es proporcionar una descripción del estado

actual de los datos en la empresa, proporcionando una vista de los elementos que

son parte de la AI y de cómo se relacionan e interactúan entre sí y con elementos

externos para soportar la operación del negocio. Para esta etapa se propone una

serie de 7 actividades como se muestra en la Figura 30.

Figura 30. Actividades de la etapa de Estado Actual

En la etapa del estado actual se empieza con el tema de las Entrevistas, donde se

habla de las entrevistas como una herramienta que ayuda a entender y conocer la

situación actual de los datos y también permite conocer que problemáticas existen

relacionadas con los datos y cuales es el estado deseado de los datos.

101

Posteriormente se tienen dos actividades que son: la actividad de Procesos de

Negocio y la actividad de Entidades de Negocio. Estas dos actividades se pueden

hacer en paralelo o se puede continuar con alguna de las dos, para efectos de

este trabajo se recomienda empezar procesos de negocio. En la actividad de

procesos de negocio, principalmente se debe conocer y entender los procesos de

negocio involucrados en la AI. En la actividad de Entidades de Negocio la tarea

principal es identificar las entidades de negocio y su relación con los procesos de

negocio. En la cuarta actividad se habla del Modelo Conceptual de datos que

corresponde a la descripción de cómo las entidades de negocio se relacionan e

interactúan entre sí. Seguidamente se tienen dos actividades (5ª y 6ª) que

tampoco tienen un orden de ejecución. En la actividad Gobierno de Datos el

objetivo es identificar que existe actualmente en la empresa en el tema de

Gobierno de Datos y en la actividad Fuentes de Datos la principal motivación es

conocer la situación actual de las diversas fuentes de datos que existen en la

empresa y como estas se relacionan o integran para soportar el negocio. Por

último se tiene una 7ª actividad que corresponde al Análisis del Estado Actual de

AI.

Entrevistas

Salidas: Acta de entrevista, documento o grabación con la información capturada

en la entrevista.

Grupo de apoyo: Estratégico y/o Negocio.

El objetivo principal de las entrevistas es servir como una herramienta que ayude

al grupo de AI a entender el negocio, conocer la situación actual y futura según los

requerimientos del negocio capturados en cada sesión de entrevista. Para esto se

recomienda seguir los siguientes pasos:

102

Paso 1: Realizar una primera entrevista que reúna a los integrantes de los grupos

de trabajo definidos en la etapa de preparación y el grupo directamente

responsable de la AI. Aquí se deben tratar temas como:

Presentación de los involucrados en el proyecto de AI.

Conocer el negocio: ver en la etapa de preparación la actividad de Conociendo

la Organización.

Comunicar el alcance del proyecto.

Definir representantes de cada grupo y del proyecto de AI, estas personas

serán las encargadas de gestionar la agenda de entrevistas.

Paso 2: Previamente a cada una de las siguientes entrevistas se debe tener en

cuenta los siguientes temas:

Enviar documento formal de la información capturada en la entrevista

inmediatamente anterior, para su respectiva validación y certificación por el

grupo de apoyo correspondiente.

Enviar agenda de los temas a tratar en la entrevista. Por cada tema se

recomienda también enviar una especie de cuestionario, que le permita al

entrevistado prepararse para la entrevista. Esto también permite que el

desarrollo de la entrevista sea planeado, se capture la información pertinente y

se optimice el tiempo empleado en la entrevista.

Paso 3: Definir claramente el líder de la entrevista, esta persona debe pertenecer

al grupo responsable del desarrollo del proyecto de AI y es la persona responsable

de la ejecución del cuestionario que cubrirá los temas a tratar, previamente

enviados al entrevistado.

Paso 4: Capturar las memorias de la entrevista. Se recomienda que cada una de

las entrevistas se grabe preferiblemente en video o en su defecto solo voz. Esto

ayudara a capturar la información sin traumatismos que puede traer el capturar la

103

información manualmente, además también se puede posteriormente analizar n

veces la entrevista y extraer la información.

Para las entrevistas se proponen dos plantillas, ver Anexo N° 5 y Anexo N° 6,

donde se muestra un formato para el acta de entrevistas y un formato para

registrar tareas pendientes definidas y que se deben realizar después de la

entrevista. Una de estas tareas puede ser enviar un correo con documentación

referente al tema de la entrevista.

El origen para proponer una actividad para entrevistas es tomado de la

metodología Kimball.

Procesos de Negocio

Entradas: Procesos de negocio, información de las entrevistas.

Salidas: Entendimiento de los procesos de negocio por parte del grupo de AI.

Aquí el grupo de AI debe reunirse y analizar la información capturada en las

entrevistas y los procesos de negocio, con el objetivo de asegurar que todo el

grupo de AI comprenda la operación del negocio y específicamente de los

procesos que estarán involucrados en la AI de acuerdo al alcance definido

previamente.

El principio de esta actividad es tomado de TOGAF y la metodología Kimball.

Entidades de Negocio

Entradas: Información capturada en las entrevistas.

Artefacto: matriz Procesos de negocio vs Entidades.

Grupos de trabajo: Negocio y Arquitectura.

104

Para identificar las entidades de negocio, se debe entender el contexto de la

empresa a través de sus procesos de negocio. Por cada proceso se deben

identificar cuáles son los objetos que pueden existir y de los cuales se desea

persistir o se persiste información. Aquí se sugiere utilizar la

Plantilla 1. Procesos vs Entidades donde se identifica cada uno de los procesos y

se cruzan con las entidades de negocio. La información que tiene la plantilla es

solo para dar un ejemplo de cómo se diligencia

PROCESOS / ENTIDADES Producto Cliente Proveedor Empleado Almacén Promoción

Ventas X X

X X X

Compras X

X X X

Inventario X

X

Plantilla 1. Procesos vs Entidades

Esta plantilla proporciona un espacio para relacionar de forma escrita y grafica los

procesos de negocio con las entidades de negocio. Esta plantilla se llena como

producto del análisis de las entrevistas realizadas para entender el negocio desde

la perspectiva de los datos.

El tema de entidades de negocio es tomado de Zackman, TOGAF e IBM.

Modelo Conceptual

Entradas: reglas de negocio,

Plantilla 1. Procesos vs Entidades.

105

Artefactos: diagrama del modelo conceptual, descripción y glosario de las

entidades de negocio.

Grupos de trabajo: Negocio y Arquitectura.

El modelo conceptual representa el primer nivel de abstracción sobre las

entidades de negocio, desde el punto de vista funcional de la empresa. Este

permite representar gráficamente las reglas del negocio las cuales se traducen en

la forma como las entidades de negocio se relacionan entre sí.

Figura 31 Modelo Conceptual nivel 0 [23]

Cuando se trabaja bajo el análisis conceptual de una situación, nos referimos a la

abstracción de hechos reales de los cuales se emite un concepto o es posible

106

hacer una idea de ello. Para poder realizar la abstracción de un tema en un área

específica, es necesario tener los requerimientos formulados por los usuarios con

respecto a este. Estos requerimientos contienen el conjunto de hechos, términos

y reglas de negocio que dan pauta a la creación del modelo conceptual donde por

medio de este se podrá realizar una descripción de alto nivel de las fuentes de

datos actuales o futuras. Para manipular este esquema se utiliza un modelo

conceptual que proporciona un lenguaje que permite utilizar un conjunto de

símbolos (estándares) para la creación de este.

La Figura 31 presenta a modo de ejemplo un modelo conceptual que hace parte

del caso de estudio que se verá en el capítulo 4:

Una vez realizado el trabajo de identificar las entidades principales y de generar el

modelo conceptual, se debe realizar una descripción detallada de cada una de las

entidades y sus respectivas relaciones. Para esto se sugiere utilizar la Plantilla 2.

La información en la plantilla hace parte del caso de estudio que se verá en el

capítulo 4. Esta plantilla se crea como una herramienta que permite registrar

información de forma ordenada y estructurada de cada una de las entidades de

negocio identificadas. La información incluye definición, descripción general,

entidades hijas y entidades relacionadas.

107

Plantilla 2. Descripción de una entidad de negocio [23]

El tema de modelo conceptual es originalmente tomado de TOGAF y Zachman.

Fuentes de Datos

Entradas: documentación y/o trabajos previos si existen, información capturada en

las entrevistas.

Artefacto: Inventario de las fuentes de datos, matriz de Fuentes de datos vs

Entidades de negocio, diagrama de ciclo de vida y diagrama de diseminación de

datos.

Grupos de trabajo: Arquitectura.

108

La tarea en este punto es consultar con el grupo de arquitectura y buscar dentro

de la organización si existe algún inventario realizado previamente sobre las

diferentes fuentes de datos existentes. Si ya existe se debe validar si se encuentra

sincronizado con la última versión de cada fuente de datos, caso contrario se debe

actualizar. Si no existe ningún trabajo o inventario realizado, se debe construir un

inventario de las fuentes de datos principales o importantes para el trabajo que se

está realizando. Seguir la Plantilla 3para realizar el inventario.

Adicionalmente se recomienda tener en cuenta los siguientes aspectos:

Identificar fuentes de datos principales: sobre el inventario de las fuentes de

datos, se debe aplicar un filtro para identificar las de mayor relevancia para el

desarrollo del proyecto de AI. Se deben seleccionar las fuentes de datos que

soportan la operación del negocio (procesos misionales) y gestionan los datos

maestros. Las fuentes de datos que soportan el funcionamiento u operación de

alguna aplicación específica deben ser descartadas.

La Plantilla 3 permite documentar mediante información detallada cada una de las

fuentes de datos e incluye información sobre su identificación, descripción,

tamaño, numero de tablas, número de procedimientos almacenados, numero de

vistas y numero de disparadores. En la Plantilla 3 se observa un ejemplo con la

información que se debe incluir. La información en la plantilla hace parte del caso

de estudio que se verá en el capítulo 4.

109

Plantilla 3. Inventario de Fuentes de Datos [23]

Matriz de relación entre Entidades de Negocio vs fuentes de datos: esta

matriz sirve como herramienta de análisis para identificar temas como:

Cuáles son las Entidades con mayor número de relaciones respecto a las

fuentes de datos. Estas entidades son críticas para el funcionamiento de la

empresa.

Cuáles son las fuentes de datos con mayor concentración de Entidades

principales. Con esto identificamos cuales son las fuentes de datos

fundamentales para el funcionamiento del negocio.

Entidades que fueron identificadas a nivel de negocio pero que no tienen

representación explicita sobre ninguna fuente de datos. Puede suceder que

dicha entidad exista sobre alguna o varias fuentes de datos, con nombres

110

diferentes. Por ejemplo, conceptualmente la entidad Persona no existe

explícitamente sobre alguna fuente de datos, pero para una fuente de datos

puede existir como empleado y para otra como afiliado, esto es importante

para el análisis posterior.

La Plantilla 4proporciona un espacio para registrar de forma escrita y grafica la

relación que existen entre las fuentes de datos y las entidades de negocio. La

importancia de esta plantilla se explica más adelante, cuando es utilizada en el

estado actual. La información en la plantilla hace parte del caso de estudio que se

verá en el capítulo 4.

Plantilla 4.Entidades de Negocio vs Fuentes de Datos [23]

Diagrama de diseminación de datos: este diagrama (ver Anexo N° 4) permite

visualizar la relación y/o dependencia entre las entidades de negocio, las

funcionalidades de negocio y las fuentes de datos, ver figura 1. De esta forma

podemos tener una visión general del estado actual de los datos respecto a las

fuentes donde se encuentran almacenados, además de visualizar el cómo

cooperan estas fuentes de datos entre sí para dar soporte al negocio.

Diagrama de ciclo de vida de los datos: Este diagrama (ver Anexo N° 4) ayuda

a identificar las necesidades de datos comunes que tiene el negocio y será el

punto de partida para diseñar fuentes de datos comunes que permitan compartir

recursos de datos. Este diagrama brinda una visión global de todos los actores del

Fuentes de datos PERSONA AFILIACION RECAUDOHISTORIA

LABORAL

BONO

PENSIONAL

RECONOCI-

MIENTO

PAGO

PRESTACIONES

CUOTAS

PARTES

PENSIONALES

CUOTASCOBRAR X X X

CUOTASPAGAR X X X

DB_COBRAR Ver Nota 2 X X

DEVOLUCIONES X X X

GPROC X

HISTLAB X X X

Entidades de Negocio

111

sistema que realizan operaciones sobre los datos, operaciones tales como

creación, consulta, actualización y borrado.

El tema de fuentes de datos es originalmente tomado de TOGAF y Zachman

Gobierno de Datos

Entrada: modelo de referencia de gobierno de datos.

Artefacto: plantilla de gobierno de datos.

Grupos de apoyo: estratégico, negocio y arquitectura.

El objetivo principal en esta actividad es identificar el estado actual del gobierno de

datos. Como diseñar y gestionar un gobierno de datos se trata en la sección 3.2.2.

Tomando el modelo de referencia de gobierno de datos (ver Figura 28) y la

plantilla definida para gobierno de datos (ver Plantilla 5), en este paso se debe

hacer un levantamiento de información, para entender e identificar lo que se tiene

implementado de gobierno de datos en la empresa.

Con los grupos de apoyo a través de entrevistas o reuniones, se debe identificar:

Si en la empresa se tienen definidos claramente cada uno de los criterios

propuestos para gobierno de datos.

Para cada Rol que se encuentre definido, cuales son las responsabilidades

definidas y que tipos de decisiones se toman.

Puede suceder que los roles no estén definidos tal como lo estipula el modelo

de referencia, pero si existan las responsabilidades en otros roles diferentes a

los mencionados por el modelo de referencia. También puede pasar que una

persona asuma las responsabilidades de varios roles.

Puede suceder también que la guía metodológica no sea exactamente igual al

modelo de referencia, pero se debe documentar también utilizando los

112

comentarios o las observaciones si existe algún rol parecido con

responsabilidades iguales o similares.

La Plantilla 5 proporciona un espacio donde se puede registrar de forma escrita la

situación actual del gobierno de datos en una empresa. Los criterios que se tienen

en cuenta son los definidos por el modelo de referencia de gobierno de datos (ver

sección de Modelo de referencia de gobierno de datos) donde se explican los

temas que aborda cada uno de los criterios. Esta plantilla permite evaluar el

gobierno de datos de la empresa contra el modelo de referencia, indicando si

existe alguno de esos criterios implantados y describiendo cual es la situación

respectiva. Esta plantilla es importante como una entrada para realizar el análisis

del estado actual y el estado deseado.

Plantilla 5. Estado actual de gobierno de datos

El principio de gobierno de datos es tomado de TOGAF y FEAF, donde solo lo

abordan de manera global.

CRITERIOS EXISTE (S/N) DESCRIPCION

Diseño organizacional

Principios de datos

Roles y responsabilidades

Seguridad y privacidad

Dominios de datos

Calidad de datos

Metricas

COMENTARIOS

113

Análisis Estado Actual

Entradas: modelo conceptual, diagrama de ciclo de vida de los datos, glosario de

las entidades de negocio, inventario de las fuentes de datos, matriz de Entidades

vs Fuentes de datos, y situación actual del gobierno de datos.

Artefacto: análisis estado actual de AI.

Aquí se debe realizar un análisis explicando las causas de los problemas

identificados y que se vienen presentando recurrentemente en el negocio como

consecuencia del estado actual de los datos. Esta actividad está compuesta por

otras tres actividades (ver Figura 32): análisis de la información, riesgos de

seguridad y gobierno de datos.

Figura 32. Actividades del Análisis de Estado Actual de AI

114

Las actividades no tienen un orden de ejecución definido (ver Figura 32). A

continuación se explica cada una de estas actividades.

El principio de Análisis del Estado Actual de AI, fue tomado de TOGAF. Pero en

este trabajo se extendió proponiendo tres actividades que para el alcance de este

trabajo se consideran fundamentales. Cada una de estas actividades es producto

del trabajo realizado.

Análisis de la información

Es importante realizar un análisis de la información, porque en la operación diaria

de cualquier negocio se toman decisiones estratégicas, operacionales y dichas

decisiones deben ser tomadas usando la información y los hechos para tener un

mayor grado de seguridad en la toma de una buena decisión ya sea estratégica u

operacional.

Difícilmente se puede encontrar un método único para alcanzar la calidad de los

datos y más que un método debe ser un proceso iterativo y continúo. De [25] se

tomó la propuesta para realizar un análisis de calidad de datos y se adaptó en este

trabajo para proponer un método iterativo (ver Figura 33).

Este método consta de 7 pasos que se describen a continuación:

Identificar información crítica para el negocio: existe tanta información en una

organización que difícilmente podemos dedicar suficientes recursos para mejorar

la calidad de toda la información, por lo que hay que fraccionar e identificar cual

es la información que tiene un mayor impacto en las operaciones del negocio. La

información o datos críticos para el negocio son los que soportan los procesos

misionales de la empresa. Priorizar los procesos misionales depende de varios

factores como el que mayor impacto tiene en los ingresos, el que más costos

genera, el menos eficiente en tiempos de ejecución, entre otros. También no

115

debemos olvidarnos de la información que apoya los procesos estratégicos,

porque es allí donde se toman las decisiones importantes para el negocio.

Figura 33. Método para análisis de calidad de datos

Definir indicadores de calidad: la pregunta que se debe responder es: ¿qué

factores se deben tomar en consideración para afirmar que un dato es de calidad

para la empresa? la respuesta son los indicadores de calidad de datos. Existen

muchos indicadores de calidad, pero se sugiere trabajar con los siguientes:

exactitud, totalidad, oportunidad, relevancia, nivel de detalle y consistencia. Para

mayor información sobre los indicadores (dimensiones) de calidad y como definir

métricas ver [29].

Realizar mediciones iniciales para detectar posibles problemas de calidad de

datos: Este paso es un diagnóstico que nos ayuda a medir la calidad actual de la

1. Identificar información

crítica

2. Definir Indicadores de calidad

3. Realizar mediciones

4. Automatizar indicadores de calidad

5. Definir responsables

6. Diagnóstio

7. Monitoreo

de los indicadores

116

información crítica definida en el paso 1, identificando donde se encuentran los

mayores problemas de calidad de datos. Para detectar problemas en la calidad de

datos se sugiere responder las siguientes preguntas:

o ¿Existe una fuente única de información o existe más de una?: En la mayoría

de las empresas NO se tiene una única fuente de información, existen diversos

sistemas formales y no formales y esto es un gran problema a la hora de tomar

decisiones basadas en la información. Para responder esta pregunta se deben

revisar y analizar las matrices: Fuentes de Datos vs Entidades de Negocio, el

diagrama de diseminación de datos y el diagrama de ciclo de vida de los datos

también puede ayudar.

o ¿Cómo asegurar una fuente única de datos con información correcta?: esto

principalmente se consigue implementando de forma adecuada dos iniciativas

principales: Gobierno de datos y Gestión de Datos Maestros (MDM).

o ¿Existen datos con alguna de las siguientes características?: incompletos,

innecesarios, no disponibles, no son creados, no consumidos, no relacionados,

no se encuentran donde se necesitan. Esta información se debe conseguir

mediante entrevistas con los usuarios de los datos y el grupo de arquitectura.

Automatizar indicadores de calidad: En este paso se realizan programas que

ayuden a medir periódicamente la calidad de la información, lo que no se puede

medir no se puede administrar y no se puede mejorar. Estos indicadores deben

estar al alcance de las personas que serán las responsables de monitorear y

mejorar la calidad de la información.

Definir responsables de calidad de datos: Una de los factores críticos de éxito

de un proyecto de calidad de datos es definir un responsable de cada indicador,

esta persona debe monitorear las tendencias del indicador y realizar planes de

acción encaminados a la mejora de los indicadores. Ver gobierno de datos en

modelos de referencia.

117

Diagnóstico de calidad de datos: en estos diagnósticos se determinan las

posibles causas de la mala calidad de Datos y se definen planes de acción con

responsables para mejorar el indicador. Entre los planes de acción normalmente

se incluye el establecer controles preventivos y correctivos para mejorar la calidad

de los datos.

Monitoreo de los indicadores de calidad: Si los empleados no perciben las altas

expectativas por parte de la gerencia o directivos, el proyecto tendrá resultados

limitados, es importante que los indicadores de calidad de datos se revisen

periódicamente, asegurando su seguimiento y mejoramiento permanente. Para

esto se sugiere realizar reuniones periódicas.

Riesgos de seguridad

Existen diversas metodologías de análisis de riesgos informáticos, lo cual no es el

alcance de este trabajo, pero si revisaremos algunos temas a tener en cuenta

cuando realizamos un trabajo de AI. Los riesgos de seguridad básicamente

comprometen los siguientes indicadores de calidad: confidencialidad, integridad y

disponibilidad de los sistemas de información. Dependiendo del contexto de la

empresa, se puede llegar a tener diferentes amenazas que comprometan los

indicadores antes mencionados. Los riesgos de información se pueden presentar

a nivel de hardware y a nivel de datos.

Los riesgos a nivel de hardware obedecen a desastres naturales, fluctuaciones en

el voltaje, vandalismo, entre otros. Los riesgos a nivel de datos son motivados por

acciones como el robo de información, espionaje, virus, alteración y destrucción.

Ante un riesgo concreto, la empresa tiene tres alternativas: aceptar, mitigar o

transferir (mediante un contrato de seguro) el riesgo. Para mitigar el riesgo la

empresa debe tomar medidas o políticas de controles de seguridad.

118

Las medidas de control ayudan a definir restricciones y otro tipo de medidas que

se deben imponer a los usuarios o sistemas internos y externos a la empresa,

para proteger los datos de los riesgos ya señalados, así como para mitigar el

riesgo y los daños que puedan ocurrir. Las medidas de control sugeridas son:

o Copia de seguridad: La manera más fácil de evitar la pérdida de datos debido

a desastres naturales, virus o errores humanos es duplicar automáticamente

todos los datos de manera periódica, es decir hacer una copia de seguridad de

datos.

o Control de acceso: Los controles de acceso son medidas para asegurar que

solo las personas o aplicaciones autorizadas puedan acceder a los datos.

Estas generalmente son códigos de accesos, con políticas de cambio periódico

y que no se puedan repetir códigos previamente utilizados.

o Revisión de auditoria: A pesar de las precauciones existentes para evitar un

uso abusivo del sistema, esto sucede algunas veces. Por lo tanto, se necesitan

medidas adicionales para mantener el registro de las transacciones, de modo

que: cuando se detecten abusos, pueda dárseles seguimiento y que el temor a

ser descubierto desaliente el abuso.

o Estándares de seguridad: se recomienda seguir alguno de los estándares de

seguridad ya existente, tales como el libro naranja Trusted Computer System

Evaluation Criteria (TCSEC), El Criterio Europeo de Evaluación de Seguridad

en Tecnología de la Información (ITSEC), Dimensiones de Calidad de Datos

según ISO/IEC 25012, entre otros. Es criterio de la empresa y dependiendo del

contexto revisar y seleccionar el estándar adecuado. Esto les ayudara a definir

un estándar que se ajuste a las necesidades propias del negocio, no se deben

inventar uno, deben seleccionar lo mejor de cada estándar o lo que mejor se

ajuste a las necesidades.

119

Gobierno de datos

La información fundamental para realizar el análisis del gobierno de datos es la

que se captura en la actividad de la situación actual del gobierno de datos, donde

se puede evidenciar si la empresa tiene y sigue una guía metodológica que facilite

el funcionamiento de un gobierno de datos y donde también se puede observar si

se cuenta con una estructura organizacional de roles bien definida junto con sus

respectivas responsabilidades.

Si la empresa no cuenta con un gobierno de datos claramente definido puede

impactar directamente el negocio, puesto que trae consecuencias como falta de

confianza en los datos para la toma de decisiones estratégicas, no contar con

información oportuna, una calidad pobre de los datos que se evidencia en

duplicación, replicación de datos sin ningún tipo de control, datos incompletos,

datos innecesarios, datos que se necesitan y que no están disponibles, datos que

no son creados, datos que existen y nunca se utilizan, entre otros. Todo esto

debe repercutir y explicar los diversos problemas que se presenten a cualquier

nivel de la empresa, estos problemas pueden ser altos costos en la operación,

problemas a la hora de tomas decisiones estratégicas, demora en los tiempos de

respuesta de los procesos misionales, problemas operacionales a nivel

tecnológico porque es difícil de administrar, operar, mantener, escalar e integrar.

Estado Deseado de Arquitectura de Información

En esta etapa no se suele utilizar los mismos lenguajes y formalismos de la

situación actual, puesto que solo es un borrador de muy alto nivel. Uno de los

objetivos principales en esta etapa es definir globalmente como debería ser la AI

para apoyar las estrategias de negocio y argumentar la necesidad de alinearse o

no con alguno de los marcos de referencia propuestos. Se proponen dos

actividades a desarrollar en esta etapa (ver Figura 34).

120

Figura 34. Actividades en la etapa de Estado Deseado de AI

El principio de la etapa Estado Deseado es tomado de TOGAF y FEAF. Pero el

concepto de Blueprint para AI y Gobierno de Datos es tomado originalmente del

curso de Diseño de Software Basado en Patrones.

Blueprint de Arquitectura de Información

Entradas: situación actual de AI, modelos de referencia.

Artefactos: blueprint de AI.

Grupos de apoyo: estratégico y de negocio.

Permite definir políticas globales que se deben respetar, también organiza y

relacionar todos los elementos que hacen parte de la solución de AI y considera

todos los aspectos como, principios de datos, gobierno de datos, seguridad,

técnicas de integración, MDM, almacenamiento, entre otros.

121

Figura 35. Blueprint de Arquitectura de Datos

El blueprint para AI está compuesto por zonas y define las políticas globales que

se deben respetar. También organiza y relaciona los aspectos que hacen parte de

la solución. Una zona es un espacio de la AI con una frontera definida y

representa claramente un objetivo para responder a una necesidad. También

enmarca un conjunto de estándares, métodos, funcionalidades, servicios, técnicas

y tecnologías que deben respetar unas políticas y reglas empresariales.

Tomando como blueprint de arquitectura de información la Figura 35, podemos

asumir que la empresa desea llegar a tener una política general sobre los datos a

través de unos principios de datos, desea implantar un gobierno de datos donde la

prioridad debe ser la calidad de los datos. También se puede deducir que

cualquier usuario de datos debe pasar una zona de seguridad que deberá

implantar estándares de seguridad y de esta forma poder consumir los datos que

necesite. También se puede observar la necesidad de trabajar en temas de

auditoria, BI, minería, bodega de datos y que además desea implantar técnicas de

integración de datos y técnicas de gestión de datos maestros.

Zona de auditoria

Zona

de

fuen

tes d

e da

tos

Zona de BI, mineria

y bodega de datos

Zona de monitoreo

Principios de Datos

Gobierno de Datos

Calidad de Datos

Zona de consulta,

creacion, modificación

y busquedaZo

na d

e us

uario

s de

dato

s

Zona

de

segu

ridad

Zona

de

Inte

grac

ión

Zona

MDM

122

Blueprint de Gobierno de Datos

Entradas: Modelo de referencia de gobierno de datos.

Artefacto: situación deseada de gobierno de datos.

Grupos de apoyo: estratégico y negocio.

Aquí el objetivo principal es definir, establecer y explicar la necesidad de alinearse

total o parcialmente con el modelo de referencia que se expone en la sección

Modelo de referencia de gobierno de datos. El blueprint de gobierno de datos es el

mismo modelo de referencia (ver Figura 28) si la decisión es ajustarse

completamente al modelo de referencia.

Tomando la Figura 28 como blueprint, podemos deducir que la empresa desea

tener un diseño de gobierno de datos, donde se debe definir una estructura

organizacional específica para el gobierno de datos, definir principios de datos,

definir roles y responsabilidades para el gobierno de datos. Además se desea

definir políticas para seguridad y privacidad de datos y también definir políticas de

calidad. También se observa que se desea definir políticas sobre dominios de

datos y finalmente se deben definir métricas que permitan medir el impacto del

gobierno de datos en el negocio.

Como complemento a esta actividad en la sección3.2.2 se propone una guía

metodológica para diseñar y gestionar un gobierno de datos.

Mapa de proyectos

Mapa de Proyectos es la última etapa (ver Figura 36) definida en la metodología

de proyecto inicial. El principal objetivo en esta etapa es responder a la pregunta

¿Cómo ir del estado actual al estado deseado?

123

Figura 36. Etapa de Mapa de Proyectos en la metodología de proyecto inicial

Para responder a la pregunta se plantean dos actividades (ver Figura 37). Para

estas actividades se tomó como referencia las técnicas de planeación de

migración que se encuentra en [16] y también se tomó información de [27] sobre

priorización de proyectos. En la siguiente sección se explica cada una de las

actividades propuestas.

Figura 37. Actividades de la etapa de Mapa de Proyectos

124

La etapa de mapa de proyectos es tomado de TOGAF.

Definición de proyectos

Siguiendo la propuesta de [16], se plantea una matriz como técnica de

Consolidación de Brecha, Soluciones y Dependencias (ver Plantilla 6). Esta

técnica le permite al grupo de AI agrupar y analizar las brechas identificadas como

resultado del trabajo realizado en las etapas de estado actual y estado deseado,

con el propósito de evaluar posibles soluciones y dependencias. La información

presentada en la Plantilla 6 es solo a modo de ejemplo.

Plantilla 6. Matriz de consolidación de brecha, soluciones dependencias [16]

N° GAP Posible Solución Dependencias

Diseño y construccion de

fuente de datos para MDM

Migracion de Clientes

Migracion de Productos

Ejecutar metodo para el

dato maestro Cliente

Ejecutar metodo para el

dato maestro Producto

3Integracion de datos

operacionales

Diseño y construccion de

tecnicas de integracion de datos

4 Gobierno de datosDiseño y gestion de gobierno de

datos

Implementación gobierno

de datos

5 ……… … …

6 …….. … …

Matriz de Consolidación de Brecha, Soluciones y Dependencias

Diseño y construccion de MDMAmbiente MDM1

Metodo para calidad de datosCalidad de Datos2

125

La Plantilla 6 es una herramienta donde se definen temas globales de trabajo, con

sus posibles soluciones y respectiva dependencias que dan origen a los proyectos

que se deben ejecutar. Los temas de trabajo se toman del blueprint de

arquitectura que se definió para datos y para gobierno. Para cada tema de trabajo

se debe especificar cuáles son los proyectos que se deben ejecutar, por ejemplo,

para el tema de MDM se puede llegar a definir un proyecto para el diseño e

implementación de uno de los enfoques arquitecturales para MDM, también definir

como proyecto el diseño de la fuente de datos para MDM, otro proyecto puede ser

la migración de los datos de Clientes.

Una vez finalizada la primera técnica (ver Plantilla 6), se prosigue con la técnica de

definición de arquitectura incremental, para esto se crea una tabla (ver ) que

permite al grupo de AI planificar por proyecto una serie de arquitecturas de

transición que describen el estado de la AI en momentos determinados.

Plantilla 7. Definición incremental de arquitectura [16]

Priorización de Proyectos

Para la priorización de proyectos se toma la propuesta de [16] que habla de la

técnica de evaluación del valor del negocio. Esta técnica consiste en la

Arquitectura de Transicion 1 Arquitectura de Transicion 2 Arquitectura de Transicion 3

N° Proyecto Julio 2012 - Diciembre 2012 Enero 2012 - Junio 2012 Julio 2013 - Diciembre 2013 Comentarios

1 Diseño y construcción MDM Diseño y fuente de datos Migracion clientes Migracion Productos

2Integracion datos operacionales

Diseño y construcción de la

tecnica de integracionDatos de clientes

Datos de productos

3Calidad de datos

Preparacion metodo de

calidad de datos

Proceso de calidad para

clientes

Proceso de calidad para

productos

4

Gobierno de datos Diseño

Definicion de roles y

responsabilidades

compartidas

Definicion de roles y

responsabilidades unicas

para Gobierno de datos

5 … … … … …

. … … … … …

.

.

.

.

126

elaboración de una matriz basada en una dimensión índice de valor y una

dimensión índice de riesgo (ver Figura 38). El índice de valor debe incluir criterios

como el cumplimiento de los principios, la contribución financiera, la alineación

estratégica, y la posición competitiva. El índice de riesgo debe incluir criterios

como el tamaño y la complejidad, la tecnología, la capacidad de organización, y el

impacto de un fracaso. A cada criterio se debe asignar un peso individual [16]. La

priorización de proyectos es una tarea que principalmente debe hacer el CEO en

compañía de los mandos medios y el grupo de arquitectura.

Figura 38. Técnica de evaluación del valor de negocio [16]

A continuación se mencionan varios criterios que se deben consideran al memento

de realizar una priorización de proyectos:

Beneficios que le aporta el proyecto a la organización:

127

o Aumento de ingresos o disminución de costos: por factores tales como

captación de nuevos clientes, extensión del negocio hacia nuevos canales,

lanzamiento de nuevos productos.

o Mejora del servicio por agilización de procesos: mejorar la información para

soportar la atención al cliente, reducción de errores de datos.

Factores que representan un riesgo:

o Uso de tecnologías no probadas

o Restricciones de tiempo

Capacidad o disponibilidad de los medios para manejar el proyecto

o Disponibilidad de recursos (técnicos, personal capacitado, presupuesto)

o Adaptabilidad de las fuentes de datos involucradas a la nueva arquitectura

de información.

3.2.2 Guía metodológica para gobierno de datos

Como resultado del análisis del estado del arte, se observa que existen diversas

propuestas para gobierno de datos y muy diversas entre sí, cada propuesta

aborda el tema desde perspectivas diferentes y abordan temas igualmente

importantes. En consecuencia si una empresa desea diseñar e implementar su

gobierno de datos debe hacer una ardua tarea de revisar cada una de las

propuestas y realizar un análisis para determinar que le sirve y que no le sirve de

acuerdo a sus necesidades. Además estas propuestas no cuentan con una guía

metodológica completa sobre como diseñar e implementar un gobierno de datos.

Para resolver el problema identificado en el análisis del estado del arte, se

propone una guía metodológica (ver Figura 39), donde se proponen una serie de

10 actividades que guían el diseño e implementación de un gobierno de datos. En

esta guía se buscó incluir los aspectos elementales tomados de las propuestas

128

analizadas en el estado del arte y que se deben considerar en la definición de la

guía metodológica en la cual se busca un fácil y rápido de entendimiento de como

diseñar y gestionar un gobierno de datos.

PreparacionMapa de Proyectos

DiseñoEvaluación de

Madurez

Modelo Organizacional

Definir Metricas

Gobierno de Datos Maestros

Gobierno de Analisis

Gestión de Seguridad y Privacidad

Medir Resultados

Figura 39. Guía Metodológica para Diseño de un Gobierno de Datos

De las 10 actividades propuestas en la guía metodológica 3 son opcionales y 7

son obligatorias. Se recomienda que la empresa seleccione por lo menos 1 de las

tres actividades opcionales [26]. A continuación se describe para cada una de las

actividades los aspectos que se deben considerar.

La guía metodológica propuesta tiene su origen en las tres propuestas de gobierno

de datos analizadas en el estado del arte y reúne los elementos principales de

cada una.

129

3.2.2.1 Preparación

En esta etapa se deben definir aspectos como la evangelización que debe ser

asumida preferiblemente por el CEO o algún representante en su nombre que

actúe como apoyo ejecutivo para que los empleados de la empresa vean el

proyecto de AI como algo importante para la compañía y que deben brindar su

apoyo incondicional. En reunión con el CEO se debe también definir el alcance del

gobierno de datos, quienes serán los responsables de los datos críticos, quien

coordinara o liderará el proyecto, si el negocio o IT.

También es importante identificar la estructura organizacional de la empresa y

conocer si es centralizada, descentralizada o mixta. Definir si se requieren roles de

medio tiempo o tiempo completo y si en la empresa existe personal capacitado en

el tema. Establecer la financiación del proyecto de gobierno de datos para saber si

es un proyecto global e independiente de los demás proyectos o si se adhiere y

sustenta en algún proyecto ya existente, puede ser un proyecto de BI, o un

proyecto de calidad de datos o cualquier proyecto referente a datos.

3.2.2.2 Diseño

Se debe tener claro desde un comienzo que la cultura existente de su empresa no

va a cambiar para apoyar el gobierno de datos, así que en su lugar se debe

trabajar para entender su cultura y aprovechar sus puntos fuertes. Por ejemplo, en

una cultura donde cada unidad de negocio opera de forma independiente y da

prioridad a su propia dirección estratégica, será apropiado fomentar un enfoque de

gobierno de datos descentralizado, donde expertos en la materia en diferentes

unidades de negocio colaboren unos con otros, evitando así un rol de liderazgo

centralizado pueda ser visto como una amenaza.

El éxito de varias empresas según [22] radica en poner en marcha el gobierno

dentro de un proyecto de BI o DW, una iniciativa MDM, o dentro de un CRM o

130

ERP. Básicamente utilizan un enfoque donde van creciendo proyecto a proyecto

hasta cubrir todos los datos empresariales.

Es importante definir los patrocinadores ejecutivos y administradores de datos

desde el comienzo y utilizarlos como sus evangelistas. La mayoría de las

organizaciones requieren que la alta gerencia y sus ejecutivos definan las

prioridades para lograr cambios reales en la gestión y calidad de los datos [22].

Es importante usar medidas cualitativas y cuantitativas de las principales

funciones de negocio, tales como marketing, finanzas, ventas y operaciones de

call center, para justificar los programas de gobierno.

También es vital incluir la participación en las metas del empleado porque nada

mata a un programa de gestión de datos más rápido que esperar la participación

voluntaria. Se debe premiar a los administradores en las evaluaciones de su

desempeño mediante el reconocimiento de su participación y las contribuciones. Y

si algunos no colaboran, escalar a su jefe directo [22].

A nivel de estructura organizacional del gobierno de datos se debe dar prioridad a

un enfoque centralizado. Es de aclarar que aunque las decisiones a nivel

corporativo se recomienda manejarlas de forma centralizada, los datos relevantes

para una sola línea de negocio pueden ser manejados de forma descentralizada

[22].

3.2.2.3 Evaluación de Madurez

De acuerdo con [26], toda organización necesita llevar a cabo una evaluación de

madurez de su gobierno, de preferencia sobre un periodo de tiempo anual. El IBM

Data Governance Council ha desarrollado un modelo de madurez basado en 11

categorías (ver capítulo 5 en [26]), tales como “Gestión de Riesgos de Datos y

Cumplimiento”, “Creación de Valor”, y “Administración”. La organización de

131

Gobierno de Datos debe evaluar el nivel actual de madurez (estado actual) y el

nivel futuro deseado de la madurez (estado futuro), que suele ser de 12 a 18

meses por lo menos. Esta duración debe ser suficiente para producir resultados,

pero lo suficientemente corto como para asegurar la continua aceptación por parte

de las principales partes interesadas.

En el apéndice D de [26] se encuentra un ejemplo de un cuestionario de

evaluación para determinar el nivel de madurez del gobierno de datos. También en

el capítulo 5 se describe detalladamente esta actividad.

3.2.2.4 Mapa de proyectos

Se debe desarrollar un plan de trabajo para cerrar la brecha entre el estado actual

y el estado futuro deseado para las 11 categorías de madurez de la gobernabilidad

de datos (ver capítulo 5 en [26]). Por ejemplo, la organización de gobierno de

datos podría revisar la brecha de vencimientos para la administración y determinar

que la empresa debe nombrar a los administradores de datos para centrarse en

temas específicos tales como clientes, proveedores, y producto. El programa de

gobierno de datos también debe incluir éxitos rápidos, áreas donde la iniciativa

puede generar valor al negocio en plazos cortos.

En el capítulo 6 de [26], se hace una explicación detallada sobre este tema.

3.2.2.5 Modelo Organizacional

La organización de gobierno de datos debe construir un modelo para dirigir sus

operaciones, y para asegurar quien tiene la autoridad suficiente para actuar como

árbitro en situaciones críticas. La organización de gobierno de datos funciona

mejor en un formato de tres niveles. El nivel superior es el Consejo de Gobierno

de Datos, que se compone de los principales líderes funcionales y de negocio que

132

dependen de los datos como un activo de la empresa. El nivel intermedio es el

grupo de gobierno de datos de trabajo, que consiste en los mandos medios que se

reúnen con más frecuencia. El último nivel consiste en la comunidad de

administradores de datos, que es responsable de la calidad de los datos en el día

a día [26].

En el capítulo 7 de [26], se hace una explicación detallada sobre este tema.

3.2.2.6 Definir Métricas

El gobierno de datos debe contar con indicadores sólidos para medir y monitorear

el progreso. Como resultado, el equipo de gobierno de datos debe recoger unos

pocos indicadores principales de rendimiento (KPIs) para medir el desempeño

continuo del programa. En el apéndice E de [26] se explica mediante un ejemplo

los aspectos como principios, políticas, procedimientos y reglas de negocio, los

cuales se deben entender y trabajar previamente a definir las métricas, puesto que

las métricas dependen de esos aspectos.

Estos son los nueve primeros pasos requeridos. El paso final requerido se discute

más adelante. La empresa también tiene que seleccionar al menos una de los

cuatro pasos de datos opcionales de Gobierno (Gobierno de Datos Maestros,

análisis de Gobierno, Seguridad y privacidad, y la información del ciclo de vida de

Gobierno).

En el capítulo 9 de [26], se hace una explicación detallada sobre este tema.

133

3.2.2.7 Gobierno de datos maestros

Aquí se debe crear una práctica continua, mediante el cual se debe definir los

principios, políticas, procesos, reglas de negocio y métricas (ver apéndice E en

[26]), específicamente para datos maestros, de tal forma que ayude en la

consecución de los objetivos de negocio, mediante la gestión de la calidad de los

datos maestros.

En el capítulo 14 de [26], se hace una explicación detallada sobre este tema.

3.2.2.8 Gobierno de análisis

En esta etapa se debe definir las políticas y procedimientos para alinear los

usuarios de negocio con las inversiones en infraestructura analítica. Para esto el

gobierno de datos debe plantearse y responder las siguientes preguntas:

o ¿Cuantos usuarios de los datos existen en la empresa por área de

negocio?

o ¿Cuantos reportes se deben crear por área de negocio?

o ¿Cuántos reportes se ejecutan por mes?

o ¿Cada cuánto tiempo necesitan ejecutar cada reporte?

o ¿Se puede entrenar a los usuarios de negocio para generar sus propios

reportes?

El tema de gobierno de análisis está relacionado con el área de BI, para lo cual se

recomienda seguir la metodología Kimball. También en el capítulo 15 de [26], se

hace una explicación detallada sobre este tema.

3.2.2.9 Gestionar la seguridad y privacidad

Aquí se deben gestionar los temas relacionados con la seguridad de los datos y la

privacidad. Algunos de los retos comunes de seguridad de datos y desafíos de

privacidad son:

134

Donde esta nuestra información confidencial?

La organización ha enmascarado sus datos confidenciales en los entornos que

no son de producción (desarrollo, pruebas y capacitación) para cumplir con las

regulaciones de privacidad?

Están los controles de auditoría de base de datos en el lugar para evitar el

acceso de los usuarios privilegiados, por ejemplo, como administradores de

bases, a los datos privados, como los sueldos de los empleados y listas de

clientes?

Controles de acceso.

Copias de seguridad.

Seguir alguno de los estándares de seguridad ya existente, tales como el libro

naranja Trusted Computer System Evaluation Criteria (TCSEC), El Criterio

Europeo de Evaluación de Seguridad en Tecnología de la Información (ITSEC),

Dimensiones de Calidad de Datos según ISO/IEC 25012, entre otros.

En el capítulo 16 de [26], se hace una explicación detallada sobre este tema.

3.2.2.10 Medir Resultados

El gobierno de datos debe asegurar una mejora continua mediante un seguimiento

constante de las métricas definidas. Entonces para medir los resultados y hacer el

seguimiento continuo se sugiere utilizar el método para análisis de calidad de

datos que se describe en la sección Análisis de la información. Como

complemento se puede revisar el capítulo 18 de [26].

135

4 APLICACIÓN DE LA GUIA METODOLOGICA PARA EL PROYECTO INICIAL

DE ARQUITECTURA DE INFORMACION EN LA ADMINISTRADORA

COLOMBIANA DE PENSIONES COLPENSIONES

La guía metodológica para el desarrollo del proyecto inicial de arquitectura de

información, fue probada en el proyecto de arquitectura de información que hace

parte integral del proyecto de arquitectura empresarial, para la creación de la

Administradora Colombiana de Pensiones COLPENSIONES que tiene su origen

en un esfuerzo del estado por unificar las diversas administradoras de pensiones

de orden estatal que existen a nivel nacional y departamental.

El objetivo principal del proyecto, es diagnosticar la situación actual de las

tecnologías de información y comunicaciones del Instituto de los Seguros Sociales

(ISS) y la Caja de Previsión Social de Comunicaciones (Caprecom), a partir de

estudios existentes y de validación directa, teniendo en cuenta la estrategia de

negocio de COLPENSIONES, los requerimientos normativos de la

Superintendencia Financiera de Colombia, las perspectivas de Gobierno de

Tecnología e Informática (TI), Arquitectura Empresarial de TI, y Soporte y entrega

de servicios de TI. También considera el diseño del Plan Estratégico de

Tecnologías de Información y Comunicaciones (TIC’s) de COLPENSIONES, con

base en las mejores prácticas y utilización de las tecnologías de punta en

información y comunicaciones. Además de la elaboración del plan de

implementación integral.

En este trabajo se abordara el objetivo principal del proyecto de creación de

COLPENSIONES, desde una perspectiva de arquitectura de información en un

contexto de arquitectura empresarial, donde se considera como punto de partida la

situación actual de la arquitectura de información del ISS y Caprecom para la

creación de la nueva empresa COLPENSIONES.

136

Es así como en la sección 4.1, se presenta la primera etapa de la metodología

llamada Preparación, donde se abordan las actividades de grupos de apoyo,

conociendo la organización, alcance de la AI, modelos de referencia, herramientas

y técnicas.

En la sección 4.2, se presenta la segunda etapa de la metodología llamada Estado

Actual, donde se abordan las actividades de entrevistas, procesos de negocio,

entidades de negocio, modelo conceptual, gobierno de datos, fuentes de datos y el

análisis de la situación actual.

La tercera etapa de la metodología llamada Estado Deseado donde se abordan

las actividades de Blueprint de Gobierno de Datos y Blueprint de Arquitectura de

Datos se presenta en la sección 4.3.

La cuarta y última etapa de la metodología llamada Mapa de Proyectos donde se

abordan las actividades de Priorización de Proyectos y Ruta de Ejecución se

presenta en la sección 4.4.

4.1 ETAPA 1: PREPARACION

4.1.1 Conociendo la organización - COLPENSIONES

La actividad de conociendo la organización se empezó con una primera reunión de

lanzamiento del proyecto, donde se presentó formalmente el proyecto de AI como

parte integral del proyecto de AE. En el anexo N° 5 de este trabajo se encuentra

una copia del acta de la reunión. Además en el anexo N° 6 se encuentra una copia

de la plantilla donde se relaciona la información solicitada durante la reunión. A

continuación se describe la información que se solicitó y que es fundamental para

conocer la organización y entender el contexto donde se desarrollara el proyecto

de AI.

137

La información que se presenta durante el desarrollo de esta actividad fue tomada

de [31].

Misión

Somos la Administradora del régimen de prima media con prestación definida que

garantiza el reconocimiento de las prestaciones económicas y los beneficios

económicos periódicos en condiciones de sostenibilidad, eficiencia y economía,

orientada al exitoso cumplimiento de los procesos que le permiten el desarrollo de

su objeto con un talento humano eficiente, competente y comprometido logrando

la satisfacción de nuestros clientes.

Visión

Colpensiones se constituirá en una Empresa innovadora y sólida con altos

estándares deservicio y líder en el aseguramiento del sistema pensional

colombiano, apoyada en macroprocesos, tecnología y talento humano de la mejor

calidad, para crear y mantener relaciones a largo plazo con clientes leales y

satisfechos.

Objetivo general y objetivos específicos

En desarrollo de las disposiciones que regulan el sistema general de seguridad

social en pensiones y de la disposición de creación prevista en el artículo 155 de

la Ley 1151 de 2007, la Administradora Colombiana de Pensiones, Colpensiones

tiene como objetivo general cumplir con la administración estatal del régimen

solidario de prima media con prestación definida y con los servicios y prestaciones

especiales que las normas legales le asignen, incluyendo los beneficios

económicos periódicos a que se refiere la Constitución y la Ley.

138

Son objetivos específicos de la Administradora Colombiana de Pensiones,

Colpensiones:

Administrar el régimen solidario de prima media con prestación definida de forma

que se dé cumplimiento al ordenamiento normativo que constituye el Sistema

General de Seguridad Social en Pensiones.

Administrar los beneficios económicos periódicos de que trata el artículo 58 de la

Constitución Política y las normas legales y reglamentarias que lo desarrollen.

Adelantar la gestión comercial, la gestión de servicio al cliente, la gestión de

historia pensional, la gestión de nómina, la gestión de reconocimiento de

prestaciones económicas a su cargo y la gestión de recursos públicos del régimen

y los servicios que administre. (Esta corresponde a función y como objetivo no es

claro), proponemos:

Implementar el proceso de gestión comercial para propender la afiliación,

fidelización del cliente y por ende el posicionamiento de la Administradora.

Mantener el proceso de servicio a los afiliados y no afiliados para lograr la

satisfacción del usuario.

Mantener actualizadas las historias pensionales para lograr el reconocimiento

oportuno delos beneficios y prestaciones económicas.

Establecer mecanismos para generar la nómina con las respectivas novedades de

pensionados para lograr el pago oportuno de las mesadas pensionales.

Desarrollar y retroalimentar el macroproceso estratégico de la Administradora en

caminado al logro del objeto social.

Desarrollar la gestión y los sistemas de control y auditoría que requieran la

empresa y el régimen y servicios a su cargo.

139

Cumplir con las disposiciones normativas que regulan su existencia y operatividad,

como también con las actividades de apoyo, administrativas, financieras,

contractuales, de talento humano y documental requeridas por la empresa para el

desarrollo de su objeto.

Identificación del mapa de proceso o cadena de valor

La identificación del mapa de procesos se realiza en los siguientes cuadros:

140

141

Para desarrollar las funciones misionales, Colpensiones debe adelantar

programas de publicidad, comunicación y promoción de su actividad como

administradora, afiliar, disponer de un sistema de información que le permita llevar

el registro de afiliados, diseñar una estructura de atención al usuario, recaudar y

administrar la cuenta común donde ingresan las cotizaciones de los afiliados, junto

con las inversiones y reservas, reconocer el ingreso, cobrar bonos pensionales y

cuotas partes, mantener y actualizar la historia pensional de los afiliados,

reconocer y pagar a los beneficiarios oportunamente las prestaciones económicas

a su cargo, y ejercer control sobre toda la operación como administradora del

régimen de prima media y de beneficios económicos periódicos.

Con el fin de dar cumplimiento al objetivo establecido por la Ley, y basados en los

componentes de un sistema de pensiones y de beneficios, se determinan los

macroprocesos, procesos, subprocesos y procedimientos, que proporcionan la

visión sistémica requerida para la definición de una estructura orgánica adecuada,

que permita el cumplimiento de la misión institucional, en condiciones de eficiencia

y eficacia que optimicen el beneficio de su población objetivo. El modelo de

operación agrupa cuatro macroprocesos:

142

Macroprocesos Estratégicos

Son aquellos que orientan, evalúan y hacen seguimiento a la gestión de la entidad,

incluye procesos relativos al establecimiento de políticas, estrategias, fijación de

objetivos, provisión de comunicación y aseguramiento de la disponibilidad de

recursos necesarios para cumplir con su objeto y revisión por la dirección.

Los macroprocesos estratégicos en Colpensiones agruparán los procesos que

materializan el objetivo, las políticas, la estrategia corporativa y el

direccionamiento de la Administradora. Estos procesos establecerán y controlarán

las metas, estimularán la dinámica organizacional a través de la conducción

tecnológica, la planeación corporativa, la gestión jurídica y doctrinal y la gestión

documental. Adicionalmente, apoyarán la excelencia Institucional a través de la

optimización delos procesos de manera planificada, organizada, integrada y

sistémica en procura de mayor calidad y competitividad.

Macroprocesos Misionales

Son aquellos que contribuyen directamente al cumplimiento de los objetivos y a la

razón de ser de la organización; su objetivo fundamental es entregar los productos

o servicios que el cliente o usuario requiere para satisfacer sus necesidades.

Incluyen todos los procesos que proporcionan el resultado previsto por la entidad

en el cumplimiento de su objeto social o razón de ser.

Los macroprocesos misionales en Colpensiones reflejarán la misión institucional;

así mismo, representarán la esencia y el deber ser de la administradora del

régimen de prima media. Mediante su ejecución se obtendrán los servicios con

valor agregado para la satisfacción de los clientes.

143

Macroprocesos de Apoyo

Son aquellos que dan soporte para el buen funcionamiento y operación de los

procesos estratégicos, misionales y de control y evaluación de la organización.

Incluyen todos aquellos procesos para la provisión de los recursos que son

necesarios en los procesos estratégicos, misionales y de medición, análisis y

mejora.

Los macroprocesos de apoyo, aunque no están ligados directamente a la misión

de la administradora, resultarán necesarios para que los estratégicos, misionales y

de control y evaluación puedan cumplir sus objetivos. Así mismo, .le permitirán a

Colpensiones la sinergia organizacional y proporcionarán los medios y condiciones

para una dinámica institucional efectiva.

Macroprocesos de Control y Evaluación

Son aquellos que adelantan las mismas dependencias responsables del proceso y

la oficina de control interno o quien haga sus veces, para verificar que los

resultados y acciones previstas se cumplieron de conformidad con lo planeado.

Incluyen aquellos procesos necesarios para medir y recopilar datos destinados a

realizar el análisis del desempeño y la mejora de la eficacia y la eficiencia.

Albergan, en consecuencia, procesos de medición, seguimiento, auditoría,

acciones correctivas y preventivas, y son una parte integral de los procesos

estratégicos, de apoyo y los misionales.

A continuación se presentan de manera gráfica los macroprocesos y procesos que

al interrelacionarse entre sí, permitirán de forma eficiente y eficaz el cumplimiento

del objeto misional de la administradora.

144

Identificación de productos y servicios ofrecidos

Para efectos de este trabajo solo se tienen en cuenta los procesos misionales.

145

146

Organigrama

4.1.2 Grupos de apoyo

Grupos de apoyo es la actividad donde se listan los principales roles involucrados

en el proyecto.

Grupo Estrategico

•Presidente

•Vicepresidentes

•Gerente del proyecto

Grupo de Negocio

•Gerentes

•Coordinadores

•Funcionarios

Grupo de Arquitectura

•Coordinador de Tecnología

•Arquitecto de aplicaciones

•DBA's

•Desarrolladores de BD's

147

4.1.3 Modelos de referencia

Para el desarrollo de este proyecto se tomara como modelo de referencia para el

tema de dominios de datos el presentado en la sección Modelo de referencia de

información empresarial, para el tema de gobierno de datos se tomara como

modelo de referencia el presentado en la sección Modelo de referencia de

gobierno de datos y para la definición del alcance del proyecto se tomara como

modelo de referencia el presentado en la sección Alcance de la AI.

4.1.4 Alcance de la arquitectura de información

Tomando como herramienta el modelo de referencia para la definición del alcance

del proyecto de AI, se define lo siguiente:

Para la fase inicial de este proyecto solo se enfocara en el domino de Datos

Maestros.

Grupo de Apoyo Nombres Rol Telefono Correo

Pedro Duarte Presidente 4162700 Ext 105

Jaime Perez Vicepresidente de tecnologia 4162700 Ext 106 [email protected]

Teresa Salcedo Vicepresidente Administrativo 4162700 Ext 107

Jhon Carranza Vicepresidente Comercial 4162700 Ext 108 [email protected]

Leandro SantamariaVicepresidente de servicio

al cliente 4162700 Ext 109 leandro.santamaria@

Carlos MarchenaVicepresidente de gestion

historia pensional 4162700 Ext 110 carlos.marchena@

Camilo A. ZuñigaVicepresidente de beneficios

y prestaciones 4162700 Ext 111 camilo.zuniga@

Camilo Torres Gerente de proyecto 4162700 Ext 112 camilo.torres@

Miguel Rodriguez Gerente de mercadeo 4162720 Ext 141

Rene Mendoza Gerente de ingresos 4162721 Ext 142 rene.mendoza@

Jairo Rodriguez Gerente de recaudo 4162722 Ext 143 jairo.rodriguez@

Zonia Villamizar Gerente de cobro 4162720 Ext 142

Monica Lopez Gerente de archivo 4162721 Ext 143 monica.lopez@

Clara Rincon Gerente de determinación 4162722 Ext 144

Armando Becerra Coordinador de Tecnlogia 4162720 Ext 123 armando.becerra@

Santiago Toro Arquitecto de aplicaciones 4162721 Ext 124 santiago.toro@

Beatriz Vaca Lider de DBA's 4162722 Ext 125 beatriz.vaca@

Sonia Sanchez Lider de desarrolladores 4162720 Ext 124 sonia.sanchez@

Grupo Estrategico

Grupo de Negocio

Grupo de Arquitectura

148

El alcance de este proyecto, solo llega hasta la ejecución del proyecto inicial de AI.

La ejecución de los proyectos particulares está fuera del alcance de la fase inicial.

La descripción de los temas que se encuentras dentro del alcance definido para el

proyecto de AI en su fase inicial, es la siguiente:

Describir la Arquitectura de Información actual del Instituto de Seguros Sociales

(ISS), la Arquitectura de Información objetivo de Colpensiones y el Mapa de

proyectos para superar la brecha existente entre la situación actual y la situación

deseada. La primera hace referencia a toda la información relacionada con la

Arquitectura actual de información (situación actual), la segunda hace referencia a

la propuesta de la Arquitectura deseada de Información (situación deseada) y el

mapa de proyectos trata el tema de definición de proyectos, priorización y ruta de

ejecución.

4.1.5 Herramientas y técnicas

La herramienta seleccionada para realizar el trabajo de AI es Enterprise Architect,

esta herramienta fue seleccionada por su capacidad para:

Crear modelos de datos conceptuales y físicos.

Explorar y visualizar la estructura de las fuentes de datos.

Relacionar fuentes de datos.

Comparar estructuras de fuentes de datos.

Descubrir similitudes entre fuentes de datos.

Analizar modelos y fuentes de datos para validar estándares.

4.2 ESTADO ACTUAL DE ARQUITECTURA DE INFORMACION

En esta sección se comienza con las entrevistas que es la actividad donde el

grupo de AI se reunió con los grupos de negocio y de arquitectura para capturar la

149

información necesaria y analizarla para determinar el estado actual de la

información.

Seguidamente al análisis de la información capturada en las entrevistas se

identificó y documentaron las entidades de negocio y también se creó el modelo

conceptual de datos.

Posteriormente se realizaron entrevistas para identificar la situación actual del

gobierno de datos y las fuentes de datos. También se presenta la relación

existente entre el modelo conceptual y las fuentes de datos; aquí se puede

apreciar si hay elementos conceptuales no incluidos en las fuentes de datos, o si

hay fuentes de datos no consideradas en el modelo conceptual.

Por último se aborda el tema de la robustez de los datos, el cual es abordado en

tres aspectos: Análisis de la información donde se revisan las dimensiones de

calidad de los datos, Riegos de seguridad donde se revisan las medidas de control

existentes y para finalizar se hace una análisis de la situación actual de gobierno

de datos.

4.2.1 Entrevistas

Se realizaron una serie de entrevistas para complementar y validar la información

suministrada en la etapa de preparación. Primero se realizaron entrevistas con el

grupo de negocio y posteriormente se realizaron entrevistas con el grupo de

arquitectura.

4.2.2 Entidades de negocio

Como resultado del análisis de las entrevistas realizadas al grupo de negocio se

identificaron las entidades de negocio y reglas de negocio que describen como se

150

relacionan entre sí. A continuación se utiliza la Plantilla 2 para describir cada uno

de las entidades de negocio identificadas:

Entidad de negocio EN-D001 Persona

Definición Contiene la información básica sobre todos los entes

que tienen relación con el negocio de pensiones de la

organización. Los bancos, Asofondos, la

Superintendencia Financiera, los aportantes, los

beneficiarios y cualquier otro ente están representados

en esta entidad.

Descripción general Las personas juegan roles que definen cuál es su

relación con la organización. Las reglas que gobiernan

los roles son:

Para que un ente exista en la entidad Persona,

debe tener o haber tenido una relación con la

organización; en otras palabras, en esta entidad no

existen personas sin relaciones actuales o pasadas

con la organización.

Una persona puede jugar más de un rol, lo que

refleja el hecho de que las personas pueden tener

más de una relación con la entidad; por ejemplo, un

empleador que sea persona natural puede también

ser un afiliado o un pensionado.

En la generalidad de los casos, los roles son

jugados de manera temporal; por ejemplo, la

persona comienza a hacer aportes en una cierta

fecha y (posiblemente) termina de hacerlos en otra

fecha. Lo anterior explica por qué este modelo no

151

Entidad de negocio EN-D001 Persona

muestra muchas de las entidades que normalmente

se manejan como afiliados, aportantes, etc.

Las personas se dividen en personas naturales y

personas jurídicas, estos 2 subconjuntos son disyuntos

y existe cierta especialización, por ejemplo, las

personas jurídicas no pueden ser afiliados.

Entidades hijas Natural (en adelante Persona Natural)

Jurídica (en adelante Persona Jurídica)

Entidades

relacionadas

Afiliación

Recaudo

Nómina Pensionados Cuota Parte Pensional

Bono Pensional

Entidad de negocio EN-D002 Afiliación

Definición Representa la información asociada al rol de afiliado de

una persona.

Descripción general Una afiliación se produce bajo las siguientes

circunstancias: primero, una persona natural adquiere

el carácter de afiliado al Sistema General de

Pensiones; segundo, una persona (natural o jurídica)

adquiere el carácter de empleador de otra persona

natural.

Entidades hijas Ninguna

Entidades

relacionadas

Persona

Persona Natural

Historia_Laboral

Reconocimiento

Recaudo

152

Entidad de negocio EN-D002 Afiliación

Bono_Pensional

Entidad de negocio EN-D003 Recaudo

Definición Representa la información asociada a los aportes

periódicos recibidos en las cuentas de los afiliados,

realizados por un empleador.

Descripción general Un recaudo proviene de una persona, bien sea natural o jurídica, por concepto de aportes hacia una persona natural. Así mismo, un recaudo es procesado por una persona jurídica que asume el rol de operador y es recibido por una persona jurídica que asume el rol de banco. Una agregación de recaudos compone una historia laboral. Un recaudo se clasifica en: Recaudos pagados, los que efectivamente fueron

recibidos; pueden estar asociados a un afiliado

válido o a una persona natural que no es un

afiliado (lo que hoy se conoce como aportes de no

vinculados).

Recaudos presuntos, son recaudos que no se

recibieron para afiliados válidos y que para esos

afiliados no existe una novedad que justifique el no

aporte. Actualmente son conocidos como aportes

presuntos o como debido cobrar dependiendo de la

época en que se generaron.

Los recaudos pueden ser pagados (efectivamente

recibidos) o presuntos (los que se esperaban y que no

llegaron).

Entidades hijas Pagado (en adelante Recaudo Pagado)

Presunto (en adelante Recaudo Presunto)

Entidades Persona

153

Entidad de negocio EN-D003 Recaudo

relacionadas Historia_Laboral

Afiliación

Entidad de negocio EN-D004 Historia_Laboral

Definición Representa la información acumulada de los aportes

para un afiliado específico.

Descripción general La información de historia laboral puede corresponder a varios empleadores o a aportes como independiente y carecerá de aquellos periodos en los que no hubo aportes. El histórico de aportes registrados en la historia laboral pertenecen a una afiliación específica; la historia laboral es base de cálculo tanto para un bono pensional como para un reconocimiento. Parte de la historia laboral está constituida por la información de los aportes que le fueron consignados al afiliado en otras administradoras en que pudo haber estado. Estas administradoras envían la información de aportes en el momento en que se realiza el traslado del afiliado. Dicha información pasa a formar parte de la historia laboral del afiliado.

Así mismo, la historia laboral es la base para el

reconocimiento; el vínculo entre éstas dos se da a

través de la afiliación, puesto que un reconocimiento

pertenece a una afiliación específica y a su vez una

afiliación comprende un conjunto de historias laborales

del individuo.

Entidades hijas Ninguna

Entidades

relacionadas

Afiliación

Recaudo

Entidad de negocio EN-D005 Bono Pensional

154

Entidad de negocio EN-D005 Bono Pensional

Definición Representa la información asociada a los bonos

pensionales de todas las clases, ya sean emitidos por

el ISS o por otras entidades.

Descripción general Un bono pensional es contribuido por una persona jurídica específica; además, un bono pensional es una parte integral de un reconocimiento. El bono pensional toma como base de cálculo la historia laboral de un afiliado; el vínculo entre estas dos se da a través de la afiliación, puesto que un bono pensional se asocia a una afiliación específica y a su vez una afiliación comprende un conjunto de historias laborales del afiliado.

Entidades hijas Ninguna

Entidades

relacionadas

Afiliación

Persona Jurídica

Reconocimiento

Entidad de negocio EN-D006 Reconocimiento

Definición Representa los datos asociados al reconocimiento de la

pensión.

Descripción general El reconocimiento contiene información tal como la fecha en que se genera, criterios usados, número de semanas incluidas, datos de bonos incluidos y cuotas partes pensionales que serán parte del reconocimiento de la pensión. El reconocimiento es causado a una afiliación y tiene como base la historia laboral (a través de la afiliación), el bono pensional (si existe) y la cuota parte pensional (si existe), del afiliado. El reconocimiento es el proceso por medio del cual se realiza el cálculo de la pensión.

Entidades hijas Ninguna

Entidades

relacionadas

Afiliación

Bono Pensional

Cuota Parte Pensional

155

Entidad de negocio EN-D006 Reconocimiento

Nómina Pensionados

Entidad de negocio EN-D007 Nómina Pensionados

Definición Representa la información asociada a los pagos

realizados a los beneficiarios de prestaciones.

Descripción general Representa los pagos realizados a los pensionados o quienes tengan derecho a dicha pensión (en ausencia del pensionado), en base al reconocimiento que previamente se les ha hecho. En caso de que existan cuotas partes pensionales, el ISS calcula el total de las mismas por cada entidad concurrente para enviar la respectiva cuenta de cobro. El beneficiario de una pensión es una persona natural.

Entidades hijas Ninguna

Entidades

relacionadas

Persona Natural

Reconocimiento

Cuota Parte Pensional

Entidad de negocio EN-D008 Cuota Parte Pensional

Definición Representa información relacionada con montos

periódicos que la organización debe pagar a otras

entidades para contribuir al pago de pensionados en

otras entidades o que recibe de otras entidades para

contribuir al pago de pensionados de la organización.

Descripción general Las cuotas partes pensionales están destinadas a uno de los pensionados de la organización; así mismo las cuotas partes pensionales son provistas por una persona jurídica, cuando son recibidas, o pueden estar dirigidas a una persona jurídica, cuando son emitidas; en cualquier caso, las operaciones de cobro y pago de las cuotas partes pensionales son entre personas jurídicas.

Entidades hijas Ninguna

156

Entidad de negocio EN-D008 Cuota Parte Pensional

Entidades

relacionadas

Nómina Pensionados Persona Jurídica

Reconocimiento

4.2.3 Modelo conceptual

El modelo conceptual de las entidades de negocio representa el primer nivel de

abstracción acerca de los datos fundamentales desde el punto de vista del

negocio, y cómo estos datos cumplen con unas reglas de negocio para

relacionarse entre sí; por ejemplo, una afiliación implica la existencia de una

persona natural (el afiliado) y una persona (natural o jurídica) el empleador, este

último podría ser vacío para el caso de los trabajadores independientes.

157

Este modelo conceptual fue creado inicialmente con la información capturada y

analizada de las entrevistas con el grupo de negocio. Posteriormente fue validado

con el grupo de arquitectura.

4.2.4 Análisis del estado actual de la AI

En esta sección se presenta el análisis realizado a la situación actual de la

arquitectura de información desde cuatro perspectivas; análisis de las fuentes de

datos, análisis de la información, análisis de gobierno de datos y análisis de

riesgos de seguridad. Para cada una de estas perspectivas se presenta una serie

de hallazgos como producto del análisis realizado y que se documentan siguiendo

la plantilla correspondiente.

4.2.4.1 Análisis de fuentes de datos

Por fuentes de datos se entiende todos aquellos conjuntos de información que son

creados, consultados, modificados o borrados como parte de los procesos de

negocio de las entidades.

A diferencia del modelo conceptual presentado en el numeral anterior, las fuentes

de datos tienen existencia real, son objetos del mundo físico, utilizadas

actualmente o con potencial de uso en la organización.

Las más comunes e importantes fuentes de datos son las bases de datos (en

adelante BD) de uso corriente en la organización. Inicialmente se manejó un

inventario entregado por el ISS de cerca de 50 bases de datos.

La información de las fuentes de datos fue capturada de las entrevistar realizadas

al grupo de arquitectura. A continuación se utiliza Plantilla 3 para documentar el

158

inventario de fuentes de datos, donde se presenta la lista de las fuentes de datos,

una descripción y datos técnicos asociados.

Nombre Descripción Tamaño

(Mb)

Número

de

Tablas

Número

de

Procedi-

mientos

Número

de

Vistas

Número de

Disparado-

res

afe

Soporta la

aplicación para

controlar el flujo de

expedientes de

solicitud de

prestaciones

económicas

44000 358 1047 44 42

auditoria

Mantiene los

registros de

inclusiones o

modificaciones el

tablas de otras

bases de datos

475000 511 5 3 0

autol

Mantiene

información de

recaudos del año

1995 (junio) al

2006 base para

migración a

Sabass recaudo.

Esta BD se usa

sólo eventualmente

en casos de

corrección de HL

570000 1467 1525 106 135

autol_2000 Autoliquidación 33000 79 2 1 144

159

Nombre Descripción Tamaño

(Mb)

Número

de

Tablas

Número

de

Procedi-

mientos

Número

de

Vistas

Número de

Disparado-

res

Año 2000

autol_2001 Autoliquidación

Año 2001 33000 82 1 1 144

autol_2002 Autoliquidación

Año 2002 33000 78 3 1 144

autol_2003 Autoliquidación

Año 2003 33000 78 3 1 144

autol_2004 Autoliquidación

Año 2004 33000 78 3 3 144

autol_2005 Autoliquidación

Año 2005 33000 78 3 1 144

autol_2006 Autoliquidación

Año 2006 33000 78 3 1 144

autol_95 Autoliquidación

Año 1995 33000 113 35 1 138

autol_96 Autoliquidación

Año 1996 33000 107 7 1 144

autol_97 Autoliquidación

Año 1997 33000 107 36 1 144

autol_98 Autoliquidación

Año 1998 33000 146 30 1 144

autol_99 Autoliquidación

Año 1999 33000 112 13 1 150

autol_com

Información

complementaria

para el recaudo

1995 - 2006

66000 1856 476 1 0

160

Nombre Descripción Tamaño

(Mb)

Número

de

Tablas

Número

de

Procedi-

mientos

Número

de

Vistas

Número de

Disparado-

res

basica

Información de la

Base de datos de

la Registraduría

33000 13 289 2 3

bonos

Incluye la

información de

Bonos

Pensionales,

modalidad 1 y 2

6600 115 160 65 15

comprobador

Información

comprobación de

derechos EPS

84000 70 16 6 3

cuotascobrar

Mantiene la

información de las

cuotas partes

pensionales por

cobrar a otras

entidades

7000 39 103 20 0

cuotaspagar

Mantiene la

información de las

cuotas partes

pensionales por

pagar a otras

entidades

1100 15 18 9 15

db_cobrar

Incluye la

información del

debido cobrar para

aportantes entre

1967 y 1994

4400 30 35 3 78

161

Nombre Descripción Tamaño

(Mb)

Número

de

Tablas

Número

de

Procedi-

mientos

Número

de

Vistas

Número de

Disparado-

res

devoluciones

Mantiene la

información de

devoluciones que

debe hacerse a las

otras

administradoras

para el caso de

aportes de no

vinculados y

traslados de

régimen

También contiene

las devoluciones

que deben hacer

las otras

administradoras a

la organización en

razón de traslados

y de aportes de no

vinculados (en las

otras

administradoras) a

vinculados ISS

60200 113 198 46 30

digitalizahl

Información de las

imágenes

digitalizadas de los

expedientes de

pensiones de la

Seccional Valle

5500 13 0 2 0

exterior Información de 2200 67 96 8 112

162

Nombre Descripción Tamaño

(Mb)

Número

de

Tablas

Número

de

Procedi-

mientos

Número

de

Vistas

Número de

Disparado-

res

afiliación y

facturación de los

afiliados a

“Colombianos en el

Exterior”

gesoiss Información de la

ARP 2200 44 84 12 132

gestion_doc

umentos

Información del

proyecto de gestión

documental

(inactiva)

2200 17 1 1 51

gproc

Soporta 9 módulos

que son usados

para automatizar

los procesos de

recaudos

33000 340 1593 42 15

histlab

Contiene la Historia

Laboral del periodo

1967 a 1994

138000 251 469 37 237

hlintranetweb

Un subconjunto de

HISTLAB que es

usado para

responder las

consultas de HL

desde la intranet

6000 65 31 1 0

hltradicional

Contiene

procedimientos y

tablas de trabajo

para consulta de

1200 570 47 1 0

163

Nombre Descripción Tamaño

(Mb)

Número

de

Tablas

Número

de

Procedi-

mientos

Número

de

Vistas

Número de

Disparado-

res

HL periodos 67 -

94

interfaz_histl

ab

Inactiva.

Información de

proyecto para

consolidación de

HL

2200 24 19 1 0

master Base de datos

propia de Sybase 500 59 15 2 0

model Base de datos

propia de Sybase 3 0 0 1 0

nominapen

Soporta la

aplicación de

Nómina de

Pensionados

84300 636 1150 148 302

nominapen_

historico

Mantiene la

información

histórica de la

Nómina de

Pensionados (oct

2003 a la fecha)

181000 36 5 23 0

pensionados

BD de trabajo para

apoyar migración

de nómina de

pensionados

67000 993 892 229 9

pensiones

Soporta

aplicaciones de

Sentencias

Judiciales y

2200 76 19 4 96

164

Nombre Descripción Tamaño

(Mb)

Número

de

Tablas

Número

de

Procedi-

mientos

Número

de

Vistas

Número de

Disparado-

res

Cálculos

Actuariales

procesos_gn

i

Base de datos de

apoyo a procesos

GNI

131000 592 429 419 0

procesos_gn

i_autoliss

Base de datos de

apoyo a procesos

GNI

12000 150 164 1 0

recaudo_inc

onsistencias

Mantiene la

información de

inconsistencias de

recaudo. Una vez

corregidas, los

registras pasan a

SABASS recaudos

119000 76 19 53 45

sabass

Incluye toda la

información de

afiliaciones

162000 285 527 159 399

sabass_reca

udo

Incluye toda la

información del

recaudo,

comenzando en

1995

1130000 207 523 294 48

siafeps Información de la

EPS del ISS 132000 220 358 78 489

sybmgmtdb Base de Datos del

sistema 1000 12 55 1 0

sybsystemdb Base de Datos del

sistema 3 1 0 1 0

165

Nombre Descripción Tamaño

(Mb)

Número

de

Tablas

Número

de

Procedi-

mientos

Número

de

Vistas

Número de

Disparado-

res

sybsystempr

ocs

Base de Datos del

sistema 500 6 564 1 0

tempdb

Base de Datos

temporal del

sistema

39004 0 0 1 0

temporal

Información de

auditoría de las BD

del sistema

autol_95 a

autol_2006

12000 770 2 1 0

traslados_pe

nsiones

Soporta la

información de

traslados entrantes

y salientes desde y

hacia otras

administradoras

3300 53 161 14 0

Tabla 5. Inventario inicial de fuentes de datos

Además de las bases de datos listadas anteriormente, existen las bases de datos

de: Tutelas, Derechos de petición, CIANI (que soporta los procesos jurídicos a

nivel nacional por demandas en contra del ISS) y Procesos de cobro coactivo (que

soporta los procesos de recuperación de cartera a través de vías coercitivas

legales).

Sobre este inventario inicial, el ISS identificó las 16 principales bases de datos, las

cuales se muestran en la siguiente sección.

166

Fuentes de datos consideradas en este estudio

A continuación se muestra el nombre y la descripción de las 16 fuentes de datos

principales del ISS.

Secuencia Base de datos Descripción

1 AFE Soporta la aplicación para controlar el flujo de

expedientes de solicitud de pensiones

2

AUDITORIA Mantiene los registros de inclusiones o

modificaciones en tablas de otras bases de

datos

3 CUOTASCOBRAR Mantiene la información de las cuotas partes

pensionales por cobrar a otras entidades

4 CUOTASPAGAR Mantiene la información de las cuotas partes

pensionales por pagar a otras entidades

5 DB_COBRAR Incluye la información del debido cobrar para

aportantes entre 1967 y 1994

6

DEVOLUCIONES Mantiene la información de devoluciones que

deban hacerse a las otras administradoras para

el caso de aportes de no vinculados y traslados

de régimen

También contiene las devoluciones que deben

hacer las otras administradoras a la

organización en razón de traslados y de aportes

de no vinculados (en las otras administradoras)

a vinculados ISS

7 GPROC Soporta 9 módulos que son usados para

automatizar los procesos de recaudo

167

Secuencia Base de datos Descripción

8 HISTLAB Contiene la Historia Laboral del periodo 1967 a

1994

9 HLINTRANETWEB Un subconjunto de HISTLAB que es usado para

responder las consultas de HL desde la Intranet

10 HLTRADICIONAL Mantiene la HL para periodos posteriores a

1994

11 NOMINAPEN Soporta la aplicación de Nómina de

Pensionados

12 NOMINAPENHISTOR

ICO

Mantiene la información histórica de la nómina

de pensionados

13

RECAUDO

INCONSISTENCIAS

Mantiene la Información de inconsistencias de

recaudo. Una vez corregidas, los registros

pasan a SABASS recaudos.

14 SABASS Incluye toda la información de afiliaciones y

soporta la aplicación del mismo nombre

15 SABBAS RECAUDO Incluye toda la información del recaudo

comenzando en 1995

16

TRASLADOS

PENSIONES

Soporta la información de traslados entrantes y

salientes desde y hacia las otras

administradoras

Tabla 6. Lista de las 16 fuentes de datos más importantes

Nota: las bases de datos con texto de color negro son parte del presente

documento.

168

Otras fuentes de datos consideradas en el estudio

Se han considerado otras fuentes de datos que por la situación actual de la

organización son ampliamente utilizadas (o podrán serlo) en la operación normal.

Secuencia Fuente de Datos Medio Descripción

1 Facturación de

Aportes

Microfichas,

Imágenes,

Documentos

Información resultante de los

procesos de facturación del

periodo 67 - 94

2 Información sistema

ALA

Microfichas,

Imágenes,

Documentos

Resultado de la información

provista por los empleadores que

usaban (o usan), el sistema ALA

para informar los aportes

3 Tarjetas de Reseña Papel,

Archivo

magnético en

C/marca y

otras

seccionales

Tarjetas usadas en las

seccionales comenzando en

1967

4 Auto Liquidación de

Aportes

Documentos,

Magnético

Archivos que contienen

información de aportes para el

periodo 1995 - 2005

Tabla 7. Otras fuentes de datos

Relación entre las entidades de negocio y las fuentes de datos

A partir de las entidades de negocio y las fuentes de datos se puede establecer la

manera en que estas últimas implementan las primeras en la actualidad; a partir

169

de ello se analiza esta relación. A continuación se utiliza la Plantilla 4 para

representar gráficamente la dependencia entre entidades de negocio y las fuentes

de datos.

Entidades de Negocio

Fuentes de datos PERSON

A

AFILIACIO

N

RECAUD

O

HISTORI

A

LABORAL

BONO

PENSIONA

L

RECONOCI

-

MIENTO

PAGO

PRESTACI

O- NES

CUOTAS

PARTES

PENSIONALE

S

CUOTASCOBRAR

Ver

Nota 1

X X X

CUOTASPAGAR

X X X

DB_COBRAR

Ver

Nota 2 X

X

DEVOLUCIONES X X X

GPROC

X

HISTLAB X

X

X

HLTRADICIONAL

X

NOMINAPEN X

X X

RECAUDO

INCONSISTENCIA

S

X

X

SABASS X

X X X

X

SABBAS

RECAUDO X X X X X

TRASLADOS

PENSIONES X

X

FACTURACION

APORTES

Ver

Nota 3

Ver

Nota 3

INFORMACION

SISTEMA ALA X

Ver

Nota 4

Ver

Nota 4

TARJETAS DE

RESEÑA

Ver

Nota 5

Ver

Nota 5

Ver

Nota 5

AUTOLIQUIDACIO

N DE APORTES X X X

X

170

Tabla 8. Entidades de Negocio vs Fuentes de Datos

En la Tabla 8, una “X” en el cruce de una entidad de negocio con una fuente de

datos, indica que la fuente mantiene información que es parte de la entidad de

negocio.

Esta matriz muestra que la entidad de negocio Reconocimiento tiene relación con

la mayoría de las bases de datos consideradas en este estudio; lo mismo ocurre,

aunque en menor proporción, con las entidades de afiliación e historia laboral.

Por el lado de las fuentes de datos, Sabass y Sabass Recaudo tienen una buena

proporción de la información de las entidades.

Esta matriz también muestra las tablas que son críticas para el funcionamiento de

la organización; aquellas que más relaciones tienen con las entidades del negocio

son más críticas que las que sólo tienen unas cuantas relaciones.

Todas las entidades de negocio tienen relaciones con una o más de las fuentes

datos, lo que permite asegurar que no se han considerado entidades que no estén

representadas en las fuentes.

Nota 1: La entidad de negocio “Persona”, tal como está concebida, no está

representada en las fuentes de datos, sino que más bien está diluida en ellas a

través de tablas (que en realidad corresponden a roles de las personas), como

afiliados, empleadores, bancos etc.

Nota 2: Esta fuente de datos está destinada para mantener la información del

periodo 1967 1994.

Nota 3: Existe la relación si es necesario que se realicen correcciones basadas en

la facturación de aportes.

Nota 4: Existe la relación si es necesario que se realicen correcciones basadas en

la información del sistema ALA.

171

Nota 5: La relación se produce si es necesario correlacionar los números de

afiliación con el documento de identidad del afiliado.

Hallazgos

Después de realizar un análisis, a nivel de esquema de las bases de datos del ISS

Sabass, Sabass Recaudo, AFE y Nómina de Pensionados, se presenta a

continuación lo observado según la relación que tienen con las líneas de negocio,

los conceptos ontológicos que manejan y su diseño lógico y físico.

A continuación los hallazgos se documentan de acuerdo a la Plantilla 8.

Hallazgo H-D001 Relación de las cuatro principales bases de

datos con las líneas de negocio

Descripción general Algunas de las bases de datos analizadas se relacionan con

las tres líneas de negocio del ISS, mientras que otras son

específicas para pensiones.

Análisis Sabass y Sabass Recaudo son compartidas por las tres

líneas de negocio del ISS: salud, pensión y riesgos

profesionales. Como tales, contienen datos que en algunos

casos son comunes a las líneas y en otros casos son

específicos a una línea en particular. Para el reconocimiento

de pensión, se debe conservar información de aportes en

salud. También se debe mantener información de la línea

salud para los casos de recuperación de cartera que deben

ir al ISS y no a la actual EPS.

Las bases de datos AFE y Nómina de Pensionados son

específicas para la línea de pensiones.

Soporte Modelos entidad/relación de las cuatro bases de datos en

estudio, proporcionados por el ISS.

172

Hallazgo H-D001 Relación de las cuatro principales bases de

datos con las líneas de negocio

Severidad Alta

Media

Baja

Confirmación Confirmado

Confirmado parcialmente

Por discutir

Hallazgo H-D002 Conceptos ontológicos manejados por las

cuatro principales bases de datos

Descripción general Las cuatro bases de datos analizadas, Sabass, Sabass

Recaudo, AFE y Nómina de Pensionados, manejan sus

propios conceptos ontológicos.

Análisis La base de datos Sabass tiene información de Afiliados

(incluidos pensionados), Afiliaciones, Aportantes, Historia

Laboral y Reconocimientos tales como pensiones y auxilios

funerarios.

La base de datos Sabass Recaudo maneja Aportes.

La base de datos AFE maneja trámites de reconocimientos

de pensiones.

La base de datos Nómina de Pensionados maneja pagos a

pensionados.

Soporte Modelos entidad/relación de las cuatro bases de datos en

estudio, proporcionados por el ISS.

Severidad Alta

173

Hallazgo H-D002 Conceptos ontológicos manejados por las

cuatro principales bases de datos

Media

Baja

Confirmación Confirmado

Confirmado parcialmente

Por discutir

Hallazgo H-D003 Diseño de las cuatro principales bases de datos

Descripción general En cuanto al diseño de las cuatro principales bases de

datos, pueden existir problemas de no-conformidad y

replicación; existen problemas de coexistencia de datos

distintos al objeto de cada base de datos, así como

integridad referencial6.

Análisis Cada una de las bases de datos analizadas maneja

información de personas, naturales y jurídicas, en los roles

de afiliado, aportante, beneficiario, pensionado. No se ha

hecho aún una validación de consistencia (“conformidad”)

entre ellas, pero existe la posibilidad de que no sean

“conformes”.

Las personas, naturales y jurídicas, pueden jugar diversos

roles simultáneamente y/o a lo largo del tiempo. Por

ejemplo, una persona natural puede ser simultáneamente

afiliado y aportante. El diseño de las bases de datos

consideradas maneja los roles como entidades distintas

6Se entiende por integridad referencial la capacidad de las bases de datos que permite que un

campo definido como llave foránea en una entidad (tabla en este caso) sólo pueda contener

valores que existen como llave primaria de la entidad referenciada.

174

Hallazgo H-D003 Diseño de las cuatro principales bases de datos

replicando posiblemente información propia de la persona y

no del rol.

En las bases de datos coexisten datos propios del modelo

ontológico del negocio con otros que sirven de apoyo a la

lógica de las aplicaciones utilizadas. Los primeros interesan

al nuevo negocio de Colpensiones, mientras los otros no

necesariamente.

En la base de datos Sabass se observa un problema de

integridad referencial específicamente en lo que se refiere a

la entidad Sucursal.

Soporte Modelos entidad/relación de las cuatro bases de datos en

estudio, proporcionados por el ISS.

Severidad Alta

Media

Baja

Confirmación Confirmado

Confirmado parcialmente

Por discutir

4.2.4.2 Gobierno de datos

En esta sección, se presenta el estado actual del gobierno de datos que fue

identificado de acuerdo a las entrevistas realizadas con el grupo estratégico y de

negocio, además de documentos suministrados vía e-mail.

Se utiliza la Plantilla 8 para documentar los hallazgos sobre el gobierno de datos.

175

Hallazgo H-D005 Falta de una autoridad de la información

Descripción general La organización carece de un área / funcionario cuyo

responsabilidad primordial sea la de mantener la calidad de

los datos.

Análisis Ninguna de las áreas que actualmente realizan corrección

de los datos, tiene como responsabilidad principal mantener

la calidad de los datos y además tiene otras funciones

diferentes de la corrección.

Existe un comité para atacar problemas de información,

conformado por la GNI y por el DNAR, pero nuevamente la

función principal de esas áreas no es la corrección y el

mantenimiento de los datos

Soporte Documento word “Organigrama ISS JK” de fecha Julio 31,

2010. Reuniones realizadas en particular octubre 19, correo

enviado por José Bocanegra a la Universidad en octubre 22,

2010

Severidad Alta

Media

Baja

Confirmación Confirmado

Confirmado parcialmente

Por discutir

A continuación se utiliza la Plantilla 5 para documentar la situación actual del

gobierno de datos, de acuerdo a los criterios definidos por el modelo de referencia

de gobierno de datos seleccionado en la etapa de preparación.

176

CRITERIOS EXISTE (S/N) OBSERVACIONES

Guía metodológica

Diseño organizacional N

Principios de datos N

Roles y responsabilidades S Comité para problemas de información

Seguridad y privacidad N

Dominios de datos N

Calidad de datos S independiente por áreas

Métricas N

COMENTARIOS

No existe un gobierno de datos definido y en su defecto existe un comité para atacar problemas de información y se dedican a solucionar problemas y no a prevenirlos como debería ser el orden de proceder en este aspecto.

Cada área o en el peor de los casos por aplicación se hacen esfuerzos independientes y no coordinados para la corrección de datos.

Ni el comité ni los grupos que hacen corrección de datos tienen como objetivo principal la calidad de los datos y cumplen con otras responsabilidades asignadas como de mayor prioridad.

4.2.4.3 Análisis de la Información

En la actualidad existe un comité que se encarga de generar proyectos que

buscan el mejoramiento de la calidad de la información, así como la implantación

de proyectos que mejoren la operación.

Es así como a la fecha existen algo más de 30 proyectos en marcha, como se

muestra en el Anexo N° 8. En este anexo, los valores anotados en la columna

avance corresponden a un avance estimado en cuanto a lo que el proyecto

necesita para ponerse en marcha y no al valor efectivamente avanzado en la

resolución del problema.

Como se puede apreciar, existe una amplia gama de proyectos que este comité ha

emprendido, una parte de los proyectos implica la construcción de código ad-hoc

para realizar las modificaciones objeto del proyecto.

177

La GNI ha informado que existen procedimientos claros para mantener las

diferentes versiones del código necesario para hacer los cambios (utilizando

Sourcesafe y Sharepoint); así mismo existen procedimientos claramente

establecidos para poner el software desarrollado en producción y existe total

independencia entre los servidores de desarrollo y producción.

Sin embargo, no existe un grupo independiente (auditoría), que pruebe que los

cambios a aplicar son precisos; las pruebas las realizan los funcionarios del área

usuaria y el personal de la GNI .

En conclusión, esta sección ha mostrado cómo en los últimos años ha habido un

esfuerzo importante en el proceso de reconstrucción de los datos que no fueron

actualizados en su oportunidad. Es claro que los esfuerzos hechos a posteriori son

más complicados, pueden tener problemas de identificación de información, son

intensivos en recursos humanos y no siempre generan los mejores resultados.

A esto hay que sumar el hecho que la organización debe otorgar pensiones a

afiliados con tiempos trabajados en entidades públicas, lo que exige conseguir

información de dichas entidades o aquellas que las hayan reemplazado.

Mucho se ha hecho en el ISS para mejorar los datos; persiste sin embargo la

impresión que el esfuerzo no ha logrado alcanzar los niveles requeridos para dar

un óptimo servicio. Sin duda, hay mucho campo para mejoramiento, comenzando

por el diseño de buenos indicadores que permitan validar cuál es realmente la

calidad de la información (particularmente confiabilidad, integridad y completitud)

que maneja la organización.

Hallazgos

Esta sección del documento presenta los hallazgos sobre la Arquitectura de

Información actual y es un complemento a la información contenida en las

secciones anteriores.

178

Están clasificados por generales, específicos y por entes externos al ISS. Cada

uno de los hallazgos se presenta de acuerdo al formato de la Plantilla 8.

Hallazgos generales

Hallazgo H-D006 No existe suficiente información sobre los datos

Descripción general Falta información más precisa (o al menos el grupo no tuvo

acceso a la información), sobre la calidad de los datos.

Análisis Existe información básica sobre la calidad de los datos, pero

ante lo crítico del problema, sería de esperarse que dicha

información fuera mucho más sofisticada de tal forma que

sirviera de base para la toma de decisiones sobre el

mejoramiento de calidad de los mismos.

Podrían ejecutarse ejercicios de estratificación (o alguna otra

clasificación que aporte claridad al problema de información),

Para decidir si todos los casos se tratan de la misma manera.

Podría ser que en algunos casos, procesos automáticos

sofisticados pudieran ayudar a resolver situaciones que no

necesiten la intervención de un funcionario del ISS.

Existe información valiosa que no se está aprovechando,

derivada de los procesos de reconocimiento de pensiones.

Se podría aprender mucho al tipificar el tipo de proceso

requerido al momento del reconocimiento, para así intentar

una clasificación de historias laborales de afiliados que se

encuentren próximos a pensionarse y los tipos de procesos

que se prevé podrían ser necesarios para esos afiliados

Soporte Reuniones con José David Márquez en diferentes fechas,

Reunión con Sandra P Quevedo en noviembre 3, 2010

Severidad Alta

Media

Baja

179

Hallazgo H-D006 No existe suficiente información sobre los datos

Confirmación Confirmado

Confirmado parcialmente

Por discutir

Hallazgo H-D007 Falta información sobre el uso potencial de

fuentes alternas de datos

Descripción general Información más detallada sobre las fuentes alternas de

información, podría ayudar a diseñar nuevos procesos de

depuración.

Análisis Existen fuentes alternas de datos que hoy se usan de

manera marginal, sobre las cuales no se tiene un buen

conocimiento (tal como volúmenes, estado, diseños,

confiabilidad y ubicación). Si se adquiere conocimiento

preciso de dichas fuentes (más la identificación de fuentes

que aún no se han descubierto), se podría identificarlas

como posibles entradas en procesos masivos que podrían

ayudar en la corrección de inconsistencias y en la aplicación

de aportes faltantes.

Soporte Visita a la Seccional Cundinamarca para verificar las tarjetas

de reseña en octubre 19, 2010

Severidad Alta

Media

Baja

Confirmación Confirmado

Confirmado parcialmente

Por discutir

180

Hallazgo H-D008 Algunas soluciones son aisladas y puntuales

Descripción general Algunos proyectos producen soluciones que no están

integradas con otras soluciones ya implantadas o que

resuelven sólo una parte del problema

Análisis Existe dispersión de esfuerzos en producir soluciones, a lo

largo de varias entrevistas se ha encontrado que los

usuarios han construido pequeñas aplicaciones para atender

problemas que no son resueltos por la aplicación provista.

Estas soluciones son necesariamente aisladas y puntuales.

Soporte Visita a la Seccional Cundinamarca en octubre 19, 2010 en

donde se encontró una aplicación para consultar números

de afiliación. Reunión de reconocimiento en de noviembre 2,

2010, se describió una aplicación hecha por los usuarios.

Severidad Alta

Media

Baja

Confirmación Confirmado

Confirmado parcialmente

Por discutir

Hallazgos específicos

Hallazgo H-D009 Uso de llaves ad hoc para identificar a

empleadores y afiliados

Descripción general Al inicio del ISS y durante varios años, el Instituto empleó

llaves diferentes de la cédula y el NIT para identificar a

afiliados y empleadores

Análisis La decisión de utilizar dichas llaves, propias sólo del ISS,

181

Hallazgo H-D009 Uso de llaves ad hoc para identificar a

empleadores y afiliados

estructuradas para incluir información adicional (por ejemplo

la seccional de ISS y hasta la actividad económica del

empleador) ha causado serios problemas para

correlacionarlas con las llaves actuales de cédula y NITS.

Es así como diferentes afiliados pueden compartir el mismo

número de afiliación, un afiliado tener más de un número de

afiliación, o un empleador tener diferentes números

patronales si tenía oficinas en más de una seccional del ISS

o si algún funcionario decidía incluir al empleador con una

nueva actividad económica.

La puesta en uso de ese método de identificación aunado a

pobres procedimientos y controles y a limitantes en el

espacio de almacenamiento (típicas en los equipos de

cómputo de hace unos cuantos años), comenzó a generar

problemas que aún hoy se viven. La actual incapacidad para

asociar un número de afiliación con una cédula de

ciudadanía para algunos afiliados (o el intenso esfuerzo

necesario para hacerlo), es una muestra de la problemática

asociada con esta decisión tomada hace ya muchos años.

Soporte Reunión para ver paso a paso corrección de HL 67-94

Severidad Alta

Media

Baja

Confirmación Confirmado

Confirmado parcialmente

Por discutir

182

Hallazgo H-D011 Problemas causados por falta de actualización

oportuna

Descripción general Los esfuerzos por mantener una historia laboral actualizada

son recientes, comparado con la edad de la información.

Análisis Durante varios años el ISS no mantuvo un registro

automático de los aportes de los empleadores y de la

historia laboral de los afiliados.

La carencia de esta actividad, que debió ser periódica,

consistente y precisa, produjo grandes problemas cuando se

decidió que se debería actualizar esta información. De

hecho, en este momento se siguen viviendo las

consecuencias de esta falta de procesamiento.

Las últimas administraciones en el ISS han hecho un

esfuerzo grande para generar y mantener la HL, pero aún

quedan vacíos de información que deben ser corregidos

manualmente ya sea del periodo 67 – 94 o post 94.

Soporte Reuniones de verificación del paso a paso periodos 67 – 94

y post 94

Severidad Alta

Media

Baja

Confirmación Confirmado

Confirmado parcialmente

Por discutir

Hallazgo H-D012 Problemas causados por la dispersión de datos

en diferentes BD

Descripción general Datos dispersos en diferentes BD causan riesgos de no

actualización de todas las instancias cuando se actualiza

183

Hallazgo H-D012 Problemas causados por la dispersión de datos

en diferentes BD

una de ellas.

Análisis Puesto que las BD no están integradas, la información

común debe replicarse en cada una de ellas. Ocurre

entonces que la modificación de información de una de las

instancias debe generar actualizaciones en todas las demás

con el propósito de mantener la información al mismo nivel

de actualización. Inevitablemente ocurre que al cabo de

algún tiempo se tienen datos diferentes sobre el mismo

sujeto y se desconoce cuál es la información correcta.

Soporte Revisión de los diccionarios de datos provistos por el ISS.

Severidad Alta

Media

Baja

Confirmación Confirmado

Confirmado parcialmente

Por discutir

Hallazgo H-D023 Problemas estructurales en base de datos AFE

Descripción general La base de datos AFE contiene información duplicada sobre

personas, que también existe en la base de datos de

afiliación Sabass; además, la base de datos AFE contiene

información de acceso/actividad de los diferentes

operadores.

Análisis La información de personas, en su rol de afiliado, reside en la

base de datos Sabass; sin embargo, en la base de datos

AFE, específicamente en la tabla Gral_Ma_Persona, se

184

Hallazgo H-D023 Problemas estructurales en base de datos AFE

duplica esta información para aquellos afiliados que solicitan

el reconocimiento de la pensión, pues nuevamente se

especifica información personal como nombres, sexo, fecha

de nacimiento, datos de contacto, además de tener extenso

detalle sobre números anteriores de afiliación (estructurados

como diferentes atributos en la tabla), datos sobre

invalidez/muerte del afiliado, entre otros.

De igual forma sucede con información sobre el otorgamiento

de la pensión, tal como número de resolución, fecha de

resolución, tipo de riesgo por el que se otorga, que reposa en

AFE en la tabla Gral_Ma_Persona, así como en Sabass y en

NominaPen.

Se presenta la misma situación con la información de

aportantes, que reside en la base de datos Sabass en este

rol; en el caso de AFE, en la tabla Gral_Ma_Entidad, se

duplica información como razón social, tipo de aportante y

datos de contacto.

Lo anterior conduce a que actualizaciones en la información

de personas sobre una de las bases de datos, Sabass o

AFE, deban ser aplicadas a la otra para mantenerlas

consistentes. En caso de que un proceso de actualización no

exista, se corre el riesgo de mantener distintas versiones de

la misma información, una de las cuales es válida y otra

desactualizada.

Así mismo, la base de datos AFE contiene información

dedicada al control de acceso/actividad de los diferentes

operadores (tablas BPM); estas tablas deberían estar en una

base de datos que pueda ser accedida por todas las

aplicaciones que requieran estos servicios de control de

acceso/actividad; de esta manera no sería necesario que al

185

Hallazgo H-D023 Problemas estructurales en base de datos AFE

mismo funcionario/contratista se le creen diferentes registros

en diferentes bases de datos, bastaría con tener una sola

entrada por operador y diferentes roles dependiendo del área

en que trabaje.

Soporte Diccionarios de datos Sabass, AFE y NominaPen.

Severidad Alta

Media

Baja

Confirmación Confirmado

Confirmado parcialmente

Por discutir

Hallazgo H-D033Caprecom - Historia Laboral anterior a 1994 no

existe

Descripción general La información de la HL en Caprecom anterior a 1994 no se

mantuvo en la entidad.

Análisis Antes de la Ley 100 de 1993, la entidad no mantuvo

información de los aportes hechos por los diferentes

empleadores.

En consecuencia, cuando se hace el reconocimiento de

pensión a afiliados que trabajaron en ese periodo, debe

recurrirse a las entidades que hicieron los aportes para

allegar la información necesaria.

Soporte Reunión con directivos de Caprecom en Diciembre 2 de 2010

Severidad Alta

Media

Baja

186

Hallazgo H-D033Caprecom - Historia Laboral anterior a 1994 no

existe

Confirmación Confirmado

Confirmado parcialmente

Por discutir

Hallazgo H-D034Caprecom - Historia Laboral 1994 y posterior

existe parcialmente

Descripción general La información de la HL en Caprecom de los años 1994 y

posteriores existe y por tanto debe ser tenida en cuenta.

Análisis A raíz de la Ley de 1993, Caprecom no pudo hacer nuevas

afiliaciones.

En el Foncap (Fondo de Pensiones de Caprecom), se

mantiene la historia laboral de los afiliados, comenzando

aproximadamente en 1998.

Actualmente esta información se tiene en cuenta para el

cálculo pensional, lo que no está incluido en la HL se ingresa

manualmente en el liquidador (tal como se explica en el

hallazgo anterior).

En la actualidad existen más o menos 3.5 millones de

registros en la base de datos de HL, los cuales deberán ser

tenidos en cuenta en el momento de la conversión de

Caprecom a la nueva entidad.

Soporte Reunión con directivos de Caprecom en Diciembre 2 de 2010

Severidad Alta

Media

Baja

Confirmación Confirmado

Confirmado parcialmente

187

Hallazgo H-D034Caprecom - Historia Laboral 1994 y posterior

existe parcialmente

Por discutir

Hallazgos generales con relación a entes externos al ISS

Hallazgo H-D014 Problemas originados por los empleadores

Descripción general La organización recibe información de aportes proveniente

de los empleadores. Esa información puede tener problemas

de calidad

Análisis La organización tiene que recibir información originada por

entes externos que no son especializados en la generación y

procesamiento de dicha información.

Es el caso de los empleadores para quienes la generación

mensual de información hacia los entes de la seguridad

social es una carga adicional al de su normal

funcionamiento, por lo que no es de extrañar que ellos

produzcan información que no sea de la mejor calidad.

La organización debe ser consciente de que es inevitable

recibir información de baja calidad y en consecuencia debe

ser validada y complementada con especial cuidado y a la

brevedad posible, así mismo deben establecerse

mecanismos para prevenirlos, probablemente a través de

una comunicación más fluida con los entes que originan la

información.

La falta de mecanismos de rápida detección, corrección y

prevención influyó negativamente en el sistema de

Autoliquidación de Aportes (ALA), lo que causó problemas

que muchos años después aun están vigentes.

Soporte Reuniones de levantamiento de información. Particularmente

188

Hallazgo H-D014 Problemas originados por los empleadores

reunión con Colpensiones en Sep. 13 de 2010.

Severidad Alta

Media

Baja

Confirmación Confirmado

Confirmado parcialmente

Por discutir

Es de anotar que con el uso de “PILA” la calidad de una parte de la información ha

mejorado mucho (por ejemplo en lo que tiene que ver con completitud de la

información), mientras que otra parte de la información aún tiene problemas

relacionados con identificación de los afiliados y aportes de no vinculados.

Evidentemente PILA ha contribuido a mejorar el sistema, pero podría ayudar a

solucionar problemas aún presentes en el sistema, a través de filtros adicionales.

Hallazgo H-D017 Problemas relacionados con la estructura y el

contenido de la información de historia laboral que

acompaña a cada traslado

Descripción general Aún persisten problemas relacionados con la estructura y el

contenido de la información de la historia laboral que

acompaña a cada traslado.

Análisis Los ciclos de traslados son bastante largos, esto incide

negativamente en cómo se va depurando el proceso, puesto

que las solicitudes de traslado radicadas por una

administradora son respondidas por la otra administradora

varias semanas después (radicadas el octavo día del mes,

respondidas el día 30 del mes siguiente). Esto implica que

189

Hallazgo H-D017 Problemas relacionados con la estructura y el

contenido de la información de historia laboral que

acompaña a cada traslado

errores en la información de la historia laboral deben esperar

un nuevo ciclo, lo cual hace que el proceso de depuración

avance lentamente.

La información de traslado desde el ISS hacia las

administradoras se llama Novedad 200 y contiene 7

diferentes tipos de registros

La información de traslado desde las administradoras hacia

el ISS se llama Novedad 207 y contiene los mismos 7

diferentes tipos de registros

Sin embargo hay diferencias en los diseños de los registros

en las novedades 200 y 207.

ISS envía la información de Nómina de Pensionados cada

mes a Asofondos para que las administradoras verifiquen

que no se vayan a producir dobles pensiones.

Antes del 2006, cada administradora enviaba la información

de traslados (HL) directamente al ISS, cada formato era

diferente y nunca se aplicaron esas novedades en el ISS.

En el 2007 la Superintendencia Financiera intervino y emitió

circulares para organizar los procesos.

Ahora es Asofondos la entidad encargada de enviar la HL de

las administradoras (comenzó con la HL de septiembre de

2006), y, aunque el formato es único, existen diferentes

interpretaciones entre administradoras (cada una puede

incluir información que después no encaja con las

validaciones del ISS).

Lo anterior causa problemas; si las administradoras tienen

diferentes interpretaciones y el ISS tiene también su propia

interpretación, entonces en temas complejos se crean

190

Hallazgo H-D017 Problemas relacionados con la estructura y el

contenido de la información de historia laboral que

acompaña a cada traslado

situaciones que deben ser discutidas, llegarse a un acuerdo

e incluir los cambios. Esto toma tiempo especialmente con

los ciclos tan largos que tienen los traslados.

Para traslados realizados antes de 2006, se creó la

modalidad de “traslados por demanda”, en donde el ISS pide

la HL del afiliado y Asofondos pide a la administradora

confirmar si la HL que ya envió esta completa; en caso

contrario la administradora envía la información a

Asofondos, quien la remite al ISS

Existen también las “HL por contingencia” para afiliados que

están en procesos de pensionarse o para afiliados fallecidos.

Para los dos casos anteriores, Asofondos hace validaciones

sencillas sobre la información que se va a mandar, pero

cuando el ISS aplica validaciones más fuertes, encuentra

inconsistencias que hacen que no pueda aplicarla.

El 88% de la deuda presunta resulta ser falta de novedades

(particularmente novedades de retiro del afiliado).

Cuando se trata de trámites de pensiones que ya están en

curso (HL por contingencia), el trámite en Asofondos –

Administradoras toma entre una semana y dos meses.

En este momento se tienen más o menos 2000 trámites

urgentes en proceso.

Otros posibles problemas:

Administradora acreditó aporte de afiliado que ya se ha

traslado al ISS, tiene que enviar al ISS esa fracción de

HL y el valor correspondiente.

Administradora acreditó por error un aporte a un afiliado

191

Hallazgo H-D017 Problemas relacionados con la estructura y el

contenido de la información de historia laboral que

acompaña a cada traslado

que después se trasladó al ISS, la administradora debe

pedir al ISS la devolución de ese valor y la corrección de

la HL del afiliado.

Multiafiliación, la administradora que no se queda con el

afiliado debe devolver la comisión.

Si la información que la administradora envió no pasa la

validación de Asofondos, entonces esa información no es

visible en las consultas que hace el ISS.

Soporte Reunión con Asofondos en Oct. 4 de 2010

Severidad Alta

Media

Baja

Confirmación Confirmado

Confirmado parcialmente

Por discutir

Hallazgo H-D020 Información contenida en la nueva cédula

Descripción general Desde mediados del año está vigente la nueva cédula que

contiene elementos que pueden ayudar en la operación de la

organización.

Análisis La nueva cédula podría servir como elemento de soporte en

la operación de la organización. En particular, la nueva

cédula tiene un código de barras bidimensional, que

almacena información sobre las huellas digitales de

cualquiera de los dedos de los portadores, de tal forma que

una persona no puede substituir a otra.

192

Hallazgo H-D020 Información contenida en la nueva cédula

Se debería iniciar un proyecto que investigue las reales

posibilidades del uso de la misma. Parte de este proyecto

podría ser identificar si la Registraduría ya corrigió problemas

que fueron detectados por el ISS hace algún tiempo, de tal

forma que pueda darse plena validez a su información.

Soporte Este sitio web contiene información sobre características de

la nueva cédula:

http://www.registraduria.gov.co/Informacion/cedulas_2010_a

bcpreguntas.htm

Severidad Alta

Media

Baja

Confirmación Confirmado

Confirmado parcialmente

Por discutir

Análisis cuantitativo

Se diseñaron indicadores que ayuden a determinar el estado de los datos respecto

a confiabilidad, integralidad (o consistencia) y completitud.

El fin principal es que dicho indicadores constituyan una forma objetiva en que los

diferentes actores al interior de la entidad puedan evaluar la salud de los datos.

Los indicadores son valores numéricos, que pueden ser calculados de manera

sencilla y en forma periódica, tal que:

Los indicadores representan un valor objetivo ligado al estado de los datos.

Los indicadores pueden ser recalculados.

193

Se puede establecer valores aceptables y óptimos para los indicadores, de

tal forma que dichos valores pueden ser utilizados como metas de

mejoramiento de la calidad de los datos.

Puesto que los indicadores pueden calcularse en cualquier momento del

tiempo, se puede ver de manera histórica la evolución del estado de los

datos.

Puesto que la fluidez de los procesos misionales depende en gran medida de la

confiabilidad de la información involucrada en cada uno de ellos, la existencia de

indicadores sobre dicha información permite identificar proyectos que deben ser

adelantados para mejorar la condición de dichos datos, de tal forma que mejores

datos ayuden a que los procesos sean más precisos y eficientes.

En este trabajo solo se proponen los indicadores descritos en este documento; sin

embargo, en la medida en que sea necesario, Colpensiones podrá diseñar nuevos

indicadores para evaluar otros aspectos de la calidad de los datos.

Los indicadores descritos aquí, han sido calculados usando una muestra del total

de los registros de las bases de datos, más adelante se presenta la metodología

empleada en el cálculo del tamaño de la muestra y de la manera en que se

seleccionaron los registros para la misma.

Todos los resultados mostrados en esta sección del documento fueron obtenidos

gracias a la asesoría de personal de la GNI, algunos de ellos fueron verificados

con la ayuda de personal del DNC.

Los valores obtenidos y presentados están abiertos a discusión; así mismo, las

consultas a las bases de datos para la creación de tablas temporales y las

consultas que generaron los valores usados para calcular los índices están a

disposición del personal técnico de Colpensiones y del ISS.

194

Para el análisis cuantitativo se utilizó el método para análisis de calidad de datos

explicado en la sección 0 y que se implementó como se describe en las siguientes

secciones.

Identificar Información crítica

Los procesos, actividades estratégicas y relevantes de la empresa y que están

directamente relacionados con su función, misión y obtención de resultados,

productos o servicios necesarios para sus clientes esta representados por los

procesos misionales de la empresa. En consecuencia la información crítica se

identificó como la información que está directamente relacionada y da soporta a

los procesos misionales. Los procesos misionales del ISS son afiliación, recaudo,

historia laboral, reconocimiento y nómina de pensionados. Para efectos de este

caso de estudio solo se ilustrara con el proceso de afiliación. Los restantes

procesos se pueden desarrollar realizando otros proyectos que progresiva e

iterativamente vayan cubriendo cada uno de los procesos.

Continuando con la implementación del diagnóstico, se contempló dos posibles

escenarios, los cuales se describen a continuación:

Escenario 1 Escenario 2

Infraestructura Colpensiones proporciona la

infraestructura necesaria para

la ejecución de las consultas,

mediante un servidor que

contiene la base de datos

forense, con alta disponibilidad

y capacidad de procesa-

miento.

La infraestructura para la

ejecución de consultas es la

de producción del ISS, con

disponibilidad y capacidad de

procesamiento limitadas.

Datos a analizar La totalidad de los datos están

disponibles para ser

Sólo una muestra de los

195

analizados. datos será analizada.

Ejecución de

consultas

Personal del ISS recibe las

consultas escritas, las ejecuta

y devuelve los resultados, que

después son analizados.

Personal del ISS recibe las

consultas escritas, las

ejecuta y devuelve los

resultados, que después son

analizados.

Para el presente diagnóstico la estrategia utilizada correspondió a la propuesta en

el Escenario 2; sin embargo, estas mismas pruebas pueden ser realizadas en un

futuro con la totalidad de los datos, como se plantea en el Escenario 1.

De esta forma, la implementación procedió de la siguiente manera:

Definición del tamaño de la muestra para que sea estadísticamente significativa:

Se utiliza un producto disponible en la web que permite calcular el tamaño de la

muestra dependiendo del nivel de confianza, el intervalo de confianza y el tamaño

de la población. Para el caso de archivos que tienen cerca de 6.5 millones de

registros, un intervalo de confianza de 2 y un nivel de confianza del 95%, es

necesario tener una muestra de 2400 registros. Este es el sitio web en donde se

puede realizar el cálculo:http://www.surveysystem.com/sscalc.htm

Definir Indicadores de Calidad

Puesto que la información almacenada en las bases de datos y archivos en

general pretende representar la realidad, es necesario que esta representación se

mantenga tan fiel como sea posible.

La realidad es muy grande y no es necesario ni útil almacenar toda la información

respecto a dicha realidad, el subconjunto de la realidad que es necesario guardar,

se conoce como la realidad de interés.

196

Una característica de la realidad es su potencial de cambio, mientras que una

parte de la misma se puede considerar muy estable (como el género del afiliado),

otra parte es por naturaleza variable, (un afiliado puede cambiar de dirección de

residencia, tener un nuevo empleador, cambiar su salario o quedar desempleado),

de tal forma que una vez se almacena información de dicha realidad, existe el

potencial de que la representación quede desactualizada en algún momento

futuro; por otra parte, la representación de la realidad puede quedar inexacta

desde el mismo momento en que se captura e igualmente la representación de la

realidad podría no ser capturada y de esta manera la representación quedar

incompleta.

Las categorías de indicadores de estado de los datos que se han definido, se

presentan a continuación utilizando el formato de la Plantilla 9:

Categoría de

Indicador

CI-D001: Completitud

Definición Es la medida que indica si la realidad de interés está

totalmente representada, este indicador no tiene en cuenta la

exactitud de la información, sólo si esta existe o no.

Nivel de cálculo Atributo

Registro

Ejemplo Parte de la realidad de interés es la fecha de nacimiento de los

afiliados; en este caso, el indicador de completitud permite

determinar el porcentaje de afiliados para los que se conoce

este atributo de interés.

Categoría de

Indicador

CI-D002: Confiabilidad

Definición Es la medida que indica la veracidad de la información

respecto a lo que intenta representar, normalmente se elige un

197

Categoría de

Indicador

CI-D002: Confiabilidad

patrón contra el cual comparar la información almacenada,

contando el número de casos en que se encuentra diferencias

Nivel de cálculo Atributo

Ejemplo El nombre de los afiliados puede ser verificado contra el

registro maestro de la Registraduría Nacional; en este caso,

un indicador de confiabilidad permite determinar el porcentaje

de veracidad de este nombre respecto al registro maestro.

Categoría de

Indicador

CI-D003: Consistencia

Definición Es la medida que indica el grado de coherencia entre dos

distintas representaciones de la realidad.

Nivel de cálculo Atributo (en tablas y/o bases de datos)

Ejemplo La dirección de contacto de las personas puede residir en

distintas fuentes de datos; un indicador de consistencia

permite determinar el porcentaje en que estas dos

representaciones del mismo atributo son las mismas.

Categoría de

Indicador

CI-D004: Accesibilidad7

Definición Indicador utilizado para representar la facilidad o dificultad de

acceder a la información.

Nivel de cálculo Este indicador no se produce a través de cálculos, sino a

través de observaciones.

Ejemplo Una fuente de datos puede ser una base de datos; en este

7El indicador no está incluido en el presente documento puesto que a la fecha no existen

mediciones confiables del mismo.

198

Categoría de

Indicador

CI-D004: Accesibilidad7

caso, accesibilidad representa el conjunto de condiciones y

restricciones existentes para que un usuario autorizado pueda

tener acceso a la información, por ejemplo acceder a la

información en una microficha es normalmente más demorado

que acceder a la misma información almacenada en una base

de datos.

Igualmente acceder a información almacenada en un servidor

que tenga demasiada carga podría tomar varios minutos, lo

cual impacta el servicio que podría prestarse en una ventanilla

a un afiliado

Categoría de

Indicador

CI-D005: Oportunidad8

Definición Indicador utilizado para representar la facilidad o dificultad de

obtener de información en el momento en que se necesita

Nivel de cálculo Este indicador no se produce a través de cálculos, si no a

través de observaciones

Ejemplo Este indicador está diseñado para mostrar cómo la

información está disponible de manera conveniente para suplir

una necesidad de la organización; de esta manera, si para la

atención en ventanilla se necesita información que no está

disponible, se puede afirmar que no existe oportunidad. Esta

carencia puede darse por la inexistencia de la información o

por la imposibilidad de accederla. No debe confundirse este

indicador con el de accesibilidad en cual mide la facilidad /

dificultad de acceder a la información

8El indicador no está incluido en el presente documento puesto que a la fecha no existen mediciones

confiables del mismo.

199

Realizar Mediciones

Para este estudio, se ha identificado un conjunto de atributos claves para los

procesos misionales de ISS (afiliación, recaudo, historia laboral, reconocimiento y

nómina de pensionados). A continuación se presenta la descripción de cada uno

de ellos, las bases de datos en las que residen, así como los cálculos de

indicadores propuestos para los mismos. Para describir las mediciones que se

realizaran se utiliza la Plantilla 10.

Atributo 1: Nombres de Afiliados

Este atributo proporciona la completa identificación de un afiliado al ISS; no-

completitud, no-confiablidad o inconsistencias en este atributo pueden impactar

negativa y fuertemente el flujo del proceso de reconocimiento de la pensión.

En la siguiente cuadro se muestra la relación de este atributo en las principales

bases de datos. Un “NO” en la columna Tabla indica que el atributo no se

encuentra en la base de datos en cuestión; en caso contrario, se especifica, la

tabla o tablas en que se encuentran los nombres del afiliado:

Base de datos Tabla

AFE Gral_Ma_Persona

Cuotas Cobrar Beneficiario

Cuotas Pagar T_CuotaPartePensionado

DB_Cobrar NO

Devoluciones Dafp_Afiliado

Histlab Afiliado

NominaPen Persona

Sabass Afiliado

200

Base de datos Tabla

Sabass Recaudo NO

Traslados Pensiones STI_Afiliado

En general, las bases de datos contienen el nombre de los afiliados como un

conjunto de 4 atributos: primer apellido, segundo apellido, primer nombre, segundo

nombre.

Debido a la importancia de este atributo para el proceso de reconocimiento de

pensión, así como a su visible replicación en las distintas bases de datos, se han

definido una serie de mediciones, a través de consultas a las distintas bases de

datos, para determinar el estado de este atributo en cuanto a completitud,

confiabilidad y consistencia. A continuación se presenta la descripción de estas

mediciones:

Prueba Descripción

Q-D001:

Completitud de información de

afiliados

Mediante esta prueba se calcula el indicador de

completitud para los nombres de los afiliados en

la base de datos de afiliación Sabass, indicando

porcentaje de valores nulos y no nulos.

Q-D007:

Confiabilidad del nombre de

afiliados

Mediante esta prueba se calcula el indicador de

confiabilidad para los nombres de los afiliados de

la base de datos Sabass respecto a la tabla de

personas de la Registraduría Nacional.

Q-D009:

Confiabilidad de la identificación

de los afiliados

Mediante esta prueba se calcula el indicador de

confiabilidad para la identificación de los afiliados,

a partir de su nombre en Sabass; esto con el fin

de identificar afiliados doblemente registrados en

201

Prueba Descripción

Sabass.

Q-D015:

Consistencia de nombres de

afiliados en Sabass y AFE

Mediante esta prueba se calcula el indicador de

consistencia para el nombre de los afiliados en

Sabass respecto a AFE; inconsistencia se da en

la medida en que el nombre reportado en AFE no

es el mismo que el reportado en Sabass para el

mismo tipo y número de documento.

Q-D016:

Consistencia de nombre de

afiliados en Sabass y Nómina

de Pensionados

Mediante esta prueba se calcula el indicador de

consistencia para el nombre de los afiliados en

Sabass respecto a Nómina de Pensionados;

inconsistencia se da en la medida en que el

nombre reportado en Nómina de Pensionados no

es el mismo que el reportado en Sabass para el

mismo tipo y número de documento.

Atributo 2: Sexo

El sexo o género es una característica de los afiliados primordial para el proceso

de reconocimiento, pues en base a este se calcula el total de semanas de

cotización requeridas para la decisión del otorgamiento de la pensión así como la

edad mínima de pensión. A continuación se detalla la aparición de este atributo de

los afiliados en las distintas bases de datos:

Base de datos Tabla

AFE Gral_Ma_Persona

Cuotas Cobrar NO

Cuotas Pagar NO

DB_Cobrar NO

202

Base de datos Tabla

Devoluciones Dafp_Afiliado

Histlab Afiliado

NominaPen Pensionado

Sabass Afiliado

Sabass Recaudo NO

Traslados Pensiones STI_Afiliado

De esta forma, se han definido las siguientes mediciones para la obtención de

indicadores de completitud, confiabilidad y consistencia de este atributo:

Prueba Descripción

Q-D001:

Completitud de información de

afiliados

Mediante esta prueba se calcula el indicador de

completitud para el sexo de los afiliados en la

base de datos de afiliación Sabass, indicando

porcentaje de valores nulos, válidos y no válidos;

los valores no válidos son los que se encuentra

por fuera del rango definido para este atributo en

Sabass.

Q-D014:

Consistencia entre sexo y

nombre de afiliados

Mediante esta prueba se calcula el indicador de

consistencia para el sexo de un afiliado respecto

a su nombre en Sabass; inconsistencia se da en

la medida en que el sexo del afiliado no

corresponde a un conjunto de nombres típicos

para el sexo específico.

Q-D017:

Consistencia de sexo de

afiliados en Sabass y AFE

Mediante esta prueba se calcula el indicador de

consistencia para el sexo de un afiliado en

Sabass respecto a AFE; inconsistencia se da en

la medida en que el sexo del afiliado en AFE no

203

Prueba Descripción

corresponde al reportado en Sabass para el

mismo número y tipo de documento.

Q-D018:

Consistencia de sexo de

afiliados en Sabass y Nómina

Pensionados

Mediante esta prueba se calcula el indicador de

consistencia para el sexo de un afiliado en

Sabass respecto a Nómina Pensionados;

inconsistencia se da en la medida en que el sexo

del afiliado en Nómina Pensionados no

corresponde al reportado en Sabass para el

mismo número y tipo de documento.

Atributo 3: Fecha de nacimiento

La edad de un afiliado es una característica clave en el proceso de

reconocimiento, puesto que esta influye directamente en la decisión del

otorgamiento; si un afiliado no ha cumplido la edad mínima requerida para acceder

a la pensión de vejez, no se le debe reconocer la pensión. Inconsistencias en este

atributo pueden causar inconvenientes y demoras en el proceso de

reconocimiento.

A continuación se muestra en qué bases de datos está presente el atributo fecha

de nacimiento de un afiliado:

Base de datos Tabla

AFE Gral_Ma_Persona

Cuotas Cobrar NO

Cuotas Pagar NO

DB_Cobrar NO

Devoluciones Dafp_Afiliado

204

Base de datos Tabla

Histlab Afiliado

NominaPen Persona

Sabass Afiliado

Sabass Recaudo NO

Traslados Pensiones STI_Afiliado

A continuación se presentan las mediciones que permiten obtener indicadores de

completitud, confiabilidad y consistencia de este atributo en las distintas bases de

datos identificadas.

Prueba Descripción

Q-D001:

Completitud de información de

afiliados

Mediante esta prueba se calcula el indicador de

completitud para la fecha de nacimiento de los

afiliados en la base de datos de afiliación Sabass,

indicando porcentaje de valores nulos, válidos y

no válidos; los valores no válidos representan

fechas de nacimiento anteriores a 1900.

Q-D009:

Confiabilidad de la identificación

de afiliados

Mediante esta prueba se calcula el indicador de

confiabilidad para la identificación de los afiliados,

a partir de su nombre y identificación; esto con el

fin de identificar afiliados doblemente registrados

en Sabass.

Q-D019:

Consistencia de fecha de

nacimiento de afiliados en

Sabass y AFE

Mediante esta prueba se calcula el indicador de

consistencia para la fecha de nacimiento de un

afiliado en Sabass respecto a AFE;

inconsistencia se da en la medida en que la fecha

de nacimiento del afiliado en AFE no corresponde

a la reportada en Sabass para el mismo número

205

Prueba Descripción

y tipo de documento.

Q-D020:

Consistencia de fecha de

nacimiento de afiliados en

Sabass y Nómina Pensionados

Mediante esta prueba se calcula el indicador de

consistencia para la fecha de nacimiento de un

afiliado en Sabass respecto a Nómina

Pensionados; inconsistencia se da en la medida

en que la fecha de nacimiento del afiliado en

Nómina Pensionados no corresponde a la

reportada en Sabass para el mismo número y

tipo de documento.

Atributo 4: Fecha de vinculación de afiliado

La fecha de vinculación de un afiliado ayuda a comprobar, en el momento de la

decisión de reconocimiento, si este ha cumplido el mínimo de semanas requerido

para obtener una pensión de vejez.

Base de datos Tabla

AFE NO

Cuotas Cobrar NO

Cuotas Pagar NO

DB_Cobrar NO

Devoluciones NO

Histlab Afiliado

NominaPen NO

Sabass Afiliado

Sabass Recaudo NO

Traslados Pensiones NO

206

Para este análisis, se debe tener en cuenta que la fecha de vinculación de un

afiliado en la base de datos Sabass corresponde a la primera fecha en que se

relacionó con el ISS, aún cuando este afiliado se haya trasladado a otra AFP. A

continuación se detallan los cálculos propuestos para medir distintos indicadores

sobre este atributo:

Prueba

Descripción

Q-D001:

Completitud de información

de afiliados

Mediante esta prueba se calcula el indicador

de completitud para la fecha de vinculación

de los afiliados en la base de datos de

afiliación Sabass, indicando porcentaje de

valores nulos, válidos y no válidos, los

valores no válidos representan fechas de

vinculación anteriores a 1967.

Atributo 5: Estado de afiliado

La correcta clasificación de un afiliado como pensionado o no pensionado del ISS

es vital para evitar pérdidas de tiempo y recursos en el proceso de reconocimiento;

en ocasiones, sólo después de adelantar las primeras actividades de este proceso

se identifica que el solicitante de la pensión ya adquirió el estatus de pensionado.

Base de datos Tabla

AFE NO

Cuotas Cobrar NO

207

Base de datos Tabla

Cuotas Pagar NO

DB_Cobrar NO

Devoluciones NO

Histlab Afiliado

NominaPen NO

Sabass Afiliado

Sabass Recaudo NO

Traslados Pensiones NO

A continuación se detalla el cálculo que permite obtener el indicador de

consistencia para este atributo:

Prueba Descripción

Q-D012:

Consistencia de estado de

afiliado

Mediante esta prueba se calcula el indicador de

confiabilidad para el atributo de estado de afiliado

respecto a si es o no pensionado en Sabass;

inconsistencia se da en la medida en que un

afiliado reportado como no-pensionado en Sabass

se encuentra en Nómina de Pensionados como

pensionado.

Atributo 6: Identificación de aportante

Tanto el NIT como la razón social de un aportante son fundamentales para

identificarlo durante su relación con el ISS; procesos como la construcción de

historia laboral completa y correcta en el momento que se solicite pueden verse

208

seriamente impactados por incoherencias en estos atributos. A continuación se

muestra la aparición de éstos en las distintas bases de datos:

Base de datos Tabla

AFE Gral_Ma_Entidad

Cuotas Cobrar NO

Cuotas Pagar NO

DB_Cobrar RegistroMaestro

Devoluciones Dafp_Empleador

Histlab Aportante

NominaPen NO

Sabass Aportante

Sabass Recaudo NO

Traslados Pensiones STI_Aportante

A continuación se detallan los cálculos necesarios para medir los distintos

indicadores sobre los atributos de identificación de aportantes:

Prueba Descripción

Q-D002:

Completitud de información de

aportantes

Mediante esta prueba se calcula el indicador de

completitud para la razón social de los aportantes

en la base de datos de afiliación Sabass,

indicando porcentaje de valores nulos y no nulos.

Q-D008:

Confiabilidad del NIT de

aportantes

Mediante esta prueba se calcula el indicador de

confiabilidad del NIT de aportantes en la base de

datos Sabass, comparando los tres primeros

dígitos con los patrones “800” y “900” para los

209

Prueba Descripción

aportantes con tipo de documento NIT.

Atributo 7: Naturaleza de aportante

La naturaleza de un aportante es importante para la correcta identificación del

mismo; esta naturaleza puede ser útil para validaciones de reglas de negocio

posteriores (por ejemplo, si el aportante es de carácter público o privado).

Base de datos Tabla

AFE NO

Cuotas Cobrar NO

Cuotas Pagar NO

DB_Cobrar NO

Devoluciones NO

Histlab Aportante

NominaPen NO

Sabass Aportante

Sabass Recaudo NO

Traslados Pensiones STI_Aportante

A continuación se detallan las consultas propuestas para obtener indicadores

sobre este atributo:

210

Prueba Descripción

Q-D002:

Completitud de información de

aportantes

Mediante esta prueba se calcula el indicador de

completitud para la naturaleza de los aportantes

en la base de datos de afiliación Sabass,

indicando porcentaje de valores nulos, válidos y no

válidos; los valores no válidos son aquellos fuera

del rango definido para este campo en Sabass.

Atributo 8: Ciclo de cotización

El ciclo de cotización refleja el mes del año al que corresponde un pago de un

aportante para un afiliado específico; es un atributo vital en el cálculo de semanas

cotizadas durante la decisión de reconocimiento de pensión. La presencia de este

atributo en las bases de datos se puede ver a continuación:

Base de datos Tabla

AFE NO

Cuotas Cobrar NO

Cuotas Pagar NO

DB_Cobrar NO

Devoluciones Dafp_Historia

Histlab NO

NominaPen NO

Sabass NO

Sabass Recaudo PagoAfiliadoPension

Traslados Pensiones NO

211

A continuación se detallan las consultas sobre las bases de datos que permiten

calcular indicadores sobre este atributo:

Prueba Descripción

Q-D003:

Completitud de información de

recaudo

Mediante esta prueba se calcula el indicador de

completitud para el atributo ciclo de cotización en

la base de datos Sabass_Recaudo, indicando

porcentaje de valores nulos, válidos y no válidos;

los valores no válidos son aquellos ciclos de

cotización con año menor a 1995.

Q-D004:

Completitud de aportes para

afiliados

Mediante esta consulta se calcula el indicador de

completitud de aportes a partir del atributo ciclo

de cotización, identificando aportes que se

esperaban y no se recibieron.

Atributo 9: Días cotizados

Así como el ciclo de cotización, para el cálculo de semanas cotizadas por un

afiliado durante el proceso de reconocimiento de pensión, es necesario establecer

los días que efectivamente cotizó en cada ciclo. Inconsistencias o falta de

completitud en este atributo pueden dificultar o impedir el correcto cálculo de

semanas, y por ende la decisión de otorgamiento de pensión.

Base de datos Tabla

AFE NO

Cuotas Cobrar NO

212

Base de datos Tabla

Cuotas Pagar NO

DB_Cobrar NO

Devoluciones NO

Histlab NO

NominaPen NO

Sabass RelacionSeguro

Sabass Recaudo PagoAfiliadoPension

Traslados Pensiones NO

A continuación se presentan las consultas que permiten calcular los indicadores

sobre este atributo:

Prueba Descripción

Q-D003:

Completitud de información de

recaudo

Mediante esta prueba se calcula el indicador de

completitud para el atributo días cotizados en

Sabass_Recaudo, indicando porcentaje de

valores nulos, válidos y no válidos; los valores no

válidos son aquellos menores a 0 y mayores al

número de días del mes respectivo.

Q-D004:

Completitud de aportes para

afiliados

Mediante esta consulta se calcula el indicador de

completitud de aportes a partir del atributo ciclo

de cotización, identificando aportes que se

esperaban y no se recibieron.

Q-D006:

Completitud de historia laboral

post-94

Mediante esta prueba se calcula el indicador de

completitud para el atributo días cotizados en una

relación laboral en Sabass; los valores no válidos

con aquellos menores a 0 y mayores al número

213

Prueba Descripción

de días del mes respectivo.

Atributo 10: Novedad

Las novedades laborales son importantes para determinar los ciclos y/o días en

que efectivamente se debieron reportar aportes por un afiliado específico y para

reconstruir la historia laboral completa de un afiliado; estas novedades tienen un

tipo (ejemplo: retiro o licencias), días que aplica la novedad y fecha en que se

produce la novedad. Inconsistencias en este atributo pueden dificultar

procedimientos como la detección de deudas en aportes, o la generación de la

historia laboral completa cuando esta se requiere.

Base de datos Tabla

AFE NO

Cuotas Cobrar NO

Cuotas Pagar NO

DB_Cobrar NO

Devoluciones NO

Histlab NovedadNoCorrelacionada

NominaPen NO

Sabass NovedadLaboral

Sabass Recaudo PagoAfiliadoPension

Traslados Pensiones NO

214

A continuación se presentan las consultas que permiten calcular los indicadores

sobre los atributos de novedad en relaciones laborales:

Prueba Descripción

Q-D005:

Completitud de información de

novedades laborales

Mediante esta prueba se calcula el indicador de

completitud para los atributos que tienen que ver

con novedades laborales, indicando porcentaje

de valores válidos y no válidos; los valores no

válidos para tipo de novedad son aquellos fuera

del rango para este atributo en Sabass, para

fecha de novedad aquellos con año menor a

1967 y para días de novedad aquellos menores a

0.

Atributo 11: Fecha de ingreso en relación laboral

Una historia laboral completa es fundamental para que el proceso de

reconocimiento de la pensión se lleve a cabo sin contratiempos; mantener las

fechas de ingreso y retiro de relaciones laborales completas es vital para la

reconstrucción de esta historia laboral en el reconocimiento.

Base de datos Tabla

AFE NO

Cuotas Cobrar NO

Cuotas Pagar NO

DB_Cobrar NO

215

Base de datos Tabla

Devoluciones NO

Histlab NO

NominaPen NO

Sabass RelacionLaboral

Sabass Recaudo NO

Traslados Pensiones NO

En la siguiente tabla se presentan las consultas definidas para el cálculo de los

distintos indicadores sobre este atributo:

Prueba Descripción

Q-D006:

Completitud de historia laboral

post-94

Mediante esta prueba se calcula el indicador de

completitud para los atributos que tienen que ver

con relaciones o vínculos laborales, indicando

porcentaje de valores válidos y no válidos; los

valores no válidos son aquellos con año menor a

1995.

Q-D013:

Consistencia entre fechas de

ingreso y retiro en relaciones

laborales

Mediante esta prueba se calcula el indicador de

consistencia entre fecha de ingreso y fecha de

retiro de cada relación laboral en Sabass;

inconsistencia en estos campos se da cuando la

fecha de ingreso es mayor a la fecha de retiro.

Atributo 12: Fecha de retiro en relación laboral

Una historia laboral completa es fundamental para que el proceso de

reconocimiento de la pensión se lleve a cabo sin contratiempos; mantener las

216

fechas de ingreso y retiro de relaciones laborales completas es vital para la

reconstrucción de esta historia laboral en el reconocimiento.

Base de datos Tabla

AFE NO

Cuotas Cobrar NO

Cuotas Pagar NO

DB_Cobrar NO

Devoluciones NO

Histlab NO

NominaPen NO

Sabass RelacionLaboral

Sabass Recaudo NO

Traslados Pensiones NO

A continuación se presentan las consultas definidas para el cálculo de los distintos

indicadores sobre este atributo:

Prueba Descripción

Q-D006:

Completitud de historia laboral

post-94

Mediante esta prueba se calcula el indicador de

completitud para los atributos que tienen que ver

con relaciones o vínculos laborales, indicando

porcentaje de valores válidos y no válidos; los

valores no válidos son aquellos con año menor a

1995.

217

Prueba Descripción

Q-D013:

Consistencia entre fechas de

ingreso y retiro en relaciones

laborales

Mediante esta prueba se calcula el indicador de

consistencia entre fecha de ingreso y fecha de

retiro de cada relación laboral en Sabass;

inconsistencia en estos campos se da cuando la

fecha de ingreso es mayor a la fecha de retiro.

Para el detalle del cálculo de indicadores solo se ilustraran las pruebas: Q-D001,

Q-D007, Q-D009, Q-D012, Q-D014, Q-D015, Q-D016, Q-D017, Q-D018, Q-D019,

Q-D020, Q-D021, Q-D022.

Detalle del cálculo de indicadores

Como se ha mencionado en este documento, la metodología que se aborda

permite la creación de tablas de trabajo temporales que contienen la muestra de

los datos clave identificados; posterior a ello, se ejecutan las consultas sobre estas

tablas.

Cabe anotar que para la extracción de las tablas de trabajo se tienen en cuenta los

siguientes criterios:

Se toma una muestra de los afiliados vivos no pensionados en Sabass, con un

95% de confidencia; esta muestra alimenta una tabla temporal de afiliados.

A partir de la muestra anterior, se seleccionan los datos requeridos en las demás

tablas de trabajo de Sabass o Sabass_Recaudo requeridas para el cálculo de

indicadores, poblando nuevas tablas temporales.

Para el caso de los aportantes, se toma una muestra con el mismo porcentaje de

confidencia para aportantes activos; posteriormente se pueblan las demás tablas

de trabajo mediante el mismo criterio.

218

Para el caso de cálculo de indicadores de consistencia entre bases de datos, en

este caso Sabass, AFE y NominaPen, se toma una muestra de personas de las

dos últimas y de las mismas personas en Sabass.

A continuación se utiliza la Plantilla 11 para mostrar la información detallada,

relacionada con el cálculo de los indicadores de completitud, confiabilidad y

consistencia para los diferentes atributos clave; en cada caso se especifica el

objetivo del cálculo, su justificación, el indicador que mide, los valores que se

obtienen mediante la consulta, la forma de calcular el indicador y, por último, los

resultados obtenidos.

Prueba No. Q-D001: Completitud de información de afiliados

Objetivo Determinar el porcentaje de completitud de los atributos

básicos de afiliados.

Justificación Los atributos básicos de los afiliados son fundamentales para

determinar la posible fecha de pensión, si un afiliado no tiene

estos datos completos no se podrá determinar su fecha de

pensión, por lo que se requerirá un proceso adicional que

permita recopilar estos datos.

Indicador que

mide

Completitud

Valores

obtenidos

mediante

consulta

Número total de afiliados (NT) Número total de afiliados que no reportan primer apellido y

primer nombre (NN) Número total de afiliados que no reportan sexo o con sexo

inválido (NS) Número total de afiliados que no reportan fecha de

nacimiento o con fecha de nacimiento inválida (NFN) Número total de afiliados que no reportan fecha de

afiliación o con fecha de afiliación inválida (NFA) Cálculo del

indicador

Completitud de nombres de afiliados: 100 – (NN / NT) * 100 Completitud de sexo de afiliados: 100 – (NS / NT) * 100 Completitud de fecha de nacimiento de afiliados :

100 – (NFN / NT) * 100 Completitud de fecha de afiliación: 100 – (NFA / NT) * 100

219

Prueba No. Q-D001: Completitud de información de afiliados

Resultados Valores obtenidos

Número total de afiliados (NT) = 2.400 Número total de afiliados que no reportan primer apellido y

primer nombre (NN) = 0 Número total de afiliados que no reportan sexo o con sexo

inválido (NS) = 0 Número total de afiliados que no reportan fecha de

nacimiento o con fecha de nacimiento inválida (NFN) = 0 Número total de afiliados que no reportan fecha de

afiliación o con fecha de afiliación inválida (NFA) = 5 Completitud de nombres de afiliados

Porcentaje de completitud: 100 – (NN / NT) = 100%

Número de casos incompletos por millón: 1.000.000 * (NN /

NT) = 0

Completitud de sexo de afiliados

Porcentaje de completitud: 100 – (NS / NT) = 100%

Número de casos incompletos por millón: 1.000.000 * (NS / NT)

= 0

Completitud de fecha de nacimiento de afiliados

Porcentaje de completitud: 100 – (NFN / NT) = 100%

Número de casos incompletos por millón: 1.000.000 * (NFN /

NT) = 0

Completitud de fecha de afiliación

Porcentaje de completitud: 100 – (NFA / NT) = 99.79%

Número de casos incompletos por millón: 1.000.000 * (NFN /

NT) = 2.083

Prueba No. Q-D007: Confiabilidad del nombre de afiliados

Objetivo Determinar el nivel de confiabilidad del nombre de los afiliados.

Justificación Comparar los nombres de los afiliados contra una base de datos

de referencia permite asegurar qué tan precisos son los datos

220

Prueba No. Q-D007: Confiabilidad del nombre de afiliados

respecto al patrón; es vital que en el momento del otorgamiento

este se haga a la persona indicada y no a otra que lo podría

estar suplantando.

Indicador que

mide

Confiabilidad

Valores

obtenidos

mediante

consulta

Número total de afiliados vivos no pensionados (NA) Número total de documentos de identidad no encontrados

en tabla maestra (NAN) Número total de registros diferentes contra tabla maestra

(NAD) Número total de registros similares contra tabla maestra

(NAS) Número total de registros iguales contra tabla maestra (NAI)

Cálculo del

indicador

Resultados Valores obtenidos

Número de afiliados vivos no pensionados (NA) = 2.400 Número total de documentos de identidad no encontrados

en tabla maestra (NAN) = 118 Número total de registros diferentes contra tabla maestra

(NAD) = 148 Número total de registros similares contra tabla maestra

(NAS) = 958 Número total de registros iguales contra tabla maestra (NAI)

= 1.176 Peso = 0,9 (un nombre semejante aporta 90% de

confiabilidad) Confiabilidad del nombre de afiliados

Porcentaje de confiabilidad = (NAI + (NAS * castigo) / NAN) *

100 = 89.3%

Número de casos no-confiables por millón = 1.000.000 –

(1.000.000 * (NAI + (NAS * castigo) / NAN)) = 106.836

Prueba No. Q-D009: Confiabilidad de la identificación de los afiliados

Objetivo Determinar el nivel de confiabilidad del número y tipo de

221

Prueba No. Q-D009: Confiabilidad de la identificación de los afiliados

documento de los afiliados.

Justificación La precisión en la identificación de afiliados permite evitar

inconvenientes o demoras en procesos posteriores por causa

de información incorrecta; registros duplicados con mismos

nombres y número de identificación pero distinto tipo de

identificación involucran un problema en esta precisión.

Indicador que

mide

Confiabilidad

Valores

obtenidos

mediante

consulta

Número de afiliados (NA) Número de nombres y tipos de documento encontrados

repetidos en el conteo de afiliados (NANF)

Cálculo del

indicador

100 - (NANF/NA) * 100

Resultados Valores obtenidos

Número de afiliados (NA) = 2.400 Números de nombres y fechas de nacimiento encontrados

repetidos (NANF) = 0 Confiabilidad de la identificación de afiliados

Porcentaje de confiabilidad: 100 – (NANF / NA) * 100 = 100%

Número de casos no-confiables por millón: 1.000.000 * (NANF /

NA) = 0

Prueba No. Q-D012: Consistencia de estado de afiliado

Objetivo Determinar el nivel de consistencia entre el reporte de un

afiliado como no-pensionado y su existencia en la nómina de

pensionados.

Justificación La existencia de personas ya pensionadas que no han sido

correctamente marcadas en la base de datos de afiliación

222

Prueba No. Q-D012: Consistencia de estado de afiliado

permite identificar problemas que deben ser corregidos, para

evitar posteriores inconvenientes en los procesos.

Indicador que

mide

Consistencia

Valores

obtenidos

mediante

consulta

Una tabla que contiene:

Número total de afiliados (NA) Número de afiliados que reportan estado no pensionado mientras se encuentran como pensionado en Nómina (NAI)

Cálculo del

indicador

100 – (NAI / NA) * 100

Resultados Valores obtenidos

Número total de afiliados (NA) = 2.400 Número de afiliados que reportan estado no pensionado mientras se encuentran como pensionado en Nómina (NAI) = 0

Consistencia de estado de afiliado

Porcentaje consistencia: 100 – (NAI / NA) * 100 = 100%

Número de registros inconsistentes por millón = 1.000.000 *

(NAI / NA) = 0

Prueba No. Q-D014: Consistencia entre sexo y nombre de afiliados

Objetivo Determinar el nivel de consistencia entre el género de un

afiliado y su nombre.

Justificación El género es un factor primordial en la decisión de otorgamiento

de una pensión a cierta edad; inconsistencias entre nombre y

género pueden indicar problemas y/o demoras futuras en el

proceso de otorgamiento.

Indicador que

mide

Consistencia

Valores Número de afiliados (NA)

223

Prueba No. Q-D014: Consistencia entre sexo y nombre de afiliados

obtenidos

mediante

consulta

Número de registros encontrados consistentes con género respecto a nombre (NAI)

Cálculo del

indicador

100 – (NAI / NA) * 100

Resultados Valores obtenidos

Número de afiliados (NA) = 2.400 Número de registros encontrados consistentes con género

respecto a nombre (NAI) = 7 Consistencia entre sexo y nombre de afiliados

Porcentaje consistencia: 100 – (NAI / NA) * 100 = 99.7%

Número de casos inconsistentes por millón: 1.000.000 * (NAI /

NA) = 2.917

Prueba No. Q-D015: Consistencia de nombres de afiliados en Sabass y

AFE

Objetivo Determinar el nivel de consistencia entre los nombres de los

afiliados de AFE respecto a Sabass.

Justificación El nombre de los afiliados es un atributo fundamental en el

proceso de reconocimiento; inconsistencias en este atributo

pueden ocasionar problemas o demoras en este proceso.

Indicador que

mide

Consistencia

Valores

obtenidos

mediante

Número de afiliados en AFE encontrados en Sabass (NAS) Número de afiliados en AFE encontrados en Sabass pero

con nombre inconsistente (NAN)

224

Prueba No. Q-D015: Consistencia de nombres de afiliados en Sabass y

AFE

consulta

Cálculo del

indicador

100 – (NAN / NAS) * 100

Resultados Valores obtenidos

Número de afiliados en AFE encontrados en Sabass (NAS): 2.397

Número de afiliados en AFE encontrados en Sabass con nombre inconsistente (NAN): 142

Consistencia de nombres de afiliados en Sabass y AFE

Porcentaje de consistencia: 100 – (NAN / NAS) * 100 = 94.07%

Número de casos inconsistentes por millón: 1.000.000 * (NAN /

NAS) = 59.241

Prueba No. Q-D016: Consistencia de nombres de afiliados en Sabass y

Nómina de Pensionados

Objetivo Determinar el nivel de consistencia de nombres de afiliados en

Nómina de Pensionados respecto a Sabass.

Justificación El nombre de los afiliados es un atributo fundamental para la

identificación completa de los mismos; errores en este atributo

pueden ocasionar inconvenientes en los pagos a las personas

adecuadas.

Indicador que

mide

Consistencia

Valores

obtenidos

mediante

consulta

Número de afiliados en Nómina Pensionados encontrados en Sabass (NAS)

Número de afiliados en Nómina Pensionados encontrados en Sabass pero con nombre inconsistente (NAN)

Cálculo del

indicador

100 – (NAN / NAS) * 100

225

Prueba No. Q-D016: Consistencia de nombres de afiliados en Sabass y

Nómina de Pensionados

Resultados Valores obtenidos

Número de afiliados en Nómina Pensionados encontrados en Sabass (NAS) = 2.159

Número de afiliados en Nómina Pensionados encontrados en Sabass pero con nombre inconsistente (NAN) = 155

Consistencia de nombres de afiliados en Sabass y Nómina

de Pensionados

Porcentaje consistencia: 100 –(NAN / NAS) * 100 = 92.8%

Número de casos inconsistentes por millón: 1.000.000 * (NAN /

NAS) = 71.792

Prueba No. Q-D017: Consistencia de sexo de afiliados en Sabass y AFE

Objetivo Determinar el nivel de consistencia del sexo de los afiliados de

AFE respecto a Sabass.

Justificación El sexo de los afiliados es un atributo fundamental en el proceso

de reconocimiento; inconsistencias en este atributo pueden

ocasionar problemas o demoras en este proceso.

Indicador que

mide

Consistencia

Valores

obtenidos

mediante

consulta

Número de afiliados en AFE encontrados en Sabass (NAS) Número de afiliados en AFE encontrados en Sabass pero

con sexo inconsistente (NAN)

Cálculo del

indicador

100 – (NAN / NAS) * 100

Resultados Valores obtenidos

Número de afiliados en AFE encontrados en Sabass (NAS) = 2.397

Número de afiliados en AFE encontrados en Sabass con sexo inconsistente (NAN) = 14

226

Prueba No. Q-D017: Consistencia de sexo de afiliados en Sabass y AFE

Consistencia de sexo de afiliados en Sabass y AFE

Porcentaje consistencia: 100 – (NAN / NAS) * 100 = 99.4%

Número de casos inconsistentes por millón: 1.000.000 – (NAN /

NAS) = 5.841

Prueba No. Q-D018: Consistencia de sexo de afiliados en Sabass y

Nómina de Pensionados

Objetivo Determinar el nivel de consistencia del sexo de afiliados en

Nómina de Pensionados respecto a Sabass.

Justificación El sexo de los afiliados es un atributo fundamental para el

otorgamiento de pensión; errores en este atributo pueden

ayudar a detectar incoherencias en el otorgamiento.

Indicador que

mide

Consistencia

Valores

obtenidos

mediante

consulta

Número de afiliados en Nómina Pensionados encontrados en Sabass (NAS)

Número de afiliados en Nómina Pensionados encontrados en Sabass pero con sexo inconsistente (NAN)

Cálculo del

indicador

100 – (NAN / NAS) * 100

Resultados

obtenidos

Valores obtenidos

Número de afiliados en Nómina Pensionados encontrados en Sabass (NAS) = 2.159

Número de afiliados en Nómina Pensionados encontrados en Sabass pero con sexo inconsistente (NAN) = 3

Consistencia de sexo de afiliados en Sabass y Nómina

Pensionados

Porcentaje consistencia: 100 – (NAN / NAS) * 100 = 99.7%

Número de casos inconsistentes por millón: 1.000.000 * (NAN /

227

Prueba No. Q-D018: Consistencia de sexo de afiliados en Sabass y

Nómina de Pensionados

NAS) = 1.389

Prueba No. Q-D019: Consistencia de fecha de nacimiento de afiliados

en Sabass y AFE

Objetivo Determinar el nivel de consistencia de la fecha de nacimiento de

los afiliados de AFE respecto a Sabass.

Justificación La fecha de nacimiento de los afiliados es un atributo

fundamental en el proceso de reconocimiento; inconsistencias

en este atributo pueden ocasionar problemas o demoras en este

proceso.

Indicador que

mide

Consistencia

Valores

obtenidos

mediante

consulta

Número de afiliados en AFE encontrados en Sabass (NAS) Número de afiliados en AFE encontrados en Sabass pero con fecha de nacimiento inconsistente (NAN)

Cálculo del

indicador

100 – (NAN / NAS) * 100

Resultados Valores obtenidos

Número de afiliados en AFE encontrados en Sabass (NAS) = 2.397 Número de afiliados en AFE encontrados en Sabass pero con fecha de nacimiento inconsistente (NAN) = 922

Consistencia de fecha de nacimiento de afiliados en Sabass

y AFE

Porcentaje consistencia: 100 – (NAN / NAS) * 100 = 61.5%

Número de casos inconsistentes por millón: 1.000.000 * (NAN /

NAS) = 384.647

228

Prueba No. Q-D020: Consistencia de fecha de nacimiento de afiliados

en Sabass y Nómina de Pensionados

Objetivo Determinar el nivel de consistencia de la fecha de nacimiento de

afiliados en Nómina de Pensionados respecto a Sabass.

Justificación La fecha de nacimiento de los afiliados es un atributo

fundamental para el otorgamiento de pensión; errores en este

atributo pueden ayudar a detectar incoherencias en el

otorgamiento.

Indicador que

mide

Consistencia

Valores

obtenidos

mediante

consulta

Número de afiliados en Nómina Pensionados encontrados en Sabass (NAS) Número de afiliados en Nómina Pensionados encontrados en Sabass pero con fecha de nacimiento inconsistente (NAN)

Cálculo del

indicador

100 – (NAN / NAS) * 100

Resultados Valores obtenidos

Número de afiliados en Nómina Pensionados encontrados en Sabass (NAS) = 2.159 Número de afiliados en Nómina Pensionados encontrados en Sabass pero con fecha de nacimiento inconsistente (NAN) = 831 Consistencia de fecha de nacimiento de afiliados en Sabass

y Nómina de Pensionados

Porcentaje consistencia = 100 – (NAN / NAS) * 100 = 61.5%

Número de casos inconsistentes por millón = 1.000.000 * (NAN /

NAS) = 384.900

Prueba No. Q-D021: Consistencia de afiliados en Sabass y AFE

Objetivo Determinar el nivel de consistencia de los afiliados existentes en

AFE y Sabass.

229

Prueba No. Q-D021: Consistencia de afiliados en Sabass y AFE

Justificación Es vital que la información que reside en las diferentes fuentes

de datos sea consistente respecto a otras fuentes y sus

objetivos; si una persona existe en AFE como solicitante de una

pensión, debería residir así mismo en Sabass como afiliado.

Indicador que

mide

Consistencia

Valores

obtenidos

mediante

consulta

Número de afiliados en AFE (NA) Número de afiliados en AFE no encontrados en Sabass

(NAN)

Cálculo del

indicador

100 – (NA / NAN) * 100

Resultados Valores obtenidos

Número de afiliados en AFE (NA) = 2.400 Número de afiliados en AFE no encontrados en Sabass

(NAN) = 3 Consistencia de afiliados en Sabass y AFE

Porcentaje consistencia = 100 – (NA / NAN) * 100 = 99.9%

Número de casos inconsistentes por millón = 1.000.000 * (NA /

NAN) = 1.250

Prueba No. Q-D022: Consistencia de afiliados en Sabass y Nómina

Pensionados

Objetivo Determinar el nivel de consistencia de los pensionados

residentes en Sabass y Nómina de Pensionados.

Justificación Es vital que la información que reside en las diferentes fuentes

de datos sea consistente respecto a otras fuentes y sus

objetivos; si una persona existe en Nómina Pensionados como

pensionado, debería residir así mismo en Sabass como afiliado

230

Prueba No. Q-D022: Consistencia de afiliados en Sabass y Nómina

Pensionados

(afiliado pensionado, en este caso).

Indicador que

mide

Consistencia

Valores

obtenidos

mediante

consulta

Número de afiliados en Nómina Pensionados (NA) Número de afiliados en Nómina Pensionados no

encontrados en Sabass (NAN)

Cálculo del

indicador

100 – (NA / NAN) * 100

Resultados Valores obtenidos

Número de afiliados en Nómina Pensionados (NA) = 2.400 Número de afiliados en Nómina Pensionados no

encontrados en Sabass (NAN) = 241 Consistencia de afiliados en Sabass y Nómina Pensionados

Porcentaje consistencia = 100 – (NAN / NA) * 100 = 89.9%

Número de casos inconsistentes por millón = 1.000.000 – (NAN

/ NA) = 100.417

Automatizar Indicadores de Calidad

La automatización de los indicadores se implementó a través de Jobs

programados que se ejecutan semanalmente y ejecutan las consultas definidas en

la sección anterior. La información extraída es cargada en las tablas temporales

que fueron creadas para soportar la ejecución del método para el análisis de la

calidad de los datos.

Es de aclarar que la automatización se aplica sobre las fuentes de datos que

continúen soportando y se integren en la operación de Colpensiones.

231

Definir Responsables

Durante la ejecución del proyecto inicial la responsabilidad es del grupo de AI,

pero la responsabilidad se debe transferir a las personas que asumen los roles y

responsabilidades que debe definir el gobierno de datos en el estado deseado.

Diagnostico

La Plantilla 12 es utilizada para presentar los resultados obtenidos de las

mediciones realizadas para cada uno de los indicadores y atributos considerados

previamente.

Categoría de

Indicador

Prueba

Porcentaje

(completos,

confiables o

consistente

s)

Número de

casos por

millón

(incompletos,

no-confiables o

inconsistentes) Nombre Atributo

Completitud Q-D001:

Completitud de

información de

afiliados

Nombre 100% 0

Sexo 100% 0

Fecha de

nacimiento

100% 0

Fecha de

afiliación

99.79% 2.083

Q-D002:

Completitud de

información de

aportantes

Razón social 96.04% 39.503

Naturaleza 48.4% 515.927

Q-D003: Ciclo de 100% 0

232

Categoría de

Indicador

Prueba

Porcentaje

(completos,

confiables o

consistente

s)

Número de

casos por

millón

(incompletos,

no-confiables o

inconsistentes) Nombre Atributo

Completitud de

información de

recaudo

cotización

IBC 100% 0

Salario base 100% 0

Días cotizados 100% 0

Q-D004:

Completitud de

aportes para

afiliados

Varios

atributos clave

de aportes

En proceso

En proceso

Q-D005:

Completitud de

información de

novedades laborales

Tipo de

novedad

96.08% 39.226

Días de

novedad

95.08% 49.165

Fecha de

novedad

100% 0

Q-D006:

Completitud de

historia laboral post-

94

Fecha de

ingreso

85.99% 140.112

Fecha de retiro 99.93% 725

Días cotizados 79.96% 230.379

Confiabilidad Q-007: Confiabilidad

del nombre de

afiliados

Nombre 89.3% 106.836

Q-D008:

Confiabilidad del NIT

NIT 91.45% 85.495

233

Categoría de

Indicador

Prueba

Porcentaje

(completos,

confiables o

consistente

s)

Número de

casos por

millón

(incompletos,

no-confiables o

inconsistentes) Nombre Atributo

de aportantes

Q-D009:

Confiabilidad de la

identificación de los

afiliados

Identificación 100% 0

Consistencia Q-D010:

Consistencia entre

fecha de nacimiento

y fecha de

vinculación

Fecha de

nacimiento y

fecha de

vinculación

99.83% 1.667

Q-D011:

Consistencia entre

sexo y número de

documento

Sexo y número

de documento

89.08% 109.185

Q-D012:

Consistencia de

estado de afiliado

Estado afiliado 100% 0

Q-D013:

Consistencia entre

fechas de ingreso y

retiro en relaciones

laborales

Fecha de

ingreso y

fecha de retiro

98.32% 16.796

Q-D014:

Consistencia entre

sexo y nombre de

Sexo y nombre 99.7% 2.917

234

Categoría de

Indicador

Prueba

Porcentaje

(completos,

confiables o

consistente

s)

Número de

casos por

millón

(incompletos,

no-confiables o

inconsistentes) Nombre Atributo

afiliados

Q-D015:

Consistencia de

nombres de afiliados

en Sabass y AFE

Nombre 94.07% 59.241

Q-D016:

Consistencia de

nombres de afiliados

en Sabass y Nómina

Pensionados

Nombre 92.8% 71.792

Q-D017:

Consistencia de

sexo de afiliados en

Sabass y AFE

Sexo 99.4% 5.841

Q-D018:

Consistencia de

sexo de afiliados en

Sabass y Nómina

Pensionados

Sexo 99.7% 1.389

Q-D019:

Consistencia de

fecha de nacimiento

de afiliados en

Sabass y AFE

Fecha de

nacimiento

61.5% 384.647

Q-D020: Fecha de 61.5% 384.647

235

Categoría de

Indicador

Prueba

Porcentaje

(completos,

confiables o

consistente

s)

Número de

casos por

millón

(incompletos,

no-confiables o

inconsistentes) Nombre Atributo

Consistencia de

fecha de nacimiento

de afiliados en

Sabass y Nómina

Pensionados

nacimiento

Q-D021:

Consistencia de

afiliados en Sabass

y AFE

Identificación 99.9% 1.250

Q-D022:

Consistencia de

afiliados en Sabass

y Nómina

Pensionados

Identificación 89.9% 100.417

Monitoreo de los Indicadores

El monitoreo de los indicadores será considerado dentro de las políticas que serán

definidas por el gobierno de datos, puesto que es importante que los indicadores

de calidad de datos se revisen periódicamente, asegurando su seguimiento y

mejoramiento permanente. En una primera instancia se sugiere realizar reuniones

periódicas que monitoreen las tendencias delos indicadores y realicen planes de

acción encaminados a la mejora de los indicadores.

236

Riesgos de Seguridad

En esta sección se presentan los hallazgos de riesgos de seguridad identificados y

que básicamente comprometen los indicadores de confidencialidad, integridad y

disponibilidad de los sistemas de información. Se utiliza la Plantilla 8 para describir

cada uno de los hallazgos.

Hallazgo H-S001 Integridad - Potenciales problemas causados por

falta de una auditoría de sistemas

Descripción general Correcciones a las bases de datos son probadas por los

usuarios y el personal de la GNI, pero no por un ente

independiente especializado en auditoría.

Análisis La no existencia de un área especializada en probar

cambios y detectar posibles problemas puede llevar a que

se instalen cambios que produzcan efectos indeseados en

las tablas modificadas.

Un área ágil, proactiva y estructurada alrededor de procesos

claros y completos de prueba, podría aportar grandes

beneficios en las pruebas de los cambios a instalar en

producción.

Soporte Correo del ingeniero Orlando Bernal enviado en Noviembre

2, 2010

Severidad Alta

Media

Baja

Confirmación Confirmado

Confirmado parcialmente

Por discutir

237

Hallazgo H-S002Confidencialidad – Prácticas irregulares en la

seguridad de los datos

Descripción general La información debe ser protegida para evitar especulación

no garantizada, interpretación incorrecta y uso inapropiado.

Análisis En el sistema de administración de pensiones se han

detectado, con mayor frecuencia y gravedad que en otros

sectores, una serie de prácticas irregulares de servidores

públicos y terceros queafectan directamente la moralidad

pública y el patrimonio estatal, pues no solo se tienen

controlesdébiles sino también la presencia de algunas

personas inescrupulosas manejando temas especialmente

sensibles con un criterio de beneficio personal o privado y no

con la visión del servicio público, del Estado, del sistema

pensional o del pensionado.

Soporte Documento realizado en septiembre de 2009: Estudio

Técnico de Estructura y Planta de personal Ajustado.

Severidad Alta

Media

Baja

Confirmación Confirmado

Confirmado parcialmente

Por discutir

Hallazgo H-S003Integridad - Problemas originados en el

intercambio de información con Asofondos

Descripción general La organización debe mantener intercambio de información

con Asofondos, existen problemas que deben ser resueltos

Análisis Debe anotarse que en la actualidad existe una relación fluida

238

Hallazgo H-S003Integridad - Problemas originados en el

intercambio de información con Asofondos

de colaboración entre las dos entidades, además los

beneficios que obtiene el ISS de tal relación no representan

ningún costo para la organización.

Asofondos funciona como un repositorio de información de

las administradoras hacia el ISS y como una puerta de

acceso de las administradoras hacia el ISS, los problemas

identificados son:

Problemas de traslados, los ciclos son muy largos y

hacer cambios toma mucho tiempo.

Diferentes interpretaciones de las normas produce que

resultados aceptados por una administradora pueden

fallar en otra administradora que reciba su información.

Información inexistente en las administradoras que hacen

que las validaciones en el ISS fallen (por ejemplo falta

salario base porque la administradora nunca lo almaceno

y el ISS no puede acreditar si ese dato hace falta).

Soporte Reunión con Asofondos en Oct. 4 de 2010

Severidad Alta

Media

Baja

Confirmación Confirmado

Confirmado parcialmente

Por discutir

239

Hallazgo H-S004Disponibilidad - Relación con Sistemas y

Computadores

Descripción general Sistemas y Computadores (SyC) ha aportado buenos

servicios al ISS, pero deben revisarse los contratos que

sustentan la prestación de los mismos

Análisis La relación debe estar apoyada en contratos que sean

suficientemente específicos en cuanto a:

Propiedad del software que se entrega o se pone al servicio del ISS, debe tenerse la claridad de quién es el dueño del software que se desarrolló, si es del ISS o es de SYC; en este último caso el contrato debe contener una cláusula que afirme que SyC es el único dueño de dicho software y que en caso de reclamación de un tercero sobre propiedad del mismo al ISS (o de cualquier otra entidad que lo reemplace), SyC saldrá en defensa de la organización.

Propiedad o licencia del software de base en donde está montado el software desarrollado por SyC, debe afirmarse que SyC tiene las licencias legales y que saldrá en defensa del ISS o de la entidad que lo reemplace en caso de reclamaciones de terceros respecto a la legalidad de las licencias necesarias para que el software de SyC ejecute propiamente.

Propiedad de los datos y las imágenes, debe ser específico en el sentido que ambos son propiedad del ISS o de la entidad que lo reemplace y que SyC no puede hacer uso distinto de los mismos.

Soporte Colpensiones envió copia de uno de los contratos

(90007819) en octubre 27, 2010, pero la UA no conoce otros

contratos. Este contrato en poder de la UA carece de

cláusulas que desarrollen los temas nombrados excepto por

una mención a la defensa del ISS por parte de SyC.

Severidad Alta

Media

Baja

Confirmación Confirmado

240

Hallazgo H-S004Disponibilidad - Relación con Sistemas y

Computadores

Confirmado parcialmente

Por discutir

4.3 ESTADO DESEADO DE ARQUITECTURA DE INFORMACION

Tal como se expresó en el diagnóstico inicial de la estructura de las bases de

datos del ISS, en la actualidad existen dos grandes problemas: primero, que en las

bases de datos actuales conviven mezclas de información entre pensiones y las

dos otras líneas de negocio que el ISS manejó en su momento; segundo, que la

estructura actual de mantener información duplicada ha conducido a situaciones

de no- consistencia.

Existen casos en que el sistema de pensiones debe mantener información de las

otras líneas de negocios; sin embargo, por la manera en que las BD fueron

construidas, la información de las líneas de negocio está entremezclada.

Así mismo, el incluir información de los diferentes productos en las mismas tablas,

limita el que la organización pueda incluir de forma sencilla nuevos productos. En

la actualidad, probablemente se comenzaría una nueva BD con tablas

especializadas para el nuevo producto y también se crearían nuevas tablas para

mantener una instancia no controlada de personas.

Por otro lado, al no disponer de información de los roles que las diferentes

personas juegan frente al ISS, se debe mantener la información básica de cada

una de dichas personas en las diferentes tablas creadas para ese propósito, lo

cual en el mediano y largo plazo causa que algunas de las entradas

correspondientes a una persona se actualicen mientras que las demás no; por

241

ejemplo, si una persona tiene el rol de afiliado y de empleador, entonces está

creado dos veces en las BD relacionadas.

4.3.1 Blueprint de arquitectura de información

Se considera que las actuales estructuras de información no son suficientemente

flexibles y poderosas para soportar los nuevos requerimientos que la entidad va a

enfrentar.

De acuerdo con lo anterior, se hace necesario el diseño de una AI que permita:

El diseño y puesta en marcha de un Gobierno de datos

Llegar a un punto en donde los datos, que anteriormente se encontraban

dispersos, tengan una capa de abstracción la cual permita que las aplicaciones

existentes, y también las nuevas que se desarrollen a futuro, tengan un solo

punto de acceso.

Implementar eficientemente un sistema MDM el cual permita centralizar el

acceso a los datos que hacen parte del core del negocio.

Vocabulario común y definición de datos.

Independencia tecnológica y por tanto la AI debe operar en una variedad

de plataformas tecnológicas.

La AI debe promover la interoperabilidad entre aplicaciones, negocio y

tecnología.

Control de acceso a los datos.

Evitar la replicación no controlada de información.

El blueprint de AI se diseñó respetando los lineamientos establecidos por el grupo

de arquitectura de aplicaciones y de negocio, donde se definió la utilización de un

modelo de referencia SOA. Es así, como en la Figura 40se muestra el Blueprint de

AI deseada que describe globalmente los componentes que responden a las

necesidades expuestas.

242

ZONA DE GOBIERNO DE DATOS

Zon

a d

e C

on

tro

l de

Acc

eso

Zon

a d

e S

erv

icio

s d

e D

ato

s

Zona de Integración de Datos

Zon

a d

e F

ue

nte

s d

e D

ato

s

Zona MDM

Figura 40. Blueprint de AI para Colpensiones

A continuación se describe la responsabilidad de cada una de las zonas

propuestas en el blueprint de AI:

Gobierno de datos

Esta zona representa la necesidad de implementar un gobierno de datos que se

debe conformar de acuerdo al modelo de referencia descrito en la sección y

seguir la guía metodológica descrita en la sección 3.2.2.

Responsabilidades:

Definir una estructura organizacional especializada para el gobierno de datos.

Garantizar que el trabajo de evangelización sea asumido por el CEO.

Ligar el proyecto de gobierno de datos a cada uno de los proyectos que se

realicen a nivel de AI. Estos proyectos pueden ser el de MDM, de calidad de

datos, de BI, etc.

243

Fomentar las normas, políticas y directrices que establecen la forma de

compartir y usar los datos a nivel empresarial. Para lo cual se evaluaran los

principios de datos propuestos por TOGAF.

Fomentar un enfoque de gobierno de datos mixto, donde las decisiones sobre

los datos relevantespor línea de negocios se tomen de forma descentralizada,

pero las decisiones a nivel corporativo sobre los datos transversales a todas

las líneas de negocio se deben tomar de forma centralizada.

Definir políticas de seguridad y privacidad que garanticen la identificación y

protección de la información confidencial y establecer controles de auditoria.

Implementación y vigilancia de un programa de mejora continua, de calidad de

datos, a través del método propuesto en la sección 0.

Monitorear el desempeño del gobierno de datos a través del monitoreo de

indicadores que permita hacer diagnósticos continuos sobre la calidad actual

de la información. Los indicadores y métricas corresponden a los definidos en

la sección del análisis del estado actual de la información.

Zona de control de acceso

Esta zona involucra las capacidades necesarias que se deben ejecutar para

brindar aspectos de seguridad como la autenticación, autorización y auditoria

(AAA), que garanticen la protección de los datos.

Para garantizar los aspectos de seguridad AAA se debe implementar mecanismos

de gestión de información básica de identidades de usuarios, contraseñas,

atributos, grupos y perfiles. Las identidades son necesarias para autenticara a los

usuarios y determinar qué tipo de recursos puede consumir. La identidad requiere

de contraseñas, certificados o datos que solo puede proporcionar un usuario.

Responsabilidades:

244

Entrada única de los usuarios para que con un único inicio de sesión puedan

entrar o acceder a todos los servicios que estén autorizados para su perfil.

Controlar el tiempo de sesión e inactividad.

Gestionar la información de la identidad a través de un directorio LDAP.

Garantizar que todos los usuarios consumidores de datos deben pasar por esta

zona sin excepción antes de llegar propiamente a los datos.

Autenticación, Autorización y Auditoria a través de un componente de software

comercial.

Zona de servicios de datos

En esta zona se define el portafolio de servicios compuestos y necesarios para

proporcionar los mecanismos de consulta, persistencia o actualización de

información en diversas fuentes de datos de forma unificada. El principal objetivo

de esta zona es proporcionar beneficios de optimización, disponibilidad de la

información, proporcionar información precisa, actualizada y asegurar la integridad

de la información.

Responsabilidades:

Garantizar la disponibilidad de servicios para consultar, guardar o actualizar

información.

Garantizar que todas las peticiones de usuarios que consumen información

deben pasar previamente por la zona de control de acceso para poder utilizar

los servicios de datos.

La información para los usuarios solo debe estar disponible a través de los

servicios de datos.

Permitir la integración de datos desde diferentes fuentes de datos que pueden

ser internas o externas a la empresa.

Operar en ambientes heterogéneos de fuentes de datos.

Permitir la integración de fuentes de datos legadas.

245

Zona de integración de datos

Esta zona proporciona los mecanismos necesarios para corregir los problemas de

dispersión, incompatibilidad de datos y mezcla de información de pensiones y las

otras líneas de negocio que actualmente existen en el ISS.

La solución a este problema se aborda desde la perspectiva de las técnicas de

integración de datos que existen actualmente en la industria y para lo cual se

establece un enfoque hibrido entre consolidación y federación.

El enfoque de consolidación de datos se orienta a la integración de múltiples

fuentes de datos y con diferentes tecnologías entre sí, para ser unificadas en una

única fuente de datos que puede ser utilizada por aplicaciones de reportes o

análisis de información como una bodega de datos, donde es aceptable una

latencia en la actualización de datos entre las fuentes origen y la fuente destino.

El enfoque federado de datos se propone para satisfacer los requerimientos de

negocio que demandan acceso sobre los datos reales y no sobre copias.

Principalmente este enfoque se establece porque permite integrar múltiples

fuentes de datos como si fuese una sola, y también porque el factor rendimiento

no es crítico para el contexto del negocio en Colpensiones. Adicionalmente según

[32], la federación de datos es la solución más usada para solucionar problemas

de información en casos de compras o unión de empresas para crear una nueva,

como es el caso de Colpensiones.

Responsabilidades:

Transformación de grandes volúmenes de información entre las fuentes de

datos origen y la fuente de dato destino.

Integrar múltiples fuentes de datos y con tecnologías diferentes.

Proporcionar información en tiempo real y tiempo temprano según

requerimientos del negocio.

Proporcionar un único acceso a los datos y vista unificada de los datos.

246

Análisis de las fuentes de datos para determinar su contenido y calidad de

datos. Para esto se recomienda la utilización de herramientas de perfilamiento

de datos.

Zona MDM

Esta zona proporciona los mecanismos necesarios para el diseño de una nueva

estructura que permita:

Una sólida definición de personas.

Separar las personas de los roles que juegan frente a la organización.

Resolver la mezcla de productos existente en las bases de datos actuales.

Soportar la incorporación de nuevos productos que ofrezca la organización, por

ejemplo BEPs, independientes de los actuales.

Evitar la replicación no controlada de información.

Crear una clara separación entre vínculos laborales y aportes.

Centrarse en el núcleo del negocio, evitando la mezcla de este con tablas

temporales, de reportes, de trabajo, etc.

Así, esta nueva estructura, detallada en el siguiente diagrama de alto nivel,

debería estar compuesta de:

Un conjunto de datos maestros, o directorio, que abarque los principales

aspectos del negocio: personas y productos.

Unas sub-estructuras específicas para los aspectos del negocio que interesa

detallar: historia laboral, producto pensiones y posiblemente otros productos.

Un conjunto de datos específicos de los productos existentes; por ahora, el

producto pensiones.

247

Figura 41. Estado deseado de los Datos Maestros

A continuación se describe la estructura propuesta, y se detallan las entidades que

hacen parte de la misma.

Maestro persona: Este diagrama contiene la estructura propuesta para manejar

la información de personas (naturales o jurídicas), tales como su información de

contacto, la historia que pueda existir respecto a los cambios de número de

documento de identidad o nombres y los roles que puede jugar respecto a los

productos que ofrece la organización.

248

La importancia de esta estructura es que permite un manejo unificado de la

información de personas naturales o jurídicas, de tal forma que exista un único

repositorio en donde la información de personas es almacenada.

De esta manera, cualquier actualización a la información de personas es

compartida para todas las aplicaciones. Así mismo, se tendrá la información de

todos los posibles roles que una persona juega frente a la organización.

Se ha añadido una estructura de grupo familiar que podría ser utilizada para

realizar proyectos de inteligencia de negocios, tales como minería de datos.

A continuación se utiliza la Plantilla 2 para presentar el detalle de las entidades

propuestas para esta estructura.

Entidad de negocio EN-DT001: Persona

Definición Entidad de negocio que representa a todos los entes que tienen relación con el negocio de la organización.

Descripción general Entidad que agrupa a todas las personas naturales o jurídicas que tienen relación (desde el punto de vista del negocio), con la organización.

La idea de agrupar a todas las personas en una sola tabla, surge del hecho que debe existir un único repositorio en donde mantener esta información. De esta manera, si se presenta un cambio en la información de una persona, habrá un único sitio en donde realizarlo, sin necesidad de hacerlo repetidamente en los diversos sitios en donde podría estar almacenado.

Puesto que una persona puede tener diferentes relaciones con la entidad (por ejemplo ser empleador y afiliado al mismo tiempo), se definieron los roles (o comportamientos), que representan dichas relaciones.

Las reglas que gobiernan los roles son:

Para que un ente exista en la entidad Persona, debe jugar o haber jugado un rol con la organización; en otras palabras, en esta entidad no existen personas sin relaciones actuales o pasadas con la organización.

Una persona puede jugar más de un rol, lo que refleja el

249

Entidad de negocio EN-DT001: Persona

hecho de que las personas pueden tener más de una relación con la entidad; por ejemplo, un empleador que sea persona natural puede también ser un afiliado o un pensionado.

En la generalidad de los casos, los roles son jugados de manera temporal; por ejemplo, para el producto Prestación Económica, la persona se afilia en una cierta fecha, por lo que adquiere el rol de afiliado, y posteriormente se pensiona, por lo que adquiere el rol de pensionado.

Entidades hijas Natural (en adelante PersonaNatural)

Jurídica (en adelante PersonaJurídica)

Entidades relacionadas

DatosContacto

DeudaPresunta

Devolucion

Historia_Id

Historia_nombres

Otorgamiento

OtorgamientoPersonaRol

PersonaNatural

PersonaProductoRol

Planilla

TipoDocumento

TipoProducto

VinculoLaboral

Atributos #id_persona

tipo_doc

num_doc

nombres_razonsocial

primer_apellido

segundo_apellido

Base de datos en que reside

No definida en este nivel de detalle

Entidad de negocio EN-DT002: PersonaNatural

Definición Entidad de negocio que representa a los individuos que se

250

Entidad de negocio EN-DT002: PersonaNatural

relacionan con la organización.

Descripción general Una persona natural es un individuo que tiene relación con la organización; así como la entidad Persona, una Persona Natural puede jugar distintos roles a través del tiempo. Esta entidad es una especialización de la entidad persona, puesto que contiene información específica del individuo, por ejemplo género o fecha de nacimiento.

Entidades hijas Ninguna

Entidades relacionadas

Afiliacion DetalleAfiliadosRecibidos DeudaPresunta GrupoFamiliar Persona PersonaJurídica RepresentanteLegal TipoRolFamiliar VinculoLaboral

Atributos genero fecha_nacimiento fecha_expedicion_documento_identidad

Base de datos en que reside

No definida en este nivel de detalle

Entidad de negocio EN-DT003: PersonaJurídica

Definición Entidad de negocio que representa a las personas jurídicas que se relacionan la organización.

Descripción general Una persona jurídica es aquella entidad o empresa de la que se quiere mantener información; estas personas jurídicas también juegan roles tales como, Administradora de Fondos de Pensiones, operador del sistema PILA. La entidad persona jurídica es una especialización de la entidad persona puesto que almacena información que es específica de las personas jurídicas, por ejemplo fecha de constitución.

Entidades hijas Ninguna Entidades relacionadas

ActividadEconomica BonoPensional CuentaCobro DetalleEntidadConcurrente Otorgamiento PersonaNatural Planilla RepresentanteLegal

251

Entidad de negocio EN-DT003: PersonaJurídica

Atributos naturaleza_juridica FechaConstitución

Base de datos en que reside

No definida en este nivel de detalle

Entidad de negocio EN-DT014: PersonaProductoRol

Definición Entidad de negocio que representa el rol desempeñado por una persona en un producto, durante un periodo de tiempo específico.

Descripción general Las personas naturales o jurídicas juegan roles en los diferentes productos que la organización ofrece, ejemplos de estos roles para el producto pensiones son afiliado, aportante, pensionado, abogado, entre otros. La naturaleza de estos roles es temporal.

Entidades hijas Ninguna

Entidades relacionadas

PersonaNatural Rol

Atributos fecha_desde fecha_hasta estado

Base de datos en que reside

No definida en este nivel de detalle

Entidad de negocio EN-DT015: RepresentanteLegal

Definición Entidad de negocio que representa la relación de representante legal entre una persona natural y una persona jurídica.

Descripción general Las personas jurídicas tienen representantes legales; éstos son personas naturales y pueden ser de interés para la entidad dado que los cobros persuasivos y coactivos tienen que ver con el representante legal.

Entidades hijas Ninguna Entidades relacionadas

PersonaNatural PersonaJuridica

Atributos fecha_desde fecha_hasta

Base de datos en que reside

No definida en este nivel de detalle

Entidad de negocio EN-DT016: GrupoFamiliar

Definición Entidad de negocio que representa el grupo familiar al que pertenece una persona natural que tiene relación con la

252

Entidad de negocio EN-DT016: GrupoFamiliar

organización.

Descripción general Las personas naturales pertenecen a grupos familiares; en los cuales desempeñan roles (padre, madre, hijo, abuelo). Estas entidades están previstas para el caso de que la entidad pueda recolectar este tipo de información para posteriormente hacer algún tipo de venta cruzada.

Entidades hijas Ninguna

Entidades relacionadas

Persona Natural TipoRolFamiliar

Atributos #id Base de datos en que reside

No definida en este nivel de detalle

Entidad de negocio EN-DT017: TipoRolFamiliar

Definición Entidad de negocio que representa el rol desempeñado por una persona dentro de un grupo familiar.

Descripción general Las personas naturales pertenecen a grupos familiares; en su grupo familiar, las personas naturales desempeñan roles (padre, madre, hijo, abuelo).

Entidades hijas Ninguna

Entidades relacionadas

GrupoFamiliar PersonaNatural

Atributos id_tiporolfamiliar nombre_tiporolfamiliar

Base de datos en que reside

No definida en este nivel de detalle

Maestro producto: esta estructura contiene la información sobre cada uno de los

productos que la entidad ofrece; inicialmente, contendrá solo la información de

pensiones pero en la medida en que se creen nuevos productos se podrá incluir

su información en esta estructura.

Se propone que las entidades de esta estructura contengan información sobre las

condiciones del producto, por ejemplo los requisitos que una persona debe cumplir

para adquirir el producto.

Así mismo, contendrá información sobre las características mismas del producto,

de tal forma que cambios en la operatividad del mismo, puedan ser incorporados

en las entidades, sin que haya necesidad de cambiar la lógica de las aplicaciones.

253

Esto permitiría escribir aplicaciones más generales que puedan manejar diferentes

productos, puesto que parte de la lógica está en la estructura y no en la aplicación.

Por ejemplo, uno de los atributos propuestos es si el producto debe tener cobro

persuasivo y cobro coactivo y a los cuántos meses de no pago se deberían iniciar

dichos procesos. De esta forma, cambios en el número de meses en que deben

iniciarse los procesos sólo afectarán la estructura de datos y no la lógica de las

aplicaciones.

Opciones de lógica más complicadas podrían ser incluidas (probablemente a

través del uso de nueva entidades), permitiendo que las aplicaciones sean más

generales y tengan menos código.

A continuación se utiliza la Plantilla 2 para presentar el detalle de las entidades

propuestas para esta estructura.

Entidad de negocio EN-DT018: TipoProducto

Definición Entidad de negocio que representa cada tipo de producto ofrecido por la organización.

Descripción general La organización puede ofrecer distintos tipos de productos a sus clientes; ejemplos de estos productos son pensiones o BEPs. El objetivo de tener esta entidad, es ofrecer flexibilidad para la creación de nuevos productos, de esta manera si la organización tiene la oportunidad de ofrecer un nuevo producto, podrá incluir su descripción y crear lógicas acordes con el mismo.

Entidades hijas Pensión BEP Descripción de cualquier otro producto financiero ofrecido

Entidades relacionadas

PersonaProductoRol Requisito TipoProductoRequisito

Atributos id ley_origen productos_por_persona unidades_saldo cobro_persuasivo? cobro_coactivo? meses_inactivar_cuenta

Base de datos en que reside

No definida en este nivel de detalle

254

Entidad de negocio EN-DT019: Pensión

Definición Entidad de negocio que mantiene información exclusiva de pensiones.

Descripción general Esta entidad es una especialización de la entidad TipoProducto y como tal, mantiene la información especializada necesaria para caracterizar el negocio de pensiones, por ejemplo puede mantener la información de lógicas que pueden aplicarse a procesos de pensiones.

Entidades hijas Ninguna Entidades relacionadas

Ninguna

Atributos Atributos de entidad padre TipoProducto Atributos propios del producto Pensión

Base de datos en que reside

No definida en este nivel de detalle

Entidad de negocio EN-DT020: BEP

Definición Entidad de negocio que representa el tipo de producto BEP.

Descripción general Esta es una especialización de la entidad TipoProducto y como tal mantiene la información especializada necesaria para caracterizar el tipo de producto BEP; este comprende el ahorro a largo plazo de las personas de escasos recursos para la obtención de beneficios económicos periódicos; esta entidad mantendrá información exclusivamente relacionada con BEPS. Además el diseño de esta entidad será diferente al de otras tablas que son hijas de la tabla TipoProducto.

Entidades hijas Ninguna

Entidades relacionadas

Ninguna

Atributos Atributos de entidad padre TipoProducto Atributos propios del producto BEP

Base de datos en que reside

No definida en este nivel de detalle

Entidad de negocio EN-DT021: Requisito

Definición Entidad de negocio que representa los requisitos que aplican para los diferentes productos.

Descripción general Los productos ofrecidos por la organización tienen una serie de requisitos que deben ser cumplidos; por ejemplo, un requisitos es que la persona tenga un ingreso inferior a 2 SML, esta información podría quedar almacenada allí y en conjunto con la tabla TipoProductoRequisito, podría usarse cuando los posibles clientes preguntan y cuando se necesite

255

Entidad de negocio EN-DT021: Requisito

hacer validaciones de información que está ingresando

Entidades hijas Ninguna

Entidades relacionadas

TipoProducto

Atributos id_requisito nombre_requisito

Base de datos en que reside

No definida en este nivel de detalle

Entidad de negocio EN-DT022: TipoProductoRequisito

Definición Entidad de negocio que representa la asociación entre un tipo de producto y un requisito.

Descripción general Ersta tabla ofrece el enlace entre los posibles requisitos y los posibles productos, de esta manera un producto puede ser asociado con los requisitos que apliquen, previamente creados en la tabla Requisito, también un mismo requisito puede ser usado por diferentes productos.

Entidades hijas Ninguna

Entidades relacionadas

TipoProducto

Atributos Ninguno

Base de datos en que reside

No definida en este nivel de detalle

Enfoque Arquitectural para MDM: para la captura, integración, uso compartido

de los datos maestros y respeto de las políticas establecidas por la arquitectura de

negocio y aplicaciones, que exigen alinear tecnología y el negocio para mejorar el

rendimiento de los procesos de negocio y ser una empresa ágil y competitiva, se

propone utilizar un enfoque arquitectural de repositorio central, donde los datos

maestros no son replicados y en consecuencia las aplicaciones deben solicitar y

actualizar la información directamente en el repositorio central. Las aplicaciones

interactúan con el repositorio central mediante un enfoque orientado a servicios.

Para mayor información sobre enfoques arquitecturales de MDM consultar [32].

Responsabilidades:

256

Reutilizar y potenciar otras aplicaciones CRM’s, ERP’s y otras aplicaciones

legadas.

Agilidad para adaptarse al cambio a causa de nuevas reglamentaciones.

Flexibilidad para reducir tiempos y costos de implantación de nuevos

requerimientos funcionales.

Favorecer la evolución, cambio y crecimiento del negocio.

Favorecer el mapeo directo entre procesos de negocio y datos empresariales.

Favorecer el desarrollo en paralelo.

4.4 MAPA DE PROYECTOS

4.4.1 Definición de proyectos

Para superar la brecha existente entre el Estado Actual y el Estado Deseado, se

han identificado un conjunto de proyectos organizados en una línea de tiempo,

durante la cual Colpensiones gradualmente integrara en su funcionamiento la

información heredada del ISS y de esta forma gradualmente alcanzara el estado

deseado. A continuación se utiliza la Plantilla 6 para consolidación de brecha,

soluciones y dependencias para superar la brecha.

257

Tabla 9. Matriz de consolidación de brecha, soluciones y dependencia.

A continuación se utiliza la Plantilla 7 para describir incrementalmente las

arquitecturas de transición.

N° Zona GAP Posible Solución Descripción Dependencias

3 MDM

Consolidar

informacion de

Personas y

Productos.

Enfoque arquitectural de repositorio

central para MDM.

4 Servicios de DatosPortafolio de

servicios de dato

Arquitectura orientada a servicios

(SOA)

El enfoque SOA es un requisito

definido por la arquitectura de

aplicaciones y en consecuencia

la arquitectura de información

debe cumplirlo.

Arquitectura de

aplicaciones.

5

6

Integracion de Datos

Matriz de Consolidación de Brecha, Soluciones y Dependencias

1

Oficina de Gobierno

de Datos.

Proceso de calidad

de datos.

Definición y creación de la oficina de

Gobierno de Datos.

Metodo para analisis de calidad de

datos.

2

Dispersión e

Incompatibilidad de

datos.

Mezcla de

información.

Tecnica de integración de datos

hibrida entre consolidación y

federación.

Se definen e implementan los

recursos financieros, logisticos,

tecnicos y humanos para la

implantación de una entidad

organizacional destinada

Integración de datos y

MDM.Gobierno de Datos

258

4.4.2 Priorización de proyectos

En reunión con el grupo estratégico y de negocio, cada proyecto se analizó de

acuerdo a dos factores: índice de beneficios e índice de riesgos. La escala de

valores utilizada es de 1 a 5 donde 1 representa el valor más bajo y 5 el valor más

alto. A continuación se muestran los valores asignados por proyecto y la gráfica

correspondientes.

Arquitectura de Transicion 1 Arquitectura de Transicion 2 Arquitectura de Transicion 3

N° Proyecto Julio 2012 - Diciembre 2012 Enero 2012 - Junio 2012 Julio 2013 - Diciembre 2013 Comentarios

1 MDM

Diseño e implementación

del repositorio central.

2 MDM migracion de datos A

Consolidar informacion de

Personas de los 80s y 90s.

Consolidar información de

Productos.

Esta informacion corresponde a

personas

proximas a pensionarse.

3 MDM Migracion de datos B

Consolidar información de

Personas de los años 2000 al

presente.

Consolidar información de

Productos.

Esta informacion corresponde a

personas que

les falta varios años para empezar el

proceso de liquidacion pensional.

4 MDM Migracion de datos C

Consolidar información de

Personas de antes de los

80s.

Consolidar información de

Productos.

La informacion de estos años

corresponde a

pesonar ya pensionadas.

5 Federación de datosDiseño y construcción de la

Federación

6 Migración de afiliaciones A

Integrar información de

Afiliaciones asociada al

proyecto 2 (MDM migración

de datos A).

Esta informacion corresponde a

afiliaciones de personas

proximas a pensionarse.

7 Migración de afiliaciones B

Integrar información de

Afiliaciones asociada al

proyecto 3 (MDM migración

de datos B).

Esta informacion corresponde a

afiliaciones de personas que

les falta varios años para empezar el

proceso de liquidacion pensional.

8 Migración de afiliaciones B

Integrar información de

Afiliaciones asociada al

proyecto 4 (MDM migración

de datos C).

La informacion de estos años

corresponde a afiliaciones de

pesonar ya pensionadas.

9 Gobierno de datosDiseño e implantación del

gobierno de datos.

Ejecucion del proceso de

calidad de datos.

Evaluacion de Madurez de la

AI.

Ejecucion del proceso de

calidad de datos.

Evaluacion de Madurez de la

AI.

259

Proyecto Riesgo Beneficio Tamaño MDM 1 5 3 MDM migración de datos A 2 5 4 MDM Migración de datos B 2 4 5 MDM Migración de datos C 1 2 4 Federación de datos 3 4 4 Migración de afiliaciones A 4 5 4 Migración de afiliaciones B 3 3 5 Migración de afiliaciones C 1 1 5 Gobierno de datos 1 4 3

Tabla 10. Valores de evaluación del Riesgo vs Beneficio

Figura 42. Grafica de evaluación del Riesgo vs Beneficio

En evaluación del riesgo vs beneficio para cada proyecto se analizaron aspectos

de riesgo como complejidad, tamaño, la tecnología y el impacto en caso del

fracaso. Para el beneficio se analizaron aspectos como cumplimiento de los

principios, la contribución financiera y la alineación estratégica.

0

1

2

3

4

5

6

0 1 2 3 4 5

Ben

efic

io

Riesgo

260

Es así, como podemos afirmar que la mayor prioridad de ejecución la tienen los

proyectos MDM, Gobierno de datos, MDM migración de datos A y MDM migración

de datos B porque son los proyectos que representan el mayor beneficio para el

negocio con el menor riesgo. En su orden de prioridad siguen los proyectos

Federación de datos, Migración de afiliaciones A, Migración de afiliaciones B

porque son los que representan también un mayor beneficio para el negocio pero

con un mayor nivel de riesgo.

Los proyectos de MDM Migración de datos C y Migración de afiliaciones C son los

proyectos con menor riesgo pero también el aporte al negocio es mínimo, puesto

que corresponde a información de personas ya pensionadas. En consecuencia, en

este momento la decisión recomendada es dejar esta información donde esta y no

hacerle ningún tratamiento por el momento.

5 CONCLUSIONES Y TRABAJO FUTURO

5.1 CONCLUSIONES DEL TRABAJO REALIZADO

Se presentó una solución para el desarrollo de arquitecturas de información en un

contexto de arquitectura empresarial, que integra elementos de AI propuestos por

los frameworks de AE, ampliamente aceptados pero que las propuestas difieren

entre sí. También la solución incluye una serie de propuesta a nivel de modelos de

referencia y plantillas que apoyan el desarrollo metodológico.

Los aportes realizados son:

Un framework que define conceptualmente tres elementos estructurales

necesarios para el desarrollo de arquitecturas de información en un contexto

de arquitectura empresarial. Estos elementos estructurales son el repositorio

261

de recursos de AI, las guías metodológicas y el repositorio de arquitectura de

información.

Modelo de referencia para dividir la complejidad de los datos empresariales en

dominios de datos.

Modelo de Referencia para describir la situación deseada de un gobierno de

datos y que también permite evaluar la situación actual del gobierno.

Modelo de Referencia para definir el alcance de una AI en un contexto de AE.

Propuesta de tres guías metodológicas que apoyan y facilitan el desarrollo de

arquitecturas de información en un contexto de AE. Las guías metodológicas

son para el desarrollo del proyecto inicial de AI, para el desarrollo de proyectos

particulares y para el gobierno de datos.

Definición y validación de la guía metodológica para el desarrollo del proyecto

inicial de AI, la cual propone 4 macro etapas que posibilitan el desarrollo

ordenado e iterativo de arquitecturas de información en un contexto de AE.

Propuesta de la guía metodológica para gobierno de datos que ayuda en el

diseño e implementación de un gobierno de datos.

Estos aportes se consideran novedosos, toda vez que en la revisión realizada del

estado del arte no se encontraron soluciones que cumplieran con las necesidades

sentidas en el desarrollo de arquitecturas de información, necesidades como guías

metodológicas, modelos de referencia, plantillas que faciliten la documentación de

la AI, identificación y organización de recursos necesario para el desarrollo de AI.

En el trabajo de revisión del estado del arte, se identificó la diferencia marcada

alrededor de las propuestas para el desarrollo de arquitecturas de información en

el contexto de arquitectura empresarial, que tienen los frameworks de AE más

aceptados. Esta diferencia en las propuestas muestra que en la actualidad no

existe unificación de conceptos y propuestas metodológicas con el nivel de detalle

necesario que guíen el desarrollo de arquitecturas de información en un contexto

de AE.

262

La aplicación de la propuesta mediante el caso de estudio permitió probar, ajustar

y mejorar principalmente las plantillas, los modelos de referencia y la guía

metodológica para el desarrollo del proyecto inicial de una AI.

5.2 TRABAJO FUTURO

Este trabajo contaba principalmente con una restricción de tiempo en su ejecución,

lo que limito el poder ejecutar el FAI completamente. Solo se abordaron los

aspectos más importantes del repositorio de recursos, la ejecución y validación de

la guía metodológica del proyecto inicial de la AI. Para un trabajo futuro se sugiere:

Complementar el repositorio de recursos de AI.

Validar la guía metodológica de gobierno de datos.

Proponer y validar una guía metodológica para el desarrollo de proyectos

particulares.

La propuesta se validó con un caso de estudio donde se fusionaban un conjunto

de empresas para dar origen a una nueva. Para un trabajo futuro se propone

validar el comportamiento del FAI en las siguientes situaciones:

Creación de una empresa nueva que no cuente con información heredada de

otras empresas.

En una empresa que ya esté constituida con varios años de operación y que

deciden emprender un proyecto de AI, pero que necesitan mantener la

operación del negocio.

En una empresa donde solo necesiten realizar un esfuerzo de AI solo para un

proceso de negocio.

263

6 BIBLIOGRAFIA

[1] The Art of Enterprise Information Architecture. Mario Godinez, Eberhard

Hechler, Klaus Koenig, Steve Lockwood, Martin Oberhofer, Michael Schroeck.

System-Based Approach for Unlocking Business Insight.IBM Press Pearson pl,

2010.

[2] Data Model Patterns A Metadata Map. David C. Hay. The Morgan Kaufmann

Series in Data Management Systems, 2006.

[3] “Framework” The American Heritage Dictionary of the English Language,

Fourth Edition. Houghton Mifflin Company.

[4] The Framework for Enterprise Architecture: Background, Description and Utility

by John A. Zachman, published by Zachman Institute for Framework

Advancement (ZIFA) Document ID 810-231-0531.

[5]John Zachman's Concise Definition of the Enterprise, 2008 John A. Zachman,

CEO www.ZachmanInternational.com

[6] Nongeospatial Metadata for the Ecological Sciences. Michener, W. et. al.

Ecological Applications 7(1). 1997. pp. 330-342.

[7] Golfarelli, M. “The Dimensional Fact Model: a Conceptual Model for Data

Warehouse”. International Journal of Cooperative Information System, Vol. 7, No.

2&3, pp. 215-247.

[8] Gorczynska, R. “Modelling Meta Data for Multidimensional Data”. Journal of

Data Warehousing, Vol. 3, No 4, pp. 32-42.

[9] Katic, N. “A Prototype Model for Data Warehouse Security Based on Metadata”.

Proceeding DEXA 98.

264

[10] Jarke, M. “Concept Base – a deductive object base for meta data

management”. Journal of Intelligent Information Systems (Special Issue on

Advances in Deductive Object-Oriented Database), Vol 4, No 2, app. 167-192.

[11] Muller, R. “An Integrative and Uniform Model for Metadata Management in

Data Warehousing Environments”. Proceeding of the International Workshop on

Desing and Management of Data Warehouses, Heidelberg. Germany, 1999.

[12] Jeusfeld, M.A. “Design and Analysis of Quality Information for Data

Warehouses”. Proc. 17th International Conference on Conceptual Modelling

(ER’98), Singapore.

[13] Pereira, C. and Sousa, P. (2004) A Method to define an Enterprise

Architecture using the Zachman Framework, Proceedings of the 2004 ACM

Symposium on Applied Computing, 1366-1371.

[14] Roger Sessions, Comparison of the Top Four Enterprise Architecture

Methodologies.

[15] Data Model Patterns A Metadata Map. The Morgan Kaufmann Series in Data

Management Systems.

[16] The Open Group Architecture Framework (TOGAF), Version 9.1, Enterprise

Edition.

[17] The Integrated Architecture Framework Explained. Jack van’t Wout, Maarten

Waage, Herman Hartman, Max Stahlecker, Aaldert Hofman. Published by

Springer-Verlag Berlin Heidelberg 2010.

[18] Designing Data Governance. Vijay Khatri and Carol V. Brown.Communication

of the ACM, January 2010.

[19] Universidad de los Andes: Arquitectura y Diseño de Software, Motivadores de

Negocio.

265

[20] Trends 2007: Master Data Management. Ray Wang, Rob Karel, and Kyle

McNabb.second document in the “Master Data Management” series. February 26,

2007.

[21] Master Data and Master Data Management: An Introduction. David Loshin.

DataFlux White Paper.

[22] Data Governance: What Works And What Doesn’t. By Rob Karel with J. Paul

Kirby, Boris Evelson, Connie Moore, and Jamie Barnett.Forrester September 10,

2007.

[23] Universidad de los Andes. Arquitectura de información para la Administradora

Colombiana de Pensiones COLPENSIONES, 2011.

[24] Harold F. Tipton, Micki Krause (eds.), Information Security Management

Handbook, 5th Ed., CRC Press, 2006.

[25] Universidad de San Martin de Porres, Calidad de datos: un nuevo enfoque de

la mejora permanente. Boletín informativo N°

60.(http://www.usmp.edu.pe/publicaciones/boletin/fia/info60/calidad.html) (Six

Sigma)

[26] Sunil Soares, The IBM Data Governance Unified Process, Driving Business

Value with IBM Software and Best Practices, MC Press.

[27] Universidad de los Andes. Curso de diseño de software basado en patrones,

2009.

[28] Heileman, Gregory L.Estructuras de datos, algoritmos y programación

orientada a objetos. Madrid ; Santafé de Bogotá : McGraw-Hill, c1998.

[29] Carlo Batini,Cinzia Cappiello, Chiara Francalanci y Andrea Maurino.

Methodologies for Data Quality Assessment and Improvement. ACM Computing

Surveys, Vol. 41, No. 3, Article 16, Publication date: July 2009.

266

[30] Tomado de Osterwalder, Alexander; Pigneur, Yves; Smith, Allan; et. al.

(2009). Business Model Generation. Nueva Jersey: Hoboken Publication. ISBN

9782839905800.

[31] Administradora colombiana de pensiones COLPENSIONES, Estudio técnico

estructura y planta de personal ajustada, Grupo de la protección social.

[32] Colin White. Data Integration: Using ETL, EAI and EII Tools to Create an

Integrated Enterprise. The Data Warehousing Institute. November 2005.

[33] The Chief Information Officers Council, Federal Enterprise Architecture

Framework, version 1.1 September 1999.

[34] Federal Enterprise Architecture Program, The Data Reference Model, version

2.0 November 17 de 2005.

[35] Executive Office of the President of the United States, FEA Consolidated

Reference Model Document, version 2.3 october 2007.

267

ANEXOS

Anexo N° 1: Glosario de Términos

En esta sección se presenta la definición de un conjunto de términos que son

necesarios para la adecuada interpretación de este trabajo. Están organizados

según su aparición a lo largo del documento y no por orden alfabético.

Anexo N° 2: Canvas

El Canvas es un modelo de negocio creado por Alexander Osterwalder el cual

describe de manera lógica la forma en que las organizaciones crean, entregan y

capturan valor. La herramienta no es más que un lienzo con distintos apartados

interrelacionados entre ellos que cubren todos los aspectos básicos de un

negocio: segmentos de clientes, propuesta de valor, canales, relación con los

clientes, fuentes de ingresos, recursos clave, actividades clave, socios clave y

estructura de costos [30].

268

Anexo N° 3: Herramientas Tecnológicas

Enterprise Architect, Modelio-Open, TOAD, Rational Rose Data Modeler, entre

otros. También Modelio-Open provee soporte para los diagramas y matrices

sugeridos por TOGAF.

Anexo N° 4: Técnicas de Modelamiento

Diagrama de Clases/Entidad-Relación

Utilizados en el modelo conceptual que permite modelar las entidades de negocio

y como se relacionan entre sí para soportar el negocio dentro de la empresa.

Diagrama de Clases

269

Diagrama Entidad Relación

Diagrama de Diseminación de Datos

Según TOGAF este diagrama permite visualizar la relación entre las entidades de

negocio, los servicios de negocio y las fuentes de datos. Con este diagrama se

puede identificar replicación de datos y también permite visualizar los sistemas

que utilizan y/o soportan las entidades de negocio. A continuación se presenta a

modo de ejemplo un diagrama tomado de [23] y que hace parte del caso de

estudio visto en capítulo 4.

Diagrama de Diseminación de Datos

270

Para realizar el diagrama de diseminación de datos se aconseja tener en cuenta lo

siguiente:

1. Preferiblemente hacer un diagrama por cada entidad de negocio.

2. Identificar las fuentes de datos donde se encuentren datos de la entidad de

negocio.

3. Identificar dependencias entre las fuentes de datos.

4. Identificar técnicas de integración de datos.

5. Para cada fuente de dato realizar una descripción básica que incluya: el

formato de los datos. Puede estar como datos estructurados o no

estructurados como imágenes o microfichas. Cantidad de registros e

información de los datos que indique la fecha del primer registro y la fecha del

último registro.

6. Hacer un diagrama no formal (como el que se muestra en la figura anterior)

donde se muestre gráficamente la información mencionada en los puntos del 1

al 5.

Diagrama de Ciclo de Vida de Datos

Este es un diagrama que permite visualizar el ciclo de vida de los datos, desde su

creación, consulta, transformación y eliminación, según las reglas o limitaciones

por procesos de negocio. Este diagrama nos ayuda a identificar las necesidades

de datos comunes que tiene el negocio y será el punto de partida para diseñar

fuentes de datos comunes que permitan compartir recursos de datos.

Para realizar un diagrama de ciclo de vida se aconseja tener en cuenta los

siguientes aspectos:

1. Identificar las entidades de negocio que se incluirán

2. Identificar procesos de negocio y clasificar en misionales, estratégicos y de

apoyo.

271

3. Identificar aplicaciones y componentes de software

4. Identificar fuentes de datos

5. Hacer un diagrama donde se describa gráficamente para cada entidad de

negocio, donde se crea, se consulta, se transforma y elimina.

A continuación se presenta una aproximación de lo que se debe incluir en un

diagrama de ciclo de vida de los datos.

Diagrama de ciclo de vida de los datos

Adicionalmente para cada una de las entidades de negocio se debe hacer una

descripción del ciclo de vida que debe ser evidente en el diagrama.

272

Anexo N° 5: Acta de Entrevista o Reunión

Este formato proporciona un espacio donde se puede relacionar de forma escrita

lo tratado y acordado en la entrevista. Además la creación y publicación de un acta

proporciona constancia oficial de lo tratado y acordado en la entrevista. A

continuación se muestra la plantilla con información de ejemplo:

273

Adicionalmente no olvidar que el acta debe también incluir la hora de inicio,

finalización y las firmas de los asistentes.

Anexo N° 6: Registro pendiente de entrevistas

Este formato proporciona un espacio para registrar temas o tareas acordadas para

realizar posterior a la entrevista. Estas tareas pueden ser: enviar documentación

de constitución de la empresa, sobre los procesos de negocio, portafolio de

productos y servicios entre otros. A continuación se muestra el formato con

información de ejemplo.

274

Anexo N° 7 Otras plantillas

La Plantilla 8 permite describir y documentar los hallazgos identificados durante el

desarrollo de la AI. Un hallazgo en este trabajo se define como una debilidad

identificada en cualquier aspecto de la AI.

Para cada una de las plantillas se presenta información tomada del caso de

estudio para ilustrar como se debe diligenciar.

Hallazgo H-D005 Falta de una autoridad de la información

Descripción general La organización carece de un área / funcionario cuyo

responsabilidad primordial sea la de mantener la calidad de

los datos.

Análisis Ninguna de las áreas que actualmente realizan corrección

de los datos, tiene como responsabilidad principal mantener

la calidad de los datos y además tiene otras funciones

diferentes de la corrección.

Existe un comité para atacar problemas de información,

conformado por la GNI y por el DNAR, pero nuevamente la

función principal de esas áreas no es la corrección y el

mantenimiento de los datos

Soporte Documento word “Organigrama ISS JK” de fecha Julio 31,

2010. Reuniones realizadas en particular octubre 19, correo

enviado por José Bocanegra a la Universidad en octubre 22,

2010

Severidad Alta

Media

Baja

Confirmación Confirmado

275

Hallazgo H-D005 Falta de una autoridad de la información

Confirmado parcialmente

Por discutir

Plantilla 8. Descripción de hallazgo [23]

La Plantilla 9 permite describir los indicadores de calidad que se consideren para

el análisis del estado de la información.

Categoría de

Indicador

CI-D001: Completitud

Definición Es la medida que indica si la realidad de interés está

totalmente representada, este indicador no tiene en cuenta la

exactitud de la información, sólo si esta existe o no.

Nivel de cálculo Atributo

Registro

Ejemplo Parte de la realidad de interés es la fecha de nacimiento de los

afiliados; en este caso, el indicador de completitud permite

determinar el porcentaje de afiliados para los que se conoce

este atributo de interés.

Plantilla 9. Indicadores de calidad de datos [23]

La Plantilla 10 permite documentar las mediciones que se realizaran de acuerdo a

cada uno de los indicadores de calidad y su respectiva información asociada.

Prueba Descripción

Q-D001:

Completitud de información de

afiliados

Mediante esta prueba se calcula el indicador de

completitud para los nombres de los afiliados en

la base de datos de afiliación Sabass, indicando

porcentaje de valores nulos y no nulos.

Q-D007: Mediante esta prueba se calcula el indicador de

276

Prueba Descripción

Confiabilidad del nombre de

afiliados

confiabilidad para los nombres de los afiliados de

la base de datos Sabass respecto a la tabla de

personas de la Registraduría Nacional.

Plantilla 10. Mediciones de los indicadores de calidad [23]

La Plantilla 11 permite describir detalladamente los cálculos que se realizaran

respecto a cada indicador de calidad y la información asociada.

Prueba No. Q-D012: Consistencia de estado de afiliado

Objetivo Determinar el nivel de consistencia entre el reporte de un

afiliado como no-pensionado y su existencia en la nómina de

pensionados.

Justificación La existencia de personas ya pensionadas que no han sido

correctamente marcadas en la base de datos de afiliación

permite identificar problemas que deben ser corregidos, para

evitar posteriores inconvenientes en los procesos.

Indicador que

mide

Consistencia

Valores

obtenidos

mediante

consulta

Una tabla que contiene:

Número total de afiliados (NA) Número de afiliados que reportan estado no pensionado mientras se encuentran como pensionado en Nómina (NAI)

Cálculo del

indicador

100 – (NAI / NA) * 100

Resultados Valores obtenidos

Número total de afiliados (NA) = 2.400 Número de afiliados que reportan estado no pensionado mientras se encuentran como pensionado en Nómina (NAI) = 0

Consistencia de estado de afiliado

277

Prueba No. Q-D012: Consistencia de estado de afiliado

Porcentaje consistencia: 100 – (NAI / NA) * 100 = 100%

Número de registros inconsistentes por millón = 1.000.000 *

(NAI / NA) = 0

Plantilla 11. Calculo de Indicadores [23]

La Plantilla 12 permite documentar el diagnostico de calidad de los datos, de

acuerdo a los resultados obtenidos de la ejecución de los cálculos establecidos

para los indicadores de calidad.

Categoría de

Indicador

Prueba

Porcentaje

(completos,

confiables o

consistentes)

Número de

casos por millón

(incompletos,

no-confiables o

inconsistentes)

Nombre Atributo

Completitud Q-D001: Completitud

de información de

afiliados

Nombre 100% 0

Sexo 100% 0

Fecha de

nacimiento

100% 0

Fecha de

afiliación

99.79% 2.083

Q-D002: Completitud

de información de

aportantes

Razón social 96.04% 39.503

Naturaleza 48.4% 515.927

Plantilla 12. Diagnóstico de calidad [23]

278

Anexo N° 8 Proyectos en marcha para el mejoramiento de la calidad de

información

Secuen

cia

Tema Detalle Volumen

Aproximado

Avance

1 IDENTIFICACIÓN

DE

APORTANTES

TIPO

AGREMIACIÓN

Marcar en Sabass aquellos

aportantes tipo agremiación o

cooperativas

No disponible 10%

2 CRUCE DE

TRASLADOS

INGRESOS Y

EGRESOS ISS –

ASOFONDOS

Procesamiento de información

enviada por Asofondos para que

el ISS evalúe los resultados y

envíe respuesta

No disponible 25%

3 NOVEDAD 911 Posibilidad de utilizar información

de Asofondos proveniente de los

fondos de cesantías, para

actualizar datos de empleadores,

afiliados y relación laboral

No disponible 12%

4 MARCACIÓN DE

PENSIONADOS

DE OTRAS

AFP’S

Posibilidad de utilizar información

de Asofondos sobre pensionados

de otras administradoras para

actualizar bases de datos del ISS

No disponible 15%

5 RELACIONES

LABORALES

INCONSISTENTES

Revisar los casos en que los

registros de la tabla

RelacionSeguro no tienen un

registro correspondiente en

RelacionLaboral.

No disponible 0%

6 DATOS

INCONSISTENTES

EN UBICACIÓN

DEL AFILIADO

Se pretende corregir información

de dirección y teléfono para

afiliados que tengan esos campos

nulos, con menos de 2 caracteres

o con un código especial

A Septiembre

30, 2010,

quedaban cerca

de 1.5 millones

de registros con

esta

93%

279

Secuen

cia

Tema Detalle Volumen

Aproximado

Avance

información

inválida

7 NOVEDADES EN

LÍNEA

Proyecto para incluir nuevas

funcionalidades en los servicios

en línea

No disponible 95%

8 FECHAS DE

RETIRO

MENORES A

FECHAS DE

INGRESO EN

RELACIÓN

SEGURO

Inconsistencia de información. 357,313

registros

0%

9 ALTO RIESGO Incluir la información de alto

riesgo en el formulario de

afiliación, así mismo generar los

cambios necesarios para su

procesamiento

No disponible 50%

10 AFILIADOS

REPETIDOS

Esto para atender estadísticas de

la contraloría (menos de 2,000

casos), sin embargo la búsqueda

en la base de datos produjo cero

resultados

Cero 0%

11 FECHAS DE

VINCULACIÓN

INCONSISTENTES

Corrección de fecha de

vinculación para aquellos casos

en que esta fecha es menor a la

del inicio del sistema o posterior a

la fecha actual

118.017

registros

corregidos.

39,181 registros

pendientes de

corrección

100%

12 CAMBIO DE

TIPO Y NÚMERO

DE

DOCUMENTO

PARA

Cambios en los aplicativos para

uso de tipo y número de

identificación del afiliado, puesto

en producción en septiembre

2010

Todos los

registros de la

BD

100%

280

Secuen

cia

Tema Detalle Volumen

Aproximado

Avance

AFILIADOS

13 ACTUALIZACIÓN

DE FECHAS DE

NACIMIENTO

INCONSISTENTES

Proceso de corrección de

información de fechas de

nacimiento, utilizando información

provista por Ministerio de

Protección Social y Asofondos

Fechas de

nacimiento

nulas: 5.270

Fechas de

nacimiento año

1900 y antes:

3.121

Fechas de

nacimiento

mayor o igual a

la fecha de

vinculación:

427

Fecha de

nacimiento

superior a la

fecha actual: 7

70%

14 ACTUALIZACIÓN

DE NOMBRES Y

APELLIDOS

INCONSISTENTES

Proceso de corrección de

nombres usando fuentes

provistas por Asofondos, BD de

recaudo y Registraduría

Menos de 8,000

registros aún

tienen algún

tipo de

inconsistencia

80%

15 FECHAS DE

INGRESO NULAS

TABLA

RELACIONSEGUR

O

Corrección de información

inconsistente en tabla relación

seguro. Proceso extrae

información de recaudo y autol

para generar la fecha de ingreso

Antes del

proceso

existían

5.301.335

registros con el

problema en

tabla relación

seguro

Se depuraron

92%

281

Secuen

cia

Tema Detalle Volumen

Aproximado

Avance

528,997

registros

16 MARCACIÓN DE

COMITÉS DE

MULTIVINCULAD

OS EN SABASS

Marcar registros que son

multiafiliados

Se procesaron

1,909 registros

de los cuales

864 fueron

marcados, los

demás tienen

glosas

90%

17 AFILIADOS

FALLECIDOS

Proceso para corregir procesos

de creación que ingresaba los

registros con estado fallecido

No disponible 90%

18 NÚMEROS DE

DOCUMENTO

ALFANUMÉRICO

S PARA

AFILIADOS Y

APORTANTES

Adecuar lo necesario para

guardar números de identificación

que efectivamente contienen

caracteres alfanuméricos

No disponible 5%

19 APORTANTES

CON TIPO DE

DOCUMENTO

NIT, NÚMERO

DE

DOCUMENTO <>

9 DÍGITOS Y

FUERA DE LAS

SERIES 800 A

900

Corrección de esta anomalía 14,391 registros

candidatos a

ser cambiados

90%

20 DEPURACIÓN DE

DEPARTAMENTOS

Y MUNICIPIOS

INCONSISTENTES

Corrección de municipios que

desaparecieron de DIVIPOLA o

que fueron creados últimamente

Numero bajo de

registros

cambiados,

esta tabla es

100%

282

Secuen

cia

Tema Detalle Volumen

Aproximado

Avance

muy pequeña

21 RAZÓN SOCIAL

DEL

APORTANTE

CON

CARACTERES

ESPECIALES

Reemplazar caracteres

especiales en la columna razón

social

En Oct/2009 se

hizo corrección

de 1.807

registros, sin

embargo en

sept 30, 2010 el

conteo de

registros con el

defecto fue de

212,580

100%

22 TIPO

AFILIACIÓN

NULA O VACÍA

TABLA

RELACIÓN

LABORAL

Corregir columna tipo de afiliación

(rl_tipoAfiliacion)

Se corrigieron

12.157.592

registros, sin

embargo

898.965

registros no

existen en tabla

RelacionSeguro

100%

23 TIPO AFILIADO

(BENEFICIARIO)

INCONSISTENTE

TABLA AFILIADO

SEGURO

Se descubrió un error en un

programa que actualiza esta

información, se hizo corrección de

la columna afectada

5,416 registros 100%

24 IDENTIFICACIÓN

DE

APORTANTES

DE

NATURALEZA

PÚBLICA

A partir de un archivo se

marcaron los aportantes de

naturaleza pública

De 4,414

registros en el

archivo de

entrada se

modificaron

1296 en Sabass

100%

25 CAMBIOS DE

ESTADO DE LOS

AFILIADOS

Procesos sucesivos se han

ejecutado a lo largo del tiempo

813,145

afiliados

marcados en la

98%

283

Secuen

cia

Tema Detalle Volumen

Aproximado

Avance

BD histórica de

pensiones

26 RÉGIMEN

SUBSIDIADO

Conjunto de actividades

tendientes a mejorar la calidad de

los datos de los afiliados a

régimen subsidiado

Totales por

diferentes

actividades

62%

27 MULTIVINCULAD

OS EN

PENSIONES

(decr 3995 /

2008)

Utilizando información

proveniente de Asofondos, se

ejecutaron varios procesos para

actualizar la pertenencia de los

afiliados a las diferentes

administradoras

Totales por

diferentes

actividades

100%

28 TRASLADOS

INGRESOS

Este proceso a cargo de SyC

utiliza información entregada por

Asofondos para marcar los

registros de traslados ingresos,

sin embargo la mayor parte de la

información resulto rechazada en

el proceso

14,691

registros

entregados por

Asofondos, 6

registros

actualizados en

la BD

75%

29 TRASLADOS

EGRESOS

Este proceso a cargo de SyC

utiliza información entregada por

Asofondos para marcar los

registros de traslados egresos

No disponible 65%

30 CONTINUIDAD

PATRONAL NIT

Crear relaciones seguro y

relaciones laborales

4,033 registros

procesados

hasta antes del

procesos de

septiembre

2010

90%

31 RUAF /

CIRCULAR 040

Este no es un proceso de

depuración

89%

32 AFILIADOS

BORRADOS

Se desarrolló este proceso para

corregir situación creada por mal

206,761

registros

90%

284

Secuen

cia

Tema Detalle Volumen

Aproximado

Avance

funcionamiento de un software recuperados

33 BORRADO DE

INFORMACIÓN

DE EPS

Este no es un proceso de

depuración

90%

34 BORRADO DE

INFORMACIÓN

DE ARP

Este no es un proceso de

depuración

85%

35 CONVENIO DE

ACTUALIZACIÓN

BASE DE DATOS

REGISTRADURÍ

A

Este no es un proceso de

depuración

100%

36 AFILIADOS

CAJANAL

Incorporación en las BD del ISS

de los afiliados enviados por

Cajanal.

100%

37 COLOMBIANOS

EN EL

EXTERIOR

Este no es un proceso de

depuración

100%

38 ACTUALIZACIÓN

DE NOVEDADES

DE PÁGINA WEB

Este no es un proceso de

depuración

100%


Recommended