+ All Categories
Home > Documents > Soluciones de búsqueda para empresas Incorporaci de …static.googleusercontent.com/media/ ·...

Soluciones de búsqueda para empresas Incorporaci de …static.googleusercontent.com/media/ ·...

Date post: 03-Sep-2020
Category:
Upload: others
View: 0 times
Download: 0 times
Share this document with a friend
10
PUNTO DE VISTA Soluciones de búsqueda para empresas Incorporación de soluciones de búsqueda en la arquitectura de TI
Transcript
Page 1: Soluciones de búsqueda para empresas Incorporaci de …static.googleusercontent.com/media/ · 2019. 10. 3. · departamentos, la empresa e Internet para localizar información prometen

PUNTO DE VISTA

Soluciones de búsqueda para empresas

Incorporaci ónde solucionesde búsquedaen laarquitecturade TI

Page 2: Soluciones de búsqueda para empresas Incorporaci de …static.googleusercontent.com/media/ · 2019. 10. 3. · departamentos, la empresa e Internet para localizar información prometen

PUNTO DE VISTA

Sol uciones de búsqueda para emp resas

Las soluciones de búsqueda paraempresas pueden ser de gran ayudapara la productividad y el rendimiento dela organización, siempre y cuando seimplementen de forma efectiva y eficiente.INTRODUCCIÓN: IMPORTANCIA DE LA ARQUITECTURALas soluciones de búsqueda para empresas están emergiendo como herramientas degrandes prestaciones que ayudan a las organizaciones a conseguir un objetivouniversal: optimizar el uso de la información.

Las soluciones de búsqueda de varios niveles que exploran el escritorio, losdepartamentos, la empresa e Internet para localizar información prometen impulsar laproductividad e incrementar la efectividad de la organización. Estas soluciones ofrecenun método para vencer los principales obstáculos con los que se enfrentan lasorganizaciones hoy en día: depósitos redundantes de datos idénticos, distintos métodosde recuperación y la falta de definiciones semánticas coherentes en la empresa. Estassoluciones también pueden ayudar a cumplir las expectativas de crecimiento de lostrabajadores, si los métodos de búsqueda de los sistemas de la empresa son tansencillos y fáciles de utilizar como el software y los servicios de Internet.

Uno de los aspectos clave para beneficiarse de los sistemas de búsqueda en toda laempresa es integrar de forma efectiva la solución de búsqueda con otros sistemasde tecnología de la organización. BearingPoint ha identificado los principios clave delas soluciones de búsqueda de las organizaciones y, a partir de ello, ha desarrolladouna arquitectura recomendada para la correcta implementación de las mismas.

PRINCIPIOS DE LAS FUNCIONES DE BÚSQUEDA EN TODA LA ORGANIZACIÓNSon varios los principios generales que dictan el desarrollo de la arquitectura de lassoluciones de búsqueda:

Simplicidad. El principio operativo del sistema de búsqueda de la organización esdisponer de sistemas y soluciones simples. La complejidad inhibe la productividad de losdesarrolladores de software, dificulta la planificación, creación y verificación de losproductos, genera retos de seguridad y provoca la frustración de usuarios finales yadministradores. Las tecnologías informáticas y de comunicación han evolucionado hastatal punto que es factible disponer de un modelo de servicios. Un software de serviciosmejorado y el desarrollo de soluciones de búsqueda más simples dan respuesta a lademanda de los usuarios de soluciones integradas y convincentes que funcionen.

Funcionalidad. Por orden de prioridad, la arquitectura de la solución de búsqueda debepresentar las siguientes características: ser manejable, fiable, segura, ampliable (entérminos de usuarios, volúmenes de mensajería y servicios) y poder crecer de formaindependiente mediante la adición de nuevos servicios proporcionados por lainfraestructura de la solución de búsqueda.

PERSPECTIVA:

INTRODUCCIÓN: IMPORTANCIA DE LAARQUITECTURA 1

PRINCIPIOS DE LAS FUNCIONES DEBÚSQUEDA EN TODA LAORGANIZACIÓN 1

DIRECTRICES DE FUNCIONAMIENTOPARA EL DESARROLLO DE SOLUCIONES 2

ARQUITECTURA DE LA SOLUCIÓN DEBÚSQUEDA 3

Arquitectura conceptual 4

Ejemplo de arquitectura de la soluciónde búsqueda 4

OPORTUNIDAD DE LA SOLUCIÓN DEBÚSQUEDA 8

Page 3: Soluciones de búsqueda para empresas Incorporaci de …static.googleusercontent.com/media/ · 2019. 10. 3. · departamentos, la empresa e Internet para localizar información prometen

PUNTO DE VISTASoluciones de búsqueda para empres as

Fiabilidad. La plataforma de la solución de búsquedadebe ser una infraestructura sólida y, por consiguiente,debe evitar el uso de tecnologías no consolidadas.Como norma general, en su arquitectura principalutilizará una tecnología que:

• Ofrezca la posibilidad de ser utilizada en cualquierentorno.

• Haya sido probada y sea fiable en otros escenariosde uso comparables.

Exigencia. Una solución de búsqueda para empresasdebe considerarse como un componente crucial parala empresa que sea muy seguro, pueda ampliarse yesté disponible las 24 horas del día, 7 días a lasemana. La arquitectura de la estructura principal dela solución de búsqueda debe diseñarse teniendo encuenta estos atributos.

Accesibilidad. A fin de permitir un amplio uso, laarquitectura de la solución de búsqueda debe estardiseñada para un uso intenso. Esta capacidad debetenerse en cuenta desde que se empieza a diseñar laarquitectura, ya que luego no es factible introduciruna funcionalidad de este tipo.

Flexibilidad. El concepto de servicio flexible es laclave del éxito para toda solución de búsqueda. Nonos referimos a un servicio de usuario final, sino aservicios que constituyen unidades diferenciadas defuncionalidad disponibles en la plataforma debúsqueda a través de interfaces definidas.

DIRECTRICES DE FUNCIONAMIENTO PARA ELDESARROLLO DE SOLUCIONESPartiendo de los principios anteriores, la arquitecturade la solución de búsqueda debe ceñirse a lasdirectrices siguientes:

Estándares abiertos, tecnología abierta einterfaces comunes. La solución de búsqueda debebasarse en estándares abiertos, tales como serviciosweb, J2EE y .NET, que permitan mantener laindependencia de la tecnología. Gracias a ello, lasolución es más flexible, se evita que debanrealizarse cambios en la interfaz al modificar otrainterfaz de la aplicación y se oculta la complejidad dela conectividad de la API (interfaz de programaciónde aplicaciones) entre sistemas y aplicacionesrelacionados.

Arquitectura modular. La solución de búsqueda sefundamenta en una arquitectura basada encomponentes y de múltiples niveles. Este enfoquepermite la abstracción de cada nivel y para cadacomponente, de modo que los componentes sonindependientes y la funcionalidad se divide de formalógica. La arquitectura debe ser flexible y muy granular.

Interoperabilidad. El uso de XML (lenguaje de marcasextensible) y de XSLT (transformación del lenguaje dehojas de estilo extensible) crea interoperabilidad yproporciona una abstracción que separa el dominio depresentación de la lógica subyacente. Dividir lapresentación en un subnivel de presentación y un subnivelde interfaz de presentación permite aislar la lógica depresentación. Para conseguir la interoperabilidad, laarquitectura se basa en la independencia de losdispositivos, las plataformas y las tecnologías.

Administración de metadatos. La administración delos metadatos hace posible la creación, elalmacenamiento, el acceso, la antigüedad y elmantenimiento de contenido de metadatos, incluido elcontrol y la sincronización de los metadatoscompartidos. La administración de los metadatos de laempresa permite a la organización:

• Automatizar la asignación de metadatos a contenidoexistente. Esto hace posible que las búsquedas seanmás efectivas, porque se realizan en los activos decontenido correctos, independientemente de suubicación.

• Desarrollar una capacidad para asociar fácilmentemetadatos con activos de contenido que se encuentrenlo más cerca posible a su fecha de creación.

• Establecer una administración organizativa clarapara el desarrollo y la gestión continuada detaxonomías y de listas de autoridad.

• Implementar procesos para mantener las taxonomíasactualizadas y auditar asociaciones de metadatos.

• Obtener distintas vistas del mismo contenido, porejemplo, por rol, tiempo y proceso.

• Integrar fuentes de contenido. La solución debúsqueda debe tener una arquitectura abierta quepermita la integración de varias fuentes de contenido.Para que una plataforma funcione sin problemas, espreciso disponer de estándares abiertos,especialmente en relación con la interoperabilidadde varias fuentes de contenido.

2

Page 4: Soluciones de búsqueda para empresas Incorporaci de …static.googleusercontent.com/media/ · 2019. 10. 3. · departamentos, la empresa e Internet para localizar información prometen

PUNTO DE VISTA

Sol uciones de búsqueda para emp resas

Las soluciones de búsqueda devarios niveles ofrecen un métodopara vencer los principalesobstáculos con los que se enfrentanlas organizaciones hoy en día.Seguridad. Una solución de búsqueda para empresasdebería abarcar y ampliar los principios de seguridadasociados con las distintas fuentes de contenido de laempresa. Es necesario aplicar los principios deautenticación, autorización, auditoría y administraciónde identidades de modo que únicamente los usuariosapropiados puedan acceder a información privilegiada.La seguridad de la solución de búsqueda debe cumplirla política de seguridad de la empresa y los requisitosreguladores. En algunos casos, para poder hacer unuso efectivo del contenido no estructurado, seprecisará seguridad en el nivel de documento.

Infraestructura de la red. La implementación de lasolución debe tener en cuenta el impacto en lainfraestructura de la red y la organización a la que dasoporte dicha infraestructura. En el caso de búsquedasen toda la organización, debe tenerse en cuenta laubicación de los datos buscados, la posibilidad de quepersonas externas a la organización utilicen lafuncionalidad de búsqueda, la seguridad y elrendimiento general.

A continuación, se indican consideraciones y directricesgenerales sobre el diseño de la red:

• ¿Cuánto tráfico generará la búsqueda en la red de laempresa y en los segmentos asociados? El diseñoestará regido por el número de fuentes de datos quedeba explorarse, la ubicación de dichas fuentes dedatos y el tipo de infraestructura de red implementada.

• ¿Dónde reside la base de usuarios para la soluciónde búsqueda: en el mismo edificio, en un campusdistinto o en una red de área amplia (WAN)?

• ¿Se ha clasificado el tráfico de la red? Es muyimportante tener en cuenta la clasificación deltráfico en un entorno en el que se lleva a cabola réplica de datos de la red de área dealmacenamiento (SAN), como Symmetrix RemoteData Facility (SRDF). La organización debe tener encuenta el impacto de las búsquedas en la red ydeterminar políticas adecuadas de segmentación de lared e implementaciones de calidad de servicio (QoS).

• ¿De qué tipo de control de acceso dispone la red?En muchas implementaciones, la solución debúsqueda se utilizará para acceder y servir datosde propiedad y confidenciales, por lo que escrucial que la implementación sea la correcta.Debe tenerse en cuenta una segmentacióncorrecta de la red, el diseño de la VLAN (red deárea local virtual), la implementación decortafuegos y el acceso a la red.

• ¿Qué tipo de resistencia de red se precisa?Teniendo en cuenta que la solución de búsquedase utiliza en el departamento financiero, en eldepartamento de recursos humanos y en otrosdepartamentos de gestión, se considera que esuna aplicación fundamental que debe estarsiempre disponible. Para conseguirlo, la soluciónde búsqueda se suele implementar a modo declúster, con opciones de recuperación de erroresen uno o varios sitios.

Recuperación tras fallos y continuidad de la empresa.A fin de poder cumplir con los principios de recuperacióntras fallos y de continuidad de la empresa, se requiereredundancia de hardware y de software con el fin deminimizar los puntos de error. La filosofía de diseñogeneral consiste en utilizar componentes redundantespara crear una infraestructura redundante,incrementando así la capacidad de recuperación trasfallos de componentes individuales y mejorando ladisponibilidad del sistema para procesos y usuarios tantointernos como externos.

ARQUITECTURA DE LA SOLUCIÓN DE BÚSQUEDAEl concepto de arquitectura para las búsquedas entoda la organización es un sistema robusto para darrespuesta a los objetivos de la empresa. Elconcepto pasa a ser una realidad en forma dearquitectura de empresa modular y de n nivelesque cumple los estándares y los principiosindicados anteriormente. Puede dar soporte a unasolución de búsqueda que dé respuesta a lasnecesidades actuales de la empresa, permita elcrecimiento, crezca al mismo ritmo que el mercadoy reduzca el coste total de propiedad (TCO).

3

Page 5: Soluciones de búsqueda para empresas Incorporaci de …static.googleusercontent.com/media/ · 2019. 10. 3. · departamentos, la empresa e Internet para localizar información prometen

PUNTO DE VISTASoluciones de búsqueda para empres as

Arquitectura conceptualEn la ilustración 1 se describe la arquitecturaconceptual de la solución de búsqueda.

Los componentes de la arquitectura conceptual sonlos siguientes:

Fuentes de contenido. Las fuentes de contenidoincluyen la intranet de la empresa, sitios web,servidores de archivos, sistemas de administración decontenido, como Documentum y FileNet, yaplicaciones empresariales que abarcan todos lossistemas de operaciones, incluyendo la administraciónde las relaciones de clientes (CRM), la administraciónde la cadena de suministro (SCM) y la planificación derecursos de la empresa (ERP). Básicamente, estebloque representa los distintos sistemas dentro de laempresa que podrían servir como fuentes decontenido sobre las que los usuarios podrían realizarbúsquedas.

Servicios de conectividad. El nivel de servicios deconectividad proporciona los adaptadores básicos paralas fuentes de contenido subyacentes. Esta capaincluirá dos tipos de adaptadores: conectores y accesofederado. Los conectores estipulan la creación deadaptadores de distintas tecnologías necesarios paraestablecer una conexión con las fuentes de contenido.Los conectores de acceso federado proporcionan laconexión al contenido de terceros.

Ilustración 1. Arquitectura conceptual de la solución de búsqueda

Servicios de metadatos. El nivel de servicios demetadatos proporciona servicios de valor añadidopara el contenido. Ofrece dos tipos de servicio:correlación de metadatos y correlación dediccionarios de datos. Los servicios de correlación demetadatos ayudan a definir los datos de la empresaentre distintos sistemas. También proporcionan unaúnica correlación entre elementos comunes a travésde la creación del diccionario de datos de la empresaen varios sistemas. El diccionario de datos de laempresa está representado por un conjunto dedefiniciones de metadatos y de representaciones deel em ent os de datos .

Acceso federado. El ni vel de acc eso f ederadoproporciona la creación de intermediarios deconsulta que pueden obtener información desistemas de operaciones subyacentes. Para poderacceder a los datos de la empresa, es preciso crearun índice universal de la semántica relacionada.

Ejemplo de arquitectura de la solución de búsquedaEn la ilustración 2 se describe un ejemplo dearquitectura de la solución de búsqueda derivada dela arquitectura conceptual anterior.

La arquitectura tiene los siguientes niveles:

Interfaz de usuarioÉste es el nivel de interacción del usuario quecontrola las interacciones de los usuarios a través deun explorador web o incluso de un dispositivo portátil.Este nivel presenta a los usuarios pantallas y datosasociados.

La interfaz de usuario es una interfaz basada en XMLque se crea de forma dinámica en el nivel de laaplicación. En función del dispositivo de consulta, seofrecerá la presentación apropiada mediantearchivos XSLT. De este modo, se separa lapresentación del contenido y se dividen claramentelas responsabilidades. Este nivel también estáestrechamente vinculado con los componentes deseguridad de autorización y autenticación, con el finde que los resultados de búsqueda se muestren apersonas que cuenten con la autorización necesariapara verlos.

Los aspectos clave que deben tenerse en cuenta paramejorar la capacidad de uso de la solución debúsqueda incluyen la presentación basada en roles,modos de visualización, de edición y ayuda contextual,y paginación de los resultados de búsqueda.

4

4

Page 6: Soluciones de búsqueda para empresas Incorporaci de …static.googleusercontent.com/media/ · 2019. 10. 3. · departamentos, la empresa e Internet para localizar información prometen

PUNTO DE VISTA

Sol uciones de búsqueda para emp resas

Ilustrac ión 2. Ej emplo d e arquit ect ura d e la s olución de b úsquedalas características de seguridad necesarias paralos agentes de información de seguridad. Enlugar de ello, el método de implementaciónrecomendado consiste en tener adaptadores quepuedan transferir la consulta al catálogo decontenido básico en nombre de la persona queemite la consulta.

• Agrupador de resultados. Este dominio recopilalos resultados de distintos catálogos que coincidencon la consulta y los presenta al usuario. Losresultados deben incluir la capacidad deproporcionar comentarios en cualquiera de losresultados mostrados, deducciones para pasar deuna consulta de búsqueda a otra y la capacidad deaplicar de nuevo una búsqueda por facetas ocategorías al motor de búsqueda.

Motor de búsquedaEl motor de búsqueda es un producto de hardware osoftware que proporciona, a través de un cuadro, lasfuncionalidades de búsqueda de la organización. Seespera que pueda realizar búsquedas en cientos deformatos de archivos distintos en cualquier lenguajey que sea capaz de indexar millones de documentos.Debe disponer de funciones de seguridad con el finde garantizar que los usuarios sólo ven losdocumentos que están autorizados a consultar.

Las funciones principales del motor de búsquedadeben ser las siguientes (véase la ilustración 3):

Un entorno empresarial típico cuenta con variosalmacenes de documentos y de contenido web en losconfines de la intranet. Dentro de estos almacenes seutilizan varias tecnologías para llevar a cabo elalojamiento real del contenido. El alojamiento incluyemecanismos de seguridad inherentes, catálogos deíndices individuales y almacenes de procesamientodel contenido propiamente dicho. La arquitectura dela solución de búsqueda debe proporcionarcapacidades dentro de tres dominios:

• Procesador de consultas. El procesador deconsultas es un servicio central al que puedellamarse desde distintos lugares. Su trabajo consisteen desglosar la consulta, validar la ortografía,traducir a idiomas alternativos, identificar sinónimos,conceptos y el tipo de consulta más apropiado parael almacén de contenido asociado; por ejemplo,palabra clave, concepto, booleano y texto completo.

• Public ación. Esta función pr oporciona una i nt erfaz debúsqueda estándar que, de forma predeterminada, puedepresentarse desde el motor de búsqueda. Esta interfaz debepersonalizarse para modificar la hoja de estilo XSLTsubyacente. Otras funciones, como la concordancia depalabras clave, sinónimos y filtros, pueden ayudar apromocionar páginas web específicas como parte de losresultados de búsqueda. La función de sinónimos sugierepalabras o frases alternativas para las consultas de búsqueda.Otras funciones crean depósitos de información lógicadenominados “colecciones”, que ayudan a satisfacer lasnecesidades de búsqueda de los usuarios.

Ilustrac ión 3. Funcionalid ad del m otor de bús queda

• Adaptador de catálogo. Los adaptadores decatálogo proporcionan el contrato de integraciónentre la consulta inicial y los catálogos del índice decontenido de procesamiento. Una única capacidaddel índice en todos los almacenes de contenido noproporcionará 5

Page 7: Soluciones de búsqueda para empresas Incorporaci de …static.googleusercontent.com/media/ · 2019. 10. 3. · departamentos, la empresa e Internet para localizar información prometen

PUNTO DE VISTASoluciones de búsqueda para empres as

• Rastreo. Los rastreadores son agentes que solicitan yrecuperan documentos de servidores web para laindexación automática. El rastreo de datos puederealizarse según dos métodos: descubrimiento de datosy recuperación de datos. Una interfaz de configuraciónpermite rastrear distintas fuentes de datos. Todo elcontenido se agrega para crear un índice maestro, quese actualiza con cada nuevo rastreo.

El rastreo puede considerase como un proceso de trespasos: descubrimiento inicial (nuevas URL por rastrear),indexación y rastreo continuado. Cada uno de losdocumentos nuevos que detecta el rastreador seexplora para detectar vínculos. Éstos bien se recopilande forma inmediata o bien se programa su recuperaciónposterior. El rastreador trata sin problemas contenidoprotegido y gestiona las comunicaciones del protocolode transferencia de hipertexto seguro (S-HTTP, SecureHypertext Transfer Protocol). El rastreador del motor debúsqueda puede gestionar la autenticación básica, laautenticación NTLM (NT LAN Manager) y el accesobasado en formularios y cookies personalizadas. Elmotor debería rastrear el contenido de las bases dedatos Oracle, SQL Server, mySQL, IBM DB2 y Sybase.En caso de que el rastreador no pueda acceder a untipo de datos, éste puede pasarse directamente al motorde búsqueda en formato XML.

• Indexación. Para indexar los datos, pueden utilizarsevarios métodos:

– Un feed de datos para el sistema de búsquedamediante adaptadores estándar o personalizados.

– Acceso directo desde el sistema de búsqueda (eladaptador estándar suministrado con el sistema es elúnico que puede acceder directamente a los datos).

– Documentos que pueden rastrearse, pero queno tienen vínculos en el sitio web y quepermiten al rastreador descubrirlos durante unnuevo rastreo.

– Documentos que pueden rastrearse, peroque, debido a problemas del servidor web ode la red, se suben con mayor rapidez si seutilizan feeds.

Los feeds pueden ser de distintos tipos:

– Feeds de contenido: contienen direccionesURL y su contenido. También pueden contenermetadatos, como la fecha de la últimamodificación del registro. En un feed de estetipo puede especificarse cualquier nombre defuente de datos.

– Feeds de web: en este tipo de feeds, cadauno de los registros contiene direcciones URL,pero no contenido. Estas direcciones URLpueden rastrearse de la forma habitual. En losfeeds de este tipo, el término “web” se utilizacomo nombre de la fuente de datos. Todas lasdirecciones URL deben contener un nombrede dominio totalmente calificado (FQDN) en elfragmento de la dirección URL quecorresponde al nombre del host.

– Feeds de base de datos: pueden crearseconectores personalizados con el fin depromocionar registros de la base de datospara crear un índice.

El proceso de configuración de los feeds del motorde búsqueda se muestra en la ilustración 4.

Ilustración 4. API de suministro de contenido de la búsqueda– Feeds de datos HTTP o que no sean HTTP.

• Feeds. La mejor forma de pasar ciertos tipos dedocumento al motor de base de datos es mediantefeeds, en lugar de encontrarlos a través de vínculosen las páginas web rastreadas. Estos tipos dedocumento son los siguientes:

– Documentos que no pueden obtenerse medianteel rastreador. Por ejemplo, registros de una basede datos o archivos de un sistema que no esténhabilitados para la web.

– Documentos que pueden rastrearse, pero quees mejor rastrearlos de nuevo a horas distintasde las establecidas por el programador derastreo automático que se ejecuta en el motor.

1 El guión exporta datos en formato XML para generar elarchivo de feed.

2 El guión publica el archivo XML en el motor de búsqueda.3 El motor de búsqueda importa el archivo XML e indexa el

contenido.6

Page 8: Soluciones de búsqueda para empresas Incorporaci de …static.googleusercontent.com/media/ · 2019. 10. 3. · departamentos, la empresa e Internet para localizar información prometen

PUNTO DE VISTA

Sol uciones de búsqueda para emp resas

• Seguridad en el motor de búsqueda. El motor debúsqueda debería incrementar el sistema deseguridad de la empresa. Debe ejecutar todos losservicios detrás de un cortafuegos, abriendosolamente algunos puertos para permitir lacomunicación con el motor a través de éste. El motorde búsqueda rastrea e indexa tanto documentospúblicos como confidenciales. Un paquete deseguridad opcional aplica las políticas de seguridadde nivel de documento de la empresa.

La entrega del conjunto de resultados correcto acualquier usuario se basa en el filtrado de losresultados del índice en el que se ha realizado labúsqueda. El contenido se divide en dos categorías:contenido público y todo el contenido. Los usuariospueden realizar búsquedas en el contenido públicoúnicamente o en los documentos públicos y losprotegidos del índice, según especifique eladministrador del índice. De forma predeterminada, elcontenido permanece protegido de modo que losusuarios que no tengan acceso no verán ningúncontenido para el que no dispongan de autorización.

El motor de búsqueda deberá dar soporte a laautenticación básica y NTML (NT LAN Manager), asícomo a la autenticación basada en formularios, ygestionará cada uno de estos protocolos deaut ent icació n de f orma di sti nta l o requi ere que eladministrador lo configure de forma diferente. Cadamétodo puede rastrear e indexar los documentosprotegidos de los sitios de intranet y puede realizaruna autenticación en las búsquedas realizadas endichos documentos.

Una API de autorización de búsqueda permite a unservicio web realizar la conversión entre la API deautorización del motor de búsqueda y el servidor de laempresa que proporciona los servicios de control deacceso, conocido como conector de acceso (CA). ElCA actúa como una capa entre el motor de búsqueday el sistema de control de acceso de la organización.

• Subir el XML en el motor de búsqueda mediante el protocoloHTTP.

Este nivel forma la estructura básica subyacente paraexponer información a través de la empresaindependientemente del formato del almacenamiento ode la fuente de datos. Por consiguiente, este nivelpermite establecer una correlación entre servicios yadaptadores de integración creados a partir de distintasfuentes de datos.

Los metadatos definidos en este nivel también podríanproporcionar la infraestructura necesaria paraconsolidar la información entre distintas fuentes dedatos de la empresa. Generalmente, esto tambiénpermite descubrir y recuperar con rapidez los elementosque coinciden en el nivel semántico. Por consiguiente,un metamodelo unificado establece definiciones demetadatos coherentes y correctas en el nivel contextualpara consolidar los distintos tipos de información.También mejora los resultados de la búsqueda coninformación de vínculos controlados por el contexto adatos estructurados y aplicaciones empresariales.

Fuentes y tipos de informaciónActualmente es posible encontrar información encualquier lugar de una empresa. La información estádisponible en formatos estructurados o no estructurados,en depósitos de propiedad o de terceros (véase la tabla1). Los motores de búsqueda pueden buscarinformación que puede indexarse para facilitar surecuperación y para que los resultados de la búsquedasean relevantes. Por consiguiente, es muy importanteclasificar las fuentes de datos del mismo modo y luegoutilizar los mecanismos de recuperación apropiados.

Tabla 1. Fuentes y tipos de información

Biblioteca de conectoresEsta capa de software forma el nivel de mensajes o deacceso a distintas fuentes de datos de una empresa,que pueden ser desde fuentes de datos estructuradoshasta aplicaciones empresariales. Generalmente, paraintegrar las fuentes de datos, se crea una plataformade integración, conectores personalizados oadaptadores.

Los conectores personalizados también puedencrearse siguiendo estos pasos:

• Convertir los datos en XML en el formatoespecificado en el feed del motor de búsqueda.

Estructurado

Noestructurado

Sistemas de gestión de bases dedatos(Oracle, SQL Server, Sybase,Informix)

Sistemas de gestión dedocumentos(Documentum, FileNet,etc.)

Aplicaciones empresariales, comoERP y CRM

Sistemas de archivos dered/sistemas de archivos

Documentos de Microsoft Office

Archivos de imagen, vídeo y audio

Sistemas de administraciónde bases de datos (mySQL)

Documentos de Open OfficeSistemas de archivos /servidor de archivos Archivosde texto

Correo electrónico

DE PROPIEDAD NO DE PRO P IEDAD

7

Page 9: Soluciones de búsqueda para empresas Incorporaci de …static.googleusercontent.com/media/ · 2019. 10. 3. · departamentos, la empresa e Internet para localizar información prometen

PUNTO DE VISTASoluciones de búsqueda para empres as

Estructurado frente a no estructurado. La diferenciaprincipal entre información estructurada y noestructurada es un modelo de información predefinido.La analogía más sencilla para la informaciónestructurada son datos que puedan presentarse en unformato predefinido como HTML o datos que puedaninsertarse en una tabla, como ocurre con la tecnologíade bases de datos. Otra forma de ver la informaciónestructurada es en términos de metadatos, es decir,información acerca de información. Por otro lado, losdatos no estructurados no tienen ningún formatopredefinido y, por consiguiente, existen en formulariosde flujo libre. Como ejemplos de este tipo de datoscabe citar los archivos de texto y los documentos PDF.En la información no estructurada, el tipo de búsqueda,en términos de las herramientas que se utilizan comosolución, supone un problema de recuperación de lainformación.

Depósitos de propiedad frente a depósitos deterceros. Actualmente, la información de la empresaestá disponible en sistemas ERP, CRM y en sistemasde administración de conocimientos, así como enportales estáticos y dinámicos. Para poder recuperarinformación, algunos de estos sistemas proporcionanformatos de propiedad para publicar información.Algunos utilizan formatos que no son de propiedad,como XML, que cada vez va ganando más terreno.Asimismo, si bien el texto sigue dominando enmuchas aplicaciones, la importancia de otros tipos demedio, como imagen, audio y vídeo, aumenta a unritmo constante. En este caso, se requiere unacombinación eficiente de recuperación automática detexto, recuperación de metadatos (generalmentecreados de forma manual) y recuperación basada encontenido de datos multimedia.

OPORTUNIDAD DE LA SOLUCIÓN DE BÚSQUEDAUna solución de búsqueda para empresas puede ser elcatalizador para optimizar la productividad de losempleados y para poder contar con mayor informaciónen el proceso de toma de decisiones. No obstante,cualquier solución de búsqueda que se utilice en laempresa debe introducirse conociendo bien susrequisitos de arquitectura y sus capacidades. Paraoptimizar el uso de las características que ofrece unasolución de búsqueda, es muy importante planificarminuciosamente la arquitectura y su implementación.

Si desea obtener más información sobre la forma enque nuestras soluciones pueden aportar valorañadido a su empresa, hablemos.

ADMINISTRACIÓN GLOBAL Y CONSULTORÍA DETECNOLOGÍA PARA EL CONTEXTOEMPRESARIAL ACTUALBearingPoint es un proveedor líder en servicios deconsultoría tecnológica y gestión global para lascompañías Global 2000 y muchas de las compañíasde servicios públicos más importantes del mundo.Nuestros expertos ayudan a las empresas de todo elmundo a prepararse para conseguir sus objetivos ycrear valor empresarial. Al adaptar sus procesosempresariales a los sistemas de información, lesayudamos a adquirir una ventaja competitiva y aobtener resultados rápidamente. Para obtener másinformación, póngase en contacto con nosotros en elnúmero 1.866.661.FIND (+1.603.589.4089 si llamadesde fuera de Estados Unidos y Canadá) o visitenuestro sitio web en www.bearingpoint.com.

8

Page 10: Soluciones de búsqueda para empresas Incorporaci de …static.googleusercontent.com/media/ · 2019. 10. 3. · departamentos, la empresa e Internet para localizar información prometen

BearingPoint proporciona servicios de consultoríaestratégica, servicios de aplicaciones, solucionestecnológicas y servicios de gestión a las empresasGlobal 2000 y a entidades gubernamentales.

BearingPoint1676 International DriveMcLean, VA 22102www.bearingpoint.com

©2006 BearingPoint, Inc. Todos los derechos reservados. Impreso en los Estados Unidos.Todas las marcas comerciales y logotipos que aparecen en este documento son propiedad de sus respectivos propietarios. 0206 -01 –USRD705


Recommended