V Jornadas Técnicas de la IDE de EspañaJIDEE 2008
Búsquedas inteligentes de toponimiaFélix José Hernández
2V Jornadas Técnicas de la IDE de España ▪ IDE, Aplicaciones al Planeamiento y la Gestión del Territorio ▪ Tenerife 5-7 noviembre 2008
Los servicios IDE en MAPA, visor geográfico deCanariasG. Calzadilla
Conector WMS para MicrostationC.D. Hernández
Herramienta de consultaurbanísticaJ.M. Barbero, I. Esteban
Arquitectura de sistemasy comunicaciones deIDECanariasO. Felipe
Medición de Rendimientos de serviciosWMS con JMeterD. Daswani
Mejoras de rendimientoen la IDEJ. Rodrigo
Difusión deIDECanarias a través del estándar OpenGIS®KML EncondingStandardJ. Rosales
Monitor de estadísticasde IDECanariasD. Daswani
BBúúsquedas inteligentessquedas inteligentesde toponimiade toponimiaF. HernF. Hernáándezndez
Sistematización de PlaneamientoJ.M. Barbero, L. Sosa
3V Jornadas Técnicas de la IDE de España ▪ IDE, Aplicaciones al Planeamiento y la Gestión del Territorio ▪ Tenerife 5-7 noviembre 2008
Índice
• Objetivo• Antecedentes• Alcance• Requisitos• Solución tecnológica• Ejemplos• Conclusiones y líneas futuras
4V Jornadas Técnicas de la IDE de España ▪ IDE, Aplicaciones al Planeamiento y la Gestión del Territorio ▪ Tenerife 5-7 noviembre 2008
Objetivo - Antecedentes
• Mejorar la funcionalidad de búsqueda
5V Jornadas Técnicas de la IDE de España ▪ IDE, Aplicaciones al Planeamiento y la Gestión del Territorio ▪ Tenerife 5-7 noviembre 2008
Alcance
•Toponimia
–– RAERAE•• Estudio del origen y significaciEstudio del origen y significacióón n
de los nombres propios de lugar.de los nombres propios de lugar.
•• Conjunto de los nombres propios Conjunto de los nombres propios de lugar de un pade lugar de un paíís o de una s o de una regiregióón.n.
–– ‘‘ToponimiaToponimia’’ = Informaci= Informacióón n espacial con atributo de textoespacial con atributo de texto
6V Jornadas Técnicas de la IDE de España ▪ IDE, Aplicaciones al Planeamiento y la Gestión del Territorio ▪ Tenerife 5-7 noviembre 2008
Alcance I I
• Resumen por clasificación
• Resumen por islaIsla Num. elementos
El Hierro 5.942 La Gomera 18.560 Fuerteventura 25.418 La Palma 31.571 Lanzarote 43.139 Gran Canaria 170.197 Tenerife 242.257
537.084
Clasificación Num. elementosTérminos Municipales 87 Espacios Naturales Protegidos 146 Estudios Toponimia 2.164 ISTAC (Entidades - Núcleos) 3.620 Puntos de Interés 18.734 Mapa topográfico 1:5.000 63.181 Callejero (Portales - Viales) 449.152
537.084
7V Jornadas Técnicas de la IDE de España ▪ IDE, Aplicaciones al Planeamiento y la Gestión del Territorio ▪ Tenerife 5-7 noviembre 2008
Requisitos
1. Caja única de búsqueda2. Lenguaje natural3. Filtrado geográfico
–– A nivel de textoA nivel de texto
–– A nivel espacialA nivel espacial
4. Rendimiento
8V Jornadas Técnicas de la IDE de España ▪ IDE, Aplicaciones al Planeamiento y la Gestión del Territorio ▪ Tenerife 5-7 noviembre 2008
Solución tecnológica I
• Full-Text Search (FTS)
–– Integrado en el motor de base de datosIntegrado en el motor de base de datos
–– Gran volumen de datos (Gran volumen de datos (PDF, HTML, DOC, etc.PDF, HTML, DOC, etc.))
–– GramGramáática del idioma (tica del idioma (tildes, verbos, etc.tildes, verbos, etc.))
–– Orientado a bOrientado a búúsquedas de squedas de ‘‘palabraspalabras’’completascompletas
• Productos analizados:
–– SQL Server FullSQL Server Full--TextText SearchSearch
–– PostgreSQLPostgreSQL FullFull--TextText SearchSearch
9V Jornadas Técnicas de la IDE de España ▪ IDE, Aplicaciones al Planeamiento y la Gestión del Territorio ▪ Tenerife 5-7 noviembre 2008
Solución tecnológica I I
• Proceso de pruebas FTS
–– Fase de IndexaciFase de Indexacióónn•• Tipo de dato: Tipo de dato: VARBINARY(maxVARBINARY(max)/)/tsvectortsvector
–– Fase de ConsultaFase de Consulta•• CONTAINS/CONTAINS/to_tsqueryto_tsquery. . Existencia de operadores en Existencia de operadores en
la cadena de bla cadena de búúsqueda, squeda, ““colegioscolegios”” NEAR NEAR ““adejeadeje””
•• FREETEXT/FREETEXT/plainto_tsqueryplainto_tsquery. . Sin operadores Sin operadores ““colegios en colegios en adejeadeje””
–– Fase de DepuraciFase de Depuracióónn•• AnAnáálisis de resultadoslisis de resultados
•• ConfiguraciConfiguracióón de Diccionarios / Sinn de Diccionarios / Sinóónimosnimos
10V Jornadas Técnicas de la IDE de España ▪ IDE, Aplicaciones al Planeamiento y la Gestión del Territorio ▪ Tenerife 5-7 noviembre 2008
Solución tecnológica I I I
• Comparativa
–– Rendimiento similarRendimiento similar
–– Funcionalidades equivalentesFuncionalidades equivalentes
–– Tiempo puesta producciTiempo puesta produccióónn
–– Soporte espacialSoporte espacial
–– Coste de licenciaCoste de licencia
• Opción elegida: PostgreSQL FTS +PostGIS
11V Jornadas Técnicas de la IDE de España ▪ IDE, Aplicaciones al Planeamiento y la Gestión del Territorio ▪ Tenerife 5-7 noviembre 2008
Ejemplos I
12V Jornadas Técnicas de la IDE de España ▪ IDE, Aplicaciones al Planeamiento y la Gestión del Territorio ▪ Tenerife 5-7 noviembre 2008
Ejemplos I I
13V Jornadas Técnicas de la IDE de España ▪ IDE, Aplicaciones al Planeamiento y la Gestión del Territorio ▪ Tenerife 5-7 noviembre 2008
Ejemplo I I I
14V Jornadas Técnicas de la IDE de España ▪ IDE, Aplicaciones al Planeamiento y la Gestión del Territorio ▪ Tenerife 5-7 noviembre 2008
Conclusiones y líneas futuras
• Conclusiones
–– Facilidad uso (Facilidad uso (interfaz, lenguaje natural, etc.interfaz, lenguaje natural, etc.))
–– Motor de bMotor de búúsquedas inteligentesquedas inteligente
–– IntegraciIntegracióón y adaptacin y adaptacióón de n de tecnologtecnologííasas
• Líneas futuras
–– Refinamiento de resultados (Refinamiento de resultados (LOGLOG))
–– EncapsulaciEncapsulacióón en estn en estáándares OGCndares OGC
–– Otros: Otros: MultilingMultilingüüe, Nuevos contenidos, etc.e, Nuevos contenidos, etc.
15V Jornadas Técnicas de la IDE de España ▪ IDE, Aplicaciones al Planeamiento y la Gestión del Territorio ▪ Tenerife 5-7 noviembre 2008
Búsquedas inteligentes de toponimia
Félix J osé Herná[email protected]