Date post: | 28-Jan-2016 |
Category: |
Documents |
Upload: | nilda-gonzalez |
View: | 214 times |
Download: | 0 times |
Modelando los Hábitos de Consumo Televisivo
usando Tecnología Semántica
Mauricio Espinoza-Mejía, Víctor Saquicela
Departamento de Ciencias de la ComputaciónGrupo de Investigación en Gestión del Conocimiento
Universidad de Cuenca, Ecuador
IX Congreso de Ciencia y Tecnología ESPE 2014, 28 -30 Mayo, 2014
2
Contenido
• Motivación • Contribución de nuestra propuesta• Qué es una ontología?• Retos modelación semántica• Especificación de Requerimientos• Modelamiento del Perfil de Usuario• Conclusiones y trabajo futuro
3
Motivación
• Migración de la TV analógica a digital• Más canales en el mismo ancho de
banda.• Aplicaciones mezcladas con contenido
audiovisual.
Sobrecarga de información
“exceso de información sobre un tema genera dificultades para comprenderlo”
Ejemplo: Web
4
Motivación
• Meta: Sistemas de recomendación
• facilite la selección de contenidos• provea interfaces fáciles de usar
• Sistemas de recomendación para TV• técnicas de minería de datos• basados en contenidos• filtrado colaborativo• técnicas de la Web semántica, etc.
5
Motivación
• Dificultades de las propuestas • recomendaciones limitadas
• requiere información histórica
• recomendaciones se basan en las elecciones pasadas
• dependen exclusivamente de los recursos disponibles a priori
6
Contenido
• Motivación • Contribución de nuestra propuesta• Qué es una ontología?• Retos modelación semántica• Especificación de Requerimientos• Modelamiento del Perfil de Usuario• Conclusiones y trabajo futuro
7
Contribución de nuestra propuesta
• Uso de tecnología semántica para razonar:
• Programación TV• Preferencias Usuarios
• Ontologías dominio creadas a propósito o descubiertas en línea
• Recursos externos• redes sociales• bases de datos de películas• repositorios de guías de programación• SPARQL endpoints
Contribución de nuestra propuesta
8
Víctor Saquicela, Mauricio Espinoza-Mejía, Jezreel Mejía,Boris Villazón-Terrazas, Reduciendo la Sobrecarga de Información en Usuarios de Televisión Digital, ENC 2013, Workshop on Semantic Web and Linked Open Data,
México, octubre 2013
9
Contenido
• Motivación • Contribución de nuestra propuesta• Qué es una ontología?• Retos modelación semántica• Especificación de Requerimientos• Modelamiento del Perfil de Usuario• Conclusiones y trabajo futuro
Qué es una ontología?
10
commonly accepted understanding
conceptual model of a domain
(ontological theory)
unambiguous terminology definitions
machine-readability with computational
semantics
[Gruber93]
Formal, explicit specification of a shared conceptualization
[Gruber93]
Estructura de una Ontología
Conceptos Entidad conceptual del dominio
Atributos Propiedad de un concepto
Relaciones Relaciones entre conceptos o propiedades
Axiomasdescripción coherente entre Conceptos / Propiedades / Relaciones través de expresiones lógicas
11
Person
Student Professor
Lecture
isA – hierarchy (taxonomy)
name email
studentnr.
researchfield
topiclecture
nr.
attends holds
holds(Professor, Lecture) Lecture.topic Professor.researchField
12
Contenido
• Motivación • Contribución de nuestra propuesta• Qué es una ontología?• Retos modelación semántica• Especificación de Requerimientos• Modelamiento del Perfil de Usuario• Conclusiones y trabajo futuro
Retos de la Modelación Semántica: Preferencias Usuarios
Tres aspectos:
• la identificación de los datos a ser modelados y su formato de representación,
• la determinación de las fuentes de información más apropiadas para la extracción de las preferencias
• el uso adecuado de este conocimiento para filtrar la información más relevante para el usuario.
13
Modelación del Perfil del Usuario
Dos desafíos principales• la necesidad de conocimiento predefinido del dominio
• correspondencias entre la descripción del contenido y la información semántica en la ontología
14
Qué peliculas ha visto?Qué observa los fines de semana?
Qué edad tiene?Cuáles son su habilidades?
…..
Cuáles con sus intereses?Qué edad tiene?
Cuáles son su habilidades?…..
15
Contenido
• Motivación • Contribución de nuestra propuesta• Qué es una ontología?• Retos modelación semántica• Especificación de Requerimientos• Modelamiento del Perfil de Usuario• Conclusiones y trabajo futuro
Especificación de Requisitos: IS
• Uno de los procesos clave en el desarrollo de software es la especificación del software• Entender y definir las funcionalidades de un producto de software
• Documento de especificación de requisitos• acuerdo entre los clientes y proveedores sobre lo que el
software va a hacer
• reducción del esfuerzo de desarrollo
• base para estimación de costos y cronogramas
• línea de base para la validación y verificación.
16
Especificación de Requisitos: Estado del Arte
• Estado del arte en ingeniería ontológica • Mayoría metodologías proponen una fase de especificación de
requisitos.• METHONTOLOGY• On-To-Knowledge• Grüninger and Fox’s methodology
» No proveen guías detalladas sobre qué realizar en cada paso
» Qué es necesario para un buen documento de espeficicacion de requisitos
• Neon Methodology• Filling card: definición, meta, entrada, salida, cuándo y quién • Workflow: entradas, salidas, actores• ORSD
17
Especificación de Requisitos: NeOn Methdology
18
Especificación de Requisitos: Secciones 1-3 del ORSD
• Posibles usuarios y expertos del dominio
• Lluvia de ideas miembros del equipo de trabajo.
19
Especificación de Requisitos: Secciones 4-5 del ORSD
• Entrevistas con los posibles usuarios y expertos del dominio.
• Los casos de uso identificados para el desarrollo del sistema de recomendación.
20
Especificación de Requisitos: Sección 6 del ORSD
• futuros usuarios del sistema de recomendación y no expertos del dominio
• técnica de preguntas de competencia• preguntas en
lenguaje natural que la ontología debe ser capaz de responder
21
Especificación de Requisitos: Sección 7 del ORSD
Pre-glosario de términos • términos extraídos de las preguntas de competencia
• términos de las respuestas a las preguntas
• términos identificados como nombres de entidades (objetos)
• Técnicas heurísticas de extracción de terminología• nombres, adjetivos y verbos
• conceptos, atributos, relaciones o instancias (en el caso de nombres de entidades).
22
Especificación de Requisitos: Sección 7 del ORSD
Metodología• usar los términos con la frecuencia más
alta• dirigir la búsqueda de recursos
existentes
Categorías• Información del Televidente
• información básica del usuario • información profesional• características propias del usuario• habilidades
• Tópicos de Preferencias• diferentes dominios
• Intereses• rock, videojuegos
• Actividades• Interacción televidente
• Tiempo y Lugares• contexto espacio-temporal
23
24
Contenido
• Motivación • Contribución de nuestra propuesta• Qué es una ontología?• Retos modelación semántica• Especificación de Requerimientos• Modelamiento del Perfil de Usuario• Conclusiones y trabajo futuro
Modelamiento del Perfil de Usuario
No se puede hablar de una ontología estándar
Las ontologías son específicas a la aplicación
Proceso de Construcción de la Ontología• Top-Down
• independientes del dominio (usando ontologías de alto nivel)• ser reutilizables en múltiples sistemas
• Neon Methodology: escenario seis - reusando, fusionando y ejecutando reingeniería de recursos ontológicos
• Premisa: desarrolladores tienen recursos ontológicos a reusar • Los recursos son fusionados para crear un nuevo modelo• La fusión no es suficiente, proceso de reingenería es requerido
25
Modelamiento del Perfil de Usuario: Escenario Seis
• Búsqueda de Ontologías
• Comparación de las Ontologías
• Selección de las Ontologías
• Personalización e Integración de las Ontologías Seleccionadas
• Evaluación de la Ontología Resultante
26
Búsqueda de Ontologías
• Búsqueda de Ontologías• ontologías que reunan los requisitos del ORSD
• Watson (http://watson.kmi.open.ac.uk/)
• Swoogle (http://swoogle.umbc.edu/)
• Sindice (http://sindice.com/)
• librerías de ontologías• Protégé Ontology Library
(http://protegewiki.stanford.edu/wiki/Protege Ontology Library)
• estándares que definan tipos de competencia e intereses de un usuario en sitios Web de alta fiabilidad.
27
Búsqueda de Ontologías
28
Comparación de las ontologías
• Ontologías no apropiadas a ser reutilizadas• Comprobar el alcance y propósito establecido en el ORSD• Los requisitos no funcionales estén cubiertos• Los requisitos funcionales en forma de preguntas de competencia
incluidos en ORSD son cubiertas (total o parcialmente)
• Heurísitica• Si el desarrollador contestó No a los criterios
• “Alcance similar” y/o “Propósito similar” y/o “Requerimientos Funcionales cubiertos”
• Ontología considerada no útil
29
Selección de las ontologías
Analizaron cuatro dimensiones
• Costo de Reutilización.• Esfuerzo de Comprensión. • Esfuerzo de Integración. • Confiabilidad.
cada una de las dimensiones tiene un conjunto de criterios que permiten obtener un puntaje para cada ontología
candidata
30
Selección de las ontologías
Los pesos • definidos por el equipo de
trabajo• símbolos (+) y (-) criterio se
cuenta de manera positiva o negativa
31
Personalización e Integración de las Ontologías
• Algunas actividades fueron ejecutadas en los recursos ontológicos seleccionados
• Podar las ontologías de acuerdo a las necesidades• GUMO personality
• Enriquecer la ontología a ser reusada• Agregar conceptos
• Adaptar las ontologías seleccionadas• convenciones de nombrado de términos
• Incluir conexiones a través de relaciones entre clases• ontología sobre la información básica de la persona con
la ontología que describe la localidad de residencia del usuario se usó la propiedad viveEn (liveIn).
32
Evaluación de la Ontología
• Comprobar la calidad técnica de la ontología construída.
• Únicamente se ha comprobado que la ontología no contenga errores de sintaxis.
• Trabajo en ejecución la evaluación de posibles errores de • diseño, • estructura y • calidad semántica.• localización de la ontología
• LabelTranslator Neon Toolkit
33
Retos de la Modelación Semántica: Preferencias Usuarios
Tres aspectos:
• la identificación de los datos a ser modelados y su formato de representación,
• la determinación de las fuentes de información más apropiadas para la extracción de las preferencias
• el uso adecuado de este conocimiento para filtrar la información más relevante para el usuario.
34
Captura del Perfil
• la determinación de las fuentes de información más apropiadas para la extracción de las preferencias
• implícitos • seguimiento del comportamiento del usuario -interacción
con el televisor• captura de las anotaciones efectuadas en redes sociales
• explícitos• aplicación Web
35
Uso del Perfil
• el uso adecuado de este conocimiento para filtrar la información más relevante para el usuario.
Base de Conocimiento• Mauricio; gusta; Adam Sandler• Mauricio; ha_visto; ‘Una esposa de mentira‘• ‘Una esposa de mentira‘; dirigida_por; Dennis Dugan
Recomendador• Mauricio se_recomienda_ver “Jack y Jill” dirigida_por
Dennis Dugan y protagonizada_por Adam Sandler.
Resultado • presentado al usuario mediante una aplicación
interactiva que haga uso del canal de retorno
36
Conclusiones y Trabajos Futuros
• Tecnologías Web Semántica pueden ser usados en el contexto de TV.
• Ontologías son útiles para compartir y reutilizar conocimiento.
• Disminuir el arranque en frío del sistema de recomendación• mediante inferencia
• Enriquecer la experiencia del usuario
• ofreciendo información adicional del tema tratado
• Localizar Ontología Labeltranslator NeOnToolkit
• Medir la usabilidad y la calidad de la modelación
• Usar la Web social como fuente de información para capturar el perfil de un usuario
37
Gracias por su atención
Mauricio Espinoza Mejía
Universidad de Cuenca
Cuenca, Ecuador
38