Estado del arte y
oportunidades de negocio
ÍNDICE
1 ANÁLISIS DE LA SITUACIÓN ACTUAL ................................................ 1
1.1 HISTORIA DE LA INTELIGENCIA ARTIFICIAL ...................................................... 2
1.2 ÁREAS DE LA INTELIGENCIA ARTIFICIAL ......................................................... 13
1.2.1 Áreas Clásicas ................................................................................ 14
1.2.1.1 Sistemas Expertos ........................................................................ 14
1.2.1.2 Aprendizaje y Razonamiento Automático ............................................. 14
1.2.1.3 Robótica ................................................................................... 15
1.2.1.4 Procesamiento de Lenguaje Natural ................................................... 15
1.2.1.5 Visión por Computador ................................................................... 16
1.2.1.6 Reconocimiento del Habla .............................................................. 17
1.2.2 Áreas de Vanguardia ........................................................................ 18
1.2.2.1 Redes Neuronales Artificiales ........................................................... 18
1.2.2.2 Lógica Difusa .............................................................................. 18
1.2.2.3 Algoritmos Genéticos .................................................................... 19
1.2.2.4 Sistemas Híbridos ......................................................................... 19
1.2.2.5 Realidad Virtual ........................................................................... 19
1.2.2.6 Agentes (Wizards) ........................................................................ 20
1.3 ANÁLISIS DEL MERCADO DE LA INTELIGENCIA ARTIFICIAL .................................... 21
1.4 AGENTES CLAVE .................................................................................... 29
1.4.1 Asociación Española Para la Inteligencia Artificial (AEPIA) ............................ 29
1.4.2 Grupos de investigación .................................................................... 30
1.4.3 Empresas del Sector ......................................................................... 31
1.4.4 Asociaciones relacionadas con áreas de la inteligencia artificial .................... 34
1.5 PATENTES A NIVEL NACIONAL E INTERNACIONAL ............................................. 35
1.5.1 Nivel nacional ................................................................................ 35
1.5.2 Nivel internacional .......................................................................... 47
2 ANÁLISIS DE OPORTUNIDADES DE NEGOCIO ..................................... 49
2.1 INVESTIGACIÓN EN INTELIGENCIA ARTIFICIAL ................................................. 49
2.1.1 Áreas de investigación ...................................................................... 50
2.1.2 Objetivos a largo plazo ..................................................................... 55
2.2 APLICACIONES DE LA INTELIGENCIA ARTIFICIAL ............................................... 56
2.2.1 La Inteligencia Artificial aplicada en los Contenidos Interactivos .................... 59
2.2.2 La Inteligencia Artificial aplicada al E-Commerce ...................................... 68
2.2.3 Aplicaciones de la Visión por Computador ............................................... 69
2.2.4 Aplicaciones Emergentes de la Inteligencia Artificial .................................. 77
3 INICIATIVAS DE INTERÉS ............................................................. 79
4 FUENTES DE INFORMACIÓN ......................................................... 97
1
1 Análisis de la Situación Actual
La inteligencia artificial es un área multidisciplinaria que estudia la creación y diseño de sistemas capaces
de resolver problemas por sí mismas, utilizando como paradigma la inteligencia humana.
La inteligencia artificial se ha convertido en una industria colosal y ha transformado literalmente la forma
en que conducimos nuestras vidas y operamos en nuestros negocios.
De la misma manera que la Revolución Industrial transformó radicalmente la vida de la humanidad en el
siglo XVIII y XIV, la Inteligencia Artificial está transformando radicalmente la forma de vida en el siglo XX y
XXI. Los juegos de ordenador, anuncios basados en la web, traductores de lenguaje automático, vehículos
de auto-conducción, e incluso Facebook y Google operan a través de Inteligencia Artificial.
Existen dos grandes tipologías de Inteligencia Artificial: una basada en reglas y otra basada en aprendizaje
automático.
La Inteligencia Artificial basada en reglas consiste en un experto que diseña un conjunto de reglas
para que el programa opere, ya que éste es incapaz de funcionar por sí mismo, no pudiendo desviarse
de ese conjunto de reglas.
Por el contrario, en la Inteligencia Artificial basada en el aprendizaje automático, el programa
aprende por sí mismo y es capaz de operar de forma independiente, además de tomar decisiones
inteligentes. Estos programas de Inteligencia Artificial operan gracias a unos programas informáticos
específicos denominados algoritmos.
En la actualidad manejamos más datos, tenemos procesadores más rápidos y las memorias de los
ordenadores son más grandes que nunca. Como resultado, los algoritmos se están volviendo cada vez más
inteligentes y permiten aplicaciones tales como el reconocimiento facial, auto-traductores o dispositivos
controlados por voz.
2
1.1 Historia de la Inteligencia Artificial
La Inteligencia Artificial tomó fuerza como disciplina de las ciencias de la información a partir del trabajo
de Alan Turing en 1950.
Los fundamentos se remontan a la lógica y algoritmos de los griegos, y a las matemáticas de los árabes,
varios siglos antes de Cristo. El concepto de razonamiento artificial aparece en el siglo XIV. A finales del
siglo XIX se obtienen lógicas formales, y a mediados del siglo XX se obtienen máquinas capaces de hacer uso
de tales lógicas y algoritmos de solución.
En su histórico artículo de 1950, Alan Turing propuso que la pregunta “¿puede pensar una máquina?”, era
demasiado filosófica para tener valor y, para hacerlo más concreto, propuso un “juego de imitación” a
través de la prueba de Turing. En ésta intervienen dos personas y un ordenador. Una persona, el
interrogador, se sienta en una sala y teclea preguntas en el ordenador. Cuando aparecen las respuestas, el
interrogador intenta determinar si fueron hechas por una persona o por un ordenador. Si actúa de manera
inteligente, según Turing es inteligente. Turing señaló que una máquina podía fracasar y ser inteligente.
Aun así creía que las máquinas podrían superar la prueba a finales del siglo XX.
Esta prueba no tuvo el valor práctico que se esperaba, aunque sus repercusiones teóricas fueron claves. El
enfoque de Turing de considerar a la inteligencia artificial como una imitación del comportamiento
humano no fue tan práctico a lo largo del tiempo, y el enfoque dominante ha sido el del comportamiento
racional.
El procedimiento de Turing permite que casi todos los grandes problemas de la inteligencia artificial puedan
ser probados. Una clasificación para los resultados de una prueba de inteligencia artificial es:
Óptimo: no es posible tener un mejor desempeño.
Fuerte sobrehumana: se comporta mejor que todos los seres humanos.
Super-humana: se comporta mejor que la mayoría de los seres humanos.
Sub-humana: realiza peor que la mayoría de los seres humanos.
Por ejemplo, el rendimiento en las damas es óptima, el rendimiento en el ajedrez es sobrehumana, y el
rendimiento en muchas tareas cotidianas (como el reconocimiento de una cara o cruzar una habitación sin
tropezar con algo), es sub-humano.
También se pueden utilizar pruebas que se desarrollan a partir de las definiciones matemáticas de
inteligencia. Ejemplos de este tipo de pruebas comienzan a finales de los años noventa. Las dos grandes
ventajas que presentan este tipo de métodos son su aplicabilidad a las inteligencias no humanas y su
ausencia de un requisito para los probadores humanos.
Un derivado de la prueba de Turing es la prueba CAPTCHA que, como su nombre indica, ayuda a determinar
que un usuario es una persona real y no un equipo informático. En contraste con la prueba estándar de
3
Turing, CAPTCHA es administrado por una máquina y dirigido a un ser humano en lugar de ser administrado
por un humano y dirigido a una máquina. Un ordenador le pide a un usuario completar una prueba simple.
Los ordenadores son incapaces de resolver el problema, por lo que las soluciones correctas se consideran el
resultado de una persona. Un tipo común de CAPTCHA es la prueba que exige la tipificación de letras,
números o símbolos distorsionados que aparecen en una imagen indescifrable por un ordenador.
El enfoque del comportamiento humano y el del pensamiento humano siguen siendo estudiados por
las ciencias cognitivas, y continúan aportando interesantes resultados a la Inteligencia Artificial, y viceversa.
En la evolución de la Inteligencia Artificial, las dos fuerzas más importantes fueron la lógica matemática y
la computación, que permitió la construcción de los primeros ordenadores en 1940.
A continuación se presentan los hitos más relevantes en la historia de la inteligencia artificial:
300 a. C: Aristóteles describió de manera estructurada un conjunto de reglas, silogismos, que
describen una parte del funcionamiento de la mente humana y que producen conclusiones racionales
a partir de premisas dadas.
250 a. C: Ctesibio de Alejandría construyó la primera máquina autocontrolada, un regulador del
flujo de agua que actuaba modificando su comportamiento de manera correcta.
1315: Ramón Llull tuvo la idea de que el razonamiento podía ser efectuado de manera artificial.
4
1847: George Boole estableció la lógica proposicional (booleana), mucho más completa que los
silogismos de Aristóteles.
1879: Gottlob Frege extiende la lógica booleana y obtiene la Lógica de Primer Orden, con un mayor
poder de expresión, dicha lógica sigue siendo utilizada en la actualidad.
1883: Las torres de Hanoi de Édouard Lucas son consideradas la introducción a la teoría de los
algoritmos. Es un juego de ocho discos de radio creciente que se apilan insertándose en una de las
tres estacas de un tablero, con el objetivo de crear la pila en otra de las estacas siguiendo ciertas
reglas y en el mínimo número de movimientos.
1903: Lee De Forest inventa el triodo, también llamado bulbo o válvula de vacío.
5
1937: Alan Turing publicó un artículo de bastante repercusión sobre los "Números Calculables",
estableciendo así las bases teóricas para todas las ciencias de computación, y que puede
considerarse el origen oficial de la informática teórica. En este artículo introdujo el concepto
de Máquina de Turing, una entidad matemática abstracta que formalizó el concepto de algoritmo y
resultó ser la precursora de los ordenadores digitales. Podía conceptualmente leer instrucciones de
una cinta de papel perforada y ejecutar todas las operaciones críticas de un ordenador.
1940: Alan Turing y su equipo construyeron el primer ordenador electromecánico
1941: Konrad Zuse creó el primer ordenador programable y el primer lenguaje de programación de
alto nivel, Plankalkül. Las siguientes máquinas más potentes, aunque con igual concepto, fueron la
ABC y ENIAC.
1943: Warren McCulloch y Walter Pitts presentaron su modelo de neuronas artificiales, el cual se
considera el primer trabajo del campo de inteligencia artificial.
6
1950: Turing consolidó el campo de la inteligencia artificial con su artículo “Computing Machinery
and Intelligence”, en el que propuso una prueba concreta para determinar si una máquina era
inteligente o no (Prueba de Turing), por lo que se le considera el padre de la Inteligencia Artificial.
El escritor estadounidense Isaac Asimov publicó "Yo, robot", una serie de relatos cortos de ciencia
ficción. Su trabajo fue popular y ayudó a inspirar a una generación de científicos dedicados a la
robótica. Uno de sus escritos más famosos es el que incluye las tres leyes de la robótica, diseñadas
para evitar que estas creaciones se vuelvan contra la humanidad.
1951: William Shockley inventa el transistor de unión, posibilitando una nueva generación de
ordenadores mucho más rápidos y pequeños.
1956: se acuña el término "inteligencia artificial" en Dartmouth durante una conferencia convocada
por McCarthy. En esta conferencia se hicieron previsiones triunfalistas a diez años que jamás se
cumplieron, lo que provocó el abandono casi total de las investigaciones durante quince años.
7
1958: John McCarthy y sus colaboradores en el Instituto Tecnológico de Massachusetts crearon LISP,
considerado por algunos el segundo lenguaje de programación de alto nivel (tras FORTRAN). Está
considerado el primer lenguaje de programación funcional y también de programación declarativa.
1959: Frank Rosenblat crea la Red tipo Perceptrón. Su intención era ilustrar algunas propiedades
fundamentales de los sistemas inteligentes en general, sin entrar en mayores detalles con respecto
a condiciones específicas y desconocidas para organismos biológicos concretos.
1963: se escribe el primer programa para jugar al ajedrez, capaz de enfrentarse a jugadores de
primera fila mundial. Se funda la primera industria de fabricación de robots.
1964-1966: Doctor Joseph Weizenbaum, del Instituto de Tecnología de Massachusetts (MIT),
imitando el comportamiento de un psiquiatra pasivo que dirige la conversación del paciente para
que éste hable todo el tiempo, creo un programa (Eliza) para desprestigiar a este tipo de psiquiatras
y así demostrar que un sencillo programa podría simular esta forma de tratamiento.
8
1969: Se demuestran las propiedades de la visión artificial para vehículos autoguiados en el Stanford
Research Institute. Este mismo año se desarrollaron los brazos Boston y Stanford, este último dotado
de una cámara y controlado por ordenador. Sobre el brazo Stanford se desarrolló un experimento
en el que el manipulador apilaba bloques según determinados criterios. En el mismo año se
desarrolló WAP-1, el primer robot bípedo, diseñado por Ichiro Kato.
1970: Se crea Prolog, un lenguaje de programación ideado en la Universidad de Aix-Marseille I por
los profesores Alain Colmerauer y Philippe Roussel. Nació de un proyecto que no tenía como objetivo
la implementación de un lenguaje de programación, sino el procesamiento de lenguaje natural.
1970-1980: Aparecen los sistemas expertos, denominados así porque emulan el razonamiento de un
experto en un dominio concreto, y en ocasiones son usados por éstos. Con los sistemas expertos se
busca una mejor calidad y rapidez en las respuestas, dando así lugar a una mejora de la
productividad del propio experto al usar este tipo de sistemas informáticos.
9
1980-1986: Se produce el resurgir de la red neuronal gracias al desarrollo de la red de Hopfield, y
en especial, al algoritmo de aprendizaje de retropropagación (BackPropagation) ideado por
Rumelhart y McLellan en 1986 que fue aplicado en el desarrollo de los perceptrones multicapa.
1987: Martin Fischles y Oscar Firschein describieron los atributos de un agente inteligente. Al
intentar describir con un mayor ámbito (no sólo la comunicación) los atributos de un agente
inteligente, la Inteligencia Artificial se ha expandido a muchas áreas que han creado ramas de
investigación diferenciadas. Dichos atributos del agente inteligente son:
1. Tiene actitudes mentales tales como creencias e intenciones.
2. Tiene la capacidad de obtener conocimiento, es decir, aprender.
3. Puede resolver problemas, incluso dividir problemas complejos en otros más simples.
4. Entiende. Posee la capacidad de crearle sentido, si es posible, a ideas ambiguas o
contradictorias.
5. Planifica, predice consecuencias, evalúa alternativas (como en los juegos de ajedrez).
6. Conoce los límites de sus propias habilidades y conocimientos.
7. Puede distinguir a pesar de la similitud de las situaciones.
8. Puede ser original, creando incluso nuevos conceptos o ideas, y hasta utilizando analogías.
9. Puede generalizar.
10. Puede percibir y modelar el mundo exterior.
11. Puede entender y utilizar el lenguaje y sus símbolos.
10
1997: aparición de la Computadora Autónoma. Fue una computadora de IBM que jugaba al ajedrez,
la primera que venció a un campeón del mundo vigente, Gary Kasparóv, con un ritmo de juego lento.
Kasparóv siempre ha declarado que perdió al estar inferioridad de condiciones, puesto que IBM
contaba con todos los movimientos de sus partidas (programados en el computador).
2002: La empresa estadounidense iRobot creó el primer producto comercial exitoso para el uso en
el hogar que utiliza el principio de inteligencia artificial: la aspiradora autónoma Roomba. Más allá
de tener un sensor y un consumo de energía regulado, este dispositivo tiene la suficiente inteligencia
como para limpiar el piso y la alfombra de una casa. Roomba ha sido el despegue de los aparatos
autónomos diseñados para una tarea específica.
2005: Se desarrolla el Prototipo del Robot NAO. Es un robot humanoide programable y autónomo,
desarrollado por Aldebaran Robotics, una compañía de robótica francesa con sede en París. El
desarrollo del robot comenzó con el lanzamiento del Proyecto Nao en 2004
11
2008: Una pequeña ayuda apareció en el nuevo iPhone: una aplicación de Google que reconocía la
voz. Fue uno de los mayores descubrimientos en este campo. Más allá de que el reconocimiento de
voz es una de las metas de la inteligencia artificial, tras décadas de investigación nunca se había
llegado más allá del 80% de precisión. Pero Google lo logró a partir de miles de ordenadores, que
funcionaban de forma paralela y aprendían patrones a partir de enormes volúmenes de información
entregados por los usuarios.
2010: Se presenta Siri una aplicación con funciones de asistente personal y con personalidad propia
para iOS. Esta aplicación utiliza procesamiento de lenguaje natural para responder preguntas, hacer
recomendaciones y realizar acciones mediante la delegación de solicitudes hacia un conjunto de
servicios web que ha ido aumentando con el tiempo. Esta aplicación es capaz de adaptarse con el
paso del tiempo a las preferencias individuales de cada usuario, personalizando las búsquedas web
y la realización de algunas tareas, tales como reservar mesa en un restaurante o pedir un taxi.
2011: Watson de IBM demuestra sus capacidades antes los dos campeones más grandes del programa
estadounidense Jeopardy, y los vence. IBM asegura que su objetivo principal es crear una
computadora capaz de entender las preguntas que los humanos le hacen de una forma natural, y a
la vez proveer la respuesta de una forma que los humanos puedan comprender. Para ello ha firmado
un acuerdo con Nuance Communication para desarrollar un proyecto comercial que utilice en
plenitud las habilidades de Watson.
12
2014: Hawking ha advertido sobre los riesgos de que las máquinas tengan superinteligencia,
indicando que esto podría ser lo más significativo que pudiese pasar a la humanidad.
Otro hito relevante ha sido que un ordenador superó con éxito el test de Turing, haciendo creer a
un interrogador que es una persona quien responde sus preguntas en un certamen organizado en
Londres por la Universidad de Reading (Reino Unido). El ordenador, con el programa Eugene
desarrollado en San Petersburgo (Rusia), se ha hecho pasar por un chico de 13 años.
13
1.2 Áreas de la Inteligencia Artificial
La inteligencia artificial, debido a su naturaleza, cuenta con diversas áreas de estudio, en las que se divide
y se investiga; cada una de estas áreas ha surgido gracias a ideas innovadoras en el ámbito de la investigación
computacional, que han permitido el desarrollo de nuevas técnicas de programación.
Cada una de las áreas de la Inteligencia Artificial es una metodología diferente para tratar de solucionar
problemas aplicando el principio de inteligencia a los sistemas.
Estas áreas se pueden dividir en áreas clásicas y áreas de vanguardia, en función de la época en la que
surgieron.
A continuación se presenta cada una de las áreas con sus principales características.
Áreas Clásicas
Sistemas expertos
Aprendizaje y Razonamiento Automático
Robótica
Procesamiento de Lenguaje Natural
Visión por Computador
Reconocimiento del habla
Redes Neuronales Artificiales
Lógica Difusa
Algoritmos Genéticos
Sistemas Híbridos
Realidad Virtual
Agentes (Wizards)
Áreas de Vanguardia
14
1.2.1 Áreas Clásicas
1.2.1.1 Sistemas Expertos
Un sistema experto es un programa o un conjunto de programas informáticos que aplican el proceso de
razonamiento del humano experto en la materia para la solución de problemas específicos, es decir, simula
el juicio y el comportamiento de un experto en una materia, y resuelve problemas que normalmente son
solucionados por expertos humanos.
Su función es la toma decisiones inteligentes en base al conocimiento y la heurística al interpretar grandes
cantidades de datos, por lo que su función es auxiliar a los expertos, no reemplazarlos.
Se compone de una base de conocimiento del dominio en cuestión, mecanismos de razonamiento para
aplicar conocimiento a los problemas que se proponen, mecanismos para explicar a los usuarios el
razonamiento utilizado a la hora de ofrecer una respuesta, y mecanismos de aprendizaje y adquisición de
nuevo conocimiento.
Para crear una base de conocimiento es necesario contar con al menos un experto humano del dominio en
cuestión. Se puede adquirir su conocimiento a partir de entrevistas o mediante interfaces amigables para
que lo introduzca. Pero también es muy relevante la adecuada modelización de su conocimiento.
Los mecanismos de representación del conocimiento que se pueden encontrar son: lógica, redes, marcos y
reglas. Normalmente se utiliza una combinación de marcos y reglas.
Existe software libre que proporciona herramientas para el desarrollo de sistemas expertos, como puede ser
Clips o Babylon.
1.2.1.2 Aprendizaje y Razonamiento Automático
Consiste en que un ordenador sea capaz de planificar, tomar decisiones, plantear y evaluar estrategias,
aprendiendo a partir de la experiencia y que, por lo tanto, es capaz de autoreprogramarse para adaptarse
a su entorno.
Las aplicaciones del aprendizaje automático afecta a motores de búsqueda, diagnósticos médicos, detección
de fraude en el uso de tarjetas de crédito, análisis del mercado de valores, clasificación de secuencias de
ADN, reconocimiento del habla y del lenguaje escrito, juegos o robótica.
15
1.2.1.3 Robótica
Se trata de artefactos autónomos capaces de llevar a cabo diversas tareas mecánicas de manera flexible e
inteligente, cumpliendo con un objetivo y ajustándose al entorno cambiante.
Se considera dentro de las ramas de la inteligencia artificial, partiendo de la idea de que un robot es un
dispositivo electromecánico programado para que realice tareas manuales, y utiliza el principio de
inteligencia artificial sólo cuando es capaz de responder a cambios en su entorno, en lugar de seguir
instrucciones establecidas previamente. Esto se puede llevar a cabo con la ayuda de sensores y de cámaras
que le permitan interpretar las señales del ambiente que lo rodea y adaptarse al mismo.
El interés de la inteligencia artificial en la robótica se centra en los agentes inteligentes que manipulan el
mundo físico. No obstante, también es un campo de gran interés para aplicar otras áreas de inteligencia
artificial como planificación o visión por computador.
Las áreas de aplicación de la robótica son múltiples: industria, agricultura, transporte, entornos peligrosos
(donde no debería haber humanos), exploración (p. ej. viajes al espacio), salud (p. ej.: cirugía gracias a la
precisión milimétrica), entretenimiento, etc.
1.2.1.4 Procesamiento de Lenguaje Natural
Son sistemas capaces de reconocer, procesar y emular el lenguaje humano.
Es un intento de comunicación cada vez más claro entre humano-máquina y máquina-humano, dejando el
uso de lenguajes de programación o de un conjunto de comandos para procesar el lenguaje humano natural.
Para procesar dicho lenguaje humano natural se necesita dividirlo de la siguiente manera:
Primero se obtiene la comprensión del lenguaje natural, que investiga métodos para que el
ordenador comprenda las instrucciones dadas por la persona humana en este tipo de lenguaje.
El segundo paso es la generación de lenguaje natural, en donde el ordenador es capaz de expresarse
en el lenguaje humano natural, de tal forma que podamos entenderle de manera más sencilla.
16
1.2.1.5 Visión por Computador
La visión por computador o artificial tiene como finalidad la extracción de información del mundo físico a
partir de imágenes, utilizando para ello un ordenador.
Su función principal es reconocer y localizar objetos en el ambiente mediante el procesamiento de las
imágenes, para lo cual extrae características de una imagen (brillo, colores, formas, etc.), para su
descripción e interpretación por parte del ordenador.
Actualmente existen múltiples aplicaciones prácticas de la visión por computador, entre las que destacan
las siguientes:
Robótica móvil y vehículos autónomos. Se utilizan cámaras y otros tipos de sensores para localizar
obstáculos, identificar objetos y personas, encontrar el camino, etc.
Manufactura. Se aplica la visión para la localización e identificación de piezas o control de calidad,
entre otras tareas.
Interpretación de imágenes aéreas y de satélite. Se usa el procesamiento de imágenes y la visión
por computador para mejorar las imágenes obtenidas, identificar diferentes tipos de cultivos,
ayudar en la predicción del clima, etc.
Análisis e interpretación de imágenes médicas. La visión se aplica para ayudar en la interpretación
de diferentes clases de imágenes médicas, tales como rayos-X, tomografía, ultrasonido, resonancia
magnética o endoscopia.
Interpretación de escritura, dibujos y planos. Se utilizan técnicas de visión para el reconocimiento
de textos, lo que se conoce como reconocimiento de caracteres. También se aplica a la
interpretación automática de dibujos y mapas.
Análisis de imágenes microscópicas. El procesamiento de imágenes y la visión por computador se
utilizan para ayudar a interpretar imágenes microscópicas en química, física y biología.
Análisis de imágenes para astronomía. Se usa la visión para procesar imágenes obtenidas por
telescopios, ayudando a la localización e identificación de objetos en el espacio.
Análisis de imágenes para compresión. Se están desarrollado técnicas sofisticadas de compresión
que se basan en la interpretación de las imágenes.
17
1.2.1.6 Reconocimiento del Habla
El reconocimiento del habla es una de las áreas con mayor impacto práctico para la comunicación hombre-
máquina.
Consiste en capturar la señal de audio, descodificar el significado de las palabras, interpretarlas y transmitir
una respuesta.
En la actualidad se utiliza en gran medida para personas que no tienen la capacidad de utilizar un teclado
y necesitan comunicarse por medio del habla, a través de dispositivos habilitados para ello.
18
1.2.2 Áreas de Vanguardia
1.2.2.1 Redes Neuronales Artificiales
Las redes neuronales artificiales presentan una gran capacidad para adquirir conocimiento a partir de datos
complejos o imprecisos, siendo utilizadas para extraer patrones y detectar tendencias, lo cual puede
resultar una tarea muy compleja para un humano, o imposible de aislar con técnicas computacionales
convencionales.
Estos sistemas no se programan, se entrenan. Una red neuronal entrenada se asemeja en su comportamiento
a un "experto humano”. Este puede proporcionar proyecciones futuras de situaciones enmarcadas en el área
de entrenamiento. La red neuronal entrenada estaría en capacidad de responder a la pregunta "¿qué pasa
si…?".
Otras ventajas de las redes neuronales artificiales incluyen:
Aprendizaje adaptativo: habilidad de aprender mientras realiza tareas de forma continua.
Auto-organización: puede crear su propia topología organizacional, que responde a la
representación gráfica de la información durante el entrenamiento.
Operaciones en Tiempo Real: los cálculos pueden realizarse en paralelo.
Tolerancia a fallos vía codificación de información redundante: tienen la capacidad de auto-
regenerarse y encontrar soluciones a problemas previsibles.
1.2.2.2 Lógica Difusa
Es la implementación de otra lógica. Amplía la lógica Booleana para introducir el concepto de verdad parcial,
a diferencia de los valores Booleanos de "verdad absoluta" y "falso absoluto".
Se trata de un proceso “difuso” metodológico para generalizar cualquier teoría, de una forma discontinua
(discreta) a una forma continua (difusa).
Basado en los principios del razonamiento aproximado y el "cálculo con palabras", éstos sistemas logran
simplificar y aproximar la descripción del problema de una manera natural, eficiente y robusta.
Por ejemplo, la lógica booleana tiene valores de verdad de 0% y 100% únicamente, mientras que la lógica
difusa puede tener valores de verdad de 0%, 25%, 50%, 75% y 100%, lo que conlleva a entender sentencias
como “Alto”, “Muy Alto”, “Medianamente Alto”, “ Poco Alto” y “ No Alto”.
19
1.2.2.3 Algoritmos Genéticos
Un algoritmo genético es una clase de algoritmo adaptativo estocástico, que implica búsqueda y
optimización para lograr soluciones perfectas.
Los algoritmos genéticos fueron utilizados en Holanda en 1975 por primera vez. Se creó un organismo
electrónico organizado en una cadena binaria ("cromosoma"), usando principios genéticos y evolutivos de
selección con aptitud para la reproducción (incluyendo cruce y la mutación aleatoria).
La idea básica es tratar de reproducir de forma sencilla el proceso de la selección natural, con el objetivo
de encontrar un algoritmo adecuado para la solución de un problema específico.
En un ordenador, comenzando por una población inicial de organismos-candidatos para la solución de un
problema, éstos se recombinan de manera aleatoria (reproducción), luego se seleccionan los mejores, y
después de cierto tiempo o número de generaciones se alcanza una solución suficientemente buena para
resolver el problema.
1.2.2.4 Sistemas Híbridos
Un sistema híbrido de inteligencia artificial está formado por la integración de varios sistemas inteligentes,
cada uno de los cuales mantiene su propio lenguaje de representación y un mecanismo diferente para
extraer soluciones.
El objetivo de los sistemas híbridos es mejorar la eficiencia y la capacidad de razonamiento, así como la
integración de los sistemas inteligentes aislados.
El sistema consigue determinar y seleccionar los elementos que deben utilizarse en cada momento.
1.2.2.5 Realidad Virtual
Recrea mundos artificiales en tiempo real que pueden ser captados por el espectador a través de diversos
canales sensoriales. El usuario puede navegar "inmerso" a través de dicho mundo virtual.
Su aplicación como inteligencia artificial radica en el mecanismo de interpretación de la interacción del
ambiente virtual, como por ejemplo la luz del sol con respecto a las sombras de objetos, la sensación de
velocidad, el rebote de una pelota, el flujo del agua, etc.
20
1.2.2.6 Agentes (Wizards)
Son programas invisibles que trabajan como espías, observando las acciones comúnmente realizadas por el
usuario, las cuales son interpretadas y se guardan para llevar un control de las mismas.
Si existe alguna anomalía, como ejecutar un programa distinto al cotidiano, o un error en una acción
realizada por el usuario, el programa lanza una alerta y sugiere una serie de soluciones.
También es capaz de realizar las tareas cotidianas al iniciar el equipo para facilitar la tarea al usuario.
21
1.3 Análisis del mercado de la Inteligencia Artificial
El mercado de la inteligencia artificial no para de crecer, dada la gran flexibilidad que presenta para resolver
problemas relacionados con la medicina, la ingeniería, el ámbito militar o el entretenimiento, entre otros.
El desarrollo de entornos de programación amigables y lenguajes de programación especializados han
facilitado el desarrollo de aplicaciones en este ámbito.
Todas las tecnologías informáticas presentan un elemento en común, la inteligencia artificial, debido a que
todo programa presente en el mercado contiene en alguna medida elementos de ésta: lógica difusa, redes
neuronales artificiales, sistemas expertos, algoritmos genéticos, sistemas híbridos, etc.
En la actualidad, la inteligencia artificial se ha convertido en una parte esencial de la industria de la
tecnología. A nivel mundial, el gasto en inteligencia artificial ha pasado de 1.7 mil millones de $ en 2010 a
14.9 mil millones de $ en 2014, lo que supone un crecimiento de aproximadamente un 50% anual. En este
incremento del gasto ha influido de manera relevante la adquisición de empresas de este ámbito por parte
de Google, Microsoft o IBM durante el año 2014. Las principales empresas en este campo son IBM, Microsoft,
Facebook y Google.
Se prevé que los ingresos de las aplicaciones empresariales de inteligencia artificial se incrementarán de
202,5 millones de $ en el 2015 a 11,1 mil millones en 2024, lo cual representa una tasa de crecimiento anual
compuesta (CAGR) del 56,1%. Las regiones con mayor crecimiento serán Asia, Estados Unidos y Europa.
Estimación de Ingresos de la Inteligencia Artificial por región (2015-2024)
Fuente: Tractica
22
Las principales compañías del ámbito de la Inteligencia Artificial a nivel internacional durante el año 2015
se presentan a continuación:
Top 33 compañías de Inteligencia Artificial a nivel mundial (2015)
Fuente: Tractica
• IBM
• Microsoft
• Baidu
• Rocket Fuel
• Dstillery
• The Climate Corporation
• Prism Skylabs
• Continental Corporation
• Tesla Motors
• Mobileye
• Lending Club
• Kabbage
• SwiftKey
• Coursera
• Knewton
• Bloomberg
• FinGenius
• Zephyr Technology
• Apple
• Intel
• NEC
• Qualcomm
• AlchemyAPI
• DeepMind
• Salesforce
• DataMinr
• Bina Technologies
• Cognitive Scale
• Declara
• AiCure
• Sailthru
23
Las empresas del ámbito de la inteligencia artificial se pueden agrupar en categorías, en función de la
utilización de la inteligencia artificial en sus productos o servicios, tal y como se muestra a continuación:
Compañías de Inteligencia Artificial por categoría
Fuente: Venture Scanner
Las categorías expuestas son las siguientes:
• Aplicaciones de aprendizaje profundo (Deep learning) / Aprendizaje automático (Machine learning)
El aprendizaje automático es la tecnología que utiliza algoritmos que operan en base a sus propios
aprendizajes, a partir de datos existentes.
El aprendizaje profundo es una tipología de aprendizaje automático que se centra en las redes
neuronales, a través de algoritmos interconectados. El aprendizaje profundo pretende imitar el
patrón neuronal del cerebro humano en los ordenadores mediante el uso de miles de millones de
algoritmos interconectados, con vínculos que producen un flujo constante, dependiendo de los
patrones de interacción del usuario.
Watson es un sistema de aprendizaje profundo, totalmente diferente de las herramientas de análisis
de datos tradicionales, ya que puede clasificar millones de conjuntos de datos aparentemente
inconexos.
Inteligencia Artificial
24
Por ejemplo, la empresa WayBlazer utiliza Watson como plataforma de comercialización de viajes
altamente personalizados, adaptando sus ofertas e información en tiempo real a la ubicación de los
consumidores y a sus necesidades.
• Visión por Computador (Computer Vision) / Reconocimiento de imágenes (Image Recognition)
La visión por computador es el método de procesamiento y análisis de imágenes para comprender
las mismas y producir información sobre ellas.
El reconocimiento de imágenes es el proceso de digitalización de imágenes para identificar objetos
y rostros.
• Procesamiento del Lenguaje Natural (Natural Language Processing)
Es el método a través del cual los ordenadores procesan el lenguaje humano y lo convierten en
representaciones comprensibles para los mismos.
• Robots inteligentes (Smart Robots)
Robots que pueden aprender de su experiencia, lo que les permite actuar y reaccionar de manera
autónoma en función de las condiciones de su entorno.
• Asistentes personales virtuales (Virtual Personal Assistant)
Utilizan la inteligencia artificial para realizar tareas y servicios, tales como servicio al cliente, etc.
Los más utilizados actualmente son Siri de Apple y Cortana de Microsoft, aunque cada vez están
surgiendo en mayor medida.
• Reconocimiento de voz (Speech Recognition)
Es una aplicación del procesamiento de lenguaje natural que se centra en el procesamiento de un
clip de sonido de la voz humana, y devuelve el significado de la misma.
• Motores de Recomendación (Recomendation Engines) / Filtrado Colaborativo (Colaborative
Filtering)
Los motores de recomendación son sistemas que predicen las preferencias e intereses de los usuarios
para determinadas cuestiones (películas, restaurantes, etc…), y aportan recomendaciones
personalizadas.
El filtrado colaborativo es un método de predicción de las preferencias e intereses de los usuarios a
través de la recopilación de las preferencias de otros usuarios similares.
25
• Control de gestos (Gesture Control)
Es el proceso a través del cual los humanos interactúan y se comunican con los ordenadores a través
de sus gestos.
• Reconocimiento Automático de Contenido de Vídeo (Video Automatic Content Recognition)
Proceso mediante el cual los ordenadores comparan una muestra de contenido de vídeo con un
archivo de código, para identificar qué es el contenido a través de sus características.
• Computación de Contexto (Context Aware Computing)
Proceso mediante el cual los ordenadores se vuelven conscientes de su entorno (ubicación,
orientación, iluminación…), adaptando su comportamiento en función de ello.
• Traducción Voz a Voz (Speech to Speech Translation): Proceso a través del cual la voz humana es
procesada por el ordenador y traducida a otro idioma de forma automática.
En cuanto al número de empresas del ámbito de la inteligencia artificial, cabe destacar la categoría de
“Aplicaciones de Machine Learning” con un total de 200 empresas, seguida por el "Procesamiento del
Lenguaje Natural", con 130 empresas:
Número de empresas por categoría
Fuente: Venture Scanner
26
La industria de la inteligencia artificial es relativamente pequeña en comparación con otras tecnologías
disruptivas en cuanto a la captación de fondos.
La financiación total concedida a empresas del ámbito de la Inteligencia Artificial asciende a 2.738 millones
de $, destacando la categoría de “Aplicaciones de Deep Learning” como la de mayor atracción inversora.
En cuanto a la financiación media por tipo de empresa, destaca la categoría de "Aplicaciones de Machine
Learning“, con un promedio de 13,8 millones de $.
Financiación concedida a las industrias disruptivas
Fuente: Venture Scanner
Financiación total por categoría
Fuente: Venture Scanner
27
La edad media de las empresas de Inteligencia Artificial es de 5 años, destacando la categoría de "Speech
Recognition" y "Video Content Recognition" con una media de 8 años, seguido por "Computer Vision", que
cuenta con una media 6,5 años de vida.
Nivel de madurez empresarial
Fuente: Venture Scanner
28
Las empresas están localizadas principalmente en Estados Unidos (415), seguido del Reino Unido (67), y
Canadá (29).
Localización de las empresas
Fuente: Venture Scanner
29
1.4 Agentes Clave
1.4.1 Asociación Española Para la Inteligencia Artificial (AEPIA)
La Asociación Española Para la Inteligencia Artificial (AEPIA), se creó en 1983 para potenciar y fomentar el
desarrollo de la Inteligencia Artificial tanto en el ámbito español como en el Iberoamericano.
AEPIA es una asociación sin ánimo de lucro formada por socios numerarios e institucionales. Es miembro de
ECCAI (European Coordinating Committee for Artificial Intelligence), miembro fundador de la Confederación
Española de Asociaciones Científicas (COSCE) y miembro fundador de IBERAMIA.
Entre sus fines se encuentran:
Creación y coordinación de grupos de trabajo.
Apoyo a la transferencia de tecnología.
Apoyo a entidades (universidades, centros de I+D+i, empresas, instituciones, etc.), para facilitar su
innovación y aplicación de las técnicas y aplicaciones de la Inteligencia Artificial.
Proporcionar un soporte y foro de discusión a investigadores y estudiantes en sus actividades
relacionadas con la Inteligencia Artificial, desde los aspectos de investigación científica y
tecnológica, desarrollo, aplicación y docencia.
Organiza bienalmente la Conferencia Española de la Asociación Española para la Inteligencia Artificial
(CAEPIA), con los siguientes objetivos:
Facilitar la diseminación de nuevas ideas y experiencias.
Fortalecer los lazos entre los distintos grupos de investigación implicados.
Promover el trasvase de conocimiento entre nuevos investigadores y grupos consolidados.
Ayudar a difundir los nuevos desarrollos hacia la sociedad.
En los años alternos co-organiza IBERAMIA, la conferencia Iberoamericana de Inteligencia Artificial en
colaboración con otras asociaciones de diferentes países iberoamericanos. También patrocina las
Conferencias Españolas de Informática (CEDI), desde su primera edición en 2005.
Desde 1997 la difusión de las actividades se realiza principalmente mediante la revista de la asociación
(Revista Iberoamericana de Inteligencia Artificial), que publica cuatro números por año con una tirada media
de 450 ejemplares. Adicionalmente, por medio de AEPIA se coordina la lista de distribución en Inteligencia
Artificial INT-ARTIF (soportada por RED-IRIS).
También publica, en colaboración con la editorial Springer, la revista científica Progress in Artificial
Intelligence. En ella se recogen artículos de los siguientes temas: minería de datos, inteligencia
computacional, conocimiento, complejidad, lógica, planificación, razonamiento, búsqueda, agentes y
sistemas multiagente, visión artificial, robótica, lenguaje natural y web inteligente.
30
1.4.2 Grupos de investigación
Además de la Asociación Española Para la Inteligencia Artificial (AEPIA), principal entidad aglutinadora de
conocimiento, cabe destacar los principales grupos de investigación en el campo de la inteligencia artificial
a nivel nacional.
A continuación se presenta la distribución geográfica de los principales grupos de investigación a nivel
nacional en el ámbito de la inteligencia artificial:
Grupos de investigación a nivel nacional
Fuente: Elaboración propia basada en la AEPIA
ITAKA: Intelligent Technologies for Advanced
Knowledge Acquisition. Departamento de Ingeniería
Informática y Matemáticas. Escuela Técnica Superior
de Ingeniería. Universidad Rovira i Virgili
Research Group on Artificial Intelligence (Banzai).
Universitat Rovira i Virgili
IDINFOR: Investigación, Desarrollo e Innovación en Informática. ETS
Ingeniería Informática
Quivir Research Group: Tecnologías Inteligentes y de Seguridad en Sistemas
de Información. ETS de Ingeniería Informática. Universidad de Sevilla.
Networking and Emerging Optimization (NEO) Universidad de Malaga
Computer Science for Complex System Modeling
(COS2MOS) Dpto. de Informática e Ingeniería de Sistemas.
Instituto de Investigación en Ingeniería de Aragón (I3A).
Universidad de Zaragoza
Sistemas Inteligentes Basados en Análisis de Decisión Difusa.
Departamento de Informática. Universidad de Jaén
Aprendizaje y Redes Neuronales Artificiales (AYRNA). Departamento de Informática y
Análisis Numérico. Universidad de Córdoba
Grupo de Aprendizaje Automático. Artificial Intelligence Center. Universidad de Oviedo.
Grupo de Investigación en Optimización y Scheduling Inteligentes (iScOp). Departamento de Informática. Campus de Gijón.
Instituto de Investigación en Inteligencia Artificial. IIIA-
CSIC. Campus UAB
Volume Visualization and Artificial Intelligence research
group (WAI). Departamento de Matemàtica Aplicada i
Anàlisi. Universitat de Barcelona
Grupo LIDIA. Universidad de A Coruña. Facultad de
Informática. Campus de Elviña
Grupo de Sistemas Inteligentes. Centro Singular de
Investigación en Tecnoloxías da Información
SING: Sistemas Informáticos de Nueva Generación.
Escuela Superior de Ingeniería Informática. Edificio
Politécnico. Campus Universitario As Lagoas
Adaptive and Bioinspired Systems Research Group (ABSYS).
Facultad de Informática. Universidad Complutense de Madrid
Área de Sistemas Inteligentes (ASI). Instituto de Investigación
Tecnológica. Universidad Pontificia Comillas
Computación científica del CIEMAT
Computational Intelligence Group. Department of Artificial
Intelligence. School of Computer Science. Universidad Politécnica de
Madrid
Control, Aprendizaje y Optimización de Sistemas. Universidad Carlos
III de Madrid.
Grupo de investigación en aplicaciones basadas en Agentes,
Sociales e Interdisplinares (GRASIA). Facultad de Informática.
Universidad Complutense de Madrid.
Ontology Engineering Group. Escuela Tecnica Superior de
Ingenieros Informáticos. Universidad Politécnica de Madrid
Planning and Learning Group (PLG). Universidad Carlos III
Grupo de Investigación en Modelos de Decisión y Optimización (MODO).
Departamento de Ciencias de la Computación e Inteligencia Artificial. ETS de
Ingeniería Informática y de Telecomunicación. Universidad de Granada
Sistemas Inteligentes. Dpto. Ciencias de la Computación e Inteligencia
Artificial. Universidad de Granada.
Grupo de Investigación ARCO. Departamento de Tecnología
de los Computadores y de las Comunicaciones. Universidad de
Extremadura
Grupo de Tecnología Informática e Inteligencia Artificial (GTI-IA). Universitat
Politècnia de València
Grupo de procedimientos de construcción, optimización y análisis de estructuras.
Universidad Politécnica de Valencia. Dpto. Ingeniería de la Construcción
DeustoTech Mobility Unit. Facultad de Ingeniería. Universidad de Deusto
Grupo de Entornos de Enseñanza Adaptativos (GaLan). Universidad del País Vasco
Algorithms, data mining and parallelism (ALDAPA). Facultad de Informática. Departamento Arquitectura y
Tecnología de Computadores.
Intelligent Systems Group. Facultad de Informática. Machine Learning Group of Tecnalia (MLGT). Parque
Tecnológico de San Sebastián.
VISILAB Grupo de Visión y Sistemas Inteligentes.
Escuela Técnica Superior de Ingenieros Industriales
Psycotrip - Razonamiento mecanizado. Departamento de Matemáticas y Computación. Universidad de La Rioja
Grupo de Inteligencia Artificial y Razonamiento Aproximado (GIARA). Universidad Pública de Navarra.
31
1.4.3 Empresas del Sector
A nivel privado, las principales empresas relacionadas con el ámbito de la inteligencia artificial se presentan
a continuación:
x.ai
Se trata de una startup de inteligencia artificial fundada en 2014 en Nueva York, que ha desarrollado un
asistente personal que permite utilizar el correo electrónico para planificar reuniones.
Cuenta con el respaldo de sus fundadores e inversores, entre los que destacan Softbank Capital IA Ventures,
Lerer Ventures, FirstMark capital, Pritzker Grupo de Capital de Riesgo, y CrunchFund.
Cilenis
Está compuesta por un equipo con formación en Lingüística e Informática, con sólida experiencia en
investigación.
Surge a partir de la línea de investigación ProLNat@GE, coordinada por Pablo Gamallo (CITIUS), en
la Universidad de Santiago.
Su objetivo es la creación de aplicaciones avanzadas basadas en el conocimiento.
Cilenis inicia su actividad en 2011 como spin-off universitaria. Actualmente comercializa tres productos:
CilenisAPI: ofrece productos basados en el desarrollo del Procesamiento de Lenguaje Natural e
Ingeniería Lingüística. Desarrollan software con filosofía de código abierto, para dar mejores
soluciones.
Linguakit: portal con un paquete de herramientas lingüísticas y de extracción textual, para que toda
persona que posea cierto interés lingüístico pueda explorar, analizar y obtener una mejor
información de los textos y documentos escritos. Contiene:
o Conjugador verbal
o Identificador de idioma
o Analizador de sentimiento
o Palabras clave en contexto
o Reconocedor de entidades
o Extractor de palabras clave
o Extractor multipalabra
32
o Etiquetador morfosintáctico
Avalingua es un software de corrección automática tanto personal como para la enseñanza. Analiza
el texto buscando errores ortográficos, léxicos, gramaticales o de estilo y ofrece información sobre
a su tipología, importancia y posibles soluciones.
PredictionIO
Se trata de un servidor de aprendizaje automático de código abierto para desarrolladores y científicos de
datos, con el objetivo de construir y desplegar aplicaciones predictivas.
Ofrece una amplia gama de plantillas de motores predictivos descargables, que los desarrolladores pueden
personalizar fácilmente.
PredictionIO ayuda a los desarrolladores construir y desplegar motores predictivos de forma más rápida, y
ayuda a los científicos a evaluar modelos y realizar un seguimiento de la historia de ajuste de parámetros.
También ayuda a unificar los diferentes tipos de datos de múltiples plataformas, y proporcionar una interfaz
para el análisis de datos en paralelo de manera efectiva y sistemática.
Wise.io
Esta empresa desarrolla aplicaciones de aprendizaje automático para conocer mejor la experiencia del
cliente.
Fue fundada en 2012 por algunos de los principales expertos del mundo de la astrofísica, estadística, y
ciencias de la computación.
El equipo creó marcos de aprendizaje automático automatizados que se utilizan para descubrir y entender
algunos de los fenómenos más raros del universo.
En 2013 la compañía incorporó ejecutivos de empresas, que aportaron análisis avanzados para el mercado
de software empresarial, proporcionando aplicaciones de aprendizaje automático que permiten optimizar
la experiencia del cliente a través de su ciclo de vida.
33
Skymind
Es una firma de inteligencia de negocios y software empresarial con sede en San Francisco, California.
Analizan los medios de comunicación de texto, imagen, vídeo, series de tiempo y sonido, para localizar y
cuantificar los patrones que afectan al negocio de los clientes.
Está formado por un equipo de especialistas en aprendizaje y robots. Ofrecen aprendizaje profundo flexible
y escalable para la industria.
El aprendizaje profundo se está convirtiendo en una herramienta importante para establecer el
procesamiento de lenguaje natural, la visión por computador, las predicciones de bases de datos, el
reconocimiento de patrones, y el procesamiento de imágenes / vídeo, y la detección de fraudes.
Euclid Analytics
Esta empresa ofrece análisis web para el comercio electrónico.
Su servicio de análisis basado en la nube ayuda al comercio minorista online a cuantificar el impacto de la
comercialización, optimizar el rendimiento de la tienda, y entender el comportamiento del cliente.
También ayuda en la toma decisiones basadas en datos, que permiten atraer, involucrar, y retener a los
clientes.
34
1.4.4 Asociaciones relacionadas con áreas de la inteligencia artificial
IEEE Computer Society
La IEEE Computer Society es una de las 36 sociedades dentro de IEEE (Institute of Electrical and Electronic
Engineers).
En la actualidad IEEE es la mayor sociedad profesional técnica del mundo, contando con 370.000 asociados
en 150 países).
Su objetivo es proporcionar información técnica y servicios a los profesionales de la informática a nivel
mundial.
International Association for Pattern Recognition (IAPR)
Es una asociación científico-profesional no lucrativa involucrada en temas de reconocimiento de patrones,
visión artificial y tratamiento de imágenes.
Está organizada geográficamente por países, por lo que los interesados en participar en las actividades
organizadas por la IAPR se adhieren a su organización nacional.
IAPR también patrocina algunas otras conferencias en estas áreas de inteligencia artificial.
Asociación Española de Reconocimiento de Formas y Análisis de Imágenes (AERFAI)
Se trata de la asociación española que desde 1982 constituye la organización española dentro de la IAPR.
La AERFAI organiza cada dos años un congreso nacional: el Simposio Nacional de Reconocimiento de Formas
y Análisis de Imágenes.
Además, publica periódicamente un boletín para los miembros de la asociación y algunos libros sobre temas
relacionados a nivel nacional.
35
1.5 Patentes a nivel nacional e internacional
1.5.1 Nivel nacional
Actualmente en España se encuentran registradas en la Oficina Española de patentes y marcas más de 900
patentes del ámbito de la Inteligencia Artificial.
Debido a que este ámbito ocupa áreas muy diversas, se ha realizado un análisis en base a éstas.
El siguiente gráfico se muestran las patentes registradas de cada una de las áreas identificadas en el ámbito
de investigación de Inteligencia Artificial:
Número de patentes por área
Fuente: Elaboración propia a partir de la Oficina Española de Patentes y Marcas
125
1 26
20
32
313
126
297
Número de Patentes por Área
Sistemas Expertos Aprendizaje y Razonamiento Automático
Robótica Procesamiento de Lenguaje Natural
Visión por Computador Redes Neuronales Artificiales
Lógica Difusa Algoritmos Genéticos
Realidad Virtual
36
A continuación se expone una muestra de las patentes más relevantes en el ámbito de la inteligencia
artificial, si bien las patentes de las áreas de Robótica y Procesamiento de Lenguaje Natural no se han
incluido en el detalle al recogerse en sus correspondientes documentos:
Área de Visión por Computador
Nombre de la patente Nº de publicación Solicitante
Dispositivo y procedimiento automático para establecer el sexo al que
pertenecen los rostros que aparecen en imágenes
ES2339100 A1 Universidad Politécnica de Madrid
Descripción
La presente invención resuelve los problemas existentes en el estado de la técnica mediante el uso de un clasificador basado en uno de los métodos más sencillos de clasificación lineal: Análisis de Componentes Principales (PCA), seguido del Análisis Discriminante Lineal de Fisher (LDA), utilizando un clasificador Bayesiano en el espacio de dimensión reducida que se obtiene del LDA, siendo la selección de las características de PCA más discriminantes el paso crucial para el aumento del rendimiento
Nombre de la patente Nº de publicación Solicitante
Sistema y método de asistencia de atraque de una pasarela de embarque
ES2385883 A1 Thyssen Krupp Elevator Innovation Center,
S.A.
Descripción
La invención integra un sistema de visión artificial para el reconocimiento de imágenes con capacidad para seguir un objeto, detectar movimiento, reconocer diferentes objetos e interactuar con ellos. Para el problema de acoplamiento de la pasarela de embarque, la presente invención emplea además técnicas de monitorización y control
Nombre de la patente Nº de publicación Solicitante
Procesador de imágenes para extracción de características
ES2421581 A1 Universidad de Santiago de Compostela
Descripción
Procesador de imágenes para extracción de características que comprende un único chip no planar que contiene una pluralidad de elementos de sensado y procesado distribuidos en dos o más capas adaptados
Nombre de la patente Nº de publicación Solicitante
Procedimiento para la estimación automática de los componentes de la
producción de un racimo de vid mediante visión artificial
ES2505330 A1 Universidad Politécnica de Valencia
Descripción
Procedimiento que permite estimar de forma automática, y sin destrucción de los racimos, los componentes de la producción de un racimo de vid mediante visión artificial. La presente invención resulta de gran interés para el sector vitivinícola en general, y especialmente para la estimaci6n de producción de cantidad y calidad de uva
37
Área de Visión por Computador
Nombre de la patente Nº de publicación Solicitante
Sistema de aproximación a una plataforma de un vehículo no tripulado
mediante análisis visual ES2387144 A1 Universidad Complutense de Madrid
Descripción
La invención trata de un sistema de aproximación a, o alejamiento de, una plataforma de un vehículo no tripulado, que mediante el análisis visual reconoce un dispositivo también reivindicado, proporcionando información de tal forma que los vehículos no tripulados puedan aterrizar/despegar en el caso de los UAVs y atracar/partir en el caso de los UMVs
Nombre de la patente Nº de publicación Solicitante
Arquitectura híbrida simd/mimd dinámicamente reconfigurable de un coprocesador para sistemas de visión
ES2391733 A1 Universidad de Santiago de Compostela
Descripción
La invención presenta una aplicación en sistemas de visión artificial para aplicaciones de video-vigilancia inteligente, guiado de robots, procesado de imagen médica o dispositivos de seguridad en el automóvil, y en general a sistemas que se basen en el procesado de imágenes o video digitales
Nombre de la patente Nº de publicación Solicitante
Dispositivo y procedimiento de obtención de imágenes densitometrías de objetos
mediante combinación de sistemas radiológicos y cámaras de profundidad
ES2445490 A1 Consejo Superior De Investigaciones
Científicas (CSIC)
Descripción
Dispositivo que obtiene información de la superficie de un objeto mediante el uso de cámaras de profundidad o cámaras de profundidad con textura combinada con uno o varios sistemas radiológicos. Registrando el sistema radiológico y las cámaras de profundidad se introduce información espacial en el análisis de las imágenes de rayos X
Nombre de la patente Nº de publicación Solicitante
Expositor virtual ES2334079 A1 Universidad de Las Palmas de Gran Canaria
Descripción
La presente invención implementada por ordenador hace referencia a un expositor virtual conformado por una serie de dispositivos y por un software que detecta y localiza, en coordenadas de la imagen, las características faciales del usuario mediante técnicas basadas en visión por computador y realiza una adición automática de elementos sintéticos a la imagen del usuario
38
Área de Sistemas Expertos
Nombre de la patente Nº de publicación Solicitante
Mejora de imágenes ES2146599 T3 International Business Machines Corporation
Descripción
Esta invención se refiere generalmente a mejoras en el tratamiento de imágenes y, más particularmente, al retoque o mejora de imágenes usando tecnología de sistemas expertos
Nombre de la patente Nº de publicación Solicitante
Evaluación de amenazas y asignación de armamento automáticas basadas en el
conocimiento ES2212377 T3 Raytheon Company
Descripción
Esta invención se refiere a sistemas de evaluación de amenazas y de asignación de armamento automáticas y, más concretamente, a un sistema de este tipo que incorpore a la solución bases de datos de conocimiento o técnicas de sistemas expertos
Nombre de la patente Nº de publicación Solicitante
Procedimiento para la explotación de una instalación técnica
ES2219508 T3 Siemens A.G.
Descripción
Instalación dosificadora de hidracina para un circuito de vapor de agua. En muchas instalaciones técnicas modernas, por ejemplo centrales de energía, se utilizan sistemas expertos para la diagnosis del estado de funcionamiento para ofrecer a los operadores una ayuda para la explotación de la central de energía - en especial en caso de avería. Los diagnósticos elaborados por un sistema experto ofrecen normalmente información sobre la clase de avería, el lugar en donde se ha producido y posibles medidas para su solución. El operador se ve con ello aliviado en la tarea de detectar posibles relaciones operativas y por medio de esto le es más fácil solucionar averías. El sistema experto contiene con ello los llamados conocimientos expertos como base científica, que se utiliza después para establecer el diagnóstico
Nombre de la patente Nº de publicación Solicitante
Sistemas para generar y analizar matrices de señal de salida estimulo-respuesta
ES2183006 T3 The Regents of The University of California
Descripción
Generación y análisis de perfiles de señales estimulo-respuesta adaptados a sistemas de inteligencia artificial basados en ordenadores, tales como las redes neurales y los sistemas expertos, y su uso como modelos para respuestas sistémicas
Nombre de la patente Nº de publicación Solicitante
Procedimiento interactivo de programación ES2201118 T3 ACTV, Inc.
Descripción
Método para proporcionar programas interactivos basados en sistemas expertos y con un método y un terminal interactivo para recibir programas interactivos basados en sistemas expertos. Los sistemas “interactivos” son conocidos en la técnica, particularmente en el contexto de los sistemas interactivos de televisión o del teléfono. En la mayoría de los casos, la “interactividad” proporcionada por estos sistemas permite al usuario del sistema controlar lo que se ve o se oye en el sistema pulsando botones en un controlador bidireccional o un teclado de tonos. Sin embargo, estos sistemas proporcionan solamente un bajo nivel de respuesta a la conversación
39
Área de Sistemas Expertos
Nombre de la patente Nº de publicación Solicitante
Aparato de diagnóstico hematológico que utiliza la tecnología de los sistemas expertos
ES2076154 T3 Becton Dickinson and Company
Descripción
Este invento se refiere a un aparato para diagnosis hematológica, esto es, un aparato que basándose en datos hematológicos obtenidos de un instrumento, alimentados al aparato, recupera del registro en la memoria información diagnostica y hematológica, y efectúa un registro del mismo que queda disponible para un especialista en hematología (hematólogo) o incluso para un médico general. Como se observará seguidamente, el aparato emplea tecnología de ordenador y procesador de datos, y más particularmente una tecnología de sistema experto que es un ramal de la tecnología comúnmente conocida como inteligencia artificial
Nombre de la patente Nº de publicación Solicitante
Comprobador de sistema experto ES2024939 A6 Westinghouse Electric Corporation
Descripción
La presente invención está dirigida a un comprobador de sistema experto que permite una comprobación extensa de las bases de reglas del sistema experto sin que el programa de prueba tenga ningún conocimiento de la base de reglas particular que está probándose y, más particularmente, proporciona un método práctico de prueba de regresión para analizar los cambios de la base de reglas después de que se ha efectuado una modificación que es eficaz respecto al coste y aumenta significativamente la calidad de la base de reglas
Nombre de la patente Nº de publicación Solicitante
Mecanismo de filtración de reglas de producción y motor de inferencia para
sistema experto que comprende tal mecanismo
ES2130374 T3 Alcatel
Descripción
El invento se refiere a un mecanismo de filtración de reglas de producción que expresan condiciones a satisfacer, destinado a identificar, en el curso de ciclos de inferencia sucesivos de reglas, la o las reglas cuyas condiciones son satisfechas por hechos deducidos y que comprende un sistema de selección para ordenar las condiciones de las reglas en función de un criterio de selección con objeto de comprobar las condiciones de las reglas sobre la base de un orden de toma en cuenta de dichas condiciones
Nombre de la patente Nº de publicación Solicitante
Sistema experto virtual de consulta y respuesta
ES2076228 T3 International Business Machines Corporation
Descripción
El presente invento trata de sistemas expertos con inteligencia artificial que aceptan interrogaciones y tienen la capacidad de responderlas. Trata, más particularmente, de un procedimiento y de un aparato que permite proporcionar, en un sistema que no dispone ni del fondo de conocimientos ni del mecanismo de inferencia y de mando de acceso de un verdadero sistema experto, respuestas equivalentes a las suministradas por un sistema experto integral
40
Área de Algoritmos Genéticos
Nombre de la patente Nº de publicación Solicitante
Método de estimación de composición y de control para columnas de destilación
ES2422954 A1 Universidad de Málaga
Descripción
La presente invención está relacionada con las técnicas empleadas en la dinámica y control de procesos, y particularmente está relacionada con un método de estimación de composición y de control para columnas de destilación. Más particularmente, la presente invención presenta un sistema de estimación de composición y nivel para una columna de destilación mediante el uso de técnicas de control basado en redes neuronales y algoritmos genéticos. La estimación se realiza en la composición de cabeza y cola de la columna con base en redes neuronales utilizando variables secundarias de fácil medición
Nombre de la patente Nº de publicación Solicitante
Circuito digital que implementa un algoritmo genético para la configuración de circuitos de propósito general
ES2278516 A1 Universitat de Les Illes Balears
Descripción
La presente invención se refiere a un circuito digital que implementa un algoritmo genético para la configuración de circuitos de propósito general. Dicha invención está optimizada para aplicaciones en tiempo real
Nombre de la patente Nº de publicación Solicitante
Perfil de rueda de ferrocarril para bogies de doble ancho UIC e ibérico
ES2395542 A2
Universidad del País Vasco - Euskal Herriko Unibertsitatea
Descripción
Perfil de rueda de ferrocarril para bogies de doble ancho UIC e ibérico formado por una sucesión de tramos rectos y arcos de circunferencia, con continuidad en la primera derivada en la zona de contacto con el carril, formado por una pestaña, una zona de transición, una banda de rodadura y una zona externa de la rueda. El perfil ha sido optimizado por medio de algoritmos genéticos y presenta un mejor comportamiento del contacto rueda-carril en ambos tipos de vía, tanto en recta como en curva, manteniendo la misma estabilidad dinámica en vías de ancho UIC, y una mejora sustancial de la inscripción en curva en ambos tipos de vías, reduciendo el desgaste
Nombre de la patente Nº de publicación Solicitante
Método y sistema de programación genética ES2217308 T3 Worzel, William P.
Descripción
El presente invento se refiere a sistemas informáticos para descubrir programas eficaces a través de técnicas de programación genética. Más concretamente, el invento combina algoritmos genéticos con técnicas de reducción de grafos para producir un sistema informático que permita la evolución eficaz de programas para resolver problemas cuya entrada es conocida y que tienen una función para determinar si un programa es mejor que otro
Nombre de la patente Nº de publicación Solicitante
Método para el modelado del nivel de glucemia mediante programación genética
ES2540159 A1 Universidad Complutense de Madrid
Descripción
Aplica la programación genética para encontrar un modelo personalizado que describa y prediga los niveles de glucosa de un paciente. De esta forma, a partir de los datos históricos de un paciente que consisten en valores previos de glucosa, carbohidratos tomados e insulinas inyectadas, obtiene una expresión que puede usarse para predecir valores de glucosa en un futuro próximo.
41
Área de Realidad Virtual
Nombre de la patente Nº de publicación Solicitante
Perfeccionamientos introducidos en la patente de invención N. 9900509 por "simulador de grúa de carga y
descarga" ES2166292 A1
Sociedad Estatal de Estiba y Desestiba del Puerto de Valencia, S.A.
Descripción
Mejoras introducidas en la patente de invención P 9900509 por “Simulador de grúa de carga y descarga”, basadas en la incorporación de varios espejos con sus correspondientes pantallas de retroproyección, sobre los componentes principales del simulador que son, un subsistema de cálculo para el modelo visual, un subsistema de simulación de movimiento, un subsistema de proyección y cabina, gobernado por un subsistema dinámico de control, basado el conjunto en técnicas de realidad virtual, de manera que la visión que se obtiene desde la cabina de mandos es frontal, lateral, superior e inferior, permitiendo por tanto simular otros modelos de grúa que precisen de esta visión
Nombre de la patente Nº de publicación Solicitante
Sistema de realidad virtual para la evaluación y el tratamiento de los trastornos motores asociados a las
enfermedades neurodegenerativas y a la edad ES2397031 A1 Universidad de Coruña
Descripción
El objetivo de la presente invención es desarrollar un sistema de realidad virtual para la evaluación y el tratamiento de los trastornos motores asociados a las enfermedades neurodegenerativas y a la edad. Mediante el sistema propuesto se obtiene el objetivo descrito y se consiguen mejoras respecto a los sistemas conocidos tales como la portabilidad, el bajo coste y la flexibilidad en la creación de distintos entornos virtuales con aplicaciones específicas para la evaluación y el tratamiento de los problemas de movimiento de los miembros superiores, inferiores, la marcha y el equilibrio. Asimismo, el sistema es capaz de integrar registros de parámetros biológicos de los pacientes obtenidos por otros dispositivos periféricos
Nombre de la patente Nº de publicación Solicitante
Disposición estructural de visualización estereoscópica aplicable en entornos de realidad virtual
ES1064924 U Frontera Azul System, S.L
Descripción
La invención se refiere a una disposición estructural de visualización estereoscópica aplicable en entornos de realidad virtual, que aporta a la función a que se destina varias ventajas e innovadoras características, que se describirán en detalle más adelante, que suponen una destacable mejora a lo ya conocido en este campo
Nombre de la patente Nº de publicación Solicitante
Sistema y procedimiento de comunicación basada en realidad virtual
ES2231035 A1 Frontera Azul Systems, S.L.
Descripción
La presente invención se refiere a un sistema y un procedimiento de comunicación entre seres humanos basados en realidad virtual. El sistema constituye una plataforma de comunicación que posibilita y agiliza la colaboración entre interlocutores distantes geográficamente que mantienen su identidad y privacidad en un entorno compartido
42
Área de Realidad Virtual
Nombre de la patente Nº de publicación Solicitante
Sistema portable de realidad virtual basado en proyección
ES2326610 A1 Universidad Politécnica de Catalunya
Descripción
La presente invención se refiere a un sistema de realidad virtual basado en proyección que permite a una persona percibir imágenes tridimensionales y a la vez es fácilmente desmontable y portable. Gracias a esta invención se consiguen notables mejoras con relación a los sistemas de proyección conocidos hasta ahora, mejoras que afectan al tamaño reducido del sistema que permite su portabilidad, a la facilidad de ensamblaje y desensamblaje y a la posibilidad de orientar el sistema hacia la parte del modelo virtual que se quiere inspeccionar o manipular
Nombre de la patente Nº de publicación Solicitante
Equipo de entrenamiento multifuncional con mando extraíble de simulación interactiva
ES2324054 T3 Lai, Yin-Liang
Descripción
La invención se refiere a un equipo de ejercicios multifuncional de realidad virtual capaz de desarrollar una función de simulación virtual tridimensional por Internet utilizando un mando interactivo como interfaz entre el equipo de ejercicios y un ordenador personal
Nombre de la patente Nº de publicación Solicitante
Modelado de realidad virtual ES2226772 T3 Lego A/S
Descripción
La presente invención se refiere al campo del modelado de realidad virtual asistido por ordenador mediante elementos geométricos predefinidos
Nombre de la patente Nº de publicación Solicitante
Método y dispositivo para la interconexión de un espacio de realidad virtual con el espacio real, para
realizar una conexión de comunicación en tiempo real tal como una conexión de llamada telefónica
ES2258786 T3 Helsingin Puhelin Oy - Helsingfors Telefon
AB
Descripción
La presente invención se refiere a un método según el preámbulo de la reivindicación 1, para la interconexión de un espacio de realidad virtual y el espacio real con el objetivo de establecer una conexión de comunicaciones en tiempo real, tal como una conexión de llamada telefónica. La presente invención se refiere también a un aparato para enlazar un espacio de realidad virtual con un espacio real
Nombre de la patente Nº de publicación Solicitante
Sistema y método para su funcionamiento en el espacio virtual 3D
ES2354985 T3
3D For All Számítastechnikai Fejleszto KFT.
Descripción
43
Área de Realidad Virtual
La patente USA Nº 5.227.985 da a conocer un sistema de detección para controlar la posición y la orientación de un objeto rígido. En la superficie del objeto están montadas, por lo menos, 4 fuentes luminosas puntuales en una disposición no coplanaria. Una única cámara electrónica captura imágenes de las fuentes luminosas puntuales. El objeto está sostenido por un operador para un control con un cursor tridimensional y para la interacción con escenas de realidad virtual en dispositivos de visualización para ordenador, y para un control remoto interactivo de mecanismos accionados a distancia. El sistema no proporciona compensación por los cambios del punto de visión del usuario
Nombre de la patente Nº de publicación Solicitante
Visor plegable para el visionado de contenido estereoscópico en dispositivos gráficos móviles
ES1138157 U Delgado Manzano, Rafael
Descripción
Esta invención se refiere a un visor plegable y desplegable, personalizable y optimizado funcional y económicamente, para visionado de contenido 3D estereoscópico de realidad virtual en la gran mayoría de dispositivos gráficos móviles actuales, tales como teléfonos móviles o aparatos similares
Nombre de la patente Nº de publicación Solicitante
Sistema de adaptación de gafas de realidad virtual para visualización de realidad aumentada estereoscópica
envolvente ES1136432 U Abad Rubio, Pablo
Descripción
El objeto de la presente invención es un nuevo dispositivo que se acopla a unas gafas de realidad virtual, capta las imágenes del entorno y mediante un software específico es capaz de fusionar modelos virtuales con las imágenes captadas y reproducirlas en la pantalla de las propias gafas de realidad virtual, obteniendo así una visión estereoscópica en primera persona de un entorno de realidad aumentada. Dado que el ángulo de visión que el sistema es capaz de presentar es de 90º o más por ojo, se denomina envolvente debido a que envuelve o abarca en gran medida el campo de visión del usuario sin que el mismo perciba que está viendo el entorno con un campo de visión reducido
Nombre de la patente Nº de publicación Solicitante
Sistema de tomas de vista destinado a la realización de montajes de realidad virtual
ES2307646 T3 DBJAY, Jean-Michel
Descripción
El presente invento concierne un dispositivo para realizar tomas de vistas o planos en tres dimensiones, destinado principalmente a la realización de montajes VR (para Virtual Reality). El montaje VR es un proceso informático según el cual los clichés pasan por un tratamiento numérico para ser visualizados en ordenadores con la ayuda de un programa de visualización llamado “viewer” que da la ilusión de una representación en tres dimensiones de la realidad fotografiada. Estos montajes en tres dimensiones son construidos a partir de imágenes fotográficas reales, contrariamente a las imágenes numéricas 3D llamadas imágenes de síntesis.
Nombre de la patente Nº de publicación Solicitante
Sistema de fumar por realidad virtual ES2346002 T3 Philip Morris Products S.A.
Descripción
Se incluye un sistema para fumar por realidad aumentada o virtual que proporciona sensaciones de fumar, tales como el sabor, el tacto, el aroma y experiencias visuales de fumar un producto de tabaco (o artículo para fumar), tal como un cigarrillo, pero sin un humo o quemado real de tabaco. Según lo previsto, se proporciona una experiencia de imitación a fumar con un sistema para fumar por realidad virtual o aumentada, que incluye un dispositivo con la forma, peso, tacto y resistencia a la succión (RTD) de un artículo para fumar, aditivos en el dispositivo y una pantalla de realidad aumentada o virtual
44
Área de Lógica Difusa
Nombre de la patente Nº de publicación Solicitante
Método y dispositivo para controlar un sistema RGE en un motor de combustión
ES2427763 T3 FPT Motorenforschung AG
Descripción
Método para operar un motor de combustión interna para un control de NOx de salida variable tomando en cuenta la generación de la RCS. El método se basa en una gestión de punto de consigna en base a lógica difusa
Nombre de la patente Nº de publicación Solicitante
Acondicionador de aire ES2275327 T3 Mitsubishi Denki Kabushiki Kaisha
Descripción
Acondicionador de aire de esta clase, que tiene la capacidad de ser controlado utilizando un control PID, un control de lógica difusa o un control por algoritmo genético o similar
Nombre de la patente Nº de publicación Solicitante
Procedimiento de regulación del calentamiento de un horno utilizando la
técnica de la lógica difusa ES2117961 T1 Stein Heurtey
Descripción
Horno para la fusión del cobre que comprende un sistema de regulación que utiliza igualmente la técnica de la lógica difusa, siendo las entradas/salidas del sistema de lógica difusa típicas del procedimiento, por ejemplo la inclinación del horno
Nombre de la patente Nº de publicación Solicitante
Sistema de control fuzzy multivariable para la regulación simultánea del estado
hipnótico y analgésico de un paciente
ES2483596 A2 Universidad de La Laguna
Descripción
Se describe un sistema de administración automática de fármacos en pacientes sometidos a intervención quirúrgica. La solución aportada es un único controlador que determina simultáneamente las velocidades de infusión de los fármacos para regular el grado de hipnosis y analgesia del paciente sometido a dicha intervención. El hecho de que sea un único controlador para infundir ambos fármacos es de especial relevancia, comparándose esta estrategia con otras invenciones similares que utilizan técnicas diferentes para el control de los estados anestésico y analgésico de pacientes. El esquema de control está basado en lógica difusa, que permite transmitir fácilmente el conocimiento experto respecto a la dinámica de pacientes sometidos a la infusión de los fármacos en reglas de control. La invención aporta, además, la solución a la conectividad entre dispositivos e implementación del controlador en un pe portátil que contiene un software gráfico para la monitorización y control de las variables de interés, el almacenamiento de las mismas para su uso posterior y la gestión de alarmas
45
Área de Lógica Difusa
Nombre de la patente Nº de publicación Solicitante
Sistema de control para la regulación del estado analgésico de un paciente en
operaciones quirúrgicas ES2483040 A2 Universidad de La Laguna
Descripción
Se describe un sistema de administración automática de analgésico en pacientes sometidos a intervención quirúrgica, mediante la medida del dolor a través de la conductancia de la piel. La solución aportada determina la velocidad de infusión del fármaco para regular el grado de analgesia del paciente sometido a dicha intervención. El esquema de control está basado en lógica difusa, que permite transmitir fácilmente el conocimiento experto respecto a la dinámica de pacientes sometidos a la infusión de los fármacos en reglas de control
Nombre de la patente Nº de publicación Solicitante
Dispositivo de control de un motor sobrealimentado que comprende la utilización de un elemento de lógica
difusa
ES2278124 T3 Renault S.A.S.
Descripción
El ámbito técnico de esta invención es el automóvil y, de modo más preciso, el mando de motores diesel o de gasolina sobrealimentados
Nombre de la patente Nº de publicación Solicitante
Controlador dinámico de detección de patrones de trafico mediante lógica
difusa ES2345647 A1 Universidad de Sevilla
Descripción
El objeto principal de la presente invención es un controlador dinámico configurado para la detección de patrones de tráfico en sistemas de transporte vertical, definido este controlador por un método y un dispositivo, y en donde dicha identificación es un elemento clave para la determinación de los algoritmos y reglas de despacho que deberán llevar a cabo las asignaciones de cabina según la llamada de planta. La presente invención se inscribe en el ámbito de la ingeniería de transporte y más concretamente en el transporte vertical mediante uso de ascensores o grupos de ascensores
Nombre de la patente Nº de publicación Solicitante
Aspiradores de polvo que comprenden una unidad de mando de lógica difusa
ES2125026 T3 Moulinex S.A.
Descripción
La presente invención se refiere a los aspiradores que comprenden una caja que comprende un compartimiento para el polvo, que aloja una bolsa para el polvo, y un compartimiento de aspiración que comunica con el compartimiento para el polvo por un orificio de circulación de aire y que comprende un grupo motoventilador; y un tubo de aspiración, del cual uno de los extremos comunica con la bolsa para el polvo por un orificio de empalme practicado en la caja y el otro extremo está acoplado a un órgano chupador que presenta una abertura de aspiración
46
Área de Lógica Difusa
Nombre de la patente Nº de publicación Solicitante
Sistema y procedimiento de control de señales de tráfico
ES2532429 T3 Road Safety Management LTD
Descripción
La presente invención se refiere a un procedimiento y un sistema de control de señales de tráfico. En particular, la 5 invención se refiere a un sistema de control de señales de tráfico multi-agente que utiliza lógica difusa
Nombre de la patente Nº de publicación Solicitante
Controlador dinámico y método de control difuso de grupo de ascensores
para la optimización del consumo energético
ES2370616 A1 Universidad de Sevilla
Descripción
El objeto de la presente invención es un método y controlador dinámico de optimización de la energía de los del tipo empleado por sistemas de control de grupo de ascensores para transporte vertical que minimiza el gasto energético de las cabinas atendiendo a una triple valoración, mediante lógica difusa, de todas y cada una de las asignaciones del tipo llamada de planta-ascensor factibles de formar parte del despacho. La presente invención, por cuanto resuelve un problema técnico de transporte vertical, forma parte del ámbito de la ingeniería de transporte, y más concretamente de los dispositivos electrónicos aplicados al control del movimiento de ascensores y similares
Nombre de la patente Nº de publicación Solicitante
Procedimiento de regulación y circuito de regulación
ES2108767 T3 Deutsche Thomson-Brandt GMBH
Descripción
La presente invención se refiere a un procedimiento de regulación y a un circuito de regulación, que funcionan según el principio de lógica difusa
Nombre de la patente Nº de publicación Solicitante
Sistema de control de vuelo ES2364237 T3 EADS Deutschland GMBH
Descripción
El sistema de control de vuelo según la invención consiste en un ordenador que funciona simultáneamente en paralelo con la regulación de vuelo y que, como observador atento, vigila parámetros de vuelo y de sistemas. Se basa, por un lado, en conocimientos altamente complejos de complicados análisis de simulación realizados en componentes individuales de aviones, así como de análisis de árbol de defectos. La implementación de este conocimiento se puede realizar de manera barata y favorable en tiempo por medio de la lógica difusa empleada en el sistema de control de vuelo
47
1.5.2 Nivel internacional
Según la Global Patent Search Network, existen actualmente 4.491 patentes sobre Inteligencia Artificial
registradas en todo el mundo (con el concepto “Artificial Intelligence” en la patente). El siguiente gráfico
muestra el número de patentes que han sido publicadas anualmente desde 1986:
Patentes registradas a nivel internacional
Fuente: Elaboración propia a partir de Global Patent Search Network
Dado que el término “Inteligencia Artificial” abarca muchas áreas y conceptos, se ha realizado un análisis
de patentes en relación a las diferentes áreas, obteniendo cerca de 320.000 patentes:
Número de patentes por área
Fuente: Elaboración propia a partir de Global Patent Search Network y UK Intellectual Property Office
0
100
200
300
400
500
600
700
22.150
135.952
119.644
9.355
12.349
7.2985.510 7.075
Número de Patentes por Área
Sistemas Expertos Aprendizaje y Razonamiento AutomáticoRobótica Procesamiento de Lenguaje NaturalVisión por Computador Redes Neuronales ArtificialesLógica Difusa Algoritmos GenéticosRealidad Virtual
48
IBM es la empresa líder en patentes registradas, con cerca de 500 relacionadas directamente con la
Inteligencia Artificial, y casi 7.000 patentes en total. El superordenador de IBM – Watson -, es un ejemplo
de transformación de empresas a través de la Inteligencia Artificial, ya que entró en el sector de la salud
en 2013 y ayudó a reducir la tasa de errores en los diagnósticos de cáncer.
De la misma manera, Microsoft, Google y SAP también han invertido en patentar sus tecnologías de
inteligencia artificial.
Por otro lado, muchas empresas han adquirido startups con tecnologías de inteligencia artificial. Por
ejemplo, Google compró seis empresas con tecnologías de Inteligencia Artificial, en concreto relacionadas
con el reconocimiento de imágenes, el procesamiento de lenguaje natural, y las redes neuronales; o Yahoo,
que compró varias empresas relacionadas con el reconocimiento de imágenes y el procesamiento de lenguaje
natural.
Patentes por tipo de tecnología y propietario
Fuente: United States Patent and Trademark Office
49
2 Análisis de Oportunidades de Negocio
2.1 Investigación en Inteligencia Artificial
La investigación en inteligencia artificial está muy especializada y dividida en áreas, que a menudo no se
comunican entre sí. Algunas áreas se centran en la solución de determinados problemas, mientras que otras
se centran en enfoques, en el uso de herramientas o en el desarrollo de aplicaciones.
Las áreas centrales de la investigación en inteligencia artificial incluyen el razonamiento, el
conocimiento, la planificación, el aprendizaje, el procesamiento de lenguaje natural, la percepción y la
capacidad de moverse y manipular objetos.
Los enfoques más utilizados son los métodos estadísticos y la inteligencia computacional. Existe un gran
número de herramientas, como por ejemplo la búsqueda y optimización matemática, lógica, métodos
basados en la probabilidad y en la economía.
El campo de la inteligencia artificial es interdisciplinario, donde varias ciencias convergen, entre las que
destacan la informática, las matemáticas, la psicología, la lingüística, la filosofía, la neurociencia y la
psicología artificial.
50
2.1.1 Áreas de investigación
Las áreas de investigación en inteligencia artificial se han priorizado en función de las capacidades
necesarias de un sistema inteligente. Las áreas descritas a continuación son las que han recibido mayor
atención:
Principales áreas de investigación
Fuente: Elaboración propia
Deducción, razonamiento y resolución de problemas
Representación del conocimiento
Planificación
AprendizajeProcesamiento de lenguaje
natural
Percepción
Movimiento y manipulación
Principales
Áreas de
Investigación
1
2
3
45
6
7
51
1. Deducción, razonamiento y resolución de problemas
Los primeros investigadores de Inteligencia Artificial desarrollaron algoritmos que imitaban el razonamiento
de los seres humanos cuando resolvemos acertijos o hacemos deducciones lógicas.
A finales de los años 90 se habían desarrollado métodos de gran éxito para tratar con información incierta o
incompleta, empleando conceptos de probabilidad y de economía.
Para los problemas difíciles, la mayoría de estos algoritmos requieren enormes recursos computacionales,
por lo que la búsqueda de algoritmos de resolución de problemas más eficientes es una prioridad en la
investigación en Inteligencia Artificial.
Los seres humanos resuelven la mayor parte de sus problemas usando juicios intuitivos rápidos en lugar de
a través de la deducción. Actualmente se trabaja para que este tipo de inteligencia también sea capaz de
usar la intuición.
Amnistía Internacional ha hecho algunos progresos en la imitación de este método de resolución de
problemas: enfoques que enfatizan la importancia de las habilidades sensoriomotoras de razonamiento
superior; redes neuronales que intentan simular las estructuras internas del cerebro; enfoques estadísticos
que imitan la naturaleza probabilística de la capacidad humana de adivinar, etc.
52
2. Representación del conocimiento
Muchos de los problemas a resolver por las máquinas, requieren de un amplio conocimiento sobre el
mundo. Entre estas cuestiones se incluyen: objetos, propiedades, categorías y relaciones entre los objetos;
situaciones, eventos, estados, causas y efectos, y muchos otros dominios menos investigados.
Una representación de "lo que existe" es una ontología: el conjunto de objetos, relaciones y conceptos que
se le presentan a la máquina para que los conozca.
Entre los problemas más difíciles de la representación del conocimiento se pueden destacar:
Razonamiento por defecto y el problema de la calificación
Si un pájaro aparece en la conversación, la gente normalmente imagina un animal que es del tamaño de un
puño, canta, y come moscas. Ninguna de estas cosas son ciertas acerca de todas las aves.
John McCarthy identificó este problema en 1969, y lo definió como el problema de calificación: para
cualquier regla de sentido común, tiende a haber un gran número de excepciones.
Casi nada es simplemente verdadero o falso en la forma en que la lógica abstracta requiere.
La amplitud de los conocimientos de sentido común
Los proyectos de investigación que tratan de construir una base de conocimiento completo de los
conocimientos de sentido común, requieren enormes cantidades de laboriosa ingeniería ontológica.
Un objetivo importante es que el equipo entienda suficientes conceptos para ser capaz de aprender
mediante la lectura a partir de fuentes como Internet, y por lo tanto ser capaz de añadir a su propia
ontología.
La forma sub-simbólica de los conocimientos de sentido común
No todo lo que la gente sabe se representa como un "hecho" o una "declaración" expresada verbalmente.
Por ejemplo, un maestro de ajedrez va a evitar una posición particular porque se siente demasiado expuesto,
o un crítico de arte puede echar un vistazo a una estatua y al instante darse cuenta de que es una
falsificación.
Estas intuiciones o tendencias que están representadas en el cerebro, reciben el nombre de sub-
simbólica. Este conocimiento apoya y proporciona un contexto para el conocimiento simbólico, consciente.
53
3. Planificación
Un sistema de control jerárquico es una forma de sistema de control, en el que un conjunto de dispositivos
y el software de gobierno están dispuesto en una jerarquía.
Los agentes inteligentes deben ser capaces de establecer metas y alcanzarlas. Necesitan una manera de
visualizar el futuro (deben tener una representación del estado del mundo y ser capaces de hacer
predicciones sobre cómo sus acciones lo cambiarán), y ser capaces de tomar decisiones que maximicen
la utilidad o el valor de las opciones disponibles.
En los problemas de planificación clásica, el agente asume que es el único que actúa en el mundo y puede
medir las consecuencias de sus acciones. Sin embargo, si el agente no es el único actor, debe periódicamente
determinar si el mundo coincide con sus predicciones y debe cambiar su plan si es necesario, lo que requiere
razonar en condiciones de incertidumbre.
La planificación multi-agente utiliza la cooperación y la competencia de muchos agentes para lograr un
objetivo determinado. Un comportamiento emergente como éste es utilizado por los algoritmos
evolutivos y la inteligencia de enjambre.
4. Aprendizaje
El aprendizaje automático es el estudio de algoritmos informáticos que mejoran automáticamente a través
de la experiencia.
El aprendizaje no supervisado es la capacidad de encontrar patrones en una corriente de entrada.
El aprendizaje supervisado incluye tanto la clasificación como la numérica de regresión:
La clasificación se utiliza para determinar a qué categoría pertenece algo, después de ver una serie
de ejemplos de elementos de varias categorías.
La regresión es el intento de producir una función que describa la relación entre las entradas y
salidas, y predecir cómo las salidas deben cambiar a medida que cambian las entradas.
En el refuerzo de aprendizaje, el agente es recompensado por las buenas respuestas y castigado por las
malas. El agente utiliza esta secuencia de premios y castigos para formar una estrategia de operación en su
espacio.
Dentro de la robótica de desarrollo, lo enfoques de aprendizaje de desarrollo se elaboraron para la
adquisición acumulativa de nuevas habilidades, a través de la auto-exploración autónoma, la interacción
social con los profesores humanos, y el uso de mecanismos de orientación, tales como el aprendizaje activo,
la maduración, las sinergias de motor, y la imitación.
54
5. Procesamiento de lenguaje natural
Un árbol de análisis representa la estructura sintáctica de una oración según la gramática formal.
El procesamiento de lenguaje natural aporta a las máquinas la capacidad de leer y comprender los idiomas
que hablan los humanos.
Un sistema de procesamiento de lenguaje natural suficientemente poderoso permitiría la adquisición de
conocimientos directamente de fuentes humanas por escrito, como textos. Algunas aplicaciones sencillas
de procesamiento del lenguaje natural incluyen la recuperación de información (o minería de texto), y la
traducción automática.
Un método común de procesamiento y extracción de significado de lenguaje natural es a través de la
indexación semántica. El aumento de la velocidad de procesamiento y la caída en el coste de
almacenamiento de datos hace que la indexación de grandes volúmenes sea mucho más eficiente.
6. Percepción
La percepción de la máquina es la capacidad de utilizar la entrada de los sensores (como cámaras,
micrófonos, sensores táctiles), para deducir aspectos del mundo.
La visión por computador es la capacidad de analizar la información visual.
Destacan dentro de este campo también el reconocimiento de voz, el reconocimiento facial y
el reconocimiento de objetos.
7. Movimiento y manipulación
El campo de la robótica está estrechamente relacionada con la Inteligencia Artificial. Los robots requieren
de Inteligencia para ser capaces de manejar objetos.
Algunas aplicaciones de este reto a conseguir son: la navegación, la localización, la cartografía (aprender
lo que está a su alrededor, la construcción de un mapa del entorno), la planificación de
movimientos (encontrar la manera de llegar), o crear una ruta de planificación (ir de un punto del espacio
a otro punto).
55
2.1.2 Objetivos a largo plazo
La inteligencia social
La computación afectiva es el estudio y desarrollo de sistemas y dispositivos que puedan reconocer,
interpretar, procesar y simular los sentimientos humanos.
Es un campo interdisciplinario que abarca la informática, la psicología y las ciencias cognitivas.
La motivación de esta investigación es intentar simular la capacidad de empatía. La máquina debe
interpretar el estado emocional de los seres humanos y adaptar su comportamiento a ellos, dando una
respuesta adecuada a dichas emociones.
Las emociones y las habilidades sociales desempeñan dos papeles para un agente inteligente. Debe ser capaz
de predecir las acciones de los demás, mediante la comprensión de sus motivos y estados emocionales.
Se trata de elementos de la teoría de juegos, teoría de la decisión, así como la capacidad de modelar las
emociones humanas y las habilidades de percepción para detectar emociones.
Creatividad
Es un área de la Inteligencia Artificial se ocupa de la creatividad tanto teóricamente (desde una perspectiva
filosófica y psicológica), como de forma práctica (a través de implementaciones específicas en los sistemas
que generan salidas que se pueden considerar creatividad, o sistemas que identifican y evalúan la
creatividad).
Las áreas relacionadas de la investigación computacional con esta área son la intuición artificial y el
pensamiento artificial.
La inteligencia general
Muchos de los problemas descritos anteriormente requerirán inteligencia general para ser resueltos.
Por ejemplo, la traducción automática requiere que la máquina sepa leer y escribir (procesamiento de
lenguaje natural), siga el argumento del autor (razonamiento), sepa de que se está hablando
(conocimiento), y reproduzca fielmente la intención del autor (inteligencia social).
56
2.2 Aplicaciones de la Inteligencia Artificial
La Inteligencia Artificial es una de las disciplinas computacionales cuyas técnicas son más demandadas
actualmente en diversos entornos, debido a su capacidad para dotar de un comportamiento inteligente a
muchas aplicaciones. A continuación se expone un ejemplo de aplicaciones por sector:
Aplicaciones de la Inteligencia Artificial por sector
Fuente: Elaboración propia
• Mantenimiento predictivo de componentes mecánicos.
• Estimación del consumo eléctrico.
• Distribución de recursos hidráulicos para la producción eléctrica.
• Control de procesos y de la calidad.
• Predicción de roturas en vigas de hormigón.
• Monitorización inteligente de pacientes.
• Análisis y procesado de imágenes.
• Detección de patrones clínicos en señales biomédicas.
• Ayuda al diagnóstico y pronóstico de estados de salud.
• Asesoramiento de actividad deportiva.
• Tratamiento de la información financiera.
• Análisis del fracaso empresarial.
• Estimación de riesgos y rentabilidad de productos financieros.
• Previsión de la evolución de los precios.
• Predicción de los mercados financieros.
• Predicción de fenómenos naturales.
• Estimación del tiempo.
• Gestión de estudiantes.
• Detección de las dificultades de un estudiante y ayuda en su
desarrollo.
• Identificación de personas a través de rasgos similares, huellas, o
algún otro dato importante que permita reconocerlo con la mayor
exactitud posible.
• Analizador de ADN.
• Elaboraciones de modelos biológicos.
• Seguimiento de los comportamientos de diversos organismos.
• Desarrollo de embriones.
• Contenidos bajo demanda (música y cine).
• Publicidad.
• Contenidos de streaming (TV y radio).
• Software interactivo.
AplicacionesSectores
Ingeniería Industrial,
Civil y Naval
Medicina y la Salud
Economía
Climatología
Educación
Legal
Biología
Contenidos
Interactivos
57
Por ejemplo, la incorporación de agentes inteligentes, redes neuronales, sistemas expertos o algoritmos
genéticos, son una tendencia en la optimización de sistemas de producción industrial de países con alto
desarrollo tecnológico y con una gran inversión en investigación y desarrollo.
Dichos componentes de la Inteligencia Artificial tienen como función principal controlar de manera
independiente, y en coordinación con otros agentes, componentes industriales tales como celdas de
manufactura o ensamblaje, operaciones de mantenimiento, diagnósticos de sistemas, etc.
Las aplicaciones en los sectores de Ingeniería Industrial, Civil y Naval de estas técnicas son muy amplias,
entre las que se pueden destacar las siguientes:
Métodos para la predicción de fallos y anomalías en sistemas mecánicos como motores o engranajes.
Mantenimiento predictivo de componentes mecánicos.
Estimación del consumo eléctrico.
Distribución de recursos hidráulicos para la producción eléctrica.
Sistemas para el control de procesos y de la calidad.
Modelos para la predicción de roturas en vigas de hormigón.
Diseño de diques verticales.
La mayoría de los sistemas de inteligencia artificial tienen la peculiaridad de “aprender”, lo que les permite
ir perfeccionando su tarea conforme pasa el tiempo, usando para ello los ejemplos o casos con los que
tratan.
Otra de las áreas en las que las técnicas de Inteligencia Artificial tienen una repercusión importante son las
relacionadas con la Medicina y la Salud. La medicina ha tenido la necesidad de incluir la inteligencia
artificial en su campo, ya que se han desarrollado máquinas que interpretan imágenes médicas, controlan
las unidades de cuidados intensivos, monitorizan a los pacientes y realizan diagnósticos. Además, se han
creado máquinas que diseñan prótesis, y hasta sistemas expertos que colaboran con los médicos en
determinadas actividades.
Actualmente se están desarrollado máquinas que detectan las potenciales enfermedades a medio plazo de
un paciente, para poder prevenir muchas de ellas.
En este ámbito existen aplicaciones de inteligencia artificial que permiten:
Monitorización inteligente de pacientes.
Sistemas de análisis y procesado de imágenes.
Detección de patrones clínicos en señales biomédicas.
58
Sistemas de ayuda al diagnóstico y pronóstico de estado de salud.
Asesoramiento de actividad deportiva.
Clasificación en bases de datos de expresiones genéticas.
En el campo de la Economía encontramos diversas aplicaciones como:
Tratamiento de la información financiera.
Análisis del fracaso empresarial.
Estimación de riesgos y rentabilidad de productos financieros.
Previsión de la evolución de los precios.
Predicción de los mercados financieros.
En campos como la Climatología estos sistemas se pueden aplicar para la predicción de fenómenos naturales
y estimación del tiempo.
En el campo de la educación se ha hecho necesario incluir la inteligencia artificial por la gran cantidad de
trabajo que genera el alto número de estudiantes, como pueden ser los sistemas de gestión de estudiantes,
o sistemas que perciben las deficiencias de un estudiante y le ayudan en su desarrollo.
La inteligencia artificial en los videojuegos es cada vez más importante, a pesar de que los usuarios no la
suelen distinguir debido a que está muy implícita a los mismos. Por ejemplo, la inteligencia artificial se ve
reflejada en los avatares.
En el ámbito de la biología es necesario el uso de la inteligencia artificial debido a que existen problemas
de gran complejidad que consumen mucho tiempo y dedicación, y con la aplicación de la inteligencia
artificial se ha logrado reducir la problemática, aportando grandes avances como el analizador de ADN,
elaboraciones de modelos biológicos, seguimientos de los comportamientos de diversos organismos,
desarrollo de embriones, etc.
La inteligencia artificial es capaz de crear sistemas para colaborar con los abogados, desde el asesoramiento
jurídico hasta la identificación de personas con solo los rasgos similares, huellas, o algún otro dato relevante
que permita identificarlo con la mayor exactitud posible.
Otro campo importante de aplicación es la propia Informática, en donde se puede realizar el diagnóstico
de errores, la detección de intrusiones en redes de ordenadores, etc.
A continuación se detallan las aplicaciones del sector de contenidos interactivos, dada su relevancia en la
industria de los contenidos digitales y la economía digital.
59
2.2.1 La Inteligencia Artificial aplicada en los Contenidos Interactivos
Los contenidos interactivos pueden definirse como contenidos audiovisuales cuya selección o características
varían en función del diálogo que el receptor mantenga con el emisor del contenido.
Distintos ejemplos de contenidos interactivos pueden ser, en orden creciente de complejidad, un vídeo bajo
demanda que se puede parar y reanudar desde casa; un sistema de recomendación de canciones que busca
las canciones y los grupos más acordes con el estado de ánimo y los gustos del oyente; o un juego online
que presenta situaciones adecuadas a los gustos del jugador, con un nivel de dificultad apropiado y
adaptándose a sus acciones de una manera coherente con el universo presentado. Todos ellos tienen en
común que el contenido se adapta de alguna manera a la persona que lo recibe.
El campo de la inteligencia artificial presenta numerosas oportunidades para mejorar y enriquecer este
diálogo entre el ser humano y la máquina, o dar herramientas al ser humano, emisor del mensaje, que
permita al receptor comprenderle mejor y más rápidamente. Algunas de ellas ya se están utilizando a
distintos niveles. Por ejemplo, los sistemas de recomendación basados en características se utilizan en
Pandora para elegir la música que pueda gustarle más al usuario del servicio.
Existen multitud de áreas exploradas en el mundo académico que pueden ayudar a adaptar estos contenidos
interactivos de manera más rica y compleja. Por ejemplo, el aprendizaje automático puede permitir a los
adversarios de un juego online modificar sus tácticas en el mismo momento, para sorprender a los jugadores
que ya se hayan encontrado con ellos y dar una sensación de mayor de inteligencia y realismo; la
planificación puede ayudar a distribuir de una manera óptima los componentes de un contenido interactivo
en una red de comunicaciones; y el reconocimiento de características en la música puede seleccionar las
canciones, dentro del gusto del usuario, que sean más acordes con su estado de ánimo.
Para su correcta aplicación hay que tener en cuenta el tipo de contenido, que varía desde puramente lúdica
(videojuegos), a una educativa (teleformación); y la situación de los recursos de computación, que pueden
estar limitados a la plataforma del usuario o localizarse en un servidor central.
La incorporación de funcionalidades avanzadas de inteligencia artificial es una de las claves para el éxito
de los contenidos digitales de la próxima década. Por ello, algunos proyectos europeos se están enfocando
en este sentido, como son el proyecto SIREN o el proyecto AgameComIn.
En campos como la música, el cine o la venta de libros, la tecnología que más impacto ha tenido han sido
los sistemas de recomendación; en los videojuegos, la aplicación para proporcionar oponentes que
representen un reto adecuado para los jugadores humanos; mientras que la radio o la televisión por ahora
no se han beneficiado apenas de los avances en este campo. No obstante, el aumento de conectividad y de
procesamiento en los servidores que proporcionan los contenidos, permiten que se expandan las
posibilidades al entregar este contenido de manera inteligente, o de adaptarlo a las necesidades del usuario.
60
A continuación se enumeran las aplicaciones que pueden beneficiarse de las tecnologías en el campo de la
inteligencia artificial, agrupadas por tipo de contenido. Como contenidos interactivos se entienden servicios
de contenidos proporcionados a través de plataformas fijas o móviles como el teléfono móvil, incluyendo
acceso a contenidos como: programas de televisión y radio, películas, música, publicidad, o software
interactivo, pero exceptuando los servicios de comunicación como la voz, la mensajería o el correo
electrónico.
Los contenidos se pueden clasificar en función de su grado de interactividad, tal y como se muestra a
continuación:
Contenidos bajo demanda (música y cine)
Publicidad
Contenidos de streaming (TV y radio)
Software interactivo
61
Contenidos bajo demanda
Los contenidos bajo demanda se caracterizan porque el contenido no está sujeto a adaptación, sino que es
la selección la que se produce de manera interactiva. En este tipo de contenidos se emplean con frecuencia
sistemas de recomendación que proponen a un usuario ciertos contenidos en función de características
comunes (sistemas basados en contenido), o bien conjuntos de contenidos que se repiten en varios usuarios
(filtrado colaborativo).
Estos sistemas se pueden mejorar con las siguientes cuestiones:
Sistemas de recomendación basados en redes sociales. Permiten que los contactos del usuario le
proporcionen información relevante sobre el contenido recomendado.
Extracción y reconocimiento de características para la recomendación. En los sistemas de
recomendación basados en modelos, se elabora el tipo de modelo sobre el contenido, y se utilizan
las características relevantes para realizar la recomendación. Los contenidos hipertextuales se
tratan actualmente con métodos como “Latent Semantic Indexing” o PageRank; sin embargo, otros
tipos de contenidos como audio y vídeo carecen de sistemas probados de extracción automática
de características útiles para la recomendación.
Relación de contenidos de distintos medios. Del mismo modo en que se pueden extraer
características de un tipo de contenidos, existen contenidos que comparten elementos (por
ejemplo, géneros de relatos en cine y literatura). La capacidad de relacionar distintos tipos de
contenido se muestra como una poderosa herramienta.
A continuación se muestra un ejemplo de cada sistema:
Sistemas basados en contenido
Un ejemplo del primer grupo de recomendadores es Pandora, el portal perteneciente a Music Gnome
Project.
El objetivo de Pandora es ofrecer a sus usuarios una emisora de radio personalizada en internet.
En primer lugar, el usuario debe introducir una canción o artista que sirva como base a su emisora personal.
Tras ello, Pandora construye una lista de música que se irá reproduciendo. Para realizar este proceso,
además de usar los más de 400 atributos que Pandora caracteriza en cada canción, se tiene en cuenta los
gustos de sus usuarios, ya que para cada tema reproducido, el usuario puede indicar si le gusta o no.
Por ello, escuchar música a través de Pandora nos permite conocer nuevos temas o artistas que encajan con
nuestros gustos personales.
62
Recomendador musical de Pandora
Fuente: Pandora
Filtrado colaborativo
Amazon ha implementado un sistema de recomendaciones basándose en las compras realizadas previamente
por sus clientes.
Al visitar la ficha de un producto, el sistema realiza dos tipos de recomendaciones: artículos que suelen
comprarse juntos, y artículos que pueden ser de nuestro interés si nos gusta el que estamos visualizando.
63
Publicidad
La elaboración de contenidos publicitarios suele incluir un proceso de análisis de mercado, a través de un
análisis de datos sobre la población objetivo, con el objetivo de adaptar el mensaje a la audiencia.
La inteligencia artificial puede ayudar a los publicistas de diferentes maneras:
Segmentación de usuarios. La minería de datos y el aprendizaje estadísticos pueden poner en
evidencia características y relaciones entre los potenciales clientes que no sean obvios a los ojos
de los publicistas sin dicho análisis.
Seguimiento de audiencia en tiempo real. La vigilancia de las actitudes de la audiencia (por
ejemplo, consultas en internet o interés medido), puede seguirse y analizarse en tiempo real, con
el objetivo de adaptar el mensaje al máximo en tiempo real.
Publicidad adaptada. Consiste en presentar a cada usuario los anuncios que más le interesen.
Google incorpora esta capacidad en sus anuncios en páginas web, y en menor medida en Youtube.
Con el auge de la televisión por internet, parece adecuado combinar estos métodos en los medios
tradicionales de streaming.
Groovinads
Es una herramienta de optimización y personalización de la publicidad online que, mediante un proceso de
aprendizaje, es capaz de seleccionar el producto a publicitar que más interés provoque en el usuario.
Groovinads analiza factores tales como los siguientes:
Contexto donde se muestran los contenidos. Es analizado para determinar aquellos productos
que estén más relacionados con el ámbito en el que el usuario está navegando.
Comportamiento del usuario. Es definido mediante patrones de conducta e interés, y
contrastado con los productos a publicitar para conseguir una selección más personalizada de
los mismos.
Esta información es utilizada por Groovinads en su algoritmo de aprendizaje para ir mejorando su proceso
de selección según las condiciones de cada momento, maximizando la relación entre el producto publicitado
y el usuario.
64
Anuncios inteligentes
En Julio de 2015 se presentó el primer anuncio generado en base a algoritmos genéticos, creado por las
empresas M&C Saatchi, Clear Channel y Posterscope.
Los elementos del anuncio que provocaron una reacción positiva se mantuvieron durante las siguientes
versiones, mientras que los elementos que generaron una reacción negativa fueron eliminados.
Se trata de campañas que utilizan tecnologías en tiempo real y se adaptan a factores como la temperatura,
el tiempo, la ubicación o la hora del día, así como las emociones, maximizando la relevancia de las
campañas.
65
Contenidos en Streaming
Los contenidos en streaming se caracterizan porque se adaptan con mayor rapidez, incluso realizándose en
directo.
Presentan una mayor interactividad que los contenidos bajo demanda.
Algunas de las aplicaciones de la inteligencia artificial son las siguientes:
Adaptación del contenido en streaming en función del feedback de los usuarios. El feedback de los
usuarios puede tratarse de manera automática, por ejemplo mediante procesamiento de lenguaje
natural, ampliando la capacidad de análisis de los participantes en el programa.
Adaptación del contenido en función del contexto del usuario. El contenido a presentar puede variar
en función del usuario que lo trate. Por ejemplo, mientras que un usuario puede pensar únicamente
en escuchar un programa, es posible que otro quiera acceder a contenidos más precisos sobre la
ubicación de la noticia, información de contexto sobre el tema en cuestión, etc.
Seguimiento de noticias y tendencias en tiempo real. Los feeds de las agencias de noticias o las
aportaciones de los propios usuarios (fotografías o vídeos en el móvil), pueden incorporarse y
procesarse en tiempo real para que sean tratados por los realizadores del contenido en streaming.
ADNStream, por ejemplo, es un servicio streaming de vídeos personalizado para cada usuario.
Su objetivo es ofrecer un sistema de televisión a la carta según los intereses de cada usuario.
Posee un motor inteligente que permite al usuario la visualización de aquellos contenidos que mejor se
adapten a sus preferencias. Para ello, utiliza diferentes factores para realizar una predicción sobre sus
gustos, y así poder tomar una mejor decisión sobre el contenido a mostrar.
66
Presentación de canales en ADNStream
Fuente: ADNStream
Utiliza un sistema de inteligencia analítica que se sirve de las valoraciones de los usuarios.
De esta manera, el usuario únicamente irá valorando los contenidos que va visualizando, construyéndose
automáticamente un perfil de preferencias, que será el que determine qué vídeos le serán recomendados.
67
Software Interactivo
El software interactivo presenta el grado de interactividad más alto, a través del intercambio de información
de manera activa.
En esta categoría se incluyen fundamentalmente el software educativo y juegos (offline y online), cuyo
solape cubre además los denominados “serious games” y las simulaciones.
Como ejemplo en juegos offline destaca la inteligencia artificial del juego FEAR, de Monolith Productions.
En este sistema se reemplaza el sistema exhaustivo de estados finitos por un sistema flexible de
planificación.
Otros aspectos de inteligencia artificial que se pueden introducir en los juegos:
Esquema de colaboración entre agentes: las acciones de los agentes no se realizan por separado,
sino como parte de un plan global. Los sistemas multiagente pueden utilizarse para este propósito
en los juegos.
Técnicas como el aprendizaje por refuerzo permitiría perfilar al contrincante para utilizar una
estrategia más adaptada.
En los juegos online, el análisis de los datos obtenidos en el transcurso del juego, mediante técnicas de
minería de datos, puede ir más allá de la adaptación del comportamiento de los oponentes.
En estos juegos, el perfilado de los usuarios es tan importante como en los sistemas de recomendación o los
sistemas de streaming.
Normalmente este perfilado se realiza buscando correlaciones y relaciones causales entre eventos de juego.
Por ejemplo, si en el transcurso del juego se ha detectado que el jugador prefiere la exploración del mundo
al combate, se puede proporcionar la misma recompensa de dos maneras diferentes: como resultado de
encontrar un camino en un laberinto o bien como parte del equipo de un oponente especial a derrotar.
De este modo el resultado final es el mismo para todos los jugadores, pero obtenido de la manera más
satisfactoria para cada uno de ellos individualmente.
No todas las aplicaciones de inteligencia artificial se orientan al control de agentes en el mundo de juego.
La generación de contenidos por procedimientos apoya al diseñador de juegos en la creación de elementos
de manera aleatoria (número de oponentes, munición, complejidad, etc.).
Por último, tanto el uso de recursos centralizados en juegos online como la potencia creciente de los
ordenadores y las consolas, permiten comenzar a incluir el procesamiento del lenguaje natural en dominios
limitados dentro del juego.
68
2.2.2 La Inteligencia Artificial aplicada al E-Commerce
Cada vez es más frecuente escuchar términos como Marketing Intelligent, buscadores inteligentes o web
inteligente.
La inteligencia artificial está avanzado a pasos agigantados con la aparición de Internet.
Estos avances han beneficiado a los e-commerce con el desarrollo de algoritmos diseñados para entender
las necesidades de los consumidores online.
Las tiendas online han visto la oportunidad de anticiparse a las demandas de su público objetivo,
ofreciéndoles productos personalizados y diseñados a medida para cada uno de ellos.
Por ello, los procesos de inteligencia artificial se han asentado dentro del campo del comercio electrónico,
presentando oportunidades para que los negocios online puedan aumentar su rentabilidad.
Cada vez es más común el uso de herramientas de inteligencia artificial para optimizar la gestión de los
negocios online y, en consecuencia, aumentas las ventas de dichas tiendas.
La inteligencia artificial aplicada al e-commerce también ha supuesto el punto de partida en el desarrollo
del término conocido como marketing inteligente.
Los responsables de marketing y comunicación de las tiendas online se han dado cuenta de la importancia
del uso de herramientas de la inteligencia artificial para sacar partido de la “voz del cliente”, diseñando el
contenido de las plataformas en función de la información extraída en el análisis del público objetivo, a
través de los patrones de comportamiento de los consumidores online.
Otro beneficio de utilizar la inteligencia artificial en los e-commerce es la personalización. Las aplicaciones
de inteligencia artificial permiten a las empresas entender cuáles son los deseos de los consumidores y
orientar sus productos o servicios a estos intereses.
Otro beneficio es la aplicación de la inteligencia artificial en los resultados de búsqueda. Hasta ahora los
motores de búsqueda funcionaban a partir de la identificación de palabras claves, pero no eran capaces de
comprender semánticamente el sentido de estas frases o palabras. Aplicando procesos de inteligencia
artificial este problema desaparece, por lo que los buscadores pueden comprender el sentido de lo que
buscan los usuarios y por qué lo buscan.
Además, cada vez son más las empresas que ofrecen sus servicios de atención al cliente mediante
herramientas basadas en inteligencia artificial, resolviendo de manera rápida y efectiva cualquier duda o
problema que se le presente al cliente en un momento dado.
Otra oportunidad que ofrece la tecnología de la inteligencia artificial son las recomendaciones. En función
de las compras realizadas por un consumidor durante un periodo de tiempo determinado, se realizan
recomendaciones personalizadas sobre productos adicionales, las cuales son cada vez son más precisas.
69
2.2.3 Aplicaciones de la Visión por Computador
La visión por computador es un campo de la ingeniería que incluye métodos para la adquisición, procesado,
análisis y extracción de información de imágenes y/o secuencias de vídeo.
Tales acciones pueden comprender desde el reconocimiento y localización de objetos concretos en imágenes
digitales, hasta aplicaciones de videovigilancia, recuento de personas, control de vehículos, etc.
Cabe diferenciar entre las aplicaciones donde la visión artificial constituye una herramienta por sí sola, de
aquellas otras en las que es parte de un sistema multisensorial. El primer caso engloba todas aquellas
aplicaciones en las que el único sensor presente es el de visión; mientras que el segundo caso se refiere a
por ejemplo la navegación en robótica, donde la visión constituye una capacidad sensorial más para la
percepción del entorno que rodea al robot.
Actualmente existen múltiples aplicaciones prácticas de la visión por computador, entre las que se pueden
destacar las siguientes:
Navegación en Robótica
En este caso, la visión es un elemento de un sistema multisensorial.
La información procedente de la visión es validada, comparada y finalmente integrada con el resto de la
información proporcionada por otro tipo de sensores. El resultado es la reconstrucción de la escena 3D, que
permite la navegación autónoma del sistema.
Para la navegación en robótica se recurre generalmente a técnicas de visión estereoscópica, con el fin de
poder reconstruir la escena 3D.
Se puede añadir un módulo de reconocimiento 3D, identificando la presencia de determinados objetos hacia
los que debe dirigirse o evitar.
No es exclusivo su uso en robótica, sino que podría utilizarse en otras aplicaciones tales como guiado
automático de máquinas agrícolas, o para la detección y estimación del movimiento de vehículos.
70
Biología, Geología y Meteorología
En el campo de la biología se pueden distinguir las aplicaciones microscópicas y las macroscópicas.
En una imagen microscópica existen muchos organismos, que mediante técnicas de segmentación orientadas
a regiones, por ejemplo utilizando una binarización, pueden ser aislados para su identificación mediante las
correspondientes propiedades (tamaño, excentricidad, color, etc.), o para contar el número de
microorganismos o células presentes en la imagen.
En las imágenes macroscópicas pueden utilizarse las regiones para la identificación de determinados tipos
de texturas en vegetales, o características de diferentes áreas naturales por su color, o el crecimiento de
ciertas especies por diferencia de imágenes.
En geología se pueden detectar movimientos de terrenos captando dos imágenes en diferentes momentos
de tiempo, observando la variación mediante una diferencia de imágenes bajo similares condiciones de
iluminación. En esta área también es posible la reconstrucción de áreas 3D mediante visión estereoscópica
o la obtención de la forma a partir de la iluminación.
En meteorología se pueden utilizar las técnicas de detección y predicción del movimiento, como puede ser
la evolución de ciertas masas nubosas u otros fenómenos meteorológicos, a través de imágenes recibidas
vía satélite.
Medicina
La comunidad médica tiene muchas aplicaciones en las que interviene el procesamiento de imágenes, a
menudo orientadas hacia el diagnóstico de dolencias o enfermedades, entre las que se incluyen radiografías,
resonancias magnéticas, tomografías, etc.
Algunos ejemplos de aplicaciones de procesamiento de imágenes son:
Técnicas de extracción de regiones por el color.
Ampliar detalles de la imagen que en una primera vista aparecen confusos.
Sustracción de imágenes que pueden detectar el movimiento de un objeto, o la variación de
volumen, por ejemplo en los movimientos de sístole y diástole del corazón.
Reducción de la escala de grises o binarización, que puede eliminar de la imagen los niveles de gris
que no interesen y dejar sólo aquellas partes de interés, por ejemplo el resaltado de dientes en una
radiografía.
Coloreado de regiones de interés en una radiografía mediante técnicas de pseudocolor.
Obtención del entramado de vasos capilares, o nervios en un determinado tejido, mediante la
extracción de bordes.
71
Detección de lesiones vasculares a partir de angiogramas renales.
Diferenciar, por el color, tejidos sanos de tejidos cancerígenos o infectados.
Detección de cánceres de piel mediante técnicas de color y extracción de bordes.
Medida del grosor de venas y arterias.
Detección de puntos de interés en una radiografía como precursores de la presencia de un tumor, o
como puntos de referencia en ciertos órganos como el cerebro.
Identificación de un nódulo sospechoso en una mamografía por diferencia de contraste y textura.
En neurología, para determinar el estado de la enfermedad, y el grado de deformación de la materia
gris del cerebro en enfermos epilépticos, mediante el uso de contornos deformables.
Detección de microcalcificaciones en mamografías mediante redes neuronales.
Reconstrucción de arterias coronarias utilizando imágenes de angiogramas.
Diferencia de imágenes para la substracción de angiogramas y para estimar el movimiento de una
vena o vaso capilar.
Movimiento de las paredes cardíacas a partir de imágenes de resonancia magnética, de las que se
extraen puntos de interés sobre los que se establecen las correspondencias, mediante correlación,
entre las distintas imágenes de una secuencia de imágenes. Se determina el flujo óptico a través de
dichas correspondencias.
Detección de bordes y la correspondencia de máscaras en las direcciones para imágenes del corazón
obtenidas mediante resonancia magnética.
Modelos deformables para el análisis del movimiento 3D en imágenes de resonancia magnética del
corazón.
Procesamiento de imágenes de resonancia magnética del cerebro humano.
Técnicas de reconocimiento de patrones para detectar cirrosis e infiltraciones de grasa en el hígado.
72
Identificación de construcciones, infraestructuras y objetos en escenas de exterior
Mediante imágenes aéreas o de satélite se puede determinar la presencia de ciertas regiones a través de la
segmentación de las mismas, así como detectar la presencia de ciertas construcciones (edificios) o
infraestructuras (carreteras, canales, puentes), a través de técnicas de extracción de bordes o contornos
combinadas con la segmentación de regiones.
Un ejemplo puede ser la reconstrucción de tejados de casas urbanas por medio de relaciones topológicas y
geométricas, teniendo una base de datos de modelos a partir de los cuales se reconstruye el tejado que está
siendo inspeccionado.
Mediante métodos similares o técnicas de extracción de las componentes de color, se puede deducir la
presencia de diferentes parcelas sobre una determinada extensión de terreno.
También se puede discernir entre imágenes urbanas y paisajes naturales, lo cual puede ser útil por ejemplo
para extraer imágenes de bases de datos grandes o para los buscadores de Internet.
Reconocimiento y clasificación
La clasificación de objetos por su tamaño y el recuento de los mismos es otra de las aplicaciones de la visión
por computador. Por ejemplo, para contar monedas en función del área o del perímetro de la moneda, tras
el correspondiente proceso de binarización.
Existe una técnica para el reconocimiento de caras de personas mediante visión artificial utilizando perfiles
de intensidad. Se pueden clasificar las edades a partir de imágenes de caras, reconocer ojos en caras
humanas o reconocer caras de entre un grupo de personas.
Existe también un procedimiento de lectura automática de datos del Documento Nacional de Identidad, así
como reconocimiento de objetos basados en el color.
El reconocimiento de huellas dactilares también es posible mediante visión.
Una de las áreas de aplicación más importantes es el Reconocimiento Óptico de Caracteres (en inglés OCR),
a través del cual se pueden realizar, entre otras, las siguientes cuestiones:
Identificación de matrículas de vehículos, que incluyen técnicas de redes neuronales.
Reconocimiento de caracteres manuscritos o documentos impresos.
Reconocimiento de objetos parcialmente ocluídos mediante sus bordes, de utilidad en la inspección
de equipajes en aeropuertos o aplicaciones militares.
Mejora la búsqueda en bases de datos, basándose en las características cromáticas de las mismas,
lo cual es útil para el manejo de bases de datos grandes.
73
Inspección y Control
La inspección es la verificación de si un objeto cumple con determinados criterios. Esto implica comparar
el objeto con algún objeto modelo que describe las características relevantes del mismo, teniendo en cuenta
que para muchos tipos de datos existen tolerancias, dentro de las cuales las medidas realizadas pueden
considerarse como aceptables.
Una de las finalidades de los controles de calidad consiste en detener la producción de algún producto si el
sistema de producción comienza a generar productos que no cumplen con las normas estándares generales.
Ciertos procesos industriales de producción requieren que los productos sean inspeccionados para asegurar
que las medidas de calidad y fiabilidad se cumplen. El proceso de inspección, dependiendo de lo que se
quiera inspeccionar, puede ser complejo, por lo que en ocasiones es necesario reducir costes de tiempo y
dinero.
En la actualidad existen sistemas de inspección basados en visión industrial para inspección en dos
dimensiones, tales como inspección de circuitos impresos. En la actualidad, son pocos los que abordan la
inspección de objetos tridimensionales.
En cualquier caso, las ventajas de un sistema de inspección visual son las siguientes:
Flexibilidad: cualquier tipo de objeto puede ser inspeccionado, al tratarse de un sistema pasivo y
no interactuar con los objetos a inspeccionar.
Velocidad: determinada por el procesamiento interno, sin necesidad de tener que colocar y tocar
el objeto.
Registro automático de los datos.
Algunas de las desventajas son las siguientes:
Las partes no visibles no se pueden inspeccionar.
La resolución del sistema, en cuanto al número de píxeles y calibración efectuada, puede impedir
la inspección de determinadas anomalías o elementos de dimensión reducida.
Los requisitos que se le exigen a cualquier sistema de inspección basado en visión por computador son los
siguientes:
Flexibilidad: para poder inspeccionar cualquier tipo de objeto.
Resolución: debe ser capaz de proporcionar medidas que sean suficientemente precisas para poder
establecer si los objetos inspeccionados están dentro de la tolerancia establecida.
Resolución espacial: para decidir si las características inspeccionadas están posicionadas y
orientadas con la precisión adecuada con respecto a algún sistema de referencia.
74
Fácil de usar: para facilitar su versatilidad y fácil manipulación.
Las técnicas pasivas de visión estereoscópica requieren determinar la correspondencia de las características
bidimensionales en cada una de las dos imágenes, necesitando la extracción fiable de esas características a
partir de dos imágenes bidimensionales separadas, para posteriormente establecer la correspondencia de
las características entre imágenes, y finalmente deducir la tercera dimensión.
Acabado de Superficies y Detección de Imperfecciones
En muchos casos resulta más sencillo inspeccionar objetos utilizando un perfil o una serie de perfiles de las
diferentes vistas del objeto. En este caso, los problemas de adquisición tridimensional son eliminados, y las
medidas se hacen con referencia a los datos bidimensionales.
Hay que tener especial cuidado en que la posición de la cámara y las condiciones de iluminación sean
idénticas, con el objetivo de que las vistas del objeto inspeccionado sean las mismas en cada imagen.
En cuanto a la posición de la cámara, hay que especificar por ejemplo que la línea de vista sea perpendicular
al área de interés, o paralela o perpendicular a algún eje de simetría del objeto.
La elección de las condiciones de iluminación es también determinante, ya que en caso contrario pueden
aparecer efectos no deseados tales como sombras y reflejos.
En cualquier caso, la inspección requiere comparar un modelo ideal con el que está siendo inspeccionado.
El acabado de una superficie puede determinarse mediante descripciones tales como: áspera, ondulada,
granulada o rayada, por ejemplo.
Para llevar a cabo esta tarea es necesario conocer la fuente de luz que se utiliza para iluminar la superficie,
de forma que la cámara reciba la luz reflejada de la superficie.
No obstante, es difícil medir el acabado de superficies visualmente, debido a las pequeñas dimensiones de
las características de las superficies que afectan a su acabado. Generalmente, esta tarea requiere la ayuda
de instrumentos de alta precisión, que obtengan el perfil por ejemplo mediante un sistema de agujas
recorriendo las superficies en líneas, aunque a veces presionan a la superficie y pueden alterar sus
propiedades. Una alternativa consiste en usar un microscopio de sección de luz.
En lugar de tratar de medir el acabado de las superficies, resulta más común en sistemas de inspección
visual detectar defectos de las superficies. Esta tarea está basada en la detección de algún cambio
significativo en las características de la superficie.
Para desarrollar esta tarea se han propuesto muchos sistemas, los cuales obtienen ciertas medidas a partir
de una secuencia de píxeles a lo largo de la superficie, y determinan un cambio o desviación en la secuencia.
75
Inspección en las industrias de alimentación y agricultura
El manejo de ciertos productos comestibles exige que los mismos necesiten un proceso de inspección, ya
que pueden dañarse o contaminarse. Se pueden mencionar algunas aplicaciones en este campo, como por
ejemplo: calidad del algodón, calidad de las frutas, inspección de árboles, crecimiento de plantas, etc.
Como puede observarse, el rango de productos es inmenso. Los problemas pueden clasificarse en dos
categorías:
a) Defectos de producción.
b) Impurezas no deseadas.
Los defectos de producción pueden provenir de muchas fuentes, incluyendo los equipos no fiables o
defectuosos, mezcla errónea de ingredientes en los productos preparados, proceso de manufactura
incorrecto (tiempo o temperatura de preparación incorrectos), o empaquetado defectuoso. Los defectos de
este tipo pueden deteriorar los productos finales. Un problema adicional consiste en cuantificar lo que
realmente constituye un defecto particular.
La apariencia de los productos es importante, en cuyo caso los métodos de textura pueden ser interesantes
para su detección. La detección de cuerpos extraños en los alimentos constituye otro de los campos de
aplicación, ya que contribuyen a la credibilidad y buena imagen del producto, como pueden ser los
siguientes: presencia de huesos en filetes que deberían estar deshuesados, o espinas en el pescado que
debería estar limpio, insectos en las verduras, pelos del operario, etc. Algunas impurezas necesitan ser
detectadas mediante Rayos-X. Las técnicas a utilizar son diversas y varían dependiendo de la naturaleza de
la inspección, por ejemplo, técnicas de color, de nivel de gris, texturas, etc.
La calidad del producto final también puede cuantificarse mediante técnicas de inspección visual. Por
ejemplo, el contenido y distribución de grasa intramuscular es un factor determinante de la calidad del
jamón ibérico. Las medidas químicas clásicas determinan el contenido pero no la distribución. Mediante
visión por computador se puede encontrar una relación entre ambas. Esta tarea se lleva a cabo mediante
técnicas de binarización, operaciones morfológicas y crecimiento de regiones.
Inspección en el envasado de productos
El objetivo es detectar por ejemplo si un determinado envase de cápsulas de farmacia ha sido correctamente
rellenado con las cápsulas correctas identificadas por su color, tamaño y forma, y que todos los
compartimentos poseen una cápsula; o la lectura e interpretación del código de barras de los productos
manufacturados.
76
Cartografía
Mediante el uso de imágenes estereoscópicas aéreas o de satélite es posible obtener las elevaciones del
terreno, fundamentalmente a través de técnicas de correspondencia basadas en el área.
Por otro lado, de cara a la elaboración de los catastros, particularmente en las zonas rurales, la utilización
de imágenes aéreas permiten una fácil identificación de las diferentes parcelas y sus delimitaciones, tras el
correspondiente tratamiento de las imágenes mediante técnicas de extracción de bordes y regiones.
Si los sensores que captan las imágenes están perfectamente calibrados, se puede llegar a determinar la
superficie real de las parcelas basándose en el área de las imágenes medida en píxeles.
Fotointerpretación
La fotointerpretación es la ciencia que trata el análisis de las imágenes por parte de un experto, para extraer
de ellas información de interés o relevante, por ejemplo, ver las construcciones existentes en una
determinada imagen de satélite o una imagen aérea.
Cuanto mejor sea la calidad de la imagen mejor será el resultado del análisis. Por ello, las imágenes pueden
ser tratadas con todas las técnicas encaminadas a mejorar la calidad de la imagen. Esta aplicación resulta
de gran utilidad para la detección de zonas deforestadas, incendios, inundaciones, variación de la
edificación, etc.
Para ello, se pueden utilizar imágenes aéreas o de satélite captadas en diferentes instantes de tiempo,
sobre las que se pueden aplicar diversas técnicas, entre las que se pueden destacar las siguientes:
a) Diferencia de imágenes.
b) Cálculo del cociente entre los valores de los píxeles de dos imágenes de diferentes fechas.
c) Comparación de las clasificaciones obtenidas en las diferentes imágenes.
d) Comparación de texturas.
e) Análisis de los componentes principales, para determinar la diferencia entre imágenes de diferentes
instantes de tiempo.
f) Análisis de cambio vectorial, a través de la medición de dos variables en los diferentes instantes de
tiempo, para detectar el ángulo y magnitud del cambio.
77
2.2.4 Aplicaciones Emergentes de la Inteligencia Artificial
En este apartado se exponen las aplicaciones emergentes en el ámbito de la inteligencia artificial:
Áreas Emergentes
Fuente: Elaboración propia
Entendimiento del Big Data
El mercado del big data ha ido madurando durante los últimos años.
En la actualidad existe tecnología capaz de sintetizar e interpretar los datos, y plasmarlos en una hoja de
cálculo o un gráfico.
Por ejemplo, Narrative Science ha desarrollado el programa Quill, que proporciona a los usuarios los
informes extraídos del big data en lenguaje natural.
Hacer robots inteligentes
Existe una tendencia emergente que consiste en el desarrollo del mejor cerebro que permita a los robots
operar de forma autónoma.
Por ejemplo, Rethink Robotics ha creado un robot amigable que puede ser entrenado; o Hanson Robotics,
que ha inventado robots muy parecidos a los humanos, capaces de mantener una conversación y recordar la
historia.
Entendimiento del Big Data
Hacer robots inteligentes
Entender las emociones
Hacer asistentes
inteligentes
78
Hacer asistentes inteligentes
La búsqueda del asistente de inteligencia artificial más sofisticado es otra tendencia emergente.
Se puede destacar a Donna, un ayudante de aplicación personal que recuerda cuando tienes una cita, indica
cuándo salir, cómo llegar, y memoriza tus preferencias.
Por otro lado, Jarvis Corp está construyendo un asistente virtual que puede acceder a Internet y responder
a las preguntas, o actuar como un control para todos los dispositivos conectados en una casa.
Entender las emociones
La computación afectiva, entendida como la tecnología capaz entender los sentimientos para predecir las
necesidades de las personas, es otra de las tendencias emergentes.
Por ejemplo, Tel Aviv utiliza tecnología que analiza las entonaciones vocales, para determinar el estado de
ánimo de una persona; o la tecnología de Affectiva´s Software, que identifica las emociones a través de la
cara de una persona.
79
3 Iniciativas de Interés
Entidad Iniciativa
Google Brain Google ha creado Project Descartes, un asistente-de inteligencia artificial no
basado en respuestas programadas.
Esta inteligencia artificial es capaz de mantener una conversación larga,
compleja, y capaz de debatir sobre el sentido de la vida, solucionar problemas
informáticos, y hablar de moral y filosofía.
Esta inteligencia artificial basa sus respuestas en el contexto ofrecido, en la
información que ya tiene de base, y la que va introduciendo el usuario en la
conversación. Se trata de un proyecto inspirado en cómo trabajan las redes
neuronales de nuestro cerebro.
El objetivo es lograr una inteligencia artificial capaz de tener una conversación
lógica, y sin que los desarrolladores tengan que definir todas las posibilidades.
Amazon Presentó Cubic, un nuevo asistente personal para el hogar, que va más allá del
típico asistente personal que hace búsquedas en la web y las dicta; también es
una herramienta capaz de tomar decisiones sobre la casa de manera
inteligente, dependiendo de las circunstancias.
Por ejemplo, puede conectarse con los dispositivos de la casa para modificar
aspectos como la temperatura; también puede controlar las luces, cerrar
puertas y configurar alarmas, todo ello a base de comandos de voz que puede
reconocer a unos siete metros y medio de distancia.
Para ello, se ha añadido la compatibilidad con Nest y Hue de Philips, entre
otros. Tiene una versión portátil, y puede integrarse con dispositivos Android
e iOS. Sus creadores prometen una API abierta para que cualquier
desarrollador pueda añadir soporte a sus apps y dispositivos.
Cubic es capaz de sacar provecho de su otra gran característica: su
“inteligencia artificial”. Podemos hablar con Cubic como hablaríamos con una
persona. Su sistema de conversación multi-tópico le permite comprender
cuando estamos hablando de cosas diferentes, y así mantener una
conversación más fluida.
80
Entidad Iniciativa
Universidad de Málaga La Universidad de Málaga, a través del grupo de investigación MAPIR,
perteneciente al departamento de Ingeniería de Sistemas y Automática, ha
desarrollado el robot Rhodon, un dispositivo que cuenta con una ‘nariz
electrónica’ capaz de detectar, reconocer y localizar concentraciones de gases
para elaborar mapas de olores en 2D y 3D, a través de los cuales minimizar los
posibles riesgos para operadores humanos.
RHODON se ha desarrollado en colaboración con la Universidad de Orebro
(Suecia) en la generación de mapas de olores en 2D y 3D; así como con la
Universidad de Groningen (Holanda), con quien se trabaja conjuntamente en
la clasificación de olores.
Una ‘nariz electrónica’ es el término científico usado para referirse al
dispositivo electrónico cuya finalidad es detectar los compuestos volátiles que
forman parte de una muestra olorosa, pudiendo de esa forma reconocerla o
discriminarla dentro de un conjunto.
Estos sistemas, que imitan de una manera muy simplificada el principio del
sistema olfativo de los animales, poseen la ventaja de poder detectar
sustancias imperceptibles para los humanos, no sufrir de cansancio o fatiga, o
ser altamente reproducibles.
Respecto a las aplicaciones que hacen uso de una nariz electrónica, se
encuentran desde aplicaciones médicas como la detección de tuberculosis y
cáncer de pulmón a partir del aliento, hasta la comprobación del estado de
maduración de la fruta en cadenas industriales.
El dotar de capacidad olfativa a un robot móvil surge de la necesidad de
generar mapas de concentración de sustancias olorosas, de controlar los
niveles anormales de gases, o de detectar el emplazamiento de las fugas o
fuentes que los generan, en áreas extensas en las que distribuir un mallado de
narices electrónicas sería demasiado complejo y altamente costoso.
Cabe destacar que dotar de capacidad olfativa a un robot móvil no le impide
seguir desarrollando sus tareas principales (vigilancia, transporte, limpieza,
etc.), sino que este nuevo sentido se desarrolla en paralelo, abriendo de esta
forma un nuevo rango de posibilidades.
81
Entidad Iniciativa
SmartFoodS Primera plataforma digital que aplica la inteligencia artificial al servicio de la
innovación alimentaria.
Se trata de un software que permite saber qué innovaciones debería crear una
empresa o quién está innovando en su sector y con qué tipo de producto.
La plataforma, diseñada por el centro de innovación Reimagine Food, busca,
detecta, filtra e interpreta toda la información de valor identificada en más
de cien mil fuentes especializadas y previamente seleccionadas.
SmartFoodS se divide en SmartFoodS Innovation, dirigida a detectar
oportunidades innovadoras de negocio dentro de la industria alimentaria, y
SmartFoodS Nutrition, que detecta posibles combinaciones de nutrientes para
generar nuevos productos y recetas.
Gracias al software SmartFoodS Innovation, los inversores podrán detectar
tendencias, nuevas oportunidades de negocio en las que invertir y startups que
están buscando financiación.
Mattel Esta empresa se ha asociado con la firma tecnológica de San Francisco ToyTalk
para desarrollar una nueva versión de su muñeca Barbie, que tendrá conexión
a internet y podrá mantener conversaciones.
Tras conectarse a la Red mediante una conexión inalámbrica, Barbie estará en
línea y se comunicará directamente con los servidores de ToyTalk.
Hello Barbie decidirá cómo responder a las preguntas de sus interlocutoras
gracias a un sistema de inteligencia artificial.
Las niñas podrán interactuar con la muñeca mediante un micrófono instalado
en el collar de Barbie.
La nueva versión de la muñeca también podrá participar en juegos
interactivos, así como contar historias y bromas.
82
Entidad Iniciativa
Volvo El software que Volvo ha integrado en el XC90 es capaz de aprender cómo
conduce la persona que va al volante, identificando todo aquello que
caracteriza sus hábitos de conducción.
Para ello, monitoriza nuestros patrones de aceleración, frenado y manejo de
la dirección, y los compara con un histórico conformado por otras sesiones de
conducción.
El objetivo que tiene la recopilación de toda esta información es permitir a
este software aprender con precisión cómo conducimos, para anticiparse en
tiempo real a nuestros errores y evitar que se produzcan.
Este programa de inteligencia artificial es capaz de comunicarse con los demás
sistemas de seguridad del coche para ejecutar correcciones en la conducción
que pueden evitar un accidente, o, al menos, reducir sensiblemente su
gravedad.
83
Entidad Iniciativa
Universidad de
Maryland
Ha diseñado Tohme, un sistema inteligente para detectar los rebajes de las
aceras que combina datos de Google Street View, técnicas de inteligencia
artificial y trabajo manual.
Con este proyecto podrán informar a las autoridades sobre la accesibilidad de
las calles o desarrollar una 'app' de navegación para las personas con
discapacidad física.
Mediante técnicas de visión artificial, el sistema trata de detectar
automáticamente la presencia de esos rebajes.
Posteriormente, el sistema evalúa la calidad de ese trabajo de detección: si
cree que la identificación por visión artificial ha sido un éxito, envía los datos
a trabajadores humanos (han utilizado el servicio de 'crowdsourcing' Amazon
Mechanical Turk), que simplemente tienen que verificarlos. En caso contrario,
el sistema desecha ese trabajo y se lo manda directamente a los 'turkers' para
que detecten y etiqueten la presencia o ausencia de rampas en las aceras.
El etiquetado manual de las imágenes, un proceso que han tratado de
simplificar al máximo, sigue siendo necesario para que Tohme funcione, si bien
se sigue investigando sobre cómo automatizar el proceso completo.
Tohme tiene una precisión del 86%, similar a una labor exclusivamente manual.
Basándose en esos datos, las agencias gubernamentales podrán tomar mejores
decisiones sobre las zonas menos accesibles que se han de mejorar.
También están trabajando para desarrollar aplicaciones que utilicen un
sistema de navegación accesible con los datos recogidos por Tohme, dirigido a
las personas en sillas de ruedas.
Además de distinguir los rebajes de las aceras, se puede medir su anchura para
evaluar si puede transitar una silla de ruedas por ella o identificar los edificios
que disponen de entradas accesibles mediante rampas.
84
Entidad Iniciativa
Darmouth College
Tecnalia Research &
Innovation y Microsoft
Research Cambridge
Los investigadores de estos centros han creado un programa con técnicas de
inteligencia artificial que usa fotos para localizar documentos en Internet.
El nuevo sistema, el cual se ha probado con fotografías, ahora se está aplicando
a vídeos, mostrando que el algoritmo de aprendizaje automatizado es preciso
y eficiente.
El sistema usa los datos de los píxeles en imágenes para localizar documentos.
Aprende a reconocer los píxeles asociados con la búsqueda de frases, y
analizando los resultados de la búsqueda de imágenes basadas en texto.
Los hallazgos se reportan en la publicación técnica PAMI (IEEE Transactions on
Pattern Analysis and Machine Intelligence).
Este es el primer estudio que muestra que un sistema de visión por computador
es capaz de extraer la información semántica de los píxeles en las fotos de las
páginas web. Esta información es usada para enriquecer la descripción de la
página HTML utilizada por los motores de búsqueda.
Google Ha desarrollado un sistema capaz de describir el contenido de una fotografía
en formato de texto y de manera automática, gracias a sus investigaciones en
el campo de la inteligencia artificial.
La tecnología busca traducir imágenes complejas a un lenguaje natural, con la
ayuda de técnicas de reconocimiento visual artificial y procesos de traducción.
Este software podría ayudar a personas con discapacidad visual al ofrecer un
texto descriptivo de las imágenes.
Además, podría facilitar las búsquedas en "Google Imágenes" al brindar mayor
precisión en las descripciones de las escenas.
Grupo de investigación
de Sistemas Inteligentes
y Telemática de la
Universidad de Murcia
Ha desarrollado un completo sistema de inteligencia artificial que, gracias a
sensores colocados en puntos estratégicos de la vivienda, consigue ahorrar
hasta un 29% de energía.
Este sistema analiza toda la información de las costumbres de los habitantes
de la vivienda o los trabajadores de una oficina, y regula los aparatos eléctricos
en función de estas costumbres, sin necesidad de que quienes utilizan el
edificio tengan que hacer nada.
Estos aparatos ya se comercializan gracias a la 'spin-off' creada por los
miembros del grupo de investigación de la UMU, Odin Solutions. La inversión
en este dispositivo se estima amortizada en una media de dos años.
85
Entidad Iniciativa
Facebook Está desarrollando un asistente virtual que detecte el comportamiento del
usuario y le advierta sobre el peligro de publicar contenido embarazoso.
Sus investigaciones han llevado a reconocer los rostros de las fotos para que al
usuario se le haga más sencillo etiquetar amigos.
De hecho, el sistema de reconocimiento facial de Facebook es uno de los más
precisos. El sistema tiene un 97,25% de efectividad, casi tan acertado como el
cerebro humano.
El equipo de inteligencia artificial de Facebook está aplicando algoritmos que
examinan el comportamiento general de los usuarios en la red social, para
identificar así el contenido adecuado para cada News Feed, y una vez
analizado el texto que se escribe en los post de Estado, pueden recomendar
hashtags relevantes.
Actisa y la Universidad
de Málaga
Han desarrollado un software capaz de realizar el diseño de una carretera o
una autovía en apenas tres horas, un trabajo que hasta ahora requería un año
de tiempo, gracias a la Inteligencia Artificial.
Tadil es el nombre del software. Con este programa, el técnico sólo tiene que
definir las variables del territorio (el SIG), y las características de la
infraestructura a diseñar.
Tadil se encarga de trazar automáticamente las alternativas para esa
infraestructura, obteniendo la definición del eje en planta y perfil, las
secciones transversales con su medición, la planta de movimiento de tierras,
expropiaciones, el balance de tierras, el presupuesto, la rentabilidad y la
valoración respecto a otras opciones.
A partir de esa información, el usuario puede ir modificando los criterios para
enriquecer el estudio y mejorar las propuestas.
El programa es capaz de realizar tanto el estudio previo como el informativo
de las carreteras o autovías. Además de la cartografía, este informe también
incluye el GIS y los precios.
El programa está especialmente indicado para países en desarrollo, donde urge
la necesidad de avanzar en la construcción de sus carreteras.
86
Entidad Iniciativa
Visual Line Se trata de una start-up de base tecnológica con sede en Bilbao que surgió con
el objetivo de desarrollar y comercializar sistemas patentados en materia de
visión e inteligencia artificial.
La empresa ha desarrollado, entre otros, unos sistemas innovadores
denominados Begile y Begitrain para ayudar a la seguridad en los sistemas
ferroviarios.
El abaratamiento de estos equipos y el grado de madurez tecnológica que han
alcanzado, hace que su uso ya esté implantado en seguridad.
El sistema más avanzado es el denominado Begile, relacionado con los pasos a
nivel, y que tras haberse desarrollado y probado en Euskadi, ha sido ofertado
a Adif.
Begile es un sistema basado en tecnologías de visión e inteligencia artificial,
que permite detectar eventos en pasos a nivel provocados por obstrucción de
la zona de paso o por fallos de alguno de los elementos de seguridad de la
propia estructura del paso. El sistema pretende aumentar la seguridad
mediante la detección temprana de situaciones que pueden generar riesgos o
daños.
Trabaja en tiempo real, detecta los obstáculos en vía con barreras bajas o en
movimiento, posibles fallos en el sistema de barreras, y es capaz de interpretar
las alarmas y avisar al centro de control.
Por otro lado, Begitrain es un sistema autónomo de apoyo a la actividad
humana en la operación ferroviaria. Permite ayudar al conductor de un tren
mediante la detección de señales de las vías y su entorno en el trayecto, a
través del análisis inteligente de los vídeos. Puede calcular la velocidad del
tren en un tramo y avisar si supera la máxima prevista.
Otro producto es Begise, un sistema que permite detectar eventos y anomalías
provocadas por el mal uso o por fallos en el funcionamiento de escaleras
mecánicas.
87
Entidad Iniciativa
Nyon Ha rediseñado el modelo tradicional del teclado y creado una versión especial
destinada a smartphones y tablets, más práctica y sencilla de utilizar, ya que
funciona con tan sólo seis botones: uno con todas las letras consonantes y cinco
para las vocales.
El teclado de la aplicación Fast Type es único, ya que cuenta con una interfaz
intuitiva basada en un sistema de inteligencia artificial, que aprende el estilo
de escritura de cada persona y sugiere en relación al contexto las palabras con
que se podría completar una oración; con ello logra escribir de manera más
rápida un mensaje de texto.
Debido al algoritmo de inteligencia artificial empleado en el teclado, el
sistema comenzará a aprender qué palabras son escritas y, aunque sean
parecidas gramaticalmente a otras, colocará la opción más adecuada.
Aunque Fast Type ya cuenta con un catálogo inicial de dos mil palabras en
inglés y español, éste puede aumentar de acuerdo a la frecuencia de empleo
del usuario y la riqueza de su vocabulario.
Si la persona maneja un lenguaje muy amplio, agregará a la base de datos
términos muy diferentes a si el usuario es recurrente en cuanto a abreviar
palabras o escribirlas con errores de ortografía.
La app podrá descargarse en smartphones y tablets con los sistemas operativos
Android y iOS.
Con el fin de evitar volver a enseñarle al sistema el modo de escritura, la app
cuenta con un perfil que se guarda y puede instalarse en todos los dispositivos
que utilice la misma persona.
88
Entidad Iniciativa
Google Ha diseñado una red neuronal artificial capaz de aprender a dominar diversos
videojuegos sin haber sido previamente programada para ello.
La compañía DeepMind, adquirida por Google en enero de 2014, ha combinado
técnicas de aprendizaje informático con mecanismos inspirados en la biología,
para lograr que su agente artificial aprenda a jugar a 49 videojuegos clásicos
del ordenador Atari 2600.
El sistema es capaz de descubrir el objetivo del juego y dominar sus controles,
sin contar con más información que las imágenes que aparecen en pantalla y
la puntuación.
Gracias a sus mecanismos de adaptación y aprendizaje, la máquina actúa a un
nivel comparable al de un humano profesional de los videojuegos.
Los autores del sistema subrayan que la aplicación de la inteligencia artificial
a los videojuegos no es más que una demostración de la potencia de su
algoritmo, cuyo uso se puede generalizar a otro tipo de entornos e industrias.
Virtual Solutions Empresa de base tecnológica de Granada, responsable de los asistentes
virtuales que ayudan a los usuarios en portales web.
Crea avatares que, emulando el comportamiento humano, son capaces de
resolver las cuestiones de los consumidores, gracias a una tecnología de
comprensión y generación del lenguaje que permite crear un sistema de
inteligencia artificial.
Estos asistentes virtuales están pensados para ofrecer todo tipo de información
a los usuarios que navegan por la página web.
El sistema que propone Virtual Solutions es programa inteligente que genera
automáticamente una respuesta, y que puede llegar a modificarla para
ajustarse a las necesidades del usuario en cada momento.
La empresa también trabaja en el ámbito del análisis de las redes sociales,
analizando los comentarios que se vierten en estas plataformas y que pueden
tener importantes aplicaciones en el ámbito de la atención al cliente y la
seguridad.
89
Entidad Iniciativa
Eterni.me Su objetivo es que las personas sigan en contacto con sus difuntos, a través de
una réplica digital en 3D creada en vida por el difunto.
Uniendo datos de Facebook, Twitter, emails, fotos y vídeos, un algoritmo de
inteligencia artificial interpreta toda esa información y desarrolla un avatar
capaz de hablar como su creador, y conversar con familiares y amigos cuando
éste ya no esté.
El usuario tendrá, por su parte, la posibilidad de determinar qué almacenar y,
de esos datos, cuáles hacer públicos. También deberá entrenar a su avatar a
través de interacciones diarias para perfeccionar sus habilidades lingüísticas y
al mismo tiempo, crear una lista de personas con acceso a la cuenta en caso
de muerte.
Actualmente cuenta con más de 28.400 usuarios. Otras plataformas ya
contaban con aplicaciones capaces de administrar la vida en las redes después
de la muerte del usuario, pero ninguna había llegado tan lejos.
Compañías como Legacy Locker o Entrustnet, por ejemplo, habían diseñado
una aplicación que autoriza a los usuarios a designar a un representante para
que administre su trascendencia en la web.
Deathswitch, por su parte, permite enviar mensajes personalizados a una lista
de contactos preseleccionados con el objetivo de no morir con secretos.
Facebook anunció una nueva función llamada “Legacy Contact”, a través de la
cual un contacto asume la responsabilidad de gestionar la cuenta del difunto.
Google desarrolló una herramienta llamada “Inactive Account Manager”, que
permite la preservación o eliminación de los datos personales tras la muerte
del titular.
90
Entidad Iniciativa
Alelo Inc Esta compañía de herramientas digitales estadounidense ha desarrollado un
juego de roles virtual, en el que los alumnos participan en encuentros
simulados con agentes de inteligencia artificial, que se comportan y responden
de una manera culturalmente precisa. Esta herramienta ha demostrado ser
eficaz en la enseñanza de la comunicación intercultural.
La herramienta es un éxito para las personas que manejan el inglés como
segunda lengua, y ha sido probada con miembros del ejército estadounidense
que deben enfrentarse a situaciones diplomáticas en otras naciones.
Para desarrollar una versión en la que se enseña inglés como segundo idioma,
los investigadores entrevistaron a inmigrantes que viven en Estados Unidos
para determinar qué cuestiones culturales les han resultado problemáticas.
La instrucción que crearon explica cómo manejar diferentes situaciones a las
que se podría enfrentar un nuevo inmigrante, y ofrece consejos sobre el
comportamiento culturalmente apropiado. Según los investigadores, el
software podría abordar la escasez de maestros calificados para enseñar chino,
árabe y otras lenguas menos populares.
91
Entidad Iniciativa
Instituto Nacional de
Astrofísica, Óptica y
Electrónica de México
Ha desarrollado un sistema denominado Terapia de Gestos. La tecnología ha
sido probada clínicamente con éxito en los institutos nacionales de Neurología
y Neurocirugía, y de Pediatría.
Se trata de un ordenador con cámara web y una manija especial con una esfera
de color y sensores de fuerza, los cuales detectan los ejercicios que lleva a
cabo el paciente.
La idea es que un agente virtual indique al paciente las tareas a realizar, a
través de diferentes videojuegos diseñados para ejercitar las partes del brazo
en su rehabilitación. Esto permite que el paciente pueda realizar su
rehabilitación en casa, sin la necesidad de tener un terapeuta in situ.
Los ambientes virtuales en los que la persona realizará la terapia simulan
actividades cotidianas. Una parte importante del sistema es la inteligencia
artificial, puesto que es la encargada de monitorizar y evaluar el desempeño
del usuario, mientras realiza los ejercicios indicados por el agente virtual. Con
estos resultados se ajusta la dificultad del videojuego.
El software de seguimiento visual analiza las imágenes que se obtienen de la
cámara, se realiza el rastreo de la posición de la mano en el espacio en 3D.
El sistema hace un mapeo de las coordenadas de la mano del paciente en el
espacio “real”, y las transfiere al virtual, donde interactúa con un mundo
imaginario, el cual se observa a través de la pantalla.
Centro de Investigación
y de Estudios Avanzados
(Cinestav) Unidad
Guadalajara
Han desarrollado unas lentes con tecnología de inteligencia artificial, sistema
de geoposicionamiento y técnicas de ultrasonido, con las cuales las personas
que han perdido la vista pueden desplazarse con mayor facilidad.
Se trata de un dispositivo de navegación que consta de una gafa con cámaras
estero-sensores de sonido, GPS y una tableta, que ayuda a guiar a sujetos
con ceguera a un punto específico, y evitar chocar contra obstáculos estáticos
o en movimiento, además de reconocer billetes de diferentes denominaciones
o color de ropa.
Usan técnicas de ultrasonido para detectar obstáculos y translúcidos, como el
vidrio, o el empleo de inteligencia artificial para reconocer lugares, letreros y
objetos.
92
Entidad Iniciativa
Universidad de
California en Berkeley
(EEUU)
Han desarrollado algoritmos que permitirán a los robots aprender nuevas
habilidades motrices con el método de ensayo y error. El proceso es similar al
que utilizan los seres humanos en su aprendizaje.
El primer robot que utiliza este sistema responde al nombre de BRETT y está
programado con una serie de algoritmos basados en el concepto de aprendizaje
profundo, que busca crear una robótica de mayor autonomía intelectual, que
no tenga que ser programada con tanta asiduidad, y que pueda mejorar en su
desempeño por sí misma.
Hasta ahora, la principal línea de investigación se centraba en programar todos
los escenarios posibles a los que se enfrentara el robot, o crear entornos
simulados donde operara. El estudio de Berkeley, en cambio, hace uso del
aprendizaje profundo, una rama de la inteligencia artificial inspirada en las
conexiones neuronales del cerebro humano, y en su manera de interactuar con
el mundo.
El reto de los investigadores de Berkeley ha estado en aplicar estos conceptos
a la resolución de tareas motrices, pues no basta con el reconocimiento de los
estímulos, sino que éstos tienen que llevar a una respuesta práctica.
El hecho fundamental es que, al desarrollarse la actividad del robot en un
ámbito físico, saliendo del entorno en 3D sin estructuras reales, no existen
soluciones previas a los problemas que permitan al robot tener una referencia.
Watson for Oncology,
de IBM
Plataforma digital conectada a la nube. Sus bases de datos incorporan
literatura científica mundial, vademécum, y casos particulares de los
pacientes.
El sistema entiende el lenguaje natural de la historia clínica y de las
anotaciones del médico. Registra todas las variables que estén incluidas en los
informes, pero además tiene capacidad de aprender y de que el médico
incorpore variables nuevas que considere importantes.
A partir de ahí, cuando el oncólogo consulte a Watson, éste le dará el
tratamiento más adecuado. Al lado de cada opción del tratamiento, el
profesional podrá consultar por qué el sistema recomienda dicho tratamiento.
Así, se le remitirá tanto a la literatura, como a la efectividad de otros casos
clínicos, como a otras consideraciones.
El profesional podrá hacer sugerencias de las que el propio sistema aprende e
incorpora en sus bases de datos para los profesionales de todo el mundo.
93
Entidad Iniciativa
Amazon Ha desarrollado una plataforma de inteligencia artificial que analiza las
revisiones que hacen los clientes de los libros que leen, particularmente los
que tienen 5 estrellas en su sistema de calificación. La idea es detectar
revisiones falsas.
Amazon ya usaba aprendizaje por computador para su sistema de
recomendaciones, donde cuando uno hacía una compra, el sistema indicaba
las posibles compras relacionadas, pero no solamente por lo que se adquirió,
sino por los hábitos de compra de otros clientes con intereses similares.
Ahora se extiende este aprendizaje al sistema de evaluación de cinco estrellas
y a la confianza que los clientes deben tener de quienes hacen revisiones de
libros o productos en línea.
El nuevo sistema dará más peso a las nuevas revisiones, a aquellas verificadas
por haber sido hechas por alguien que hizo la compra de lo que revisa, y por
quienes votan a favor de una revisión en particular por haber sido de su agrado
o haberles ayudado a decidir sobre si comprar o no un producto.
Facebook Ha desarrollado una forma de reconocer a la gente en las fotografías, aunque
sus caras estén oscurecidas.
Los resultados surgen del trabajo en la visión por computador, con la que se
enseña al software a reconocer el idioma y las imágenes, con la misma rapidez
y facilidad que el cerebro humano.
En el trabajo, investigadores de Facebook y de la Universidad de California,
utilizaron la silueta del cuerpo, la postura y otras pistas para identificar a la
gente en fotografías, aunque sus rostros no se apreciasen con total claridad.
Facebook asegura que puede identificar a las personas con una precisión del
83% usando un método denominado PIPER, el acrónimo en inglés para
reconocimiento de la persona con independencia de la pose.
En el futuro, esta tecnología podría ayudar a anunciantes, cuerpos del orden
público y académicos a buscar en las fotografías pistas sobre las actividades,
intereses y círculos sociales de una persona. Ese potencial también puede
captar la atención de los reguladores y de los defensores de la privacidad en
Europa y EEUU.
94
Entidad Iniciativa
Google DeepMind Está utilizando artículos del Daily Mail y CNN para enseñar a las máquinas a
leer.
La revolución del aprendizaje profundo se debe a dos avances clave.
El primero está relacionado con las redes neuronales artificiales (RNA), pero
una RNA sirve de poco sin una base de datos de la que pueda aprender. Esto
ha sido posible gracias a los servicios de crowdsourcing de Mechanical Turk de
Amazon, que ha creado este tipo de base de datos.
Las páginas web del Daily Mail, MailOnline, y CNN online desglosan los puntos
de mayor interés de cada artículo en apartados independientes del texto
completo del artículo.
Esto sugiere un nuevo método de creación de bases de datos anotadas: utilizar
los artículos de noticias como el texto, y los apartados como las anotaciones.
Sin embargo, el equipo de DeepMind señala que es posible obtener la respuesta
a muchas preguntas mediante el uso de enfoques sencillos de búsquedas de
palabras.
Un sencillo tipo de algoritmo de búsqueda de datos llamado búsqueda de n-
gramas, es capaz de encontrar la respuesta fácilmente buscando las palabras
que aparecen con mayor frecuencia.
La base de datos resultante consta de 110.000 artículos de CNN online y
218.000 artículos de Daily Mail. Los resultados demuestran la potencia que han
adquirido las redes neuronales. Las mejores RNA pueden contestar con éxito
el 60% de las preguntas realizadas. También afirman que estas máquinas
pueden contestar todas las preguntas que tengan una estructura sencilla,
mientras rinden peor con las preguntas con estructuras gramaticalmente
complejas.
95
Entidad Iniciativa
Investigadores de la
Universidad Politécnica
de Valencia y de
troovel.com
Han desarrollado un nuevo sistema de recomendación web basado en técnicas
de inteligencia artificial, que ayuda a los usuarios a planificar cualquier viaje
de manera rápida e intuitiva.
Este nuevo sistema analiza la interacción entre el usuario y la propia
aplicación, en función de lo que cada uno marca como preferencia, y junto
con los gustos de otros usuarios similares, recomienda qué lugares visitar, con
información detallada de cada uno de ellos.
El sistema se basa en dos tipos de recomendaciones: las preferencias del
usuario, y las basadas en razonamiento probabilístico a partir de información
de otros usuarios.
Además, es capaz de mostrar las razones por las que se recomienda un
determinado lugar a un usuario, bien porque es acorde a sus preferencias o
bien porque personas similares a él lo han resaltado de manera positiva.
El sistema se nutre también de información recogida de diferentes fuentes de
internet, para generar una base de datos lo suficientemente grande para poder
hacer recomendaciones en todo el mundo.
La nueva herramienta construye un perfil de cada usuario, que se actualiza
conforme va navegando en el mismo y planificando nuevas rutas de viaje. Una
vez planificado, los usuarios pueden llevarse el sistema descargado en sus
dispositivos móviles, a través de las aplicaciones disponibles en Google Play y
App Store.
96
Entidad Iniciativa
Universidad RMIT de
Melbourne
Ha desarrollado una nanomemoria que es capaz de almacenar información de
la misma manera que un cerebro humano, lo que supone un paso importante
hacia la creación de un cerebro biónico. El aparato, diez mil veces más
delgado que un cabello humano, imita la compleja ingeniería del cerebro.
El desarrollo de estas celdas de nanomemoria es un requisito previo para la
construcción de redes de neuronas artificiales. A diferencia de los aparatos de
almacenamiento digital, como los USB que registran los datos en secuencias
binarias, la celda de nanomemoria puede almacenar la información en
múltiples estados porque es análoga.
El estudio, publicado en la revista Advanced Functional Materials, explica que
la creación de un cerebro biónico contribuirá a entender mejor las
características de los seres humanos respecto a las enfermedades como el
párkinson o el alzhéimer, e incluso para reemplazar en un futuro lejano las
partes dañadas de este órgano. Además, el sistema puede servir para
desarrollar formas de inteligencia artificial capaces de almacenar, recordar y
rememorar eventos pasados.
Google Está trabajando en una red neural que identifica imágenes. Se trata de un
sistema que emula el funcionamiento de neuronas en diferentes capas. Cuando
recibe una imagen, cada capa identifica diferentes parámetros como los
bordes, el color, los rasgos característicos, la repetición, etc. La última capa
se encarga de determinar qué es el objeto en función de los datos procesados
por las anteriores capas, y los millones de imágenes similares que ha recibido.
La red detecta ciertos rasgos característicos y los amplificar. Hay aspectos de
este proceso de aprendizaje por capas que no están muy claros, así que el
equipo de Google ha tenido la ocurrencia de pedirle a una red neural entrenada
para reconocer imágenes, que encuentre diferentes objetos en fotos que solo
tienen ruido y ninguna forma discernible.
Es un nivel de abstracción propio del ser humano y que casi se corresponde con
la imaginación. Curiosamente, el sistema comete los mismos errores de
concepto que podría cometer un niño muy pequeño.
La red neural añade objetos que ha asociado a otros (por ejemplo, asocia hojas
y vegetación con animales, y paisajes con edificios). Los investigadores de
Google llaman a estas imágenes interpretadas por la red neural
“inceptionismos”.
97
4 Fuentes de Información
A continuación se presentan las principales fuentes de información utilizadas y los agentes clave
entrevistados para el desarrollo del presente documento:
Fuentes de información
Aplicaciones de la Visión Artificial, Grupo de investigación Sistemas, Robótica y Visión.
Desarrollo y Tendencias de la Inteligencia Artificial, Rueda C. Fabio, Rodríguez S. Alfonso y
Castellanos G. H. Camilo, Fundación Universitaria de San Gil, Unisangil, Facultad de Ciencias
Naturales e Ingenierías, Programa de Ingenierías de Sistemas, Revista Matices Tecnológicos.
Nuevas Aplicaciones de Inteligencia Artificial en Contenidos Interactivos, Plataforma Tecnológica
Española de Tecnologías Audiovisuales en Red - eNEM.
Estado del arte de las TIC aplicadas a la Edificación Inteligente, Sociedad Andaluza para el Desarrollo
de las Telecomunicaciones S.A SANDETEL, Consejería de Economía, Innovación y Ciencia, Junta de
Andalucía.
Procesado de Imagen y Visión por Computador, Grado de Ingeniería en Sistemas de
Telecomunicación, Universidad de Alcalá.
Sistemas de Percepción y Visión por Computador, Alberto Ruiz García, Departamento de Informática
y Sistemas, Facultad de Informática, Universidad de Murcia.
Visión Computacional, L. Enrique Sucar, Instituto Nacional de Astrofísica, Óptica y Electrónica,
Puebla, México y Giovani Gómez, Helmholtz Zentrum Munchen, Neuherberg, Alemania.
Visión por Computador, José Francisco Vélez Serrano, Ana Belén Moreno Díaz, Ángel Sánchez Calle,
José Luis Esteban Sánchez Martin.
Neural Turing Machines, Alex Graves, Greg Wayne, Ivo Danihelka, Google DeepMind, London, UK.
Oficina Española de patentes y marcas.
Global Patent Search Network.
Asociación Española Para la Inteligencia Artificial (AEPIA).
KPMG.
Inteligencia Artificial e Ingeniería del Conocimiento. Gonzalo Pajares Martinsanz y Matilde Santos
Peñas. AlfaOmega. México, D.F. Mayo 2007.
Venture Scanner.
98
Tractica.
United States Patent and Trademark Office.
CITIC.
33 Voices.
Inc.
Abra Invest.
World Economic Forum.
X.ai.
Cilenis.
PredictionIO.
Wise.io.
Euclid Analytics.
99
Agentes clave entrevistados
Enrique Alba, Catedrático del Grupo Neo, Universidad de Málaga.
Federico Álvarez García, Profesor de la Escuela Técnica Superior de Ingenieros de
Telecomunicación, Grupo de investigación “Grupo de Aplicación de Telecomunicaciones Visuales”
(G@TV).
Raúl Arrabales, anteriormente Solution Manager, Analytics & Insights en Altran, y actualmente
Analytics Senior Manager en Accenture Analytics (Accenture Digital).
Luis Peña, Socio Promotor de Lurtis Rules.
José María Peña, Socio Promotor de Lurtis Rules y Profesor de la Escuela Técnica Superior de
Ingenieros Informáticos de la Universidad Politécnica de Madrid (UPM).
Dr. Sinuhe Arroyo, CEO, Sales of Taiger.