of 121
INTERFAZ DE MONITOREO CON VISIN ARTIFICIAL USANDO KINECT
APLICADO A PROCESOS INDUSTRIALES
MILTON EULISIS MEDINA RINCON
DANIEL ANDRES PARDO VARGAS
UNIVERSIDAD SANTO TOMAS
FACULTAD DE INGENIERA ELECTRNICA
TUNJA
2013
INTERFAZ DE MONITOREO CON VISIN ARTIFICIAL USANDO KINECT
APLICADO A PROCESOS INDUSTRIALES
MILTON EULISIS MEDINA RINCON
DANIEL ANDRES PARDO VARGAS
Trabajo de monografa que presenta los resultados de la investigacin realizada
para obtener el ttulo de Ingeniero Electrnico
Director
MSc(c). Camilo Ernesto Pardo Beainy
Ing. Electrnico
UNIVERSIDAD SANTO TOMAS
FACULTAD DE INGENIERA ELECTRNICA
TUNJA
2013
Solamente Los Autores Son Responsables
de Las Ideas Expuestas en El Presente
Trabajo.
Nota de aceptacin:
______________________________
______________________________
______________________________
______________________________
______________________________
______________________________
______________________________
Firma del Director
______________________________
Firma del Jurado
______________________________
Firma del Jurado
Tunja, Diciembre de 2013
Dedicamos este trabajo a Dios, que nos ha dado la
oportunidad de vivir y regalarnos una familia maravillosa, a
nuestros padres quienes nos han dado todo, han credo en
nosotros y les debemos nuestra formacin como personas y
profesionales, a nuestros familiares, amigos y a todas las
personas que contribuyeron a la culminacin de nuestros
estudios.
AGRADECIMIENTOS
A Nuestras Familias y Amigos.
Milton Eulisis
En primer lugar agradecer a Dios por haberme dado la vida, la salud y las fuerzas necesarias para
cumplir este objetivo de mi vida, un objetivo que empez como un sueo y hoy se est haciendo
tangible.
Sabiendo que no existe ni existir una forma de agradecer toda una vida, de lucha, sacrificio y
esfuerzo. Trato de agradecer humildemente a quienes me brindaron amor sin escatimar esfuerzo
alguno, as mismo han sacrificado gran parte de su vida para formarme y educarme. A mis amigos
incondicionales de batallas, que me orientaron por los buenos caminos de la vida, siempre
extendiendo su mano cuando ms los necesite, y a pesar de la distancia en la que estuvimos los
sent tan cerca, los amo Mam y pap. Gracias por ser mi ejemplo a seguir como personas y
profesionales, mil gracias por todos esos momentos compartidos, consejos y alcahueteras. No
me cansare de darles las gracias por que me estn dando el tesoro ms valioso que pueden darle a
un hijo, una carrera.
A mis hermanitos, mi hermano Mi mejor amigo, por estar a mi lado, por tantos consejos de vida,
por soportar todos mis estados de nimo, mil gracias. Mi princesita Sofi, por cuidar de pap y
mam mientras estamos fuera de casa, con sus palabras de aliento y amor puso su granito de arena
para hacer esto posible.
A mi novia, que con su amor, ternura y compresin se convirti en un apoyo fundamental.
A mis abuelitos y dems familia por estar apoyando y dndome nimos.
Daniel Andrs
Para empezar, quiero agradecer a Dios quien dio inicio a mi vida y ha estado presente en mi alma
y en mi corazn a lo largo de toda mi vida protegindome e iluminando mis pasos, para cumplir los
objetivos y metas que me he propuesto, siendo siempre una figura sanadora de esperanza y fuerza.
A mis abuelos quienes estuvieron presentes con su Amor incondicional en cada suceso y
momento de mi vida, siendo fuente de inspiracin, fortaleza y motivacin para cumplir todos mis
sueos y eje central de mi alegra y cuyo amor me cautivo para ser cada da mejor.
A mis padres quienes me apoyaron en todos los objetivos que me he propuesto, a lo largo de mi
vida y mi trayectoria acadmica, brindndome momentos llenos de felicidad y tranquilidad,
compartidos en un ambiente musical que siempre me ha caracterizado y ha hecho la persona que
ahora soy.
A mis tas y tos quienes con su cario y consejos, hicieron de m una mejor persona, que
principia en valores fundamentados en el respeto y la tolerancia, dentro de en un ambiente familiar
ejemplar lleno de enseanzas, reflexiones y esperanza.
A mis primos quienes estuvieron conmigo en momentos buenos y malos, y con quienes compart
momentos inolvidables de diversin, risas, satisfaccin y felicidad, y que gracias a ellos, hoy puedo
decir que soy una persona ms segura, integra y feliz, que disfruta los pequeos momentos de la
vida.
A mis amigos y compaeros de semestre, quienes me aconsejaron y apoyaron a lo largo de la
carrera y con quienes compart sentimientos de angustia, dolor, celebracin y gratitud.
A Nuestros Compaeros y Docentes
A nuestro tutor por todas las horas de dedicacin acompaamiento, respaldo, asesora y
enseanza.
A nuestros docentes de la facultad que siempre nos estuvieron apoyando y asesorando frente a
cualquier inquietud o problema a lo largo de nuestra carrera.
A La Facultad de Ingeniera Electrnica de La Universidad Santo Tomas en cabeza de Su
decano Ing. Jos Ricardo Casallas Gutirrez, por su respaldo y Acompaamiento durante el
proceso de formacin acadmico.
Y finalmente a nuestro amigos y compaeros con quienes compartimos tantos momentos de alegra,
tristeza, triunfos, fracasos, angustia y jubilo
CONTENIDO
LISTA DE FIGURAS .................................................................................................... 10
LISTA DE TABLAS....................................................................................................... 13
GLOSARIO .................................................................................................................... 14
PROLOGO..................................................................................................................... 17
1. INTRODUCCIN .................................................................................................. 18
2. JUSTIFICACIN................................................................................................... 20
3. PLANTEAMIENTO DEL PROBLEMA ............................................................... 21
3.1 FORMULACIN DE PREGUNTAS................................................................................................................ 21
3.2 DEFINICIN DEL PROBLEMA ...................................................................................................................... 21 3.3 DELIMITACIN DEL PROBLEMA................................................................................................................. 22
4. OBJETIVOS .......................................................................................................... 23
4.1 OBJETIVO GENERAL ..................................................................................................................................... 23
4.2 OBJETIVOS ESPECFICOS ............................................................................................................................. 23
5. PREMBULO........................................................................................................ 24
6. ALCANCES Y LIMITACIONES .......................................................................... 25
7. MARCO TERICO............................................................................................... 26
7.1 DESARROLLO HISTRICO............................................................................................................................ 26
7.2 DESARROLLO CONTEMPORNEO ............................................................................................................. 27 7.2.1 Regional .............................................................................................................................................. 27
7.2.2 Nacional.............................................................................................................................................. 28
7.2.3 Mundial............................................................................................................................................... 28
7.3 MARCO EPISTEMOLGICO......................................................................................................................... 29 7.3.1 Comunicacin Inalmbrica Bidireccional ...................................................................................... 29
7.3.2 LabVIEW .......................................................................................................................................... 29
7.3.3 Mdulos XBEE PRO (S1 y S2) ........................................................................................................... 30 7.3.4 Luz estructurada................................................................................................................................ 32
7.3.4.1 Cdigos binarios................................................................................................................................... 32 7.3.4.2 Cdigos grises ...................................................................................................................................... 32 7.3.4.3 Tres cambios de fase (Three phase shift) ............................................................................................ 33 7.3.4.4 Dos cambios de fase ms uno ............................................................................................................. 33 7.3.4.5 Tcnicas experimentales ..................................................................................................................... 33
7.3.5 Kinect ................................................................................................................................................ 33 7.3.5.1 Reconocimiento de voz ....................................................................................................................... 38 7.3.5.2 El motor ............................................................................................................................................... 38
7.3.6 Filtrado de datos y deteccin de bordes. ...................................................................................... 39 7.3.6.1 Deteccin de bordes ............................................................................................................................ 39 7.3.6.2 Fil trado de datos .................................................................................................................................. 41 7.3.6.3 Operador segunda derivada (Laplaciana)............................................................................................ 42 7.3.6.2 Operador Laplaciana de la gaussiana .................................................................................................. 44
7.3.7 Sistema de adquisicin de datos .................................................................................................... 50
7.3.8 Protocolos de comunicacin ........................................................................................................... 50 7.3.8.1 Comunicaciones Seriales ..................................................................................................................... 50 7.3.8.2 Estndar RS-232................................................................................................................................... 51 7.3.8.3 Protocolos de Red................................................................................................................................ 51
7.3.9 Instrumentacin virtual ................................................................................................................... 52
8. DISEO DESARROLLO Y RESULTADOS ..................................................... 53
8.1 ADQUISICIN DE LA IMAGEN......................................................................................................................... 56
8.2 PRINCIPIO DE FUNCIONAMIENTO ................................................................................................................. 58
8.2.1 Reconocimiento (Mapa de Profundidad) ............................................................................................ 60 8.2.2 Seleccin de rango de trabajo (Distancias de Adquisicin). ............................................................ 66
8.2.3 Filtrado de datos ..................................................................................................................................... 71
8.2.4 Descripcin de contornos (crculos) ..................................................................................................... 75 8.2.5 Fragmentacin y segmentacin de la imagen (cuadrantes). .......................................................... 78
8.2.5.1 Posicin del objeto detectado. ............................................................................................................ 80 8.2.5.2 Tamao del objeto detectado. ............................................................................................................ 82
8.2.6 Comparacin y envi de datos .............................................................................................................. 82
8.2.8 Incorporacin sistema inalmbrico bidireccional, conversin de protocolo y acceso a la red .. 92 8.2.8.1 Comunicacin inalmbrica . ................................................................................................................. 94
8.2.9 Conversin de protocolo y acceso a la red. ........................................................................................ 98
8.3 INCORPORACION DE LA PLANTA DE FLUIDOS AL SISTEMA ..................................................................... 104
8.3.1 Temperatura .......................................................................................................................................... 107 8.3.2 Nivel......................................................................................................................................................... 109
8.3.3 Velocidad Electrobomba ...................................................................................................................... 110
9. APORTES DEL TRABAJO ............................................................................... 112
10. CONCLUSIONES ........................................................................................... 113
RECOMENDACIONES.............................................................................................. 116
BIBLIOGRAFIA ........................................................................................................... 118
INFOGRAFIA .............................................................................................................. 120
ANEXOS ...................................................................................................................... 121
LISTA DE FIGURAS
Figura 1. Mdulo XBee ................................................................................................ 30
Figura 2. Plataforma programacin mdulo XBEE ................................................. 31
Figura 3. Componentes del sensor Kinect ............................................................ 34
Figura 4. Composicin interna del sensor Kinect................................................. 35
Figura 5. Rango de distancias admitidas por el sensor Kinect .......................... 36
Figura 6. Funcionamiento del sensor monocromtico. .......................................... 36
Figura 7. Representacin del modelo de borde. ..................................................... 39
Figura 8. Deteccin de bordes por derivacin. ........................................................ 40
Figura 9. Modelo simple de deteccin de bordes. .................................................. 41
Figura 10. Implementacin digital de operadores Laplaciana. ............................. 43
Figura 11.Imagen Original para el procesamiento. ................................................. 43
Figura 12. Resultado de aplicar el operador ........................................................... 44
Figura 13. Representacion del operador LG............................................................ 45
Figura 14. Respuesta en frecuencia unidimensional del operador LG................ 48
Figura 15. Resultado de la convolucin con la mscara dada en la figura de la
imagen de la figura............................................................................................... 49
Figura 16. Imagen Original. ........................................................................................ 49
Figura 17. Sistema de adquisicin de datos. ........................................................... 50
Figura 18. Diagrama de bloques................................................................................ 54
Figura 19. Diagrama esquemtico de las etapas del proyecto............................. 54
Figura 20. Diagrama esquemtico. ........................................................................... 55
Figura 21. Adquisicin de la imagen en el diagrama de bloques. ........................ 56
Figura 22. Clasificacin de las tcnicas de medida para el mapa de
profundidad............................................................................................................ 57
Figura 23. Modulacin Pulso. ..................................................................................... 57
Figura 24. Principios de Kinect................................................................................ 59
Figura 25.Barrido espacial. ......................................................................................... 59
Figura 26. Reconocimiento (mapa de profundidad) en el Diagrama de bloques
................................................................................................................................. 60
Figura 27. Triangulacin de cada punto, entre una imagen patrn y la imagen
capturada. .............................................................................................................. 61
Figura 28. Influencia de la distancia y orientacin del sensor en la deteccin de
la imagen. .............................................................................................................. 61
Figura 29.Regiones de captura de imagen .............................................................. 62
Figura 30. Drivers Sensor Kinect. ........................................................................... 63
Figura 31. SubVI de adquisicin de imagen RGB. ................................................. 64
Figura 32.SubVI de adquisicin de imagen de profundidad.................................. 64
Figura 33. SubVI de configuracin de ngulo de vista del Kinect. .................... 65
Figura 34. SubVI de parada de datos. ...................................................................... 65
Figura 35. Programa de verificacin y prueba del Kinect. .................................. 65
Figura 36. Imgenes (RGB y Depth) proporcionada por el Kinect.................... 66
Figura 37. Rango de trabajo en el diagrama de bloques....................................... 67
Figura 38.Rango de trabajo para la adquisicin de imagen. ................................. 68
Figura 39. Whiteboard ................................................................................................. 68
Figura 40. Evaluacin de profundidad en la whiteboard. (Distancia de dibujo) . 69
Figura 41.Rango de trabajo funcional. Fuente: Autor............................................. 70
Figura 42. Determinacin del rango del filtro. .......................................................... 70
Figura 43. Perillas de control del rango del filtro ..................................................... 71
Figura 44. Filtrado de datos en el Diagrama de bloques ....................................... 72
Figura 45. Seleccin de Vision Assistant ................................................................. 73
Figura 46. Imagen en Vision Assistant ..................................................................... 73
Figura 47. Seleccin del filtro. .................................................................................... 74
Figura 48. Deteccin de bordes por derivacin ....................................................... 75
Figura 49. Filtrado de datos en el diagrama de bloques....................................... 76
Figura 50. Deteccin de formas vision assistant ..................................................... 76
Figura 51. Deteccin de crculos. .............................................................................. 77
Figura 52. Vision Assistant y LabVIEW. ............................................................... 78
Figura 53. Fragmentacin y segmentacin de la imagen en el diagrama de
bloques................................................................................................................... 79
Figura 54. Extraccin de la posicin del crculo. ..................................................... 80
Figura 55. Sistema coordenado de la deteccin del crculo.................................. 81
Figura 56. Comparacin y envi de datos en el Diagrama de bloques............... 83
Figura 57. Subsistema de comparaciones. .............................................................. 84
Figura 58. Segunda etapa de comparaciones......................................................... 85
Figura 59. Tercera etapa de comparaciones. .......................................................... 86
Figura 60. Seleccin de proceso en el panel frontal. ............................................. 86
Figura 61. Interfaz de Monitoreo y Control en el diagrama de bloques. ............. 87
Figura 62. Panel frontal ............................................................................................... 88
Figura 63 Panel del proceso a controlar................................................................... 89
Figura 64. Interfaz de usuario principal..................................................................... 90
Figura 65. Interfaz de usuario secundaria. ............................................................... 90
Figura 66. Vinculacin de los VIs de comunicacin. ............................................. 91
Figura 67. Sistema de control y comunicacin dentro de diagrama de bloques.
................................................................................................................................. 92
Figura 68. Diagrama esquemtico de comunicacin. ............................................ 93
Figura 69. DS 100 ........................................................................................................ 94
Figura 70.DS 100 y MaxStream................................................................................. 95
Figura 71. Conexin Ds100 y XBee .......................................................................... 95
Figura 72. Esquema conexin mdulo XBee y microcontrolador. ....................... 96
Figura 73. Mdulo de interfaz RS232. ...................................................................... 97
Figura 74. Esquema comunicacin punto multi-punto. .......................................... 97
Figura 75. Conversor PT203 de Tibbo...................................................................... 98
Figura 76. Conversor PT203 de Tibbo...................................................................... 99
Figura 77. Circuito diseado para adaptar el PT203. ............................................. 99
Figura 78. Sistema microcontrolado........................................................................ 100
Figura 79. Simulacin en ISIS del sistema microcontrolado. .............................. 101
Figura 80. Microcontrolador principal. ..................................................................... 103
Figura 81. Base mdulo XBee. ................................................................................ 103
Figura 82. Base mdulo PT203. .............................................................................. 103
Figura 83. Sistema implementado. .......................................................................... 104
Figura 84. Esquema dimensional de la Planta. ..................................................... 105
Figura 85. Esquema de ubicacin de sensores y actuadores. ........................... 106
Figura 86. Planta a controlar. ................................................................................... 107
Figura 87. Circuito control de temperatura ............................................................. 108
Figura 88. Implementacin del circuito de instrumentacin y puente de
Wheatstone. ........................................................................................................ 109
Figura 89. Nivel de agua propuesto y visualizacin de la ranura del
potencimetro. .................................................................................................... 109
Figura 90. Circuito control de nivel de tanque ....................................................... 111
Figura 91. Implementacin circuito microcontrolado para la velocidad de la
electrobomba....................................................................................................... 111
LISTA DE TABLAS
Tabla 1. Cuadrante superior izquierdo para una mscara de la LG. ................... 46
Tabla 2. Drivers de Instalacin ................................................................................... 64
Tabla 3. Valores de distancia y valor numrico en el programa para la
profundidad en el rango de trabajo.................................................................... 69
Tabla 4.Datos de los crculos detectados por Vision Assistant. ........................... 77
Tabla 5. Tabla de estados de la interfaz de usuario............................................... 83
Tabla 6. Formato de la Trama de Supervisin ...................................................... 102
Tabla 7. Formato de la Trama de Control .............................................................. 102
GLOSARIO
ANSI: El Instituto Nacional Estadounidense de Estndares (ANSI, por sus siglas
en ingls: American National Standards Institute) es una organizacin sin nimo
de lucro que supervisa el desarrollo de estndares para productos, servicios,
procesos y sistemas en los Estados Unidos.
ASCII: acrnimo ingls de American Standard Code for Information Interchange
.Cdigo Estndar Estadounidense para el Intercambio de Informacin).
ETHERNET: Sistema de red de rea local de alta velocidad. Se ha convertido
en un estndar de red corporativa.
Frame: Fotograma o cuadro de una imagen particular dentro de una sucesin
de imgenes que componen una animacin. La continua sucesin de estos
fotogramas producen a la vista la sensacin de movimiento.
Interfaz: se utiliza para nombrar a la conexin fsica y funcional entre dos
sistemas o dispositivos de cualquier tipo dando una comunicacin entre
distintos niveles.
IP: Protocolo Internet (Internet Protocol).
IR: radiacin infrarroja, es un tipo de radiacin electromagntica y trmica, de
mayor longitud de onda que la luz visible, pero menor que la de las microondas,
Su rango de longitudes de onda va desde unos 0,7 hasta los 1000 micrmetros.
LAN : Local rea Network. (Red de rea local). Es una red que conecta equipos
en un rea relativamente pequea y predeterminada, como una habitacin, un
edificio, o un conjunto de edificios.
Mesh: red inalmbrica mallada, es una red en malla implementada sobre
una red inalmbrica LAN.
OpenCV: es una biblioteca libre de visin artificial originalmente desarrollada
por Intel.
Pixel: s la menor unidad homognea en color que forma parte de una imagen
digital, ya sea esta una fotografa, un fotograma de vdeo o un grfico.
QVGA: Quarter Video Graphics Array, es la resolucin grfica de
320x240 pxeles.
RGB: Red, Green, Blue, en espaol rojo, verde y azul es la composicin del
color en trminos de la intensidad de los colores primarios de la luz
SCADA: Proviene de las siglas "Supervisory Control And Data Adquisiton"
(Control Supervisor y Adquisicin de Datos). Es un sistema basado en
computadores que permite supervisar y controlar variables de proceso a
distancia, proporcionando comunicacin con los dispositivos de campo y
controlando el proceso de forma automtica por medio de un software
especializado.
SDK: kit de desarrollo de software
SMA: (SubMiniature version A) a un tipo de conector roscado para cable
coaxial utilizado en microondas, til hasta una frecuencia de 33 GHz
SubVIS: Sub instrumento virtual, instrumento virtual que contienen a otros
instrumentos virtuales.
TCP/IP: (Transmission Control Protocol/Internet Protocol), Conjunto de
protocolos de la comunicacin bsica en Internet. Hace que la informacin
(mensajes, grficos o audio) viaje en forma de paquetes sin que estos se
pierdan, siguiendo cualquier ruta posible.
Tilts: Movimiento de inclinacin.
Toolkits: Consiste en una biblioteca de widgets que pueden ser llamados por
los programas de aplicacin.
VGA: (Video Graphics Array) Adaptador Grfico de Video
VI: Virtual Instrument (Instrumento Virtual).
Widgets: Pequea aplicacin o programa, usualmente presentado en archivos
o ficheros pequeos que son ejecutados por un motor de widgets o Widget
Engine.
17
PROLOGO
Con el auge tecnolgico de las ltimas dcadas, el desarrollo del comercio y la
globalizacin, ha ocasionado que las industrias sean cada vez ms
competitivas, pues cada empresa dedica su esfuerzo y compromiso con la
finalidad de obtener un producto final de alta calidad. En dicha bsqueda, se
opta por diferentes tipos de mecanismos de control, en orden de facilitar costos,
capacitacin y mano de obra. Aprovechando el surgimiento de nuevos
dispositivos caracterizados por realizar mapeo tridimensional de ambientes,
deteccin de contorno y adquisicin de imgenes en escala de grises, las
industrias y las instituciones educativas aprovechan las caractersticas de estos
sistemas con el fin de optimizar procesos, afianzar costos y velar por ambientes
ms seguros y cmodos para el usuario.
Los estudiantes de 10mo semestre con su proyecto titulado Interfaz De
Monitoreo Con Visin Artificial Usando Kinect Aplicado A Procesos
Industriales, pretenden hacer uso de las caractersticas de uno de los
dispositivos ms novedosos e interesantes que ha proporcionado Microsoft, con
el fin de poder manipular aplicaciones a travs de una interfaz caracterizada por
interpretar comandos de accin del usuario, sin contacto fsico, brindando la
posibilidad de manipular variables como temperatura, humedad, caudal, entre
otras; adems de presentarse como una herramienta til de afianzamiento en
procesos de enseanza en la academia.
Tunja, Diciembre 2013
Ing. Camilo Ernesto Pardo Beainy
18
1. INTRODUCCIN
En el rea de la automatizacin de procesos y en el sector industrial, la
comunicacin existente entre hombre y maquina (interfaz usuario-maquina),
representa el eje de ms alto inters, en cuanto a control y manipulacin de
procesos se refiere; la comunicacin en estos procesos exige que el usuario
pueda manipular e interactuar fcilmente con la mquina, en donde la interfaz
brinde las herramientas necesarias para poder efectuar cualquier accin o
cambio sobre el sistema.
Hoy da, el mapeo tridimensional de ambientes, la deteccin de contorno y
adquisicin de imgenes en escala de grises, se ha convertido en tema de gran
inters e investigacin, gracias en parte a los esfuerzos de empresas como
Microsoft por proveer un sensor que permite acceder a estas tres
aplicaciones, el Microsoft Kinect (originalmente titulado como Project Natal).
Desde su lanzamiento en noviembre de 2010, el Kinect ha proporcionado a
los investigadores y aficionados de todo el mundo una forma de acceder a la
alta calidad de datos tridimensionales, en un solo paquete disponible y
asequible. Este trabajo aprovecha la innovacin del Kinect para disear una
interfaz que permite utilizar esta tecnologa en diferentes aplicaciones en este
caso a una maqueta simuladora de procesos industriales para fluidos.
La idea central del sistema que se desarrollara, es proporcionar una interfaz
sencilla, precisa y atractiva, en donde el usuario pueda efectuar comandos de
accin sobre el sistema, como control de temperatura del agua contenida en un
tanque, velocidad de bombeo de una motobomba, entre otros parmetros, sin la
necesidad de estar pulsando botones o accionando alguna palanca, solo
moviendo las extremidades del cuerpo. Para facilitar esta operacin, es
necesario llevar a cabo un mapeo de todo el entorno, efectuar un filtro para
precisar los rangos y las distancias que se contemplan en la adquisicin, y una
divisin en coordenadas cartesianas de la imagen para precisar en donde se
estn ejecutando cambios en los comandos de accin.
El sistema incorporara el proyecto titulado Simulador de Procesos Industriales
para Fluidos que representara la planta que se desea controlar, y el proyecto
titulado sistema de monitoreo de acceso inalmbrico bidireccional a procesos
19
industriales, dicha interfaz permitir al usuario acceder inalmbricamente a la
planta desde cualquier punto en una red de rea local.
20
2. JUSTIFICACIN
El procesamiento de imgenes est siendo aplicado de manera creciente en la administracin de la calidad de la industria y sus proveedores de componentes,
logrando convertirse en una herramienta excelente para realizar pruebas y monitoreo. Las ventajas del procesamiento de imgenes se ven claramente, al
interactuar directamente con un sistema sin contacto y al brindar una interfaz sencilla, amigable y confiable a cualquier usuario. Por otro lado, el sistema de reconocimiento y deteccin de movimiento y de voz Kinect, ha demostrado, desde que se lanz comercialmente, que puede llegar mucho ms lejos de lo que se esperaba, pues desde ingenieros, investigadores, msicos y hasta
cientficos, aprovechan el potencial del artefacto en diferentes aplicaciones como: el tratamiento del Alzheimer, esclerosis mltiple y Sndrome de Down, ayudante en el quirfano, estudios de movimiento en los glaciares, anuncios
inteligentes y como parte de una nueva generacin de telfonos mviles.
El eje central de la interfaz de usuario, es que la persona que ejecute las tareas, no necesariamente tendr que emplear sus manos para dicha labor, el sistema est abierto a emplear cualquier extensin del cuerpo y permitir que el usuario
interacte dinmicamente con el sistema, sin limitarse a un teclado y un ratn.
Por tal motivo, el presente proyecto Interfaz de monitoreo con visin artificial usando Kinect aplicado a procesos industriales, se realiza con el propsito de ofrecer una alternativa de solucin novedosa que hace uso de un dispositivo
Microsoft Kinect para poder examinar mediante un mapa de profundidad la posicin de una extremidad u objeto ubicado en el espacio enfrente del sensor,
dependiendo de la posicin se ejecutar una tarea especfica en el sistema principal a controlar en este caso la planta Simulador de Procesos Industriales para Fluidos.
21
3. PLANTEAMIENTO DEL PROBLEMA
3.1 FORMULACIN DE PREGUNTAS
Debido a que la interfaz de usuario, adems de segura, brinda la posibilidad de
interactuar con la planta de forma inalmbrica y a travs de imgenes, la
principal pregunta que se plantea es:
Cmo disear e implementar un sistema caracterizado por evaluar las
acciones de comandos del usuario a travs de imgenes y posteriormente
enviar datos de control, que correspondan a la imagen captada, de forma
inalmbrica a una central de control principal que los interprete?
3.2 DEFINICIN DEL PROBLEMA
Con el desarrollo tecnolgico actual, las industrias deben garantizar entornos de
trabajo seguros en donde los empleados no coloquen en riesgo su integridad
fsica o en caso extremo la vida; por tal motivo, se han diseado sistemas
caracterizados por evaluar constantemente las variables involucradas en un
proceso y visualizar posteriormente la informacin de inters al empleado, de
esta forma se ha logrado automatizar una gran cantidad de procesos en la
industria.
Aun as, el riesgo no deja de estar presente en el usuario que ejecuta las tareas
de control, por tal motivo, reas como las comunicaciones y la automatizacin
industrial, buscan nuevas y mejores alternativas para hacer de la industria y el
mundo, un lugar mucho ms cmodo y eficiente en donde sea cosa del pasado
las interfaces poco intuitivas, en las que se presenta un alto grado de
complejidad para la manipulacin y control de variables industriales que
acarrean un alto costo y tiempo de capacitacin para la interpretacin del
manejo de la interfaz.
Para poder llevar a cabo esta labor, actualmente las industrias apuntan al
desarrollo de nuevos sensores y transmisores de campo, y sistemas de control
y supervisin, que permitan inspeccionar y controlar las operaciones que se
llevan a cabo dentro de una planta, en donde el empleado pueda efectuar todas
22
las acciones que requiere la planta de forma remota, manipulando una serie de
comandos de accin que el sistema pueda interpretar.
Sumado a esto, la interfaz planteada est orientada en parte a personas
discapacitadas, que por diversos factores han perdido alguna parte de su
cuerpo, y son operarios que desean continuar laborando en dicho sector de la
industria; el sistema le brinda la oportunidad de continuar con sus labores en un
entorno mucho ms seguro, sin el riesgo de que pierda su trabajo.
3.3 DELIMITACIN DEL PROBLEMA
El presente proyecto, se desarroll en la Universidad Santo Toms Seccional
Tunja, en el cual se propone en primera medida como el desarrollo de un
prototipo para prcticas de laboratorio que hace uso del tratamiento y
procesamiento digital de imgenes para dar soporte a las diferentes asignaturas
disciplinares de la Facultad de Ingeniera Electrnica; por otra parte, el sistema
puede tener aplicacin en empresas y fbricas del sector industrial del
departamento y del pas que requieran interactuar directamente con un sistema
sin contacto, de forma sencilla, amigable y confiable, o bien orientado a
optimizar los servicios del sistema existente, velando por un aumento en la
eficiencia de sus procesos.
23
4. OBJETIVOS
4.1 OBJETIVO GENERAL
Disear una interfaz caracterizada por emplear el tratamiento digital de seales, haciendo uso del sensor Microsoft Kinect para poder efectuar un control por medio de imgenes sobre una planta, incorporando un sistema de monitoreo y
control remoto de acceso inalmbrico bidireccional con aplicabilidad a procesos industriales, a procesos de monitoreo, supervisin y control.
4.2 OBJETIVOS ESPECFICOS
Disear e implementar toda la interfaz necesaria para poder adquirir la imagen y enviar los comandos correspondientes de cada imagen, a la
etapa de control.
Realizar el mapeo de profundidad con el sensor Kinect.
Disear e implementar el filtro para poder definir los rangos en que se
est captando la imagen.
Fragmentar la imagen en escalas ms pequeas para facilitar la adquisicin de las imgenes.
Implementar el sistema de interpretacin de los datos enviados por el ordenador, a fin de que ejecute una tarea correspondiente.
Realizar conversin de protocolos seriales a protocolos de red, de tal
forma que sea posible acceder a la informacin desde cualquier punto de una red de rea local.
Disponer toda la interfaz de comunicacin inalmbrica bidireccional para poder enviar los comandos de accin del sistema principal a la etapa de
control.
24
5. PREMBULO
El presente trabajo asocia dos ejes importantes, el primero es la interfaz de
manipulacin por medio de imgenes, la segunda constituye la evidencia de la
tercera etapa del Proyecto llamado Sistema de monitoreo remoto con acceso
inalmbrico a procesos industriales (Mateus, Pardo, & Rodriguez, 2010), cuya
primera fase fue culminada y sustentada en el segundo semestre del ao 2010
y la segunda fase en el primer semestre de 2011, cumpliendo con los objetivos
planteados: Disear e implementar un prototipo de comunicacin inalmbrico,
que podr ser aplicado a procesos de monitoreo y supervisin, que permita la
adquisicin de seales anlogas y digitales, que sean procesadas y
transmitidas a travs de protocolos de comunicacin almbrica e inalmbrica
bidireccional, y posteriormente visualizadas tanto en una estacin remota con
acceso a una Red de rea Local como en la interfaz de control del usuario.
En la incorporacin de la tercera etapa de desarrollo del proyecto se plantean
unos nuevos objetivos sobre los resultados ya obtenidos, entre los que se
encuentran la estructuracin completa del sistema como tal, sobre plataformas
de acceso sencillas y adecuadas a cualquier usuario, facilitando las conexiones
de acondicionamiento y control del proceso asociado, por tal motivo dentro del
contenido del libro se hace necesario hacer referencia a temas y
especificaciones contenidos en el primer y segundo tomo de este proyecto.
25
6. ALCANCES Y LIMITACIONES
El proyecto encuentra su aplicacin a la hora de brindar una herramienta
esencial para poder controlar uno o ms procesos a travs de una interfaz
adecuada, flexible y sencilla, brindando la posibilidad de realizar prcticas de
laboratorio en asignaturas como Electrnica de Potencia e Instrumentacin
Industrial, entre otras. La idea es mejorar el proceso de captacin y control de
cada una de las variables asociadas al sistema a travs de la captacin de
imgenes y diseo de mapas de profundidad, y visualizacin de cada una de
las variables (Mateus et al., 2010).
En cuanto a limitaciones, es necesario reemplazar algunos dispositivos
incorporados en el mdulo, que con el paso del tiempo, han dejado de funcionar
adecuadamente, lo que involucra ms costes en el desarrollo del proyecto,
adems de nuevos subVIS y toolkits de LabVIEW y OpenCV para tratamiento
y procesamiento digital de imgenes.
26
7. MARCO TERICO
En el presente capitulo se suscitan y presentan en el marco epistemolgico las
nociones bsicas relacionadas con los conceptos y fundamentos tericos
orientados a la concepcin del proyecto, tales como: Interfaz de Usuario,
sistemas de adquisicin de datos, luz estructurada, generalidades del sensor
Kinect, mdulos de comunicacin principales y algunos protocolos de
comunicaciones y la instrumentacin virtual. Por otro lado, se contextualiza el
impacto del proyecto en la sociedad en el entorno histrico y contemporneo.
7.1 DESARROLLO HISTRICO
Con el transcurso y evolucin del hombre, siempre ha existido un notable
inters en interactuar con los fenmenos fsicos que ocasionan cambios en su
entorno, de aqu surge la necesidad de que dos cosas de naturaleza distinta,
converjan a travs de una interconexin que permita unir dos procesos
diferenciados con un nico propsito comn (Mateus et al., 2010).
Histricamente se encuentra que las comunicaciones inalmbricas comenzaron
con hechos relevantes como la postulacin de las ondas electromagnticas por
James Cleck Maxwell durante el ao de 1860 en Inglaterra, la demostracin de
la existencia de estas ondas por Heinrich Rudolf Hertz en 1880 en Inglaterra, la
invencin del telgrafo inalmbrico por Guglielmo Marconi (George, 2009).
Durante la dcada de 1890 eminentes cientficos como Jagdish Chandra Bose
de India, Oliver Lodge en Inglaterra y Augusto Righi de la Universidad de
Bologna, se encargaron del estudio de los fundamentos naturales de las ondas
electromagnticas. Hacia 1896 la primera patente de comunicaciones
inalmbricas fue concedida a Guglielmo Marconi en el Reino Unido, a partir de
ese momento tuvieron lugar un sinnmero de desarrollos que dieron como
resultado las comunicaciones celulares en la dcada de 1980, la cual sigue
avanzando hasta la actualidad (Shampo & Kyle, 1983).
La historia de la visin comenz con los presocrticos, quienes afirmaban que
el ojo esta hecho de agua y fuego, posteriormente Aristteles postulo las bases
necesarias para realizar el estudio cientfico, solo hasta el siglo XIX con
Hermann von Helmholtz, se da hincapi al estudio cientfico de la percepcin
27
visual y los primeros mtodos psicofsicos. Luego a inicios del siglo XX, la
escuela de la Gestalt propone que la visin est fuertemente guiada por
procesos arriba-abajo. Hoy en da es ms difcil hablar de escuelas, puesto que
el estudio de la visin es sumamente interdisciplinario (Guemez Sandoval
Erendira, 2008).
En cuanto a la visin artificial y el tratamiento digital de imgenes,
histricamente el inicio de esta rea fue marcado por Larry Roberts, el cual, en
1961 cre un programa que poda "ver" una estructura de bloques, analizar su
contenido y reproducirla desde otra perspectiva, demostrando as a los
espectadores que esa informacin visual que haba sido mandada al ordenador
por una cmara, haba sido procesada adecuadamente por l.
7.2 DESARROLLO CONTEMPORNEO
En la Universidad Santo Toms Seccional Tunja. Con respecto al rea del
conocimiento que se plantea, los desarrollos llevados a cabo se limitan a los
avances logrados por estudiantes de ltimos semestres, en el mbito de las
comunicaciones inalmbricas y en la automatizacin de procesos industriales,
sin embargo no se han desarrollado muchos proyectos que centren su inters
en el rea del tratamiento digital de imgenes.
7.2.1 Regional
En el mbito industrial. Los adelantos en esta materia van orientados al
mejoramiento de procesos de diferentes industrias manufactureras, de
servicios, agricultura y minera. Como es el caso de Bavaria, Holcim, lcteos
Duitama LTDA y SIBEMA, las cuales una de sus principales tareas es la de
fomentar reacciones qumicas y cambios fsicos en sus productos, con el fin de
establecer condiciones aptas de limpieza y esterilidad, teniendo presente el
impacto ambiental que generara el tratamiento de sus productos.
En el mbito educativo, se cuenta con los esfuerzos de la Universidad
Pedaggica y Tecnolgica de Colombia UPTC, en el desarrollo de un prototipo
basado en visin artificial y lgica difusa para identificar procesos de
28
representacin espacial en discapacitados visuales y grupos de trabajo en el
rea de la electrnica, reconocidos y con trabajos ya publicados a travs de
ponencias en seminarios y congresos llevados a cabo en la Universidad Santo
Tomas Seccional Tunja.
7.2.2 Nacional.
Entre algunos de los avances ms importantes en el rea del tratamiento digital
de imgenes, se encuentra la Universidad Popular del Cesar, donde se dise
un sistema caracterizado por hacer reconocimiento de patrones de imgenes en
tiempo real utilizando una red neuronal tipo memoria asociativa, implementada
en una FPGA.
En la Universidad Industrial de Santander UIS se desarrollan prototipos de
sistemas que buscan solucionar problemas de su entorno, como lo es el manejo
de la gasolina con el apoyo de ECOPETROL, Fundacin para el Desarrollo del
Petrleo, y Corasfaltos, en donde las reacciones qumicas y cambios fsicos de
sus compuestos son relevantes.
7.2.3 Mundial.
A travs de IEEE XPLORE y otras fuentes de consulta, existe a nivel mundial
un gran nmero de publicaciones y artculos de investigacin centrados en el
desarrollo de sistemas enfocados en esta rea; entre algunos de los pases
ms destacados en esta rea a nivel latino-americano, se encuentran Mxico y
Argentina. Entre algunas de las empresas que centran sus esfuerzos en
desarrollar sistemas que involucren visin artificial ligada a procesos
industriales, se pueden mencionar Samac, Dinisco, Spiraz Sarco y Disai,
adems de asociaciones de ingenieros como el IEEE, que presentan captulos
o ramas dedicadas al estudio de esta rea.
29
7.3 MARCO EPISTEMOLGICO
7.3.1 Comunicacin Inalmbrica Bidireccional
La comunicacin inalmbrica o sin cables es aquella en la que extremos de la
comunicacin (emisor/receptor) no se encuentran unidos por un medio de
propagacin fsico, sino que se utiliza la modulacin de ondas
electromagnticas a travs del espacio (Tirso, 2005). En este sentido, los
dispositivos fsicos slo estn presentes en los emisores y receptores de la
seal, entre los cuales se encuentran: antenas, computadoras porttiles, PDA,
telfonos mviles, etc.
El trmino bidireccional hace referencia a la comunicacin que se establece
entre dos sujetos que actan como emisores y receptores, modulando nuevos
mensajes que se emiten en respuesta a otros mensajes que se enviaron
anteriormente. En esencia, al implantar el sistema en conjunto con una serie de
estaciones, se conforma una red de comunicacin novedosa para poder captar
datos en distintos puntos del proceso (Mateus et al., 2010).
7.3.2 LabVIEW
LabVIEW constituye un revolucionario sistema de programacin grfica para
aplicaciones que involucren adquisicin, control, anlisis y presentacin de
datos. Las ventajas que proporciona el empleo de LabVIEW son:
Se reduce el tiempo de desarrollo de las aplicaciones al menos de 4 a 10
veces, ya que es muy intuitivo y fcil de aprender.
Dota de gran flexibilidad al sistema, permitiendo cambios y
actualizaciones tanto del hardware como del software.
Da la posibilidad a los usuarios de crear soluciones completas y
complejas.
Con un nico sistema de desarrollo se integran las funciones de
adquisicin, anlisis y presentacin de datos.
30
El sistema est dotado de un compilador grfico para lograr la mxima
velocidad de ejecucin posible.
Tiene la posibilidad de incorporar aplicaciones escritas en otros
lenguajes.
LabVIEW es un entorno de programacin destinado al desarrollo de
aplicaciones, similar a los sistemas de desarrollo comerciales que utilizan
el lenguaje C o BASIC (Wei & Wu, 2004). Sin embargo, LabVIEW se
diferencia de dichos programas en un importante aspecto: los citados
lenguajes de programacin se basan en lneas de texto para crear el
cdigo fuente del programa, mientras que LabVIEW emplea la
programacin grfica o lenguaje G para crear programas basados en
diagramas de bloques (Bhutada et al., 2005).
7.3.3 Mdulos XBEE PRO (S1 y S2)
Los mdulos XBee proveen 2 formas amigables de comunicacin: Transmisin
serial transparente (modo AT) y el modo API que provee muchas ventajas. Los
mdulos XBee pueden ser configurados desde el PC utilizando el programa X-
CTU o bien desde un microcontrolador. Los XBee pueden comunicarse en
arquitecturas punto a punto, punto a multi punto o en una red mesh. La eleccin
del mdulo XBee correcto pasa por escoger el tipo de antena (chip, alambre o
conector SMA) y la potencia de transmisin (2mW para 300 pies o 60mW para
hasta 1 milla).
Figura 1. Mdulo XBee
Fuente: Autores
31
Los mdulos XBee pueden ser usados con adaptadores XBee Explorer Serial o
XBee Explorer USB. Aquellos microcontroladores que trabajan con 5V
necesitarn de una interfaz (XBee regulated) para comunicarse con los mdulos
XBee.
Figura 2. Plataforma programacin mdulo
XBEE
Fuente: Autores.
Los mdulos XBee son econmicos, poderosos y fciles de utilizar. Algunas sus
principales caractersticas son:
Buen Alcance: hasta 300ft (100 m) en lnea vista para los mdulos XBee
y hasta 1 milla (1.6 Km) para los mdulos XBee Pro.
9 entradas/salidas con entradas analgicas y digitales.
Bajo consumo
32
La serie 1 est basada en el chipset Freescale y est pensado para ser utilizado
en redes punto a punto y punto a multipunto. Los mdulos de la serie 2 estn
basados en el chipset de Ember y estn diseados para ser utilizados en
aplicaciones que requieren repetidores o una red mesh. Ambos mdulos
pueden ser utilizados en los modos AT y API (Oyarce, 2010).
7.3.4 Luz estructurada
Las tcnicas de luz estructurada hacen uso de un proyector para mostrar un
patrn sobre la escena a escanear. Al hacer corresponder la imagen captada
con el patrn original, es posible triangular la posicin de cada pxel y
determinar su profundidad con respecto al plano perpendicular a la cmara
(Sean, Kean, Jonathan, 2011). Dentro de la luz estructurada, existen diferentes
tcnicas dependiendo del tipo de patrn y del anlisis posterior realizado:
7.3.4.1 Cdigos binarios
Los cdigos binarios pueden conseguir buenos resultados con una tcnica muy
sencilla, sacrificando para ello el tiempo necesario de toma de varias imgenes
con diferentes patrones. Como primer paso se proyecta la mitad del patrn en
color blanco y la otra mitad en negro. Es posible entonces catalogar los pxeles
en dos grupos. Posteriormente se divide el patrn en dos, obteniendo cuatro
regiones, con dos blancas y dos negras intercaladas.
De esta manera se consigue depurar la informacin conseguida en trminos de
profundidad relativa del pxel con respecto a sus vecinos. Es posible continuar
esta divisin binaria hasta el mximo permitido por el proyector. Por ejemplo, un
proyector con resolucin 1024x768 necesita log2(1024) = 10 subdivisiones, y
por lo tanto para explotar sus caractersticas es necesario tomar diez imgenes
de la escena con diez patrones diferentes (Abramov et al., 2010)
7.3.4.2 Cdigos grises
Con un modo de funcionamiento similar a los cdigos binarios, en esta tcnica
se hace uso de la capacidad del proyector para iluminar utilizando colores. De
33
esta manera, los cdigos proyectados se codifican de forma binaria en las
seales digitales que son interpretadas como colores (Yeonsooo, 2011).
7.3.4.3 Tres cambios de fase (Three phase shift)
La tcnica Three Phase Shift se basa en un modelo matemtico que permite
gracias a tres imgenes capturadas, cada una de ellas iluminada con un patrn
en escala de grises senoidal, evaluar la posicin relativa del pxel.
El mtodo Three Phase Shift obtiene nubes de puntos muy densas, esto quiere
decir que calcula un valor de profundidad para cada pxel gracias al uso de un
hardware sencillo: una cmara y un proyector (Yeonsooo, 2011).
7.3.4.4 Dos cambios de fase ms uno
Se trata de una versin del mtodo anterior que mejora la adquisicin del color
de la escena ya que hace uso de una fase blanca, mediante la cual no es
necesaria reconstruir el color (C. T. Huang, Huang, & Wang, 2007).
7.3.4.5 Tcnicas experimentales
Los proyectores de tipo DLP tienen cierto parpadeo caracterstico que, en
conjuncin con cmaras de alta velocidad, pueden ser utilizados para recoger la
informacin tridimensional de la escena.
7.3.5 Kinect
El sensor de Kinect es una barra horizontal de aproximadamente 23 cm,
conectada a una pequea base circular con un eje de articulacin de rtula. El
dispositivo cuenta con una cmara RGB, un sensor de profundidad, un
micrfono de mltiples matrices y un procesador que proporciona captura de
movimiento de los objetos en 3D, reconocimiento facial y capacidades de
reconocimiento de voz. El sensor de profundidad es un proyector de infrarrojos
combinado con un sensor CMOS monocromo que permite a Kinect ver
recintos en 3D en cualquier condicin de luz ambiental. El rango de deteccin
de la profundidad del sensor es ajustable por software.
34
Figura 3. Componentes del sensor Kinect
Fuente: Kinect-based Obstacle Detection for Manipulator
Panjawee Rakprayoon, Miti Ruchanurucks, and Ada Coundoul
El sensor de Kinect adquiere imgenes de video con un sensor CMOS de
colores a una frecuencia de 30 Hz, en colores RGB de 32-bits y resolucin VGA
de 640480 pixeles. El canal de video monocromo CMOS es de 16-bit,
resolucin QVGA de 320240 pixeles con hasta 65,536 niveles de sensibilidad
(Castaneda & Navab, 2011).
Para calcular distancias entre un cuerpo y el sensor, el sensor emite un haz
lser infrarrojo que proyecta un patrn de puntos sobre los cuerpos cuya
distancia se determina. Una cmara infrarroja capta este patrn y por hardware
calcula la profundidad de cada punto. El rango de profundidad del sensor de
Kinect est entre 0.4 y 4 m (Figura. 5) Existen 2 modos (Default y Near) para
determinar distancias.
La cmara de Kinect funciona con hardware y software propios para el
reconocimiento de imagen.
35
Figura 4. Composicin interna del sensor Kinect
Fuente:(SlideShare) Juan Pablo Arbelez (2011, March). Kinect, Como
Funciona. Available: http://www.slideshare.net/ArbelaezGroup/Kinect- como-
funciona-7228721
La cmara tiene dos funciones principales:
Generar un mapa en 3D de la imagen que tiene en su campo visual.
Reconocer humanos en movimiento entre los objetos de la imagen a
partir de diferentes segmentos de las articulaciones del cuerpo y un
esquema en escala de grises.
El procesador es capaz de interpretar los movimientos que se registran de los
objetos capturados por la cmara de Kinect en eventos con significado que
aparecen en pantalla (Rakprayoon, Ruchanurucks, & Coundoul, 2011).
36
Figura 5. Rango de distancias admitidas por el
sensor Kinect
Fuente: (SlideShare) Juan Pablo Arbelez (2011, March). Kinect, Como
Funciona. Available: http://www.slideshare.net/ArbelaezGroup/Kinect- como-
funciona-7228721
Los movimientos buscados por el algoritmo son contextualizados. Por ejemplo,
si se est aplicando el sensor Kinect a un juego como Kinect Adventures,
donde una balsa desciende por la corriente del ro, dado que este juego
requiere movimientos tales como agacharse o tumbarse, el algoritmo buscar
la identificacin de estos movimientos en tiempo real para producir eventos en
pantalla.
Figura 6. Funcionamiento del sensor
monocromtico.
Fuente: (Coding4Fun) Microsoft. Project Gallery. Available:
http://channel9.msdn.com/coding4fun/Kinect/
37
El dispositivo como tal, est compuesto por tres partes funcionales:
Sistema de rastreo (tracking).
Reconocimiento de voz.
Motor de rotula.
Sistema de Rastreo
El sistema ptico de Kinect, permite seguir movimientos en tiempo real. Est
formado por la integracin de tecnologa que se ha venido desarrollando desde
hace 15 aos; pero con efectos y funcionalidades que se han descubierto
recientemente.
Est conformada por dos partes: un proyector y una cmara VGA infrarroja, los
cuales funcionan proyectando un lser (el cual Microsoft declara que es seguro)
a travs de toda el rea donde se encuentra el dispositivo generando lo que se
llama depth field (campo de profundidad). Esencialmente, todos los pixeles que
Kinect recibe como ruido de IR son convertidos en una escala de colores,
haciendo que los cuerpos dependiendo de la distancia se capturen como rojos,
verdes, azules hasta llegar a tonos grises, que representan a objetos muy
lejanos (Zeng & Zhang, 2012).
Debido a las caractersticas del dispositivo y el software SDK asociado al
mismo, las imgenes pueden ser capturadas y hacindolas pasar por una serie
de filtros para que Kinect determine que es una persona y que no lo es. Para
esto se siguen una serie de parmetros relacionados con las longitudes y
caractersticas propias del cuerpo humano; por lo cual, con estos modelos en
procesamiento, se facilita el reconocimiento y captura de cada parte del cuerpo.
Una vez que la informacin es separada del resto, se convierte cada
identificacin del cuerpo en un esqueleto con articulaciones mviles. Kinect
est precargado con una base de datos de 200 poses, as que puede llenar los
espacios si haces un movimiento que obstruya la visin de la cmara. Por otro
lado, Kinect efecta cada una de estas tareas en un tiempo total de 30
cuadros por segundo (Rakprayoon et al., 2011).
38
7.3.5.1 Reconocimiento de voz
Inicialmente, el subsistema de micrfonos presentaba a limitante de capturar e
interpretar sonidos a solo 3 metros de la consola, ignorando ruidos ambientales
y otros sonidos diferentes de la voz humana en el proceso. Para solucionar este
problema, Microsoft incorpor un arreglo de micrfonos localizados en las reas
laterales del dispositivo, especficamente uno a la izquierda y tres a la derecha;
esta es la razn por la cual el dispositivo es tan ancho.
Este arreglo de micrfonos es ptimo para capturar voces a la distancia, pero
requiere ayuda de un procesador de audio, encargado de cancelar los ruidos
provenientes del entorno externo al dispositivo, mientras que un software
llamado Beam Forming trabaja en conjunto con la cmara para averiguar la
posicin del usuario y crear una esfera de sonido que lo envuelva, permitiendo
enfocarse solo en el sonido del mismo, ignorando cualquier otro. Kinect tiene
adems un modelo acstico para cada pas y dialectos para regiones
especficas, construido gracias a cientos de actores alrededor del mundo, cuyas
voces fueron procesadas al hablar de varias formas.
Igual que con el sistema ptico, la captura de informacin se realiza todo el
tiempo, pues el sistema de sonido trabaja en un sistema de micrfono abierto,
haciendo que los micrfonos estn a la escucha durante todo el tiempo
(Rakprayoon et al., 2011).
7.3.5.2 El motor
Este elemento fue incluido despus de que Microsoft analizara las diferencias
entre los hogares de Amrica, Europa y Asia; obteniendo resultados muy
notorios, concluyendo que la mejor alternativa fue desarrollar un sistema que
pudiera moverse dependiendo las necesidades de espacio.
Este elemento es capaz de mover la unidad verticalmente hacia abajo y hacia
arriba con 30 grados de libertad. Para garantizar un movimiento limpio y libre de
ruido, se efectuaron pruebas de esfuerzo al motor bajo calor extremo, uso
prolongado (cientos de tilts al da durante varios meses), y se verifico que la
calibracin sea exacta (grado por grado de inclinacin). Todo esto, realizado en
39
un cuarto libre de ruido, creado para asegurarse de que el motor y el proceso
de tilting no fueran odos por los usuarios, pues Microsoft insiste que el
movimiento del motor solo deber generar 24 decibeles de ruido, en un cuarto
promedio con 40 decibeles.
El motor permite operar al mismo tiempo el sistema de zoom de la cmara,
permitiendo expandir el rea de juego. Aparte de todas las caractersticas
anteriormente mencionadas, se encuentra presente un ventilador que entrar
en accin cuando las condiciones ambientales lo ameriten, sin interferir en la
accin de los micrfonos (Rakprayoon et al., 2011).
7.3.6 Filtrado de datos y deteccin de bordes.
7.3.6.1 Deteccin de bordes.
Una vez establecida la regin de anlisis, se propone utilizar el mtodo
establecido por LabVIEW para deteccin de bordes, el cual supone visualizar
el cambio de intensidad en los pixeles como una funcin rampa usando un
arreglo de una sola dimensin definido a travs de la lnea de identificacin. La
Figura 7 distingue la variacin de los valores lineales de pixeles en la escala de
grises.
Figura 7. Representacin del modelo de
borde.
1) valor digital escala de grises. 2) longitud
del borde. 3) contraste del borde. 4)
ubicacin del Borde.
Fuente: Pardo Beainy Camilo Ernesto. Distribucin Binomial Aplicada a un
Sistema de Clasificacin de Piezas Utilizando Tratamiento Digital de Imgenes.
REVISTA ITECKNE volumen X.
40
El contraste del borde define la diferencia mnima en escala de grises entre el
fondo y el borde, el cual vara por condiciones de iluminacin o por diferencias
en las caractersticas de la escala de grises, por lo cual, es necesario garantizar
condiciones de iluminacin homogneas (Ernesto & Andrs, 2011). La
deteccin de bordes se realiza a travs del empleo de derivadas de primer y
segundo orden sobre la imagen como se muestra en la Figura 8.
Figura 8. Deteccin de bordes por derivacin.
Fuente: Pardo Beainy Camilo Ernesto. Distribucin Binomial Aplicada a un
Sistema de Clasificacin de Piezas Utilizando Tratamiento Digital de Imgenes.
REVISTA ITECKNE volumen X.
La magnitud de la primera derivada se usa para determinar la presencia de un
borde en un punto de la imagen, es decir determinar si el punto se encuentra en
la rampa. De la misma manera la segunda derivada se usa para determinar si el
pxel se encuentra en el lado oscuro o claro del borde.
Para obtener el cambio de contraste se utiliza un mtodo simple de deteccin,
el cual examina en primera instancia una pendiente positiva en la curva de
escala de grises (Ernesto & Andrs, 2011). El mtodo simple de localizacin de
bordes se muestra en la en la figura 9.
41
Figura 9. Modelo simple de deteccin de
bordes.
1) Valores, 2) nivel mnimo, 3) histresis, 4)
deteccin de subida, 5) deteccin de bajada.
Deteccin de bordes por derivacin.
Fuente: Pardo Beainy Camilo Ernesto. Distribucin Binomial Aplicada a un
Sistema de Clasificacin de Piezas Utilizando Tratamiento Digital de Imgenes.
REVISTA ITECKNE volumen X.
En la Figura 9, se muestra como se detectan los bordes, primero se recopila la
informacin de los valores de los pixeles a lo largo del perfil que analiza (1),
luego se establece un valor de umbral o tolerancia (2), el cual establece un
valor de histresis para determinar el inicio y fin del borde (3) y finalmente se
determinan cules son los pxeles de inicio y fin del borde (4 y 5).
7.3.6.2 Filtrado de datos.
Existen diferentes mtodos para filtrar una imagen y cada uno de ellos obedece
a ciertas caractersticas relacionadas al tipo de fenmeno que se desee tratar.
Por ejemplo, en el estudio de la deteccin de bordes, uno de los filtrados ms
usados es el filtro de deteccin de bordes de Laplaciana (Pajares & De la cruz,
2003).
42
7.3.6.3 Operador segunda derivada (Laplaciana).
La caractersticas ms importantes del operador laplaciano, es que es una
funcin 2D f(x,y) definido como:
2f =2y
x2+
2y
x2 ec. 1
Como en el caso del gradiente, la ecuacin 1 se puede implementar en forma
digital en varias formas, por ejemplo:
2f = 4z5 (z2 + z4 + z6 + z8 ) ec. 2
En donde los coeficientes z hacen parte de una imagen 3X3 como se muestra a
continuacin
[
z1 z2 z3z4 z5 z6z7 z8 z9
]
Siendo la laplaciana un operador de segunda derivada, el requisito bsico para
poder definirla apropiadamente, es que tanto los coeficientes asociados con el
pxel central como los coeficientes asociados con el resto de pixeles sean
negativos, pues como este operador es una derivada, la suma de los
coeficientes tendr que ser de una valor igual a cero, siempre y cuando el punto
en cuestin y sus vecinos tengan el mismo valor (Pajares & De la cruz, 2003).
Existen diferentes mtodos de aproximacin del operador laplaciano, como el
empleo de mscaras laplacianas (figura 10), las cuales se caracterizan por ser
simtricas rotacionalmente, a diferencia de las mscaras de primera derivada,
por lo que son capaces de detectar bordes en todas las direcciones espaciales.
Dichas aproximaciones pueden ser aplicadas efectuando una operacin de
convolucin entre una mscara y la imagen en cuestin, del resultado de la
convolucin posteriormente se analiza el signo del resultado (positivo o
negativo), esto con el fin de examinar el lado del borde que es ms o menos
oscuro e informacin relacionada con la direccin.
43
Figura 10. Implementacin digital de
operadores Laplaciana.
Fuente: Gonzalo Pajares Martinsanz, Jess M.de la Cruz Garcia. Vision por
computador. 2 Edicin Alfaomega Mxico
En la figura 12 (a), se puede apreciar el resultado de aplicar la primer mascara
(figura 10 (a)), a la imagen original (figura 11). Dependiendo del coeficiente
central que se escoja, se obtendrn imgenes con diferentes tipos de escalas
de grises, debido a las operaciones de convolucin que se realizan sobre cada
pixel. Por ejemplo, en la figura 12 (b), se muestra el resultado de hacer la
convolucin de la imagen original y la mscara de la figura 12 (a), con la
diferencia de que el coeficiente central de dicha mascara es ahora 5.
Ahora, si se escogen valores mayores para este pixel central, la imagen cambia
considerablemente, como puede apreciarse en la figura 12 (c) y (d), en donde
se tom la misma mascara de la figura 10 (a) y se cambiaron los valores
centrales a 10 y 20 respectivamente (Pajares & De la cruz, 2003).
Figura 11.Imagen Original para el
procesamiento.
Fuente: Gonzalo Pajares Martinsanz, Jess M.de la Cruz Garcia. Visin por
computador. 2 Edicin Alfaomega Mxico
44
Figura 12. Resultado de aplicar el operador
de la figura 10 a la imagen original de la
figura 11 (a); (b), (c), (d) son resultados de
aplicar el mismo operador pero con su valor
central 5,10 y 20 respectivamente.
Fuente: Gonzalo Pajares Martinsanz, Jess M.de la Cruz Garcia. Visin por
computador. 2 Edicin Alfaomega Mxico
7.3.6.2 Operador Laplaciana de la gaussiana
El empleo del operador Laplaciana de la Gaussiana (LG), se justifica por
estudios realizados acerca de la organizacin espacial de los campos
receptivos de las clulas retnales, asociado a la estructura simtrica circular
que involucra una regin excitatoria central y una regin inhibidora envolviendo
a la primera (Pajares & De la cruz, 2003).
Marr-Hildreth (1982, 1985), en este estudio aplica el concepto de la LG en su
teora computacional, examinando la existencia de tres fases para llegar a una
representacin 3D a partir de la 2D, para esto contempla la deteccin de los
cambios de intensidad de la imagen, examinando tanto la medida de los
gradientes de intensidad en diferentes escalas, como la medida de precisin de
la localizacin de esos cambios, esto con el fin de emplearlos en filtros de
suavizado que permitan seleccionar la informacin de la intensidad de los
45
niveles de gris en diferentes escalas y elegir un tipo de filtro capaz de optimizar
tanto frecuencia espacial como localizacin posicional.
Posteriormente, Marr-Poggio (1979) sugiere el empleo de la teora de la
deteccin de bordes de Marr-Hildreth (1980) para hacer convolucin imgenes
con funciones LG (Pajares & De la cruz, 2003); por tal motivo, se tiene que:
2G(x,y) = K (2 x2+y2
2) e(
x2 +y2
22) ec.3
Donde
G(x,y) =1
2e(
x2 +y2
22)ec. 4
2 es el operador Laplaciana definido en ec 1, k es una constante de escalado,
que se introduce de forma adicional una vez obtenida ec 3. a partir de ec 4
para determinar el rango de valores de la LG .
En la figura 13 (a) se representa el operador dado en ec. 3 con y=0, es decir en
el caso unidimensional, mientras que en la figura 13 (b) se muestra el operador
bidimensional. En los dos casos con K=0,5.
Figura 13.Representacion del operador LG.
a.Unidimensional, b.Bidimensional.
Fuente: Gonzalo Pajares Martinsanz, Jess M.de la Cruz Garcia. Visin por
computador. 2 Edicin Alfaomega Mxico
46
Para la implementacin digital del operador dado en la ec. 3,se puede seguir los
siguientes pasos:
1. Fijar y determinar los valores del operador para las diferentes posiciones, comenzando en el centro del operador, esto es, x =0,1, e y = 0,1. Debido a la simetra del operador esto solo se necesita calcular en su cuadrante.
2. Escalar los valores del operador mediante K.
3. Calcular los valores mediante la ecuacin ec. 3 y redondearlos al
entero ms prximo.
4. Extender el ancho de la mscara de forma que contenga todos los
valores distintos de cero.
5. Ajustar de forma simtrica los valores, mediante la adicin o
substraccin de valores pequeos hasta conseguir que todos los
valores de la mscara sumen cero.
En la tabla 1, se puede observar la correspondiente mscara asociada a este
tipo de operador (Pajares & De la cruz, 2003).
Tabla 1. Cuadrante superior izquierdo para una
mscara de la LG.
Con dimensiones 15x15, con k=256 = 2.0
Fuente: Gonzalo Pajares Martinsanz, Jess M.de la Cruz Garcia. Visin por
computador. 2 Edicin Alfaomega Mxico
47
El filtro dado por la ecuacin 3 resulta bastante costoso en tiempo de
computacin, debido a las dimensiones de las mscaras que son relativamente
grandes para obtener resultados satisfactorios, no obstante presenta las
siguientes propiedades:
a. Es un operador segunda derivada, reduce el efecto del ruido al suavizar
la imagen por el efecto Gaussiano.
b. Es un operador istropo capaz de detectar bordes en todas las
orientaciones posibles.
c. Es un operador capaz, de trabajar a diferentes escalas con la simple
variacin de la desviacin estndar (), ya que, el rango de frecuencia
(espaciales) varia con como se desprende del anlisis de su funcin de transferencia.
G(u, v) = (u2 + v2)exp [(u2 + v2)
2]
En la figura 14 se representa la funcin de transferencia unidimensional.
Ahora, examinemos la influencia de , sobre el anlisis de la respuesta en
frecuencia espacial, en donde se pone de manifiesto que cuanto mayor es ,
ms estrecho es el ancho de banda del filtro y en consecuencia, en este ltimo
caso, habr un menor nmero de pasos por cero. El menor nmero de pasos
por cero, la presencia de una realidad fsica, es decir de un borde real no
originado por ruido u otros fenmenos espurios, lo que la convierte en una base
de anlisis para diferentes escalas.
48
Figura 14.Respuesta en frecuencia
unidimensional del operador LG.
Fuente: Gonzalo Pajares Martinsanz, Jess M.de la Cruz Garcia. Vision por
computador. 2 Edicin Alfaomega Mxico
El efecto producido por el hecho de utilizar diferentes valores de se muestran
en la figura 15 (b) y (c), cuanto mayor sea , habr ms atenuacin de los
bordes y en consecuencia menor densidad de ceros.
En la figura 16 (a) se observa el resultado de la convolucin con la mscara
dada en la tabla I. En este resultado, el negro representa los valores ms
negativos, y el blanco los valores ms positivos, por tanto los valores de gris
intermedios representan los ceros.
La figura 16 (b) muestra una imagen binaria creada poniendo todos los valores
negativos en 16 (a) a negro y todos los valores positivos a blanco (Pajares & De
la cruz, 2003). Por tal motivo, a partir de esta imagen, se facilita realizar la
deteccin de bordes si cambiamos los valores intermedios de gris a un lmite
(ya sea negro o blanco), o simplemente eliminando los valores que representan
los ceros.
49
Figura 15. (a) Resultado de la convolucin
con la mscara dada en la figura de la
imagen de la figura.
(b) imagen binaria para simplificar el
proceso de deteccin de ceros. (c). Imagen
de ceros.
Fuente: Gonzalo Pajares Martinsanz, Jess M.de la Cruz Garcia. Visin por
computador. 2 Edicin Alfaomega Mxico
Figura 16. (a) Imagen Original.
(b) Ceros obtenidos con t=400 y = 2.0
Fuente: Gonzalo Pajares Martinsanz, Jess
M.de la Cruz Garcia. Visin por
computador. 2 Edicin Alfaomega Mxico.
50
7.3.7 Sistema de adquisicin de datos
Un sistema de adquisicin de datos es un instrumento que permite obtener
datos de un proceso, tomando la seal medida y convirtindola en una seal
elctrica. El sistema de adquisicin de datos tiene las siguientes etapas:
a. Conversin de la magnitud fsica en una seal elctrica a travs de
sensores o transductores.
b. Acondicionamiento de seal que incluye aislamiento, filtrado, conversin
y amplificacin de la seal.
c. Sistema de tratamiento que va a transformar la informacin digital en
informacin til para el usuario.
d. Sistema de visualizacin para el usuario final.
Figura 17. Sistema de adquisicin de datos.
Fuente: Los Autores
7.3.8 Protocolos de comunicacin
7.3.8.1 Comunicaciones Seriales
La comunicacin serial es un protocolo para comunicacin entre dispositivos. El
puerto serial enva y recibe bytes de informacin un bit a la vez. Aunque la
comunicacin en serie es ms lenta que la comunicacin en paralelo, que
permite la transmisin de una cantidad determinada de informacin de forma
simultnea, este mtodo de comunicacin es ms sencillo y puede alcanzar
grandes distancias a velocidades elevadas (Mateus et al., 2010).
Tpicamente, la comunicacin serial se utiliza para transmitir datos en formato
ASCII (American Standard Code for Information Interchange). Para realizar la
comunicacin se utilizan 3 lneas de transmisin: (1) Tierra (o referencia), (2)
Transmisin, (3) Recepcin. Debido a que la transmisin es asincrnica, es
posible enviar datos por una lnea mientras se reciben datos por otra. Las
caractersticas ms importantes de la comunicacin serial son la velocidad de
51
transmisin, los bits de datos, los bits de parada, y la paridad. Para que dos
puertos se puedan comunicar, es necesario que las caractersticas sean iguales.
7.3.8.2 Estndar RS-232
(Estndar ANSI/EIA-232) es el conector serial hallado en las PCs IBM y
compatibles. Es utilizado para una gran variedad de propsitos, como conectar
un ratn, impresora o modem, as como instrumentacin industrial. Gracias a las
mejoras que se han ido desarrollando en las lneas de transmisin y en los
cables, existen aplicaciones en las que se aumenta el desempeo de RS-232 en
lo que respecta a la distancia y velocidad del estndar (Mateus et al., 2010). RS-
232 est limitado a comunicaciones de punto a punto entre los dispositivos y el
puerto serial del computador. El hardware de RS-232 se puede utilizar para
comunicaciones seriales en distancias de hasta 50 pies.1
7.3.8.3 Protocolos de Red
Ethernet
Ethernet es un conjunto de tecnologas de red y mtodos de acceso a medios
especificados para las redes LAN. Ha sido desarrollado para permitir a las
computadoras comunicarse a travs de cortas distancias a travs de un medio
fsico. Ethernet ha evolucionado como la tecnologa ms extendida para las LAN
cableadas. La mayora de las redes Ethernet utilizan cables de par trenzado en
sus subredes y las fibras pticas y cables coaxiales en la red troncal. Las
especificaciones de Ethernet y las normas son tambin conocidas como
IEEE802.3.2
El protocolo Ethernet, se caracteriza por tener una topologa bus, lo que permite
tener una mayor velocidad, sin embargo, el consumo de ancho de banda es alto
debido a que todos los datos dentro de la LAN deben pasar por el mismo bus y
se pueden presentar colisiones que retrasen los datos. Es por esto que esta
1www.itescam.edu.mx
2http://www.acm.org/elementk
52
topologa es muy til por su velocidad pero, siempre y cuando, la LAN no sea
muy extensa, es decir, posea pocos host y que estos no mantengan intercambio
de datos permanentemente o exista difusin o broadcast de forma continua, lo
que mejorar el ancho de banda y reducir las colisiones.
Para mejorar este desempeo existen protocolos internos del 802.3 como el
CSMA y CSMA/CD que se encargan de reducir y detectar colisiones, este
mtodo es muy comnmente usado y efectivamente disminuye el consumo de
ancho de banda reduciendo la cantidad de colisiones.
Otra forma de evitar este alto consumo de ancho de banda es usar este tipo de
arquitecturas en LAN con pocos host, y que los host que hagan parte de ella no
requieran de un intercambio de datos continuo, de esta forma sern mnimas las
colisiones y el consumo de ancho de banda. Es por esta razn que es el ms
popular a nivel mundial, pues en todas las casas y pequeas empresas es la
arquitectura ms econmica y funcional debido a la poca cantidad de host
usados y al poco flujo de datos a travs de la lnea de transmisin (Mateus et al.,
2010).3
7.3.9 Instrumentacin virtual
El concepto de instrumentacin virtual nace a partir del uso del computador
personal (PC) como "instrumento" de medicin de tales seales como
temperatura, presin, caudal, etc. Es decir, el PC comienza a ser utilizado para
realizar mediciones de fenmenos fsicos representados en seales de
corriente y/o voltaje. Sin embargo, el concepto de "instrumentacin virtual"
tambin involucra el procesamiento, anlisis, almacenamiento, distribucin y
despliegue de los datos e informacin relacionados con la medicin de una o
varias seales especficas; involucrando la interfaz hombre-mquina, las
funciones de anlisis y procesamiento de seales, las rutinas de
almacenamiento de datos y la comunicacin con otros equipos (Mateus et al.,
2010). El instrumento virtual es definido entonces como una capa de software y
hardware que se le agrega a un PC en tal forma que permite a los usuarios
interactuar con la computadora como si estuviesen utilizando su propio
3http://www.acm.org/elementk
53
instrumento electrnico diseado de acuerdo con requerimientos especficos.
Para construir un instrumento virtual, slo se requiere de un PC, una tarjeta de
adquisicin de datos con acondicionamiento de seales (PCMCIA, ISA, XT,
PCI, etc.) y el software apropiado, los tres (3) elementos clave en la
conformacin de un instrumento virtual, teniendo un chasis de
acondicionamiento de seales como elemento opcional. 4
8. DISEO DESARROLLO Y RESULTADOS
En este apartado del documento se detalla el proceso de desarrollo del diseo
de la interfaz de usuario y se explica detalladamente el proceso de
implementacin e incorporacin de todo el sistema etapa por etapa, detallando
aspectos relevantes al Kinect, en cuando a la obtencin de imgenes y mapas
de profundidad se refiere, diseo y caractersticas de la interfaz grfica de
usuario diseada en LabVIEW e incorporacin del sistema inalmbrico
bidireccional (Mateus et al., 2010).
La Interfaz De Monitoreo Con Visin Artificial Usando Kinect Aplicado A
Procesos Industriales, en la Universidad Santo Toms seccional Tunja, se
desarrolla de acuerdo con el diagrama de bloques de la figura 18, el cual
plantea el diseo de un prototipo de interfaz de usuario que emplea el
tratamiento digital de imgenes, buscando brindar un soporte a empresas y
fbricas que requieran sistemas de identificacin y manipulacin basados en
procesamiento de imgenes, capaces de interactuar directamente con una
planta sin contacto, brindando una interfaz sencilla, amigable y confiable a
cualquier usuario.
4 http://digital.ni.com/worldwide/latam.nsf/
54
Figura 18. Diagrama de bloques.
Fuente: Autores.
A grandes rasgos, el sistema se puede describir en el siguiente esquema:
Figura 19. Diagrama esquemtico de las etapas
del proyecto.
Fuente: Autores.
55
Asimismo, se puede observar la estructura del desarrollo del proyecto en el
diagrama esquemtico de la figura 20, que muestra de forma grfica la relacin
entre todos los diferentes dispositivos empleados, desde la adquisicin de
imgenes por medio del sensor Kinect, pasando por la interfaz de usuario, los
mdulos de comunicacin inalmbrica, la interconexin hacia los protocolos
seriales a Ethernet, hasta llegar a las subestaciones caracterizadas por ser
sistemas microcontrolados que obtienen datos de la planta y actan a la vez
sobre la misma.
Figura 20