FACULTAD DE ADMINISTRACIÓN HOTELERA, TURISMO
Y GASTRONOMÍA
Carrera de Administración en Turismo
MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE FOTOGRAFÍAS EN RELACIÓN A SUS
ATRIBUTOS VISUALES EN LA RED SOCIAL INSTAGRAM
PARA EL CASO DE LA ISLA TAQUILE
Tesis para optar el Título Profesional de Licenciado en
Administración en Turismo
DIANA CAROLINA GARAYAR LEGUA
SAMANTHA ESTEFANIA CIRIACO BELLIDO
Asesora:
Mg. Sandra Sotomayor Masalias
Lima – Perú 2020
ÍNDICE DE CONTENIDOS
CAPÍTULO I: INTRODUCCIÓN .............................................................................. 6
1.1. Planteamiento del Problema ............................................................................. 7
1.2. Formulación del Problema ............................................................................. 10
1.3. Justificación ................................................................................................. 10
CAPÍTULO II: MARCO REFERENCIAL ................................................................ 13
2.1. Antecedentes ................................................................................................ 13
2.2. Marco Teórico .............................................................................................. 16
2.2.1. Modelado Predictivo................................................................................ 16
2.2.2. Modelo predictivo de referencia ................................................................ 17
2.2.3. Redes Sociales y Turismo ........................................................................ 18
2.2.4. Importancia de las fotografías en el turismo ................................................ 20
2.2.5. Instagram y Turismo ................................................................................ 21
2.2.6. Engagement en Instagram ........................................................................ 23
2.2.7. Atributos visuales presentes en una fotografía en el contexto peruano ............ 26
2.2.8. Aspectos teóricos del análisis pictórico ...................................................... 27
2.2.9. El análisis de imágenes con soporte computacional ..................................... 32
2.2.10. Isla Taquile ........................................................................................... 34
2.3. Objetivos ..................................................................................................... 39
2.4. Hipótesis ...................................................................................................... 39
CAPÍTULO III: MÉTODO ...................................................................................... 40
3.1. Tipo de investigación..................................................................................... 40
3.2. Diseño de Investigación ................................................................................. 40
3.3. Variables ...................................................................................................... 42
3.4. Universo ...................................................................................................... 44
3.5. Muestra........................................................................................................ 44
3.6. Instrumentos de Investigación ......................................................................... 45
3.6.1. Downloader for Instagram ....................................................................... 45
3.6.2. Google Vision AI ..................................................................................... 46
3.6.3. EyeEm Vision ......................................................................................... 48
3.6.4. Everypixel .............................................................................................. 49
3.6.5. SPSS Modeler......................................................................................... 50
3.7. Recolección de datos ..................................................................................... 52
3.8. Plan de análisis ............................................................................................. 53
3.8.1. Regresión Lineal Múltiple ........................................................................ 53
3.8.2. Redes Neuronales .................................................................................... 55
3.8.3. Comparación de ambos modelos ............................................................... 62
CAPÍTULO IV: RESULTADOS .............................................................................. 63
4.1. Resultados .................................................................................................... 63
4.2. Discusión ..................................................................................................... 78
CAPÍTULO V: CONCLUSIONES ........................................................................... 81
5.1. Conclusiones ................................................................................................ 81
5.2. Recomendaciones ......................................................................................... 82
5.3. Limitaciones ................................................................................................. 84
BIBLIOGRAFIA .................................................................................................... 85
ÍNDICE DE TABLAS
Tabla 1: Categorías identificadas en fotografías tomadas en territorio peruano .................. 27
Tabla 2: Variables de Estudio ............................................................................................... 43
Tabla 3: ANOVA de la regresión lineal múltiple automática .............................................. 63
Tabla 4: Análisis de coeficientes y test de colinealidad ....................................................... 64
Tabla 5: Análisis de variables retiradas del modelo ............................................................. 66
Tabla 6: Resumen del modelo y Test de Durbin Watson ..................................................... 66
Tabla 7: Prueba de Kolmogórov-Smirnov para los residuos no estandarizados .................. 68
Tabla 8: Parámetro del modelo ............................................................................................. 72
Tabla 9: Resumen del modelo basado en una red neuronal ................................................. 73
Tabla 10: Precisión de cada modelo ..................................................................................... 77
ÍNDICE DE FIGURAS
Figura 1. Interés mensual en aspectos relacionados a viajes en Instagram durante el 2010 al
2019. ..................................................................................................................................... 23
Figura 2. Interés mundial hacia la Visión Artificial entre marzo del 2015 y marzo del 2019.
.............................................................................................................................................. 34
Figura 3. Arribos a la Isla Taquile durante el 2015-2019. .................................................... 36
Figura 4. Distribución mensual de arribos nacionales a la Isla Taquile durante el 2015-
2019. ..................................................................................................................................... 37
Figura 5. Distribución mensual de arribos internacionales a la Isla Taquile durante el 2015-
2019. ..................................................................................................................................... 37
Figura 6: Proporción de arribos a la Isla Taquile de acuerdo a origen (nacional-extranjero).
.............................................................................................................................................. 38
Figura 7. Modo de uso de Downloader for Instagram. ......................................................... 46
Figura 8. Interface de uso de Google Vision AI. .................................................................. 47
Figura 9. Formato de resultados del instrumento Google Vision AI.................................... 47
Figura 10. Interface y resultados del instrumento EyeEm Vision. ....................................... 48
Figura 11. Interface de Uso para el software Everypixel. .................................................... 49
Figura 12. Resultados de la aplicación Everypixel............................................................... 50
Figura 13. Interface inicial del SPSS Modeler. .................................................................... 50
Figura 14. Interface del SPSS Modeler empleado en la investigación. ................................ 51
Figura 15. Arquitectura de una red neuronal. ..................................................................... 588
Figura 16. Valores observados y predichos en la distribución normal. ................................ 68
Figura 17. Valores observados y predichos del engagement en la regresión lineal. ............ 69
Figura 18. Arquitectura de la red neuronal. .......................................................................... 70
Figura 19. Valores observados y predichos del engagement en la red neuronal. ................. 74
Figura 20. Importancia de cada variable predictora dentro de cada modelo. ....................... 75
Figura 21. Comparación de los valores predichos y observados en la regresión lineal y red
neuronal. ............................................................................................................................... 76
6
CAPÍTULO I: INTRODUCCIÓN
Una fotografía propia de la actividad turística presenta múltiples atributos visuales;
desde el paisajístico hasta incluso puede representar un estilo de vida, que naturalmente se
encuentra condicionado por el tipo de lugar visitado. Por ejemplo, en la selva amazónica se
puede registrar una biodiversidad basta y vistosa a diferencia de Barcelona donde destaca la
combinación de arquitectura gótica y modernista.
Actualmente, los usuarios de las redes sociales son testigos del incremento de la
popularidad de la temática viajera. Tal es el caso de la red social Instagram, que concentra
el mayor volumen de fotografías de la actividad turística. Una de las métricas de mayor uso
en esta red social es el engagement, el cual representa una valoración y/o aceptación de los
contenidos por parte del usuario, determinada por la suma de likes (“me gusta”) y
comentarios obtenidos (Vignisdóttir, 2016; Bakshi, Shamma & Gilbert, 2014). Asimismo,
el término engagement ha sido usado cada vez más en la literatura del marketing (Bowden,
2009). Preciamente la inrupción de internet y redes sociales han traido consigo un gran
interés por el estudio el engagement, mediante la medición de variables como las utilizadas
en las redes sociales: “me gusta” o comentarios. Cada una de estas variables responde a un
diferente grado de compromiso e intencionalidad por parte del usuario, por lo que su
utilización cuantitativa es muy diferente (Ballesteros, 2019).
Las imágenes (fotografías) y textos son extremadamente abundantes en la web, dentro
de ellos se encuentran las relacionadas al sector turismo. En este sentido, la „Ciencia de
Datos‟, viene efectuando con mayor crecimiento el aprovechamiento de datos no
estructurados (textos e imágenes). Esto debido al volumen existente en la web de dichos
7
datos empleando algoritmos como la regresión lineal múltiple y las redes neuronales para
poder pronosticar interacciones web.
Teniendo en cuenta que el engagement es una variable cuantitativa y que existen
herramientas informáticas para convertir imágenes (fotografías) en datos numéricos, ha
resultado factible construir un modelo de predicción orientado al engagement y su relación
con los atributos visuales de las imágenes (fotografías). Se ha tomado como objeto de
estudio las fotografías de la Isla Taquile en la red social Instagram, considerando que
constituye uno de los principales atractivos turísticos de la región Puno, desarrolla
actividades de turismo rural y comunitario y que cuenta con un registro fotográfico por
parte de visitantes nacionales y extranjeros.
1.1. Planteamiento del Problema
Las redes sociales han ganado un gran territorio en la vida de las personas y los
negocios. Hasta el año 2017 más de la mitad de la población mundial (más de 4.422
millones de personas) eran usuarios activos de Internet (Internet World Stats, 2019);
además, más de 2.500 millones de personas eran usuarios activos de redes sociales y el
91.3% de ellos utilizaban un dispositivo móvil para conectarse (eMarketer, 2013). Entre las
redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019), siendo
Instagram la que ofrece hasta 58 veces más interacción por seguidor que Facebook y 150
veces más que Twitter (Forrester, 2015).
En Instagram, el engagement de una fotografía puede medirse como la suma del número
de likes y comentarios que alcanza la misma en un momento determinado (Rochman,
2017). Según Quintly (2018), el 72.6% de las publicaciones en Instagram son fotografías.
8
Además, el 80% de las personas que tienen una cuenta en Instagram siguen a una empresa,
mientras que el 59% de usuarios ha utilizado esa red social para descubrir una marca o
comprar un producto o servicio. De esta manera Instagram se consagra como una de las
plataformas más potentes para la promoción de los negocios (Escobar, 2019).
El sector turismo no es ajeno a la relevancia que tiene Instagram hoy en día, ya que
según Schofield (2017), cuatro de cada diez jóvenes que forman parte de la generación
millennials (personas nacidas entre 1980 y 2000) y centennials (personas nacidas en el
2001 a la actualidad) eligen su destino de vacaciones no solo porque sea económico,
exótico o porque les traiga recuerdos, sino que el 40% lo elige en función de si es
„instagrameable‟; es decir, eligen un destino a partir de las fotografías que pueden
compartir ellos mismos o que sus amigos compartieron previamente; conclusión que
coincide con el estudio de Lonely Planet (2016), una de las mayores editoras de viajes en el
mundo. Además, según eDreams (2019), una de las principales agencias de viaje en línea
del mundo, el 52% de viajeros americanos reservan sus vacaciones basados en el insta-
worthiness (suficiente belleza de un destino para ser publicado en Instagram), antecedidos
por el viajero italiano (58%) y el viajero español (55%). De esta manera, Instagram se ha
convertido en una plataforma importante para los millennials y centennials, siendo los
primeros el segmento de mayor participación (45%) dentro de los turistas extranjeros que
visitan el Perú (PROMPERÚ, 2018).
Según IBM (2019), los instrumentos de analítica visual pueden encontrar escenas,
objetos, rostros, colores y otras características sobre el contenido de fotografías. Analizar
imágenes forma parte de la disciplina llamada “Computer Vision” (o visión por
computadora), la cual permite a un ordenador simular el proceso que realizan los ojos de un
9
ser humano cuando procesan el contenido de una fotografía (Forsyth & Ponce, 2012).
Asimismo permite la descripción y clasificación de fotografías (Szelizki, 2010) y la
medición de sus atributos visuales como: estilo de vida, paisaje, naturaleza, entre otros, los
mismos que pueden ser relacionados con el engagement mediante métodos estadísticos o
computacionales.
Por otro lado, se ha elegido la Isla Taquile como caso de aplicación, considerando que
este atractivo cuenta con tres elementos esenciales: Elemento Natural: localización
geográfica – Lago Titicaca; Elemento Cultural: Costumbres ancestrales (vestimenta típica,
alojamiento y alimentación) – turismo comunitario / turismo vivencial; Elemento Humano:
Comunidad constituida en la Isla; lo cual permite tener un mayor alcance para identificar
los atributos visuales de las fotografías. Asimismo, constituye uno de los atractivos de la
región Puno preferidos por los turistas extranjeros (52%) (PROMPERÚ, 2018). Su
ubicación en la región Puno asegura su preferencia en el tiempo, al formar parte de la Ruta
Sur del Perú (ruta de mayor preferencia), conjuntamente con la región Cusco y la región
Arequipa.
Asimismo, según el Perfil del Turista Extranjero que visita Puno 2018, tiene entre 25 a
34 años de edad; es decir, preferentemente jóvenes (PROMPERÚ, 2018); lo cual coincide
con las edades de la mayoría de usuarios que publican más del 70% del contenido de
Instagram (Hootsuite, 2019). Por lo expuesto, se puede precisar que el internet como las
redes sociales – entre ellas Instagram – constituye una importante fuente de información y
de fotografías relevantes o motivadoras para los turistas, al momento de decidir su próximo
destino a visitar.
10
Por lo anteriormente mencionado, resulta tentativo construir un modelo orientado a
predecir el engagement (nivel de aprobación) de las fotografías en la red social Instagram
en base a ciertos atributos visuales para el caso de la Isla Taquile. Finalmente, el
engagement es una variable cuantitativa, y para poder ser pronosticada a menudo son
empleados dos algoritmos: regresión lineal múltiple y redes neuronales, ambos bastante
citados en distintas publicaciones internacionales.
1.2. Formulación del Problema
¿Es significativo un modelo que relacione el engagement con los atributos visuales de
fotografías en la red social Instagram, para el caso de la Isla Taquile?
1.3. Justificación
Si bien los atributos visuales pueden ser relevantes para predecir los likes y comentarios
- o el engagement- de una imagen en Instagram, lo cierto es que todavía no se puede
establecer con precisión qué atributo visual es más importante e incluso es probable que no
todos sean importantes de acuerdo a cada ámbito del conocimiento (De, Maity, Goel,
Shitole, & Bhattacharya, 2017). El debate académico no ha incorporado modelamientos
matemáticos que contribuyan a respaldar o refutar ciertos postulados; probablemente, ello
se deba a que no se contaba con los medios tecnológicos necesarios para medir los atributos
visuales.
El aporte del presente estudio es conocer la importancia de los atributos visuales en las
fotografías de Instagram de la Isla Taquile, que tienen mayor relación con el engagement y
medir su resultado, a través de Computer Vision, y poder aplicarlo a otros destinos no
11
convencionales, ahorrando recursos económicos y tiempo al momento de escoger las
fotografías adecuadas, y de esta manera se podría incrementar el engagement de un destino
específico en Instagram, con fines principalmente promocionales para el Sector Turístico.
La aplicación práctica del análisis de fotografías es denominada Analítica de Imágenes
(Image Analytics). Debe tomarse en cuenta que el análisis de fotografías siempre ha
presentado dificultades en cuanto a su metodología, siendo uno de los principales
problemas la clasificación y descripción de su contenido (Toivonen, et al., 2019). Dicha
labor era llevada a cabo por el investigador o por los participantes, pero la aplicación de un
software especializado minimiza los sesgos.
La obtención de patrones numéricos a partir de fotografías debe ser considerada desde
una perspectiva operacional; así, los instrumentos en formato de encuesta son validados con
técnicas estadísticas, mientras que el Computer Vision se cimienta sobre la computación
cognitiva (ámbito que pretende emular el pensamiento humano en máquinas). El objetivo
surge a partir del hecho de poder conocer y cuantificar los atributos visuales de fotografías
de un destino turístico y medir su nivel de engagement, empleando dichos atributos
visuales. Esto debe ser considerado como un punto de referencia para quienes deseen
analizar registros fotográficos en investigaciones relacionadas al turismo, todo ello
aprovechando un contexto en donde son los propios viajeros quienes de forma libre eligen
proporcionar datos acerca de sus distintas experiencias.
Asimismo, este estudio pretende explorar los atributos visuales de una fotografía a través
de instrumentos que pueden obtener patrones de imágenes (ámbito del Computer Vision) y
poder ampliar este tema para futuras investigaciones, al haber escasos estudios académicos
relacionados al sector turismo, de ello queda evidencia si se exploran en los principales
12
repositorios académicos y plataformas como Web of Science o Scopus. Por otro lado, este
estudio será útil para construir KPI´s, al determinar los atributos visuales con los que debe
contar una fotografía para llegar a una determinada cantidad de reacciones positivas; es
importante recordar que los modelos predictivos contribuyen a reducir la incertidumbre y a
tomar mejores decisiones.
Finalmente, el comparar dos modelos como la regresión lineal y las redes neuronales
para pronosticar el engagement contribuye a la discusión acerca del uso de ambos
algoritmos (Kavuncuoglu, et al. 2018), los mismos han sido comparados en ámbitos de la
ingeniería, biología, físico-química, marketing, finanzas, otros (Aggarwal, 2019). Desde
luego, ambas opciones de modelado tienen sus alcances y limitaciones. Ello se menciona en
el plan de análisis y se evidencia en la sección correspondiente a resultados.
13
CAPÍTULO II: MARCO REFERENCIAL
2.1. Antecedentes
Belk y Yeh (2011) tuvieron por objetivo investigar las razones por las que los turistas
capturan imágenes de sus excursiones en cámaras o videocámaras. Durante un período de
aproximadamente cinco años, los autores analizaron fotografías o videos tomadas en
diferentes lugares internacionales por turistas y completaron su análisis por medio de
entrevistas. Los informantes al momento de llegar a casa, enviaron por correo electrónico
sus fotos de viajes junto con descripciones de lo que las imágenes representaban; estos
datos se archivaron y posteriormente fueron interpretados por los investigadores. Los
investigadores sugirieron que las imágenes formaban parte de un proyecto de identidad que
sirven para transmitir historias internas y proyectarlas hacia los demás. Asimismo,
determinaron que el nivel de actividad humana tiene relación con el hecho de que ese
momento sea capturado. Este aspecto debe ser tomado en cuenta, considerando que la
actividad humana es un rasgo inherente a una proporción de fotografías en Instagram.
Cahyanto, Pennington-Gray y Thapa (2012) adoptaron un enfoque cualitativo, indicando
que existen un conjunto de motivaciones cuando las personas deciden capturar una imagen;
el estudio se llevó a cabo en la aldea de Sambi, Indonesia, entre junio y julio del 2007; se
entregó cámaras fotográficas a 28 pobladores y se les pidió tomar fotografías de las cosas,
lugares, personas o cualquier cosa que consideraban importante de su aldea y que deseaban
compartir con los visitantes; asimismo, se le efectuaron entrevistas individuales para
obtener información acerca de las fotografías tomadas. Para el análisis de datos de las
fotografías y entrevistas, el estudio utilizó un enfoque temático inductivo, hallando cinco
temas principales que los pobladores deseaban compartir con los visitantes como: forma
14
rural de la vida, características ambientales, estructuras construidas, personas, ceremonias
tradicionales y artes. Los autores dan un especial peso a la calidad paisajística de las
fotografías como atributo para que las personas prefieran capturarlas. De este estudio cabe
destacar el uso del análisis cualitativo aplicado a quienes capturan las imágenes, así como
el dimensionamiento del contenido visual.
Haussmann, et al. (2017), centraron su atención en las preferencias acerca de la
biodiversidad en el Parque Nacional Kruger, Sudáfrica; los investigadores en un periodo
determinado, realizaron una encuesta tradicional a los turistas que visitaban el parque y
compararon los resultados con las preferencias de más de 13.600 fotografías compartidas
por turistas en Instagram y Flickr en ese mismo período. No encontraron ninguna diferencia
significativa entre las preferencias de los turistas de ambos grupos. En general, los
mamíferos de gran tamaño fueron encontrados como el grupo favorito, tanto en la encuesta
como en las plataformas de redes sociales. Sin embargo, se descubrió que Flickr
concordaba mejor con la preferencia de los turistas por la biodiversidad menos carismática.
Los hallazgos sugieren que el contenido de los medios de comunicación, como las redes
sociales, puede ser utilizado como una forma rentable de explorar y supervisar
constantemente las preferencias relacionadas a la biodiversidad y actividades humanas en
áreas protegidas. De este antecedente se determina que la presencia de fauna de gran
tamaño guarda relación con las preferencias de los turistas.
Thommes y Hubner (2018) analizaron un total de 700 fotografías vinculadas a obras
arquitectónicas. Los investigadores emplearon el modelo (algoritmos) de regresión lineal
múltiple y determinaron que habían atributos relacionados al hecho de que una imagen
registrara más likes. Entre ellos identificaron el hecho de que la fotografía fuera del tipo 3D
15
en lugar de 2D. También consideraron la variable nivel de estética; para encontrar el valor
de esta variable consideraron necesario realizar encuestas en donde los participantes
indicaron en una escala de Likert si les agradaba la fotografía. Asimismo, determinaron que
el balance de la fotografía influía directamente en la cantidad de likes. De este antecedente
cabe destacar el uso de la regresión lineal como algoritmo predictor y el uso de una escala
para medir la belleza de una foto desde una perspectiva de los participantes.
De, et al. (2017) desarrollaron un modelo predictivo en donde la variable dependiente
era el número de likes (me gusta) que recibió una fotografía relacionada a los estilos de vida
de los hindúes. Para ello fueron analizadas un total de 1280 fotografías de la red social
Instagram. El modelamiento empleado fue de redes neuronales; las fotografías fueron
extraídas de los hashtags #polaroid #oldschool #KanganaRanaut, #GQAwards, #BTS
#Exclusive, #Throwback, #WomenWeLove, #2016, #Woman. Entre las variables
consideradas se encontraban: el número de seguidores, seguidos y días en que estuvo
colgada la fotografía, número de etiquetas empleadas en la descripción, el hecho de que la
fotografía incluyera o no textos. Se obtuvo como resultado de la investigación que se puede
predecir los likes de una fotografía con el 88% de precisión. El estudio evidencia el uso del
algoritmo de redes neuronales como modelo predictivo para determinar la cantidad de likes
de fotografías de Instagram.
Ruiz y Calero (2019), tuvieron por objetivo determinar la relación entre elementos de la
discriminación digital con el precio de alquiler por noche de habitaciones de Airbnb
localizadas en el distrito de Miraflores. Para ello analizaron los datos de 120 habitaciones
rentadas en los últimos dos meses del 2018. Entre las variables predictoras fueron
consideradas la “belleza” presente en las fotografías de las habitaciones y la calificación de
16
“sorprendente”, es decir el hecho de que pudieran ser calificadas como asombrosas. Los
investigadores determinaron mediante el modelo de regresión lineal múltiple que ambos
atributos (belleza y sorprendente) tenían una relación significativa y directa con el precio.
De esta investigación se destaca el uso de instrumentos como Eyeem Vision y EveryPixel,
donde la primera permitía medir la belleza y la segunda el nivel en que una fotografía
puede ser calificada como sorprendente; asimismo, la posibilidad de emplear redes
neuronales como modelo predictivo fue mencionada en las recomendaciones de los
investigadores, aspecto que es desarrollado en el caso de la Isla Taquile.
2.2. Marco Teórico
2.2.1. Modelado Predictivo
El modelado predictivo puede ser definido como un proceso que consiste en
descubrir relaciones dentro de los datos para predecir algunos resultados deseados
en el futuro utilizando datos históricos (Mitchell, 2020). Dado que muchos dominios
científicos han contribuido a este campo, hay sinónimos para diferentes entidades;
así, por ejemplo, a la variable respuesta se lo conoce también como dependiente u
output, mientras que las independientes son denominadas también inputs del modelo
(Kuhn & Johnson, 2013).
Además, existen muchos tipos diferentes de técnicas de modelado predictivo que
incluyen regresión lineal (mínimos cuadrados ordinarios), regresión logística, series
de tiempo, árboles de decisión, redes neuronales y muchos más (Kuhn & Johnson,
2013). Al seleccionar la técnica de modelado predictivo correcta al inicio del
17
proyecto se puede ahorrar mucho tiempo. La elección de la técnica de modelado
incorrecta puede dar lugar a predicciones inexactas (Oldon & Wu, 2020).
El análisis predictivo amplía la inteligencia estadística y/o artificial para
proporcionar la capacidad de previsión (Kuhn & Johnson, 2013). También incluye
el modelado de clasificación, la aplicación de modelos para sugerir mejores formas
de hacer las cosas, para incluir la identificación de los perfiles de clientes más
probables para enviar materiales de marketing, identificar transacciones realizadas
con tarjetas de crédito robadas, medir la satisfacción de los consumidores mediante
el procesamientos de reviews online, entre otras aplicaciones (Oldon & Wu, 2020).
2.2.2. Modelo predictivo de referencia
En el ámbito de la Ciencia de Datos (o Data Science), un sector de la academia
se ha abocado a construir modelos que puedan predecir el engagement de
publicaciones en redes sociales empleando distintos algoritmos como la regresión
lineal o las redes neuronales (De, et al., 2017).
Por otra parte, con relación a las variables del modelo; investigadores como
Vignisdóttir (2016) y Chatzopolou, Sheng y Faloutsos (2010), sugieren incorporar
determinadas variables como la “cantidad de seguidores”, “número de días” que ha
permanecido la publicación en línea y “cantidad de hashtags” empleados. Por otro
lado, Salem (2012) postuló que las fotografías que contenían “textos” eran menos
atractivas visualmente. Asimismo, es necesario mencionar que hay dos principales
grupos que publican contenido: organizaciones y personas. Después, cabe destacar
que aspectos como el hecho de que la fotografía puede ser calificada como
18
“sorprendente” puede generar engagement en redes sociales (Stokman, 2014). A
ello hay que incorporar el nivel en que la fotografía pueda ser calificada como
“bella” (Ruiz & Calero, 2019). Finalmente se toman en cuenta como variables a las
categorías indicadas por Stepchenkova y Zhan (2012) (ver Tabla 1). Luego, el
modelo se determina de la siguiente forma:
Log(Engagement) = f(seguidores, hashtags, tipo_usuario, presencia_texto,
cantidad_dias, belleza, sorprendente, paisaje_natural, personas,
sitios_arqueológicos, estilo_vida, vestimenta_tradicional, arquitectura,
vida_salvaje, aventura, objeto_arte, instalaciones_turísticas)
La expresión anterior, representa al modelo de referencia a evaluar en la presente
investigación: “f” representa una función que combina a las variables establecidas .
2.2.3. Redes Sociales y Turismo
El turismo está lleno de situaciones en que los vínculos son esenciales para una
comprensión plena de su actividad: flujos turísticos, movimientos entre destinos y
rutas, relaciones interempresariales, como alianzas y franquicias, relaciones de los
interesados en los destinos, relaciones informales entre los diferentes actores,
gestión de relaciones con clientes y turistas, etc. En este sentido, el desarrollo de
redes sociales es relativamente reciente (Casanueva, Gallego, & García-Sánchez,
2014). Desde entonces, el desarrollo de algoritmos que explican la estructura de los
19
vínculos ha sido constante y ha crecido exponencialmente con el uso de la
tecnología de la información.
Según Martorell (2016), las redes sociales son plataformas digitales que sirven de
punto de encuentro para usuarios con intereses comunes, donde se comparte
información a través de diferentes herramientas y servicios que ofrecen ya sea de
mensajería, publicación de fotografía o creación de grupos entre otros. Además, las
redes sociales poseen poderosas herramientas como la interactividad, la alta calidad,
visualización, búsqueda rápida y transmisión de información, pudiendo convertirse
en una de las principales herramientas de elección de destinos turísticos (Martorell,
2016).
Las personas son miembros de las redes sociales y, por lo tanto, interactúan con
otros miembros de su red y en la medida en que la interacción implica la necesidad
de ponerse en contacto cara a cara, induce a viajar. Por consiguiente, las
características de la red social, como su número de miembros, su composición y
distribución espacial, son una fuente de explicación de la actividad social
relacionada a los viajes (Kim, Rasouli & Timmermans, 2018). Las redes sociales no
son sólo una fuente de explicación de la frecuencia, naturaleza de las actividades
sociales y el comportamiento de los viajes, sino también una fuente de explicación
de otras decisiones relacionada a los viajes, como el intercambio de información, la
influencia social y la formación de actitudes (Kim, et al., 2018). Asimismo, otro
estudio reciente demostró que las redes sociales impactan las expectativas de los
turistas sobre un destino turístico (Smith, 2018).
20
2.2.4. Importancia de las fotografías en el turismo
En los últimos años, la fotografía ha experimentado cambios sustanciales. En la
década del noventa, Fontcuberta (1997) definió a la fotografía como aquella que
requiere de la presencia de un objeto, que mediante una luz reflejada en el mismo y
sobre una superficie fotosensible, genera finalmente una imagen; esta imagen, según
el mencionado autor es un rastro almacenado, que queda en la memoria. Años
después, en el 2011, este mismo autor resalta que las fotografías, hoy en día, son
parte de una nueva cultura urbana en la que jóvenes y adolescentes no las recogen
como recuerdos para guardarlos en su mente, sino que ahora son mensajes que son
intercambiados en gestos de comunicación.
El enunciado anterior, afirma que las fotografías ya no son memorias, sino
instantes que por medio de las redes sociales muestran aspectos como “estuve aquí”,
“compré esto”, “me gusta esta marca”, entre otros. En ese sentido, la fotografía
compartida en redes sociales recopila millones de momentos intrascendentes de
manera aislada, pero a su vez es capaz de aportar nuevo conocimiento sobre
espacios, cuerpos, estéticas, modos y estilos de vida.
A principios del siglo XX, la fotografía y el turismo se integraron de manera
completa y la cámara fotográfica ha sido un distintivo de identidad del turista
(Chalfen, 1989); es decir, a donde viaje el turista coleccionará evidencias de dónde
ha estado, qué ha visto, realizado y probado. La función de la fotografía turística es
proporcionar un recuerdo del viaje (Belk & Yeh, 2011)
21
La percepción de un destino turístico no sólo se relaciona con información, sino
también se transmite por medio de imágenes o fotografías; por consiguiente, hay
muchas empresas del rubro turístico utilizan fotografías como parte de su estrategia
de marketing digital para promocionar los destinos que ofrecen. Por otro lado, se
percibe que a través de la comunicación que realiza una empresa (publicidad o
promoción de ventas), los consumidores se forman determinadas expectativas,
creencias y opiniones acerca del resultado que proporcionará el consumir el servicio
o producto en el futuro (Ngobo, 2011).
Para el caso turístico, al no existir un traslado físico de los productos y servicios
desde donde se encuentra la oferta (destino turístico) hasta donde reside la demanda
(turista), es importante realizar una apropiada publicidad del destino que genere una
buena imagen y deseo de visitarlo. Según Fakeye y Crompton (1991), la imagen de
un destino turístico es vital para la toma de decisiones del turista, ya que refleja lo
que se espera ver del destino; por ello, se deben distinguir tres dimensiones para
construir la imagen percibida de un destino: imagen orgánica (creada a través de
documentación), inducida (creada a través de la promoción del destino) y compleja
(creada a través de la experimentación del turista) (Fakeye & Crompton, 1991). Por
tanto, la elección del destino turístico depende de las 3 dimensiones mencionadas,
siendo la variable inducida (promoción) importante para la presente investigación.
2.2.5. Instagram y Turismo
Instagram es una red social, inaugurada en octubre del 2010, que permite a los
usuarios colgar fotografías y videos, de manera que estos puedan compartir
22
contenidos relacionados a su personalidad, gustos e intereses con sus seguidores.
Asimismo, ofrece una serie de funciones atractivas al usuario como: filtros de
imagen, marcos, uso de hashtags que agrupan las fotos en espacios compartidos,
chats internos, grabación de voz, visualización de estados, entre otras (Salinas,
2017).
Además, se debe de tener en cuenta que la promoción en Instagram funciona
diferente a la estructura convencional: esta última genera un costo de promoción
altísimo y un bajo impacto en los usuarios. Por otro lado, al ser principalmente una
aplicación para compartir fotografías y videos, Instagram se ha destacado como una
herramienta efectiva de comunicación y marketing para mostrar productos con
descripciones visuales (Amornpashara, Rompho & Phadoongsitthi, 2015); en tal
sentido, esta red social se convierte en una plataforma útil para usuarios como
empresas.
En cuanto a turismo, Instagram provee la facilidad de una comunicación
completa que va desde promocionar y posicionar la marca turística de un destino en
todo el mundo hasta una fotografía con contenido turístico generado por usuarios.
Según Megasari y Wayan (2015), Instagram es uno de los canales perfectos para los
tours operadores para promocionar destinos turísticos a través de imágenes, hoy en
día, el usar herramientas convencionales de promoción no es lo suficientemente
impactante como usar las redes sociales. Un claro ejemplo de esta afirmación es el
estudio aplicado en Indonesia, que explica el potencial de Instagram para
promocionar este país y describir cómo es capaz de crear y desarrollar una marca
destino a través de la publicación de fotografías en esta red social. Además, el 60%
de usuarios en Instagram publican en sus perfiles imágenes de los lugares que han
23
visitado, convirtiéndose en fotógrafos de sus experiencias y hasta embajadores de
destinos turísticos (Megasari & Wayan, 2015). Por otro lado, cabe mencionar que
las búsquedas de Instagram, a través de Google Trends (herramienta que muestra
tendencias de búsquedas en Google), en lo relacionado a la categoría „viajes‟ han
crecido en los últimos 10 años, tal como se evidencia en la figura 1.
Figura 1. Interés mensual en aspectos relacionados a viajes en Instagram durante el 2010 al 2019.
Fuente: Google Trends (2020a)
2.2.6. Engagement en Instagram
Como se menciona anteriormente, el engagement es el grado de compromiso
cognitivo y afectivo del consumidor con la marca a través de cualquier canal digital
24
(Molen & Wilson, 2010), es decir, se mide a través de la interacción de los usuarios
en los canales digitales (Molero & Milano, 2019); igualmente se define como un
término que mide de cierta forma el nivel de interacción entre una marca y los
usuarios en redes sociales (Nuñez, 2017). El engagement, también, puede ser
considerado como el arte de crear una relación de amor incondicional hacía una
marca (Perezbolde, 2010). Por otro lado, según Rodríguez (2016) el engagement se
relaciona con el número de seguidos, el número de “me gusta” en las publicaciones,
número de veces que el contenido se ha compartido por otros usuarios, por el
número de menciones y comentarios positivos (Rodríguez, 2016).
Al respecto, para medir el engagement se utilizan dos fórmulas: La primera es el
total de interacciones de los usuarios (likes, comentarios y shares) sobre la cantidad
de personas que vieron la publicación y multiplicarlo por 100 y la segunda es el
total de interacciones sobre total de seguidores actuales y multiplicarlo por 100,
según Núñez (2017). Asimismo, Origami Logic (2016) calcula el engagement
considerando el número total de interacciones dividido por: seguidores (representa
la audiencia que está potencialmente expuesta de manera directa a los contenidos),
alcance (representa el número de individuos que estuvieron expuestos al contenido)
o impresiones (representa el número total de vistas del contenido). Otra fórmula
para calcular el engagement es dividiendo el total de interacciones de los usuarios
en un período de tiempo determinado por el número de publicaciones realizadas en
ese mismo período y, luego, dividido por el número de seguidores, y multiplicado
por cien (Human Level Communications). Por ello puede ser considerado como una
métrica de popularidad muy importante para el marketing digital (Vignisdóttir,
2016).
25
No obstante, una de las fórmulas de mayor difusión para determinar el
engagement en Instagram empleada por profesionales del Marketing y la ciencia de
datos (Data Science) es la sumatoria de likes y comentarios (Vignisdóttir, 2016),
indicado también por Bakshi, Shamma y Gilbert (2014). Por otro lado,
investigadores como Zohourian, Sajedi y Yavary (2018) indicaron que resultaba
adecuado realizar ajustes a una variable de interacción empleando operaciones
como los logaritmos, ello con el fin de suavizar las diferencias.
Según el estudio de Brandwatch (2019), diariamente se producen 4,2 mil
millones de likes en Instagram y afirma que las publicaciones con al menos un
hashtag genera 12.6% de engagement. Se define como hashtag a una etiqueta o
símbolo (#) compuesto seguido por una o más palabras juntas utilizadas para
clasificar o categorizar por temática las publicaciones de usuarios en las redes
sociales (Custodio, 2017). Además, Brandwatch afirma que las publicaciones que
cuenten con Geotags (geolocalizadores) reciben 79% más de engagement;
entiéndase como Geotag a etiquetas que permiten geolocalizar mediante GPS las
imágenes y videos publicados en Instagram, permitiendo ubicar de manera más
rápida a las publicaciones de un determinado lugar. Esto demuestra la gran
capacidad que tiene Instagram de generar engagement utilizando al menos dos de
sus funciones (hashtag y geotags) y además su capacidad de penetrarse a todos los
segmentos convirtiéndolo en una plataforma imprescindible para el sector turismo
(Brandwatch, 2019).
26
2.2.7. Atributos visuales presentes en una fotografía en el contexto peruano
Si bien existen diversos atributos en una fotografía, no todos pueden ser
calificados como indicadores asociados al turismo, la cantidad de colores, el hecho
de que la fotografía cuente con efectos, una posición determinada, ángulo de toma y
otros son atributos visuales propiamente dichos, pero pueden ser estudiados por
otras disciplinas como las Ciencias de la Comunicación. Asimismo, en turismo
existen investigaciones que han buscado categorizar los atributos visuales presentes
en una fotografía (Fahmy, Bock, & Wanta, 2014).
En el contexto peruano, los atributos visuales presentes en las fotografías fueron
estudiadas por Stepchenkova y Zhan (2012) en su trabajo Visual destination images
of Peru: Comparative content analysis of DMO and user-generated photography.
Los investigadores indican que existen un grupo de atributos visuales (los cuales
denominaron categorías) presentes en las fotografías tomadas por los viajeros en el
territorio peruano, tales como: paisaje natural, presencia de personas, sitios
arqueológicos, estilo de vida, vestimenta tradicional, arquitectura, vida salvaje,
aventura, objetos de artes e instalaciones turísticas, tal como se muestra en la Tabla
1.
27
Tabla 1
Categorías identificadas en fotografías tomadas en territorio peruano
Categoría Descripción
Paisaje Natural
Naturaleza prístina con atributos menores relacionados con el ser humano;
incluye montañas, desiertos, bosques, junglas, ríos y lagos, playas, otros
afines.
Personas Pobladores locales y viajeros, razonablemente identificables en la imagen.
Sitios Arqueológicos
Estructuras preincas e incas, remanentes de la arquitectura preinca e inca,
tumbas y sitios de entierro, pirámides, templos, centros ceremoniales,
fortalezas y otros afines.
Estilo de Vida
Forma de vida de pobladores locales, refleja sus condiciones de vida, vivienda
o actividades cotidianas; puede incluir viviendas individuales o múltiples y
arquitecturas para el uso de residentes del Perú: viviendas privadas, garajes,
tiendas locales, restaurantes, pequeñas iglesias, escenas en calle de zonas
residenciales urbanas o rurales, escenas del mercado local en un campo.
Vestimenta Tradicional
Vestidos o trajes de fiesta que reflejan la cultura diferenciada del Perú y sus
regiones; algunas personas nativas (e.g. los indios Yagua del Amazonas) no
llevan ropa convencional y normalmente usan vestidos hechos a partir de
animales o hojas de árboles.
Arquitectura
Del interior como exterior de la arquitectura de estilo occidental, español y
moderno en las zonas urbanas y rurales; incluye iglesias, monasterios,
palacios, edificios públicos y otros afines.
Vida Salvaje Aves, mamíferos marinos, camélidos andinos, mariposas, primates, otros.
Aventura Actividades en bote, kayak, senderismo, trekking, equitación, pesca, natación,
ecoturismo y otros afines.
Objeto de Arte Arte folklórico, arte de museo, arte moderno o arte callejero, lo que refleja la
cultura antigua o moderna de Perú.
Instalaciones Turísticas Hoteles, restaurantes, resorts y spas, playas con sillas y sombrillas, campos de
golf, otros afines.
Fuente: Stepchenkova y Zhan (2012) – Elaboración propia
2.2.8. Aspectos teóricos del análisis pictórico
La fotografía de destino, producida por organismos de marketing turístico de
destinos como: DMO (Destination Marketing Organization) o UGC (User
Generated Content), comunican imágenes que configuran y modifican las
percepciones de destino de los viajeros. Hay dos componentes principales de una
28
fotografía: contenido y composición (Albers & James, 1988), el contenido se refiere
a las apariencias o signos capturados en una fotografía en su totalidad y la
composición a la forma en que estas apariencias o signos están vinculados entre sí y
son presentados a los espectadores. Los autores postulan que en los materiales
pictóricos que son analizados en varios dominios, incluido el turismo, a menudo se
encuentra redundancia en contenido y composición; esta redundancia no es
aleatoria.
El significado de una fotografía puede ser estructurado desde dos perspectivas,
metonímica o metafórica (Stepchenkova & Zhan, 2012). Desde la perspectiva
metonímica, todos los signos presentados en una fotografía representan a sí mismos
y se interpretan al pie de la letra; la perspectiva metafórica, en contraste, tiene que
ver con lo que la imagen significa más allá de las meras apariencias. Todos los
atributos de una fotografía se tratan como símbolos que aluden colectivamente a un
significado que se encuentra fuera de la imagen en particular. Un ejemplo de una
"lectura" metafórica sería una imagen de una rosa, que podría clasificarse como una
planta o una flor o, en ciertos contextos, podría simbolizar el romance o la pasión
(Strinati, 1995). La perspectiva elegida, metonímica o metafórica, define el enfoque
metodológico para el análisis (Stepchenkova & Zhan, 2012).
El proceso de análisis fotográfico puede ser cuantitativo y cualitativo, con dos
grandes grupos de metodologías empleados, análisis de contenido y análisis
semiótico, respectivamente (Stepchenkova & Zhan, 2012). El análisis de contenido
se ha utilizado con mayor frecuencia con contenido textual, pero también se puede
realizar en material gráfico (fotografías). En estudios culturales, las imágenes,
(incluidas pinturas, mapas, videos e incluso paisajes) a menudo se consideran como
29
una forma de textual (Albers & James, 1988). El análisis de contenido se basa en
atributos y se ocupa principalmente en describir cuantitativamente la apariencia de
ciertos temas y atributos en la colección de imágenes o fotografías, lo que permite
identificar los principales temas focales en las imágenes y sus frecuencias,
concurrencia, agrupación y otros relacionados para ser recodificados (Albers &
James, 1988). Por lo tanto, el análisis de contenido considera que una fotografía es
una metonimia y trata sus atributos (signos y manifestaciones) de forma
independiente, como atributos independientes (Albers & James, 1988). En otras
palabras, el análisis de contenido "divide" una imagen en una serie de atributos (o
categorías) guiados por lo que se representa en una foto y toma estas
representaciones al pie de la letra. Ello hace referencia al contenido manifiesto
versus el contenido latente, un problema común que se da también en el análisis
textual (Krippendorff, 2004).
Albers y James (1988), en su estudio de la relación entre fotografía, etnia y viaje,
afirmaron que el análisis de contenido está dominado por el paradigma positivista
con su énfasis en la cuantificación; siendo los temas: número de personas en la foto,
edad y género, vestimenta (e.g., ropa cotidiana o vestimenta festiva), presentación
(e.g., sujetos representados en una acción o como un retrato formal) y alrededores
(e.g., estudio, escenario al aire libre o atracción turística). Estos autores también
declararon que las coincidencias de atributos focales en una fotografía son un factor
importante para describir un conjunto de datos; una vez que se describe
cuantitativamente un conjunto de datos, puede analizarse más a fondo desde un
ángulo temporal (cuando se tomaron las imágenes), un ángulo geográfico (donde se
30
tomaron las imágenes) o una perspectiva de producción (quién tomó y distribuyó las
imágenes).
Asimismo, ha habido varios estudios que probaron la teoría de Urry (1990),
quien resalta el "círculo cerrado de representación" (elemento que hace referencia al
significado que cada persona puede otorgar a aquello que captura) dentro del marco
de análisis de contenido. Otros estudios que aplicaron el análisis de contenido a las
fotografías obtenidas por los turistas, bajo la instrucción del investigador, la llamada
técnica de fotografía empleada por el visitante (VEP). Según Garrod (2008), se
evaluó las fotografías VEP y las postales de los visitantes de la localidad y
descubrió que las dos muestras de imágenes tenían características comunes en
términos de atracciones capturadas en las imágenes, ubicaciones a partir del cual se
representaron estas atracciones, así como la composición general de la imagen. Otro
estudio de Garrod (2009), comparó las fotografías de turistas y residentes de
Aberystwyth; el resultado fue que tanto los turistas como los residentes adoptaron la
misma forma de "leer" el destino; el autor especuló que estas "lecturas" habían sido
inducidas por las representaciones de destino producidas por DMO. Asimismo,
MacKay y Couldwell (2004) compararon fotografías de un sitio histórico nacional
en la provincia de Saskatchewan, Canadá, obtenidas usando VEP, con imágenes
usadas en un esfuerzo promocional dado en ese momento. Como se puede apreciar,
cada uno de los tres estudios empíricos confirmó hasta cierto punto la existencia del
“círculo cerrado de representación” de Urry; sin embargo, también registraron
diferencias en las imágenes proyectadas y percibidas.
El análisis semiótico considera la imagen como un todo y se ocupa de investigar
cómo el contenido y la composición de una imagen comunican los mensajes
31
deseados, a través de signos y símbolos sobre el lugar o el objeto que representan
(Stepchenkova & Zhan, 2012). Como enfoque de la comunicación, que se centra en
el significado y la interpretación, la semiótica desafía el modelo de transmisión
considerado por algunos como reduccionista, que equipara el “significado” con el
"mensaje", es decir, el contenido. El análisis semiótico "trata cada imagen como una
marca de totalidad en las relaciones pautadas en su contenido, conectándolas con
estructuras paralelas y contrastantes en otras imágenes, y relacionándolas con las
narraciones escritas que las acompañan” (Albers & James, 1988).
La teoría de Urry, también se ha probado con análisis semiótico. Caton y Santos
(2008), analizaron fotografías tomadas por estudiantes en un viaje de crucero al
extranjero a un país del Tercer Mundo, a través de cinco dimensiones:
tradicional/moderno, sujeto/objeto, maestro/ servidor, centro/periferia y desviado-
vago/moral-trabajador, llegando a la conclusión de que las fotografías completan el
“círculo cerrado de representación” y se ajustan a las ideologías socioculturales del
poder y el dominio occidental.
Por otro lado, Markwick (2001), analizó imágenes de postales de Malta, su
contexto y complejidad, a través de la motivación y deseo del turista; el análisis
incluyó perspectivas tales como "sol y mar", "pasión por los viajes", “autenticidad y
realismo”. El autor identificó los circuitos complejos de consumo y producción
evidenciados en postales, destacando la importancia de los contextos en los que
operan estos circuitos.
Finalmente, el análisis de contenido se seleccionó como el método principal
debido a su capacidad para gestionar material cualitativo de manera sistemática,
verificable y replicable (Krippendorff, 2004). Aunque el análisis de contenido pueda
32
considerarse como adecuado, no permite la misma complejidad y riqueza de
interpretación que el análisis semiótico, en aquellas investigaciones que involucren
fotografías (Stepchenkova y Zhan, 2012).
2.2.9. El análisis de imágenes con soporte computacional
De acuerdo a lo mencionado en la sección anterior, el análisis pictórico puede
realizarse desde una perspectiva cuantitativa; el uso de métodos que involucren
procesos computacionales puede contribuir a la minimización de sesgos pues una
máquina carece de sesgos y obedece a procesos lógicos (Solomon & Breckon,
2011).
El análisis de imágenes es la extracción de información significativa de
imágenes; principalmente de imágenes digitales mediante técnicas de procesamiento
de imágenes digitales (Solomon & Breckon, 2011). Las tareas de análisis de
imágenes pueden ser tan simples como leer las etiquetas codificadas en barras o tan
sofisticadas como identificar el rostro de una persona (Dehghan, Ortiz, Shu & Zain,
2017).
Las computadoras son indispensables para el análisis de grandes cantidades de
datos, para tareas que requieren computación compleja o para la extracción de
información cuantitativa (Zhang, 2019). Por otro lado, la corteza visual humana es
un excelente aparato de análisis de imagen, especialmente para extraer información
de nivel superior, y para muchas aplicaciones incluyendo medicina, seguridad y
teledetección; los analistas humanos aún no pueden ser reemplazados por
computadoras (Dehghan,et al., 2017). Las herramientas importantes para el análisis
33
de imágenes, como los detectores de bordes y las redes neuronales, están inspiradas
en modelos de Computer Vision, basados en los mecanismos artificiales que
pretenden emular la percepción visual humana (Forsyth & Ponce, 2012). En el
ámbito académico de habla hispana, el proceso se conoce como Visión Artificial, la
cual también puede ser considerada como una herramienta consolidada que emplea
diversos sectores productivos, para la inspección de calidad, monitoreo y control,
tanto para productos como servicios (Cavanzo, Pérez & Villavisan, 2017). La
Visión Artificial integra tres áreas de la ingeniería: óptica, electrónica e informática.
El objetivo es la captura de imágenes de objetos o entorno, procesarlas y extraer
información relevante del estado de los productos, servicios y procesos, todo de
manera objetiva y automática.
La minería de imágenes (Image Mining) tiene como objetivo extraer relaciones y
patrones que no están explícitamente almacenados en la base de datos de imágenes
sin procesar (Zhang, 2019). La minería de imágenes es una técnica bien estructurada
basada en la minería de datos, la inteligencia artificial, el aprendizaje automático, la
recuperación y procesamiento de imágenes, la visión de ordenador y el manejo de
base de datos (Solomon & Breckon, 2011).
La capacidad de la minería de imágenes consiste en descubrir patrones de
imágenes útiles y abrir varios campos de investigación a las nuevas fronteras;
asimismo, la Big Data y Data Mining combinados de grandes colecciones de
imágenes con datos alfanuméricos asociados son los dos temas importantes de la
minería de imágenes (Solomon & Breckon, 2011). La capacidad de la minería de
imágenes para inferir el conocimiento de los datos de una imagen automática
34
constituye la razón principal de su creciente popularidad, como se muestra en la
Figura 2.
Figura 2. Interés mundial hacia la Visión Artificial entre marzo del 2015 y marzo del 2019.
Fuente: Google Trends (2020b)
2.2.10. Isla Taquile
Es una de las islas que conforman el circuito del lago Titicaca, ubicada a 36 km
al Este de la ciudad de Puno, tiene una extensión aproximada de 5.72 km2 y la
altitud entre el puerto y el pueblo varía de 3,810 a 3,950 m.s.n.m (PROMPERÚ,
2016). Está conformada por seis suyos: Kollata, Huayllano, Kollino, Chuño Pampa,
Estancia y Lakano, división relacionada con la actividad agrícola. Su clima es
templado, con temperatura máxima de 23 ºC (66 °F) y la mínima de 7 °C (37 °F)
(PROMPERÚ, s.f.).
Asimismo, según el Sistema de Información Georeferencial de MINCETUR
(SIGMINCETUR), la Isla Taquile está ubicada en la categoría 1 “Sitios Naturales”
35
de la fase de categorización de los Recursos Turísticos, de tipo “Costa”, subtipo
“Islas” y con jerarquía “2”, debido a que cuenta con algunos rasgos llamativos que
pueden ser de interés a visitantes que hubiesen llegado al lugar por otros motivos
turísticos o de motivar flujos turísticos regionales o locales (MINCETUR, 2017).
Por otro lado, la Isla Taquile tiene una población de aproximadamente dos mil
doscientas personas, descendientes de la comunidad quechua, que aún conserva la
mayoría de sus costumbres antiguas, valores, folclore y vestimenta original y
vistosa. La base de su economía es la agricultura, arte textil y turismo, siendo las
dos últimas su principal fuente de ingresos (EcuRed, 2012).
Sobre el arte textil de la Isla Taquile, según PROMPERÚ se caracteriza por sus
coloridos textiles hechos por los pobladores expertos en la práctica textil tradicional,
los finos textiles hechos por los pobladores, resaltan sus decoraciones simétricas,
simbólicas y de colores fuertes, que reflejan la forma de vida, costumbres y
creencias andinas, así conservan sus tradiciones. Su arte textil es considerado
Patrimonio Cultural Inmaterial de la Humanidad por la UNESCO (PROMPERÚ,
s.f.); esta actividad es realizada por hombres y mujeres de todas las edades;
contando con una escuela especializada para la enseñanza de su arte textil,
contribuyendo a su preservación y continuidad de la tradición (UNESCO, s.f.).
Con relación al turismo de la Isla Taquile, su principal atractivo es el turismo
comunitario, que comprende experimentar sus costumbres como: convivencia con
los pobladores para aprender y realizar actividades agrícolas aprovechando el clima
beneficioso y los recursos hídricos del lago Titicaca, conocer los ritos y creencias y
realizar los rituales andinos como el tributo a la Pachamama (MINCETUR, 2015).
En Taquile, también existen sitios turísticos arqueológicos y sitios naturales para el
36
esparcimiento como las playas Huayllano y Collata (en esta es posible hallar
petroglifos).
En lo que respecta a los arribos totales de turistas (extranjeros y nacionales) a la
Isla Taquile, según data proporcionada por MINCETUR (2020), resulta posible
afirmar que entre los años 2015 y 2019, la cantidad de arribos mantuvo una
tendencia creciente, con una contracción en el 2018, como se puede apreciar en la
Figura 3.
Figura 3. Arribos a la Isla Taquile durante el 2015-2019.
Fuente: MINCETUR (2020) – Elaboración propia
Al respecto, de emplearse el medio de regresión lineal, es posible inferir que, por
cada año transcurrido, la cantidad de arribos en la Isla Taquile creció en 9,735.
Por otro lado, la distribución mensual de los arribos nacionales y extranjeros de
la Isla Taquile en el periodo 2015 al 2019, se muestra en la Figura 4 y Figura 5,
respectivamente.
69,194
84,483
105,733
86,890
116,663 y = 9734.5x + 63389 R² = 0.6779
0
20,000
40,000
60,000
80,000
100,000
120,000
140,000
2015 2016 2017 2018 2019
37
Figura 4. Distribución mensual de arribos nacionales a la Isla Taquile durante el 2015-2019.
Fuente: MINCETUR (2020) – Elaboración propia
De acuerdo a la figura anterior, se puede inferir que en el periodo del 2015 al
2019, la Isla Taquile fue más visitada en los meses de febrero y julio por turistas
nacionales.
Figura 5. Distribución mensual de arribos internacionales a la Isla Taquile durante el 2015-2019.
Fuente: MINCETUR (2020) – Elaboración propia
7.58%
10.89%
5.67%
7.42% 7.13% 6.36%
10.50%
8.77% 8.09% 8.31%
9.66% 9.62%
0.00%
2.00%
4.00%
6.00%
8.00%
10.00%
12.00%
4.76%
7.33% 6.22%
7.51%
10.09%
8.02%
11.01% 11.65%
9.27% 8.83% 8.09%
7.23%
0.00%
2.00%
4.00%
6.00%
8.00%
10.00%
12.00%
14.00%
38
Asimismo, de la figura anterior se puede determinar que en el periodo 2015 al
2019, la Isla Taquile fue más visitada en los meses de julio y agosto por turistas
internacionales.
Finalmente, la proporción de arribos de la Isla Taquile, teniendo en cuenta el
origen (nacional y extranjero) de los turistas se muestra en la Figura 6.
Figura 6: Proporción de arribos a la Isla Taquile de acuerdo a origen (nacional-extranjero).
Fuente: MINCETUR (2020) – Elaboración propia
De la figura anterior, se puede determinar que la Isla Taquile es visitada
principalmente por turistas extranjeros en un promedio general del 81% con
respecto al total de visitantes.
17.66% 20.97% 17.27% 18.32% 20.45%
82.34% 79.03% 82.73% 81.68% 79.55%
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
2015 2016 2017 2018 2019
Nacionales Extranjeros
39
2.3. Objetivos
Objetivo general: Determinar si el modelo que relaciona el engagement de fotografías
y sus atributos visuales en la red social Instagram para el caso de la Isla Taquile resulta
significativo.
Objetivo específico 1: Determinar si el modelo de regresión lineal que relaciona el
engagement de fotografías y sus atributos visuales en la red social Instagram para
el caso de la Isla Taquile cumple con las condiciones de validez necesarias.
Objetivo específico 2: Determinar si el modelo de redes neuronales que relaciona
el engagement de fotografías y sus atributos visuales en la red social Instagram
para el caso de la Isla Taquile supera en precisión al modelo de regresión lineal.
2.4. Hipótesis
Hipótesis General: El modelo que relaciona el engagement de fotografías y sus
atributos visuales en la red social Instagram para el caso de la Isla Taquile resulta
significativo.
Hipótesis específica 1: El modelo de regresión lineal que relaciona el engagement
de fotografías y sus atributos visuales en la red social Instagram para el caso de la
Isla Taquile cumple con las condiciones de validez necesarias.
Hipótesis específica 2: El modelo de redes neuronales que relaciona el engagement
de fotografías y sus atributos visuales en la red social Instagram para el caso de la
Isla Taquile supera en precisión al modelo de regresión lineal.
40
CAPÍTULO III: MÉTODO
3.1. Tipo de investigación
La presente investigación se basa en modelos predictivos similares donde el engagement
en Instagram es la variable respuesta. Por esa razón, se considera esta investigación como
explicativa ya que busca establecer causas posibles para un fenómeno ya estudiado
(Hernández, Fernández & Baptista, 2014). En este caso, la investigación se orienta a
conocer una serie de atributos visuales que pueden explicar el engagement de las
fotografías de la Isla Taquile en Instagram. Por otro lado, cabe mencionar que los objetivos
y valores de verdad de las hipótesis de investigación serán alcanzados mediante el uso de
métodos estadístico-matemáticos. Esta es una característica distintiva de las investigaciones
cuantitativas (Kothari, 2004).
3.2. Diseño de Investigación
Por su naturaleza, la investigación es correlacional y no experimental. Los estudios
correlacionales aportan una gran utilidad ya que permite conocer cómo se puede comportar
un concepto o una variable al conocer el comportamiento de otras variables vinculadas
(Hanneman, Kposowa & Riddle, 2013). Esta correlación puede ser positiva o negativa, si es
positiva, significa que los valores altos en una variable tenderán también a mostrar valores
elevados en la otra y si es negativa o no existe correlación alguna entre las variables, indica
que fluctúan sin seguir un patrón sistemático común (Hernández, et al., 2014). Esto quiere
decir, que, con este tipo de estudio, se puede determinar cómo y cuánto es que una variable
se puede vincular o relacionar con otra de manera positiva o negativa.
41
Cabe resaltar, que las mediciones de las variables que se van a correlacionar deben
provenir de los mismos casos o participantes, pues no es común que se correlacionen
mediciones de una variable realizadas en ciertas personas o participantes, con mediciones
de otra variable realizadas en otras personas (Hernández, et al., 2014). Por otro lado, los
estudios correlacionales procuran medir el grado de relación entre variables, mientras que
los estudios descriptivos se orientan a medir con exactitud las mismas individualmente
(Kothari, 2004).
Además, la investigación es no experimental. El investigador no controla las variables ni
pretender hacerlo, únicamente se limita a recolectar datos (Sánchez & Reyes, 2015). Dicho
de otra forma, quienes asumen el rol de investigador no pretende manipular
intencionalmente las variables independientes para ver el efecto sobre otras (Hernández, et
al., 2014). Si bien es cierto que se transforman las fotografías en patrones numéricos, cabe
recalcar que dichas imágenes como tal han sido capturadas por terceros que se han
desplazado hasta la Isla Taquile. Un estudio experimental implicaría que el investigador
publique un contenido previamente establecido para medir el engagement generado
(Vignisdóttir, 2016).
El estudio es transversal. Ello implica obtener información una sola vez de cualquier
muestra de la población. Esto quiere decir, que se analiza la información en un solo
momento y no depende del factor “tiempo” como en el caso del Diseño Longitudinal. La
clasificación del Diseño Transversal se divide en Diseño Transversal Simple, aquel en
donde se obtiene por única vez información de una muestra extraída de una determinada
población, y Diseño Transversal Múltiple, definido como aquel en dónde hay más de dos
muestras de encuestados y de cada muestra se obtiene información una sola vez (Malhotra,
2008). Para este trabajo de investigación se aplicará el Diseño Transversal Simple: se
42
analizó una muestra de fotografías sustraídas de la red social Instagram y posteriormente se
obtendrá por única vez información a partir del análisis de las mismas.
3.3. Variables
Las variables de estudio se muestran en la Tabla 2 y son propias del modelo previamente
indicado en las secciones 2.2.2, es decir:
Log(Engagement) = f(seguidores, hashtags, tipo_usuario, presencia_texto,
cantidad_dias, belleza, sorprendente, paisaje_natural, personas, sitios_arqueológicos,
estilo_vida, vestimenta_tradicional, arquitectura, vida_salvaje, aventura, objeto_arte,
instalaciones_turísticas)
43
Tabla 2
Variables de Estudio
Variable Descripción Operacionalización
Engagement Variable dependiente del estudio. Representa a las interacciones de los usuarios. Observación directa (suma de likes y comentarios) a la que se aplica el logaritmo en
base 10.
Seguidores Número de seguidores de la cuenta del usuario de Instagram. Observación directa al momento de recolectar la data.
Hashtags Número de hashtags empleados en la publicación. Observación directa al momento de recolectar la data.
Tipo_usuario Variable dicotómica que hace referencia a si la fotografía fue compartida por una organización
(1) o persona (0). Observación directa al momento de recolectar la data.
Presencia_texto Variable dicotómica que hace referencia a si la fotografía presenta texto (1) o no (0). Observación directa al momento de recolectar la data.
Cantidad_días Cantidad de días que ha permanecido la fotografía en la red social Instagram. Observación directa al momento de recolectar la data (diferencial de la fecha de
publicación y recolección).
Belleza Representa el nivel de belleza de la fotografía. Es un porcentaje, es decir va desde 0 hasta
100%. Procesamiento de cada fotografía con Eyeem Vision.
Sorpredente (awesome) Representa el nivel en que la fotografía puede ser calificada como asombrosa. Es un
porcentaje que va desde 0 hasta 100%. Procesamiento de cada fotografía con EveryPixel.
Paisaje_natural Corresponde al nivel de presencia paisajística natural existente en la fotografía. Admite
valores a partir de 0. Procesamiento de cada fotografía con Google Visual AI.
Vestimenta_tradicional Corresponde al nivel de presencia de vestimenta tradicional existente en la fotografía. Admite
valores a partir de 0. Procesamiento de cada fotografía con Google Visual AI.
Arquitectura Corresponde al nivel de presencia de estructuras arquitectónicas existentes en la fotografía.
Admite valores a partir de 0. Procesamiento de cada fotografía con Google Visual AI.
Sitios_arqueológicos Hace referencia al nivel de presencia de sitios arqueológicos existentes en la fotografía.
Admite valores a partir de 0. Procesamiento de cada fotografía con Google Visual AI.
Objeto_arte Hace referencia al nivel de presencia de objetos de arte presentes en la fotografía. Admite
valores a partir de 0. Procesamiento de cada fotografía con Google Visual AI.
Estilo_vida Corresponde al nivel de presencia de escenarios asociados a un estilo de vida presente en la
fotografía. Admite valores a partir de 0. Procesamiento de cada fotografía con Google Visual AI.
Vida_salvaje Corresponde al nivel de presencia de vida salvaje presente en la fotografía. Admite valores a
partir de 0. Procesamiento de cada fotografía con Google Visual AI.
Personas Corresponde al nivel de presencia de personas presente en la fotografía. Admite valores a
partir de 0. Procesamiento de cada fotografía con Google Visual AI.
Aventura Corresponde al nivel de presencia de actividades vinculadas a la aventura presente en la
fotografía. Admite valores a partir de 0. Procesamiento de cada fotografía con Google Visual AI.
Instalaciones_turísticas Corresponde al nivel de presencia de instalaciones para turistas presente en la fotografía. Admite valores a partir de 0.
Procesamiento de cada fotografía con Google Visual AI.
Fuente: Elaboración propia
44
3.4. Universo
El universo estuvo compuesto por el conjunto total de fotografías de la red social
Instagram en las que se ha retratado la Isla Taquile. No resulta posible estimar el tamaño
del universo con la exactitud necesaria.
3.5. Muestra
Si se considera que el universo supera las 100,000 unidades (población infinita) y el
muestreo fuera aleatorio se utilizaría la siguiente fórmula:
Donde Z = 1.96 (asociado al 95% de confianza); mientras que p = q = 0.05
(p=probabilidad de éxito y q =probabilidad de fracaso) y e = error (0.05). Con dichos
valores n registra un valor de 384. Dichos parámetros son habituales en las investigaciones
científicas.
Los datos geolocalizados resultan de mayor fiabilidad para obtener información acerca
de un determinado lugar debido a que es una función automática y corroborada por el
dispositivo de captura (Kádár, 2014). La data considerada incluyó 439 fotografías desde
mayo del 2015 hasta setiembre del 2019, debido a que se cuentan con datos de los
seguidores de cada cuenta desde dicho mes y año. Además, se empleó el muestreo no
probabilístico, pues de todas las fotografías que se encuentran en Instagram, como criterios
de exclusión se han seleccionado aquellas que cuentan con el geolocalizador “Isla Taquile
– Puno”, además, se consideraron fotografías nítidas y no fragmentadas. Todo ello
evidencia que las fotografías de la Isla Taquile en Instagram no tuvieron la misma
probabilidad de ser elegidas.
45
En el muestreo no probabilístico son seleccionados elementos muestrales que no son
estadísticamente representativos de una población determinada, es decir, la elección de la
muestra no tiene la misma posibilidad de ser elegidos, sino que parte de la decisión de un
investigador o grupo de recolectores de datos (Hernández, et al., 2014). Además, fue
necesario emplear el muestreo por conveniencia: al momento de extraer la muestra, se
eligieron fotografías de perfiles públicos, debido a que en un determinado momento un
perfil puede figurar público y en otro momento, por políticas de privacidad, puede figurar
como privado, lo que limitaría la extracción de las fotografías. El muestreo no
probabilístico por conveniencia permite seleccionar la muestra de acuerdo a la
conveniencia o proximidad de los sujetos para el investigador (Otzen & Manterola, 2017).
3.6. Instrumentos de Investigación
3.6.1. Downloader for Instagram
Forma parte de la aplicación Instagram y permite descargar fotografías de dicha
red social en formato jpeg. Esta aplicación es de fácil uso pues solo requiere
descargarla sin costo alguno, agregarla como extensión de Chrome e ingresar a
Instagram desde un ordenador (Chrome Web Store, 2020). En la presente
investigación fue empleada para descargar las fotografías de la Isla Taquile, previa
delimitación geográfica de los resultados a partir de “Isla Taquile- Puno”,
posteriormente se colocó el cursor encima del botón “descargar” de cada fotografía.
La pantalla interactiva de la aplicación Downloader for Instagram se muestra en la
Figura 7.
46
Figura 7. Modo de uso de Downloader for Instagram.
Fuente: Instagram (2020)
3.6.2. Google Vision AI
Inteligencia Artificial diseñada por Google es especializada en el análisis de
imágenes (Stokman, 2014). El algoritmo ha sido entrenado en parte por las propias
búsquedas realizadas por personas que usan el mencionado navegador (Stokman,
2014). Cuenta con una versión gratuita y otra de pago. En la investigación se
empleó para poder medir las “variables contenidos en la Tabla 1”, planteados por
Stepchenkova y Zhan (2012). Google Vision AI funciona con el mecanismo drag &
drop (arrastra y suelta); es decir, solo es necesario arrastrar la imagen hacia la zona
Try the API para su análisis. La pantalla interactiva de la aplicación Google Vision
AI se muestra en la Figura 8.
47
Figura 8. Interface de uso de Google Vision AI.
Fuente: Google Vision AI (2020)
Los resultados son inmediatos, para poder visualizarlos en su totalidad es
necesario desplegar el achivo JSON, cuyo formato se muestra en la Figura 9.
Figura 9. Formato de resultados del instrumento Google Vision AI.
Fuente: Google Vision AI (2020)
Nota: En este caso pueden observarse dos resultados: uno correspondiente a Paisaje_Natural
(Natural Landscape) y otro para Arquitectura (Architecture).
48
3.6.3. EyeEm Vision
Constituye una tecnología de reconocimiento de imágenes, cuya función
principal es detectar conceptos y emociones en las fotografías. Esta herramienta se
creó a fin de resolver los problemas que la mayoría de los fotógrafos y compradores
tenían como el de querer que descubran sus fotografías y descubrir las mejores,
respectivamente. De esta manera es como EyeEm Vision nació como un motor de
visión por computadora que etiqueta fotografías según lo que se detecta en cada
imagen (EyeEm Vision, 2019).
Además de la función de etiquetar, EyeEm Vision da un paso más allá del
etiquetado automático y reconoce la intención de un fotógrafo, que puede ser un
concepto o una emoción, generando así que gran parte de las fotografías sean
descubiertas a través de conexiones instantáneas con fotógrafos y compradores de
fotografías (EyeEm Vision, 2019). Este instrumento tiene una versión gratuita y ha
sido utilizado para medir la variable “belleza” de las fotografías, la cual puede
usarse mediante el mecanismo drag & drop (arrastra y suelta). La pantalla
interactiva de la aplicación EyeEm Vision se muestra en la Figura 10.
Figura 10. Interface y resultados del instrumento EyeEm Vision.
Fuente: EyeEm Vision (2020)
Nota: El resultado para la fotografía empleada fue de 51% de belleza.
49
3.6.4. Everypixel
Aplicación basada en una red neuronal, que simula una secuencia de neuronas.
Es un algoritmo basado en una inteligencia artificial que tiene como tarea analizar la
fotografía y determinar el nivel en que esta puede ser calificada como awesome
(sorprendente). Su resultado se obtiene en un rango de 0% hasta 100%, siendo esta
precisamente la característica empleada en la investigación. La estructura de la red
neuronal vino directamente de la biología al mundo de la programación. Gracias a
ello, la máquina adquiere la capacidad de analizar e incluso memorizar una variedad
de información (Everypixel, 2019). La Figura 11 muestra la interface de uso de la
aplicación Everypixel.
Figura 11. Interface de Uso para el software Everypixel.
Fuente: Everypixel (2020)
Everypixel, al igual que Google Vision AI y EyeEm Vision, funciona con el
mecanismo drag & drop (arrastra y suelta). El resultado obtenido de medir la
variable awesome (sorprendente) en una determinada fotografía, se muestra en la
figura 12:
50
Figura 12. Resultados de la aplicación Everypixel.
Fuente: Everypixel (2020)
Nota: El resultado para la fotografía empleada fue de 18.2% awesome.
3.6.5. SPSS Modeler
Constituye un software orientado al Data Mining cuya interfaz se basa en un
flujo que debe ser elaborado por el usuario (Wendler & Gröttrup, 2016), cuya
interfaz se muestra en la Figura 13.
Figura 13. Interface inicial del SPSS Modeler.
Fuente: Wendler & Gröttrup (2016)
51
En la zona inferior de la interfaz mostrada se encuentran las herramientas que
deben ser utilizadas para el proceso de modelado, los mismos que deberán ser
seleccionados y arrastrados en el lienzo en blanco (IBM, 2017). Las herramientas
representan procesos lógicos-computacionales (Wendler & Gröttrup, 2016). El
software fue desarrollado tomando en consideración la metodología CRISP-DM
(del inglés Cross Industry Standard Process for Data Mining) (Almahadeen,
Akkaya & Sari, 2017). A continuación la Figura 14 muestra la interface aplicado en
la investigación.
Figura 14. Interface del SPSS Modeler empleado en la investigación.
Fuente: Adaptado de Wendler & Gröttrup (2016) – Elaboración propia
Existe un origen de datos (dataset) (1), a los que es necesario asignar un tipo, es
decir, variable dependiente o independiente (2). El modelo de redes neuronales
requiere particionar la data en datos de entrenamiento y testeo (3). Una opción de
52
modelado es la regresión lineal (4) y otra el uso de las redes neuronales (5). Los
resultados de cada modelo constituyen el output del modelado ((6) y (7)).
3.7. Recolección de datos
La recolección de datos es polietápica; implica una serie de etapas, que se describen a
continuación:
a) Usar la herramienta de geolocalización “Isla Taquile – Puno” para obtener la data
(fotografías) en su estado original.
b) Registrar los datos que se puedan obtener mediante observación directa como:
fecha en la que se compartió el contenido y la fecha en la que fue incorporado el
elemento (fotografía) a la muestra, lo que permitirá determinar la cantidad de días
de publicación en Instagram; cantidad de seguidores de la cuenta, likes y
comentarios que ha generado la fotografía de la Isla Taquile. Asimismo, fue posible
medir la cantidad de hashtags empleados y establecer si la fotografía contenía
texto. Del mismo modo se pudo identificar si la cuenta pertenecía a una persona u
organización, si existía alguna duda sobre cualquier caso a recolectar (por ejemplo,
no saber si la fotografía pertenecía a un individuo o una organización),
simplemente se eliminó el elemento de la muestra.
c) Descargar las fotografías empleando la aplicación Downloader for Instagram y
almacenarlas para el posterior análisis con los instrumentos propios de Image
Analytics, es decir, Google Vision AI, EyeEm Vision y EveryPixel; esta actividad se
realiza en paralelo al registro de datos. Los atributos que forman parte del
contenido visual de una fotografía digital no cambian con el tiempo (Ordenes &
53
Zhang, 2019). En contraste, lo que puede ocurrir es que los algoritmos sean
actualizados (Shukla & Vala, 2016).
d) Consolidar el dataset, de tal modo que para cada elemento muestral, se tenga
registrado el engagement (suma de likes y comentarios) junto a todos los atributos
de contenido visual y aquellas variables que han podido ser medidas mediante
observación directa.
e) Emplear el software de análisis automático de datos SPSS Modeler importando el
dataset consolidado y posteriormente construir los modelos de predicción: Redes
Neuronales y Regresión Lineal.
3.8. Plan de análisis
3.8.1. Regresión Lineal Múltiple
Una vez completada la base de datos, se procedió a emplear el SPSS Modeler.
Dada la naturaleza de la variable dependiente (engagement) que constituye una
variable cuantitativa continua; y al hecho de que las variables independientes podían
ser expresadas como números, se optó por usar la regresión lineal múltiple
(Montgomery, Peck & Vining, 2012). Fue empleada la versión step forward; este es
un método de ajuste de modelos de regresión en el que la elección de variables
independiente (también llamadas variables predictoras o explicativas), se realiza
mediante un procedimiento automático. En cada paso, se considera una variable
dependiente (o variable de respuesta) para la suma o la resta del conjunto de
variables independientes, en función de algún criterio preespecificado (Loftus &
Taylor, 2014). El software irá agregando variables al modelo hasta mientras el valor
54
R-cuadrado y R-cuadrado ajustado aumente y al punto de que el error medio no
pueda disminuirse más (Loftus & Taylor, 2014). El objetivo de esta fase es
identificar variables que aportan al modelo.
Por otro lado, es necesario mencionar que existen ciertas condiciones de validez
para considerar que la regresión lineal es un modelo adecuado (Harrell, 2015):
Aditividad y multicolinealidad: La aditividad significa que el modelo de
regresión lineal es aditivo. En otras palabras, cada variable independiente
por sí sola suma a la explicación de la variable dependiente (Osborne &
Waters, 2002). Esto implica que no haya relación entre las variables
independentes (predictoras). Si así ocurriese, se estaría dando la
multicolinealidad; esta se produce cuando dos o más variables predictoras
están relacionadas entre sí. Para verificar que no se produzca la
multicolinealidad fue empleado el VIF (Factor Inflación de Varianza); este
indicador no debe superar el valor de 5, de acuerdo a lo planteado por
(Kutner, Nachtsheim, Neter & Li, 2004).
Autocorrelación entre los residuos (diferencias entre el valor real y
pronosticado): En la regresión lineal múltiple, lo que se espera es que los
residuos sean independientes, si esta condición no llegara a darse, puede
que la ecuación encontrada presente sesgos (Osborne & Waters, 2002).
Para que la regresión lineal múltiple sea un modelo adecuado debe
verificarse el estadístico de Durbin Watson, valores próximos a dos
favorecen al modelo (Kutner, et al., 2004).
55
Normalidad: Los residuos deben tener una distribución normal (Osborne &
Waters, 2002). A fin de que esta condición sea cumplida fue aplicado la
prueba de Kolmogórov-Smirnov (Kutner, et al., 2004)
La regresión lineal es ampliamente usada, debido a que resulta sumamente
práctica. De acuerdo a Belsley (1991), una vez determinado el modelo, el mismo
puede ser replicado empleando procedimientos aritméticos sencillos. Esta posición
también es compartida por Osborne & Waters (2002), quienes indican que el
proceso puede ser llevado a mano con una hoja de cálculo. En cambio, otros
métodos no son fácilmente replicables como: la regresión PLS, por ejemplo, que
incluye otros métodos más sofisticados que exceden los límites de la investigación.
Por otro lado, las redes neuronales podrían ser empleadas, lamentablemente dicho
método computacional no permite comprobar hipótesis para cada una de las
variables, ya que el computador busca la manera de combinar las variables de
entrada mediante diferentes algoritmos para llegar a una variable respuesta
(Osborne & Waters, 2002). Finalmente, el modelo de regresión lineal múltiple ha
sido de amplio uso empleados en distintas investigaciones relacionadas a servicios
(Osborne & Waters, 2002).
3.8.2. Redes Neuronales
En las ciencias duras, el uso de las redes neuronales ha aumentado en los últimos
años. Por ejemplo, se utiliza como una poderosa técnica de análisis para detectar el
cáncer de seno, modelar la actividad antioxidante y predecir la progresión y
mortalidad de una enfermedad (Hassan, Negm, Zahran & Saavedra, 2015). La
56
popularidad de las redes neuronales se cimenta en dos hechos clave; en primer
lugar, las computadoras personales ahora son lo suficientemente potentes como para
ejecutar programas de redes neuronales a través de softwares fácilmente obtenibles
(DeTienne & DeTienne, 2017). Luego, las redes neuronales pueden superar la
mayoría de las deficiencias de las técnicas de regresión tradicionales como: el
análisis de ruidos, datos incompletos, datos no lineales y datos con valores atípicos
(DeTienne & DeTienne, 2017).
La primera investigación importante sobre redes neuronales fue realizada en
1943 por McCollough y Pitts. Rosenblatt siguió en 1962 creando un algoritmo de
aprendizaje para un modelo conocido como el perceptrón (DeTienne & DeTienne,
2017). El interés en la investigación de redes neuronales aumentó constantemente
hasta 1969, cuando un libro de Minsky y Papert indicó que las redes neuronales
podrían usarse para evaluar solo una variedad limitada de funciones (Pérez & De
Paz, 2007). Las redes neuronales se han utilizado en pocos estudios de negocios y
marketing. En el artículo de Bainbridge (2006), sobre diferentes tipos de avances en
marketing sociométrico computarizado, se señala que se ha desarrollado potentes
softwares informáticos que mejoran significativamente las oportunidades
metodológicas.
Una red neuronal artificial (Artificial Neural Network o ANN) se compone de
varias unidades interconectadas, llamadas neuronas o nodos (IBM, s.f.). Cada nudo
realiza una operación simple en una entrada para generar una salida que se reenvía a
los siguientes nodos en la secuencia (Pérez & De Paz, 2007). Este procesamiento
paralelo permite grandes ventajas en el análisis de datos. Asimismo, las tres
57
características esenciales de una red neuronal son: topología de la red, ubicación y
función de sus elementos y el entrenamiento de la red (Pérez & De Paz, 2007).
La topología de la red; se refiere al número y organización de las unidades
informáticas, el tipo de conexiones entre neuronas y la dirección del flujo de
información en la red (Ciaburro & Venkateswaran, 2017). La neurona (perceptrón)
es la unidad organizativa básica de una red neuronal, y están dispuestos en una serie
de capas para crear las redes neuronales artificiales (Ciaburro & Venkateswaran,
2017).
Según su ubicación y función dentro de la red, los nodos (neuronas) se clasifican
como nodos de entrada, salida o capa oculta (Pérez & De Paz, 2007). Los nodos de
la capa de entrada reciben información de fuentes externas a la red neuronal; los
nodos de la capa de salida transmiten información fuera de la red neuronal; y los
nodos de la capa oculta actúan como los nodos computacionales en la red neuronal,
comunicándose entre nodos de entrada y otros nodos de capa oculta y nodos de
salida (Pérez & De Paz, 2007). Al respecto, la Figura 15 muestra la arquitectura de
una red neuronal.
58
Figura 15. Arquitectura de una red neuronal.
Fuente: Hassan, et al., (2015)
Nota: Los 4 inputs de la capa de entrada (Input Layer) son las variables independientes
(predictoras), mientras que en la capa oculta (Hidden Layer) se han formado 5 nodos
intermedios. La capa de salida (Output Layer) se ubica la variable dependiente (resultado)
de la red neuronal .
El número de nodos en la capa de entrada es igual al número de variables
independientes ingresadas en la red y el número de nodos en la capa salida
corresponde al número de variables dependientes (Taylor, 2017). Las conexiones
entre las neuronas se clasifican como excitatorias o inhibitorias, tomando en cuenta
si los pesos de las neuronas son negativos o positivos, respectivamente (DeTienne &
DeTienne, 2017). La dirección del movimiento de la información también distingue
a las redes neuronales como: redes de alimentación y de retroalimentación. Las
redes de alimentación permiten la transferencia de datos en una sola dirección a
través de la red, mientras que las redes de retroalimentación permiten que los datos
circulen por la red (Stern, 1996). El número de capas y nodos ocultos utilizados
59
dentro de la capa oculta varía según la complejidad de la tarea que debe realizar la
red (Nazari, Hajiallahyari, Rahimi, Khanmohammadi & Amini, 2019).
Hasta esta etapa aún no existen reglas o funciones rigurosas para determinar la
configuración óptima de una red neuronal para resolver un problema específico.
Demasiados o muy pocos nodos en la capa oculta evitarán que la red genere los
resultados deseados (Yang, 2019). Esencialmente, las redes neuronales a menudo
dependen de prueba y error para determinar la topología de red correcta para un
problema dado, aunque es frecuente encontrar complicaciones similares con
cualquier procedimiento de análisis de datos (Stern, 1996).
Una vez que se establecen la topología de la red y la ubicación y funciones
computacionales de la misma, se debe determinar la estrategia de entrenamiento o
aprendizaje adaptativo de la red (Stern, 1996). Las redes neuronales deben
"aprender" para generar valores consistentes con los patrones en un conjunto de
datos dado para hacer proyecciones precisas (Yang, 2019). El proceso de
aprendizaje es cuando los pesos de la red cambian en respuesta a un conjunto de
datos de capacitación. Las redes neuronales aprenden de dos maneras: aprendizaje
supervisado y no supervisado, que difieren según se usen o no las respuestas
conocidas para capacitar a la red (DeTienne & DeTienne, 2017).
El aprendizaje supervisado se usa cuando el conjunto de datos contiene valores
de salida asociados con cada entrada en el conjunto de datos. La red compara los
valores que genera con los valores de salida (target) y minimiza los errores al
descubrir las características de conducción en los datos y ajustar los pesos
(DeTienne & DeTienne, 2017). Una vez capacitada, la red podrá descubrir patrones
y hacer predicciones con datos no utilizados en el conjunto de capacitación. El
60
algoritmo más común utilizado para ajustar los pesos en el aprendizaje supervisado
se llama retropropagación (Backpropagation) (DeTienne & DeTienne, 2017).
El algoritmo de aprendizaje supervisado de retropropagación se utiliza para
encontrar pesos en redes de alimentación de múltiples capas (Taylor, 2017). El
algoritmo de retropropagación es el modelo más práctico y comúnmente utilizado
para las redes neuronales. Adya y Collopy (1998) descubrieron que el 88% de los
análisis de investigación de negocios de redes neuronales durante un período de seis
años utilizaron el algoritmo de retropropagación, cuyo desarrollo es una de las
principales razones para el resurgimiento del interés en las redes neuronales. El
algoritmo retropropagación es conceptualmente simple: tomando en cuenta los
valores de entrada el rendimiento de la red se evalúa en los valores objetivo en el
conjunto de validación. Los errores resultantes de la comparación de los valores de
salida real y objetivo se propagan hacia atrás a través de la red, y los pesos se
ajustan para minimizar el error (Taylor, 2017).
Mientras la red continúe generando valores más cercanos a los valores de
validación, el aprendizaje continuará. El proceso de simulación de entrenamiento
finaliza cuando todos los patrones se clasifican correctamente dentro de un rango
seleccionado de precisión, o la red comienza a presentar un peor funcionamiento en
un proceso llamado sobreajuste o sobre entrenamiento (DeTienne & DeTienne,
2017). Si la red no puede aprender todos los patrones, la topología de la red se
puede ajustar (Taylor, 2017). Con respecto a las redes neuronales, el criterio de
rendimiento es la minimización del error al cuadrado (Taylor, 2017).
Cuando el conjunto de entrenamiento carece de valores de salida objetivo, se usa
el aprendizaje no supervisado, el cual realiza ajustes de peso con respecto a las
61
correlaciones en las variables de entrada, que en realidad son tanto variables de
entrada como de destino (Cross, Harrison & Kennedy, 1995). La red se ajusta para
que las entradas similares generen salidas similares. Esta capacitación se lleva a
cabo mediante la construcción de variables de características a partir de las cuales se
pueden predecir variables (Sarle, 1994). Durante el aprendizaje no supervisado de
redes, la capa de salida no se utiliza; los nodos de salida solo se utilizan al
interpretar los resultados (Sarle, 1994). Debido a que las redes no supervisadas se
centran solo en los valores de entrada en un conjunto de datos para descubrir las
características predictivas, se entrenan rápidamente y se usan con frecuencia como
preprocesadores para la creación de redes supervisadas (DeTienne & DeTienne,
2017). Esto se debe a que el aprendizaje supervisado se simplifica cuando las
características clave del conjunto de datos se han identificado previamente y solo
estas características son utilizadas como variables de entrada (Cross, et al., 1995).
Las redes no supervisadas son ideales para casos en que las salidas conocidas no
están disponibles (Demsar, et al., 2013).
Los métodos de análisis basados en redes neuronales no requieren suposiciones
de que las variables independientes no están correlacionadas, resolviendo así el
problema de multicolinealidad encontrado en la regresión lineal múltiple. Por
ejemplo, el estudio realizado por Pechmann y Knight (2002) sobre las creencias e
intenciones de los adolescentes acerca del consumo de cigarrillos utilizó un modelo
de dos pasos que combina la publicidad y el comportamiento de adolescentes para
producir un resultado en el que cualquiera de los factores sería inconsistente. El
estudio evidenció anuncios de fumar y videos de adolescentes que no se conocían y
monitoreó los efectos combinados de estos estímulos en las creencias. Este estudio
62
utilizó diferentes variables bajo los supuestos de la regresión lineal para sacar
conclusiones. Sin embargo, fuera de un mundo perfecto, las variables
verdaderamente independientes son casi imposibles de obtener.
3.8.3. Comparación de ambos modelos
De ambos modelos se requiere conocer su precisión (accuracy). En el caso de la
red neuronal el accuracy es una salida del SPSS, mientras que, en la regresión lineal
múltiple, la precisión es el R-cuadrado. A fin de alcanzar una mejor comprensión de
la diferencia entre los dos modelos se presenta el comparativo gráfico entre los
valores observados y predichos para cada una de las dos opciones de modelado.
Finalmente comparar la importancia de las variables predictoras dentro de cada
modelo (IBM, s.f.). Ello es necesario porque lo esperable es que las variables
independientes (predictoras) no tengan la misma importancia en dos algoritmos
distintos.
63
CAPÍTULO IV: RESULTADOS
4.1. Resultados
Los resultados del modelo de regresión lineal múltiple automático (step forward) fueron
los siguientes:
Tabla 3
ANOVA de la regresión lineal múltiple automática
Modelo
Suma de
cuadrados
Gl
Media
cuadrática
F Sig.
Regresión 62.649 11 5.695 52.788 .000l
Residuo 46.069 427 .108
Total 108.718 438
Variables Predictoras: (Constante), paisaje_natural, arquitectura, hashtags,
sitios_arqueológicos, seguidores, estilo_vida, belleza, vestimenta_tradicional, objeto_arte,
vida_salvaje, cantidad_días
Luego de haber empleado el análisis de varianza (ANOVA), de la Tabla 3 se puede
inferir que el modelo de regresión lineal múltiple ha resultado significativo (.000 inferior a
.05). Además, los resultados del Análisis de Coeficientes y Test de Colinealidad de las
variables fueron los siguientes:
64
Tabla 4
Análisis de coeficientes (aditividad) y test de multicolinealidad
Modelo
Coeficientes no
estandarizados
Coeficientes
estandarizados
t Sig.
Estadísticas de
colinealidad
B
Error
estándar
Beta Tolerancia VIF
(Constante) -.810 .128 -6.332 .000
paisaje_natural 1.454 .211 .241 6.894 .000 .813 1.230
arquitectura 1.368 .207 .223 6.619 .000 .877 1.141
hashtags .012 .001 .257 8.057 .000 .976 1.024
sitios_arqueológicos 1.292 .207 .209 6.244 .000 .888 1.127
seguidores 9.345E-06 .000 .201 6.190 .000 .939 1.065
estilo_vida 1.313 .231 .207 5.686 .000 .751 1.332
belleza .533 .098 .173 5.432 .000 .976 1.024
vestimenta_tradicional 4.568 1.041 .143 4.388 .000 .937 1.068
objeto_arte .615 .221 .091 2.783 .006 .932 1.073
vida_salvaje -.293 .129 -.078 -2.268 .024 .839 1.192
cantidad_días .000 .000 .068 2.117 .035 .954 1.048
De la Tabla 4, se ha determinado las variables que permanecen en el modelo de
regresión, por tener un nivel de significancia menor a .05. Asimismo, con la información de
la Tabla, es posible construir la ecuación de regresión, la cual adopta la siguiente forma:
65
log(engagement) = -.810 + 1.454*paisaje_natural + 1.368*arquitectura + .012*hashtags +
1.292* sitios_arqueologicos + 9.345E-06*seguidores + 1.313*estilo_vida + .533*belleza +
4.568*vestimenta_tradicional + .615*objeto_arte - .293*vida_salvaje +.000*cantidad_dias
De la expresión anterior queda evidencia de la relación entre el log(engagement) y
paisaje_natural, arquitectura, hashtags, sitios_arqueologicos, seguidores, estilo_vida,
belleza, vestimenta_tradicional, objeto_arte. Dicha relación entre ellas es directa a
excepción de vida_salvaje pues arroja un valor negativo en beta (-0.293). Luego,
cantidad_dias es una variable que tiene incidencia en la variable dependiente (engagement),
pero de forma marginal considerando que su coeficiente beta tiende a 0.
Por otro lado, cabe mencionar que se ha cumplido una de las condiciones de la regresión
lineal múltiple. Los valores VIF (Factor Inflación de Varianza) del modelo son inferiores a
2, lo que significa que no hay una relación de dependencia entre las variables
independientes (predictoras) que distorsione los resultados de la regresión; es decir, no hay
colinealidad.
A continuación, luego de haber analizado las variables que permanecen en el modelo; se
han identificado las variables a ser retiradas del modelo, por tener un nivel de significancia
mayor a 0.05, como se muestra en la Tabla 5:
66
Tabla 5
Análisis de variables retiradas del modelo
Modelo En beta T Sig.
Estadísticas de colinealidad
Tolerancia VIF
Tolerancia
mínima
tipo_usuario -.034 -1.062 .289 .982 1.018 .749
presencia_texto .049 1.538 .125 .981 1.020 .751
sorprendente .044 1.307 .192 .893 1.120 .750
personas -.020 -.630 .529 .977 1.024 .750
aventura -.044 -1.365 .173 .973 1.028 .747
instalaciones_turisticas .026 .802 .423 .968 1.033 .750
Para determinar la precisión del modelo y el cumplimiento de otra de las condiciones de
la regresión lineal múltiple (no autocorrelación entre los residuos), se ha calculado el R
cuadrado y el Test de Durbin Watson respectivamente, tal y como se muestra en la Tabla 6:
Tabla 6
Resumen del modelo y Test de Durbin Watson
Modelo R
R
cuadrado
R cuadrado
ajustado
Error
estándar de
la estimación
Durbin-
Watson
0.759 .576 .565 0.328 2.078
67
De la tabla anterior, es posible inferir que la variable dependiente log(engagement) ha
quedado determinada en un 57.6% por las variables predictoras: paisaje_natural,
arquitectura, hashtags, sitios_arqueologicos, seguidores, estilo_vida, belleza,
vestimenta_tradicional, objeto_arte, vida_salvaje y cantidad_dias. El R cuadrado es
considerado como un indicador de precisión del modelo.
Lo adecuado es evitar la autocorrelación entre residuos, esto se verifica con el
estadístico de Durbin Watson (Montgomery, et al., 2012). El Test de Durbin-Watson
permite evaluar si existe autocorrelación en una regresión lineal, sea simple o múltiple
(Harrell, 2015). Con ello se pretende ver si los valores presentan algún tipo de dependencia
en cuanto al orden de obtención, si fuera así se estaría incumpliendo una de las condiciones
del modelo de regresión lineal. Valores cercanos a 2 son los óptimos para afirmar que no se
presenta la autocorrelación entre residuos; lo que finalmente ha ocurrido, teniendo en
cuenta que el Durbin-Watson es de 2.078. Caso contrario se cae en un sesgo. En este caso
se verifica que el modelo de regresión lineal múltiple cumple con esta condición.
Otra de las condiciones de la regresión lineal múltiple es la distribución normal de los
residuos. Para facilitar la estimación por intervalo del modelo de regresión es exigible la
normalidad de la distribución de los errores. Ello se verifica usando el test de Kolmogórov-
Smirnov, tal como se muestra en la siguiente Tabla 7:
68
Tabla 7
Prueba de Kolmogórov-Smirnov para los residuos no estandarizados
Residual no estandarizado
N 439
Parámetros
normalesa,b
Media 0.000
Desviación
estándar 0.324
Máximas
diferencias
extremas
Absoluta 0.057
Positivo 0.057
Negativo -0.033
Estadístico de prueba .057
Sig. asintótica (bilateral) .002c
Dado que el nivel de significancia es de .002 (inferior a .05), no se puede aceptar que los
residuos no tengan una distribución normal. Ello es apreciable también en la Figura 16:
Figura 16. Valores observados y predichos en la distribución normal.
69
El hecho de que los residuos no tengan una distribución normal es una situación que no
favorece a la regresión múltiple como modelo. Por ello es necesario buscar otra alternativa.
Precisamente por ello se ha empleado otro algoritmo predictivo.
Con respecto a los valores observados y predichos del engagement en la regresión lineal
se muestra en la Figura 17:
Figura 17. Valores observados y predichos del engagement en la regresión lineal.
0
0.5
1
1.5
2
2.5
3
3.5
4
4.5
5
0 0.5 1 1.5 2 2.5 3 3.5 4
Val
or
Pre
dic
ho
Valor Observado
70
Por otro lado, en cuanto a los resultados de la red neuronal se muestra la topologia (o
arquitectura) en la Figura 18:
Figura 18. Arquitectura de la red neuronal.
71
De la figura anterior, cabe mencionar el hecho que las variables independientes
(predictoras) se combinan usando dos funciones: tangente hiperbólica
) en
la capa oculta e identidad ( en la capa de salida (estructura análoga a la regresión
lineal). Con respecto a los parámetros de la red neuronal se muestran en la Tabla 8:
72
Tabla 8
Parámetro del modelo
Predictor
Pronosticado
Capa oculta 1 Capa de salida
H(1:1) H(1:2) H(1:3) H(1:4) H(1:5) H(1:6) H(1:7) engagement
Capa de
entrada
(Sesgo) -.435 .471 -.110 -.366 -.516 -.244 .113
Seguidores -.156 -.301 -.613 .470 -.235 .767 -.292
Hashtags .203 -.349 -.539 .055 .002 .091 .109
tipo_usuario .401 .211 -.271 -.249 -.193 -.226 -.137
presencia_texto .219 .012 -.289 .201 .269 -.046 -.040
cantidad_días -.180 .229 -.055 -.265 .393 .233 -.236
Belleza .331 .248 -.225 -.307 -.438 .389 .079
Sorprendente .113 .402 .095 -.436 .131 .137 -.275
paisaje_natural -.413 .316 -.567 .438 -.304 .085 .265
vestimenta_tradicional .421 .195 -.255 .297 .257 .033 .343
Arquitectura .093 .627 .150 .173 -.274 .332 .353
sitios_arqueológicos -.269 .588 -.215 .380 -.188 .030 .440
objeto_arte .345 .324 -.201 -.110 -.477 -.047 .119
estilo_vida .182 -.054 -.293 -.143 .576 .605 -.107
vida_salvaje .340 .012 .184 -.314 .043 .017 .181
Personas .278 -.180 -.177 .202 .307 -.097 -.018
Aventura -.247 .340 .153 -.327 -.444 .174 -.147
instalaciones_turísticas .430 .188 -.244 -.430 -.130 -.039 -.429
Capa oculta 1 (Sesgo) .177
H(1:1) .014
H(1:2) .009
H(1:3) -.541
H(1:4) .370
H(1:5) -.058
H(1:6) .682
H(1:7) -.249
73
Con respecto a la resultados generales del modelo basado en redes neuronales se tiene:
Tabla 9
Resumen del modelo basado en una red neuronal
'División' 1_Entrenamiento 2_Testeo
Error mínimo -0.792 -0.802
Error máximo 1.268 1.177
Error medio -0.008 -0.020
Error absoluto medio 0.233 0.273
Desviación estándar 0.294 0.337
Correlación Lineal 0.817 0.716
Ocurrencia 299.0 141.0
Precisión 66.40%
La red neuronal, entonces, alcanzó una precisión de 66.40%
74
En lo que respecta a los valores obervados y predichos de la red neuronal se obtuvo:
Figura 19. Valores observados y predichos del engagement en la red neuronal.
0
0.5
1
1.5
2
2.5
3
3.5
0 0.5 1 1.5 2 2.5 3 3.5 4
Val
or
Pre
dic
ho
Valor Observado
75
En lo que respecta a la importancia de la variable predictora de cada modelo se obtuvo lo siguiente:
Figura 20. Importancia de cada variable predictora dentro de cada modelo.
Independientemente del modelo empleado, la cantidad de seguidores, hashtags, paisaje natural y estilo de vida, son las variables
predictoras que predominan, siendo la primera la variable predictora de mayor importancia.
25%
6% 4%
6%
3% 3% 3%
10%
3%
7% 5%
3%
11%
2% 2% 4% 3%
41%
11%
0% 0% 2%
5%
0%
9%
5%
8% 7%
1%
10%
1% 0% 0% 0% 0%
5%
10%
15%
20%
25%
30%
35%
40%
45%
Red Neuronal
Reg. Lineal
76
Si se compara los valores observados y predichos de cada modelo se obtiene:
Regresión Lineal Red Neuronal
Figura 21. Comparación de los valores predichos y observados en la regresión lineal y red neuronal.
77
De la Figura anterior, es posible inferir que la red neuronal ha alcanzado mejores resultados (menor dispersión entre los valores
predichos y observados). Ello se puede verificar si se compara el accuracy de ambos modelos, cuyos resultados se evidencian en la
Tabla 10.
Tabla 10
Precisión de cada modelo
Modelo Regresión Lineal Red Neuronal
Precisión (Accuracy) 57.60% 66.40%
La red neuronal ha registrado una mayor precisión que la regresión lineal.
78
4.2. Discusión
Belk & Yeh (2011), indican que el nivel de actividad humana incide en el hecho de que
una fotografía sea capturada. En el caso de la Isla Taquile, la actividad humana propia de
los locales tiene relación con el “estilo de vida”. Ocurre también que esta última tiene
relación con el engagement. La diferencia se encuentra en la naturaleza del estudio, ya que
el capturar una foto no necesariamente implica compartirla en redes sociales. Entonces
debe entenderse que pueda existir algún tipo de relación entre el contenido que decide
capturarse y aquel que genera reacciones (likes y comentarios) en las redes sociales.
Cabe resaltar que la clasificación del contenido visual indicada por Stepchenkova y
Zhan (2012) ha resultado ser adecuada para la tesis, debido a que a partir de ella se han
construido variables que han permitido aproximarse al engagement. De ello queda
evidencia en el hecho de que el modelo de regresión lineal múltiple haya resultado
significativo; caso contario, era posible afimar que ninguno de los elementos visuales
contribuye significativamente a predecir el engagement, al igual que las variables auxiliares
(seguidores, cantidad de días que ha permanecido la publicación online, etc).
Cahyanto, et al., (2012) emplearon un análisis cualitativo orientado a categorizar los
atributos visuales de Sambi. Las categorías fueron 5: características ambientales,
estructuras construidas, personas, ceremonias tradicionales y artes; mientras que en la
presente investigación se recurre a la categorización de Stepchenkova y Zhan (2012) en su
trabajo Visual destination images of Peru: Comparative content analysis of DMO and user-
generated photography, el cual incluye diez dimensiones. Ciertamente el trabajo de estas
últimas adecuado para el contexto peruano, pero no solo a nivel cualitativo, sino también
desde una perspectiva cuantitativa. De ello queda evidencia en el hecho de que el modelo
79
de regresión contenga elementos que pueden ser significativos para pronosticar el
engagement; caso contrario lo adecuado era emplear otra categorización de contenido
visual.
Haussmann, et al. (2017), indicaron que para el caso del Parque Nacional Kruger, la
fauna de gran tamaño tenga relación con las preferencias de los viajeros. En el caso de la
Isla Taquile, ciertamente la “vida salvaje” no aporta significativamente al engagement. Por
el contrario, puede disminuirlo. Esto bajo el modelo de regresión lineal múltiple. No
obstante, es una variable que no tiene una mayor importancia dentro ambas opciones de
modelado. La diferencia probablemente quede explicada por el hecho de que Taquile se
asocia al turismo rural, mientras que el Parque Nacional Kruger destaca por su vida salvaje.
Thommes y Hubner (2018), emplearon una escala de Likert para medir la “belleza” de
fotografías arquitectónicas. Como se ha evidencia en la investigación, el uso de un software
especializado es viable, e incluso puede ser empleado un indicador de belleza para construir
un modelo predictivo. Ello implica que una encuesta (instrumento) puede ser
eventualmente reemplazado por instrumentos artificiales en el caso de análisis de imágenes,
lo cual contribuye a la disminución de sesgos, ya que las herramientas han sido
programadas siguiendo procesos lógico-matemáticos.
De, et al. (2017), evidencia el uso de las redes neuronales como método predictor de un
“número de reacciones web” (cantidad de likes) en lo que a estilos de vida de los hindúes se
refiere. El engagement para el caso de las fotografías de la Isla Taquile ha podido emplear
el mencionado algoritmo. A diferencia de la regresión lineal, con la red neuronal no ha sido
necesario verificar una serie de condiciones de validez; además ha resultado de mayor
precisión; sin embargo, si se observan los parámetros de ambos modelos, es evidente que la
regresión es de más fácil de comprender.
80
Ruiz y Calero (2019), evidenciaron que la “belleza” y “nivel de asombro” pueden incidir
en el precio de alquiler de una habitación de Airbnb. En la presente investigación, el
atributo “belleza” tiene relación directa con el engagement; sin embargo, el atributo
“sorprendente” puede incidir también, pero empleando las redes neuronales. Por otro lado,
cabe destacar que para el caso de Airbnb únicamente se hizo uso de la regresión lineal
múltiple, en el caso de Taquile, ciertamente se puede usar dicho algoritmo, pero no resulta
totalmente adecuado desde una perspectiva estrictamente matemática.
81
CAPÍTULO V: CONCLUSIONES
5.1. Conclusiones
Tanto el modelo de regresión lineal múltiple como el modelo basado en redes neuronales
permiten aproximarse al engagement de fotografías de la Isla Taquile en Instagram. Sin
embargo, la regresión lineal múltiple no cumple con todas las condiciones de validez: las
variables predictoras son independientes y no se presenta la autocorrelación entre los
residuos; no obstante, los residuos no poseen una distribución normal. La hipótesis general
es verdadera: el modelo de regresión lineal múltiple es significativo, aunque no es idóneo al
no cumplir las condiciones antes mencionadas.
La primera hipótesis específica es falsa: como se ha mencionado anteriormente, la
regresión lineal múltiple no cumple con todas las condiciones de validez. Es un modelo
significativo, pero en un sentido estrictamente matemático posee sesgos.
La segunda hipótesis especifica es verdadera: las redes neuronales como modelo ha
registrado una mayor precisión que la regresión lineal múltiple (66.40% > 57.60%), por
otro lado, la red neuronal no requiere de condiciones de validez.
Por otro lado, la variable de mayor importancia es la “cantidad de seguidores”
(followers), independientemente de que modelo se use, se espera que dicha variable tenga
una relación directa. Otra variable a tomar en consideración es la “cantidad de hashtags”
empleados en la descripción y que tiene incidencia directa sobre el engagement.
Dentro de las variables de contenido visual propiamente dichos, el “estilo de vida” es la
de mayor relevancia, independientemente de que modelo sea usado. A ella le siguen en
82
importancia la presencia de “paisajes naturales”. La variable que menos aporta es la
presencia de “personas”. Las variables “belleza” y “sorprendente” son menos relevantes
dentro de las variables de contenido visual.
De los dos modelos presentados, el modelo de regresión lineal múltiple no solo incluye
una menor cantidad de variables, sino también es el que se puede implementar con mayor
facilidad. Las redes neuronales, en este sentido, resultan ser una estructura de mayor
complejidad, pero en un sentido estrictamente matemático, estas redes no tienen sesgos.
El engagement en fotografías de Instagram, que involucran a las de la Isla Taquile es
adecuado. Si es que uno de los objetivos de un gestor turístico es maximizar el engagement,
entonces no basta con que una fotografía sea bella o sorprendente (o tenga una combinación
de ambas). Es posible medir la presencia de otros atributos y aproximarse a los niveles de
engagement dada una serie de características propias de las fotografías.
5.2. Recomendaciones
En turismo, los datos no estructurados como son las fotografías que comparten los
turistas en sus redes sociales, pueden ser estudiados de forma cuantitativa siempre y cuando
sean estructurados con softwares especializados, por lo que se recomienda seguir
empleando estas herramientas. La construcción de un modelo predictivo orientado a medir
el engagement es una prueba de que estructurar atributos fotográficos no resulta una tarea
de la cual no se pueda obtener provecho académico.
Implementar el modelo resulta factible. Es recomendable guardar un registro de los
valores observados y predichos y ajustar los indicadores del modelo, con el fin de poder
83
actualizar los parámetros del mismo, dado que las preferencias pueden variar con el tiempo,
esto tiene que ver con el monitoreo de las variables asociadas al contenido de las
fotografías; por ejemplo, existen variaciones a lo largo del tiempo, respecto a si el nivel de
presencia de la paisajística natural aumenta o si la presencia de objetos de arte disminuye;
esto se denomina análisis de preferencias a lo largo del tiempo y puede emplearse en una
investigación de tipo longitudinal.
El nivel en que una fotografía pueda ser calificada como asombrosa o bella es relevante.
No obstante, no son los atributos de mayor importancia, al menos para la muestra
analizada. El contenido fotográfico es el mayor condicionante del engagement, pero por lo
general, si dos fotografías tienen un mismo contenido, se recomienda publicar aquella que
posea un mayor nivel de estética o capacidad de causar asombro; esto puede controlarse
mediante elementos como los efectos, balance de colores, entre otros.
La investigación puede complementarse con estudios cualitativos que pueden ayudar a
comprender por qué existe relación entre determinados atributos visuales y el engagement.
Este estudio puede realizarse entre usuarios de Instagram que hayan visitado la Isla Taquile.
Para investigaciones futuras, cabe destacar la posibilidad de construir modelos
segmentando a los viajeros de acuerdo a características personales; por ejemplo, se pueden
hacer divisiones de acuerdo al género de los usuarios de Instagram o según su origen
(nacional o extranjero).
Existen otras variables que pueden ser consideradas en investigaciones futuras como por
ejemplo, los datos en formato de texto que pueden ser aprovechados mediante el proceso de
Text Mining. Estos datos pueden contribuir a conocer la polaridad de las emociones
presentes en un contenido de formato textual.
84
El modelo puede ser replicado para destinos que sean comparables a la Isla Taquile a fin
de comprobar diferencias y similitudes en el modelado.
5.3. Limitaciones
Entre las limitaciones de la investigación es necesario mencionar que los instrumentos
utilizados son brindados por terceros que constantemente los actualizan. Ello, incluso, se
puede relacionar con lo que es considerado bello o hermoso a lo largo del tiempo. Los
algoritmos o modelos como la regresión lineal y redes neuronales son actualizados cada
cierto tiempo por lo que es posible que los resultados varíen incluso si se utiliza la misma
muestra de fotografías.
Por otro lado, existen quienes afirman que las computadoras están todavía lejos de
percibir significados como lo hace el cerebro humano. En las fotografías, por ejemplo, no
todo el contenido es literal. Un ejemplo de ello son los “memes”, representaciones en
donde existen otros significados que difieren del significado literal. Existen, además, otros
significados ocultos que no son tan evidentes.
La investigación ha recurrido a un muestreo abierto y por conveniencia; ello no quiere
decir que los resultados carezcan de validez, pero es necesario aclarar que el modelo es
significativo para la muestra analizada; los resultados mostrados poseen validez y es
tentativo creer que deben tener similitudes con un estudio poblacional.
85
BIBLIOGRAFIA
Adya, M., & Collopy, F. (1998). How effective are neural networks at forecasting and
prediction? A review and evalutation. Journal of Forecasting, 17, 481-495.
Aggarwal, C. (2019). Neural Networks and Deep Learning A Textbook. New York:
Springer.
Albers, P., & James, W. (1988). Travel photography: a methodological approach. Annals of
Tourism Research, 15, 134-158.
Almahadeen, L., Akkaya, M., & Sari, A. (2017). Mining Student Data Using CRISP-DM
Model. International Journal of Computer Science and Information Security, 15(2),
305-316.
Amornpashara, N., Rompho, N., & Phadoongsitthi, M. (2015). A study of the relationship
between using Instagram and purchase intention. Journal for Global Business
Advancement, 8(3), 354-370. doi:10.1504/JGBA.2015.071330
Bainbridge, W. (2006). God from the Machine: Artificial Intelligence Models of Religious
Cognition. Lanham, MD: AltaMira Press.
Bakshi, S., Shamma, D., & Gilbert, E. (2014). Faces engage us: photos with faces attract
more likes and comments on Instagram. CHI '14: Proceedings of the SIGCHI
Conference on Human Factors in Computing Systems, (págs. 965-974). Toronto .
doi:10.1145/2556288.2557403
Ballesteros, C. (2019). La representación digital del engagement: hacia una percepción del
compromiso a través de acciones simbólicas. Revista de Comunicación. 18(1). 227.
http://dx.doi.org/10.26441/RC18.1-2019-A11.
Belk, R., & Yeh, J. (2011). Tourist photographs: signs of self. International Journal of
Culture Tourism and Hospitality Research, 5(4), 345-353.
doi:10.1108/17506181111174628
Belsley, D. (1991). Conditioning Diagnostics: Collinearity And Weak Data In Regression.
New York: Wiley-Interscience.
Brandwatch. (20 de enero de 2019). 50 Incredible Instagram Statistics. Recuperado el 10 de
enero de 2019, de https://www.brandwatch.com/blog/instagram-stats/
Bowden, J. (2009). The Process of Customer Engagement: A Conceptual Framework. The
Journal of Marketing Theory and Practice, 17(1), 63–74.
doi.org/10.2753/MTP1069-6679170105
Cahyanto, I., Pennington-Gray, L., & Thapa, B. (2012). Tourist–resident interfaces: using
reflexive photography to develop responsible rural tourism in Indonesia. Journal of
Sustainable Tourism, 21(5), 1-18. doi:10.1080/09669582.2012.709860
Casanueva, C., Gallego, Á., & García-Sánchez, M. (2014). Current Issues in Tourism.
Social network analysis in tourism. doi:10.1080/13683500.2014.990422
Caton, K., & Santos, C. (2008). Closing the hermeneutic circle? Photographic encounters
with the other. Annals of Tourism Research, 35(1), 7-26.
86
Cavanzo, G., Pérez, M., & Villavisan, F. (2017). Medición de eficiencia de algoritmos de
visión artificial implementados en raspberry pi y ordenador personal mediante
python. Ingenium, 18(35), 105-119.
Chalfen, R. (1989). Snapshot Versions of Life. University of Wisconsin Press.
Chatzopolou, G., Sheng, C., & Faloutsos, M. (2010). A First Step Towards Understanding
Popularity in YouTube. NFOCOM IEEE Conference on Computer Communications
Workshop. doi:10.1109/INFCOMW.2010.5466701
Chrome Web Store. (2020). Downloader for Instagram - Descripción. Recuperado el 14 de
Marzo de 2020, de https://chrome.google.com/webstore/detail/downloader-for-
instagram/olkpikmlhoaojbbmmpejnimiglejmboe?hl=en
Ciaburro, G., & Venkateswaran, B. (2017). Neural Networks with R. Birmingham-Mumbai:
Packt Publishing.
Cross, S., Harrison, R., & Kennedy, R. (1995). Introduction to neural networks. The
Lancet, 346, 1075-1079.
Custodio, M. (2017). #Hashtag: ¿Qué significa y cómo utilizarlo de manera adecuada?
Recuperado el 27 de marzo de 2019, de https://www.rdstation.com/co/blog/hashtag-
significado-uso/
De, S., Maity, A., Goel, V., Shitole, S., & Bhattacharya, A. (2017). Predicting the
Popularity of Instagram Posts for a Lifestyle Magazine Using Deep Learning.
Recuperado de
https://www.researchgate.net/publication/319108587_Predicting_the_Popularity_of
_Instagram_Posts_for_a_Lifestyle_Magazine_Using_Deep_Learning
Dehghan, A., Ortiz, E., Shu, G., & Zain, S. (2017). DAGER: Deep Age, Gender and
Emotion Recognition Using Convolutional Neural Networks. Computer Vision and
Pattern Recognition.
Demsar, J., Curk, T., Erjavec, A., Gorup, C., Hocevar, T., Milutinovic, M., Mozina, M.,
Polajnar, M., Toplak, M., Staric, A., Stajdohar, M., Umek, L., Zagar, L., Zbontar, J.,
Zitnik, M. & Zupan, B. (2013). Orange: Data Mining Toolbox in Python. Journal of
Machine Learning, 2349-2353.
DeTienne, K., & DeTienne, D. (2017). Neural networks in strategic marketing: exploring
the possibilities. Journal of Strategic Marketing, 25(4), 289-300.
doi:10.1080/0965254X.2015.1076881
EcuRed. (2012). EcuRed. Recuperado el 27 de marzo de 2019, de
https://www.ecured.cu/Islas_Taquile
eDreams. (2019). eDreams Reveals New Study on the Insta-worthiness of Travel. Cision PR
Newswire. Recuperado de: https://www.prnewswire.com/news-releases/edreams-
reveals-new-study-on-the-insta-worthiness-of-travel-300829924.html
eMarketer. (2013). Social Networ Users Worldwide 2011 - 2017. Recuperado el 16 de
junio de 2019, de
https://i.pinimg.com/originals/57/1f/de/571fde7571b0cd30d3bb25c1ee1ba556.jpg?_
ga=2.222915417.318388950.1566224556-581713151.1565109707
87
Escobar, C. (2019). Estadísticas de Instagram que debes conocer. Sproutsocial. Recuperado
de: https://sproutsocial.com/insights/estadisticas-de-instagram-para-marketeros/
Everypixel. (2020). Resultados de demo para Everypixel. Recuperado el 13 de Marzo de
2020, de https://www.everypixel.com/aesthetics
Everypixel. (2019). About - What's the feature? Recuperado el 10 de marzo de 2019, de
https://www.everypixel.com/about
EyeEm Vision. (2020). Recuperado el 11 de Marzo de 2020, de
https://www.eyeem.com/eyeem-vision
EyeEm Vision. (2019). Introducing EyeEm Vision. Recuperado el 15 de marzo de 2019, de
https://www.eyeem.com/blog/introducing-eyevision
Fahmy, S., Bock, M., & Wanta, W. (2014). Visual Communication Theory and Research,
A mass communication perspective. Nueva York, Estados Unidos: Palgrave
Macmillan. Recuperado el 23 de agosto de 2019, de
https://books.google.com.pe/books?id=PZqxAwAAQBAJ&printsec=frontcover&hl
=es&source=gbs_ge_summary_r&cad=0#v=onepage&q&f=false
Fakeye, P., & Crompton, J. (1991). Image Differences between Prospective, First-Time,
and Repeat Visitors to the Lower Rio Grande Valley. 16. Sage. Recuperado el 20 de
agosto de 2019, de
https://www.researchgate.net/publication/249700751_Image_Differences_Between
_Prospective_First-Time_and_Repeat_Visitors_to_the_Lower_Rio_Grande_Valley
Fontcuberta, J. (1997). El beso de Judas - Fotografía y verdad. En J. Fontcuberta.
Recuperado de https://es.calameo.com/read/0024478948667869f7687
Forrester. (2015). Instagram Is The King Of Social Engagement. Recuperado el 10 de junio
de 2019, de https://go.forrester.com/blogs/14-04-29-
instagram_is_the_king_of_social_engagement/
Forsyth, D., & Ponce, J. (2012). Computer Vision, a modern approach (segunda ed.).
Pearson. Recuperado de:
https://eclass.teicrete.gr/modules/document/file.php/TM152/Books/Computer%20V
ision%20-%20A%20Modern%20Approach%20-
%20D.%20Forsyth,%20J.%20Ponce.pdf
Garrod, B. (2008). Exploring place perception: a photo-based analysis. Annals of Tourism
Research, 35(2), 381-401.
Garrod, B. (2009). Understanding the relationship between tourism destination imagery and
tourist photography. Journal of Travel Research, 47(3), 346-358.
Google Trends. (2020a). Resultados para consulta acerca de Instagram. Recuperado de
https://trends.google.es/trends/?geo=ES
Google Trends. (2020b). Resultados para consulta Visión Artificial. Recuperado de
https://trends.google.es/trends/?geo=ES
Google Vision AI. (2020). Resultados demo. Recuperado el 12 de Marzo de 2020, de
https://cloud.google.com/vision/?&utm_source=google&utm_medium=cpc&utm_c
ampaign=latam-PE-all-es-dr-bkws-all-all-trial-b-dr-1008075-
88
LUAC0009175&utm_content=text-ad-none-none-DEV_c-CRE_402089885181-
ADGP_BKWS+%7C+Multi+~+Machine+Learning+%7C+Cloud+Vision+API
Hanneman, R., Kposowa, A., & Riddle, M. (2013). Research Methods for the Social
Sciences: Basic Statistics for Social Research. Wiley.
Harrell, L. (2015). Regression Modeling Strategies (Segunda ed.). Springer.
Hassan, M., Negm, A., Zahran, M., & Saavedra, L. (2015). Assessment of Artificial Neural
Network for bathymetry estimation using High Resolution Satellite imagery in
Shallow Lakes: Case Study El Burullus Lake. Eighteenth International Water
Technology Conference, IWTC18. Sharm ElSheikh.
Haussmann, A., Toivonnen, T., Slotow, R., Tenkanen.H, Moilanen, A., Heikinheimo, V., &
Di Minin, E. (2017). Social Media Data Can Be Used to Understand Tourists‟
Preferences for Nature-Based Experiences in Protected Areas. Conservation Letters.
doi:10.1111/conl.12343
Heraldo. (2019). Instagram registra más de 70 millones de fotos diariamente. Zaragoza.
Recuperado de https://www.heraldo.es/noticias/sociedad/2015/09/22/instagram-
registra-mas-de-70-millones-de-fotos-diariamente-487574.html#
Hernández, R., Fernández, C., & Baptista, P. (2014). Metodología de la investigación.
(Sexta). Recuperado el 1 de abril de 2019
Hootsuite. (2019). Todos los datos y tendencias que necesitas para entender los
componentes en Internet, Redes Sociales, Móvil y Comercio Electrónico. España.
Recuperado el 20 de enero de 2019, de https://es.slideshare.net/t2omedia/digital-
2019-estudio-hootsuite
IBM. (2017). SPSS Modeler. Recuperado el 30 de Enero de 2020, de
https://www.ibm.com/pe-es/marketplace/spss-modeler
IBM. (2019). Watson Visual Recognition. Recuperado el 28 de mayo de 2019, de
Características de Watson Visual Recognition: https://www.ibm.com/pe-
es/cloud/watson-visual-recognition
IBM. (s.f.). IBM SPSS Neural Networks 21. Recuperado el Febrero de 2020, de
ftp://public.dhe.ibm.com/software/analytics/spss/documentation/statistics/21.0/es/cli
ent/Manuals/IBM_SPSS_Neural_Network.pdf
Instagram. (2020). Resultado para búsqueda Isla Taquile - Puno. Recuperado el 13 de
Marzo de 2020, de https://www.instagram.com/explore/locations/661454483/isla-
taquile-puno/
Internet World Stats. (2019). Internet Users in the World by Regions 2019. Recuperado el 3
de mayo de 2019, de
https://www.internetworldstats.com/stats.htm?_ga=2.136139127.717387088.15651
09707-581713151.1565109707
Kádár, B. (2014). Measuring tourist activities in cities using geotagged photography. An
International Journal of Tourism Space, Place and Environment, 16(1), 88-104.
doi:10.1080/14616688.2013.868029
89
Kavuncuoglu, H., Kavuncuoglu, E., Karatas, S., Benli, B., Sagdic, O., & Yalcin, H. (2018).
Prediction of the antimicrobial activity of walnut (Juglans regia L.) kernel aqueous
extracts using artificial neural network and multiple linear regression. Journal of
microbiological methods, 148, 78-86.
Kim, J., Rasouli, S., & Timmermans, H. (2018). Social networks, social influence and
activity-travel behaviour: a review of models and empirical evidence. Transport
Reviews, 38(4), 499-523. doi:10.1080/01441647.2017.1351500
Kothari, C. (2004). Research Methodology, Methods and Techniques (Segunda ed.). New
Age International.
Krippendorff, K. (2004). Content analysis: An introduction to its methodology. Thousand
Oaks, California: Sage Publications.
Kuhn, M., & Johnson, K. (2013). Applied Predictive Modeling. New York: Springer.
doi:10.1007/978-1-4614-6849-3
Kutner, M., Nachtsheim, C., Neter, J., & Li, W. (2004). Applied Linear Statistical Models
(Quinta ed.). McGraw-Hill.
Loftus, J., & Taylor, J. (2014). A significance test for forward stepwise. Cornell University.
Recuperado el 2 de agosto de 2019, de https://arxiv.org/abs/1405.3920
Lonely Planet. (2016). Young travellers more likely to find holiday inspiration on social
media. Recuperado el 10 de febrero de 2020, de
https://www.lonelyplanet.com/articles/travellers-holiday-inspiration-social-media
MacKay, J., & Couldwell, C. (2004). Using visitor-employed photography to investigate
destination image. Journaol of Travel Research, 42(4), 390-396.
Malhotra, N. (2008). Investigación de mercados (Quinta ed.). México: Pearson Educación.
Recuperado el 19 de julio de 2019, de
https://www.academia.edu/11400390/Investigacion_de_Mercados_5ta_Edicion_-
_Naresh_K._Malhotra
Markwick. (2001). Postcards from Malta: image, consumption, contex. Annals of Tourism
Research, 28(2), 417-438.
Martorell, S. (2016). Las redes sociales como medio de promoción de la práctica artística.
20. Valencia, España. Recuperado el 22 de mayo de 2019, de
https://dialnet.unirioja.es/servlet/articulo?codigo=5901088
Megasari, N., & Wayan, I. (2015). Beyond User Gaze: How Instagram Creates Tourism
Destination Brand? Recuperado el 27 de julio de 2019, de
https://www.sciencedirect.com/science/article/pii/S1877042815054853
MINCETUR. (2015). Memorial de Turismo Rural Comunitario en el Perú. Recuperado el
10 de junio de 2019, de http://media.peru.info/koha/Memorial-Turismo-Rural-
Comunitario-en-el-Peru.pdf
MINCETUR. (2017). Sistema de Información Georeferencial de MINCETUR . Recursos
Turísticos. Recuperado el 22 de mayo de 2019, de
http://ficha.sigmincetur.mincetur.gob.pe/index.aspx?cod_Ficha=959
90
MINCETUR. (2020). Reportes Estadísticos de Turismo. Recuperado el 10 de Marzo de
2020, de https://www.mincetur.gob.pe/turismo/reportes-estadisticos-de-turismo/
Mitchell, M. (2020). Selecting the Correct Predictive Modeling Technique. Recuperado el
15 de Marzo de 2020, de Towards Data Science:
https://towardsdatascience.com/selecting-the-correct-predictive-modeling-
technique-ba459c370d59
Molen, A., & Wilson, H. (2010). Engagement, telepresence and interactivity in online
consumer experience: Reconciling scholastic and managerial perspectives.
Recuperado el 22 de mayo de 2019, de
https://www.sciencedirect.com/science/article/abs/pii/S0148296309002100?via%3
Dihub
Molero, R., & Milano, C. (2019). De dos orillas: imagen y experiencia en el turismo. Pasos
edita. Recuperado el 19 de mayo de 2019, de
http://www.pasosonline.org/Publicados/pasosoedita/PSEdita23.pdf
Montgomery, D., Peck, E., & Vining, G. (2012). Introduction to Linear Regression (Quinta
ed.). Wiley.
Nazari, A., Hajiallahyari, H., Rahimi, A., Khanmohammadi, H., & Amini, A. (2019).
Prediction compressive strength of Portland cement-based geopolymers by artificial
neural networks. En Neural Computing and Applications. doi:DOI 10.1007/s00521-
012-1082-3
Ngobo. (2011). La imagen de un destino turístico como herramienta de marketing. En O.
Femenía, La imagen de un destino turístico como herramienta de marketing (pág.
38). Recuperado el 20 de agosto de 2019, de
https://dialnet.unirioja.es/servlet/libro?codigo=482050
Nuñez, V. (2017). Fórmula para calcular engagement en redes sociales y CTR. Recuperado
el 15 de marzo de 2019, de https://vilmanunez.com/formula-engagement-redes-
sociales-ctr/
Oldon, D., & Wu, D. (2020). Predictive Data Mining Models (Segunda ed.). New York:
Springer.
Ordenes, F., & Zhang, S. (2019). From words to pixels: text and image mining methods for
service research. Journal of Service Management. doi:10.1108/JOSM-08-2019-
0254
Origami Logic. (2016). The Marketers Guide To Measuring Social Engagement.
Recuperado de http://docplayer.net/14260996-The-marketers-guide-to-measuring-
social-engagement.html
Osborne, J., & Waters, E. (2002). Four Assumptions of Multiple Regression That
Researchers Should Always Test. Practical Assessment, Research and Evaluation,
8(8). doi:10.7275/r222-hv23
Otzen, T., & Manterola, C. (2017). Técnicas de Muestreo sobre una Población a Estudio.
International journal of morphology, 35(1), 227-232.
91
Pechmann, C., & Knight, S. (2002). An experimental investigation of the joint effects of
advertising and peers on adolescents‟ beliefs and intentions about cigarette
consumption. Journal of Consumer Research, 29, 5-19.
Pérez, M., & De Paz, Y. (2007). Cuadernos de Estadística - Aplicación de las Redes
Neuronales artificiales a la regresión (Vol. 35). Madrid: La Muralla.
Perezbolde, G. (2010). Engagement... El término del que todos hablan, pero pocos
entienden. Recuperado el 15 de junio de 2019, de
https://www.merca20.com/engagement-el-termino-del-que-todos-hablan-pero-
pocos-entienden/
PROMPERÚ. (2018). Perfil del Turista Extranjero 2018: Turismo In. Recuperado de:
https://www.promperu.gob.pe/TurismoIN/sitio/PerfTuristaExt
PROMPERÚ. (s.f.). El Lago Titicaca. Recuperado de https://www.peru.travel/es-es/que-
hacer/naturaleza/lagos-lagunas-cataratas-y-rios/lago-titicaca.aspx
PROMPERÚ. (2018). Perfil del Turista Extranjero que visita Puno - 2018: Turismo In.
Recuperado de:
https://www.promperu.gob.pe/TurismoIN/sitio/VisorDocumentos?titulo=Lugar%20
visitado%20-
%20Puno&url=~/Uploads/perfiles_extranjeros/41/tips/2615/PTE18Puno.pdf&nomb
Objeto=PerfTuristaExt&back=/TurismoIN/sitio/PerfTuristaExt&peso=98417
PROMPERÚ. (s.f.). Y tú qué planes. Recuperado de
https://www.ytuqueplanes.com/destinos/puno/215_isla-de-taquile
Quintly. (2018). The 2018 Instagram Study. Recuperado el 10 de junio de 2019, de
https://info.quintly.com/instagram-study/view
Rodríguez, V. (2016). Marcas de moda en las redes sociales : el poder de Instagram para
generar engagement dentro de la comunidad. Barcelona, España. Recuperado el 15
de abril de 2019, de https://ddd.uab.cat/record/170114
Ruiz, G., & Calero, O. (2019). Relación entre los elementos de la discriminación digital y
el precio de alquiler por noche asignado a habitaciones privadas en Airbnb en
Lima Moderna. Universidad San Ignacio de Loyola, Facultad de Ciencias
Empresariales. Recuperado de http://repositorio.usil.edu.pe/handle/USIL/9014
Salem, V. (2012). Amixer está en Facebook, una investigación sobre la choledad virtual.
Tesis de maestría, Pontificia Universidad Católica del Perú, Lima. Recuperado de
http://tesis.pucp.edu.pe/repositorio/bitstream/handle/123456789/4643/SALEM_VE
RONICA_AMIXER.pdf?sequence=1
Salinas, A. (11 de agosto de 2017). Historia, servicios y características de la red social
Instagram. Recuperado el 29 de mayo de 2019, de
https://mott.marketing/informacion-sobre-la-historia-servicios-caracteristicas-de-la-
red-social-instagram/
Sánchez, H., & Reyes, C. (2015). Metodología y Diseños en la Investigación Científica
(Quinta ed.). Lima: Business Suport.
92
Sarle, W. (1994). Neural networks and statistical models. Proceedings of the 19th Annual
SAS Group conference, Cary, NC. pp. 1.538-1.550.
Schofield, P. (2017). Two fifths of millennials choose their holiday destination based on
how „Instagrammable‟ the holiday pics will be. Schofields Insurance. Recuperado
de https://www.schofields.ltd.uk/blog/5123/two-fifths-of-millennials-choose-their-
holiday-destination-based-on-how-instagrammable-the-holiday-pics-will-be/
Shukla, V., & Vala, J. (2016). A Survey on Image Mining, its Techniques and Application.
International Journal of Computer Applications, 133(9), 12-15.
Smith, S. (2018). Instagram abroad: performance, consumption and colonial narrative in.
Postcolonial Studies, 21(2), 172-191. Recuperado el 20 de mayo de 2019, de
http://hub.hku.hk/bitstream/10722/263767/1/Content.pdf
Solomon, C., & Breckon, T. (2011). Fundamental of Digital Image Process. Oxford:
Willey-Blackwell.
Stepchenkova, S., & Zhan, F. (2012). Visual destination images of Peru: Comparative
content analysis of DMO and user-generated photography. 36. Recuperado el 23 de
agosto de 2019, de
https://www.sciencedirect.com/science/article/abs/pii/S0261517712001422
Stern, H. (1996). Neural networks in applied statistics. Technometrics, 38, 205-214.
Stokman, H. (2014). The Future of Smart Photography. IEEE MultiMedia, 21(3), 66-71.
Strinati, D. (1995). An introduction to theories of popuar culture. London: Routledge.
Szelizki, R. (2010). Computer Vision: Algorithms and Applications. Recuperado de:
http://szeliski.org/Book/drafts/SzeliskiBook_20100903_draft.pdf
Taylor, M. (2017). Make Your Own Neural Network: An In-depth Visual Introduction For
Beginners .
Thommes, K., & Hubner, R. (2018). Instagram Likes for Architectural Photos Can Be
Predicted by Quantitative Balance Measures and Curvature. Recuperado el 19 de
mayo de 2019, de
https://www.frontiersin.org/articles/10.3389/fpsyg.2018.01050/full
Toivonen, T., Heikinheimo, V., Fink, C., Hausmann, A., Hiipala, T., Jarv, O., Tenkanen,
H., & Di Minin E., (2019). Social media data for conservation science: A
methodological overview. Biological Conservation, 233, 298-315. Recuperado el 2
de junio de 2019, de
https://www.sciencedirect.com/science/article/pii/S0006320718317609
UNESCO. (s.f.). El arte textil de Taquile. Recuperado el 17 de mayo de 2019, de Inscrito
en 2008 en la Lista Representativa del Patrimonio Cultural Inmaterial de la
Humanidad (originalmente proclamado en 2005): https://ich.unesco.org/es/RL/el-
arte-textil-de-taquile-00166
Urry, J. (1990). The tourist gaze. London: Sage Publications.
Vignisdóttir, A. (2016). CUSTOMER ENGAGEMENT ON INSTAGRAM BRAND PAGES
IN THE MAKE-UP COSMETICS INDUSTRY. Recuperado el 12 de Junio de 2018,
de
93
https://skemman.is/bitstream/1946/26717/1/MAR0117_Thesis_Annika_Vignisdottir
_Customer%20Engagement%20on%20Instagram%20Brand%20Pages%20In%20th
e%20Make-up%20Cosmetics%20Industry.pdf
Wendler, T., & Gröttrup, S. (2016). Data Mining with SPSS Modeler, Theory, Exercises
and Solutions. Berlin: Springer.
Yang, X. (2019). Introduction to Algorithms for Data Mining and Machine Learning.
Academic Press.
Zhang, D. (2019). Fundamentals of Image Data Mining: Analysis, Features, Classification
and Retrieval. Springer.
Zohourian, A., Sajedi, H., & Yavary, A. (2018). Popularity prediction of images and videos
on Instagram. 2018 4th International Conference on Web Research (ICWR), (págs.
111-117). Tehran.