UNIVERSIDAD DE CHILEFACULTAD DE CIENCIAS FÍSICAS Y MATEMÁTICASDEPARTAMENTO DE INGENIERÍA MATEMÁTICA
Estudios experimentales y de modelaciónen aprendizaje y cognición matemática
Tesis para optar al grado deDoctor en Ciencias de la Ingenierı́a
mención Modelación Matemática
David Maximiliano Gómez Rojas
Profesor Guı́aPablo Dartnell Roy
Miembros de la ComisiónServet Martı́nez AguileraRafael Correa Fontecilla
Roberto Araya SchulzJorge Soto Andrade
Pedro Rosas Henrı́quez
Santiago de ChileDiciembre 2010
Resumen de la Tesis para optar al grado de Doctoren Ciencias de la Ingenierı́a mención Modelación Matemática
Autor: David M. GómezFecha Examen: 21 de Diciembre de 2010
Prof. Guı́a: Pablo Dartnell
Estudios experimentales y de modelaciónen aprendizaje y cognición matemática
En este trabajo se presenta una serie de estudios sobre aprendizaje y cognición numérica, desdeun enfoque mixto entre la modelación matemática y la experimentación psicológica.
Se comienza analizando un modelo sobre memoria y aprendizaje, investigando los efectos deldecaimiento temporal de cada recuerdo en la capacidad de un agente ideal para estimar la probabilidadde ocurrencia α de un evento dado. Para esto, el agente construye un estimador (Qn) en el contextode un proceso estocástico a tiempo discreto, y la velocidad de decaimiento de cada recuerdo está dadapor una llamada función de olvido. El análisis es considerablemente más general que el realizado entrabajos previos, encontrándose clases de funciones de olvido que hacen que (Qn) converja a α conprobabilidades cero o uno. Se extiende algunos de estos resultados a casos en donde el agente debeestimar las probabilidades asociadas a un conjunto finito de eventos.
Se revisa luego investigaciones sobre la capacidad de animales y humanos para representar mental-mente cantidades de objetos. Se plantea un problema de optimización para estudiar la recta numéricamental propuesta en la literatura como base de estas representaciones numéricas, suponiendo que estarecta numérica ha sido moldeada en un proceso evolutivo que tiende a maximizar la discriminabilidadentre representaciones mentales de números consecutivos. Se demuestra la existencia de una cantidadmáxima discriminable, la cual se discute a la luz de las habilidades numéricas de tribus indı́genas delAmazonas y de bebés de pocos meses.
Se presenta entonces un primer trabajo experimental, cuyo objetivo es verificar si las proporcionesde cantidades gozan de un status similar a las cantidades simples, en términos perceptuales. La tareaconsistı́a en elegir la mayor de dos proporciones de puntos, presentadas en una pantalla durante unsegundo. Los resultados muestran un porcentaje de acierto por sobre el 70% y, más aún, que la funciónmás apropiada para describir la distancia perceptual entre dos proporciones es su cuociente y no sudiferencia absoluta, tal como ocurre también en la percepción de cantidades enteras.
Finalmente, se estudia cómo se puede conciliar esta rapidez y naturalidad de la percepción deproporciones con la gran dificultad que tienen niños de enseñanza básica para aprender la operatoriade fracciones. Se realiza un estudio correlacional buscando enlazar aprendizaje de ordenamiento defracciones y capacidad de inhibición de respuestas automáticas, en un grupo de niños que estudiabanfracciones por primera vez. Se encontró una correlación estadı́sticamente significativa entre un ı́ndiceestándar de capacidad inhibitoria y el rendimiento en un cuestionario de comparación de fracciones,controlando ciertas variables exógenas como nivel socioeconómico familiar.
ii
Ouroboros, representación ancestral de procesos cı́clicos(Ilustración de Javiera Constanzo, http://uialwen.deviantart.com/).
iii
A todos quienes, con su ánimo y compañı́a,
han anónimamente dejado su huella en este trabajo y en mi vida.
iv
Agradecimientos
Ası́ como una pieza de piano se compone de la contribución de dos manos, una que usualmentelleva la melodı́a y otra que acompaña, este trabajo ha sido moldeado –y podrı́amos decir tambiénescrito– por una multitud de personas, a pesar de que no todas estas influencias han dejado huellasen las lı́neas finalmente impresas: algunas, silenciosas, simplemente pasean entre lı́neas y númerosproporcionando una melodı́a de fondo sin la cual esta obra no serı́a tal.
Comencemos por la melodı́a: La génesis y el desarrollo de este trabajo se debe en gran parte ami profesor guı́a Pablo Dartnell y a nuestro incondicional colaborador Roberto Araya, quienes com-plementando mutuamente sus conocimientos dieron origen a la chispa inicial de embarcarme en estaruta de modelación y experimentación cognitiva. Gracias por estos años de trabajo juntos, los cualesestoy seguro se multiplicarán hacia adelante. Gracias también a Leonor Varas y su incesante trabajo deorganización del Seminario de Educación del Centro de Modelamiento Matemático (CMM), a travésdel cual me acerqué a mis actuales áreas de interés.
Gracias a Jorge Soto, Pedro Rosas, Rafael Correa y Servet Martı́nez por darse el trabajo de leer ydiscutir este trabajo. También a varias personas que aportaron sus conocimientos, ideas y trabajo enlos diversos temas que componen esta tesis, como Alejandro Maass, Gonzalo Mena y Jairo Navarre-te, además de los participantes del Seminario de Educognición realizado durante el año 2008 en elCMM: Grecia Gálvez, Jorge Soto, y otros que enriquecieron con sus diversos puntos de vista muchasdiscusiones. Por su parte, Eugenia Dı́az y Rosa Devés me ayudaron desde la Facultad de Medicina adar mis primeros pasos hacia las disciplinas experimentales.
Gracias a la CONICYT por darme la oportunidad de acercarme al mundo académico, con su esen-cial soporte económico para mi trabajo de estos años; y al Departamento de Ingenierı́a Matemática(DIM) y al Centro de Investigación Avanzada en Educación (CIAE) por sus aportes que me posibili-
v
taron concretar los estudios experimentales presentados en este trabajo.
Gracias también a muchos funcionarios del DIM y el CIAE: Eterin, Marı́a Rosa, Gladys, Silvia,Verónica, Luis, Óscar, Jaime, Javier, Juan Pablo, y otros, por su ayuda en múltiples ocasiones con unsinfı́n de papeleos y otras yerbas.
Después de haber escuchado la melodı́a por un rato, usualmente uno suficientemente atento co-mienza a sentir los matices puestos en la música por la mano que acompaña. Notas de humor, com-pañerismo, y del necesario ánimo que me hizo falta en los momentos más complicados se las agradez-co a Jairo, Marcelo, Álvaro, Gonzalo, Daniela, Andrés, y muchas otras personas que en este momentose me escabuyen de entre los dedos. También a Andrea y Silvia, quienes hicieron lo propio en losrincones del Golfo de Trieste.
A mi familia: Alejandra, Juan Carlos, Carmen, Juan Carlos y Camila, gracias por estar siemprepresentes a través de su preocupación, ayuda, consuelo, y apoyo a toda prueba, sea a 2 o a 12.000kilómetros. También a Marı́a y Ernesto, quienes seguramente también acompañaron este proceso des-de su nueva casa.
vi
Una historia abreviada
Santiago de Chile, otoño de 2004
Se acercaba ya el momento de definir el que serı́a el tema de mi memoria de Ingenierı́a CivilMatemática. En ese entonces, y tal como ahora, en el Centro de Modelamiento Matemático de laUniversidad de Chile se organizaba mensualmente el Seminario de Educación. Habiendo estado cercade postular a Pedagogı́a en Matemáticas en lugar de Ingenierı́a, decidı́ asistir a algunas sesiones paraver de qué cosas se hablaba. Al final de una de estas charlas, surgió espontáneamente una plática conPablo Dartnell, quien participaba usualmente de esas reuniones.
– Ası́ que, ¿te gustan estos temas? –fue la frase que comenzó una conversación sobre el proyectoque Pablo lideraba en ese entonces sobre tutorı́as online para estudiantes de enseñanza media. Mecontó también de un colega suyo, Roberto Araya, quien habı́a trabajado previamente en modelaciónde datos experimentales sobre aprendizaje con alumnos de enseñanza básica. Quedamos de juntarnoslos tres por esos dı́as –en lo que se convertirı́a en nuestra base de operaciones, el Café Universitario–,y discutir la posibilidad de una memoria sobre modelación de este proceso de aprendizaje.
Santiago de Chile, enero de 2006
Después de un arduo año y medio de trabajo, la conversación de 2004 se convirtió finalmenteen la memoria que me valió el tı́tulo de Ingeniero. No sin antes haber pasado por una multitud delecturas en un lenguaje absolutamente nuevo: el de la psicologı́a experimental. Debo decir, al menos,que si bien Roberto era versado en estos temas, Pablo estaba emprendiendo este nuevo camino más omenos al mismo tiempo que yo. Y ambos parecı́amos entusiasmados con las posibilidades a futuro queesto abrirı́a, pensando en un grupo de trabajo que integrase los enfoques de modelación matemática y
vii
experimentación cognitiva, aplicados a temas educativos.
Habı́a ya decidido continuar mis estudios en un programa de Doctorado, y ası́ fue como a partir deese mismo año me inscribı́ en Modelación Matemática en el Departamento de Ingenierı́a Matemática.
Santiago de Chile, enero de 2008
Dos años después, el panorama ha cambiado bastante, ası́ como yo mismo. Paralelamente a rea-lizar los cursos matemáticos que el programa requiere, habı́a decidido que necesitaba acercarme mása algunas disciplinas cercanas al aprendizaje, como la psicologı́a y las neurociencias. Esto me llevó atomar cursos en la Escuela de Postgrado de la Facultad de Medicina, donde tuve que partir desdelas cosas más básicas, además de refrescar en mi mente el hecho que “básico” y “simple” no nece-sariamente son sinónimos. Después de estudiar temas como la biologı́a y fisiologı́a celulares, pudeapreciar en toda su amplitud una frase que personas como Eugenia Dı́az me dijeron en su momento:“una de las cosas que más cuesta es habituarse a los distintos modos de trabajo, en la matemática y enlas ciencias experimentales”. Esto se traduce en nociones tan centrales como qué cosa es una verdadválida en estas disciplinas: el Teorema de Pitágoras sigue siendo hoy tan válido como el dı́a en que fuedemostrado por primera vez unos 3,000 años atrás, mientras que nadie tiene la certeza si un artı́culoexperimental publicado hoy será todavı́a considerado válido en tres años más.
Y finalmente está por llegar el momento de mi examen de calificación, en marzo. El plan es unatesis de modelación sobre fenómenos de cognición, matemática y lenguaje.
Trieste, Italia, septiembre de 2008
Convencido de continuar buscando una formación tanto como matemático como cognitivista, meintegré al Sector de Neurociencias Cognitivas de la Scuola Internazionale Superiore di Studi Avanzati,en Italia. Sin embargo, las posibilidades de hacer un trabajo de tesis conjunto entre esta institución yla Universidad de Chile se esfumaron cuando la burocracia gubernamental chilena decidió privilegiarla letra del contrato y cerró las puertas a la idea. Ni siquiera una carta del Papa ayudó.
Y aquı́ comenzó el mayor giro dramático de esta historia, cuando decidı́ seguir adelante con ambasinstituciones, en programas de Doctorado separados.
viii
Trieste, Italia, octubre de 2010
Se acerca finalmente el momento de terminar el Doctorado en Modelación Matemática, una fechaque a ratos parecı́a nunca llegar. Esto de tener dos jefes, y dos trabajos, no se lo doy a nadie. Llegó lahora de recoger ecuaciones, modelos, papers, experimentos, camas y petacas, y poner todas las cartassobre la mesa. Definitivamente, la palabra modelación tomó un peso especial a través de este trabajo.Especialmente considerando que otras personas, matemáticos en formación, han mostrado interés enlos temas que me trajeron por este camino. El cual ha resultado ser algo sinuoso, pero profundamentepropio. Y que por lo demás, todavı́a no termina.
ix
Esquema de esta tesis
En este trabajo, presentamos un enfoque mixto matemático-cognitivo para el estudio de ciertostemas de interés en las áreas de estudio de la memoria, percepción numérica y educación matemática.
Si bien esta tesis posee una motivación unitaria, los capı́tulos que la componen han sido prepara-dos para ser leı́dos como unidades independientes. Por esta razón, cada uno de ellos posee resumen,introducción y discusión especı́ficos, donde se hace la revisión de la literatura apropiada en detalle.También las referencias bibliográficas son entregadas al final de cada capı́tulo, para facilitar al lec-tor su búsqueda. Asimismo, incluimos al final de la tesis un epı́logo con algunas reflexiones finalesgenerales sobre el trabajo realizado.
El Capı́tulo 2 es eminentemente teórico: en él presentamos un modelo matemático basado en pro-cesos estocásticos discretos, cuyo objetivo es formalizar un proceso simple de memoria y aprendizajey contestar algunas preguntas que los enfoques clásicos experimentales en el estudio de la memoriano son, por definición, capaces de responder. Este modelo fue propuesto originalmente en la memoriade Ingenierı́a Civil Matemática del mismo autor de esta tesis, sin embargo ahora lo tratamos en ma-yor generalidad y lo enraizamos considerablemente en la literatura apropiada. Este estudio nos llevaademás, al final del capı́tulo y haciendo tributo al sorprendente entramado conceptual de la matemáti-ca, a proponer una fórmula de Monte Carlo de cuadratura para la integración con respecto a medidasbinomiales y ciertas convoluciones de Bernoulli.
Luego, en el Capı́tulo 3 nos abocamos a un tema más bien perceptual, y que se ubica seguramenteal origen de nuestra capacidad de hacer matemáticas (al menos como las conocemos): presentamos unabreve revisión de lo que la investigación psicocognitiva ha llamado el Sentido Numérico, refiriéndosea nuestra capacidad de percibir cantidades en nuestro entorno, y sus relaciones y operatoria. Dada
x
la vasta evidencia empı́rica sugiriendo que los orı́genes de esta percepción numérica preexiste a laespecie humana, nos dedicamos a tratar de comprender algunas de sus propiedades asumiendo queestos orı́genes corresponden a un proceso evolutivo de optimización de la discriminabilidad entrerepresentaciones de números similares. Traducimos esto en un problema de optimización en variasvariables, el cual estudiamos y resolvemos numéricamente.
En ese momento también presentamos la primera experiencia empı́rica de esta tesis, cuyo objetivoes estudiar si acaso las reglas del Sentido Numérico se aplican también a las proporciones de canti-dades: ¿Son éstas también rápidamente accesibles? ¿Son sus representaciones mentales afectadas porprincipios similares a los de las representaciones de números enteros?
En el Capı́tulo 4 nos alejamos relativamente de la matemática en cuanto herramienta y la enfo-camos como objeto de estudio. Basándonos en algunos de los conceptos e ideas presentados en loscapı́tulos previos, nos preguntamos por la gran dificultad que presenta el tema de las fracciones en laeducación matemática. Ponemos a prueba, en este contexto especı́fico, una teorı́a reciente que rela-ciona aprendizaje matemático y un set de habilidades cognitivas llamadas capacidades ejecutivas, através de un estudio experimental correlacional sobre aprendizaje de fracciones con niños de tercerobásico.
Finalmente, en los apéndices dejamos algunos materiales que podrı́an entorpecer el flujo de pen-samiento de los capı́tulos previos si los hubiéramos dejado allı́: enunciados de ciertos teoremas queutilizamos en nuestro análisis, la demostración de un lema técnico, y una breve descrpción de unatécnica de análisis usada en uno de los estudios experimentales.
xi
ÍNDICE GENERAL
Índice general
1. Introducción General 1
1.1. Análisis matemático de resultados experimentales previos . . . . . . . . . . . . . . . 3
1.2. Experimentación sobre cognición matemática . . . . . . . . . . . . . . . . . . . . . 4
1.3. Aplicación a la Educación Matemática . . . . . . . . . . . . . . . . . . . . . . . . . 4
2. Memoria y Aprendizaje 6
2.1. Un contexto de aprendizaje . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.2. Presentación del modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
2.2.1. Un modelo clásico: la urna de Pólya . . . . . . . . . . . . . . . . . . . . . . 18
2.3. Análisis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.3.1. Selección de estrategias . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.3.2. Sobre otros modelos de urnas . . . . . . . . . . . . . . . . . . . . . . . . . 21
xii
ÍNDICE GENERAL
2.3.3. Convergencia en el caso |S| = 1 . . . . . . . . . . . . . . . . . . . . . . . . 23
2.3.4. Convergencia en el caso |S| > 1 . . . . . . . . . . . . . . . . . . . . . . . . 28
2.4. Modificación 1: una estrategia a intervalos irregulares . . . . . . . . . . . . . . . . . 30
2.5. Modificación 2: varias estrategias, con estabilización . . . . . . . . . . . . . . . . . 32
2.6. Simulaciones computacionales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
2.7. Algunos resultados matemáticos relacionados . . . . . . . . . . . . . . . . . . . . . 43
2.7.1. Integración con respecto a convoluciones de Bernoulli . . . . . . . . . . . . 46
2.8. Resumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
2.9. Discusión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
3. Número y proporción 56
3.1. Percepción numérica en animales . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
3.2. Percepción numérica en humanos . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
3.2.1. Un paréntesis de la Historia de las Matemáticas . . . . . . . . . . . . . . . . 61
3.3. Percepción numérica en bebés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
3.4. Modelos sobre percepción numérica . . . . . . . . . . . . . . . . . . . . . . . . . . 62
3.4.1. Modelo lineal con variabilidad escalar . . . . . . . . . . . . . . . . . . . . . 64
xiii
ÍNDICE GENERAL
3.4.2. Modelos de escala comprimida . . . . . . . . . . . . . . . . . . . . . . . . . 65
3.4.3. Crı́ticas a ambos modelos . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
3.5. Posible origen evolutivo de una escala comprimida . . . . . . . . . . . . . . . . . . 66
3.5.1. El modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
3.5.2. Sobre la secuencia de pesos . . . . . . . . . . . . . . . . . . . . . . . . . . 68
3.5.3. Propiedades generales del modelo . . . . . . . . . . . . . . . . . . . . . . . 70
3.5.4. Solución del problema de optimización . . . . . . . . . . . . . . . . . . . . 73
3.5.5. Solución numérica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
3.6. Una investigación empı́rica sobre proporciones . . . . . . . . . . . . . . . . . . . . 79
3.6.1. Método . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
3.6.2. Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
3.6.3. Resumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
3.7. Discusión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
3.7.1. Sobre el modelo teórico . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
3.7.2. Sobre el estudio experimental . . . . . . . . . . . . . . . . . . . . . . . . . 95
4. Una investigación en educación matemática 100
xiv
ÍNDICE GENERAL
4.1. El aprendizaje de fracciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
4.1.1. Medición de capacidad inhibitoria . . . . . . . . . . . . . . . . . . . . . . . 104
4.2. Sobre inhibición y aprendizaje de fracciones . . . . . . . . . . . . . . . . . . . . . . 106
4.2.1. Metodologı́a . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
4.2.2. Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
4.3. Resumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
4.4. Discusión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
5. Epı́logo 129
5.1. Estudiar la educación matemática . . . . . . . . . . . . . . . . . . . . . . . . . . . 131
5.2. Reflexión final . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
A. Convergencia de medias ponderadas 134
B. Convergencia de distribuciones empı́ricas 135
C. Un resultado de independencia condicional 137
D. Técnica de escalamiento unidimensional 139
xv
ÍNDICE DE FIGURAS
Índice de figuras
2.1. Simulación de (Qn) para varias funciones de olvido . . . . . . . . . . . . . . . . . . 41
2.2. Simulación de (Qn) para una función exponencial (30,000 iteraciones) . . . . . . . . 42
2.3. Simulación de (Qn(s)) (modificación 1) . . . . . . . . . . . . . . . . . . . . . . . . 42
3.1. Tiempos de reacción en una tarea de comparación numérica . . . . . . . . . . . . . 59
3.2. Bebés esperan que 1 + 1 sea 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
3.3. Soluciones numéricas al problema (Pw) . . . . . . . . . . . . . . . . . . . . . . . . 78
3.4. Diseño del material experimental sobre comparación de proporciones . . . . . . . . 82
3.5. Procedimiento experimental . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
3.6. Resultados generales sobre comparación de proporciones . . . . . . . . . . . . . . . 86
3.7. Resultados segregados por proporciones comparadas . . . . . . . . . . . . . . . . . 88
3.8. Representaciones estimadas por escalamiento unidimensional . . . . . . . . . . . . . 90
xvi
ÍNDICE DE FIGURAS
3.9. Resultados respecto de distancias lineal y logarı́tmica . . . . . . . . . . . . . . . . . 90
3.10. Frecuencia de uso de numerales en Mundurukú . . . . . . . . . . . . . . . . . . . . 94
4.1. Ejemplos de ı́temes del test de Stroop numérico . . . . . . . . . . . . . . . . . . . . 106
4.2. Ejemplos de ı́temes del cuestionario de conocimiento aritmético . . . . . . . . . . . 112
4.3. Ítemes del cuestionario de comprensión del material instructivo . . . . . . . . . . . . 113
4.4. Ejemplos de ı́temes del cuestionario de ordenamiento de fracciones . . . . . . . . . . 114
4.5. Resumen de resultados de los cuestionarios . . . . . . . . . . . . . . . . . . . . . . 116
4.6. Histogramas de los ı́ndices de interferencia y facilitación . . . . . . . . . . . . . . . 118
4.7. Diagrama de dispersión entre cuestionario de fracciones y facilitación . . . . . . . . 120
4.8. Distribuciones de puntajes segregados por variables exógenas al estudio . . . . . . . 121
xvii
ÍNDICE DE CUADROS
Índice de cuadros
2.1. Notación utilizada en el capı́tulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.2. Funciones de olvido simuladas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
4.1. Estı́mulos utilizados en el experimento original de Stroop . . . . . . . . . . . . . . . 105
4.2. Listado de ı́temes del cuestionario de conocimiento aritmético . . . . . . . . . . . . 111
4.3. Listado de ı́temes del cuestionario de ordenamiento de fracciones . . . . . . . . . . . 111
4.4. Errores por condición en el test de Stroop numérico . . . . . . . . . . . . . . . . . . 119
xviii
Capı́tulo 1
Introducción General
“Mathematics is the most beautiful
and most powerful creation of the human spirit.
Mathematics is as old as Man.”
— Stefan Banach1
La historia de las Matemáticas ha estado profundamente ligada a la necesidad de los seres humanos
de comprender e interactuar eficazmente con nuestro entorno. Varios de los textos dejados por antiguas
civilizaciones como la babilónica, egipcia o griega (Neugebauer, 1969) dan testimonio de métodos de
cálculo, contabilidad o predicción de ciertos fenómenos climáticos o astronómicos. En la actualidad, la
cantidad de aplicaciones de las matemáticas en las ciencias y otros campos es prácticamente imposible
de cuantificar, haciendo de esta ciencia “pura” la más aplicada de todas.
Algunas disciplinas como la Fı́sica poseen una relación muy fluida con las Matemáticas. En ella se
trabaja habitualmente con el planteo y análisis de modelos matemáticos como parte de las teorı́as. En
1Kałuża (1996, Capı́tulo VIII).
1
otras disciplinas relativamente nuevas, como la Psicologı́a y las Ciencias Cognitivas2, la integración
con las matemáticas se encuentra en una etapa bastante más rudimentaria, utilizándose principalmente
para evaluación estadı́stica de datos experimentales. Esto no excluye que ciertos autores, como por
ejemplo Wickelgren y otros mencionados en el Capı́tulo 2, hayan hecho un uso importante de las
Matemáticas para ciertos análisis teóricos. No obstante, estos autores constituyen una minorı́a aún en
la actualidad.
Un punto que ha influido en esta tendencia parece ser la sobre-especialización del conocimiento
que hemos vivido en el último siglo: en el pasado era mucho más común que la “gente de ciencia” se
interesara en varias disciplinas, y muchos de los grandes personajes eran filósofos y matemáticos a la
vez, además de trabajar en temas relacionados con fı́sica, quı́mica u otras. La tendencia reduccionista
de dedicarse a un área única del conocimiento ha llevado por una parte a un avance impresionante
en ciertos temas, pero también ha minado el diálogo entre disciplinas3 y elevado las barreras de en-
trada entre éstas. En este sentido, las últimas décadas han sido testigo de un redescubrimiento de la
importancia del trabajo interdisciplinar, el que, sin embargo aún encuentra grandes trabas institucio-
nales y culturales para su realización (e.g. Gentile & Boehlert, 2010; Illman & Clark, 2008). En este
contexto se vuelven particularmente relevantes instancias e instituciones que promuevan este tipo de
investigación, como el mismo Centro de Modelamiento Matemático de la Universidad de Chile4.
Los enfoques interdisciplinarios con las matemáticas se vuelven particularmente importantes con
las disciplinas jóvenes, muchas de las cuales nacieron precisamente en la época de la sobre-especiali-
zación.
El punto de partida filosófico de esta tesis es un par de convicciones: una de todo matemático, que
las Matemáticas no son solamente una colección de métodos de cálculo; y otra de todo matemático
aplicado, que éstas son también un camino para descubrir propiedades de los modelos que se pueda
plantear en cualquier disciplina y más aún, que la generación y el estudio de estos modelos son un en-
2Bermúdez (2010) hace una interesante revisión de la “prehistoria” y la historia de las ciencias cognitivas, ubicando losalbores de la primera hacia 1930.
3Metzger & Zare (1999) comentaron esta situación en el contexto de la biologı́a, reconociendo que excelencia cientı́ficay excelencia disciplinar tienden a ser considerados como sinónimos.
4A través del cual el autor del presente documento llegó a encontrarse con las temáticas que conformarı́an su tesisdoctoral.
2
1.1. Análisis matemático de resultados experimentales previos
granaje esencial para mejorar nuestra comprensión de los elementos involucrados y sus interacciones.
En este trabajo nos aproximamos a problemas de cognición general y, particularmente, cognición
numérica desde dos puntos de vista complementarios: el de modelación matemática y el experimental
cognitivo. Éstos constituyen los dos brazos de esta tesis, a los cuales agregamos también un apartado
dedicado a la investigación educativa. A continuación detallamos brevemente estas tres temáticas.
1.1. Análisis matemático de resultados experimentales previos
Esta rama de la tesis se desarrolla en el Capı́tulo 2 y en la primera parte del Capı́tulo 3. Consiste
en la generación y análisis de dos modelos matemáticos, basados en procesos estocásticos discretos
y optimización respectivamente, a partir de la evidencia empı́rica disponible en dos áreas de alto
interés de las Ciencias Cognitivas. La literatura relevante para sustentar cada modelo se presenta en
los respectivos capı́tulos.
La primera temática cognitiva que abordamos en estos modelos es el estudio de la memoria de
largo plazo, ı́ntimamente ligada con el aprendizaje. Los procesos estocásticos discretos nos permiten
el modelamiento y la simulación numérica de la deriva temporal de un recuerdo simple, donde además
estudiamos propiedades asintóticas de esta deriva. Éstas resultan tener consecuencias centrales en la
capacidad de aprendizaje de un agente ideal dotado de una cierta memoria.
El segundo tema es el estudio de las representaciones numéricas internas que observamos no
solamente en seres humanos, sino que también en otros animales, algunos bastante lejanos de nosotros
en la escala evolutiva. Un modelo de optimización nos permite evaluar cuáles de las propiedades
observadas empı́ricamente de estas representaciones numéricas podrı́an ser explicadas por un proceso
de evolución tendiente a maximizar la discriminabilidad entre representaciones distintas.
Ambos modelos son analizados tanto teórica como numéricamente, discutiendo finalmente la re-
levancia y conexión de los resultados obtenidos en el contexto amplio de la literatura que los inspiró.
3
1.2. Experimentación sobre cognición matemática
1.2. Experimentación sobre cognición matemática
Esta segunda veta se trabaja en la parte final del Capı́tulo 3 y en el Capı́tulo 4, aunque este último
lo comentaremos en modo especial en la sección siguiente. En general, el tratamiento de esta parte se
materializa de forma muy similar a la de una publicación cognitiva, detallando los materiales y méto-
dos utilizados para luego dar paso a los resultados experimentales y su análisis estadı́stico, finalizando
con una discusión de éstos.
El punto de partida son los mismos modelos cognitivos de percepción numérica que inspiraron
parte del análisis matemático. Estos modelos en la actualidad se limitan a cantidades enteras (es decir,
números naturales), a pesar de que el formalismo es perfectamente aplicable también a cantidades
racionales. Nos preguntamos entonces si las razones entre enteros tienen representaciones mentales
de similares propiedades. Coloquialmente, podemos decir que nos interesamos en saber si los números
racionales son o no representados en la misma “recta numérica mental” que ha sido propuesta para los
enteros.
La propiedad especı́fica que estudiamos en esta tesis es la noción de distancia más apropiada
entre las representaciones mentales de estas cantidades. En el caso de los enteros, numerosos estudios
han confirmado que la distancia perceptual más apropiada es logarı́tmica, es decir la mejor variable
predictora de los procesos automáticos mentales de comparación numérica es el cuociente entre los
dos comparandos, en lugar de su diferencia. Para evaluar esto en el caso de proporciones de enteros,
usamos un paradigma experimental de comparación de proporciones presentadas en un formato no
simbólico (i.e. sin usar numerales) donde los participantes tienen un tiempo limitado para responder.
1.3. Aplicación a la Educación Matemática
Finalmente, nos aproximamos a uno de los intereses personales del autor de esta tesis: la inves-
tigación educativa. El Capı́tulo 4 detalla una experiencia conducida con niños de tercer año básico,
en la cual tenemos por objetivo evaluar la validez de una teorı́a cognitiva que relaciona la dificultad
4
BIBLIOGRAFÍA
del aprendizaje de ciertos conceptos y operatorias matemáticas con un set de habilidades cognitivas
llamadas capacidades ejecutivas. Esta teorı́a dice, esencialmente, que la capacidad de inhibir estrate-
gias y operatorias aprendidas previamente para dar paso a otras nuevas juega un rol importante en el
aprendizaje matemático. Nosotros circunscribimos esta teorı́a general a un tema cuya dificultad en el
currı́culum educativo lo hace especialmente interesante: el aprendizaje de los conceptos básicos y el
ordenamiento de fracciones.
Bibliografı́a
Bermúdez, J. L. (2010). Cognitive Science: An Introduction to the Science of the Mind. Cambridge
University Press. Pág(s) 2
Gentile, J., & Boehlert, S. (2010). Nurturing young scientists. Science, 329, 884. Pág(s) 2
Illman, D. L., & Clark, F. (2008). Visibility of team science: A case study of media coverage of the
NSF Science and Technology Centers. Science Communication, 30(1), 48–76. Pág(s) 2
Kałuża, R. (1996). Through a reporter’s eyes: The life of Stefan Banach. Birkhäuser. Traductores A.
Kostant, W. Woyczyński. Pág(s) 1
Metzger, N., & Zare, R. N. (1999). Interdisciplinary research: From belief to reality. Science, 283,
642–643. Pág(s) 2
Neugebauer, O. (1969). The Exact Sciences in Antiquity. Dover Publications. Pág(s) 1
5
Capı́tulo 2
Memoria y Aprendizaje
El presente capı́tulo analiza en detalle un modelo de aprendizaje basado en procesos es-
tocásticos discretos, discutiéndolo a la luz de la literatura cognitiva relevante, y com-
parándolo con otros enfoques teóricos previos. Presentamos además simulaciones compu-
tacionales para ilustrar nuestros principales resultados teóricos.
El estudio de la memoria y el aprendizaje fue uno de los puntos de partida del enfoque cientı́fi-
co/experimental en Psicologı́a. Hacia fines del siglo XIX, el alemán Herman Ebbinghaus (Ebbinghaus,
1885/1913) se propuso buscar regularidades en los procesos de recuerdo y aprendizaje. Para ello desa-
rrolló un método inusualmente riguroso para su época, el cual aplicó a sı́ mismo como único parti-
cipante de sus propios estudios1. Para evitar múltiples elementos que podrı́an provocar confusión en
la interpretación de sus resultados, decidió tomar como medida de aprendizaje y recuerdo la cantidad
de tiempo requerida para memorizar, en perfecto orden, listas de sı́labas sin sentido como “FAP” y
“GOK”. Ebbinghaus observó que el tiempo requerido para volver a aprender a perfección una lista era
1Esta situación es considerada subestándar en nuestros dı́as, aunque Ebbinghaus la justificó argumentando que sus estu-dios requerı́an de una modificación tal de su rutina diaria, y de una cantidad tan grande de repeticiones, que no deseaba hacerpasar a nadie más por semejante proceso. Sin embargo, diseñó ingeniosos mecanismos que le permitı́an reducir el impactode esta limitación.
6
menor que el que tomaba la primera vez, incluso cuando la lista hubiera sido aparentemente olvidada
entre ambas sesiones.
La presencia de un cierto patrón en la reducción del tiempo requerido lo llevó a plantear la existen-
cia de una función de ahorro: ésta relaciona el número de veces que una lista ha sido reestudiada con el
tiempo requerido para reaprenderla a perfección2. Junto con observar que esta función era bien apro-
ximada por una potencia de un logaritmo, Ebbinghaus daba el punto de partida para un estudio mucho
más riguroso y metódico de los fenómenos cognitivos y perceptuales de lo que se acostumbrada en
aquel entonces.
Los hallazgos de Ebbinghaus han sido replicados por muchos investigadores, y su explicación
teórica ha sido refinada en varios aspectos. Con el paso del tiempo, el concepto de función de ahorro
dio paso al concepto más amplio de función de olvido, utilizada para cuantificar la fortaleza de un
recuerdo (llamado técnicamente una “traza de memoria”) en un instante dado de tiempo: si f es una
función de olvido, entonces la fortaleza en el instante t2 de un evento ocurrido en el instante t1 < t2está dada por f (t2− t1).
La cantidad de investigación experimental acumulada a través de los años en este tema ha sido
enorme, abarcando diversas escalas de tiempo (por ejemplo, estudios centrados en estudiar retención
de corto o largo plazo) y diversos tipos de participantes (adultos sanos, personas con sı́ndromes que
afectan la memoria, palomas, ratas, etc.). Un denominador común de la casi totalidad de estos estudios
ha sido el buscar la forma más apropiada de “la” función de olvido a través de ajuste estadı́stico de los
datos experimentales obtenidos. Esto llevó a la proposición de una larga lista de funciones candidatas,
entre las cuales siempre han sobresalido dos familias en particular: las funciones exponenciales f (t) =
Aρt (A > 0, ρ ∈ (0,1)), y las funciones potencia f (t) = A(1 + t)−β (A > 0, β ∈ (0,1]).
Algunos trabajos como el de Wickelgren (1974) tuvieron un enfoque primariamente teórico, tra-
tando de derivar la forma de la función de olvido a partir de principios básicos y utilizando el ajuste
estadı́stico de datos como una verificación en lugar de una simple exploración de posibles funciones.
Sin embargo, este tipo de aproximación al problema ha sido claramente minoritaria, quizás marginal.
2Más precisamente, la diferencia de este tiempo con respecto al invertido en el primer estudio de la lista.
7
Esto es un problema, debido a que el estudio experimental tı́pico no considera una cantidad suficiente
de puntos en el eje temporal como para discriminar entre formas funcionales más complejas. Incluso
el mero hecho de discriminar entre dos familias de funciones basado en ajustes estadı́sticos sobre una
cantidad reducida de datos parece ser una empresa de dudoso éxito, como ya algunos investigadores
como White (2001) han hecho notar. White ha sido un abogado de las formas exponenciales para la
función de olvido, argumentando que el proceso de olvido es markoviano3, es decir independiente de
la historia previa dado el estado actual. Definiendo la tasa de olvido δ(t) como
δ(t) =∣∣∣∣∣ f ′(t)f (t)
∣∣∣∣∣ ,una función de olvido exponencial se sustenta en el supuesto de que la tasa de olvido es constante en
el tiempo.
Si bien el modelo exponencial provee una forma funcional simple apoyada por la proposición
de un mecanismo convincente (decaimiento markoviano), ciertos hallazgos experimentales ponen en
duda su uso. Hace más de un siglo, Jost (1897) observó que las memorias pasan por un proceso de
“fortalecimiento” a través del tiempo, en lo que llegarı́a a ser conocida como su segunda ley:
“Dadas dos asociaciones de igual fuerza pero de distinta antigüedad,
la más antigua decae más lentamente durante un intervalo dado de tiempo.” 4
Simon (1966) volvió a traer este elemento a la discusión, observando que la afirmación de Jost
implicaba que δ(t) debı́a ser una función decreciente en el tiempo. Simon propuso ante esto una solu-
ción simple, consistente en tomar funciones de olvido que fuesen combinaciones aditivas de funciones
3Esta naturaleza markoviana puede concebirse a priori en diversos niveles, por ejemplo el psicológico (proceso mentalde olvido de trazas de memoria) y el biológico (proceso neuronal de regreso a un estado basal previo a una estimulación).Es importante tener en mente que no necesariamente el mejor modelo de olvido para un nivel lo es también para el otro.
4“Given two associations of the same strength, but of different ages, the older falls off less rapidly in a given length oftime”, según lo citado por Staddon (2001, p. 139).
8
exponenciales con distintas tasas. Por ejemplo5,
f (t) =n∑
k=1
Akρtk con Ak > 0;0 < ρ1 < . . . < ρn < 1.
Observamos que
δ′ =
∣∣∣∣∣ f ′f∣∣∣∣∣′ = (− f ′f
)′=
f ′2− f ′′ ff 2
. (2.1)
Calculando las derivadas de f , obtenemos
f ′(t) =n∑
k=1
Akρtk logρk y f′′(t) =
n∑k=1
Akρtk[logρk
]2 ,de donde se sigue que
f ′2(t)− f ′′(t) f (t) =∑k, j
AkA j(ρkρ j)t logρk logρ j−∑k, j
AkA j(ρkρ j)t[logρk
]2=
∑k, j
AkA j(ρkρ j)t logρk(logρ j− logρk).
Llamando Ck j = AkA j(ρkρ j)t logρk, continuamos este desarrollo:
f ′2(t)− f ′′(t) f (t) =∑k< j
Ck j(logρ j− logρk) +∑k> j
Ck j(logρ j− logρk)
=∑k< j
Ck j(logρ j− logρk) +∑j>k
C jk(logρk − logρ j),
donde hemos intercambiado los nombres de los ı́ndices en la segunda suma. Ası́,
f ′2(t)− f ′′(t) f (t) =∑k< j
(Ck j−C jk)(logρ j− logρk)
5Simon presentó originalmente el caso con n = 2.
9
= −∑k< j
AkA j(ρkρ j)t(logρ j− logρk)2 < 0.
Sustituyendo esto en la Ecuación (2.1), concluimos que δ(t) es una función estrictamente decre-
ciente. Además,
lı́mt→∞
δ(t) =∣∣∣logρn∣∣∣ > 0.
La solución propuesta por Simon, a pesar de ser eficaz en el proveer una función de olvido con
tasa de decaimiento decreciente, pareciera pecar de conservadora: varios estudios abogan por la uti-
lización de funciones cuyo decaimiento sea claramente más lento que el de las exponenciales, como
es por ejemplo el caso de las funciones potencia. Para éstas, la tasa de olvido (δ(t) = β(1 + t)−1) de-
crece a cero cuando t → ∞. Wixted & Carpenter (2007) han argumentado que un reanálisis de losdatos originales de Ebbinghaus muestra un buen ajuste de parte tanto de las funciones exponenciales
como potencias6, pero que si uno repite los ajustes dejando ciertos puntos fuera, los parámetros de
las funciones exponenciales pueden tener variaciones importantes, mientras que los de las funciones
potencia muestran una mucho mayor estabilidad7.
A pesar de esto, un hecho importante a considerar en esta discusión es la influencia que los pro-
pios métodos de medición y análisis pudieran estar ejerciendo sobre los resultados finales. Anderson
& Tweney (1997) sugirieron que la práctica común de utilizar medias aritméticas para estimar los
valores de la función de olvido en diversos instantes de tiempo podrı́a generar sesgos en los ajustes
estadı́sticos, favoreciendo artificialmente a las funciones potencia. Esencialmente su argumento con-
sistió en mostrar, teóricamente y a través de simulaciones computacionales, que a pesar de que ni las
funciones exponenciales ni las potencias son estables bajo promedios aritméticos, las funciones ex-
ponenciales son las más perjudicadas en este proceso8. De acuerdo a ejemplos presentados por estos
autores, cabe incluso la posibilidad de que un promedio aritmético de valores generados por un mo-
delo exponencial sea mejor ajustado por un modelo potencia. Una condición necesaria para que esta
6Es necesario notar que las funciones exponenciales consideradas por Wixted & Carpenter disponı́an de un parámetroextra: un nivel asintótico c > 0, de modo que la forma funcional discutida en este caso era f (t) = c + Aρt.
7Los datos originales de Ebbinghaus son una de las pocas buenas fuentes que permiten verificar este hecho, dado queincluyó un amplio rango de valores en el eje temporal, que muy pocos estudios posteriores han utilizado.
8Ver también los análisis teóricos más avanzados, en la misma lı́nea, hechos por Anderson (2001); Myung et al. (2000).
10
última situación se dé es que en el promedio aritmético incurran funciones exponenciales con diversas
bases ρ, lo que tiene sentido si uno considera que la práctica estándar involucra promediar valores ob-
tenidos de los distintos participantes (por ejemplo) de un estudio. Ası́, las funciones potencia habrı́an
aparecido como un artefacto del método estadı́stico, el cual podrı́a ser subsanado si los datos fuesen
analizados tomando sus promedios geométricos en vez de aritméticos. Con todo, Wixted & Ebbesen
(1997) presentaron ajustes de datos separados por cada participante, encontrando que incluso antes de
promediar valores las funciones potencia proveı́an una mejor explicación de los datos.
Análisis matemáticos hechos posteriormente, basados en el supuesto de que la retención es el re-
sultado promedio de una infinitud de procesos elementales de olvido, también sugieren que las funcio-
nes potencia pueden aparecer como el resultado promedio del decaimiento de trazas exponenciales:
Kahana & Adler (2002) sugirieron que, si una infinitud de trazas individuales decae siguiendo una
misma forma funcional pero con diversos niveles de “aceleración”, como es el caso de decaimien-
tos exponenciales con diferentes tasas, la proporción de trazas de memoria que en un momento dado
está por sobre un valor umbral decrece asintóticamente como una potencia. Por otra parte, utilizando
transformadas de Laplace, Murre & Chessa (2009) observaron que si las tasas de decaimiento de una
población infinita de trazas que decaen exponencialmente tienen una distribución Gamma, entonces
la fuerza media de la población es exactamente una función potencia. Sin embargo, común a ambos
argumentos es la necesidad de que existan trazas que decaigan con tasas arbitrariamente cercanas a
cero: en el caso de Murre & Chessa, la distribución Gamma puede ser modificada en varios aspectos
manteniendo la validez de sus resultados, excepto el ser truncada en una vecindad de 0; mientras que
Kahana & Adler asumen distribuciones gaussianas restringidas a R+. La existencia de trazas tan re-
sistentes al decaimiento como se desee, una hipótesis crı́tica de estos modelos, está motivada más por
necesidad del argumento que por observaciones biológicas o psicológicas.
Todo esto nos hace volver a un punto ya mencionado previamente: las limitaciones intrı́nsecas
a los estudios experimentales. Éstos son conducidos en un intervalo de tiempo acotado, donde es
difı́cil evaluar verdaderamente el decaimiento de las trazas de memoria9. El trabajo experimental,
además, involucra decisiones de diseño que no siempre influyen de modo simple en los resultados
finales (e.g. ¿debe el participante recordar todos los ı́temes en exactamente el mismo orden en que
9Ver la Figura 5 de Kahana & Adler, 2002, donde se muestra un ajuste casi perfecto de funciones potencia a unaexponencial cuando se considera intervalos de tiempo breves.
11
2.1. Un contexto de aprendizaje
los estudió, o puede hacerlo en el orden que le sea más cómodo?), y el proceso de medición posee
cierto nivel de ruido que le es propio. Una razón de peso a favor de uno u otro modelo difı́cilmente
provendrá de ese mundo. Es por esto que, en este capı́tulo, presentamos una abstracción matemática
que nos permitirá estudiar los aspectos estructurales de los modelos en disputa, dejando fuera la mayor
parte de los aspectos accidentales inherentes a la experimentación.
2.1. Un contexto de aprendizaje
Desde los inicios del estudio de la memoria, ésta ha sido considerada como esencialmente unida a
los procesos de aprendizaje. Continuando en esta lı́nea, consideramos una tarea simple que se conoce
en la literatura psicológica clásica como “probability learning”. En ésta, un participante observa una
secuencia finita de tiradas de moneda (cara-sello-cara-cara-sello-. . . ), y debe predecir cuál será el re-
sultado de una nueva tirada. Si la secuencia fue generada siguiendo un proceso de Bernoulli, entonces
basta con que el participante estime la probabilidad α de que la moneda caiga ‘cara’ para poder estimar
de mejor modo el nuevo resultado.
Es posible complejizar esta tarea, aumentando el número de monedas disponibles y permitiendo
al participante observar el resultado de sólo una moneda en cada iteración10. En esta situación, la
elección de qué moneda observar en cada etapa puede ser un proceso aleatorio en sı́ mismo, o ser
decidido por el participante en la medida que observa la secuencia. Esta última situación permite
considerar la tarea de probability learning como una abstracción de múltiples procesos de selección
de alternativas, como por ejemplo un proceso de aprendizaje de un agente que dispone de un conjunto
de estrategias, de entre las cuales debe seleccionar una en modo recurrente.
La nomenclatura que usaremos está inspirada en el modelo de resolución estratégico de problemas
inversos de adición planteado por Siegler & Araya (2005). Ellos trabajaron en la modelación compu-
tacional de la resolución de problemas del tipo a + b− c por alumnos de tercer año básico. En el casoespecı́fico en que b = c, los niños poseen dos posibles estrategias para resolver estos problemas, las
10Esta modalidad ha sido efectivamente aplicada en experimentación con personas, y su rendimiento ha sido bastantebueno. Ver por ejemplo Estes (1976, capı́tulo III, experimento 2).
12
2.1. Un contexto de aprendizaje
cuales difieren esencialmente en el orden en el cual se realizan las operaciones:
Cálculo directo Consiste en calcular (a + b)−b. Ésta es la estrategia natural de partida, debido a quelos niños siempre aprenden a efectuar las operaciones de izquierda a derecha.
Atajo Consiste en calcular a + (b−b). Esta estrategia posee la ventaja de agrupar las operaciones demodo de sólo realizar cálculos de mucha simplicidad11.
Bisanz & LeFevre (1990) propusieron que el tiempo que le toma a un niño de tercero básico
resolver un problema del tipo a + b−b es un buen indicador de la estrategia utilizada. De acuerdo conlos datos de Siegler & Stern (1998), usualmente la estrategia de cálculo directo produce tiempos de
respuesta mayores a 8 segundos, mientras que la estrategia de atajo toma 4 segundos o menos12. Esto
les permitió una estimación de la estrategia utilizada a pesar de que los niños no pudieran explicitar
correctamente su procedimiento cuando se les consultaba.
Si bien con la práctica aritmética la estrategia de atajo se vuelve dominante, tercero básico es
precisamente una época en la cual los niños aún no descubren en modo robusto sus ventajas, cosa
que logran en la medida que resuelvan suficientes ejercicios apropiados. Esta transición, sin embargo,
no es directa: Siegler & Stern (1998) observaron que los niños podı́an descubrir la estrategia de atajo
durante una sesión de ejercicios, para luego aparentemente haberla olvidado al comenzar la próxima.
Esto llevó a Siegler (2005) a proponer la teorı́a de “ondas superpuestas” (overlapping waves), según
la cual la elección de estrategias no se realiza necesariamente en modo optimal, sino que múltiples
estrategias aplicables a un problema dado conviven durante lapsos de tiempo potencialmente largos,
siendo sólo algunas de estas estrategias abandonadas definitivamente.
Considerando que la aritmética mental posee un pequeño margen de error, entonces las estrategias
11Cabe preguntarse si esta estrategia en efecto involucra cálculos. Resolver b−b probablemente involucra un razonamientoconceptual simple por parte de los niños, evitándose el tener que realizar efectivamente la resta.
12Según las mediciones de Siegler & Stern (1998), el 92% de los tiempos de respuesta en niños de tercero básico caeen esta clasificación. El resto puede ser explicado, de acuerdo a Siegler & Araya (2005), como estrategias resultantes dealguna combinación de las dos aquı́ presentadas. Cálculo directo y atajo podrı́an ser denominadas las estrategias básicaspara resolver el problema, mientras que las estrategias combinadas son construidas como composición de trozos de lasestrategias básicas, gracias a la posibilidad de ‘interrumpir’ una estrategia durante su ejecución.
13
2.2. Presentación del modelo
de cálculo directo y atajo pueden ser vistas como tiradas de monedas cargadas, las cuales con una
cierta probabilidad dan la respuesta correcta. También, dado que la estrategia de atajo involucra ope-
raciones (o razonamientos) más simples, es razonable pensar que su probabilidad de error asociada
sea menor. Esta abstracción nos permite ubicar el problema de aprendizaje estratégico en un contexto
de probability learning, donde las monedas o estrategias son seleccionadas en base a su efectividad
estimada. Una primera versión de este modelo fue presentada en la Memoria de Tı́tulo de Ingenierı́a
Civil Matemática de Gómez (2006). En este trabajo ampliaremos ese modelo y sus resultados.
2.2. Presentación del modelo
Sea S un conjunto finito y no vacı́o, cuyos elementos son las estrategias (o monedas) entre lascuales un agente puede elegir para resolver un problema dado. Cada una de estas estrategias s ∈ Sposee una probabilidad de éxito asociada α(s) ∈ (0,1).
La mecánica del modelo es la siguiente: en cada etapa n ≥ 1, el agente elige una estrategia sn ∈ S,la cual produce un resultado Xn. Éste puede ser 1 (‘éxito’) o 0 (‘fracaso’). Observando este resultado,
el agente pasa a la etapa n + 1, donde debe elegir nuevamente otra estrategia, incorporando la nueva
información de que dispone.
Formalmente, consideraremos dos secuencias aleatorias: (sn : n ≥ 1) ⊆ S la secuencia de estra-tegias elegidas, y (Xn : n ≥ 1) ⊆ {0,1} la secuencia de resultados de la aplicación de las estrategias.Asumiremos que el resultado de la ejecución de una estrategia depende solamente de la estrategia
elegida, independientemente de la historia previa. Si denotamos la historia hasta el tiempo n por
Hn = σ(sk,Xk : 1 ≤ k ≤ n), esto significa que
P(Xn = 1|sn,Hn−1) = P(Xn = 1|sn) = α(sn) (n ≥ 1). (2.2)
Para poder plantear la ley condicional de elección de estrategias, requerimos dotar a los agentes
de algún tipo de ı́ndice basado en su historia. Dada una estrategia s ∈ S, un estimador simple de su
14
2.2. Presentación del modelo
probabilidad de éxito dada la historiaHn−1 puede ser la media∑n−1k=1 I {sk = s}Xk∑n−1
k=1 I {sk = s}∈ [0,1], (2.3)
donde I(A) es la función indicatriz del evento A.
A pesar de ser simple de analizar y gozar de varias propiedades, esta media simple no responde
bien a nuestro deseo de modelar un agente real (persona o animal). La razón es que en (2.3) todas las
observaciones Xk poseen el mismo peso relativo, en tanto que la investigación psicológica y la vida
diaria nos sugieren que las observaciones más recientes (aquéllas con k ≈ n) debieran tener un mayorpeso relativo que las más lejanas (ésas con k� n).
Para subsanar este problema recurriremos a medias ponderadas en lugar de la media simple, y es
aquı́ donde nos ayudará el concepto de función de olvido introducido previamente. Diremos que una
función suave13 f : R+ → R+ es una función de olvido si es decreciente (no necesariamente decre-cimiento estricto) y, sin pérdida de generalidad, se tiene que f (0) = 1. Como ya hemos mencionado,
interpretaremos f (n− k) como la fortaleza en la etapa n del recuerdo de una unidad de informaciónadquirida en la etapa k. Nuestro agente, entonces, utilizará el estimador
Qn(s) =∑n−1
k=1 f (n− k)I {sk = s}Xk∑n−1k=1 f (n− k)I {sk = s}
∈ [0,1], (2.4)
el cual es una funciónHn−1-medible. Para evitar el problema técnico de que esta expresión se indefinepara las combinaciones (n, s) donde la estrategia s no ha sido elegida antes de la etapa n, modificaremos
esta definición previa a
Qn(s) =f (n)α0(s) +
∑n−1k=1 f (n− k)I {sk = s}Xk
f (n) +∑n−1
k=1 f (n− k)I {sk = s}∈ [0,1]. (2.5)
Esto equivale a asumir que, antes de ser elegida por primera vez, cada estrategia posee una esti-
13La gran mayorı́a de los ejemplos dados en la literatura son funciones de clase C∞, aunque también se usa a vecesfunciones derivables por trozos. En cualquier caso, dado que nuestro análisis es a tiempo discreto, los resultados valentambién para funciones más generales dado que la suavidad se vuelve irrelevante.
15
2.2. Presentación del modelo
mación basal de efectividad (o nivel basal de ‘confianza’ en la estrategia) dada por α0(s) > 0.
Basado en estimaciones de efectividad muy similares a la aquı́ propuesta, Gómez (2006) consi-
deró dos posibles protocolos de selección de estrategias:
Elegir en cada etapa n la estrategia s cuyo estimador Qn(s) es máximo. Este protocolo responde
a la suposición de un agente racional, que maximiza la probabilidad condicional de éxito de
acuerdo a su historia previa.
Elegir en cada etapa n una estrategia s aleatoriamente, con una probabilidad condicional pro-
porcional a Qn(s). Este protocolo fue utilizado por Siegler & Araya (2005) como una posible
implementación de la teorı́a de ondas superpuestas propuesta por Siegler (2005).
Gómez (2006) realizó un primer análisis de estos modelos. Para nuestro trabajo presente, debido
a nuestra inspiración estratégica tomada de Siegler & Araya (2005), nos concentraremos sólo en el
segundo protocolo. Éste dice, más precisamente, que la probabilidad de elegir la estrategia s en la
etapa n está dada por
P(sn = s|Hn−1) = Q̂n(s) ≡Qn(s)∑
z∈SQn(z). (2.6)
Antes de continuar con el análisis y discusión del modelo, en la Tabla 2.1 damos un resumen de la
notación utilizada, para facilitar la lectura de esta sección.
16
2.2. Presentación del modelo
S Conjunto de estrategiasS∞ Conjunto (aleatorio) de todas las estrategias que son elegidas infinitas vecesα(s) Tasa de éxito asociada a la estrategia s ∈ Sα Valor de α(s) en el caso en que el agente dispone de una sola estrategia
α0(s) Valor a priori que el agente asume para su estimación de α(s)α0 Valor a priori que el agente asume para su estimación de α (caso de una sola estrategia)
f Función de olvido (suave, decreciente y f (0) = 1)f (t2− t1) Fortaleza en el instante t2 del recuerdo de un evento ocurrido en el instante t1
(sn : n ≥ 1) Secuencia de estrategias elegidas por el agente(Xn : n ≥ 1) Secuencia de resultados de la aplicación de las estrategias (0: fracaso, 1:éxito)Hn σ-álgebra generada por la historia del agente hasta la etapa n: σ(s1,X1, . . . , sn,Xn)
Qn(s) Estimación de α(s) hecha por el agente en la etapa nQn Estimación de α, en el caso en que el agente dispone de una sola estrategia
Q̂n(s) Estimación normalizada sobre S: Qn(s)/∑
z∈SQn(z)τk(s) Instante en el cual la estrategia s es usada por la k-ésima vezXk(s) Resultado obtenido en la k-ésima aplicación de la estrategia s: Xτk(s)
µ [Modificación 1] Probabilidad de utilizar la estrategia dada en un instante de tiempoT [Modificación 2] Instante a partir del cual el agente no continúa actualizando
sus estimadores Qn(s)
m∧n Mı́nimo entre m y nI(A) Función indicatriz del evento AP(A) Probabilidad del evento AE(F) Valor esperado de la función F
Cuadro 2.1: Resumen de la notación utilizada en el capı́tulo.
17
2.2. Presentación del modelo
2.2.1. Un modelo clásico: la urna de Pólya
El modelo de Pólya que presentamos en esta sección es un elemento que no podemos dejar de
mencionar, ya que podrı́a representar una alternativa para modelar la situación de aprendizaje que
deseamos trabajar en este capı́tulo. Luego de describirlo brevemente, sin embargo, observaremos cier-
tas diferencias entre este modelo y el por nosotros presentado, respecto de su idoneidad para nuestra
aplicación.
La urna de Pólya es una urna que contiene inicialmente r bolas rojas y a bolas azules. En cada
etapa, se extrae una bola al azar de la urna. Esta bola se devuelve, y además se añade a la urna una
bola extra del mismo color de la extraı́da. De este modo, el número de bolas en la urna crece en cada
etapa. Pólya mostro que si Rn es el número de bolas rojas en la urna después de n iteraciones de este
proceso, entonces (n + r + a)−1Rn es una martingala cuya distribución converge a una beta.
Formalmente, hay a priori dos modos principales en los cuales nuestro modelo podrı́a compararse
a una urna de Pólya, sin embargo veremos que ambas posibilidades presentan dificultades.
Una opción es considerar el caso en que el agente dispone de sólo una estrategia (es decir el caso
|S| = 1), la cual podemos asimilar a una urna. El historial de éxitos y fracasos de esta estrategiaserı́a, entonces, la cantidad de bolas rojas y azules que la urna contiene. En la situación que
modelamos, sin embargo, hemos asumido que la probabilidad de que al historial se agregue un
éxito o fracaso es un valor constante α, es decir que no depende del historial mismo (i.e. del
contenido de la urna).
Otra posibilidad es pensar los colores rojo y azul de la urna de Pólya como dos estrategias
separadas. De este modo, la elección de una estrategia por sobre la otra en un momento dado se
realiza proporcionalmente a una función del historial de cada estrategia, como plantea el modelo
de Pólya. No obstante, esta analogı́a no considera el hecho que en el proceso de aprendizaje que
estudiamos, cada estrategia contiene en su historial éxitos y fracasos, requiriendo una mayor
información que la mera cantidad de uso de cada estrategia.
18
2.3. Análisis
2.3. Análisis
Sobre la selección de estrategias, mostramos que el trabajo realizado por Gómez (2006) en su
Teorema 5.1 se puede extender sin mayores modificaciones a contextos más generales, probando que
toda estrategia es elegida infinitas veces (Gómez trabajó solamente el caso especı́fico de funciones de
olvido exponencial y potencia). Luego, ponemos el acento en ampliar los resultados de convergencia
de los estimadores (Qn(s)).
2.3.1. Selección de estrategias
Teorema 1. Supongamos que una de las siguientes condiciones se cumple:
(I) La función de olvido f satisface ∑n≥0
f (n)∑nk=0 f (k)
= +∞.
(II) La función f es exponencial, es decir existe una constante ρ ∈ (0,1) tal que f (t) = ρt.
Entonces, todas las estrategias en S son elegidas infinitas veces, con probabilidad 1.
Demostración. La demostración de la suficiencia de la condición (I) seguirá los mismos pasos que
el Teorema 5.1 de Gómez (2006). Denotemos por S∞ ⊆ S el conjunto (en principio aleatorio) deestrategias que son elegidas infinitas veces. Entonces, dada s ∈ S:
P(s < S∞) = P((∃N ≥ 1)sn , s para todo n ≥ N).
19
2.3. Análisis
Por la monotonı́a de los eventos involucrados, concluimos que
P(s < S∞) = lı́mn→∞
lı́mk→∞P(An,k),
definiendo An,k como el evento en que sn , s, . . . , sn+k , s.
Supongamos que la propiedad (I) es cierta. Entonces, en An,k se tiene que
Qn+k(s) =f (n + k)α0(s) +
∑n−1i=1 f (n + k− i)I {si = s}Xi
f (n + k) +∑n−1
i=1 f (n + k− i)I {si = s}
≥ α0(s)f (n + k)∑n+k
i=0 f (i).
Por comodidad de notación, llamemos un = f (n)/∑n
i=0 f (i).
Ası́, en el evento An,k:
Q̂n+k(s) =Qn+k(s)∑
z∈SQn+k(z)≥ Qn+k(s)
Qn+k(s) + (|S|−1)
≥ α0(s)un+kα0(s)un+k + (|S|−1)
= 1− (|S|−1)α0(s)un+k + (|S|−1)
De este modo, podemos calcular
P(An,k+1) = P({sn+k+1 , s}∩An,k)
= E(I(An,k)P(sn+k+1 , s|s1, . . . , sn+k)
)= E
(I(An,k)E(P(sn+k+1 , s|Hn+k)|s1, . . . , sn+k)
)= E
(I(An,k)E(1− Q̂n+k(s)|s1, . . . , sn+k)
)≤ (|S|−1)
α0(s)un+k + (|S|−1)P(An,k).
20
2.3. Análisis
Con esta cota, obtenemos que
P(An,k)P(An,0)
≤k−1∏i=0
(|S|−1)α0(s)un+i + (|S|−1)
=
k−1∏i=0
(1− α0(s)un+i
α0(s)un+i + (|S|−1)
)
≤k−1∏i=0
(1− α0(s)un+i|S|
)≤
k−1∏i=0
exp(−α0(s)un+i|S|
)
= exp
−α0(s)|S|k−1∑i=0
un+i
y concluimos que P(An,k) converge a cero cuando k→∞, lo que implica el resultado deseado.
(II) es el caso especı́fico de la función exponencial, que fue ya demostrado directamente por
Gómez (2006). �
2.3.2. Sobre otros modelos de urnas
Antes de continuar con el análisis de nuestro modelo, revisitaremos nuestro resultado sobre selec-
ción de estrategias de la sección anterior a la luz de otros modelos que se encuentran en la literatura,
especı́ficamente con ciertas generalizaciones de la urna de Pólya presentada en la Sección 2.2.1, como
lo son los procesos de bolas en urnas con feedback (ver, por ejemplo, Mitzenmacher et al., 2004; Oli-
veira, 2008, 2009). Estos procesos pueden ser pensados como una urna de Pólya en la cual hay bolas
de K colores distintos, y donde la probabilidad de extraer una bola de un color dado es proporcional a
una función F de las cantidades de bolas de cada color en la urna. Es decir, la probabilidad de elegir
una bola de color c ∈ {1, . . . ,K} está dada por
F(nc)∑Ki=1 F(ni)
,
donde ni es el número de bolas de color i presentes en la urna.
Como ya mencionamos al describir la urna de Pólya, una diferencia crucial entre nuestro modelo
21
2.3. Análisis
y los aquı́ considerados es que el primero utiliza selección proporcional a una media ponderada de los
éxitos de la estrategia, mientras que los segundos lo hacen proporcionalmente a la cantidad de veces
que ésta ha sido utilizada.
Si bien en este capı́tulo consideramos solamente el caso de proporcionalidad exacta, es decir to-
mando F la función identidad, Oliveira y otros han estudiado con particular interés el caso en que
F(x) = xp, con p > 1. En este caso, se sabe que uno de los colores obtiene un monopolio, es decir
existe casi seguramente un momento a partir del cual siempre se extrae bolas del mismo color. Esta
conclusión marca una diferencia con nuestros resultados, donde vemos que que toda estrategia es ele-
gida infinitas veces con probabilidad uno. Observamos, además, que esto no se debe a la presencia de
la función F especı́fica considerada en la literatura, puesto que podrı́amos modificar la ley condicional
de (sn) presentada en (2.6) por
P(sn = s|Hn−1) =F(Qn(s))∑
z∈SF(Qn(z)),
y en esta nueva situación la demostración que hemos dado para el Teorema 1 es también válida (casi
sin modificaciones) para demostrar que toda estrategia se elige infinitas veces con probabilidad uno
para toda función F tal que cumpla (conjuntamente con la función de olvido f )
∑n≥0
F(
f (n)∑nk=0 f (k)
)= +∞. (2.7)
Para hacer más clara nuestra comparación con los modelos de bolas en urnas con feedback, deja-
mos de lado nuestra función de olvido, tomando f (n) ≡ 1. De este modo, la Ecuación (2.7) se reducea ∑
n≥1F(n−1) = +∞,
lo que es fácil ver que se cumple para toda función F(x) = xp con p ∈ (0,2). Con esto, vemos quepara p ∈ (1,2) se tiene que elegir proporcionalmente a la tasa de éxito de una estrategia implica queésta será elegida infinitas veces casi seguramente, a diferencia de los modelos de bolas en urnas con
feedback, en los cuales, con probabilidad uno, una urna obtiene el monopolio en el largo plazo.
22
2.3. Análisis
2.3.3. Convergencia en el caso |S| = 1
Cuando hay sólo una estrategia disponible la secuencia (sn) se vuelve trivial, de modo que la única
ley de probabilidad de importancia en este caso es
P(Xn = 1|X1, . . . ,Xn−1) = α,
que se obtiene de la Ecuación (2.2), si denotamos α ≡ α(s) con s el único elemento de S (en lo queresta de esta sección, simplemente omitimos las referencias a s). Esta última expresión muestra inme-
diatamente que (Xn) es ahora una secuencia i.i.d.de variables aleatorias, lo cual nos permitirá trabajar
con bastante libertad. Veremos que en este caso, condiciones sobre el decaimiento de la función de
olvido f nos permiten obtener conclusiones directas respecto de la convergencia de los estimadores
(Qn), los cuales se reducen a la expresión
Qn =f (n)α0 +
∑n−1k=1 f (n− k)Xk
f (n) +∑n−1
k=1 f (n− k)=
f (n)α0 +∑n−1
k=1 f (n− k)Xk∑nk=1 f (k)
(2.8)
El siguiente Teorema presenta un primer par de resultados, válidos para cualquier función de
olvido f .
Teorema 2. Se tiene que:
1. El valor esperado de (Qn) converge a α.
2. La probabilidad de que (Qn) converja es o bien 0, o bien 1.
Demostración. A través de un cálculo simple, obtenemos que E(Qn) puede escribirse como λnα0 +
(1−λn)α, conλn =
f (n)∑nk=1 f (k)
.
Observamos que si∑
k≥1 f (k) = L < +∞, entonces f (n) converge a cero cuando n→∞, y lo mismo
23
2.3. Análisis
ocurre con λn. Por el contrario, si∑
k≥1 f (k) = +∞, entonces nuevamente obtenemos que λn convergea cero, ya que f (n) ≤ f (0) = 1. De esto se sigue directamente la afirmación (1).
La propiedad (2) se demuestra en modo análogo a la Ley 0-1 clásica de Kolmogorov, notando que
el argumento del párrafo anterior nos permite también demostrar que, para cualquier n0 fijo,
lı́mn→∞
f (n)α0 +∑n0
k=1 f (n− k)Xk∑nk=1 f (k)
≤ lı́mn→∞
n0∑k=0
λn−k = 0.
De esto se desprende que la convergencia de (Qn) es un evento de la σ-álgebra cola de la secuencia
(Xk), la cual es i.i.d.. Ası́, este evento debe tener probabilidad o 0 ó 1. �
Dados estos primeros resultados, observamos que el espacio de funciones de olvido puede ser
particionado en las funciones que aseguran, y las que impiden, la convergencia de (Qn) (es decir, las
funciones f para las cuales la probabilidad de convergencia vale 1 ó 0, respectivamente). Los siguien-
tes resultados nos darán luces acerca de cuál situación es la que corresponde para ciertas familias de
funciones.
Funciones de olvido de serie finita
Teorema 3. Supongamos que la función de olvido f es tal que∑k≥0
f (k) = L < +∞.
Entonces 0 y 1 son, casi seguramente, puntos de acumulación de (Qn).
Demostración. Sea δ > 0 pequeño, y elijamos p > 1 tal que∑
k>p f (k) < δ. Gracias a la independencia
24
2.3. Análisis
de (Xk), el Lema de Borel-Cantelli nos asegura que con probabilidad uno, para infinitos valores de
n > p se tiene
Xn−p = . . . = Xn−1 = 1. (2.9)
Para cada uno de estos valores de n, se cumple
Qn =f (n)α0 +
∑n−1k=1 f (n− k)X(n− k)∑n
k=1 f (k)
=f (n)α0 +
∑n−p−1k=1 f (n− k)X(n− k) +
∑pk=1 f (k)∑n
k=1 f (k)
≥ 1L
p∑k=1
f (k) >L−δ
L= 1− δ
L.
De aquı́, concluimos que (Qn) se acumula en 1. La acumulación en 0 se demuestra análogamente,
tomando una subsecuencia de valores de n para los cuales Xn−p, . . . ,Xn−1 valgan todos cero (cuya
existencia está garantizada, nuevamente, por el Lema de Borel-Cantelli). �
Observación 1. Hemos elegido esta forma de enunciar el teorema de modo de poder extenderlo singrandes modificaciones a otras situaciones que estudiaremos en las próximas secciones. Sin embargo,
la demostración del Teorema 3 aquı́ presentada puede ser ajustada fácilmente de modo de ver que a =1L∑n0
k=0 akρk es también un punto de acumulación de (Qn), para cualquier n0 ≥ 0 y cualquier secuencia
a0, . . . ,an0 de ceros y unos. La demostración consiste en tomar en la Ecuación (2.9) una secuencia no
de unos, sino una secuencia compuesta que inicie con ceros y luego continúe con an0 ,an0−1, . . . ,a1,a0.
El largo de la secuencia de ceros establecerá cuán cerca de a se encontrará el valor ası́ construido
de Qn.
Funciones de olvido de lento decaimiento
Diremos que una función de olvido f es de lento decaimiento si existe un C > 0 tal que f (t) ≥C(1 + t)−1 para todo t ≥ 0.
25
2.3. Análisis
Lema 1. Si f es una función de lento decaimiento, el cuociente
Rn =∑n
k=1 f (k)2 · logn(∑n
k=1 f (k))2
converge a cero cuando n→∞.
Demostración. El caso en que lı́mt→∞ f (t) = µ > 0 es directo, ya que en este caso
Rn ≈nµ2 logn
(nµ)2=
lognn
.
Supongamos ahora que f decrece a cero. A partir de la definición de lento decaimiento, obtenemos
que para todo t ≥ 0 ∫ t0
f ≥C log(1 + t) (2.10)
y, en particular, que∫ ∞
0 f = +∞.
Supongamos que∫ ∞
0 f2 = K < +∞. Entonces, usando la Ecuación (2.10) vemos que
lı́mt→∞
∫ t0 f
2 log t(∫ t0 f
)2 ≤ lı́mt→∞ KC ∫ t0 f = 0.
Si, por el contrario, tuviéramos que∫ ∞
0 f2 =∞, entonces tenemos
lı́mt→∞
∫ t0 f
2 log t(∫ t0 f
)2 ≤C−1 lı́mt→∞∫ t
0 f2∫ t
0 f,
donde este último lı́mite es una forma indeterminada, la cual podemos calcular usando la regla de
26
2.3. Análisis
L’Hôpital:
lı́mt→∞
∫ t0 f
2∫ t0 f
= lı́mt→∞
f 2(t)f (t)
= lı́mt→∞
f (t) = 0.
Con esto, y haciendo uso de las desigualdades∫ n0
g−1 ≤n∑
k=1
g(k) ≤∫ n
0g
válidas para cualquier función de olvido g, calculamos finalmente
lı́mn→∞
Rn ≤ lı́mn→∞
∫ n0 f
2 logn(∫ n0 f −1
)2 ≤ lı́mn→∞∫ n
0 f2 logn(∫ n
0 f)2 ·
∫ n
0 f∫ n0 f −1
2
= 0,
gracias a la Ecuación (2.10) y el hecho que el segundo factor de la última expresión es acotado. �
Teorema 4. Supongamos que la función de olvido f es de lento decaimiento. Entonces (Qn) convergea α casi seguramente.
Demostración. Sea ank = f (n− k)/∑n
k=1 f (k). Podemos, entonces, escribir
Q̃n ≡ Qn−E(Qn) =n−1∑k=1
ank(Xk −E(Xk)).
Para demostrar la convergencia casi segura de (Q̃n) a cero, utilizaremos el Teorema 1 de Giuliano
Antonini et al. (2001), cuyo enunciado presentamos en el Apéndice A. Las condiciones que no se
siguen directamente del hecho que (Xk −E(Xk)) es una secuencia uniformemente acotada, son:
i. El conjunto {ank logn : n ≥ 1,1 ≤ k ≤ n} debe ser acotado. Esto es consecuencia directa de que fsea una función de lento decaimiento, ya que en tal caso ank logn está acotado por una constante.
27
2.3. Análisis
ii. La sucesión (∑n−1
k=1 a2nk logn) debe converger a cero. Notamos, sin embargo, que esta sucesión es
igual a (Rn), la cual hemos definido y demostrado su convergencia a cero en el Lema 1.
Con esto, Giuliano Antonini et al. (2001) nos asegura que la sucesión (Q̃n) converge completa-
mente a cero14. Es sabido que la convergencia completa implica la convergencia casi segura (gracias
al Lema de Borel-Cantelli, ver también Chung, 2001, Teoremas 4.2.1 y 4.2.2), y uniendo esto al hecho
que E(Qt) −→ α cuando t→∞ gracias al Teorema 2, hemos completado la demostración. �
2.3.4. Convergencia en el caso |S| > 1
En este caso general, la secuencia (Xk) ya no es i.i.d., debido a que X1, . . . ,Xn inciden en el valor
de sn+1, quien influirá a su vez en el valor de Xn+1. Sin embargo Gómez (2006) mostró, usando una
técnica que utilizaba tiempos de parada, que ciertas subsucesiones aleatorias de (Xk) son en efecto
i.i.d., lo cual le permitió extender parte de sus resultados a este caso.
Definamos, entonces, dada una estrategia s ∈ S,
τ1(s) = mı́n{k ≥ 1 : sk = s},τn+1(s) = mı́n{k > τn(s) : sk = s}.
Es bien sabido que para cada n≥ 1 y s ∈ S, τn(s) es un tiempo de parada con respecto a la filtraciónZn = σ(s1, . . . , sn). Si s es elegida infinitas veces, entonces τn(s) es finito para todo n ≥ 1, y podemosdefinir Xk(s) = Xτk(s) para todo k ≥ 1.
Gómez (2006, Sección 4.1) demostró que, bajo la hipótesis de que s ∈ S es elegida infinitas vecescon probabilidad uno, entonces (Xk(s)) es una secuencia infinita, i.i.d., con distribución Bernoulli de
parámetro α(s). En esta sección, veremos que un argumento casi idéntico al del caso |S| = 1 permite14Decimos que una secuencia aleatoria (Wk) converge completamente a cero si y solamente si para cualquier ε > 0, la
suma∑
k P(|Wk | > ε) es convergente. Esta definición fue introducida por Hsu & Robbins (1947).
28
2.3. Análisis
demostrar la no-convergencia de (Qn(s)) en esta situación más general. Recordemos que S∞ es elconjunto de estrategias que son elegidas infinitas veces.
Teorema 5. El Teorema 3 (no-convergencia para las funciones de olvido de suma finita) es tambiénválido en el caso |S| > 1, para cada estrategia s tal que s ∈ S∞ casi seguramente. Es decir, si s ∈ S esuna tal estrategia, entonces tanto 0 como 1 son puntos de acumulación de (Qt(s)) con probabilidad
uno.
Demostración. Sea s una estrategia tal que s ∈ S∞ con probabilidad uno. Definamos N(n) como elnúmero de veces que s ha sido elegida hasta la etapa n, es decir N(n) = ∑nk=1 I {sk = s}. Haciendo usode esta notación, observamos que Qn(s) puede ser escrito como
Qn(s) =α0(s) f (n) +
∑N(n−1)j=1 f (n−τ j(s))X j(s)
f (n) +∑N(n−1)
j=1 f (n−τ j(s)).
Siguiendo el mismo hilo conductor del Teorema 3, dado cualquier p > 1 aplicamos el Lema de
Borel-Cantelli a la secuencia i.i.d. (Xk(s)) para obtener que con probabilidad uno, y para infinitos
valores de n > p: Xn−p(s) = . . . = Xn−1(s) = 1.
Sea entonces m = 1 +τn−1(s). Con esto, como N(m−1) = n−1, se tiene que
Qm(s) =α0(s) f (m) +
∑n−p−1j=1 f (m−τ j(s))X j(s) +
∑n−1j=n−p f (m−τ j(s))
f (m) +∑n−p−1
j=1 f (m−τ j(s)) +∑n−1
j=n−p f (m−τ j(s))
≥α0(s) f (m) +
∑n−1j=n−p f (m−τ j(s))
f (m) +∑n−p−1
j=1 f (m−τ j(s)) +∑n−1
j=n−p f (m−τ j(s))
≥ f (1)f (m) +
∑n−p−1j=1 f (m−τ j(s)) + f (1)
.
29
2.4. Modificación 1: una estrategia a intervalos irregulares
Notamos también que si l ≥ k entonces τl(s)−τk(s) ≥ l− k, con lo cual
f (m) +n−p−1∑
j=1
f (m−τ j(s)) ≤ f (m) +n−p−1∑
j=1
f (n− j) ≤∑j>p
f ( j).
Ası́, recordando que f (1) ≤ 1, concluimos que si p es elegido de modo que esta última sumatoriasea menor que un δ > 0 dado, se tiene que para infinitos valores de m
Qm(s) ≥1
δ+ 1≥ 1−δ,
lo que concluye la demostración. De modo análogo se demuestra la acumulación en 0. �
En las siguientes secciones, abordaremos dos modificaciones del modelo que hemos presentado,
con las cuales perseguimos aproximarnos más a ciertas situaciones psicológicamente comunes: por
una parte, en el dı́a a dı́a las aplicaciones de una estrategia dada no suelen estar separadas por lapsos
de tiempo de igual duración. Siendo una suposición válida para entornos experimentales pero no tanto
para la realidad cotidiana donde se desenvuelve casi la totalidad de nuestro aprendizaje, cabe pregun-
tarse si nuestros resultados de aprendizaje siguen siendo válidos al relajarla. La segunda modificación
concierne el hecho sabido que, al dedicarnos continuamente a una tarea repetitiva, nuestro nivel de
recursos cognitivos dedicados a la misma decae (es decir, la tarea se automatiza). Dado esto, estu-
diaremos qué ocurre en el modelo con varias estrategias cuando el agente detiene su mecanismo de
actualización de las variables (Qn(s)) en un instante dado, manteniendo sus probabilidades de elección
constantes a partir de ese momento.
2.4. Modificación 1: una estrategia a intervalos irregulares
Para revisar la validez de nuestros resultados en el caso en que las aplicaciones de una estrategia
no se encuentran equiespaciadas en el tiempo, en esta sección consideraremos que no en toda etapa
30
2.4. Modificación 1: una estrategia a intervalos irregulares
n el agente puede observar el resultado Xn. Esto le estará permitido sólo en una selección de valores
para n.
Para lograr esto, modificamos levemente nuestro modelo de varias estrategias del modo siguiente.
Tomemos S = {s, s̄}, donde s es la estrategia cuya efectividad α(s) deseamos estimar, y s̄ es un ele-mento de juguete, que utilizamos simplemente para representar la no elección de s. En este contexto,
consideramos que más que elegir o no la estrategia s, el agente observa una nueva observación (Xk), o
se le presenta la necesidad de usar esa estrategia, cada vez que sn = s. En este tratamiento, suponemos
que la secuencia (sn) es i.i.d.e independiente de Hn−1, con P(sn = s) = µ ∈ (0,1). Esto tiene sentido sise considera que la oportunidad de observar una nueva variable (Xk) es dependiente del contexto, en
lugar que del agente.
Definamos Yn = I {sn = s}Xn. Tenemos que
P(Yn = 1|Y1, . . . ,Yn−1) = E(P(Yn = 1|sn,Hn−1)|Y1, . . . ,Yn−1)= E(I {sn = s}P(Xn = 1|sn,Hn−1)|Y1, . . . ,Yn−1)= E(I {sn = s}α(sn)|Y1, . . . ,Yn−1)= α(s)P(sn = s|Y1, . . . ,Yn−1)= α(s)µ.
por lo que (Yn) es también una secuencia i.i.d., con distribución Bernoulli de media α(s)µ.
Con esto, en el caso en que la función de olvido f es de lento decaimiento, podemos aplicar el
Teorema 4 a las secuencias (Yn) e (I {sn = s}), obteniendo que con probabilidad uno
lı́mn→∞
f (n)α0(s) +∑n−1
k=1 f (n− k)Yn∑nk=1 f (n)
= α(s)µ
lı́mn→∞
f (n) +∑n−1
k=1 f (n− k)I {sn = s}∑nk=1 f (n)
= µ
y, dividiendo ambas expresiones, concluimos que (Qn(s)) converge casi seguramente a α(s).
31
2.5. Modificación 2: varias estrategias, con estabilización
Con respecto al resultado de no-convergencia para funciones de olvido de suma finita, hacemos
notar que podemos aplicar exactamente el mismo argumento ya dado en la Sección 2.3.4 para el caso
|S| > 1. En efecto, la secuencia (τk(s)) es precisamente el conjunto de etapas en las que el agenteobserva Xn. Esto genera una secuencia (Xk(s)) efectivamente infinita, gracias a la Ley de los Grandes
Números que nos dice que con probabilidad uno
lı́mn→∞
1n
n∑k=1
I {sk = s} = µ > 0,
es decir s ∈ S∞ casi seguramente.
Con esto, Gómez (2006, Sección 4.1) nos asegura que nuevamente (Xk(s)) es una secuencia i.i.d.,
y ası́ la demostración del Teorema 5 se aplica sin modificaciones.
2.5. Modificación 2: varias estrategias, con estabilización
Para comenzar, observamos que si modificamos la ley condicional de elección de estrategias dada
en la Ecuación (2.6) a
P(sn = s|Hn−1) = µ(s)
donde µ(s) > 0,∑
z∈Sµ(z) = 1, son probabilidades fijas, entonces la secuencia (sn) se vuelve inmedia-
tamente i.i.d., con lo cual nos podemos reducir al caso de la Modificación 1 presentado en la sección
anterior si consideramos separadamente cada estrategia s ∈ S, elegida con probabilidad µ(s) y no ele-gida con probabilidad 1− µ(s). Esto nos dice que valen en esta situación tanto el Teorema 3 sobrefunciones de olvido sumables, como el Teorema 4 sobre funciones de olvido de lento decaimiento, y
esta vez para todos los elementos de S (además, S∞ =S casi seguramente). Es decir, si asumimos quela ley condicional de (sn) es constante, reobtenemos los buenos resultados de los casos con una única
estrategia.
En lo que resta de esta sección vemos que éste es también el caso cuando suponemos que la ley
condicional de (sn) se estabiliza, es decir se hace constante, a partir de un tiempo T aleatorio. Este
32
2.5. Modificación 2: varias estrategias, con estabilización
tiempo T lo podemos considerar como un instante decidido por el a