Estudios experimentales y de modelacion en aprendizaje y … · 2011. 5. 10. · CMM: Grecia...

UNIVERSIDAD DE CHILEFACULTAD DE CIENCIAS FÍSICAS Y MATEMÁTICASDEPARTAMENTO DE INGENIERÍA MATEMÁTICA

Estudios experimentales y de modelaciónen aprendizaje y cognición matemática

Tesis para optar al grado deDoctor en Ciencias de la Ingenierı́a

mención Modelación Matemática

David Maximiliano Gómez Rojas

Profesor Guı́aPablo Dartnell Roy

Miembros de la ComisiónServet Martı́nez AguileraRafael Correa Fontecilla

Roberto Araya SchulzJorge Soto Andrade

Pedro Rosas Henrı́quez

Santiago de ChileDiciembre 2010

Resumen de la Tesis para optar al grado de Doctoren Ciencias de la Ingenierı́a mención Modelación Matemática

Autor: David M. GómezFecha Examen: 21 de Diciembre de 2010

Prof. Guı́a: Pablo Dartnell

Estudios experimentales y de modelaciónen aprendizaje y cognición matemática

En este trabajo se presenta una serie de estudios sobre aprendizaje y cognición numérica, desdeun enfoque mixto entre la modelación matemática y la experimentación psicológica.

Se comienza analizando un modelo sobre memoria y aprendizaje, investigando los efectos deldecaimiento temporal de cada recuerdo en la capacidad de un agente ideal para estimar la probabilidadde ocurrencia α de un evento dado. Para esto, el agente construye un estimador (Qn) en el contextode un proceso estocástico a tiempo discreto, y la velocidad de decaimiento de cada recuerdo está dadapor una llamada función de olvido. El análisis es considerablemente más general que el realizado entrabajos previos, encontrándose clases de funciones de olvido que hacen que (Qn) converja a α conprobabilidades cero o uno. Se extiende algunos de estos resultados a casos en donde el agente debeestimar las probabilidades asociadas a un conjunto finito de eventos.

Se revisa luego investigaciones sobre la capacidad de animales y humanos para representar mental-mente cantidades de objetos. Se plantea un problema de optimización para estudiar la recta numéricamental propuesta en la literatura como base de estas representaciones numéricas, suponiendo que estarecta numérica ha sido moldeada en un proceso evolutivo que tiende a maximizar la discriminabilidadentre representaciones mentales de números consecutivos. Se demuestra la existencia de una cantidadmáxima discriminable, la cual se discute a la luz de las habilidades numéricas de tribus indı́genas delAmazonas y de bebés de pocos meses.

Se presenta entonces un primer trabajo experimental, cuyo objetivo es verificar si las proporcionesde cantidades gozan de un status similar a las cantidades simples, en términos perceptuales. La tareaconsistı́a en elegir la mayor de dos proporciones de puntos, presentadas en una pantalla durante unsegundo. Los resultados muestran un porcentaje de acierto por sobre el 70% y, más aún, que la funciónmás apropiada para describir la distancia perceptual entre dos proporciones es su cuociente y no sudiferencia absoluta, tal como ocurre también en la percepción de cantidades enteras.

Finalmente, se estudia cómo se puede conciliar esta rapidez y naturalidad de la percepción deproporciones con la gran dificultad que tienen niños de enseñanza básica para aprender la operatoriade fracciones. Se realiza un estudio correlacional buscando enlazar aprendizaje de ordenamiento defracciones y capacidad de inhibición de respuestas automáticas, en un grupo de niños que estudiabanfracciones por primera vez. Se encontró una correlación estadı́sticamente significativa entre un ı́ndiceestándar de capacidad inhibitoria y el rendimiento en un cuestionario de comparación de fracciones,controlando ciertas variables exógenas como nivel socioeconómico familiar.

ii

Ouroboros, representación ancestral de procesos cı́clicos(Ilustración de Javiera Constanzo, http://uialwen.deviantart.com/).

iii

A todos quienes, con su ánimo y compañı́a,

han anónimamente dejado su huella en este trabajo y en mi vida.

iv

Agradecimientos

Ası́ como una pieza de piano se compone de la contribución de dos manos, una que usualmentelleva la melodı́a y otra que acompaña, este trabajo ha sido moldeado –y podrı́amos decir tambiénescrito– por una multitud de personas, a pesar de que no todas estas influencias han dejado huellasen las lı́neas finalmente impresas: algunas, silenciosas, simplemente pasean entre lı́neas y númerosproporcionando una melodı́a de fondo sin la cual esta obra no serı́a tal.

Comencemos por la melodı́a: La génesis y el desarrollo de este trabajo se debe en gran parte ami profesor guı́a Pablo Dartnell y a nuestro incondicional colaborador Roberto Araya, quienes com-plementando mutuamente sus conocimientos dieron origen a la chispa inicial de embarcarme en estaruta de modelación y experimentación cognitiva. Gracias por estos años de trabajo juntos, los cualesestoy seguro se multiplicarán hacia adelante. Gracias también a Leonor Varas y su incesante trabajo deorganización del Seminario de Educación del Centro de Modelamiento Matemático (CMM), a travésdel cual me acerqué a mis actuales áreas de interés.

Gracias a Jorge Soto, Pedro Rosas, Rafael Correa y Servet Martı́nez por darse el trabajo de leer ydiscutir este trabajo. También a varias personas que aportaron sus conocimientos, ideas y trabajo enlos diversos temas que componen esta tesis, como Alejandro Maass, Gonzalo Mena y Jairo Navarre-te, además de los participantes del Seminario de Educognición realizado durante el año 2008 en elCMM: Grecia Gálvez, Jorge Soto, y otros que enriquecieron con sus diversos puntos de vista muchasdiscusiones. Por su parte, Eugenia Dı́az y Rosa Devés me ayudaron desde la Facultad de Medicina adar mis primeros pasos hacia las disciplinas experimentales.

Gracias a la CONICYT por darme la oportunidad de acercarme al mundo académico, con su esen-cial soporte económico para mi trabajo de estos años; y al Departamento de Ingenierı́a Matemática(DIM) y al Centro de Investigación Avanzada en Educación (CIAE) por sus aportes que me posibili-

v

taron concretar los estudios experimentales presentados en este trabajo.

Gracias también a muchos funcionarios del DIM y el CIAE: Eterin, Marı́a Rosa, Gladys, Silvia,Verónica, Luis, Óscar, Jaime, Javier, Juan Pablo, y otros, por su ayuda en múltiples ocasiones con unsinfı́n de papeleos y otras yerbas.

Después de haber escuchado la melodı́a por un rato, usualmente uno suficientemente atento co-mienza a sentir los matices puestos en la música por la mano que acompaña. Notas de humor, com-pañerismo, y del necesario ánimo que me hizo falta en los momentos más complicados se las agradez-co a Jairo, Marcelo, Álvaro, Gonzalo, Daniela, Andrés, y muchas otras personas que en este momentose me escabuyen de entre los dedos. También a Andrea y Silvia, quienes hicieron lo propio en losrincones del Golfo de Trieste.

A mi familia: Alejandra, Juan Carlos, Carmen, Juan Carlos y Camila, gracias por estar siemprepresentes a través de su preocupación, ayuda, consuelo, y apoyo a toda prueba, sea a 2 o a 12.000kilómetros. También a Marı́a y Ernesto, quienes seguramente también acompañaron este proceso des-de su nueva casa.

vi

Una historia abreviada

Santiago de Chile, otoño de 2004

Se acercaba ya el momento de definir el que serı́a el tema de mi memoria de Ingenierı́a CivilMatemática. En ese entonces, y tal como ahora, en el Centro de Modelamiento Matemático de laUniversidad de Chile se organizaba mensualmente el Seminario de Educación. Habiendo estado cercade postular a Pedagogı́a en Matemáticas en lugar de Ingenierı́a, decidı́ asistir a algunas sesiones paraver de qué cosas se hablaba. Al final de una de estas charlas, surgió espontáneamente una plática conPablo Dartnell, quien participaba usualmente de esas reuniones.

– Ası́ que, ¿te gustan estos temas? –fue la frase que comenzó una conversación sobre el proyectoque Pablo lideraba en ese entonces sobre tutorı́as online para estudiantes de enseñanza media. Mecontó también de un colega suyo, Roberto Araya, quien habı́a trabajado previamente en modelaciónde datos experimentales sobre aprendizaje con alumnos de enseñanza básica. Quedamos de juntarnoslos tres por esos dı́as –en lo que se convertirı́a en nuestra base de operaciones, el Café Universitario–,y discutir la posibilidad de una memoria sobre modelación de este proceso de aprendizaje.

Santiago de Chile, enero de 2006

Después de un arduo año y medio de trabajo, la conversación de 2004 se convirtió finalmenteen la memoria que me valió el tı́tulo de Ingeniero. No sin antes haber pasado por una multitud delecturas en un lenguaje absolutamente nuevo: el de la psicologı́a experimental. Debo decir, al menos,que si bien Roberto era versado en estos temas, Pablo estaba emprendiendo este nuevo camino más omenos al mismo tiempo que yo. Y ambos parecı́amos entusiasmados con las posibilidades a futuro queesto abrirı́a, pensando en un grupo de trabajo que integrase los enfoques de modelación matemática y

vii

experimentación cognitiva, aplicados a temas educativos.

Habı́a ya decidido continuar mis estudios en un programa de Doctorado, y ası́ fue como a partir deese mismo año me inscribı́ en Modelación Matemática en el Departamento de Ingenierı́a Matemática.

Santiago de Chile, enero de 2008

Dos años después, el panorama ha cambiado bastante, ası́ como yo mismo. Paralelamente a rea-lizar los cursos matemáticos que el programa requiere, habı́a decidido que necesitaba acercarme mása algunas disciplinas cercanas al aprendizaje, como la psicologı́a y las neurociencias. Esto me llevó atomar cursos en la Escuela de Postgrado de la Facultad de Medicina, donde tuve que partir desdelas cosas más básicas, además de refrescar en mi mente el hecho que “básico” y “simple” no nece-sariamente son sinónimos. Después de estudiar temas como la biologı́a y fisiologı́a celulares, pudeapreciar en toda su amplitud una frase que personas como Eugenia Dı́az me dijeron en su momento:“una de las cosas que más cuesta es habituarse a los distintos modos de trabajo, en la matemática y enlas ciencias experimentales”. Esto se traduce en nociones tan centrales como qué cosa es una verdadválida en estas disciplinas: el Teorema de Pitágoras sigue siendo hoy tan válido como el dı́a en que fuedemostrado por primera vez unos 3,000 años atrás, mientras que nadie tiene la certeza si un artı́culoexperimental publicado hoy será todavı́a considerado válido en tres años más.

Y finalmente está por llegar el momento de mi examen de calificación, en marzo. El plan es unatesis de modelación sobre fenómenos de cognición, matemática y lenguaje.

Trieste, Italia, septiembre de 2008

Convencido de continuar buscando una formación tanto como matemático como cognitivista, meintegré al Sector de Neurociencias Cognitivas de la Scuola Internazionale Superiore di Studi Avanzati,en Italia. Sin embargo, las posibilidades de hacer un trabajo de tesis conjunto entre esta institución yla Universidad de Chile se esfumaron cuando la burocracia gubernamental chilena decidió privilegiarla letra del contrato y cerró las puertas a la idea. Ni siquiera una carta del Papa ayudó.

Y aquı́ comenzó el mayor giro dramático de esta historia, cuando decidı́ seguir adelante con ambasinstituciones, en programas de Doctorado separados.

viii

Trieste, Italia, octubre de 2010

Se acerca finalmente el momento de terminar el Doctorado en Modelación Matemática, una fechaque a ratos parecı́a nunca llegar. Esto de tener dos jefes, y dos trabajos, no se lo doy a nadie. Llegó lahora de recoger ecuaciones, modelos, papers, experimentos, camas y petacas, y poner todas las cartassobre la mesa. Definitivamente, la palabra modelación tomó un peso especial a través de este trabajo.Especialmente considerando que otras personas, matemáticos en formación, han mostrado interés enlos temas que me trajeron por este camino. El cual ha resultado ser algo sinuoso, pero profundamentepropio. Y que por lo demás, todavı́a no termina.

ix

Esquema de esta tesis

En este trabajo, presentamos un enfoque mixto matemático-cognitivo para el estudio de ciertostemas de interés en las áreas de estudio de la memoria, percepción numérica y educación matemática.

Si bien esta tesis posee una motivación unitaria, los capı́tulos que la componen han sido prepara-dos para ser leı́dos como unidades independientes. Por esta razón, cada uno de ellos posee resumen,introducción y discusión especı́ficos, donde se hace la revisión de la literatura apropiada en detalle.También las referencias bibliográficas son entregadas al final de cada capı́tulo, para facilitar al lec-tor su búsqueda. Asimismo, incluimos al final de la tesis un epı́logo con algunas reflexiones finalesgenerales sobre el trabajo realizado.

El Capı́tulo 2 es eminentemente teórico: en él presentamos un modelo matemático basado en pro-cesos estocásticos discretos, cuyo objetivo es formalizar un proceso simple de memoria y aprendizajey contestar algunas preguntas que los enfoques clásicos experimentales en el estudio de la memoriano son, por definición, capaces de responder. Este modelo fue propuesto originalmente en la memoriade Ingenierı́a Civil Matemática del mismo autor de esta tesis, sin embargo ahora lo tratamos en ma-yor generalidad y lo enraizamos considerablemente en la literatura apropiada. Este estudio nos llevaademás, al final del capı́tulo y haciendo tributo al sorprendente entramado conceptual de la matemáti-ca, a proponer una fórmula de Monte Carlo de cuadratura para la integración con respecto a medidasbinomiales y ciertas convoluciones de Bernoulli.

Luego, en el Capı́tulo 3 nos abocamos a un tema más bien perceptual, y que se ubica seguramenteal origen de nuestra capacidad de hacer matemáticas (al menos como las conocemos): presentamos unabreve revisión de lo que la investigación psicocognitiva ha llamado el Sentido Numérico, refiriéndosea nuestra capacidad de percibir cantidades en nuestro entorno, y sus relaciones y operatoria. Dada

x

la vasta evidencia empı́rica sugiriendo que los orı́genes de esta percepción numérica preexiste a laespecie humana, nos dedicamos a tratar de comprender algunas de sus propiedades asumiendo queestos orı́genes corresponden a un proceso evolutivo de optimización de la discriminabilidad entrerepresentaciones de números similares. Traducimos esto en un problema de optimización en variasvariables, el cual estudiamos y resolvemos numéricamente.

En ese momento también presentamos la primera experiencia empı́rica de esta tesis, cuyo objetivoes estudiar si acaso las reglas del Sentido Numérico se aplican también a las proporciones de canti-dades: ¿Son éstas también rápidamente accesibles? ¿Son sus representaciones mentales afectadas porprincipios similares a los de las representaciones de números enteros?

En el Capı́tulo 4 nos alejamos relativamente de la matemática en cuanto herramienta y la enfo-camos como objeto de estudio. Basándonos en algunos de los conceptos e ideas presentados en loscapı́tulos previos, nos preguntamos por la gran dificultad que presenta el tema de las fracciones en laeducación matemática. Ponemos a prueba, en este contexto especı́fico, una teorı́a reciente que rela-ciona aprendizaje matemático y un set de habilidades cognitivas llamadas capacidades ejecutivas, através de un estudio experimental correlacional sobre aprendizaje de fracciones con niños de tercerobásico.

Finalmente, en los apéndices dejamos algunos materiales que podrı́an entorpecer el flujo de pen-samiento de los capı́tulos previos si los hubiéramos dejado allı́: enunciados de ciertos teoremas queutilizamos en nuestro análisis, la demostración de un lema técnico, y una breve descrpción de unatécnica de análisis usada en uno de los estudios experimentales.

xi

ÍNDICE GENERAL

Índice general

1. Introducción General 1

1.1. Análisis matemático de resultados experimentales previos . . . . . . . . . . . . . . . 3

1.2. Experimentación sobre cognición matemática . . . . . . . . . . . . . . . . . . . . . 4

1.3. Aplicación a la Educación Matemática . . . . . . . . . . . . . . . . . . . . . . . . . 4

2. Memoria y Aprendizaje 6

2.1. Un contexto de aprendizaje . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

2.2. Presentación del modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

2.2.1. Un modelo clásico: la urna de Pólya . . . . . . . . . . . . . . . . . . . . . . 18

2.3. Análisis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

2.3.1. Selección de estrategias . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

2.3.2. Sobre otros modelos de urnas . . . . . . . . . . . . . . . . . . . . . . . . . 21

xii

ÍNDICE GENERAL

2.3.3. Convergencia en el caso |S| = 1 . . . . . . . . . . . . . . . . . . . . . . . . 23

2.3.4. Convergencia en el caso |S| > 1 . . . . . . . . . . . . . . . . . . . . . . . . 28

2.4. Modificación 1: una estrategia a intervalos irregulares . . . . . . . . . . . . . . . . . 30

2.5. Modificación 2: varias estrategias, con estabilización . . . . . . . . . . . . . . . . . 32

2.6. Simulaciones computacionales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

2.7. Algunos resultados matemáticos relacionados . . . . . . . . . . . . . . . . . . . . . 43

2.7.1. Integración con respecto a convoluciones de Bernoulli . . . . . . . . . . . . 46

2.8. Resumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

2.9. Discusión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

3. Número y proporción 56

3.1. Percepción numérica en animales . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57

3.2. Percepción numérica en humanos . . . . . . . . . . . . . . . . . . . . . . . . . . . 58

3.2.1. Un paréntesis de la Historia de las Matemáticas . . . . . . . . . . . . . . . . 61

3.3. Percepción numérica en bebés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62

3.4. Modelos sobre percepción numérica . . . . . . . . . . . . . . . . . . . . . . . . . . 62

3.4.1. Modelo lineal con variabilidad escalar . . . . . . . . . . . . . . . . . . . . . 64

xiii

ÍNDICE GENERAL

3.4.2. Modelos de escala comprimida . . . . . . . . . . . . . . . . . . . . . . . . . 65

3.4.3. Crı́ticas a ambos modelos . . . . . . . . . . . . . . . . . . . . . . . . . . . 65

3.5. Posible origen evolutivo de una escala comprimida . . . . . . . . . . . . . . . . . . 66

3.5.1. El modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67

3.5.2. Sobre la secuencia de pesos . . . . . . . . . . . . . . . . . . . . . . . . . . 68

3.5.3. Propiedades generales del modelo . . . . . . . . . . . . . . . . . . . . . . . 70

3.5.4. Solución del problema de optimización . . . . . . . . . . . . . . . . . . . . 73

3.5.5. Solución numérica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77

3.6. Una investigación empı́rica sobre proporciones . . . . . . . . . . . . . . . . . . . . 79

3.6.1. Método . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80

3.6.2. Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85

3.6.3. Resumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91

3.7. Discusión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92

3.7.1. Sobre el modelo teórico . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92

3.7.2. Sobre el estudio experimental . . . . . . . . . . . . . . . . . . . . . . . . . 95

4. Una investigación en educación matemática 100

xiv

ÍNDICE GENERAL

4.1. El aprendizaje de fracciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102

4.1.1. Medición de capacidad inhibitoria . . . . . . . . . . . . . . . . . . . . . . . 104

4.2. Sobre inhibición y aprendizaje de fracciones . . . . . . . . . . . . . . . . . . . . . . 106

4.2.1. Metodologı́a . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107

4.2.2. Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115

4.3. Resumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122

4.4. Discusión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123

5. Epı́logo 129

5.1. Estudiar la educación matemática . . . . . . . . . . . . . . . . . . . . . . . . . . . 131

5.2. Reflexión final . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132

A. Convergencia de medias ponderadas 134

B. Convergencia de distribuciones empı́ricas 135

C. Un resultado de independencia condicional 137

D. Técnica de escalamiento unidimensional 139

xv

ÍNDICE DE FIGURAS

Índice de figuras

2.1. Simulación de (Qn) para varias funciones de olvido . . . . . . . . . . . . . . . . . . 41

2.2. Simulación de (Qn) para una función exponencial (30,000 iteraciones) . . . . . . . . 42

2.3. Simulación de (Qn(s)) (modificación 1) . . . . . . . . . . . . . . . . . . . . . . . . 42

3.1. Tiempos de reacción en una tarea de comparación numérica . . . . . . . . . . . . . 59

3.2. Bebés esperan que 1 + 1 sea 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63

3.3. Soluciones numéricas al problema (Pw) . . . . . . . . . . . . . . . . . . . . . . . . 78

3.4. Diseño del material experimental sobre comparación de proporciones . . . . . . . . 82

3.5. Procedimiento experimental . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84

3.6. Resultados generales sobre comparación de proporciones . . . . . . . . . . . . . . . 86

3.7. Resultados segregados por proporciones comparadas . . . . . . . . . . . . . . . . . 88

3.8. Representaciones estimadas por escalamiento unidimensional . . . . . . . . . . . . . 90

xvi

ÍNDICE DE FIGURAS

3.9. Resultados respecto de distancias lineal y logarı́tmica . . . . . . . . . . . . . . . . . 90

3.10. Frecuencia de uso de numerales en Mundurukú . . . . . . . . . . . . . . . . . . . . 94

4.1. Ejemplos de ı́temes del test de Stroop numérico . . . . . . . . . . . . . . . . . . . . 106

4.2. Ejemplos de ı́temes del cuestionario de conocimiento aritmético . . . . . . . . . . . 112

4.3. Ítemes del cuestionario de comprensión del material instructivo . . . . . . . . . . . . 113

4.4. Ejemplos de ı́temes del cuestionario de ordenamiento de fracciones . . . . . . . . . . 114

4.5. Resumen de resultados de los cuestionarios . . . . . . . . . . . . . . . . . . . . . . 116

4.6. Histogramas de los ı́ndices de interferencia y facilitación . . . . . . . . . . . . . . . 118

4.7. Diagrama de dispersión entre cuestionario de fracciones y facilitación . . . . . . . . 120

4.8. Distribuciones de puntajes segregados por variables exógenas al estudio . . . . . . . 121

xvii

ÍNDICE DE CUADROS

Índice de cuadros

2.1. Notación utilizada en el capı́tulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

2.2. Funciones de olvido simuladas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

4.1. Estı́mulos utilizados en el experimento original de Stroop . . . . . . . . . . . . . . . 105

4.2. Listado de ı́temes del cuestionario de conocimiento aritmético . . . . . . . . . . . . 111

4.3. Listado de ı́temes del cuestionario de ordenamiento de fracciones . . . . . . . . . . . 111

4.4. Errores por condición en el test de Stroop numérico . . . . . . . . . . . . . . . . . . 119

xviii

Capı́tulo 1

Introducción General

“Mathematics is the most beautiful

and most powerful creation of the human spirit.

Mathematics is as old as Man.”

— Stefan Banach1

La historia de las Matemáticas ha estado profundamente ligada a la necesidad de los seres humanos

de comprender e interactuar eficazmente con nuestro entorno. Varios de los textos dejados por antiguas

civilizaciones como la babilónica, egipcia o griega (Neugebauer, 1969) dan testimonio de métodos de

cálculo, contabilidad o predicción de ciertos fenómenos climáticos o astronómicos. En la actualidad, la

cantidad de aplicaciones de las matemáticas en las ciencias y otros campos es prácticamente imposible

de cuantificar, haciendo de esta ciencia “pura” la más aplicada de todas.

Algunas disciplinas como la Fı́sica poseen una relación muy fluida con las Matemáticas. En ella se

trabaja habitualmente con el planteo y análisis de modelos matemáticos como parte de las teorı́as. En

1Kałuża (1996, Capı́tulo VIII).

1

otras disciplinas relativamente nuevas, como la Psicologı́a y las Ciencias Cognitivas2, la integración

con las matemáticas se encuentra en una etapa bastante más rudimentaria, utilizándose principalmente

para evaluación estadı́stica de datos experimentales. Esto no excluye que ciertos autores, como por

ejemplo Wickelgren y otros mencionados en el Capı́tulo 2, hayan hecho un uso importante de las

Matemáticas para ciertos análisis teóricos. No obstante, estos autores constituyen una minorı́a aún en

la actualidad.

Un punto que ha influido en esta tendencia parece ser la sobre-especialización del conocimiento

que hemos vivido en el último siglo: en el pasado era mucho más común que la “gente de ciencia” se

interesara en varias disciplinas, y muchos de los grandes personajes eran filósofos y matemáticos a la

vez, además de trabajar en temas relacionados con fı́sica, quı́mica u otras. La tendencia reduccionista

de dedicarse a un área única del conocimiento ha llevado por una parte a un avance impresionante

en ciertos temas, pero también ha minado el diálogo entre disciplinas3 y elevado las barreras de en-

trada entre éstas. En este sentido, las últimas décadas han sido testigo de un redescubrimiento de la

importancia del trabajo interdisciplinar, el que, sin embargo aún encuentra grandes trabas institucio-

nales y culturales para su realización (e.g. Gentile & Boehlert, 2010; Illman & Clark, 2008). En este

contexto se vuelven particularmente relevantes instancias e instituciones que promuevan este tipo de

investigación, como el mismo Centro de Modelamiento Matemático de la Universidad de Chile4.

Los enfoques interdisciplinarios con las matemáticas se vuelven particularmente importantes con

las disciplinas jóvenes, muchas de las cuales nacieron precisamente en la época de la sobre-especiali-

zación.

El punto de partida filosófico de esta tesis es un par de convicciones: una de todo matemático, que

las Matemáticas no son solamente una colección de métodos de cálculo; y otra de todo matemático

aplicado, que éstas son también un camino para descubrir propiedades de los modelos que se pueda

plantear en cualquier disciplina y más aún, que la generación y el estudio de estos modelos son un en-

2Bermúdez (2010) hace una interesante revisión de la “prehistoria” y la historia de las ciencias cognitivas, ubicando losalbores de la primera hacia 1930.

3Metzger & Zare (1999) comentaron esta situación en el contexto de la biologı́a, reconociendo que excelencia cientı́ficay excelencia disciplinar tienden a ser considerados como sinónimos.

4A través del cual el autor del presente documento llegó a encontrarse con las temáticas que conformarı́an su tesisdoctoral.

2

1.1. Análisis matemático de resultados experimentales previos

granaje esencial para mejorar nuestra comprensión de los elementos involucrados y sus interacciones.

En este trabajo nos aproximamos a problemas de cognición general y, particularmente, cognición

numérica desde dos puntos de vista complementarios: el de modelación matemática y el experimental

cognitivo. Éstos constituyen los dos brazos de esta tesis, a los cuales agregamos también un apartado

dedicado a la investigación educativa. A continuación detallamos brevemente estas tres temáticas.

1.1. Análisis matemático de resultados experimentales previos

Esta rama de la tesis se desarrolla en el Capı́tulo 2 y en la primera parte del Capı́tulo 3. Consiste

en la generación y análisis de dos modelos matemáticos, basados en procesos estocásticos discretos

y optimización respectivamente, a partir de la evidencia empı́rica disponible en dos áreas de alto

interés de las Ciencias Cognitivas. La literatura relevante para sustentar cada modelo se presenta en

los respectivos capı́tulos.

La primera temática cognitiva que abordamos en estos modelos es el estudio de la memoria de

largo plazo, ı́ntimamente ligada con el aprendizaje. Los procesos estocásticos discretos nos permiten

el modelamiento y la simulación numérica de la deriva temporal de un recuerdo simple, donde además

estudiamos propiedades asintóticas de esta deriva. Éstas resultan tener consecuencias centrales en la

capacidad de aprendizaje de un agente ideal dotado de una cierta memoria.

El segundo tema es el estudio de las representaciones numéricas internas que observamos no

solamente en seres humanos, sino que también en otros animales, algunos bastante lejanos de nosotros

en la escala evolutiva. Un modelo de optimización nos permite evaluar cuáles de las propiedades

observadas empı́ricamente de estas representaciones numéricas podrı́an ser explicadas por un proceso

de evolución tendiente a maximizar la discriminabilidad entre representaciones distintas.

Ambos modelos son analizados tanto teórica como numéricamente, discutiendo finalmente la re-

levancia y conexión de los resultados obtenidos en el contexto amplio de la literatura que los inspiró.

3

1.2. Experimentación sobre cognición matemática

1.2. Experimentación sobre cognición matemática

Esta segunda veta se trabaja en la parte final del Capı́tulo 3 y en el Capı́tulo 4, aunque este último

lo comentaremos en modo especial en la sección siguiente. En general, el tratamiento de esta parte se

materializa de forma muy similar a la de una publicación cognitiva, detallando los materiales y méto-

dos utilizados para luego dar paso a los resultados experimentales y su análisis estadı́stico, finalizando

con una discusión de éstos.

El punto de partida son los mismos modelos cognitivos de percepción numérica que inspiraron

parte del análisis matemático. Estos modelos en la actualidad se limitan a cantidades enteras (es decir,

números naturales), a pesar de que el formalismo es perfectamente aplicable también a cantidades

racionales. Nos preguntamos entonces si las razones entre enteros tienen representaciones mentales

de similares propiedades. Coloquialmente, podemos decir que nos interesamos en saber si los números

racionales son o no representados en la misma “recta numérica mental” que ha sido propuesta para los

enteros.

La propiedad especı́fica que estudiamos en esta tesis es la noción de distancia más apropiada

entre las representaciones mentales de estas cantidades. En el caso de los enteros, numerosos estudios

han confirmado que la distancia perceptual más apropiada es logarı́tmica, es decir la mejor variable

predictora de los procesos automáticos mentales de comparación numérica es el cuociente entre los

dos comparandos, en lugar de su diferencia. Para evaluar esto en el caso de proporciones de enteros,

usamos un paradigma experimental de comparación de proporciones presentadas en un formato no

simbólico (i.e. sin usar numerales) donde los participantes tienen un tiempo limitado para responder.

1.3. Aplicación a la Educación Matemática

Finalmente, nos aproximamos a uno de los intereses personales del autor de esta tesis: la inves-

tigación educativa. El Capı́tulo 4 detalla una experiencia conducida con niños de tercer año básico,

en la cual tenemos por objetivo evaluar la validez de una teorı́a cognitiva que relaciona la dificultad

4

BIBLIOGRAFÍA

del aprendizaje de ciertos conceptos y operatorias matemáticas con un set de habilidades cognitivas

llamadas capacidades ejecutivas. Esta teorı́a dice, esencialmente, que la capacidad de inhibir estrate-

gias y operatorias aprendidas previamente para dar paso a otras nuevas juega un rol importante en el

aprendizaje matemático. Nosotros circunscribimos esta teorı́a general a un tema cuya dificultad en el

currı́culum educativo lo hace especialmente interesante: el aprendizaje de los conceptos básicos y el

ordenamiento de fracciones.

Bibliografı́a

Bermúdez, J. L. (2010). Cognitive Science: An Introduction to the Science of the Mind. Cambridge

University Press. Pág(s) 2

Gentile, J., & Boehlert, S. (2010). Nurturing young scientists. Science, 329, 884. Pág(s) 2

Illman, D. L., & Clark, F. (2008). Visibility of team science: A case study of media coverage of the

NSF Science and Technology Centers. Science Communication, 30(1), 48–76. Pág(s) 2

Kałuża, R. (1996). Through a reporter’s eyes: The life of Stefan Banach. Birkhäuser. Traductores A.

Kostant, W. Woyczyński. Pág(s) 1

Metzger, N., & Zare, R. N. (1999). Interdisciplinary research: From belief to reality. Science, 283,

642–643. Pág(s) 2

Neugebauer, O. (1969). The Exact Sciences in Antiquity. Dover Publications. Pág(s) 1

5

Capı́tulo 2

Memoria y Aprendizaje

El presente capı́tulo analiza en detalle un modelo de aprendizaje basado en procesos es-

tocásticos discretos, discutiéndolo a la luz de la literatura cognitiva relevante, y com-

parándolo con otros enfoques teóricos previos. Presentamos además simulaciones compu-

tacionales para ilustrar nuestros principales resultados teóricos.

El estudio de la memoria y el aprendizaje fue uno de los puntos de partida del enfoque cientı́fi-

co/experimental en Psicologı́a. Hacia fines del siglo XIX, el alemán Herman Ebbinghaus (Ebbinghaus,

1885/1913) se propuso buscar regularidades en los procesos de recuerdo y aprendizaje. Para ello desa-

rrolló un método inusualmente riguroso para su época, el cual aplicó a sı́ mismo como único parti-

cipante de sus propios estudios1. Para evitar múltiples elementos que podrı́an provocar confusión en

la interpretación de sus resultados, decidió tomar como medida de aprendizaje y recuerdo la cantidad

de tiempo requerida para memorizar, en perfecto orden, listas de sı́labas sin sentido como “FAP” y

“GOK”. Ebbinghaus observó que el tiempo requerido para volver a aprender a perfección una lista era

1Esta situación es considerada subestándar en nuestros dı́as, aunque Ebbinghaus la justificó argumentando que sus estu-dios requerı́an de una modificación tal de su rutina diaria, y de una cantidad tan grande de repeticiones, que no deseaba hacerpasar a nadie más por semejante proceso. Sin embargo, diseñó ingeniosos mecanismos que le permitı́an reducir el impactode esta limitación.

6

menor que el que tomaba la primera vez, incluso cuando la lista hubiera sido aparentemente olvidada

entre ambas sesiones.

La presencia de un cierto patrón en la reducción del tiempo requerido lo llevó a plantear la existen-

cia de una función de ahorro: ésta relaciona el número de veces que una lista ha sido reestudiada con el

tiempo requerido para reaprenderla a perfección2. Junto con observar que esta función era bien apro-

ximada por una potencia de un logaritmo, Ebbinghaus daba el punto de partida para un estudio mucho

más riguroso y metódico de los fenómenos cognitivos y perceptuales de lo que se acostumbrada en

aquel entonces.

Los hallazgos de Ebbinghaus han sido replicados por muchos investigadores, y su explicación

teórica ha sido refinada en varios aspectos. Con el paso del tiempo, el concepto de función de ahorro

dio paso al concepto más amplio de función de olvido, utilizada para cuantificar la fortaleza de un

recuerdo (llamado técnicamente una “traza de memoria”) en un instante dado de tiempo: si f es una

función de olvido, entonces la fortaleza en el instante t2 de un evento ocurrido en el instante t1 < t2está dada por f (t2− t1).

La cantidad de investigación experimental acumulada a través de los años en este tema ha sido

enorme, abarcando diversas escalas de tiempo (por ejemplo, estudios centrados en estudiar retención

de corto o largo plazo) y diversos tipos de participantes (adultos sanos, personas con sı́ndromes que

afectan la memoria, palomas, ratas, etc.). Un denominador común de la casi totalidad de estos estudios

ha sido el buscar la forma más apropiada de “la” función de olvido a través de ajuste estadı́stico de los

datos experimentales obtenidos. Esto llevó a la proposición de una larga lista de funciones candidatas,

entre las cuales siempre han sobresalido dos familias en particular: las funciones exponenciales f (t) =

Aρt (A > 0, ρ ∈ (0,1)), y las funciones potencia f (t) = A(1 + t)−β (A > 0, β ∈ (0,1]).

Algunos trabajos como el de Wickelgren (1974) tuvieron un enfoque primariamente teórico, tra-

tando de derivar la forma de la función de olvido a partir de principios básicos y utilizando el ajuste

estadı́stico de datos como una verificación en lugar de una simple exploración de posibles funciones.

Sin embargo, este tipo de aproximación al problema ha sido claramente minoritaria, quizás marginal.

2Más precisamente, la diferencia de este tiempo con respecto al invertido en el primer estudio de la lista.

7

Esto es un problema, debido a que el estudio experimental tı́pico no considera una cantidad suficiente

de puntos en el eje temporal como para discriminar entre formas funcionales más complejas. Incluso

el mero hecho de discriminar entre dos familias de funciones basado en ajustes estadı́sticos sobre una

cantidad reducida de datos parece ser una empresa de dudoso éxito, como ya algunos investigadores

como White (2001) han hecho notar. White ha sido un abogado de las formas exponenciales para la

función de olvido, argumentando que el proceso de olvido es markoviano3, es decir independiente de

la historia previa dado el estado actual. Definiendo la tasa de olvido δ(t) como

δ(t) =∣∣∣∣∣ f ′(t)f (t)

∣∣∣∣∣ ,una función de olvido exponencial se sustenta en el supuesto de que la tasa de olvido es constante en

el tiempo.

Si bien el modelo exponencial provee una forma funcional simple apoyada por la proposición

de un mecanismo convincente (decaimiento markoviano), ciertos hallazgos experimentales ponen en

duda su uso. Hace más de un siglo, Jost (1897) observó que las memorias pasan por un proceso de

“fortalecimiento” a través del tiempo, en lo que llegarı́a a ser conocida como su segunda ley:

“Dadas dos asociaciones de igual fuerza pero de distinta antigüedad,

la más antigua decae más lentamente durante un intervalo dado de tiempo.” 4

Simon (1966) volvió a traer este elemento a la discusión, observando que la afirmación de Jost

implicaba que δ(t) debı́a ser una función decreciente en el tiempo. Simon propuso ante esto una solu-

ción simple, consistente en tomar funciones de olvido que fuesen combinaciones aditivas de funciones

3Esta naturaleza markoviana puede concebirse a priori en diversos niveles, por ejemplo el psicológico (proceso mentalde olvido de trazas de memoria) y el biológico (proceso neuronal de regreso a un estado basal previo a una estimulación).Es importante tener en mente que no necesariamente el mejor modelo de olvido para un nivel lo es también para el otro.

4“Given two associations of the same strength, but of different ages, the older falls off less rapidly in a given length oftime”, según lo citado por Staddon (2001, p. 139).

8

exponenciales con distintas tasas. Por ejemplo5,

f (t) =n∑

k=1

Akρtk con Ak > 0;0 < ρ1 < . . . < ρn < 1.

Observamos que

δ′ =

∣∣∣∣∣ f ′f∣∣∣∣∣′ = (− f ′f

)′=

f ′2− f ′′ ff 2

. (2.1)

Calculando las derivadas de f , obtenemos

f ′(t) =n∑

k=1

Akρtk logρk y f′′(t) =

n∑k=1

Akρtk[logρk

]2 ,de donde se sigue que

f ′2(t)− f ′′(t) f (t) =∑k, j

AkA j(ρkρ j)t logρk logρ j−∑k, j

AkA j(ρkρ j)t[logρk

]2=

∑k, j

AkA j(ρkρ j)t logρk(logρ j− logρk).

Llamando Ck j = AkA j(ρkρ j)t logρk, continuamos este desarrollo:

f ′2(t)− f ′′(t) f (t) =∑k< j

Ck j(logρ j− logρk) +∑k> j

Ck j(logρ j− logρk)

=∑k< j

Ck j(logρ j− logρk) +∑j>k

C jk(logρk − logρ j),

donde hemos intercambiado los nombres de los ı́ndices en la segunda suma. Ası́,

f ′2(t)− f ′′(t) f (t) =∑k< j

(Ck j−C jk)(logρ j− logρk)

5Simon presentó originalmente el caso con n = 2.

9

= −∑k< j

AkA j(ρkρ j)t(logρ j− logρk)2 < 0.

Sustituyendo esto en la Ecuación (2.1), concluimos que δ(t) es una función estrictamente decre-

ciente. Además,

lı́mt→∞

δ(t) =∣∣∣logρn∣∣∣ > 0.

La solución propuesta por Simon, a pesar de ser eficaz en el proveer una función de olvido con

tasa de decaimiento decreciente, pareciera pecar de conservadora: varios estudios abogan por la uti-

lización de funciones cuyo decaimiento sea claramente más lento que el de las exponenciales, como

es por ejemplo el caso de las funciones potencia. Para éstas, la tasa de olvido (δ(t) = β(1 + t)−1) de-

crece a cero cuando t → ∞. Wixted & Carpenter (2007) han argumentado que un reanálisis de losdatos originales de Ebbinghaus muestra un buen ajuste de parte tanto de las funciones exponenciales

como potencias6, pero que si uno repite los ajustes dejando ciertos puntos fuera, los parámetros de

las funciones exponenciales pueden tener variaciones importantes, mientras que los de las funciones

potencia muestran una mucho mayor estabilidad7.

A pesar de esto, un hecho importante a considerar en esta discusión es la influencia que los pro-

pios métodos de medición y análisis pudieran estar ejerciendo sobre los resultados finales. Anderson

& Tweney (1997) sugirieron que la práctica común de utilizar medias aritméticas para estimar los

valores de la función de olvido en diversos instantes de tiempo podrı́a generar sesgos en los ajustes

estadı́sticos, favoreciendo artificialmente a las funciones potencia. Esencialmente su argumento con-

sistió en mostrar, teóricamente y a través de simulaciones computacionales, que a pesar de que ni las

funciones exponenciales ni las potencias son estables bajo promedios aritméticos, las funciones ex-

ponenciales son las más perjudicadas en este proceso8. De acuerdo a ejemplos presentados por estos

autores, cabe incluso la posibilidad de que un promedio aritmético de valores generados por un mo-

delo exponencial sea mejor ajustado por un modelo potencia. Una condición necesaria para que esta

6Es necesario notar que las funciones exponenciales consideradas por Wixted & Carpenter disponı́an de un parámetroextra: un nivel asintótico c > 0, de modo que la forma funcional discutida en este caso era f (t) = c + Aρt.

7Los datos originales de Ebbinghaus son una de las pocas buenas fuentes que permiten verificar este hecho, dado queincluyó un amplio rango de valores en el eje temporal, que muy pocos estudios posteriores han utilizado.

8Ver también los análisis teóricos más avanzados, en la misma lı́nea, hechos por Anderson (2001); Myung et al. (2000).

10

última situación se dé es que en el promedio aritmético incurran funciones exponenciales con diversas

bases ρ, lo que tiene sentido si uno considera que la práctica estándar involucra promediar valores ob-

tenidos de los distintos participantes (por ejemplo) de un estudio. Ası́, las funciones potencia habrı́an

aparecido como un artefacto del método estadı́stico, el cual podrı́a ser subsanado si los datos fuesen

analizados tomando sus promedios geométricos en vez de aritméticos. Con todo, Wixted & Ebbesen

(1997) presentaron ajustes de datos separados por cada participante, encontrando que incluso antes de

promediar valores las funciones potencia proveı́an una mejor explicación de los datos.

Análisis matemáticos hechos posteriormente, basados en el supuesto de que la retención es el re-

sultado promedio de una infinitud de procesos elementales de olvido, también sugieren que las funcio-

nes potencia pueden aparecer como el resultado promedio del decaimiento de trazas exponenciales:

Kahana & Adler (2002) sugirieron que, si una infinitud de trazas individuales decae siguiendo una

misma forma funcional pero con diversos niveles de “aceleración”, como es el caso de decaimien-

tos exponenciales con diferentes tasas, la proporción de trazas de memoria que en un momento dado

está por sobre un valor umbral decrece asintóticamente como una potencia. Por otra parte, utilizando

transformadas de Laplace, Murre & Chessa (2009) observaron que si las tasas de decaimiento de una

población infinita de trazas que decaen exponencialmente tienen una distribución Gamma, entonces

la fuerza media de la población es exactamente una función potencia. Sin embargo, común a ambos

argumentos es la necesidad de que existan trazas que decaigan con tasas arbitrariamente cercanas a

cero: en el caso de Murre & Chessa, la distribución Gamma puede ser modificada en varios aspectos

manteniendo la validez de sus resultados, excepto el ser truncada en una vecindad de 0; mientras que

Kahana & Adler asumen distribuciones gaussianas restringidas a R+. La existencia de trazas tan re-

sistentes al decaimiento como se desee, una hipótesis crı́tica de estos modelos, está motivada más por

necesidad del argumento que por observaciones biológicas o psicológicas.

Todo esto nos hace volver a un punto ya mencionado previamente: las limitaciones intrı́nsecas

a los estudios experimentales. Éstos son conducidos en un intervalo de tiempo acotado, donde es

difı́cil evaluar verdaderamente el decaimiento de las trazas de memoria9. El trabajo experimental,

además, involucra decisiones de diseño que no siempre influyen de modo simple en los resultados

finales (e.g. ¿debe el participante recordar todos los ı́temes en exactamente el mismo orden en que

9Ver la Figura 5 de Kahana & Adler, 2002, donde se muestra un ajuste casi perfecto de funciones potencia a unaexponencial cuando se considera intervalos de tiempo breves.

11

2.1. Un contexto de aprendizaje

los estudió, o puede hacerlo en el orden que le sea más cómodo?), y el proceso de medición posee

cierto nivel de ruido que le es propio. Una razón de peso a favor de uno u otro modelo difı́cilmente

provendrá de ese mundo. Es por esto que, en este capı́tulo, presentamos una abstracción matemática

que nos permitirá estudiar los aspectos estructurales de los modelos en disputa, dejando fuera la mayor

parte de los aspectos accidentales inherentes a la experimentación.


Desde los inicios del estudio de la memoria, ésta ha sido considerada como esencialmente unida a

los procesos de aprendizaje. Continuando en esta lı́nea, consideramos una tarea simple que se conoce

en la literatura psicológica clásica como “probability learning”. En ésta, un participante observa una

secuencia finita de tiradas de moneda (cara-sello-cara-cara-sello-. . . ), y debe predecir cuál será el re-

sultado de una nueva tirada. Si la secuencia fue generada siguiendo un proceso de Bernoulli, entonces

basta con que el participante estime la probabilidad α de que la moneda caiga ‘cara’ para poder estimar

de mejor modo el nuevo resultado.

Es posible complejizar esta tarea, aumentando el número de monedas disponibles y permitiendo

al participante observar el resultado de sólo una moneda en cada iteración10. En esta situación, la

elección de qué moneda observar en cada etapa puede ser un proceso aleatorio en sı́ mismo, o ser

decidido por el participante en la medida que observa la secuencia. Esta última situación permite

considerar la tarea de probability learning como una abstracción de múltiples procesos de selección

de alternativas, como por ejemplo un proceso de aprendizaje de un agente que dispone de un conjunto

de estrategias, de entre las cuales debe seleccionar una en modo recurrente.

La nomenclatura que usaremos está inspirada en el modelo de resolución estratégico de problemas

inversos de adición planteado por Siegler & Araya (2005). Ellos trabajaron en la modelación compu-

tacional de la resolución de problemas del tipo a + b− c por alumnos de tercer año básico. En el casoespecı́fico en que b = c, los niños poseen dos posibles estrategias para resolver estos problemas, las

10Esta modalidad ha sido efectivamente aplicada en experimentación con personas, y su rendimiento ha sido bastantebueno. Ver por ejemplo Estes (1976, capı́tulo III, experimento 2).

12


cuales difieren esencialmente en el orden en el cual se realizan las operaciones:

Cálculo directo Consiste en calcular (a + b)−b. Ésta es la estrategia natural de partida, debido a quelos niños siempre aprenden a efectuar las operaciones de izquierda a derecha.

Atajo Consiste en calcular a + (b−b). Esta estrategia posee la ventaja de agrupar las operaciones demodo de sólo realizar cálculos de mucha simplicidad11.

Bisanz & LeFevre (1990) propusieron que el tiempo que le toma a un niño de tercero básico

resolver un problema del tipo a + b−b es un buen indicador de la estrategia utilizada. De acuerdo conlos datos de Siegler & Stern (1998), usualmente la estrategia de cálculo directo produce tiempos de

respuesta mayores a 8 segundos, mientras que la estrategia de atajo toma 4 segundos o menos12. Esto

les permitió una estimación de la estrategia utilizada a pesar de que los niños no pudieran explicitar

correctamente su procedimiento cuando se les consultaba.

Si bien con la práctica aritmética la estrategia de atajo se vuelve dominante, tercero básico es

precisamente una época en la cual los niños aún no descubren en modo robusto sus ventajas, cosa

que logran en la medida que resuelvan suficientes ejercicios apropiados. Esta transición, sin embargo,

no es directa: Siegler & Stern (1998) observaron que los niños podı́an descubrir la estrategia de atajo

durante una sesión de ejercicios, para luego aparentemente haberla olvidado al comenzar la próxima.

Esto llevó a Siegler (2005) a proponer la teorı́a de “ondas superpuestas” (overlapping waves), según

la cual la elección de estrategias no se realiza necesariamente en modo optimal, sino que múltiples

estrategias aplicables a un problema dado conviven durante lapsos de tiempo potencialmente largos,

siendo sólo algunas de estas estrategias abandonadas definitivamente.

Considerando que la aritmética mental posee un pequeño margen de error, entonces las estrategias

11Cabe preguntarse si esta estrategia en efecto involucra cálculos. Resolver b−b probablemente involucra un razonamientoconceptual simple por parte de los niños, evitándose el tener que realizar efectivamente la resta.

12Según las mediciones de Siegler & Stern (1998), el 92% de los tiempos de respuesta en niños de tercero básico caeen esta clasificación. El resto puede ser explicado, de acuerdo a Siegler & Araya (2005), como estrategias resultantes dealguna combinación de las dos aquı́ presentadas. Cálculo directo y atajo podrı́an ser denominadas las estrategias básicaspara resolver el problema, mientras que las estrategias combinadas son construidas como composición de trozos de lasestrategias básicas, gracias a la posibilidad de ‘interrumpir’ una estrategia durante su ejecución.

13

2.2. Presentación del modelo

de cálculo directo y atajo pueden ser vistas como tiradas de monedas cargadas, las cuales con una

cierta probabilidad dan la respuesta correcta. También, dado que la estrategia de atajo involucra ope-

raciones (o razonamientos) más simples, es razonable pensar que su probabilidad de error asociada

sea menor. Esta abstracción nos permite ubicar el problema de aprendizaje estratégico en un contexto

de probability learning, donde las monedas o estrategias son seleccionadas en base a su efectividad

estimada. Una primera versión de este modelo fue presentada en la Memoria de Tı́tulo de Ingenierı́a

Civil Matemática de Gómez (2006). En este trabajo ampliaremos ese modelo y sus resultados.


Sea S un conjunto finito y no vacı́o, cuyos elementos son las estrategias (o monedas) entre lascuales un agente puede elegir para resolver un problema dado. Cada una de estas estrategias s ∈ Sposee una probabilidad de éxito asociada α(s) ∈ (0,1).

La mecánica del modelo es la siguiente: en cada etapa n ≥ 1, el agente elige una estrategia sn ∈ S,la cual produce un resultado Xn. Éste puede ser 1 (‘éxito’) o 0 (‘fracaso’). Observando este resultado,

el agente pasa a la etapa n + 1, donde debe elegir nuevamente otra estrategia, incorporando la nueva

información de que dispone.

Formalmente, consideraremos dos secuencias aleatorias: (sn : n ≥ 1) ⊆ S la secuencia de estra-tegias elegidas, y (Xn : n ≥ 1) ⊆ {0,1} la secuencia de resultados de la aplicación de las estrategias.Asumiremos que el resultado de la ejecución de una estrategia depende solamente de la estrategia

elegida, independientemente de la historia previa. Si denotamos la historia hasta el tiempo n por

Hn = σ(sk,Xk : 1 ≤ k ≤ n), esto significa que

P(Xn = 1|sn,Hn−1) = P(Xn = 1|sn) = α(sn) (n ≥ 1). (2.2)

Para poder plantear la ley condicional de elección de estrategias, requerimos dotar a los agentes

de algún tipo de ı́ndice basado en su historia. Dada una estrategia s ∈ S, un estimador simple de su

14


probabilidad de éxito dada la historiaHn−1 puede ser la media∑n−1k=1 I {sk = s}Xk∑n−1

k=1 I {sk = s}∈ [0,1], (2.3)

donde I(A) es la función indicatriz del evento A.

A pesar de ser simple de analizar y gozar de varias propiedades, esta media simple no responde

bien a nuestro deseo de modelar un agente real (persona o animal). La razón es que en (2.3) todas las

observaciones Xk poseen el mismo peso relativo, en tanto que la investigación psicológica y la vida

diaria nos sugieren que las observaciones más recientes (aquéllas con k ≈ n) debieran tener un mayorpeso relativo que las más lejanas (ésas con k� n).

Para subsanar este problema recurriremos a medias ponderadas en lugar de la media simple, y es

aquı́ donde nos ayudará el concepto de función de olvido introducido previamente. Diremos que una

función suave13 f : R+ → R+ es una función de olvido si es decreciente (no necesariamente decre-cimiento estricto) y, sin pérdida de generalidad, se tiene que f (0) = 1. Como ya hemos mencionado,

interpretaremos f (n− k) como la fortaleza en la etapa n del recuerdo de una unidad de informaciónadquirida en la etapa k. Nuestro agente, entonces, utilizará el estimador

Qn(s) =∑n−1

k=1 f (n− k)I {sk = s}Xk∑n−1k=1 f (n− k)I {sk = s}

∈ [0,1], (2.4)

el cual es una funciónHn−1-medible. Para evitar el problema técnico de que esta expresión se indefinepara las combinaciones (n, s) donde la estrategia s no ha sido elegida antes de la etapa n, modificaremos

esta definición previa a

Qn(s) =f (n)α0(s) +

∑n−1k=1 f (n− k)I {sk = s}Xk

f (n) +∑n−1

k=1 f (n− k)I {sk = s}∈ [0,1]. (2.5)

Esto equivale a asumir que, antes de ser elegida por primera vez, cada estrategia posee una esti-

13La gran mayorı́a de los ejemplos dados en la literatura son funciones de clase C∞, aunque también se usa a vecesfunciones derivables por trozos. En cualquier caso, dado que nuestro análisis es a tiempo discreto, los resultados valentambién para funciones más generales dado que la suavidad se vuelve irrelevante.

15


mación basal de efectividad (o nivel basal de ‘confianza’ en la estrategia) dada por α0(s) > 0.

Basado en estimaciones de efectividad muy similares a la aquı́ propuesta, Gómez (2006) consi-

deró dos posibles protocolos de selección de estrategias:

Elegir en cada etapa n la estrategia s cuyo estimador Qn(s) es máximo. Este protocolo responde

a la suposición de un agente racional, que maximiza la probabilidad condicional de éxito de

acuerdo a su historia previa.

Elegir en cada etapa n una estrategia s aleatoriamente, con una probabilidad condicional pro-

porcional a Qn(s). Este protocolo fue utilizado por Siegler & Araya (2005) como una posible

implementación de la teorı́a de ondas superpuestas propuesta por Siegler (2005).

Gómez (2006) realizó un primer análisis de estos modelos. Para nuestro trabajo presente, debido

a nuestra inspiración estratégica tomada de Siegler & Araya (2005), nos concentraremos sólo en el

segundo protocolo. Éste dice, más precisamente, que la probabilidad de elegir la estrategia s en la

etapa n está dada por

P(sn = s|Hn−1) = Q̂n(s) ≡Qn(s)∑

z∈SQn(z). (2.6)

Antes de continuar con el análisis y discusión del modelo, en la Tabla 2.1 damos un resumen de la

notación utilizada, para facilitar la lectura de esta sección.

16


S Conjunto de estrategiasS∞ Conjunto (aleatorio) de todas las estrategias que son elegidas infinitas vecesα(s) Tasa de éxito asociada a la estrategia s ∈ Sα Valor de α(s) en el caso en que el agente dispone de una sola estrategia

α0(s) Valor a priori que el agente asume para su estimación de α(s)α0 Valor a priori que el agente asume para su estimación de α (caso de una sola estrategia)

f Función de olvido (suave, decreciente y f (0) = 1)f (t2− t1) Fortaleza en el instante t2 del recuerdo de un evento ocurrido en el instante t1

(sn : n ≥ 1) Secuencia de estrategias elegidas por el agente(Xn : n ≥ 1) Secuencia de resultados de la aplicación de las estrategias (0: fracaso, 1:éxito)Hn σ-álgebra generada por la historia del agente hasta la etapa n: σ(s1,X1, . . . , sn,Xn)

Qn(s) Estimación de α(s) hecha por el agente en la etapa nQn Estimación de α, en el caso en que el agente dispone de una sola estrategia

Q̂n(s) Estimación normalizada sobre S: Qn(s)/∑

z∈SQn(z)τk(s) Instante en el cual la estrategia s es usada por la k-ésima vezXk(s) Resultado obtenido en la k-ésima aplicación de la estrategia s: Xτk(s)

µ [Modificación 1] Probabilidad de utilizar la estrategia dada en un instante de tiempoT [Modificación 2] Instante a partir del cual el agente no continúa actualizando

sus estimadores Qn(s)

m∧n Mı́nimo entre m y nI(A) Función indicatriz del evento AP(A) Probabilidad del evento AE(F) Valor esperado de la función F

Cuadro 2.1: Resumen de la notación utilizada en el capı́tulo.

17


2.2.1. Un modelo clásico: la urna de Pólya

El modelo de Pólya que presentamos en esta sección es un elemento que no podemos dejar de

mencionar, ya que podrı́a representar una alternativa para modelar la situación de aprendizaje que

deseamos trabajar en este capı́tulo. Luego de describirlo brevemente, sin embargo, observaremos cier-

tas diferencias entre este modelo y el por nosotros presentado, respecto de su idoneidad para nuestra

aplicación.

La urna de Pólya es una urna que contiene inicialmente r bolas rojas y a bolas azules. En cada

etapa, se extrae una bola al azar de la urna. Esta bola se devuelve, y además se añade a la urna una

bola extra del mismo color de la extraı́da. De este modo, el número de bolas en la urna crece en cada

etapa. Pólya mostro que si Rn es el número de bolas rojas en la urna después de n iteraciones de este

proceso, entonces (n + r + a)−1Rn es una martingala cuya distribución converge a una beta.

Formalmente, hay a priori dos modos principales en los cuales nuestro modelo podrı́a compararse

a una urna de Pólya, sin embargo veremos que ambas posibilidades presentan dificultades.

Una opción es considerar el caso en que el agente dispone de sólo una estrategia (es decir el caso

|S| = 1), la cual podemos asimilar a una urna. El historial de éxitos y fracasos de esta estrategiaserı́a, entonces, la cantidad de bolas rojas y azules que la urna contiene. En la situación que

modelamos, sin embargo, hemos asumido que la probabilidad de que al historial se agregue un

éxito o fracaso es un valor constante α, es decir que no depende del historial mismo (i.e. del

contenido de la urna).

Otra posibilidad es pensar los colores rojo y azul de la urna de Pólya como dos estrategias

separadas. De este modo, la elección de una estrategia por sobre la otra en un momento dado se

realiza proporcionalmente a una función del historial de cada estrategia, como plantea el modelo

de Pólya. No obstante, esta analogı́a no considera el hecho que en el proceso de aprendizaje que

estudiamos, cada estrategia contiene en su historial éxitos y fracasos, requiriendo una mayor

información que la mera cantidad de uso de cada estrategia.

18

2.3. Análisis

2.3. Análisis

Sobre la selección de estrategias, mostramos que el trabajo realizado por Gómez (2006) en su

Teorema 5.1 se puede extender sin mayores modificaciones a contextos más generales, probando que

toda estrategia es elegida infinitas veces (Gómez trabajó solamente el caso especı́fico de funciones de

olvido exponencial y potencia). Luego, ponemos el acento en ampliar los resultados de convergencia

de los estimadores (Qn(s)).

2.3.1. Selección de estrategias

Teorema 1. Supongamos que una de las siguientes condiciones se cumple:

(I) La función de olvido f satisface ∑n≥0

f (n)∑nk=0 f (k)

= +∞.

(II) La función f es exponencial, es decir existe una constante ρ ∈ (0,1) tal que f (t) = ρt.

Entonces, todas las estrategias en S son elegidas infinitas veces, con probabilidad 1.

Demostración. La demostración de la suficiencia de la condición (I) seguirá los mismos pasos que

el Teorema 5.1 de Gómez (2006). Denotemos por S∞ ⊆ S el conjunto (en principio aleatorio) deestrategias que son elegidas infinitas veces. Entonces, dada s ∈ S:

P(s < S∞) = P((∃N ≥ 1)sn , s para todo n ≥ N).

19

2.3. Análisis

Por la monotonı́a de los eventos involucrados, concluimos que

P(s < S∞) = lı́mn→∞

lı́mk→∞P(An,k),

definiendo An,k como el evento en que sn , s, . . . , sn+k , s.

Supongamos que la propiedad (I) es cierta. Entonces, en An,k se tiene que

Qn+k(s) =f (n + k)α0(s) +

∑n−1i=1 f (n + k− i)I {si = s}Xi

f (n + k) +∑n−1

i=1 f (n + k− i)I {si = s}

≥ α0(s)f (n + k)∑n+k

i=0 f (i).

Por comodidad de notación, llamemos un = f (n)/∑n

i=0 f (i).

Ası́, en el evento An,k:

Q̂n+k(s) =Qn+k(s)∑

z∈SQn+k(z)≥ Qn+k(s)

Qn+k(s) + (|S|−1)

≥ α0(s)un+kα0(s)un+k + (|S|−1)

= 1− (|S|−1)α0(s)un+k + (|S|−1)

De este modo, podemos calcular

P(An,k+1) = P({sn+k+1 , s}∩An,k)

= E(I(An,k)P(sn+k+1 , s|s1, . . . , sn+k)

)= E

(I(An,k)E(P(sn+k+1 , s|Hn+k)|s1, . . . , sn+k)

)= E

(I(An,k)E(1− Q̂n+k(s)|s1, . . . , sn+k)

)≤ (|S|−1)

α0(s)un+k + (|S|−1)P(An,k).

20

2.3. Análisis

Con esta cota, obtenemos que

P(An,k)P(An,0)

≤k−1∏i=0

(|S|−1)α0(s)un+i + (|S|−1)

=

k−1∏i=0

(1− α0(s)un+i

α0(s)un+i + (|S|−1)

)

≤k−1∏i=0

(1− α0(s)un+i|S|

)≤

k−1∏i=0

exp(−α0(s)un+i|S|

)

= exp

−α0(s)|S|k−1∑i=0

un+i

y concluimos que P(An,k) converge a cero cuando k→∞, lo que implica el resultado deseado.

(II) es el caso especı́fico de la función exponencial, que fue ya demostrado directamente por

Gómez (2006). �

2.3.2. Sobre otros modelos de urnas

Antes de continuar con el análisis de nuestro modelo, revisitaremos nuestro resultado sobre selec-

ción de estrategias de la sección anterior a la luz de otros modelos que se encuentran en la literatura,

especı́ficamente con ciertas generalizaciones de la urna de Pólya presentada en la Sección 2.2.1, como

lo son los procesos de bolas en urnas con feedback (ver, por ejemplo, Mitzenmacher et al., 2004; Oli-

veira, 2008, 2009). Estos procesos pueden ser pensados como una urna de Pólya en la cual hay bolas

de K colores distintos, y donde la probabilidad de extraer una bola de un color dado es proporcional a

una función F de las cantidades de bolas de cada color en la urna. Es decir, la probabilidad de elegir

una bola de color c ∈ {1, . . . ,K} está dada por

F(nc)∑Ki=1 F(ni)

,

donde ni es el número de bolas de color i presentes en la urna.

Como ya mencionamos al describir la urna de Pólya, una diferencia crucial entre nuestro modelo

21

2.3. Análisis

y los aquı́ considerados es que el primero utiliza selección proporcional a una media ponderada de los

éxitos de la estrategia, mientras que los segundos lo hacen proporcionalmente a la cantidad de veces

que ésta ha sido utilizada.

Si bien en este capı́tulo consideramos solamente el caso de proporcionalidad exacta, es decir to-

mando F la función identidad, Oliveira y otros han estudiado con particular interés el caso en que

F(x) = xp, con p > 1. En este caso, se sabe que uno de los colores obtiene un monopolio, es decir

existe casi seguramente un momento a partir del cual siempre se extrae bolas del mismo color. Esta

conclusión marca una diferencia con nuestros resultados, donde vemos que que toda estrategia es ele-

gida infinitas veces con probabilidad uno. Observamos, además, que esto no se debe a la presencia de

la función F especı́fica considerada en la literatura, puesto que podrı́amos modificar la ley condicional

de (sn) presentada en (2.6) por

P(sn = s|Hn−1) =F(Qn(s))∑

z∈SF(Qn(z)),

y en esta nueva situación la demostración que hemos dado para el Teorema 1 es también válida (casi

sin modificaciones) para demostrar que toda estrategia se elige infinitas veces con probabilidad uno

para toda función F tal que cumpla (conjuntamente con la función de olvido f )

∑n≥0

F(

f (n)∑nk=0 f (k)

)= +∞. (2.7)

Para hacer más clara nuestra comparación con los modelos de bolas en urnas con feedback, deja-

mos de lado nuestra función de olvido, tomando f (n) ≡ 1. De este modo, la Ecuación (2.7) se reducea ∑

n≥1F(n−1) = +∞,

lo que es fácil ver que se cumple para toda función F(x) = xp con p ∈ (0,2). Con esto, vemos quepara p ∈ (1,2) se tiene que elegir proporcionalmente a la tasa de éxito de una estrategia implica queésta será elegida infinitas veces casi seguramente, a diferencia de los modelos de bolas en urnas con

feedback, en los cuales, con probabilidad uno, una urna obtiene el monopolio en el largo plazo.

22

2.3. Análisis

2.3.3. Convergencia en el caso |S| = 1

Cuando hay sólo una estrategia disponible la secuencia (sn) se vuelve trivial, de modo que la única

ley de probabilidad de importancia en este caso es

P(Xn = 1|X1, . . . ,Xn−1) = α,

que se obtiene de la Ecuación (2.2), si denotamos α ≡ α(s) con s el único elemento de S (en lo queresta de esta sección, simplemente omitimos las referencias a s). Esta última expresión muestra inme-

diatamente que (Xn) es ahora una secuencia i.i.d.de variables aleatorias, lo cual nos permitirá trabajar

con bastante libertad. Veremos que en este caso, condiciones sobre el decaimiento de la función de

olvido f nos permiten obtener conclusiones directas respecto de la convergencia de los estimadores

(Qn), los cuales se reducen a la expresión

Qn =f (n)α0 +

∑n−1k=1 f (n− k)Xk

f (n) +∑n−1

k=1 f (n− k)=

f (n)α0 +∑n−1

k=1 f (n− k)Xk∑nk=1 f (k)

(2.8)

El siguiente Teorema presenta un primer par de resultados, válidos para cualquier función de

olvido f .

Teorema 2. Se tiene que:

1. El valor esperado de (Qn) converge a α.

2. La probabilidad de que (Qn) converja es o bien 0, o bien 1.

Demostración. A través de un cálculo simple, obtenemos que E(Qn) puede escribirse como λnα0 +

(1−λn)α, conλn =

f (n)∑nk=1 f (k)

.

Observamos que si∑

k≥1 f (k) = L < +∞, entonces f (n) converge a cero cuando n→∞, y lo mismo

23

2.3. Análisis

ocurre con λn. Por el contrario, si∑

k≥1 f (k) = +∞, entonces nuevamente obtenemos que λn convergea cero, ya que f (n) ≤ f (0) = 1. De esto se sigue directamente la afirmación (1).

La propiedad (2) se demuestra en modo análogo a la Ley 0-1 clásica de Kolmogorov, notando que

el argumento del párrafo anterior nos permite también demostrar que, para cualquier n0 fijo,

lı́mn→∞

f (n)α0 +∑n0

k=1 f (n− k)Xk∑nk=1 f (k)

≤ lı́mn→∞

n0∑k=0

λn−k = 0.

De esto se desprende que la convergencia de (Qn) es un evento de la σ-álgebra cola de la secuencia

(Xk), la cual es i.i.d.. Ası́, este evento debe tener probabilidad o 0 ó 1. �

Dados estos primeros resultados, observamos que el espacio de funciones de olvido puede ser

particionado en las funciones que aseguran, y las que impiden, la convergencia de (Qn) (es decir, las

funciones f para las cuales la probabilidad de convergencia vale 1 ó 0, respectivamente). Los siguien-

tes resultados nos darán luces acerca de cuál situación es la que corresponde para ciertas familias de

funciones.

Funciones de olvido de serie finita

Teorema 3. Supongamos que la función de olvido f es tal que∑k≥0

f (k) = L < +∞.

Entonces 0 y 1 son, casi seguramente, puntos de acumulación de (Qn).

Demostración. Sea δ > 0 pequeño, y elijamos p > 1 tal que∑

k>p f (k) < δ. Gracias a la independencia

24

2.3. Análisis

de (Xk), el Lema de Borel-Cantelli nos asegura que con probabilidad uno, para infinitos valores de

n > p se tiene

Xn−p = . . . = Xn−1 = 1. (2.9)

Para cada uno de estos valores de n, se cumple

Qn =f (n)α0 +

∑n−1k=1 f (n− k)X(n− k)∑n

k=1 f (k)

=f (n)α0 +

∑n−p−1k=1 f (n− k)X(n− k) +

∑pk=1 f (k)∑n

k=1 f (k)

≥ 1L

p∑k=1

f (k) >L−δ

L= 1− δ

L.

De aquı́, concluimos que (Qn) se acumula en 1. La acumulación en 0 se demuestra análogamente,

tomando una subsecuencia de valores de n para los cuales Xn−p, . . . ,Xn−1 valgan todos cero (cuya

existencia está garantizada, nuevamente, por el Lema de Borel-Cantelli). �

Observación 1. Hemos elegido esta forma de enunciar el teorema de modo de poder extenderlo singrandes modificaciones a otras situaciones que estudiaremos en las próximas secciones. Sin embargo,

la demostración del Teorema 3 aquı́ presentada puede ser ajustada fácilmente de modo de ver que a =1L∑n0

k=0 akρk es también un punto de acumulación de (Qn), para cualquier n0 ≥ 0 y cualquier secuencia

a0, . . . ,an0 de ceros y unos. La demostración consiste en tomar en la Ecuación (2.9) una secuencia no

de unos, sino una secuencia compuesta que inicie con ceros y luego continúe con an0 ,an0−1, . . . ,a1,a0.

El largo de la secuencia de ceros establecerá cuán cerca de a se encontrará el valor ası́ construido

de Qn.

Funciones de olvido de lento decaimiento

Diremos que una función de olvido f es de lento decaimiento si existe un C > 0 tal que f (t) ≥C(1 + t)−1 para todo t ≥ 0.

25

2.3. Análisis

Lema 1. Si f es una función de lento decaimiento, el cuociente

Rn =∑n

k=1 f (k)2 · logn(∑n

k=1 f (k))2

converge a cero cuando n→∞.

Demostración. El caso en que lı́mt→∞ f (t) = µ > 0 es directo, ya que en este caso

Rn ≈nµ2 logn

(nµ)2=

lognn

.

Supongamos ahora que f decrece a cero. A partir de la definición de lento decaimiento, obtenemos

que para todo t ≥ 0 ∫ t0

f ≥C log(1 + t) (2.10)

y, en particular, que∫ ∞

0 f = +∞.

Supongamos que∫ ∞

0 f2 = K < +∞. Entonces, usando la Ecuación (2.10) vemos que

lı́mt→∞

∫ t0 f

2 log t(∫ t0 f

)2 ≤ lı́mt→∞ KC ∫ t0 f = 0.

Si, por el contrario, tuviéramos que∫ ∞

0 f2 =∞, entonces tenemos

lı́mt→∞

∫ t0 f

2 log t(∫ t0 f

)2 ≤C−1 lı́mt→∞∫ t

0 f2∫ t

0 f,

donde este último lı́mite es una forma indeterminada, la cual podemos calcular usando la regla de

26

2.3. Análisis

L’Hôpital:

lı́mt→∞

∫ t0 f

2∫ t0 f

= lı́mt→∞

f 2(t)f (t)

= lı́mt→∞

f (t) = 0.

Con esto, y haciendo uso de las desigualdades∫ n0

g−1 ≤n∑

k=1

g(k) ≤∫ n

0g

válidas para cualquier función de olvido g, calculamos finalmente

lı́mn→∞

Rn ≤ lı́mn→∞

∫ n0 f

2 logn(∫ n0 f −1

)2 ≤ lı́mn→∞∫ n

0 f2 logn(∫ n

0 f)2 ·

∫ n

0 f∫ n0 f −1

2

= 0,

gracias a la Ecuación (2.10) y el hecho que el segundo factor de la última expresión es acotado. �

Teorema 4. Supongamos que la función de olvido f es de lento decaimiento. Entonces (Qn) convergea α casi seguramente.

Demostración. Sea ank = f (n− k)/∑n

k=1 f (k). Podemos, entonces, escribir

Q̃n ≡ Qn−E(Qn) =n−1∑k=1

ank(Xk −E(Xk)).

Para demostrar la convergencia casi segura de (Q̃n) a cero, utilizaremos el Teorema 1 de Giuliano

Antonini et al. (2001), cuyo enunciado presentamos en el Apéndice A. Las condiciones que no se

siguen directamente del hecho que (Xk −E(Xk)) es una secuencia uniformemente acotada, son:

i. El conjunto {ank logn : n ≥ 1,1 ≤ k ≤ n} debe ser acotado. Esto es consecuencia directa de que fsea una función de lento decaimiento, ya que en tal caso ank logn está acotado por una constante.

27

2.3. Análisis

ii. La sucesión (∑n−1

k=1 a2nk logn) debe converger a cero. Notamos, sin embargo, que esta sucesión es

igual a (Rn), la cual hemos definido y demostrado su convergencia a cero en el Lema 1.

Con esto, Giuliano Antonini et al. (2001) nos asegura que la sucesión (Q̃n) converge completa-

mente a cero14. Es sabido que la convergencia completa implica la convergencia casi segura (gracias

al Lema de Borel-Cantelli, ver también Chung, 2001, Teoremas 4.2.1 y 4.2.2), y uniendo esto al hecho

que E(Qt) −→ α cuando t→∞ gracias al Teorema 2, hemos completado la demostración. �

2.3.4. Convergencia en el caso |S| > 1

En este caso general, la secuencia (Xk) ya no es i.i.d., debido a que X1, . . . ,Xn inciden en el valor

de sn+1, quien influirá a su vez en el valor de Xn+1. Sin embargo Gómez (2006) mostró, usando una

técnica que utilizaba tiempos de parada, que ciertas subsucesiones aleatorias de (Xk) son en efecto

i.i.d., lo cual le permitió extender parte de sus resultados a este caso.

Definamos, entonces, dada una estrategia s ∈ S,

τ1(s) = mı́n{k ≥ 1 : sk = s},τn+1(s) = mı́n{k > τn(s) : sk = s}.

Es bien sabido que para cada n≥ 1 y s ∈ S, τn(s) es un tiempo de parada con respecto a la filtraciónZn = σ(s1, . . . , sn). Si s es elegida infinitas veces, entonces τn(s) es finito para todo n ≥ 1, y podemosdefinir Xk(s) = Xτk(s) para todo k ≥ 1.

Gómez (2006, Sección 4.1) demostró que, bajo la hipótesis de que s ∈ S es elegida infinitas vecescon probabilidad uno, entonces (Xk(s)) es una secuencia infinita, i.i.d., con distribución Bernoulli de

parámetro α(s). En esta sección, veremos que un argumento casi idéntico al del caso |S| = 1 permite14Decimos que una secuencia aleatoria (Wk) converge completamente a cero si y solamente si para cualquier ε > 0, la

suma∑

k P(|Wk | > ε) es convergente. Esta definición fue introducida por Hsu & Robbins (1947).

28

2.3. Análisis

demostrar la no-convergencia de (Qn(s)) en esta situación más general. Recordemos que S∞ es elconjunto de estrategias que son elegidas infinitas veces.

Teorema 5. El Teorema 3 (no-convergencia para las funciones de olvido de suma finita) es tambiénválido en el caso |S| > 1, para cada estrategia s tal que s ∈ S∞ casi seguramente. Es decir, si s ∈ S esuna tal estrategia, entonces tanto 0 como 1 son puntos de acumulación de (Qt(s)) con probabilidad

uno.

Demostración. Sea s una estrategia tal que s ∈ S∞ con probabilidad uno. Definamos N(n) como elnúmero de veces que s ha sido elegida hasta la etapa n, es decir N(n) = ∑nk=1 I {sk = s}. Haciendo usode esta notación, observamos que Qn(s) puede ser escrito como

Qn(s) =α0(s) f (n) +

∑N(n−1)j=1 f (n−τ j(s))X j(s)

f (n) +∑N(n−1)

j=1 f (n−τ j(s)).

Siguiendo el mismo hilo conductor del Teorema 3, dado cualquier p > 1 aplicamos el Lema de

Borel-Cantelli a la secuencia i.i.d. (Xk(s)) para obtener que con probabilidad uno, y para infinitos

valores de n > p: Xn−p(s) = . . . = Xn−1(s) = 1.

Sea entonces m = 1 +τn−1(s). Con esto, como N(m−1) = n−1, se tiene que

Qm(s) =α0(s) f (m) +

∑n−p−1j=1 f (m−τ j(s))X j(s) +

∑n−1j=n−p f (m−τ j(s))

f (m) +∑n−p−1

j=1 f (m−τ j(s)) +∑n−1

j=n−p f (m−τ j(s))

≥α0(s) f (m) +

∑n−1j=n−p f (m−τ j(s))

f (m) +∑n−p−1

j=1 f (m−τ j(s)) +∑n−1

j=n−p f (m−τ j(s))

≥ f (1)f (m) +

∑n−p−1j=1 f (m−τ j(s)) + f (1)

.

29

2.4. Modificación 1: una estrategia a intervalos irregulares

Notamos también que si l ≥ k entonces τl(s)−τk(s) ≥ l− k, con lo cual

f (m) +n−p−1∑

j=1

f (m−τ j(s)) ≤ f (m) +n−p−1∑

j=1

f (n− j) ≤∑j>p

f ( j).

Ası́, recordando que f (1) ≤ 1, concluimos que si p es elegido de modo que esta última sumatoriasea menor que un δ > 0 dado, se tiene que para infinitos valores de m

Qm(s) ≥1

δ+ 1≥ 1−δ,

lo que concluye la demostración. De modo análogo se demuestra la acumulación en 0. �

En las siguientes secciones, abordaremos dos modificaciones del modelo que hemos presentado,

con las cuales perseguimos aproximarnos más a ciertas situaciones psicológicamente comunes: por

una parte, en el dı́a a dı́a las aplicaciones de una estrategia dada no suelen estar separadas por lapsos

de tiempo de igual duración. Siendo una suposición válida para entornos experimentales pero no tanto

para la realidad cotidiana donde se desenvuelve casi la totalidad de nuestro aprendizaje, cabe pregun-

tarse si nuestros resultados de aprendizaje siguen siendo válidos al relajarla. La segunda modificación

concierne el hecho sabido que, al dedicarnos continuamente a una tarea repetitiva, nuestro nivel de

recursos cognitivos dedicados a la misma decae (es decir, la tarea se automatiza). Dado esto, estu-

diaremos qué ocurre en el modelo con varias estrategias cuando el agente detiene su mecanismo de

actualización de las variables (Qn(s)) en un instante dado, manteniendo sus probabilidades de elección

constantes a partir de ese momento.


Para revisar la validez de nuestros resultados en el caso en que las aplicaciones de una estrategia

no se encuentran equiespaciadas en el tiempo, en esta sección consideraremos que no en toda etapa

30


n el agente puede observar el resultado Xn. Esto le estará permitido sólo en una selección de valores

para n.

Para lograr esto, modificamos levemente nuestro modelo de varias estrategias del modo siguiente.

Tomemos S = {s, s̄}, donde s es la estrategia cuya efectividad α(s) deseamos estimar, y s̄ es un ele-mento de juguete, que utilizamos simplemente para representar la no elección de s. En este contexto,

consideramos que más que elegir o no la estrategia s, el agente observa una nueva observación (Xk), o

se le presenta la necesidad de usar esa estrategia, cada vez que sn = s. En este tratamiento, suponemos

que la secuencia (sn) es i.i.d.e independiente de Hn−1, con P(sn = s) = µ ∈ (0,1). Esto tiene sentido sise considera que la oportunidad de observar una nueva variable (Xk) es dependiente del contexto, en

lugar que del agente.

Definamos Yn = I {sn = s}Xn. Tenemos que

P(Yn = 1|Y1, . . . ,Yn−1) = E(P(Yn = 1|sn,Hn−1)|Y1, . . . ,Yn−1)= E(I {sn = s}P(Xn = 1|sn,Hn−1)|Y1, . . . ,Yn−1)= E(I {sn = s}α(sn)|Y1, . . . ,Yn−1)= α(s)P(sn = s|Y1, . . . ,Yn−1)= α(s)µ.

por lo que (Yn) es también una secuencia i.i.d., con distribución Bernoulli de media α(s)µ.

Con esto, en el caso en que la función de olvido f es de lento decaimiento, podemos aplicar el

Teorema 4 a las secuencias (Yn) e (I {sn = s}), obteniendo que con probabilidad uno

lı́mn→∞

f (n)α0(s) +∑n−1

k=1 f (n− k)Yn∑nk=1 f (n)

= α(s)µ

lı́mn→∞

f (n) +∑n−1

k=1 f (n− k)I {sn = s}∑nk=1 f (n)

= µ

y, dividiendo ambas expresiones, concluimos que (Qn(s)) converge casi seguramente a α(s).

31

2.5. Modificación 2: varias estrategias, con estabilización

Con respecto al resultado de no-convergencia para funciones de olvido de suma finita, hacemos

notar que podemos aplicar exactamente el mismo argumento ya dado en la Sección 2.3.4 para el caso

|S| > 1. En efecto, la secuencia (τk(s)) es precisamente el conjunto de etapas en las que el agenteobserva Xn. Esto genera una secuencia (Xk(s)) efectivamente infinita, gracias a la Ley de los Grandes

Números que nos dice que con probabilidad uno

lı́mn→∞

1n

n∑k=1

I {sk = s} = µ > 0,

es decir s ∈ S∞ casi seguramente.

Con esto, Gómez (2006, Sección 4.1) nos asegura que nuevamente (Xk(s)) es una secuencia i.i.d.,

y ası́ la demostración del Teorema 5 se aplica sin modificaciones.


Para comenzar, observamos que si modificamos la ley condicional de elección de estrategias dada

en la Ecuación (2.6) a

P(sn = s|Hn−1) = µ(s)

donde µ(s) > 0,∑

z∈Sµ(z) = 1, son probabilidades fijas, entonces la secuencia (sn) se vuelve inmedia-

tamente i.i.d., con lo cual nos podemos reducir al caso de la Modificación 1 presentado en la sección

anterior si consideramos separadamente cada estrategia s ∈ S, elegida con probabilidad µ(s) y no ele-gida con probabilidad 1− µ(s). Esto nos dice que valen en esta situación tanto el Teorema 3 sobrefunciones de olvido sumables, como el Teorema 4 sobre funciones de olvido de lento decaimiento, y

esta vez para todos los elementos de S (además, S∞ =S casi seguramente). Es decir, si asumimos quela ley condicional de (sn) es constante, reobtenemos los buenos resultados de los casos con una única

estrategia.

En lo que resta de esta sección vemos que éste es también el caso cuando suponemos que la ley

condicional de (sn) se estabiliza, es decir se hace constante, a partir de un tiempo T aleatorio. Este

32


tiempo T lo podemos considerar como un instante decidido por el a

Date post:	13-Feb-2021
Category:	Documents
Upload:	others
View:	1 times
Download:	0 times

Estudios experimentales y de modelacion en aprendizaje y … · 2011. 5. 10. · CMM: Grecia...

Documents