Aprendizaje de un solo estímulo Habituación y sensibilización.pdf

Tema 2: Aprendizaje de un solo estímulo: Habituación y sensibilización

LA NATURALEZA DE LA CONDUCTA ELICITADA

Todos los animales reaccionan a los eventos que tienen lugar en su entorno (comida en la boca= sabor, polvo en el ambiente = estornudo, superficie caliente = retirar la mano).

Gran parte de la conducta tiene lugar como respuesta a los estímulos, es decir, ocurre de forma elicitada (se quiera o no) El concepto de reflejo Un reflejo conlleva un estímulo elicitante y su correspondiente respuesta.

La especificidad de la relación entre un estímulo y su respuesta refleja es una consecuencia de la organización del sistema nervioso. En los vertebrados, los reflejos simples suelen estar mediados por tres neuronas:

1. Neurona sensorial o aferente: la activa el estimulo ambiental y transmite el mensaje sensorial a la médula espinal.

2. Neurona motora o eferente: el impulso neural se transmite a la neurona motora que activa el músculo involucrado en la respuesta refleja.

3. Interneurona: comunica los impulsos entre la neurona sensorial o aferente y la motora o eferente.

La neurona sensorial y la motora rara vez se comunican directamente.

Determinadas neuronas sensoriales se conectan al conjunto correspondiente de neuronas motoras, este “cableado” hace que una respuesta refleja esté elicitada únicamente por un conjunto limitado de estímulos.

El conjunto formado por la neurona sensorial o aferente, la Interneurona y la neurona motora o eferente constituye el arco reflejo Arco reflejo: Estructura neural que consiste en una neurona aferente o sensorial, una Interneurona y una neurona eferente o motora y que permite que un estímulo pueda elicitar una respuesta refleja.

En vertebrados el arco reflejo representa el número mínimo de conexiones neurales necesarias para que tenga lugar el acto reflejo, aunque puede haber más estructuras.

http://psicologia.isipedia.com/primero/psicologia-del-aprendizaje/02-conducta-elicitada-habituacion-y-sensibilizacion/2-1.png?attredirects=0

Incluso los reflejos sencillos pueden estar influidos por el sistema nervioso superior.

Los reflejos contribuyen al bienestar del organismo (supervivencia).

Los reflejos constituyen la mayoría de la conducta de los recién nacidos (reflejos de succión, reflejo de oclusión respiratoria (inclina la cabeza hacia atrás y si no funciona llora porque el llanto requiere una vigorosa expulsión de aire, el suficiente para eliminar la oclusión)) Pautas de acción modal Algunas formas de conducta elicitada tienen lugar únicamente en una especie o en un grupo de especies relacionadas (succión en mamíferos, picoteo en gaviotas...) aunque ambas especies dependen de la alimentación de sus padres lo hacen de modo distinto.

A las secuencias de respuestas típicas de especies particulares, como las que aparecen en las crías, se las llama pautas de acción modal o PAMs Pauta de acción modal: patrón de respuesta exhibido de forma similar por la mayoría de los miembros de una misma especie. Las pautas de acción modal se utilizan como unidades básicas de conducta en las investigaciones etológicas del comportamiento.

Una característica importante de las pautas de acción modal es que el umbral de estimulación necesario para que estas se pongan en marcha varía en función de las circunstancia. El mismo estímulo puede tener efectos diversos dependiendo del estado fisiológico del animal y de las acciones que haya realizado recientemente.

Las pautas de acción modal fueron originalmente identificadas por los etólogos (científicos interesados en la evolución del comportamiento).

Los primeros etólogos como Lorenz o Tinbergen se refirieron a los patrones propios de cada especie como “pautas de acción fija” enfatizando así que dichas actividades tenían lugar de forma similar en todos los miembros de la especie.

Observaciones posteriores indicaron que no se realizan siempre igual, debido a esa variabilidad ahora se utiliza el término “pautas de acción modal” Estímulos elicitantes de las pautas de acción modal Los estímulos elicitantes pueden identificarse fácilmente en los reflejos simples (sobresaltarse ante un ruido), pero es más difícil de aislar en interacciones sociales complejas (el polluelo de gaviota arenquera ha de picotear el pico de su progenitor para que regurgite la comida, la respuesta a qué es lo que estimula ese picoteo del polluelo no puede determinarse por simple observación ya que ese picoteo puede deberse a varias razones (color, forma, longitud, ruido...). Tinbergen y Perdeck (1950) estudiaron sobre esos motivos utilizando modelos artificiales y demostraron que un modelo artificial debe reunir diversas características para provocar la respuesta de picoteo.

Esos rasgos específicos que se requieren para elicitar la conducta se llaman estímulo señal o estimulo desencadenante.

Estimulo señal o desencadenante: Rasgo específico de un objeto o animal que elicita una pauta de acción modal en otros organismos.

Un estímulo señal o desencadenante es suficiente para elicitar una pauta de acción modal. Sin embargo, una determinada pauta de acción modal puede estar controlada por

varios rasgos del estímulo de forma aditiva. Además, el estimulo que elicita con mayor efectividad la pauta de acción no tiene porque ser el que ocurra con mayor probabilidad en condiciones naturales (ver estudio de Baerends y Drent sobre la conducta de la recuperación de huevos de la gaviota arenquera. Página 33 del manual).

Cuando se identifican los rasgos que provocan la respuesta elicitada es posible combinarlos para fabricar un objeto que sea más efectivo que el propio objeto natural como elicitador de la pauta de acción.

Estos estímulos inusualmente efectivos reciben el nombre de estímulos supranormales Estímulo supranormal: Estímulo señal artificialmente agrandado o exagerado que elicita una respuesta inusualmente vigorosa.

La organización secuencial de la conducta Las respuestas no tienen lugar aisladas unas de otras, sino que las acciones individuales se organizan en secuencias efectivas.

Toda conducta motivada o dirigida a metas, ya sea buscar comida, encontrar pareja etc, involucra secuencias de acciones sistemáticamente organizadas.

Los etólogos llamaron conducta apetitiva a los primeros componentes de la secuencia de comportamiento y conducta consumatoria a los últimos. Por ejemplo, masticar y tragar consuman la búsqueda de comida (consumación, conclusión). Las respuestas consumatorias tienden a ser pautas de acción modal específicas de la especie. Las conductas apetitivas, por el contrario, son más variables dependiendo del entorno (diferentes formas de cocinar de cada etnia: conducta apetitiva, todas mastican y tragan del mismo modo: conducta consumatoria)

Conducta apetitiva: Conducta que tiene lugar al principio de una secuencia natural de conducta y que sirve para poner al organismo en contacto con un estímulo desencadenante.

Conducta consumatoria: Conducta que lleva a consumar o completar una secuencia natural de conducta. Las respuestas consumatorias son, por lo general, patrones de acción modal específicos de la especie.

Los teóricos del aprendizaje están tomando cada vez mayor conciencia de la importancia de considerar las secuencias de conducta naturales.

Al estudiar cómo los animales obtienen comida, por ejemplo, es normal considerar que la secuencia de respuestas de búsqueda de comida comienza por un modo de búsqueda general (sin una localización espacial concreta), seguido de un modo de búsqueda focalizada (especificidad espacial) (se busca sólo donde hay indicios que se encuentra la comida que se busca y se obvia lo demás), y termina con un modo de manipulación del alimento (una vez encontrada la comida deseada se llega a la conducta consumatoria (masticar y tragar)) Modo de búsqueda general: Primer componente de la secuencia de conducta de alimentación, en la que el organismo pone en marcha una conducta motora sin dirección fija. La búsqueda general es una forma de conducta apetitiva.

Modo de búsqueda focalizada: Segundo componente de la secuencia de conducta de alimentación, tras la búsqueda general, en el que el organismo pone en marcha una

conducta centrada en la localización de un estímulo particular que indica la presencia de alimento. La búsqueda focalizada es una forma de conducta apetitiva más directamente relacionada con el alimento que la búsqueda general.

Modo de manipulación del alimento: Último componente de la secuencia de conducta de alimentación en el que el organismo manipula y consume el alimento. Es similar a lo que los etólogos llaman conducta consumatoria.

EFECTOS DE LA ESTIMULACIÓN REPETIDA

Contrariamente a los presupuestos de Descartes (pensaba que una respuesta refleja ocurre del mismo modo siempre que se le presenta el estimulo elicitante), la conducta elicitada no es inmutable. Uno de los rasgos más característicos de la conducta elicitada es su plasticidad. Ni siquiera las respuestas elicitadas simples ocurres de la misma manera en todas las ocasiones.

Atención visual en los bebés humanos

Las claves visuales elicitan una respuesta de observación, que puede medirse por el tiempo que los bebes mantienen sus ojos en un objeto antes de mirar a otra parte.

La atención visual provocada por un estímulo novedoso cambia a mediada que el bebé se familiariza con el estímulo la naturaleza del cambio está determinada por la naturaleza del estímulo (en un patrón 4x4 de un tablero de ajedrez la atención visual se reduce más rápido que en uno de 12x12 donde la atención primero se incremente y después se reduce) La tarea de agudeza visual puede proporcionar información sobre la agudeza visual. El procedimiento también se ha adaptado para estudiar una amplia variedad de cuestiones complicadas sobre la cognición infantil.

Salivación y evaluación del sabor en humanos

El sabor de la comida elicita la salivación como respuesta refleja. Esto puede observarse tan claramente en las personas como en los perros de Pavlov. En un estudio, se midió la respuesta de salivación de ocho mujeres ante el sabor del zumo de limón y del zumo de lima.

A medida que el estímulo se repetía diez veces, perdía eficacia para elicitar tanto las respuestas de salivación como las hedónicas.

En el Ensayo 11, se cambió el sabor (a lima para los sujetos que previamente habían sido expuestos al limón y a limón para los sujetos que habían sido expuestos a lima). Esto produjo una impresionante recuperación tanto del reflejo salival como de la evaluación hedónica. Curiosamente, esta recuperación persistió en el Ensayo 12, en el que se presento el sabor original.

Las personas encuentran el sabor de una comida específica menos placentera cuanto más la comen. Sin embargo, el sabor de una comida distinta es suficiente para restablecer la valoración hedónica de una comida familiar. Estos hallazgos sugieren que la sobrealimentación puede reducirse no variando los alimentos disponibles para su consumo

Respuesta de sobresalto en ratas

La respuesta de sobresalto es una respuesta defensiva que aparece en muchas especies, incluida la humana. Consiste en un salto repentino y una contracción de los músculos de la parte superior del cuerpo, con frecuencia acompañado de una elevación de los hombros.

En las ratas, la respuesta de sobresalto puede medirse situando al animal en una cámara estabilimétrica (una pequeña cámara descansa sobre unos sensores de presión. Estos sensores detectan los movimientos repentinos de la rata, que se registran en un ordenador). Cuando el animal se sobresalta, da un salto haciendo que la cámara se mueva. Los sensores de presión situados bajo la cámara miden con precisión estos movimientos, que se usan como indicadores de la intensidad de la reacción de sobresalto.

La reacción de sobresalto puede elicitarse en ratas por medio de toda una variedad de estímulos, incluyendo tonos y luces breves.

La presentación repetida del estímulo elicitante no siempre produce la misma respuesta. En un estudio, las ratas expuestas a un ruido ambiental suave, las repeticiones del tono provocaron una reacción de sobresalto cada vez más débil. Por el contrario, cuando el ruido era intenso, las repeticiones del tono provocaron reacciones de sobresalto cada vez más vigorosas.

LOS CONCEPTOS DE HABITUACIÓN Y SENSIBILIZACIÓN

La presentación repetida de un estímulo elicitante puede provocar tanto disminuciones como incrementos en la respuesta. Las disminuciones de la tendencia a responder producidas por la estimulación repetida reciben el nombre técnico de efecto de habituación. Los incrementos de la tendencia a responder se llaman efecto de sensibilización.

Efecto de habituación: Disminución progresiva en el vigor de la conducta elicitada que puede tener lugar con la presentación repetida del estímulo elicitante.

Efecto de sensibilización: Incremento en el vigor de la conducta elicitada que puede resultar de la presentación repetida del estímulo elicitante o de la exposición a un estímulo externo intenso.

Los efectos de la habituación y sensibilización son dos tipos básicos de cambios conductuales que resultan de la experiencia previa. Son rasgos tan fundamentales del ajuste de los organismos al entorno que tiene lugar en todas las especies y en todos los sistemas de respuesta.

Los efectos de habituación y sensibilización pueden ocurrir en cualquier situación que conlleve la exposición repetida a un estimulo. La consideración de estos efectos es crítica para los estudios de aprendizaje. También juegan un papel importante en el condicionamiento operante.

Adaptabilidad y generalidad de la habituación y la sensibilización Los fenómenos de habituación y sensibilización son el producto final de procesos que ayudan a organizar y focalizar la conducta en el caótico mundo de estímulos en el que los organismos viven.

En la experiencia humana cotidiana existen numerosos ejemplos de habituación y sensibilización, por ejemplo, cuando visitamos un lugar nuevo o conocemos a una persona, es probable que prestemos atención a todo tipo de estímulos que normalmente ignoramos. Es probable que ignoremos estos detalles en los sitios o con las personas familiares.

Diferencias entre habituación, adaptación sensorial y fatiga Para entender otras fuentes alternativas de disminuciones en la respuesta, volvamos al concepto de reflejo.

Un reflejo consta de tres componentes:

1. Un estímulo activa uno de los órganos sensoriales, como los ojos o los oídos. Esto genera impulsos neuronales que se envían al sistema nervioso central (medula espinal y cerebro).

2. Transmisión de los mensajes sensoriales a los nervios motores a través de las interneuronas.

3. Los impulsos nerviosos de los nervios motores activan los músculos dando lugar a la respuesta observable.

Dados estos tres componentes de un reflejo, existen varias razones por las cuales una respuesta elicitada puede no ocurrir (p.e quedar cegado temporalmente por una luz brillante).

Tales disminuciones en la sensibilidad reciben el nombre de adaptación sensorial, que es distinta de la habituación. La respuesta tampoco tendrá lugar si los músculos involucrados quedan incapacitados por la fatiga. La adaptación sensorial y la fatiga impiden la respuesta a nivel de los órganos sensoriales y de los músculos, sin la intervención del sistema nervioso. Por tanto, pueden distinguirse de la habituación.

Adaptación sensorial: Reducción temporal en la sensibilidad de los órganos sensoriales provocada por la estimulación repetida o excesiva.

Fatiga: disminución temporal de la conducta causada por el uso repetido o excesivo de los músculos involucrados en la conducta.

Se asume que la habituación y la sensibilización conllevan cambios neurofisiológicos que dificultan o facilitan la transmisión de los impulsos neurales desde las neuronas sensoriales a las motoras. En la habituación, el organismo deja de responder a un estímulo aunque mantiene la capacidad de percibirlo y de realizar los movimientos


musculares requeridos por la respuesta. La respuesta no tiene lugar debido a que los cambios en el sistema nervioso bloquean la transmisión del impulso nervioso a las neuronas motoras.

En los estudios sobre habituación, la adaptación sensorial puede descartarse ya que existe evidencia de que la habituación es específica de la respuesta.

Un organismo puede dejar de responder a n estímulo con un aspecto de su conducta, mientras que continúa respondiendo al mismo de otras formas.

La fatiga también puede descartarse como causa de la habituación por medio de evidencia que muestra que la habituación es específica del estímulo. Una respuesta habituada se recupera rápidamente cuando se introduce un estímulo novedoso.

Teoría del proceso dual de la habituación y la sensibilización

Los efectos de habituación y sensibilización son cambios en la conducta o en la ejecución.

La teoría del proceso dual propuesta por Groves y Thompson (1970) continúa siendo la principal teoría sobre la habituación y la sensibilización.

La teoría del proceso dual presupone que los incrementos y disminuciones en la tendencia a responder a un estímulo son producto de procesos neurales diferentes. Uno de estos procesos neurales es el proceso de habituación, provoca una disminución en la tendencia a responder. Otro, el proceso de sensibilización, produce un incremento en la tendencia a responder. Estos procesos no son mutuamente excluyentes, el resultado conductual depende de qué proceso sea mas fuerte.

Proceso de habituación: mecanismo neural activado por la repetición de un estímulo que reduce la magnitud de las respuestas elicitadas por ese estímulo.


Proceso de sensibilización: mecanismo neural que incrementa la magnitud de las respuestas elicitadas por un estímulo.

El cambio observable en la respuesta elicitada representa siempre el efecto neto de los procesos de habituación y sensibilización.

Que el resultado neto sea un incremento o una disminución en la conducta depende de cuál de los procesos subyacentes sea más fuerte en una situación particular. La distinción entre efectos y procesos en la habituación y la sensibilización es análoga a la distinción entre ejecución y aprendizaje.

Los efectos hacen referencia a la conducta observable, y los procesos se refieren a los mecanismos subyacentes.

Basándose en la investigación neuropsicológica, Groves y Thompson (1970) sugirieron que los procesos de habituación y sensibilización tienen lugar en diferentes partes del sistema nervioso.

Se asume que los procesos de habituación tienen lugar en el sistema E-R, que consiste en el camino neural más corto que conecta los órganos sensoriales activados por el estímulo elicitante los músculos involucrados en la producción de la respuesta elicitada. El sistema E-R puede ser concebido como el arco reflejo. Cada presentación de un estímulo elicitante activa el sistema E-R y causa un incremento en la habituación.

Se asume que los procesos de sensibilización tienen lugar en el sistema de estado. Este sistema abarca otras partes del sistema nervioso que determinan el nivel general de disposición o tendencia a responder de un organismo. A diferencia del sistema E-R, que se activa cada vez que se presenta el estímulo elicitante, el sistema de estado se activa únicamente con eventos excitadores. Por ejemplo, permanece relativamente inactivo durante el sueño.

Las drogas pueden alterar el funcionamiento del sistema de estado y, por tanto, afectar a la tendencia a responder.

El aumento de la reactividad que acompaña al miedo está causado por la activación del sistema de estado.

En resumen, el sistema de estado determina la tendencia general de un organismo a responder, mientras que el sistema E-R permite al animal dar la respuesta específica al estímulo relevante. Los cambios en la conducta que tienen lugar por la repetición de un estímulo reflejan la acción combinada de los sistemas E-R y de estado.

Aplicaciones de la teoría del proceso dual: los ejemplos de habituación y sensibilización que se muestran en la evidencia anteriormente mencionada pueden ser fácilmente interpretados en términos de la teoría del proceso dual. La exposición repetida al patrón de tablero de ajedrez 4x4 produjo una disminución en la respuesta de orientación visual de los bebés, posiblemente porque no provocaba mucha activación. De hecho el estimulo 4x4 activó principalmente e sistema E-R y, por tanto, el proceso de habituación. El patrón de tablero 12x12 produjo un mayor nivel de activación.

Probablemente activó, no sólo el sistema E-R, sino también el sistema d estado. La activación del sistema de estado produjo un incremento en la atención visual después de la primera presentación del patrón 12x12. Sin embargo, la activación o el proceso de sensibilización no fue lo suficientemente fuerte para contrarrestar completamente los efectos de la habituación. Como resultado, después de unos cuantos ensayos, la atención visual también declinó en respuesta al estímulo 12x12.

Los efectos de habituación y sensibilización de la respuesta de sobresalto en ratas requieren una aplicación diferente de la teoría del proceso dual.

Cuando se sometió a prueba a las ratas con un ruido suave no había nada que las activara. Por tanto podemos asumir que los procedimientos experimentales no produjeron cambios en el sistema de estado. La presentación repetida del tono elicitador de sobresalto activaba tan solo el sistema E-R , lo que dio lugar a la habituación de respuesta de sobresalto.

El resultado contrario tuvo lugar cuando los animales fueron puestos a prueba en presencia de un rudo fuerte. Con las sucesivas presentaciones del tono aparecieron reacciones de sobresalto más enérgicas. Dado que en ambos grupos se utilizó idéntico tono, la diferencia en los resultados no puede ser atribuida al mismo debemos asumir que en segundo grupo el ruido ambiental intenso incrementó el nivel de activación o la tendencia a responder. Esta sensibilización del sistema de estado fue probablemente la causa del incremento en la reacción de sobresalto al tono en el segundo grupo.

HABLAR CON UN FETO O CON UN BEBÉ

La habituación y la sensibilización no requieren habilidades verbales. Estas formas de plasticidad conductual son, por tanto, muy útiles en los estudios sobre habilidades perceptivas y cognitivas de los fetos y de los bebes que aún no han adquirido el lenguaje.

Kaplan, Godstein, Huckeby y Cooper (1995) investigaron si los bebés de 4 meses podían percibir la diferencia entre el habla de la madre dirigida hacia el bebé o hacia otros adultos. Como estímulo registraron a una madre diciendo una frase. En una de las grabaciones, las palabras estaban dirigidas hacia el bebé. En la otra, se pidió a la madre que dijera las palabras como si estuviese hablando con otro adulto.

Los resultados muestran que los bebes pueden comunicar la diferencia entro dos tipos de discurso hablado que encontraban más estimulante el discurso dirigido al bebé.

Implicaciones de la teoría del proceso dual: los sistemas de estado y E-R se activan de forma diferente por la presentación repetida de un estímulo. El sistema E-R se activa siempre que un estímulo elicita una respuesta ya que es el circuito neural que lleva los impulsos desde la entrada sensorial hasta la salida conductual.

Por el contrario, el sistema de estado solo interviene en circunstancias especiales.

La teoría del proceso dual de la habituación y la sensibilización ha tenido una gran influencia en el estudio de la plasticidad de la conducta elicitada.

Una de las contribuciones más importantes de la teoría ha sido el presupuesto de que la conducta elicitada puede estar fuertemente influenciada por los eventos neuropsicológicos que tienen lugar fuera del arco reflejo directamente involucrado en una respuesta elicitada particular.

En la teoría del procesamiento dual, se asume que el sistema de estado modula la actividad de los arcos reflejos.

CARACTERÍSTICAS DE LA HABITUACIÓN Y LA SENSIBILIZACIÓN

Aunque las características de la habituación y la sensibilización no son perfectamente uniformes en todas las especies y sistemas de respuesta, hay muchos aspectos comunes.

Curso temporal la mayor parte de los cambios conductuales que se describen en los capítulos posteriores se mantienen durante periodos largos, una característica definitoria de los fenómenos de aprendizaje, no todos los casos de habituación y sensibilización pueden considerarse en rigor muestras de aprendizaje duradero.

Curso temporal de la sensibilización: por lo general, los procesos de sensibilización tienen efectos temporales. Aunque en algunos casos la sensibilización persiste durante más de una semana, el incremento en la tendencia a responder tiene normalmente una vida corta.

En todos los sistemas de respuesta la duración de los efectos de sensibilización está determinada por la intensidad del estímulo. Los estímulos más intensos producen mayores incrementos en la tendencia a responder y una sensibilización más persistente.

Curso temporal de la habituación: la persistencia de la habituación también es variable. En el caso de la sensibilización las diferencias en el curso temporal del efecto se deben normalmente a diferencias cuantitativas. Pero el mecanismo subyacente es el mismo. Por el contrario, hay dos tipos de efecto de habituación cualitativamente distintos:

1. La habituación a corto plazo se parece a la mayoría de los casos de sensibilización en que se disipa relativamente rápido (segundos o minutos)

2. La habituación a largo plazo persiste durante muchos días.

La recuperación espontánea es la principal característica del efecto de la habituación a corto plazo.

Recuperación espontánea: recuperación de una respuesta habituada o de una respuesta extinguida tras un periodo de descanso.

La presentación repetida de un estímulo no siempre da lugar conjuntamente a habituación a corto y a largo plazo.

La recuperación espontánea nunca es completa en las situaciones que conllevan efectos de habituación a largo plazo.

La habituación a corto plazo suele tener lugar cuando el estímulo elicitante se presenta frecuentemente.

La habituación a largo plazo es más probable cuando las presentaciones del estímulo están más separadas.

La teoría del proceso dual de la habituación y la sensibilización se formuló para explicar solo los efectos a corto plazo, y, por tanto, no puede explicar por qué la habituación dura considerablemente más en ciertas condiciones.

La explicación más aceptada de la habituación a largo plazo es la teoría de la activación de Wagner.

Especificidad del estímulo

Especificidad del estimulo en la habituación: la habituación es específica del estímulo que ha sido presentado repetidamente. Una respuesta a un estímulo previamente habituada puede manifestarse plenamente alterando alguna característica importante del estimulo (experimento de habituación de la salivación y de la evaluación hedónica en respuesta a un sabor) (después que nos hemos habituado al repiqueteo de un reloj de pared, es probable que volvamos a prestar atención al reloj si funciona mal y hace un sonido nuevo).

Después de que la respuesta de orientación a un estímulo se ha habituado completamente, dicha respuesta se manifestara en su intensidad habitual si se presenta un estímulo suficientemente novedoso. La especificidad del estímulo se ha considerado como una de las características definitorias de la habituación.

Aunque la habituación es específica de un estímulo, puede darse cierta generalización, si nos hemos habituado a un determinado sonido del reloj, es posible que tampoco respondamos al sonido de otro reloj similar. Este fenómeno recibe el nombre de generalización del estimulo de la habituación.

Sin embargo, a pesar de la generalización del estímulo de la habituación, a medida que los estímulos de prueba se hacen progresivamente diferentes del estímulo habituado, el organismo mostrará una menor habituación o supresión de la respuesta ante dichos estímulos.

Especificidad del estímulo en la sensibilización: a diferencia de la habituación, la sensibilización no es muy específica del estímulo. Si un animal se activa o sensibiliza por alguna razón, su reactividad se incrementará para toda una variedad de estímulos (el malestar gástrico y las náuseas incrementa la reactividad de las ratas a un amplio rango de nuevos sabores).

Efecto de un estímulo externo intenso

Un cambio en la naturaleza del estímulo elicitante puede dar lugar a la recuperación de una respuesta habituada. Sin embargo, la respuesta habituada también puede restablecerse sensibilizando al organismo con la exposición a un estímulo externo. Este fenómeno recibe el nombre de deshabituación.

Deshabituación: recuperación de una respuesta habituada como resultado de la presentación de un estimulo externo e intenso.

Es importante tener presente que la deshabituación hace referencia a la recuperación de la respuesta al estímulo previamente habituado. La respuesta directa al tono utilizado para deshabituar o sensibilizar carece de interés.

APLICACIÓN A LAS EMOCIONES Y LA CONDUCTA MOTIVADA

La exposición de los cambios producidos por la repetición de un estímulo elicitante pueden provocar emociones complejas (miedo, euforia...) Reacciones emocionales y sus efectos posteriores En su revisión de ejemplos de respuestas emocionales a varios estímulos, incluyendo drogas, Solomon y Corbit (1974) destacaron dos rasgos llamativos:

1. Las reacciones emocionales intensas a menudo constan de dos fases: una emoción tiene lugar durante la presentación del estímulo elicitante, la opuesta se observa cuando el estímulo desaparece (efecto psicoactivo del alcohol: primero alegre y relajada, cuando los efectos desaparecen viene la “resaca”). La reacción primaria y su postefecto dependen de la dosis de la droga.

2. Otra característica común de las reacciones emocionales es que cambian con la experiencia. La reacción primaria se hace más débil y su postefecto se hace más fuerte.

La habituación de la primera reacción a la droga se llama tolerancia a la droga, lo que hace referencia a la disminución en la efectividad de una droga con las exposiciones repetidas (una cantidad que podría emborrachar ligeramente a un bebedor ocasional puede no tener efecto alguno en un bebedor habitual) Tolerancia a la droga: reducción en la efectividad de una droga como resultado del uso repetido de la droga.

Debido al desarrollo de la tolerancia, los consumidores habituales de drogas a veces no disfrutan tanto de su consumo como los consumidores novatos.

Solomon y Corbit (1974) destacaron que se producen patrones de reacción emocional similares con otros estímulos emocionales como el amor y el apego (los recién casados suelen sentirse emocionados el uno con el otro, pero esta reacción primaria se habitúa con el tiempo).

Además la habituación de la reacción emocional primaria va acompañada de un fortalecimiento des postefecto afectivo (las parejas que han estado juntas muchos años sufren más intensamente la separación por muerte o enfermedad que los recién casados). Este postefecto afectivo es llamativo, ya que en esta fase de la relación la pareja bien puede haber dejado de mostrar cualquier signo de afecto.

La teoría del proceso oponente

Tres características comunes de las reacciones emocionales:

1. Las reacciones emocionales son bifásicas; a una reacción primaria sigue un postefecto opuesto.

2. La reacción primaria se debilita con la estimulación repetida. 3. El debilitamiento de la reacción primaria va acompañado por un fortalecimiento

del postecto.

La teoría del proceso oponente de Solomon y Corbit se diseñó para explicar estos tres rasgos característicos de las emociones.

La teoría del proceso oponente asume que los mecanismos neurofisiológicos involucrados en la conducta emocional tratan de mantener la estabilidad emocional. Así pues, la teoría del proceso oponente es una teoría homeostática. Se basa en la premisa de que una función importante de los mecanismos que controlan la conducta emocional es minimizar las desviaciones con respecto a la neutralidad o estabilidad emocional.

Mantener cualquier sistema estable o neutral requiere que las perturbaciones que mueven el sistema en una dirección se encuentren con una fuerza opuesta que compense la perturbación.

El concepto de fuerzas opuestas es central para la teoría del proceso oponente.

La teoría asume que un estimulo emocional activador desvía de la neutralidad el estado emocional de una persona.

Se asume que este desplazamiento con respecto a la neutralidad emocional pone en marcha un proceso oponente que compensa el cambio. Los patrones de conducta emocional observados tanto inicialmente como después de la experiencia repetida con un estímulo son el resultado neto de los procesos oponentes de los cambios en los mismos como resultado de la experiencia.

La teoría del proceso oponente asume que la presentación de un estímulo emocional activador elicita inicialmente lo que se denomina el proceso primario, o proceso a que es el responsable de la naturaleza del estado emocional, (por ejemplo felicidad) que tiene lugar en presencia del estimulo.

El proceso primario o proceso a elicita a su vez un proceso oponente o proceso b, que genera la reacción emocional opuesta (por ejemplo tristeza).

Se asume que los cambios emocionales observados cuando se presenta un estímulo y después se retira reflejan el resultado neto de los procesos primario y oponente. La fuerza del proceso oponente se resta de la fuerza del proceso primario para dar lugar a las emociones que realmente ocurren.

Por tanto, los procesos primario y oponente son mecanismos internos cuyos efectos son los cambios emocionales observados. (fig 2.12) Un presupuesto adicional básico para la teoría del proceso oponente es que el proceso oponente es ligeramente ineficiente. Al principio permanece a la zaga de la alteración emocional primaria, y por tanto, no es lo suficientemente fuerte para compensar por completo la emoción primaria.

Sin embargo, el proceso oponente se hace más rápido y potente con la práctica o con la experiencia repetida con el estímulo que activa la emoción.

En cierto sentido, el proceso oponente se sensibiliza como resultado de la activación repetida. Progresivamente se va haciendo lo suficientemente fuerte como para bloquear la mayor parte de la reacción emocional primaria, momento en el cual produce también un postefecto muy fuerte al terminar el estímulo emocional activador.

Mecanismos oponentes durante la exposición inicial al estímulo

Cuando el estímulo se presenta por primera vez, el proceso a tiene lugar sin la oposición del proceso b. Esto permite que la reacción emocional primaria alcance su nivel más alto.

Después se activa el proceso b y comienza a oponerse al proceso a. Sin embargo, en la primera presentación del estímulo el proceso b no es lo suficiente mente fuerte para compensar por completo la respuesta emocional primaria, que persiste mientras está presente el estimulo elicitante.

Cuando el estimulo se retira, el proceso a se detiene rápidamente, pero el proceso b permanece por algún tiempo.

En este momento no hay nada que se oponga al proceso b, y la respuesta emocional característica del proceso oponente se hace evidente por primera vez.

Estas emociones son por lo general opuestas a las que se observan durante la presentación del estímulo.

Mecanismos oponentes tras la exposición prolongada al estímulo:


Un estímulo familiar no elicita reacciones emocionales fuertes, pero el postefecto afectivo tiende a ser más fuerte cuando termina un estimulo familiar.

La teoría del proceso oponente explica este resultado asumiendo que el proceso b se fortalece con la exposición prolongada a estimulo, el fortalecimiento del proceso b se refleja en varias de sus características: se activa antes tras la aparición del estimulo, su intensidad máxima se hace mayor y da más tiempo en decaer tras la desaparición del estímulo.

Por el contrario, se asume que el proceso a permanece inalterado.

Por tanto, tras la presentación repetida de un estímulo, la respuesta emocional primaria queda compensada de forma más efectiva por el proceso oponente.

Este fortalecimiento del proceso oponente reduce la intensidad de las respuestas emocionales primarias observadas durante la presentación del estimulo emocional activador. También d lugar a un postefecto emocional intenso cuando el estimulo se retira.

Motivación y postefecto oponente

La teoría del proceso oponente sugiere que lo adicción a las drogas es principalmente un intento de reducir la aversión producida por el postefecto afectivo de las drogas.

Hay dos formas de reducir los postefectos oponentes aversivos de las drogas:


1. Esperar el tiempo necesario para e se disipen. 2. O más rápido: tomando de nuevo la droga.

De acuerdo con la teoría, los adictos quedan atrapados por la necesidad de tomar la droga para reducir los efectos de la retirada.

Valoración general de la teoría del proceso oponente

Aunque la teoría no ha estimulado toda la investigación que prometía, ha supuesto una importante contribución al aplicar el concepto de regulación homeostática al análisis de emociones y la motivación.

Variaciones en la conducta dirigida a metas

Responder para escapar de la molestia producida por la retirada de un estímulo es sólo uno de los tipos de conducta motivada o dirigida a metas.

Un objeto meta gratificante recibe el nombre técnico de reforzador.

Reforzador: estímulo cuya administración inmediatamente posterior a una respuesta incrementa la probabilidad futura de dicha respuesta.

Las situaciones en las que los organismos responden repetidamente para obtener un reforzador muestran muchas de las propiedades comunes de la habituación la sensibilización. (Escuchar una canción particular, es menos probable que nos apetezca encender la radio para escuchar siempre lo mismo (habituación), pero esta pérdida de interés es específica de esa canción repetida (especificidad del estímulo), además recuperaremos nuestro interés en la canción si no la escuchamos en unos días (recuperación espontánea), o también puede restablecerse nuestro interés por la exposición a estímulos novedosos como que la escuchemos junto a un amigo (sensibilización)).

La habituación y la sensibilización son frecuentes con reforzadores sensoriales (como una pieza musical).

COMENTARIOS FINALES

La conducta elicitada representa una de las principales formas en las que el comportamiento de todos los animales -desde los organismos unicelulares hasta los humanos- se ajusta a los eventos del ambiente.

La conducta elicitada toma muchas formas, desde reflejos simples mediados por tres neuronas a las reacciones emocionales complejas.

Aunque la conducta elicitada tiene lugar como reacción a un estímulo, no es rígida ni invariable.

Uno de lo de sus rasgos más llamativos es que la conducta elicitada cambia con la experiencia.

Si un estímulo elicitante no activa a organismo, la presentación repetida del estímulo provocará respuestas cada vez mas débiles (habituación).

Si el estimulo elicitante es intenso o significativo para el individuo, la presentación repetida dará lugar a respuestas cada vez más fuertes (sensibilización).

El nivel resultante de respuesta refleja el resultado neto de los procesos de habituación y sensibilización. Por lo tanto, si desconocemos las experiencias pasadas de un organismo, es imposible predecir con qué intensidad reaccionará ante la presentación de un estímulo particular.

La presentación repetida de u estímulo elicitante produce cambios tanto en las respuestas simples como en reacciones emocionales más complejas.

Los organismos tienden a minimizar los cambios emocionales provocados por estímulos externos.

De acuerdo con la teoría del proceso oponente de la motivación, el organismo compensa las respuestas emocionales estimuladas por un evento del entorno con n proceso oponente. Se asume que este proceso compensatorio, u oponente, se hace más fuerte cada vez que se activa, lo que lleva a una reducción de la respuesta emocional primaria. El fortalecimiento del estado emocional oponente como postefecto se hace evidente cuando el estímulo se retira.

La habituación, la sensibilización y los cambios en la fuerza de los procesos oponentes son los mecanismos más sencillos mediante los qe los organismos ajustan sus reacciones a los eventos del entorno en función de la experiencia

PREGUNTAS DE PRUEBA

1. Compare y contraste la conducta apetitiva y consumatoria describa cómo se relacionan con la búsqueda general, focalizada y con la manipulación del alimento.

2. Explique la distinción entre habituación, adaptación sensorial y fatiga. 3. Explique la diferencia entre los efectos de habituación y sensibilización y los

procesos de habituación y sensibilización. 4. Describa los dos procesos de la teoría del proceso dual de la habituación y la

sensibilización y las diferencias entre estos procesos. 5. Describa la teoría del proceso oponente de la motivación y cómo explica la

habituación y la sensibilización. 6. Explique por qué la habituación y la sensibilización son relevantes en relación a

la conducta dirigida a metas.

Tema 3: Aprendizaje de relaciones entre estímulos. Fundamentos del condicionamiento clásico.

La investigación sobre el condicionamiento clásico comenzó con el trabajo de Pavlov, que estudió como aprendían los perros a anticipar la administración de comida.

Hay procedimientos del condicionamiento clásico que establecen una asociación entre dos estímulos. Otros inhiben el funcionamiento de las asociaciones excitatorias.

El condicionamiento clásico es el mecanismo más simple por el cual los organismos pueden aprender a cerca de las relaciones entre estímulos y cambiar su conducta en conformidad con las mismas. Permite a los seres humanos y a los demás animales aprovecharse de la secuencia ordenada de eventos de su ambiente y aprender que estímulos tienden a ir con qué eventos.

Sobre la base de este aprendizaje los organismos dan respuestas nuevas a los estímulos.

Con el condicionamiento clásico, aprendemos a predecir cuando y que podemos comer. También está involucrado en el aprendizaje de nuevas respuestas emocionales como el miedo y el placer a estímulos que inicialmente no elicitaban esas emociones.

LOS PRIMEROS AÑOS DEL CONDICIONAMIENTO CLÁSICO

Los primeros trabajos comienzan con Pavlov – fisiólogo ruso- .

En sus tesis doctoral Twitmyer (1974) presentada en la universidad de Pensilvania en 1902. Trató de condicionar el reflejo patelar de los estudiantes haciendo sonar una campana 0,5 segundos antes de golpear el tendón rotuliano situado bajo la rótula. Tras varios ensayos, sólo con escuchar el sonido para elicitar este reflejo (es decir, la pierna de los estudiantes) al escuchar la campana se movía sin tener que da el golpecito con el martillo en su rodilla, pero sus hallazgos no despertaron interés.

Los trabajos de Pavlov sobre el condicionamiento clásico fueron una extensión de su investigación sobre el proceso de digestión.

Desarrolló técnicas quirúrgicas introduciendo a sus perros tubos y fístulas artificiales, para recoger jugos gástricos. Los técnicos de su laboratorio descubrieron que los perros secretaban jugos gástricos en respuesta cuando veían la comida, o a la persona que les alimentaba.

Los asistentes del laboratorio llamaban a estos jugos “secreciones psíquicas”, durante muchos años este fenómeno tuvo escaso interés científico.

Los descubrimientos de Vul´fson y Snarskii

Estos estudiantes, se centraron en las glándulas salivares, que son las primeras glándulas involucradas en la descomposición de la comida. Vul´fson estudió la respuesta salival a varias sustancias situadas en la boca, como comida seca, comida húmeda, agua ácida y

arena. Cuando los perros experimentaban la sensación de estas sustancias en la boca, sólo la visión de estas provocaba la salivación.

Mientras Vul´fson utilizaba sustancias naturales en sus estudios, Snarskii lo hacía con sustancias artificiales.

Las sustancias también provocaban en la boca sensaciones de textura y sabor características. Estas sensaciones se denominan estímulos orofaríngeos. La primera vez que se ponía arena en la boca del perro, sólo la sensación de esta provocaba salivación. Cuando se repitió varias veces el experimento, sólo ver la arena provocaba salivación, sin necesidad de introducirla en la boca. El perro aprendió a asociar las características visuales de la arena con las características orofaríngeas. A este tipo de aprendizaje se le denomina Aprendizaje de objeto. Pues requiere asociar diferentes características de un mismo objeto. En los estudios posteriores sobre el condicionamiento Pavlov utilizó procedimientos en los que los estímulos a asociar provenían de diferentes fuentes. Actualmente se utilizan estos métodos experimentales.

El paradigma del condicionamiento clásico

El procedimiento para estudiar la salivación condicionada de Pavlov, conlleva dos estímulos:

1. Un tono de luz que no provoca salivación al principio del experimento. 2. Un alimento o solución ácida situada en la boca. este si provoca salivación fuerte

la primera vez que se presenta.

Pavlov se refirió al tono o a la luz como estímulo condicional pues la efectividad de este para provocar la salivación dependía su emparejamiento repetido con la presentación de la comida. Al estímulo de sabor ácido lo denominó estímulo incondicional, pues su efectividad para provocar la salivación era independiente del entrenamiento anterior. La salivación provocada por el tono o la luz se denominó respuesta condicional, y la provocada por la comida y el sabor ácido era la respuesta incondicional.

Las respuestas y estímulos cuyas propiedades no dependían del entrenamiento previo se denominaron incondicionales, y las respuestas y estímulos que aparecían sólo tras el entrenamiento previo eran las condicionales

Las abreviaturas de estímulo condicionado y respuesta condicionada son EC y RC. Las abreviaturas de estímulo incondicionado y respuesta incondicionada son EI y RI.

SITUACIONES EXPERIMENTALES

Pavlov realizó la mayor parte de sus experimentos con perros utilizando la técnica de la fístula salival. Actualmente se realizan con ratas, conejos y palomas con procedimientos desarrollados por científicos de la segunda mitad del siglo XX.

Condicionamiento del miedo

Tras el trabajo de Watson y Rayner (1920) el condicionamiento de las reacciones emocionales ha sido uno de los principales centros de atención del condicionamiento

pavloviano. Estos pensaban que al principio los niños están limitados en su reactividad emocional y asumieron << debe haber algún procedimiento sencillo por medio del cual el rango de estímulos que pueden despertar las emociones y sus compuestos se amplía>>. Este procedimiento sencillo era el condicionamiento pavloviano. Watson y Rayner condicionaron la respuesta del miedo de un niño de 9 meses Albert a la presentación de una rata blanca de laboratorio.

Albert no tenía miedo a casi nada, pero se dieron cuenta que cuando hacían sonar un ruido fuerte tras su cabeza si se asustaba. Utilizaron esta reacción incondicionada para condicionar el miedo a la rata blanca. Cada ensayo de condicionamiento consistía en presentar la rata a Albert y luego golpear la barra de hierro tras su cabeza. Al principio se acercaba a la rata cuando se le presentaba. Pero tras cinco ensayos mostró una reacción de miedo intensa ante la rata. Lloriqueaba o sollozaba y se separaba de la rata todo lo posible e incluso a veces se caía y se escapaba gateando. Pero si se le presentaban sus juguetes no aparecían las respuestas de miedo. Pero el miedo condicionado se le generalizó a otros objetos peludos (un conejo, un abrigo de piel, algodón…)

El miedo y la ansiedad pueden producir serios problemas psicológicos y conductuales.

Desde el estudio de Watson y Rayner con Albert los investigadores han examinado el condicionamiento del miedo utilizando ratas de laboratorio. El estímulo incondicionado aversivos utilizado en estos estudios es una breve descarga eléctrica en las patas del animal mediante una rejilla metálica en el suelo. La descarga utilizada como EI tiene una intensidad y duración suficientemente baja para no producir daño. La descarga resulta aversiva por que es extraña. El EC puede ser un tono o una luz, poco antes de la descarga. Las ratas muestran su miedo quedándose quietas, esta paralización es una respuesta a la anticipación de una estimulación aversiva.

Los investigadores miden el miedo condicionado indirectamente registrando como el estímulo condicionado altera la actividad del animal. Una técnica popular para la medida indirecta del miedo condicionado es el procedimiento de respuesta emocional condicionada o supresión condicionada (REC). El procedimiento REC fue diseñado por Estes y Skinner (1941) y se ha utilizado mucho en el estudio del condicionamiento pavloviano. Primero se enseña a las ratas a presionar una barra en una pequeña cámara experimental para obtener comida como recompensa. Cuando se ha presionado la barra unas cuantas veces se administra la comida. Tras un entrenamiento las ratas presionan la barra a un ritmo regular. Después comienza la fase de condicionamiento del miedo. En cada ensayo de condicionamiento se presenta el EC durante 1 o 2 minutos inmediatamente seguido una breve exposición a la descarga. Hay una separación de entre 15 y 30 minutos entre ensayos.

Las ratas por el miedo no pueden presionar la palanca y esto hace que el procediendo REC sea útil para medir la supresión de la respuesta inducida por el miedo. La adquisición del miedo al estímulo condicionado provoca una interrupción de la respuesta de presión de la palanca para obtener comida. Tras varios emparejamientos del EC con la descarga el animal suprime la respuesta cuando aparece el EC. La supresión condicionada puede ser completa y el animal no presione más la barra en 3 o 5 ensayos de condicionamiento, sin embargo la supresión es específica del EC. Cuando este desaparece las ratas vuelven a presionar la palanca para obtener comida.

Para medir cuantitativamente la supresión condicionada se calcula una razón de supresión. Esta razón compara el número de supresiones de la palanca que tiene lugar durante el EC con la que tiene lugar durante un período de línea base comparable anterior a la presentación del EC (período pre-EC) y la formula es:

Respuesta durante el EC

Razón de supresión= ---------------------------------------------------------------------------------------------------

Respuestas durante el EC + Respuestas durante el pre-EC

La razón de supresión adopta el número 0 si la rata deja de presionar la palanca completamente durante el EC, ya que en este caso el numerador de la fórmula es 0.

Si la rata no altera su ritmo de presiones de palanca cuando se presenta el EC, la razón tiene un valor de 0,5.

Supongamos que el EC se presenta durante 2 minutos y que en un período pre-EC de 2m la rata da 30 respuestas. Si el EC no altera la conducta de presión de la palanca, el animal dará 30 respuestas durante el EC de forma que el numerador de la razón será 30. El denominador será igual a 30 (respuestas durante el EC) + (30 respuestas durante el pre-EC), es decir, 60. La razón será 30/60 o 0.5. A medida que se baja de 0,5 a 0 los valores indican mayores niveles de supresión de la respuesta o de miedo condicionado. Por tanto la escala es la inversa. Los valores más bajos de la razón de supresión indican mayor alteración en la conducta de presión de la palanca.

Hay que recordar que una razón de supresión que indica 0, quiere decir que no hay ninguna respuesta durante el EC, lo que representa la mayor supresión posible de respuesta. Cuanta más pequeña es la razón de supresión, más paralizado está el animal porque el EC provoca más miedo condicionado.

En el procedimiento de supresión condicionada, la conducta de presión de la palanca para obtener comida proporciona la línea base de la respuesta.

En el procedimiento de supresión condicionada de lameteo la presentación de un estímulo condicionado que provoca miedo da lugar a una supresión de la conducta de lameteo. En este procedimiento se requiere menos entrenamiento para hacer que las ratas beban del tubo del que se requiere para que presionen una palanca para obtener comida. En este procedimiento también se registra el tiempo que el animal tarda en completar un total de 5segundos de lameteo como medida de supresión de la respuesta.

Condicionamiento de parpadeo

El reflejo palpebral es un reflejo discreto, muy parecido al reflejo patelar. Es uno de los primeros componentes de la respuesta de sobresalto y se da en diversas especies.

Al dar una palmada cerca de los ojos, o un soplo de aire cerca de ellos a través de una pajita, podemos hacer que se parpadee. Pero si a este soplo de aire le precede un tono

breve, es posible que la persona aprenda a parpadear cuando aparece el tono, anticipando el soplo de aire.

Al comienzo del desarrollo de la teoría del aprendizaje, el condicionamiento palpebral se utilizó principalmente en humanos, y aún tiene interés en la investigación, debido a los avances en nuestra comprensión de los sustratos neurobiológicos de este tipo de aprendizaje.

Steinmetz (1999) destacó que <<el condicionamiento palpebral proporciona un medio excelente para la observación directa de una conducta simple, y puede utilizarse para valorar procesos biológicos y psicológicos básicos en seres humanos, tales como el aprendizaje y la memoria, el desarrollo, la conciencia, la atención, la activación y el envejecimiento natural>>.

(Ver ejemplo del condicionamiento del parpadeo en páginas 66-67)

Las investigaciones neurobiológicas sobre el condicionamiento palpebral se han realizado con conejos domésticos principalmente.

La preparación del condicionamiento palpebral fue llevada a cabo por Gormezano. Los conejos domésticos son ideales para este tipo de investigación debido a su disponibilidad, a que son sedentarios, a que toleran bien las restricciones del movimiento y que rara vez parpadean, en ausencia de aire o irritación del ojo.

El condicionamiento palpebral de los conejos es relativamente lento, requiere cientos de ensayos para obtener un nivel significativo de respuesta condicionada.

Seguimiento del signo

Los estudios de Pavlov, se centraron en la salivación y en otras respuestas de carácter reflejo, y afianzaron la idea de que el condicionamiento clásico tenía lugar únicamente en sistemas de respuesta reflejos, pero en los últimos años se ha abandonado esta visión restringida del condicionamiento pavloviano. Uno de los paradigmas que ha contribuido a la concepción actual de este condicionamiento es el de seguimiento del signo o automoldeamiento.

En el ambiente natural la disponibilidad de comida puede predecirse a partir de algunos aspectos de la propia comida, que se pueden percibir a distancia (como el aspecto de dicha comida). Para un halcón el ver un ratón en movimiento es una clave que indica alimento.

El seguimiento del signo, se estudia en el laboratorio presentando un estímulo visual discreto y bien localizado justo antes de cada administración de alimento. El primer experimento de este tipo se realizó con palomas y lo realizaron Brown y Jenkins (1968). Se ponían a los animales en una cámara experimental que tenía una tecla circular que se podía iluminar y las palomas podían picotear. Las palomas periódicamente podían comer durante unos segundos. La tecla luminosa se encendía 8 segundos antes de cada administración de comida.

Las palomas no tenían que hacer nada para que apareciera la comida, esta se administraba automáticamente después de la iluminación de la tecla de respuesta, independientemente de lo que hicieran las aves. Como las aves estaban hambrientas lo lógico era pensar que irían a picotear la comida en cuanto se encendiera la luz, pero esto no fue así. En lugar de esperar a que se encendiera la luz para ir al comedero, fueron ellas a picotear la tecla. Este comportamiento resultó curioso porque no era necesario que hicieran nada para tener acceso a la comida.

Después de este experimento se han hecho otros con pollos, codornices, carpas…

Todos estos experimentos sobre el seguimiento del signo es una herramienta útil para el estudio del aprendizaje asociativo. En estos experimentos con palomas, el EC es la iluminación de la teclas de respuesta, y el EI la presentación de la comida. El aprendizaje es rápido cuando el EC se presenta justo antes que EI.

Se puede ver un ejemplo del seguimiento del signo con palomas en la pág 71.

El seguimiento del signo sólo es posible en situaciones en las que el EC tiene una localización precisa, por tanto, puede ser seguido.

En un estudio se utilizaron como EC claves contextuales y espaciales difusas de las cámaras en las que las palomas recibían comida periódicamente, el aprendizaje de la asociación se manifestó en forma de un incremento de actividad más que como una respuesta de aproximación específica. En otro se compararon una luz bien localizada y un sonido como EC para la comida. Sólo la luz estimuló la conducta condicionada de aproximación o seguimiento del signo. El EC auditivo provocaba una aproximación al comedero en lugar de a la fuente de sonido. Estos experimentos muestran que para que tenga lugar el seguimiento del signo el EC tiene que ser de una modalidad y configuración apropiadas. Un factor también muy importante es la relación entre la cantidad de tiempo que los sujetos pasan en el contexto experimental y la duración de cada presentación del EC. Se obtienen mayores niveles de seguimiento del signo con mayores exposiciones al contexto experimental en relación a la duración del EC.

Aprendizaje de aversión al sabor

El acto de comer da muchas oportunidades para el aprendizaje de asociaciones. Rozin y Zellner (1985) destacaron<< el condicionamiento pavloviano está plenamente activo en las asociaciones entres los sabores de los miles de millones de comidas que se ingieren cada día… en las asociaciones entre comidas y objetos nocivos y entre las asociaciones de las comidas con algunas de sus consecuencias.

La aversión al sabor puede aprenderse si la ingestión de un sabor nuevo va seguida de una enfermedad o de otras consecuencias nocivas. Las preferencias por un sabor pueden aprenderse si un sabor se asemeja con la sensación de saciedad u otras consecuencias positivas.

Una cantidad creciente de evidencia indica que muchas de las aversiones al sabor de los humanos son también el resultado de condicionamiento pavloviano. Gran parte de esta evidencia se han obtenido en estudios basados por cuestionarios. Todas las personas han adquirido aversión a una comida en su vida. El emparejamiento del sabor y la

enfermedad puede dar lugar a una aversión condicionada al alimento en un único ensayo, y el aprendizaje puede tener lugar incluso si la enfermedad se manifiesta varias horas después de la ingestión de la comida. El 20% de las personas estaban seguras de que la enfermedad no se la provocó la comida, pero adquirieron una aversión a esa comida. Lo que indica que el aprendizaje de aversión al sabor puede ser independiente de los procesos de pensamiento racional y que puede ser contrario a las conclusiones de una persona sobre la causa de su enfermedad.

La quimioterapia puede provocar nauseas como efecto secundario. Los enfermos de cáncer, niños y adultos adquieren aversiones a los alimentos ingeridos justo antes de su sesión de quimioterapia, esto puede contribuir a la falta de apetito observada entre estos pacientes.

La aversión condicionada al sabor puede provocar una anorexia al suprimir la ingestión de alimentos. La anorexia que acompaña a la aparición de algunos tumores puede ser el resultado de un aprendizaje de aversión al sabor. Este aprendizaje de aversión al sabor puede también contribuir a la aparición de anorexia nerviosa, caracterizado por una perdida de peso fuerte y crónica. Incluso este aprendizaje de la aversión al sabor puede contribuir a la perdida de apetito en personas con depresiones severas.

Muchos de estos conocimientos sobre aprendizaje de aversión al sabor se han descubierto con anormales de laboratorio.

La aversión al sabor es el resultado del emparejamiento de un EC (el sabor) con un EI (una droga o exposición a radiación), de forma similar a otros ejemplos de condicionamiento clásico, y sigue las mismas leyes de aprendizaje en muchos aspectos. También tiene características especiales.

Primera característica los estudios de laboratorio han demostrado que con un solo emparejamiento del sabor y la humedad, puede aprenderse una fuerte aversión al sabor. En el condicionamiento del miedo pasa lo mismo, pero no es tan fuerte, ni tan común, si es que se da el condicionamiento palpebral, el salival o el seguimiento del signo.

La segunda característica única del aprendizaje de aversión al sabor es que tiene lugar incluso si los animales no enferman has varias horas después de la exposición al sabor novedoso.

Probablemente el aprendizaje demorado, de la aversión al sabor ha evolucionado para permitir a los animales (humanos y no humanos) evitar alimentos venenosos con efectos retardados.

Un experimento de Smith y Roll (1967) es un ejemplo de aprendizaje demorado de aversión al sabor. Se sometió a unas ratas de laboratorio a un programa de privación de agua, de modo que estuvieran motivadas para beber cuando se ponía un recipiente con agua en su caja experimental. El día del condicionamiento tuvieron acceso durante 20 minutos a una solución de agua con sacarina al 0,1%. En diferentes momentos tras la presentación de la sacarina en un rango de 0 a 24horas, diferentes grupos fueron expuestos a radiación de una maquina de rayos X. Los grupos de control también fueron llevados a la máquina de rayos X pero no fueron irradiados. Se les llamó grupo falsamente irradiados. Empezando al día siguiente del tratamiento de irradiación, se dio

a cada rata la oportunidad de elegir entre beber la solución de sacarina o agua normal durante dos días.

En la figura se muestra la preferencia de cada grupo de animales por la solución de sacarina. Loa animales expuestos a la radiación 6h después de probar la solución de sacarina mostraron aversión a la sacarina en la prueba. Menos el 20% de su ingestión total de liquido correspondía al tubo de la sacarina. Los animales irradiados 12h después de la exposición a la sacarina mostraron una aversión mucho menor, y casi no se notó aversión en las ratas irradiadas 24h después de la exposición al sabor. En contraste con este patrón de evitación de la sacarina observado en el grupo de ratas irradiadas, todos los grupos falsamente irradiados prefirieron la solución de sacarina. Más del 70% de la ingestión total del líquido lo bebieron del tubo de la sacarina.

PROCEDIMIENTOS DE CONDICIONAMIENTO PAVLOVIANO EXCITATORIO

Hasta ahora todo lo que se ha visto son ejemplos de condicionamiento pavloviano excitatorios.

En el condicionamiento excitatorio, los organismos aprenden una asociación entre los estímulos condicionados e incondicionados. Como resultado de esta asociación, la presentación del estímulo condicionado activa la actividad conductual y neural relacionada con el EI, sin la presentación real del EI. Los procesos relacionados con el EI son los que generan las respuestas condicionadas que se observan. De esta forma las palomas aprenden a aproximarse y picotear una tecla luminosa que va seguida de comida, las ratas aprenden a asustarse de un sonido que precede a una descarga eléctrica, los conejos aprenden a parpadear en respuesta a un tono que precede un soplo de aire y las ratas aprenden a beber la sacarina que va seguida de malestar. En todos los casos el EC adquiere la capacidad de activar la conducta relacionada con el EI asociado.

Procedimientos típicos de condicionamiento pavloviano

La ordenación temporal del EC y el EI es uno de los factores críticos que determinan el curso del condicionamiento clásico. Variaciones aparentemente pequeñas en la forma de emparejar el EC y el EI pueden tener importantes efectos en la intensidad de la respuesta condicionada.

En esta figura se muestra cinco procedimientos típicos de condicionamiento clásico. La distancia horizontal de cada diagrama representa el paso del tiempo; el desplazamiento vertical indica el momento en que cada estímulo aparece y desaparece. Cada configuración del estímulo condicionado y el estímulo incondicionado, representa un único ensayo de condicionamiento.

En un experimento típico de condicionamiento clásico los episodios de EC-EI se repiten varias veces en una sesión de entrenamiento. Al tiempo entre el final de un ensayo y el comienzo de otro se le llama, intervalo entre ensayos. El tiempo entre el comienzo entre el EC y el EI dentro del mismo ensayo del condicionamiento se llama intervalo entre estímulos o intervalo EC-EI.

Para que haya una respuesta condicionada, el intervalo entre estímulos tiene que ser más corto que el intervalo entre ensayos.

1. Condicionamiento de demora corta consiste en demorar el comienzo del EI ligeramente tras el comienzo del EI ligeramente tras el comienzo del EC en cada ensayo. Su principal característica es que cada ensayo comienza con el EC, y el EI se presenta tras una demora (menos de un minuto). El EC puede continuar durante el EI o terminar cuando empieza el mismo.

2. Condicionamiento de huella se parece al procedimiento de demora corta en el que el EC se presenta primero y le sigue el EI. Sin embargo en este condicionamiento el EI no se presenta hasta que ha transcurrido cierto tiempo desde la terminación del EC. Esto deja un espacio temporal entre el EC y el EI. Este espacio se llama intervalo de huella.

3. Condicionamiento de demora larga también se parece al de demora corta en que el EC también empieza antes que el EI, pero en este el EI se demora durante más tiempo (5-10 minutos) que en el procedimiento de demora corta. El procedimiento de demora larga no incluye un intervalo de huella. El EC dura hasta que el EI empieza.

4. Condicionamiento simultáneo es quizá la forma más obvia de exponer a los sujetos a un EC junto con un EI sea presentar ambos al mismo tiempo, por eso se llama simultáneo.

5. Condicionamiento hacia atrás en este caso el EI ocurre poco antes que el EC, y se llama hacia atrás debido a que el EC y el EI se presentan en el orden contrario al de los otros procedimientos.

Medida de las respuestas condicionadas

Para poder comparar los diferentes procedimientos, los investigadores deben utilizar un método para medir el condicionamiento que sea igualmente aplicable a todos los procedimientos. Eso normalmente se hace mediante un ensayo de prueba que consiste en la presentación del EC aislado (sin el EI). Así puede observarse la respuesta provocada por el EC sin la contaminación de las respuestas provocadas por le EI. Estos ensayos se pueden introducir a lo largo del curso de entrenamiento para hacer un seguimiento del aprendizaje.

La conducta que tiene lugar durante el EC se puede cuantificar:

• Por la magnitud de las respuesta condicionada, que es la cantidad de conducta que tiene lugar. Por ejemplo Pavlov midió el número de gotas de saliva elicitadas por el EC, otro ejemplo puede ser la cantidad de supresión de la conducta que tiene lugar en el procedimiento REC.

o Probabilidad de la respuesta frecuencia con la que el EC provoca una respuesta condicionada. Por ejemplo puede medirse el porcentaje de ensayos en los que el EC provoca una respuesta condicionada. Esta medida se puede utilizar en los estudios del condicionamiento palpebral.

• Por la latencia rapidez la respuesta condicionada tras la aparición del EC y es la cantidad de tiempo que pasa entre el principio del EC y la aparición de la respuesta condicionada.

o En los procedimientos de demora y huella el EC aparece de forma aislada al principio de cada ensayo. Cualquier conducta condicionada

que tenga lugar al inicio del EC aislado no está contaminada por la conducta provocada por el EI y por tanto puede ser utilizada como medida del aprendizaje. En los ensayos de condicionamiento simultáneo y hacia atrás la respuesta durante el EC puede reflejar la presencia del EI, por lo que los ensayos de prueba serán cruciales para evaluar el aprendizaje en el condicionamiento simultáneo y hacia atrás.

Procedimientos de control en el condicionamiento clásico

Para estar seguros de que un procedimiento de condicionamiento es el causante de determinados cambios en la conducta, deben compararse esos cambios con los efectos de un procedimiento de control. ¿Cual debería ser ese procedimiento de control? Se requieren procedimientos de control más complicados que los utilizados en los estudios sobre habituación y sensibilización, pues sólo eran de interés los efectos de exposición previa a un estímulo. En los estudios sobre el condicionamiento clásico, el interés se centra en la forma en como se asocian los estímulos condicionado e incondicionado.

Una asociación entre un EC y un EI implica que los dos eventos han quedado conectados de alguna forma. Después de que la asociación se ha establecido, el EC adquiere la capacidad de activar procesos relacionados con el EI. Para concluir que se ha establecido una asociación, debemos asegurarnos de que el cambio conductual observado no podría haberse producido por la mera presentación del EC o del EI por separado.

La presentación de un estímulo activador como la comida, en el caso de un animal hambriento, puede incrementar la conducta provocada por un estímulo menos efectivo, como un tono, sin que se haya establecido una asociación entre los dos estímulos. Por lo que el incremento en la respuesta que se observa en el emparejamiento repetido el EC y EI, podría ser en realidad, el resultado de la mera exposición al EI. Los casos en los que la mera exposición al EI da lugar a respuestas similares recibe el nombre de pseudocondicionamiento. Para determinar si las respuestas que se dan ante el EC representan una asociación entre EC y EI en lugar de un efecto de sensibilización debido a la exposición a los estímulos condicionados e incondicionados, se requiere un procedimiento de control.

Un procedimiento de control útil, consiste en la presentación de los estímulos condicionados e incondicionados en diferentes ensayos. A este procedimiento se le denomina control desemparejado explícito. En este procedimiento los estímulos condicionados e incondicionados se presentan separados para evitar que se asocien. La cantidad de tiempo que debe de pasar entre ellos dependen del sistema de respuesta. En el aprendizaje de aversión al sabor debe de pasar más tiempo entre EC y EI que en otras formas de condicionamiento. Hay una variante del control desemparejado explícito en la que sólo se presentan ECs durante la primera sesión y EIs en la segunda.

Eficacia de los procedimientos típicos de condicionamiento

Hay gran interés por determinar cual de los procedimientos produce más muestras de aprendizaje. Tradicionalmente los investigadores siguieren la dirección marcada por Pavlov, y se centraron en una única medida directa de aprendizaje. Los laboratorios se adaptaron para realizar experimentos utilizando sólo una de las preparaciones comunes

del condicionamiento (condicionamiento del miedo, palpebral, del seguimiento del signo o de aversión al sabor) y los equipos estaban diseñados para registrar sólo la respuesta de interés para ese laboratorio. Tras afirmarse en una medida específica de aprendizaje, el investigador estaba preparado para examinar el aprendizaje en los procedimientos de demora, simultáneo, huella y hacia atrás. Se suponía que el condicionamiento pavloviano producía una asociación EC-EI cuya fuerza quedaría reflejada directamente en el vigor de la RC (respuesta condicionada).

El resultado de los estudios realizados con los cinco procedimientos de la figura 3.7 se resume prestando atención al intervalo temporal entre el principio de EC y el principio de EI (intervalo entre estímulos o intervalo EC-EI). En general se observa poco condicionamiento en los procedimientos de condicionamiento simultáneo, en los que el intervalo EC-EI es cero. Una ligera demora de la presentación del EI tras el EC facilita la respuesta condicionada. Sin embargo esta facilitación estaba claramente limitada. Si el intervalo EC-EI se incrementa más, la respuesta condicionada disminuirá, en el procedimiento de aversión al sabor, en el que el aprendizaje es posible con intervalos EC-EI de 1 o 2 horas, la respuesta condicionada disminuye a medida que el intervalo EC-EI aumenta. (Figura 3.6).

Los procedimientos de condicionamiento de huella son interesantes por que se mantiene el mismo intervalo EC-EI que los procedimientos de condicionamiento de demora. Sin embargo en el de huella el EC desaparece un poco antes que el EI. Tradicionalmente el condicionamiento de huella se ha considerado menos efectivo que el de demora. Al igual que en el condicionamiento de demora, se observa, menos condicionamiento con el procedimiento de huella cuando se incrementa el intervalo entre EC y EI.

Estos descubrimientos realzaron la idea de que el condicionamiento es más efectivo cuando el EC es una buena señal de que el EI pronto aparecerá. El valor de la señal del estímulo condicionado es mejor en el procedimiento de demora corta, en el que el EI tiene lugar poco después de la aparición de EC. El valor de la señal del EC se reduce a medida que se incrementa el intervalo EC-EI. El EC también es un mal predictor del EI en los procedimientos simultáneos y de huella. En el condicionamiento simultáneo, el EI aparece a la vez que el EC, por tanto, no está señalado por el EC. En el condicionamiento de huella el EC va seguido por el intervalo de huella, en lugar de por el EI. El condicionamiento hacia atrás produce resultados ambiguos. Tait y Saladin (1986) encontraron efectos de condicionamiento tanto excitatorio como inhibitorio como resultado del mismo procedimiento de condicionamiento hacia atrás.

Algunos estudios han demostrado que los procedimientos simultáneo, de demora, de huella y hacia atrás, pueden producir un aprendizaje sólido, y una respuesta condicionada fuerte, pero lo que los sujetos aprenden es diferente en cada procedimiento. El sujeto no sólo aprende que el EC está asociado con el EI, sino también cuando ocurre el EI en relación al EC. A esto se le denomina hipótesis de la codificación temporal.

CONDICIONAMIENTO PAVLOVIANO INHIBITORIO

Hasta ahora se ha hablado del condicionamiento pavloviano en términos de aprendizaje, para predecir cuando va a aparecer un evento significativo o condicionamiento incondicionado. Pero hay otro condicionamiento en el que los sujetos aprenden a

predecir la ausencia del estímulo incondicionado. Un ejemplo sería: los niños que son mal tratados en sus casas sus padres pueden pegarles o gritarles sin ninguna razón, sin aviso.

La investigación con animales demuestra que la exposición a estímulos aversivos impredecibles, produce úlceras de estómago y estrés. Otra fuente de estrés es el ataque de pánico, tiene unos síntomas físicos, como taquicardias y sensación de desastre inminente. Si estos ataques son muy seguidos y le produce una ansiedad considerable se dice que el sujeto padece trastornos de pánico.

Los individuos con ataques de pánico a veces pueden predecirlos otras no.

Graske, y DeCola (1995) en un estudio con sujetos que experimentaban ataques de pánico predecibles e impredecibles, midieron la ansiedad de cada sujeto antes y después de cada ataque.

Antes del ataque, los niveles de ansiedad eran similares independientemente de que el ataque fuera predecible o no. Sin embargo, la ansiedad se incrementaba significativamente tras un ataque de pánico imprevisto. Estos resultados indican que la ansiedad generada por la experiencia de pánico tiene lugar a causa de la imprevisibilidad de los ataques.

¿Por qué son preferibles los estímulos aversivos predecibles a los eventos impredecibles? Una posibilidad sería que la capacidad de predecir la aparición de un evento aversivos, también permite predecir la ausencia de estimulación aversiva, y el hecho de predecir esa ausencia puede ser un factor crítico. Según este razonamiento, las técnicas efectivas para reducir el estrés (relajación, meditación) conlleva la creación de un período de seguridad de que no tendrán lugar eventos aversivos. Los expertos en estrés dicen que es imposible eliminar los eventos aversivos de la vida de una persona para siempre; no es posible prevenir los accidentes, o que un niño no pegue a otro.

Las señales que predicen la ausencia de un estímulo aversivo son estímulos condicionados inhibitorios.

Pavlov descubrió el condicionamiento inhibitorio a comienzos del siglo XX, pero no despertó interés hasta décadas después.

A diferencia del condicionamiento excitatorio, la inhibición condicionada sigue siendo objeto de discusión.

Procedimientos de condicionamiento inhibitorio

La diferencia con el condicionamiento excitatorio es que este –el excitatorio- puede proceder sin condiciones previas especiales, la inhibición condicionada tiene un requisito importante. Para que la ausencia del EI sea significativa, este debe ocurrir periódicamente en la situación. Hay señales de ausencia de eventos en nuestra vida diaria como las señales de fuera de servicio, cerrado. La misma señal despertaría poco interés si no estuviera colocada en el sitio idóneo.

Es decir, el condicionamiento inhibitorio y el control inhibitorio de la conducta sólo tienen lugar si hay un contexto excitatorio para el EI en cuestión. El condicionamiento excitatorio no depende del mismo modo de un contexto especial.

Procedimiento estándar de inhibición condicionada

El procedimiento que utilizó Pavlov requiere dos estímulos condicionados y dos tipos de ensayo de condicionamiento. Uno para el condicionamiento excitatorio y otro para el inhibitorio. El EI se presenta en los ensayos de condicionamiento excitatorio y siempre que aparece el EI va anunciado por el estímulo condicionado etiquetado como EC+( por ejemplo un tono) debido a los emparejamientos con el EI, el EC+ se convierte en una señal de EI y sirve para proporcionar el contexto excitatorio necesario para el desarrollo de la inhibición condicionada.

En los ensayos de condicionamiento inhibitorio, el EC+ se presenta junto con el segundo estímulo condicionado, El EC (por ejemplo una luz) y no se presenta el EI. Por tanto, el EC- se presenta en el contexto excitatorio proporcionado por el EC+ pero no se empareja con el EI. Esto convierte al EC- en un inhibidor condicionado. A lo largo del tratamiento los ensayos Ay B se alternan de forma aleatoria.

El procedimiento estándar de inhibición condicionada es análogo a la situación en la que se introduce algo que previene un resultado que de otra forma ocurriría. Un semáforo rojo en un cruce transitado es una señal EC+ de un peligro potencial EI. Pero si un agente de policía nos indica que podemos cruzar a pesar de la luz roja, es poco probable que tengamos un accidente. No es probable que la luz roja EC+ junto con los gestos del agente EC- vayan seguidos de peligro. Los gestos actúan como un EC- y que inhiben o bloquean nuestra negativa a cruzar la calle con la luz roja.

Procedimiento estándar de inhibición condicionada en algunos ensayos (tipo A) el EC+ se empareja con el EI. En otros ensayos (tipo B) el EC+ se presenta junto con el EC- y se omite el EI. El procedimiento resulta efectivo para condicionar propiedades inhibitorias al EC-

Contingencia o correlación negativa entre el EC y el EI

Una contingencia negativa indica que el EI es menos probable tras el EC que en otro momento. Por tanto el EC señala una reducción en la probabilidad de que aparezca el EI.

Imaginemos un niño con el que se meten los compañeros cuando el maestro está fuera del aula, esto es semejante a recibir periódicamente un estímulo aversivo o EI. Cuando el profesor vuelve el niño puede estar seguro de que no le molestaran. Por lo que el maestro funciona como EC- que señala un período libre de acoso, o la ausencia del estímulo incondicionado.

La inhibición condicionada se observa constantemente en procedimientos en los que el único estímulo condicionado explícito está correlacionado negativamente con el EI. (Rescolda 1969).

En el procedimiento de contingencia negativa EC-EI, el EI puede aparecer de vez en cuando tras el EC, pero con una probabilidad pequeña. Es más probable que el EI aversivo aparezca en ausencia del EC, dando lugar a una contingencia negativa entre el EC y el EI. Pero aún en ausencia de EC, el momento exacto de presentación del EI no se puede predecir. El EI tiene lugar de forma probabilística, a diferencia del procedimiento estándar de inhibición condicionada. En el procedimiento estándar el EI siempre aparece al final del EC+ y no aparece cuando se presenta el EC- junto con el EC+. El procedimiento estándar permite predecir la aparición del EI también permite predecir cuando no aparece.

Por tanto, el procedimiento estándar de inhibición condicionada permite la codificación temporal de la ausencia del EI.

Medición de la inhibición condicionada

Los estímulos condicionales excitatorios adquieren la capacidad de elicitar respuestas que no se observaban anteriormente. Los estímulos condicionados excitatorios consiguen provocar respuestas como salivación, aproximación, parpadeo, dependiendo del EI. Es de esperar que los estímulos condicionados inhibitorios eliciten reacciones opuestas a estas tales como supresión de la salivación, de la aproximación o de el parpadeo.

¿Pero como pueden medirse estas respuestas opuestas?

Procedimiento de contingencia negativa EC-EI para condicionar propiedades inhibitorias al EC.

Se observa que el EC siempre va seguido de un período sin el EI.

Sistemas de respuestas bidireccionales

El ritmo cardíaco, la respiración y la temperatura corporal, pueden aumentar o disminuir con relación a una línea base. Ciertas respuestas conductuales son bidireccionales. Esto es muy característico de muchas respuestas fisiológicas.

El procedimiento de seguimiento del signo se ha utilizado para proporcionar evidencia de condicionamiento inhibitorio mediante respuestas bidireccionales. Una paloma se acercará a una tecla luminosa asociada con la presentación subsiguiente de comida. Pero cuando se utiliza un procedimiento de condicionamiento inhibitorio, la paloma se aleja del EC.

Aunque los síntomas de respuesta bidireccionales pueden proporcionar evidencia de inhibición condicionada, la técnica resulta limitada y su uso no se ha extendido. Una limitación es que este método funciona sólo con repuestas que pueden ir en direcciones opuestas. Otra limitación menos obvia es que esta técnica puede mostrar sólo el efecto neto de la excitación y la inhibición.

La prueba del estímulo compuesto o sumación

¿Cómo se puede medir la inhibición cuando la conducta no es bidireccional?

Se pone como ejemplo la respuesta de parpadeo que se estudia con conejos. En ausencia de un estímulo elicitante, los conejos rara vez parpadean. Si se ha condicionado un estímulo para inhibir la respuesta de parpadeo, los investigadores tampoco observan parpadeo cuado se presenta este estímulo.

Para concluir que un estímulo inhibe activamente el parpadeo, los investigadores deben utilizar procedimientos de prueba más sofisticados. Uno de estos procedimientos es la prueba de sumación o del estímulo compuesto.

La prueba de estímulo compuesto o prueba de sumación fue muy popular en la época de Pavlov y se está convirtiendo en el método más aceptable para la medición de la inhibición condicionada, en los estudios actuales. La prueba de estímulo compuestos compensa las dificultades originadas por una baja línea base presentando un estímulo condicionado excitatorio que provoca la respuesta condicionada. La inhibición condicionada se mide a partir de la reducción o inhibición de esta respuesta condicionada. La prueba requiere observar los efectos de un EC inhibitorio, en compuesto con un EC+ excitatorio. El procedimiento también se puede entender como la observación de la sumación de los efectos del estímulo inhibitorio (EC-) y el estímulo excitatorio (EC+).

Cole, Barnet y Miller (1997) presentaron una demostración de inhibición condicionada utilizando la prueba del estímulo compuesto o sumación. El experimento se realizó usando el procedimiento de supresión de lameteo con ratas de laboratorio. Los sujetos recibieron un condicionamiento inhibitorio en el que la presentación de una luz terminaba siempre con una breve descarga (A+) y la presentación de una clave auditiva (X) que junto con la luz terminaba sin la descarga (AX-), se utilizó el procedimiento estándar de inhibición condicionada. El condicionamiento inhibitorio se realizó en siete sesiones en los que el sujeto recibió un total de 28 ensayos A+ y 56 ensayos AX -. Recibieron también entrenamiento con otro estímulo auditivo (B) en una cámara experimental diferente y este estímulo terminaba con una breve descarga (B+). El objeto de este procedimiento era establecer una excitación condicionada a dos estímulos diferentes, A y B, y una inhibición condicionada al estímulo X.

Cole y sus colegas luego se preguntaron si la clave presuntamente inhibitoria X suprimiría la respuesta a los dos estímulos excitatorios Ay B.

Los estímulos A y B se condicionaron como estímulos excitatorios mediante la presentación de cada uno de ellos por separado junto con la descarga (A+ y B+). El estímulo X se condicionó como inhibidor presentándolo junto con el estímulo A si la descarga (AX-). El estímulo Y era un estímulo de control que no había intervenido en ningún condicionamiento excitatorio o inhibitorio. A era una luz brillante, B, X e Y eran claves auditivas (un clip, un ruido blanco y un zumbador, contrabalanceados). A y AX se pusieron a prueba en el contexto original del condicionamiento B, BX y BY se pusieron a prueba en un contexto diferente.

Se midió el tiempo que los sujetos tardaron en beber agua durante cinco segundos de forma ininterrumpida. Cuando los estímulos A y B se presentaron de forma aislada, las ratas tardaron un tiempo considerable en completar el criterio de cinco segundos de ingestión. Pero cuando los estímulos excitatorios se presentaron junto con el inhibidor condicionado, tardaron menos en completar el criterio de cinco segundos de ingestión.

El hecho de presentar el estímulo X con A y B redujo la conducta de supresión de beber que tenía lugar cuando A y B se presentaban por su cuenta.

En otra condición de prueba (que se incluye en la figura 3.12) el estímulo B se puso a prueba junto con otra clave auditiva Y. El estímulo Y no se condicionó previamente como inhibidor y se presentó para asegurarse de que la introducción de un estímulo novedoso junto con el estímulo B no daría lugar a una alteración de la respuesta condicionada de miedo. Pero tal alteración no tuvo lugar con el estímulo Y. Por lo que la inhibición del miedo se limita al estímulo X. X fue capaz de inhibir el miedo condicionado no sólo ante el excitador con el que fue entrenado A sino ante otro excitador B que nunca se presentó junto con X durante el entrenamiento.

El procedimiento de prueba del estímulo compuesto para la inhibición condicionada supone que la presentación de un inhibidor condicionado o de una señal de seguridad puede reducir los efectos estresantes de una experiencia aversiva.

Se invitó a una serie de pacientes con ataques de pánico a acudir a los laboratorios acompañados de alguien con quien se sintieran seguros. Se les hizo inhalar una mezcla de gas con altos niveles de dióxido de carbono, y posteriormente se les pidió que informaran de sus niveles de ansiedad percibida y de la ideación catastrofista provocada por la exposición al dióxido de carbono. La manipulación experimental fue la presencia de los acompañantes. A la mitad de los participantes se les permitió permanecer con sus acompañantes en la misma habitación durante el experimento, y la otra mitad estuvieron solos durante el experimento. Los resultados demostraron que la presencia de la persona que inspiraba seguridad a los participantes reducía a la mitad la ansiedad y la ideación catastrofista asociada al ataque de pánico.

La prueba del retraso en la adquisición. Si un estímulo inhibe de forma activa una respuesta particular, entonces debería ser difícil de condicionar ese estímulo para que provoque la conducta. Es decir, la velocidad de la adquisición de una respuesta excitatoria debería disminuir si el EC es un inhibidor condicionado. Cole y colaboradores en (1997) hicieron un experimento muy similar al de la prueba de sumación anterior.

Tomaron el estímulo X (que había sido condicionado como inhibidor) y el estímulo Y (que no había sido utilizado con anterioridad en el procedimiento de condicionamiento) y realizaron una prueba de retraso en la adquisición emparejando tres veces cada uno de estos estímulos con una descarga. Tras los tres ensayos de adquisición, cada estímulo se sometió a prueba para ver cual provocaba una mayor supresión de la conducta de beber.

Efectos de una prueba de inhibición en el retraso en la adquisición en un experimento de supresión de lameteo tras el mismo tipo de condicionamiento inhibitorio empleado para predecir los resultados que se presentan en la figura 3.12. El estímulo X se había condicionado previamente como estímulo inhibitorio, y el estímulo Y no había recibido entrenamiento previo.

El tiempo empleado en completar un total de cinco segundos de ingestión de agua fue mayor en presencia del estímulo de control Y que en presencia del estímulo X. Por lo que el entrenamiento inicial de X retrasó la adquisición de propiedades excitatorias de miedo condicionado.

Rescolda, propuso (1969) la utilización tanto de la prueba del estímulo compuesto como la del retraso de la adquisición.

PREDOMINIO DEL CONDICIONAMIENTO CLÁSICO

El condicionamiento clásico puede tener lugar siempre que un estímulo precede regularmente a otro, y con una demora corta entre el EC y el EI. Se estudia normalmente en laboratorio pero se da también en una gran variedad de situaciones fuera de él.

Una investigación interesante es como las personas llegan a considerar que un evento es la causa de otro.

Los estudios sobre juicios causales humanos se parecen a los estudios sobre condicionamiento pavloviano en que ambos conllevan experiencias repetidas con dos eventos y respuestas basadas en el grado que esos dos eventos están relacionados. Lo que quiere decir que los mecanismos asociativos pavlovianos no se limitan a los perros de Pavlov sino que pueden tener un importante papel en los juicios de causalidad informales que realizamos en nuestra vida cotidiana.

El condicionamiento pavloviano también interviene en las respuestas de los niños y de las madres durante la lactancia. Para que el amamantamiento sea satisfactorio, la madre debe mantener al bebe en una posición determinada que proporciona estímulos táctiles especiales tanto para la madre como para el niño. Los estímulos táctiles que percibe el bebé pueden condicionarse y elicitar respuestas de orientación y succión. Los experimentados por la madre pueden condicionarse para elicitar la respuesta de secreción de la leche en anticipación de la conducta de succión del bebé.

El condicionamiento pavloviano es importante también en el aprendizaje acerca de situaciones sexuales.

Tema 4: Aprendizaje de relaciones Pavlovianas: Mecanismos.

¿A QUE DEBEN SU EFICACIA LOS ESTIMULOS CONDICIONADOS E INCONDICIONADOS?

RESPUESTAS INICIALES A LOS ESTIMULOS

Según pavlov el estimulo condicionado EC inicialmente no provoca la respuesta condicionada, pero acaba haciéndolo por el desarrollo de una asociación con el estimulo incondicionado. El EI elicita la respuesta solo sin entrenamiento. Estas respuestas son particulares debido a ello la identificación de ECs y EIs potenciales requieren la comparación entre las distintas respuestas antes del condicionamiento. La identificación de los ECs y de los EIs es relativa: un suceso puede servir de EC respecto a un estimulo y de EI respecto a otro.

NOVEDAD DE EC Y DE EI

El efecto conductual de un estimulo depende de su novedad (estudios habituación), tanto si el EC como el EI son familiares el aprendizaje es más lento que si ambos son novedosos, estudios sobre la novedad se realizan en dos fases.

1. Exposición repetida del estimulo de forma aislada 2. Ec se empareja con el EI mediante procedimiento estándar condicionamiento

clásico

La familiarización inicial con el estimulo retrasa el condicionamiento. Este fenómeno se denomina efecto de preexposicion al EC o efecto de inhibición latente, similar a la función de habituación, ambos limitan la cantidad de procesamiento y atención a estímulos sin consecuencias, la habituación sesga la conducta elicitada a favor de los Es (estímulos) novedosos, la inhibición latente sesga el aprendizaje a favor de los Es novedosos.

Los experimentos sobre la importancia de la novedad en el EI son parecidos a los experimentos de preexposicion al EC: EI aislado-Ei empareja con EC. Los sujetos familiarizados con el EI antes de su emparejamiento con el EC desarrollan el condicionamiento más lentamente, este efecto se llama efecto de preexposicion al EI

Aunque ninguna teoría consigue explicar todos los datos, actualmente se acepta que son varios los mecanismos involucrados, uno de ellos conllevaría cierta interferencia asociativa de acuerdo con esta teoría las preexposiciones al EC o al EI disminuyen la capacidad de estos estímulos para participar en nuevas asociaciones. La segunda explicación es la interferencia de memoria: la RC resulta alterada debido a que los participantes recuerdan lo que ocurre en ambas fases del experimento

INTENSIDAD Y SALIENCIA DEL EC I DEL EI

La RC es más fuerte cuando se utilizan ECs y EIs más intensos.

El término saliencia se corresponde con la significación o perceptibilidad. Las teorías del aprendizaje suelen asumir que el aprendizaje será más rápido si se usan estímulos mas salientes: Un estimulo puede adquirir saliencia aumentando su intensidad también haciéndolo más relevante en relación a las necesidades biológicas del organismo o hacer que el EC del laboratorio se parezca más al tipo de estímulos que el animal puede encontrar en su hábitat natural

RELEVANCIA O PERTINENCIA DEL EC-EI

Otra variable que afecta al ritmo de desarrollo del condicionamiento clásico es el grado en que el EC es relevante o pertinente con respecto al EI. Gracia y Koelling (1996) lo demostraron en un experimento ya clásico (ver libro pág. 94), este experimento ilustra el principio de relevancia. El aprendizaje tuvo lugar rápidamente solo si el EC se combinaba con el EI apropiado, el fenómeno parece reflejar una predisposición genética para la asociación selectiva de ciertas combinaciones de estímulos condicionados e incondicionados. LoLordo y asociados también han documentado efectos de relevancia en palomas: las claves visuales son relevantes para la conducta de alimentación y las claves auditivas son relevantes para la conducta defensiva. También se observa conducta de relevancia en la adquisición del miedo.

EL CONCEPTO DE FUERZA BIOLOGICA

Las respuestas ante el EC no son tan fuertes como las respuestas ante el EI antes del condicionamiento. Pavlov era consciente de esta diferencia en la fuerza biológica de los estímulos y considero que esta diferencia era necesaria para que fueran efectivos como estímulos C e I, sugirió que para que un estimulo se condicionara debía tener una fuerza biológica menor que la del estimulo incondicionado, inicialmente el EC debía elicitar menos respuestas y más débiles que el EI

Condicionamiento de orden superior: Un estimulo puede hacer de EI tras haber sido fuertemente condicionado, ej. Tono- comida, el tono elicitara salivaciones como fuertes respuestas de orientación y aproximación, en este momento el tono debería ser efectivo a la hora de condicionar la salivación a una luz, este efecto se observa con frecuencia y recibe el nombre de condicionamiento de orden superior, opera en diferentes niveles: tono-comida, condicionamiento de primer orden, luz –tono, condicionamiento de segundo orden, si tras esto la luz se condicionara con otro estimulo, condicionamiento de tercer orden.

Con pocos ensayos no reforzados se obtiene condicionamiento excitatorio de segundo orden. Con entrenamiento más extenso, se desarrolla inhibición condicionada.

Con el condicionamiento de orden superior, el condicionamiento clásico puede ocurrir sin un estimulo incondicional primario, el único requisito es que estén disponibles estímulos previamente condicionados

Contracondicionamiento: Dos estímulos pueden quedar asociados el uno con el otro aunque ambos eliciten inicialmente respuestas intensas. La respuesta que un animal da a un EC se invierte o contrarresta emparejando ese estimulo con un EI que provoca una reacción opuesta

Precondicionamiento sensorial: Se pueden aprender asociaciones entre dos estímulos que tan solo elicitan una débil respuesta de orientación antes del condicionamiento, ej. : triangulo y cuadrado no EC, en la segunda fase del experimento se empareja triangulo con un estimulo incondicionado, descarga, triangulo=miedo, ahora también el cuadrado da miedo.

¿QUE DETERMINA LA NATURALEZA DE LA RESPUESTA INCONDICONADA?

EL MODELO DE SUSTITUCION DEL ESTIMULO

El EC adquiere la capacidad de funcionar como el EI, por tanto se asume que el EC activa los circuitos neuronales que antes activaba solo el EI y elicita respuestas similares a las del EI. Pavlov sugirió que el condicionamiento da lugar al establecimiento de nuevos enlaces neuronales entre los circuitos que previamente activaba el EC y los que, previamente, solo activaba el EI, una vez que esta conexión se ha establecido, la presentación del EC da lugar a la activación de los circuitos del EI que a su vez generan la respuesta incondicionada, por tanto el EC se convierte en un sustituto del EI

El EI como factor determinante de la RC: Si el condicionamiento convierte al EC en sustituto del EI entonces los ECs condicionados con diferentes EIs deberían provocar diferentes tipos de respuestas condicionadas.

La naturaleza de la RC depende del EI; Jenkins y Moore (1973) ver libro pag101: El EC condicionado con la comida provocaba los picoteos relacionados con la comida, y el EC condicionado con agua provocaba los picoteos relacionados con la bebida.

APRENDIZAJE Y HOMEOSTASIS. UN CASO ESPECIAL DE SUSTITUCION DEL ESTIMULO

Cannon introdujo el termino homeostasis para referirse a los mecanismo fisiológicos que mantiene los aspectos críticos del cuerpo dentro de los niveles aceptables, estos mecanismo funcionaban por procesos de retroalimentación negativa que servían para contrarrestar las alteraciones una vez que estas ya habían provocado una desviación de los niveles óptimos, esto puede resultar ineficiente, especialmente si el proceso de compensación o corrección tarda en activarse. Dworking (1993) señalo que las alteraciones en la homeostasis pueden compensarse más activamente si pueden anticiparse mediante condicionamiento pavloviano

Las respuestas homeostáticas condicionadas se han examinado más extensamente en relación a la forma en que los organismos responden a la administración de drogas, suelen provocar alteraciones fisiológicas que afectan a la homeostasis que activan reacciones compensatorias condicionadas. Las claves que se asocian con la alteración fisiológica inducida por la droga pueden llegar a elicitar estas reacciones compensatorias como respuestas condicionadas anticipatorias.

Tanto las medidas fisiológicas como los autoinformes sobre el estado emocional proporcionaron pruebas de que los estímulos relacionados con la cocaína elicitaban

respuestas condicionadas, incremento significativo del ritmo cardiaco especifico de los estímulos relacionados con la cocaína

El modelo de condicionamiento de tolerancia a las drogas: Se considera que se ha desarrollado tolerancia a las drogas cuando las administraciones repetidas de las mismas tiene un efecto cada vez menor, tradicionalmente se ha considerado esta tolerancia como debida a procesos farmacológicos, Siegel, en contraste ha propuesto un modelo basado en el condicionamiento clásico utilizando el concepto de homeostasis aprendida: los cambio fisiológicos producidos por la droga constituyen el EI que pone en marcha ajustes compensatorios incondicionados RI,.

Como resultado de la asociación con la droga, las claves que acompañan a la administración de esta adquieren la propiedad de elicitar las respuestas compensatorias que previamente se activaban como respuestas incondicionadas a las alteraciones homeostáticas atenuando los efectos de la droga, en consecuencia una importante predicción de esta teoría es que la tolerancia se verá atenuada si los sujetos reciben la droga en condiciones novedosas o en ausencia de las claves que normalmente predicen su consumo. El modelo también predice que varios factores que atenúan el desarrollo de las respuestas incondicionadas también deberían atenuar el desarrollo de la tolerancia a la droga, esto ha sido confirmado por Siegel y colegas

El EC como determinante de la forma de la RC: La forma de la RC también está influenciada por la naturaleza del EC, Timberlake y Grant (1975) utilizaron comida como EI, el EC fue la presentación de otra rata justo antes de la administración de comida, el EC no provocó conductas de roer y morder, elicito respuestas de orientación, aproximación y olfateo, así como contactos de tipo social

Conducta condicionada y sistemas de conducta: Los diversos sistemas de conductas han evolucionado para permitir al animal llevar a cabo tareas criticas, cada sistema consiste en una serie de modos de respuesta, cada uno de ellos con sus propios estímulos y respuestas relevantes, dispuestos con determinado orden espacial y secuencial.

La teoría de los sistemas de conducta asume que la presentación del EI en un procedimiento de condicionamiento pavloviano activa el sistema de conducta relevante para ese EI.

Una predicción provocadora es que la forma de la RC dependerá del intervalo EC_EI que se utilice. Este intervalo determina el lugar en que se incorporara el EC dentro de la secuencia de respuestas del sistema de conducta. Ej. Akins 2000 pág. 107.Con un intervalo de ECEI 1 minuto el condicionamiento produjo búsqueda focalizada, con EC EI de 20 minutos búsqueda general. De acuerdo con la teoría el EC no sustituye ni compensa al EI, sustituye a un estimulo en el punto del sistema de conducta determinado por el intervalo EC EI

Aprendizaje E_R frente a aprendizaje E_E: Históricamente la conducta condicionada se veía como una conducta elicitada directamente por el EC de acuerdo con la teoría del aprendizaje E_R, establece una nueva conexión estimulo respuesta entre el EC y la RC. La teoría del aprendizaje E_E los sujetos aprenden una asociación estimulo-estimulo entre el EC y el EI, los sujetos responden al EC, no porque este elicite directamente una

RC, sino porque el EC activa una representación del EI. La presentación del EC hace que el sujeto piense en el EI y esta es la causa de la conducta condicionada.

Una técnica de investigación importante para decidir entre aprendizaje ER y EE es la de la devaluación del EI, Holland y Rescolda Ver libro pág. 108

¿COMO SE ASOCIAN LOS ESTIMULOS CONDICIONADOS E INCONDICIONADOS?

El efecto de bloqueo: Conlleva una secuencia de sucesos similar.1º-se asocia EC (estimulo a) y EI, una vez que el ECa está bien condicionado, se añade el segundo estimulo, estimulo b) al estimulo a y se presentan los dos juntos: el hallazgo básico es que el condicionamiento previo de a bloquea el desarrollo de la RC al estimulo b.

Este efecto se ha convertido en un fenómeno clave del condicionamiento clásico porque puso en duda el presupuesto de que la contigüidad temporal es suficiente para el aprendizaje

Kamin, su descubridor explico el efecto proponiendo que, para que se produzca aprendizaje de forma efectiva el EI debía ser sorprendente, los eventos inesperados activan procesos que llevan a un nuevo aprendizaje.

El modelo de Rescorla y Wagner

Mediante este modelo las implicaciones del concepto de sorpresividad del EI se extendieron a una amplia variedad de fenómenos de condicionamiento. Un EI inesperadamente grande es la base del condicionamiento excitatorio o del incremento de la fuerza asociativa, y un EI inesperadamente pequeño es la base del condicionamiento inhibitorio o de la disminución de la fuerza asociativa. AV=k(lambda-V), donde k es una constante relacionada con la salienza del EC y del EI.

Aplicación del efecto de bloqueo: ver libro pag113

Pérdida de valor asociativo a pesar de los emparejamientos con el EI. Gran parte de la importancia del modelo se debe a sus inusuales predicciones, una de tales predicciones es que en ciertas circunstancias, las propiedades condicionadas de los estímulos se reducirán a pesar de que siga habiendo emparejamientos con el EI el EI

Problemas del modelo Rescorla Wagner:

1. Su análisis de la extinción de la inhibición es incorrecto. Algunos investigadores han encontrado que no reforzar un EC- de forma repetida puede potenciar sus propiedades inhibitorias

2. el modelo considera la extinción como lo opuesto a la excitación, o a la vuelta a un valor asociativo 0, pero la extinción no debería verse como una mera inversión de la adquisición. La extinción parece involucrar el aprendizaje de una nueva relación entre el EC y el EI

3. En ciertas condiciones el mismo EC puede tener tanto propiedades excitatorias como inhibitorias, en el modelo no pueden ser ambos

4. El modelo tiene dificultades para explicar hallazgos recientes obtenidos en los paradigmas de aversión al sabor y olor, En experimentos similares al de efecto de bloqueo, cabria esperar que la presencia del EC previamente condicionado interfiriera en el condicionamiento del EC añadido en la fase 2: se encontró el resultado opuesto: un efecto de aumento o de contrabloqueo.

Otros modelos de condicionamiento clásico

Modelos atencionales de condicionamiento

Los británicos se han aproximado a fenómenos como el bloqueo postulando cambios en la forma en que el EC capta la atención del sujeto. Las teorías atencionales difieren en sus supuestos sobre qué es lo que determina la saliencia del EC en un ensayo. Pearce y Hall (1980) asumen que el grado de atención depende del grado de atención en el que el EI haya sido sorprendente en el ensayo anterior, esta es una diferencia importante con Rescorla Wagner que asumen que la sorpresividad del EI en un ensayo determina lo que se aprende en ese ensayo.

Factores temporales y respuesta condicionada

Por encima de un punto óptimo los procedimientos con intervalos EC EI más largos producen menos respuestas.

Otra variable temporal importante es el intervalo entre ensayos, en general en ensayos mas separados entre sí mayor respuesta condicionada. Más interesante resulta que el intervalo entre ensayos y la duración del EC interactúan a la hora de determinar la respuesta. Numerosos ensayos han mostrado que el factor crítico es la duración relativa de estas dos variables, más que el valor absoluto de las mismas.

Se han ofrecido varias interpretaciones sobre porque la respuesta condicionada esta tan fuertemente determinada por la razón IEE/DE:1ºHipotesis de espera relativo: se supone que un EC proporciona información acerca de la aparición del EI solo si el sujeto tiene que pasar menos tiempo esperando al EI que cuando esta simplemente expuesto al contexto experimental: cuando la Razón IEE/ED es baja, el tiempo de espera ante el EC es similar al tiempo de espera en el contexto: en este caso, el EC proporciona poca información adicional sobre el momento de aparición del EI y no se desarrollara mucha respuesta condicionada. Cuando la razón IEE/ED es alta, el tiempo de espera ante el EC es mucho menor que el tiempo de espera en el contexto. Esto hace que el EC aporte información sobre el momento que aparece el EI, y la respuesta condicionada será más fuerte

La hipótesis del comparador de R.Miller

Se parece a la hipótesis del tiempo de espera relativo, en que asume que la RC depende no solo de la asociación entre el EC y EI, sino también de todas las posibles asociaciones que puedan establecerse en claves contextuales y el EI. La fuerza asociativa de otras claves presentes durante el entrenamiento con el EC crítico es especialmente importante. Otra restricción del modelo del comparador es que solo permite asociaciones excitatorias con el EI. El modelo asume que el que la RC refleje excitación o inhibición eta determinado por la fuerza relativa de la excitación

condicionada al EC en comparación con la excitación condicionada a las claves contextuales presentes durante el entrenamiento del EC

Hace más hincapié en las asociaciones que en el tiempo: asume que los sujetos aprenden tres asociaciones

1. Une el EC crítico (X) con el EI. (de forma directa) 2. Une el EC crítico con las claves contextuales de comparación 3. Une los estímulos de comparación y el EI (de forma indirecta)

La hipótesis del comparador no indica cómo se establecen las asociaciones, se trata de una teoría de ejecución, no de aprendizaje.

La comparación entre las asociaciones (EC-EI) y (contexto-EI) se realiza en el momento de la prueba.

También se ha probado esta hipótesis en estudios sobre inhibición condicionada.

Atribuye la inhibición condicionada a situaciones en las que la asociación del EC crítico con el EI es más débil que la asociación de las claves contextuales con el EI. (esto se entiende observando la balanza de la página 120, en el medio tenemos un medidor apuntando al 0 y dependiendo de lo que tenga más valor se desplazará hacia la izquierda (inhibición) o hacia la derecha (excitación).

Es la única hipótesis que predice que la extinción de la inhibición condicionada se puede lograr no presentando el EC- de forma aislada, sino extinguiendo las claves que sirven de EC+ y que proporcionan el contexto excitatorio para el condicionamiento inhibitorio del EC-.

El modelo predice también que incrementar el valor excitatorio de las claves contextuales tras el tratamiento reducirá la respuesta condicionada del EC crítico.

Otra contribución ha sido suponer que las diferencias en la respuesta condicionada pueden reflejar diferencias en la ejecución más que en el aprendizaje.

Cuando se presenta el Ec este activa la representación del EI tanto directamente (asoc 1) como indirectamente (asoc 2 y 3). La comparación de las activaciones directa e indirecta del Ei determina el grado de respuesta excitatoria o inhibitoria. No indica cómo se establecen las asociaciones, es una teoría de la ejecución.

Un importante corolario es que la comparación entre asociaciones EC-EI y el contexto-EI se realiza en el momento de la prueba. Predice quela extinción de la asociación contexto EI después del entrenamiento del EC potenciara la respuesta al EC critico

Principal contribución ha sido su énfasis en que las diferencias en la respuesta condicionada pueden reflejar diferencias en la ejecución más que en el aprendizaje, considera el efecto bloqueo como un fallo en la ejecución, Predice que la extinción del estimulo bloqueador elevara la RC al EC bloqueado

Tema 5: Aprendizaje respuesta-consecuencia.

En este capítulo se vuelve la vista al análisis de las situaciones de aprendizaje en las cuales los estímulos a los que un organismo se enfrenta son el resultado directo de su conducta, descrita como “dirigida a una meta”.

La conducta de sucede debido a que ha servido previamente como instrumento para producir ciertas consecuencias se denomina conducta instrumental.

Primeras investigaciones sobre el condicionamiento instrumental

Los análisis teóricos y de laboratorio del condicionamiento instrumental comenzaron formalmente con el trabajo de thorndike, su intención original era estudiar la inteligencia animal. Estudio la cuestión planteada por Darwin sobre que capacidades intelectuales humanas estaban presentes en los animales mediante investigación empírica, para ello invento una serie de cajas problema donde introducía un gato hambriento con algo de comida fuera de la vista del animal, su tarea era aprender a salir de la caja y obtener la comida.

La cuidadosa aproximación empírica de Thorndike fue un avance significativo en el estudio de la inteligencia animal. Otra contribución importante fue la estricta evitación de interpretaciones antropomórficas de la conducta observada, en lugar de ello interpreto los resultados de sus estudios como el reflejo del aprendizaje de una asociación E-R .A medida que la asociación o conexión entre las claves de la caja y la respuesta con éxito se hacía más fuerte, el gato llegaba a realizar esta de forma más rápida. La consecuencia de la respuesta exitosa fortalecía la asociación entre los estímulos de la caja y esa respuesta.

Sobre la base de eta investigación, Thorndike formulo la ley del efecto: si una respuesta en presencia de un estimulo es seguida por un suceso satisfactorio, la asociación E-R se fortalece, si es seguida por un suceso molesto, se debilita. Esta ley implica un aprendizaje E-R.

Aproximaciones modernas al estudio del condicionamiento instrumental

Procedimientos de ensayo discreto

Similares al método de Thorndike, W.S.Small (1899,1900), introdujo el laberinto en las investigaciones sobre aprendizaje inspirado en las madrigueras bajo tierra.

Otro laberinto muy utilizado es el de forma de T, diseñado para estudiar la conducta de elección

La conducta en el laberinto puede cuantificarse midiendo la velocidad de carrera, que normalmente aumenta con ensayos de entrenamiento repetidos. Otra medida común es la latencia , tiempo que tarda el animal en abandonar la caja salida y empezar a desplazarse por el pasadizo, las latencias se hacen más cortas a medida que progresa el entrenamiento.

Procedimientos de operante libre

Permiten al animal que repita la respuesta instrumental una y otra vez sin restricciones, ideado por Skinner para estudiar la conducta de una manera más continua. Estaba interesado en analizar en el laboratorio una forma de conducta que fuese representativa de toda la actividad en curso que ocurría de forma natural. La conducta no se divide como si fueran moléculas, por eso propuso el concepto de operante como la forma de dividir la conducta en unidades medibles con significado.

Una respuesta operante se defina a partir del efecto que produce en el ambiente. Las actividades que provocan el mismo efecto ambiental se consideran ejemplos de la misma operante.

Entrenamiento y moldeamiento al comedero: Hay algunos pasos preliminares para establecer la conducta de presión de la palanca, 1º los animales tienen que aprender cuando está disponible la comida en el comedero, esto comprende un condicionamiento clásico, tras suficientes emparejamientos del sonido del dispensador con la entrega de comida, el sonido llega a elicitar una respuesta de seguimiento del signo, esta fase preliminar se llama entrenamiento al comedero. Después, el organismo está preparado para aprender la respuesta instrumental requerida. Si la respuesta no es algo que el animal ya realiza, nunca sucederá por si mima, para facilitar la adquisición de una nueva respuesta operante, al principio la comida se entrega si el animal hace cualquier cosa remotamente relacionada con la respuesta deseada. Una vez que la respuesta de alzamiento ha sido establecida la comida solo entrega si la rata realiza la respuesta de alzamiento sobre la palanca de respuesta. Una vez que el alzamiento sobre la palanca ha sido establecido, la bolita de comida puede entregarse solo si realmente la rata presiona la palanca, esta secuencia de pasos se denomina moldeamiento, este incluye dos tácticas complementarias: reforzamiento de aproximaciones sucesivas a la respuesta requerida y no reforzamiento de las formas de respuesta más tempranas.

Moldeamiento y nueva conducta: El condicionamiento instrumental incluye a menudo la construcción o síntesis de una nueva unidad conductual a partir de componentes de respuesta preexistentes que ya se encuentran en el repertorio del sujeto. El condicionamiento instrumental puede también utilizarse para producir respuestas que no se parecen en nada a lo que el individuo es probable que haga sin entrenamiento. El moldeamiento aprovecha la variabilidad inherente de la conducta. Sin esta variabilidad, los procedimientos de moldeamiento no tendrían éxito. El moldeamiento puede producir nuevas formas de respuesta nunca antes realizadas por el organismo.

La tasa de respuesta como medida de la conducta operante: los métodos de operante libre permiten una observación continua durante largos periodos, proporcionan una ocasión especial para observar cambios en la probabilidad de la conducta a lo largo del tiempo.

Las medidas de la latencia de la respuesta y de la velocidad que se emplea normalmente en procedimientos de ensayo discreto no permiten que se repita la respuesta. Skinner propuso que la tasa de ocurrencia de una conducta operante (frecuencia por minuto por ej.)Se utilizase como medida de la probabilidad de respuesta.

Procedimientos de condicionamiento instrumental

http://psicologia.isipedia.com/primero/psicologia-del-aprendizaje/05-condicionamiento-instrumental-fundamento

Una consecuencia placentera se denomina técnicamente estimulo apetitivo. Una consecuencia molesta estimulo aversivo. La respuesta instrumental puede proporcionar el estimulo, en este caso se dice que surte efecto una contingencia positiva entre la respuesta y su estimulo consecuente. De forma alternativa, la respuesta instrumental puede retirar o eliminar un estimulo, en este caso se dice que existe un efecto de contingencia negativo entre la respuesta y su consecuencia: Que el resultado de un procedimiento de condicionamiento sea un aumento o una disminución de la tasa de respuesta depende tanto de la contingencia respuesta-consecuencia como de la naturaleza de la consecuencia.

Reforzamiento positivo: es un procedimiento en el que la respuesta instrumental produce un estimulo apetitivo. Si se da la respuesta el estimulo apetitivo se presenta, si no se da la respuesta el estimulo apetitivo no se presenta: existe una contingencia positiva entre la respuesta instrumental y el estimulo positivo. El reforzamiento positivo produce incremento en la tasa de respuesta.

Castigo: En un procedimiento de castigo, la respuesta instrumental produce o aproxima un estimulo molesto o aversivo. Produce disminución en la respuesta instrumental.

Reforzamiento negativo: En una contingencia negativa, la respuesta retira o previene la presentación de un suceso ambiental. Un procedimiento en el que la respuesta instrumental finaliza o previene la entrega de un estimulo aversivo de denomina reforzamiento negativo. Hay dos tipos, escape y evitación. En el escape, el estimulo aversivo se presenta pero puede ser eliminado por la respuesta instrumental. La presencia de un estimulo aversivo establece la ocasión para la ocurrencia de la respuesta instrumental, entonces es reforzada por la terminación del estimulo aversivo. La evitación implica la programación de un estimulo aversivo para ser presentado en algún momento del futuro. En este caso la respuesta instrumental previene la entrega del estimulo aversivo

Entrenamiento de omisión: Incluye una contingencia negativa entre la respuesta instrumental y un suceso ambiental. En este caso la respuesta instrumental previene la presentación de un estimulo apetitivo o placentero. A menudo es el preferido para disuadir la conducta humana (niño a su habitación).

Los procedimientos de entrenamiento de omisión se denominan en ocasiones reforzamiento diferencial de otras conductas o RDO. Este término refleja el hecho de que el individuo recibe un estimulo apetitivo periódicamente a condición de que se dedique a realizar otra conducta diferente de la respuesta especificada por el procedimiento, implica el reforzamiento de otras conductas. La respuesta instrumental disminuye por el castigo y aumenta por el reforzamiento negativo

Elementos fundamentales del condicionamiento instrumental

La esencia de la conducta instrumental es que está controlada por sus consecuencias. El condicionamiento instrumental consta de tres elementos claves; una respuesta, una consecuencia (el reforzador) y una relación o contingencia, entre la respuesta y la consecuencia.

La respuesta instrumental

El resultado de los procedimientos del condicionamiento instrumental depende en parte de la naturaleza de la respuesta que se este condicionando. Algunas respuestas son más fácilmente condicionables que otras.

Variabilidad conductual versus estereotipia. Thorndike y Skinner enfatizaron que el reforzamiento incrementa la probabilidad de que la respuesta se repita en el futuro. Este énfasis alentó la creencia de que los procedimientos de condicionamiento instrumental producían repeticiones de la misma respuesta- que producían uniformidad o estereotipia en la conducta- . Sin embargo, esto no significa que el condicionamiento instrumental no pueda verse también involucrado en la producción de respuestas creativas o variables. Los organismos pueden aprender a obtener refuerzo en situaciones donde se requiera hacer algo nuevo ej. Pág. 137.

Relevancia o pertinencia en el condicionamiento instrumental: Thorndike propuso el término de pertinencia para explicar los fallos en el entrenamiento del rascado y del bostezo, ciertas respuestas se corresponden de forma natural con el reforzador debido a la historia evolutiva del animal. Los Breland denominaron deriva instintiva

Al desarrollo de respuestas como la de hozar en los cerdos y frotar monedas en los mapaches. Estas respuestas naturales relacionadas con la comida eran aparentemente muy fuertes y competían con las respuestas que requería el investigador.

Sistemas de conducta y limitaciones en el condicionamiento instrumental: Las limitaciones de respuesta que se han descrito son coherentes con la teoría de los sistemas de conducta. La efectividad del procedimiento para el incremento de una respuesta instrumental dependerá de la compatibilidad de esa respuesta con la organización preexistente del sistema de alimentación. Shettleworth (1975) encontró que la privación de comida disminuía la probabilidad de respuestas de autocuidado pero incrementaba la probabilidad de actividades dirigidas al ambiente como cavar etc. Este patrón de resultados es el que se ha observado en estudios de condicionamiento instrumental.

Otra forma de diagnosticar si una respuesta es parte de un sistema de conducta es realizar un experimento de condicionamiento clásico; un EC llega a elicitar componentes del sistema de conducta activado por el EI: Si la deriva instintiva refleja las respuestas del sistema de conducta, las respuestas análogas a la deriva instintiva deberías ser evidentes en un experimento de condicionamiento clásico. Timberlake y colaboradores comprobaron estas predicciones ratas utilizando una modificación de los estudios de manipulación de monedas de Brelands.

El reforzador instrumental

Cantidad y naturaleza del reforzador: En un estudio sistemático, Hutt (1954) intento aislar los efectos de la cantidad y naturaleza del reforzador alimenticio liquido mediante la variación sistemática de ambos rasgos. Los incrementos en la calidad y cantidad produjeron mayor tasa de respuesta.

Cambios en la naturaleza y la cantidad de reforzador: Se plantea la posibilidad de que la efectividad de un reforzador dependa no solo de sus propiedades sino también de cómo ese reforzador se compara con otros que el individuo haya experimentado. La

efectividad de un EI en el condicionamiento clásica depende de cómo se compare el EI con las expectativas del individuo basándose en la experiencia previa, esta es la idea fundamental del modelo Rescorla-Wagner, si el EI es mayor de lo esperado, producirá condicionamiento excitatorio, si el EI es menor producirá condicionamiento inhibitorio. La evidencia experimental confirma esta impresión, los efectos de una cantidad o tipo de reforzador dependen de la cantidad y la naturaleza de los reforzadores que el individuo ha experimentado previamente. Mellgren (1972) ver ejemplo libro pág. 144. Los resultados que obtuvo ilustran el fenómeno de contraste positivo; se refiere a una elevada respuesta por una recompensa favorable resultado de una experiencia anterior con una consecuencia menos atractiva y contraste negativo; se refiere a una respuesta disminuida por una recompensa desfavorable debido a una experiencia anterior con una consecuencia mejor. Los efectos de contraste también se dan si las condiciones de recompensa se modifican una y otra vez con una clave diferente señalando cada condición de recompensa, estos efectos son ejemplo de contraste conductual simultaneo.

Todos los efectos de contraste ilustran que la efectividad de un reforzador en una situación está determinada en parte por las experiencias del organismo con reforzadores en otras situaciones. Por razones que no están totalmente claras, el contraste negativo se ha obtenido de forma más clara que el contraste positivo.

La relación respuesta reforzador

La conducta instrumental eficiente requiere sensibilidad a la relación respuesta reforzador. Existen dos tipos de relaciones entre una respuesta y un reforzador, una es la relación temporal. Que se refiere al tiempo que transcurre entre la respuesta y el reforzador, un tipo especial de relación temporal es la contigüidad temporal, la cual se refiere a la entrega del reforzador inmediatamente después de la respuesta. El segundo tipo de relación es la relación causal o contingencia respuesta reforzador, se refiere al hecho de que la respuesta instrumental es necesaria y suficiente para la ocurrencia del reforzador.

Los factores temporales y causales son independientes unos de otros.

Efectos de contigüidad temporal: El reforzamiento inmediato es preferible al reforzamiento demorado. Los psicólogos del aprendizaje han resaltado que el condicionamiento instrumental requiere proporcionar el reforzador inmediatamente después de la ocurrencia de la respuesta instrumental. Grice informo que el aprendizaje instrumental puede deteriorarse con demoras tan cortas como 0.5 seg. El hecho recurrente es que el aprendizaje instrumental se altera demorando el reforzador tras la ocurrencia de la respuesta instrumental.

Hay varios factores que pueden contribuir a este deterioro, cuando el reforzamiento es demorado tras la realización de una respuesta, R1, el organismo no deja de hacer cosas, r2 r3 r4 etc. <si el reforzador se establece en r1 pero no se entrega hasta algún tiempo después el reforzador puede ocurrir después de alguna otra respuesta por ej. R5. Para asociar r1 con el reforzador, el organismo tiene que poder distinguir r1 de otras respuestas que realiza durante el intervalo de demora. Hay dos formas de resolver este problema. La primera técnica, es proporcionar un reforzador secundario o condicionado inmediatamente después de la respuesta instrumental, este es un estimulo condicionado que previamente ha sido asociado con el reforzador. Otra técnica es marcar la respuesta

instrumental criterio de alguna manera para hacerla distinguible de otras actividades del organismo. La efectividad del procedimiento de marcado se demostró por primera vez por Lieberman, Mcintosh y Thomas (1979)

La contingencia respuesta-reforzador: Los estudios de demora del reforzamiento muestran que no es suficiente una relación causal perfecta entre la respuesta y el reforzador para producir una respuesta instrumental vigorosa: incluso con una relación causal perfecta, el condicionamiento no ocurre si el reforzamiento es demorado durante demasiado tiempo. Datos como estos alentaron pronto a los investigadores a concluir que la contigüidad respuesta-reforzador más que la contingencia era el factor crítico que producía el aprendizaje instrumental. No obstante esta visión ha resultado injustificada por la investigación posterior. L a contingencia respuesta-reforzador es también importante.

El experimento de superstición Skinner: Fue un hito en el debate sobre el papel de la contigüidad frente a la contingencia en el aprendizaje instrumental. Las palomas parecían estar respondiendo como si la conducta controlara la entrega del reforzador.

La conducta supersticiosa descansa en la idea de reforzamiento accidental o adventicio, se refiere al emparejamiento accidental de una respuesta con la entrega de un reforzador, un segundo emparejamiento accidental aumenta aun más la probabilidad de la respuesta, de esta forma cada emparejamiento ayuda a estampar una respuesta particular.

Reinterpretacion del experimento de superstición: la afirmación de Skinner ha sido puesta en duda por la evidencia empírica posterior. Stadon y Simmelhag (1971) realizaron observaciones más extensas, definieron y midieron la ocurrencia de muchas respuestas, algunas respuesta ocurrían de modo predominante hacia el final del intervalo entre reforzadores, las llamaron respuestas terminales. Otras aumentaron tras la entrega del reforzador y disminuían a medida que se acercaba el tiempo de la siguiente comida; respuestas de interin.

Las acciones que eran respuestas terminales y las que eran respuestas de interin no variaban mucho de una paloma a otra. No encontraron evidencia de reforzamiento accidental. La investigación posterior ha proporcionado mucha evidencia adicional de que las presentaciones periódicas de un reforzador producen regularidades en la conducta.

Explicacion de la periodicidad de las respuestas de interin y terminales. Staddon y Simmelhag sugirieron que las respuestas terminales son respuestas típicas de la especie que reflejan la anticipación de la comida a medida que en el tiempo se encuentra más cerca de la próxima presentación de comida. En contraste, entendieron las respuestas de interin como una manifestación de otras fuentes de motivación que eran más importantes al comienzo del intervalo entre comidas, cuando la presentación de comida era improbable. Los investigadores posteriores, sin embargo han favorecido aproximaciones en las cuales las respuestas terminales y de interin se consideran diferentes manifestaciones del mismo sistema motivacional. La teoría mejor desarrollada es la teoría de sistema de conducta: el sistema de alimentación esta activado en animales privados de comida a los que se les proporciona periódicamente pequeñas cantidades de comida. Justo después de la entrega de comida se asume que el

organismo realiza respuestas de búsqueda focalizada poscomida, en medio del intervalo entre entregas ocurren respuestas de búsqueda general, en el momento de la próxima entrega de comida respuestas de búsqueda focalizada.

La distribución de las actividades que se desarrollan con la entrega periódica de un reforzador depende de la naturaleza de ese reforzador, se desarrollan diferentes sistemas de conducta, congruente con la teoría de sistemas, según sea agua o comida, debido a que activan diferentes patrones de forrajeo.

Efectos de la controlabilidad de los reforzadores: Una contingencia fuerte entre una respuesta instrumental y un reforzador esencialmente significa que la respuesta controla el reforzador, esto es, que el reforzador suceda depende de si ha ocurrido la respuesta instrumental. Los estudios acerca de los efectos de control sobre reforzadores han proporcionado la evidencia más amplia de la sensibilidad de la conducta a las contingencias respuesta-reforzador. La mayoría de la investigación se ha centrado en los efectos de control sobre la estimulación aversiva, esa se origino con los estudios pioneros de Seligman, overmier y Maier, quienes investigaron los efectos de la exposición a una descarga incontrolable en el aprendizaje posterior de escape-evitación en perros. El hallazgo más importante fue que la exposición a una descarga incontrolable dificultaba el aprendizaje posterior. Efecto de indefensión aprendida.

1º Diseño tríadico: los experimentos sobre indefensión aprendida se realizan normalmente utilizando este diseño, incluye dos fases; exposición, un grupo de ratas (E escape) es expuesto a descargas periódicas que puede finalizar mediante la realización de un respuesta de escape. Cada sujeto del segundo grupo (a, acoplado) es acoplado a un animal del grupo E y recibe las mismas descargas, pero el grupo A no puede hacer nada por evitarlas. El tercer grupo (C confinado), no recibe descargas durante la fase de exposición pero está confinado en el aparato tanto tiempo como los otros grupos, Durante la fase de condicionamiento, los tres grupos reciben entrenamiento escape-evitación. El hallazgo destacable es que los efectos de la estimulación aversiva durante la fase de exposición dependen de si la descarga es o no es escapable. La exposición a una descarga incontrolable (grupo A) produce una severa interrupción del aprendizaje posterior de escape-evitación, esto indica que los animales son sensibles a las diferencias procedimentales entre la descarga escalable y la descarga inescapable. L principal diferencia procedimental entre los grupos E y A es la presencia de una contingencia respuesta-reforzador para el grupo E pero no para el grupo A.

2º- La hipótesis de la indefensión aprendida: la primera explicación importante estaba basada en la conclusión de que los animales pueden percibir la contingencia entre su conducta y la entrega de un reforzador. La hipótesis de la indefensión aprendida asume que durante la exposición a descargas incontrolables, los animales aprenden que las descargas son independientes de su conducta. Es más, llegan a esperar que los reforzadores continuaran siendo independientes de su conducta. Esta expectativa de ausencia de control debilita su habilidad para aprender una nueva respuesta instrumental, esto ocurre por dos razones, primero, la expectativa de falta de control reduce la motivación de los sujetos para realizar una respuesta instrumental. Segundo, incluso si realizan la respuesta y son reforzados en la fase de condicionamiento, la expectativa previamente aprendida de falta de control hace más difícil para los sujetos aprender que su conducta es ahora efectiva para producir reforzamiento.

Es importante distinguir la hipótesis de indefensión aprendida del efecto de indefensión aprendida. El efecto de indefensión aprendida es el patrón de resultados obtenido con el diseño tríadico, este ha sido reproducido en numerosos estudios y es un hallazgo bien establecido. En contraste, desde que se propuso, la hipótesis de indefensión aprendida ha sido una explicación sugestiva y controvertida del efecto de indefensión aprendida.

3º- Déficit de actividad: el déficit de aprendizaje observado en el grupo A era resultado de que aprendían a ser inactivos durante la fase de exposición. Congruente con esta hipótesis, en algunas situaciones la descarga inescapable produce una disminución en el movimiento motor, y a esto se deberían los posteriores déficits de actuación. Hay también situaciones en las cuales los efectos del aprendizaje probablemente no son debidos a la supresión del movimiento causada por la descarga inescapable. Por tanto la hipótesis de la inactividad aprendida no puede explicar todos los ejemplos de efectos de indefensión aprendida.

4º- déficit atencional: Que la descarga provoque que los animales presten menos atención a sus acciones. Si un animal no presta atención a su conducta, tendrá dificultad para asociar sus acciones con los reforzadores en el escape-evitación o en otras formas de condicionamiento instrumental.

Maier, Jackson y Tomie (1987) probaron esta hipótesis de déficit atencional con ratas, razonaron que la atención reducida a la conducta instrumental también podía ser aliviada mediante la introducción de una clave externa de retroalimentación de la respuesta o estimulo de marcado

5º- relaciones estimulares en el condicionamiento de escape: Resulta evidente que el condicionamiento de escape resulta más complejo de lo que se pensaba anteriormente.

El rasgo definitorio d la conducta de escape es que la respuesta instrumental tiene como consecuencia la terminación de un estimulo aversivo. Realizar la respuesta de escape tiene como resultado claves internas de retroalimentación de la respuesta. Algunos de estos estímulos producidos por la respuesta son experimentados al comienzo de la respuesta de escape, justo antes de que la descarga se retire, y se denominan claves de retroalimentación de la terminación de la descarga. Otros estímulos producidos por la respuesta son experimentados cuando el animal completa la respuesta, justo después de que la descarga se haya retirado al comienzo del intervalo entre ensayos, estos se denominan claves de retroalimentación de la señal de seguridad, estas son seguidas de forma fiable por el intervalo entre ensayos, y por tanto por la ausencia de descarga. En consecuencia, estas claves contextuales pueden llegar a convertirse en inhibidores condicionados del miedo y limitan o inhiben el miedo elicitado por las claves contextuales de la cámara experimental. Estas señales de seguridad no existen para los animales que están acoplados a la descarga inescapable porque, para ellos, los periodos de descarga no descarga no son predecibles.

Centrarse en los factores estimulares del condicionamiento de escapeen lugar de las contingencias respuesta-reforzador no ha permitido todavía el desarrollo de una explicación comprensiva de todos los resultados con el diseño tríadico.

Tema 6: Programas de refuerzo y conducta de elección.

• PROGRAMAS SIMPLES o razón fija o razón variable o intervalo fijo o intervalo variable

• PROGRAMAS DE REFORZAMIENTO DE TASAS DE RESPUESTA o RDA (reforzamiento diferencial tasas altas) o RDB (reforzamiento diferencial tasas bajas)

Hasta aquí incluyen UNA ÚNICA RESPUESTA y el reforzamiento de esa respuesta no proporcionan una visión completa de la conducta.

• ANÁLISIS DE LA CONDUCTA DE ELECCIÓN o programas concurrentes

• ELECCIÓN CON COMPROMISO o programas concurrentes encadenados

Un programa de reforzamiento: es un programa o regla que determina cómo y cuándo la ocurrencia de una respuesta irá seguida de un reforzador. Estos programas se investigan normalmente en cajas de Skinner. Estudian muy bien LOS FACTORES que controlan el mantenimiento de la conducta y su realización continuada. Zeiler denominó a estos programas “EL GIGANTE DURMIENTE” del análisis de la conducta

PROGRAMAS SIMPLES DE REFORZAMIENTO INTERMITENTE

En estos programas SIMPLES 1 solo factor determina qué ocurrencia de la respuesa instrumental se refuerza.

PROGRAMAS DE RAZÓN

El reforzamiento depende sólo del número de respuestas que el organismo realiza. Se cuenta en n. de respuesta ocurridas y entregar el reforzador cada vez que se alcance el n. requerido. REFORZAMIENTO CONTINUO (RFC). Sólo sucede en el laboratorio.

REFORZAMIENTO PARCIAL O INTERMITENTE: las respuestas se refuerzan sólo alguna vez.

RAZÓN FIJA: predictible (número predecible de respuestas para cada refuerzo).

Cuando cada 10 respuestas “apretar una palanca” por cada reforzador RF 10. (pagar por el número de piezas que montan), etc..Es decir, un programa de reforzamiento continuo es también un programa de razón fija. Es un programa de reformaziento continuo RFC (razón fija continua). Los organismos sueles responder a una tasa constante PERO moderada, sólo se dan pausas breves e impredecibles. (una paloma, al principio picoteará más para conseguir comida y luego lo hará más lentamente a medida que sacie el apetito).Se da una tasa constante y alta una vez que la conducta se ha iniciado, pero se puede tardar un tiempo antes de comenzar. Esta caracteristica de la respuesta se puede

observar en un REGISTRO ACUMULATIVO DE LA CONDUCTA: representa la forma de repetirse una respuesta a lo largo del tiempo. (n. respuestas totales o acumuladas en un momento determinado de tiempo). La pendiente de la linea trazada por este registro representa la TASA DE RESPUESTA del sujeto. La tasa 0 de respuesta que se observa justo después del reforzamiento se llama PAUSA POSREFORZAMIENTO. La longitud de esta pausa está controlada por el requerimiento de la razón subsiguiente . Por eso de llama también PAUSA PRE-RAZÓN

LA CARRERA DE LA RAZÓN: es la tasa de respuesta ALTA y ESTABLE que completa cada requerimiento de la razón. Si el requerimiento de la razón se incremente un poco (de RF 120 a RF 150), la tasa de respuesta puede permanecer igual durante la carrera de razón, Con aumentos considerables ocurren pausas posreforzamiento más largas. Este efecto se llama TENSIÓN DE LA RAZÓN por eso no hay que aumentar la razón requerida demasiado rápido, puede desistir por completo.

Un programa intermitente de razón fija: se da un patrón de respuestas muy diferentes. No es probable pausas en medio de la acción de marcar un número de teléfono,

RAZÓN VARIABLE: IMPREDECIBLE mediante la variación del número de respuestas requerido para el reforzamiento de una ocasión a la siguiente. Sigue siendo de “razón” porque el reforzamiento depende del n. de respuestas que realiza el organismo. Este RV ( aqui se utiliza el número MEDIO (la media) de respuestas requerido, al principio 13, luego 7, etc... por eso RV 10): Como es impredecible las pausas son menos probables con esos programas RV (hay una tasa claramente estable). Se pueden dar pausas posreforzamiento pero son menos intensas

PROGRAMAS DE INTERVALO

Tras cierta cantidad de TIEMPO

INTERVALO FIJO

(cantidad FIJA de tiempo)

IF 4 minutos el tiempo establecido no varia de una ocasión a otra. El patrón de respuesta se llama FESTÓN DEL INTERVALO FIJO.

Un IF 4 minutos no garantiza que el reforzador se proporcionará en algún momento a los largo del intervalo de tiempo. Se requieren respuestas como en RAZÓN. El intervalo determina sólo cuándo el reforzador está disponible, NO cuándo se entrega (programación de los exámenes se parecen al IF, al principio se dedica poco tiempo al estudio, se estudia más una semana antes del exámen, la tasa se incremente cuando se aproxima el día de examen).

INTERVALO VARIABLE TIEMPO IMPREDECIBLE

IV tiempo impredecible para dispensar el reforzador . Es un intervalo MEDIO (la media) IV 2 minutos . Se tiene que realizar una respuesta. Los reforzadores no se dan “gratis”. No hay pausas con tasas de respuestas CONSTANTES.

PROGRAMAS DE INTERVALO Y ESPERA LIMITADA

Son programas FUERA de laboratorio, el reforzador está disponible SÓLO durante PERIODOS LIMITADOS. (horario restaurantes). Este tipo de RESTRICCIÓN en cuanto al tiempo que permanece el reforzador disponible se llama ESPERA LIMITADA.Esta restricción se puede aplicar tanto a IF como a IV.

COMPARACIÓN DE LOS PROGRAMAS DE RAZÓN Y DE INTERVALO

RF y IF: ambos producen una pausa posreforzamiento después de de la administración de cada reforzador. Ambos reciben altas tasas de respuesta JUSTO ANTES de la administración del siguiente reforzador.

RV y IV: mantienen tasas estables de respuestas SIN PAUSA PREDECIBLE.

Los programas de razon y intervalo activan DIFERENTES CAMBIOS NEUROQUÍMICOS en el cerebro. Los programas de razón son capaces de producir tasas de respuesta MÁS ALTAS que los programas de intervalo. El factor crítico es el espaciamiento entre respuestas que se da justo antes del reforzamiento.

Reforzamiento diferencial del tiempo interrespuesta: TIR Es el intervalo entre una respuesta y la siguiente TIR o tiempo interrespuesta. Si se refuerzan los TIRs cortos = el sujeto realiza TIRs cortos. Si se refuerzan TIRs largos = realiza TIRs largos. Con TIRs cortos = responderá a una tasa ALTA. Sujeto que produce TIRs largos, responderá a una tasa baja.

Un programa de razón = favorece que no se espere mucho entre las respuestas.Favorece tiempos interrespuesta cortos

Un programa de intervalo =no favorecen los TIRs cortos, sino una ejecución con TIRs largos, que deriva en tasas de respuestas más bajas que en razón.

PROGRAMAS DE REFORZAMIENTO DE TASAS DE RESPUESTA

Fuera del laboratorio, en situaciones que requiere tasas de respuesta particulares (deporte de velocidad , cadena de montaje)

Ni razón e intervalo requieren una tasa especifica de respuesta para conseguir el reforzamiento. Los programas de tasas de respuesta requieren una tasa particular para obtener el reforzador. Depende aquí de cuán pronto ocurra tras la respuesta precedente. Por ejem. Que una respuesta se refuerce sólo si ocurre 5 segundos siguientes a la respuesta precedente.Entonces su tasa de respuesta será de 12 por minuto o mayor RDA (Reforzamiento diferencial de tasas altas). Fomenta tasas altas de respuesta. En RDA una respueta se refuerza sólo si ocurre ANTES de que haya transcurrido cierta cantidad de tiempo TRAS la respuesta precedente.

EL reforzamiento diferencial de tasas bajas RDB fomentan que los sujetos respondan lentamente, pues se refuerza una respuesta SOLO si ocurre DESPUES de que haya transcurrido cierta cantidad de tiempo desde la respuesta previa.

CONDUCTA DE ELECCIÓN: PROGRAMAS CONCURRENTES

( al mismo tiempo 2 ó más programas)

La situación de elección más simple = 2 respuestas alternativas, cada una de éstas seguidas por un reforzador de acuerdo con su propio programa de reforzamiento.

Se empezó estudiando la conducta de elección utilizando LABERINTOS en T especialmente. Actualmente se utilizan cajas de Skinner equipadas con 2 manipulandos, como 2 teclas de picoteo. Los 2 programas ocurren al mismo tiempo (o concurrentemente) El sujeto es libre de cambiar de una tecla de respuesta a la otra PROGRAMA CONCURRENTE que permiten una medición continua de la elección.

Programa A (IV 60 seg.) Programa B (RF 10)

Tecla A Tecla B

MEDIDAS DE LA CONDUCTA DE ELECCIÓN

Entre 2 respuesta alternativas. Hay 2 formas de medición:

1.- calcular la TASA RELATIVA DE RESPUESTA de cada alternativa. Es decir de la tecla A se divide su tasa de respuesta por la tasa total de respuesta:

RA/ (RA + RB)

La forma de distribución de la conducta entre las 2 alternativas de respuesta está muy influida por el programa de reforzamiento que funciona en cada respuesta.

2.- calcular la TASA RELATIVA DE REFORZAMIENTO conseguido para cada alternativa de rspuesta se calcula igual que la anterior:

rA/ (rA + rB)

LA LEY DE LA IGUALACIÓN

La tasa relativa de respuesa y la tasa relativa de reforzamiento son iguales. Herrnstein establece esta relación como una ley de conducta.

La primera expresión matemática:

RA/(RA +RB) = rA/rA + rB)

Como antes RA y RB = tasas de respuesta en las teclas A y B

rA y rB = tasas de reforzamiento conseguidas en cada alternativa de respuesta.

La segunda expresión matemática:

RA/RB = rA/rB

Representan el mismo principio básico: Las tasas relativas de respuesta se IGUALAN con las tasas relativas de reforzamiento

INFRAIGUALACIÓN, SUPRAIGUALACIÓN Y SESGO DE RESPUESTA

La Ley de igualación indica que las elecciones NO se hacen de forma caprichosa (son una función ordenada de las tasas de reforzamiento). Actualmente las tasas relativas de respuesta NO SIEMPRE se igualan exactamente con las tasas relativas de reforzamiento. Se añaden 2 parámetros b, s a la fórmula

RA/RB = b(rA/rB)”elevado el parentesis a s)

S= representa la SENSIBIIDAD de la conducta a la elección a las tasas relativas de reforzamiento. Cuando existe una igualación perfecta s = 1, las tasas relativas de respuesta son una función DIRECTA de las tasas relativas de reforzamiento.

INFRAIGUALACIÓN:un tipo de desviación perfecta incluye una sensibilidad reducida de la conducta de elección a las tasas relativas de reforzamiento y se acomoda dando al exponente s un valor MENOR a 1. Se encuentra la infraigualación más a menudo que la supraigualación. Hay muchas variables que influyen. Hacer más difícil el cambio de una alternativa de respuesta a otra INCREMENTE el parámetro de sensibilidad.

SUPRAIGUALACIÓN:se acomodan los resultados dotando al exponente de un valor MAYOR a 1.

B= sesgo (en inglés bias). Estos sesgos influyen en las respuestas cuando las alternativas de respuesas son DIFERENTES . Una preferencia (o sesgo) por una respuesta o un reforzador sobre la otra influye en el parámetro del sesgo b. Si no hay sesgos b= 1.

LA LEY DE LA IGUALACIÓN Y EL VALOR DEL REFORZADOR

La relación de igualación se ha extendido a otros aspectos de los reforzadores distintos de su tasa de ocurrencia. La tasa relativa de respuesta es una función de la cantidad relativa de cada reforzador, y la demora relativa del reforzamiento.

La tasas relativas de respuesta están determinadas por la PALATABILIDAD de los reforzadores( Cualidad de ser grato al paladar un alimento.) Cuando mayores, más sabrosos y más inmediatos sean los reforzadores, mayor será el valor. No se sabe cómo se combinan las diferentes caracteristicas para determinar su valor.

LA LEY DE LA IGUALACIÓN Y LOS PROGRAMAS SIMPLES DE REFORZAMIENTO

Incluso las situaciones de respuesta única pueden involucrar una ELECCIÓN. La elección es realizar la respuesta especificada y ocuparse en otras posibles actividades . Esto permite la aplicación de la ley de la igualación a programas de reformaziento de respuesta única. Aunque recientemente se pone en duda.

MECANISMOS DE LA LEY DE IGUALACIÓN

Es una ley DESCRIPTIVA de la naturaleza y no una ley mecanicista (no explica los mecanismos que son responsables de la distribución de las respuestas). Esta ley ignora CUÁNDO se realizan las respuestas individuales.

TEORIAS MOLARES: explican agregados de respuestas y se relacionan con la distribución total de respuestas y reforzadores en las situaciones de elección,

TEORIAS MOLECULARES se centran en lo que ocurre alnivel de las respuestas individuales y consideran la igualación como el rsultado neto de estas elecciones individuales.

TEORIAS DE MEJORAMIENTO: caracteristicas de la conducta que no son ni molares ni moleculares, sino algo intermedio entre ellas.

IGUALACIÓN Y MAXIMIZACIÓN DE LAS TASAS DE REFORZAMIENTO

La conducta de elección : se basan en la idea de que los organismos DISTRIBUYEN sus acciones entre las alternativas de respuestas para recibir la MÁXIMA cantidad de reforzamiento posible. Esta idea de que los organismos MAXIMIZAN el reforzamiento se utiliza para explicar la conducta de elección en los distintos análsis: Los mecanismos son:

1. MAXIMIZACIÓN MOLECULAR: siempre se elige cualquier alternativa de respuesta con MEJORES PROBABILIDADES de que sea reforzada en ese momento. Se centran en las tasas GLOBALES de respuesta y reforzamiento, calculadas sobre la duración total de una sesión experimental.

2. MAXIMIZACIÓN MOLAR: el organismo distribuye sus respuestas entre las VARIAS ALTERNATIVAS a fin de maximizar la cantidad de reforzamiento que consiguen a la LARGA. Se centran en agregados de conducta sobre algún periodo de TIEMPO más que enlas respuestas de elección indivdual

3. MEJORAMIENTO operan en una escala TEMPORAL que está entre molar y molecular. Se refiere a “hacer algo mejor”. Es la meta “más modesta (o inocente)” de sólo hacer que la situación sea mejor. (mejor de cómo esa situación ha sido en el pasado reciente). Los resultados a una situación limitada (no en su totalidad a largo plazo). Las tasas LOCALES se calculan sobre el periodo de tiempo que un sujeto dedica a una alternativa particular de respuesta. Esta tasa es siempre MAYOR que su tasa global. La teoria de mejoramiento asume que los organismos cambian de una alternativa de respuesta a otra para MEJORAR la TASA LOCAL de reforzamiento que están recibiendo. El mecanismo de mejoramiento da como resultado LA IGUALACIÓN.

ELECCIÓN CON COMPROMISO

Se die a la gente que carecce de AUTOCONTROL si elige una recompensa pequeña a corto plazo en lugar de esperar para conseguir un beneficio mayor pero más demorado

PROGRAMAS CONCURRENTES ENCADENADOS

Programa A (RV 10) Programa B (RF 10)

* * * *

Eslabon terminal Eslabón terminal

TECLA A TECLA B Eslabón de elección(no es el reforzador primario)

Hay 2 fases o eslabones: Durante la primera fase el ESLABON DE ELECCIÓN elige entre 2 programas alternativos. Responder a este eslabon de elección NO PROPORCIONA RESULTADOS, sólo cuando se encuentre en le ESLABON TERMINAL. Cuando se escoge A o B está comprometido hasta el final del eslabón terminal del programa por eso implican ELECCIÓ CON COMPROMISO

Se prefiere la alternativa de razón variable. RV . La variedad parece ser la SAL DE LA VIDA. El eslabón terminal se convierte en REFORZADOR CONDICIONADO,

La conducta de elección está gobernada tanto por los programas de eslabón terminal como por cualquier programa que funcione en el enlace inicial.

ESTUDIOS DE AUTOCONTROL

Autocontrol: es elegir una recompensa grande demorada sobre una recompensa pequeña inmediata. El autocontrol es más fácil si la alternativa tentadora (un pastel) no está tan claramente disponible (en la carta hay pastel y verduras).

Una propiedad general de la conducta de elección: Si las recompensas se entregan rápidamente tras una rspuesta de elección, los sujetos generalmente PREFIEREN una recompensa pequeña inmediate más que una recompensa grande demorada. Sin embargo, si se añade una demora CONSTANTE a la entrega de ambas recompensas, los sujetos muestran autocontrol y prefieren la recompensa grande demorada.

EXPLICACIONES DEL AUTOCONTROL

Principio general: el valor de un reforzador se REDUCE en función de cuánto tiempo se tiene que esperar para obtenerlo. La fórmula para esta reducción en el valor se llama FUNCIÓN DESCONTADORA DEL VALOR.

V= M/(1+ KD) FUNCIÓN DEL DECAIMIENTO HIPERBÓLICO

M= magnitud de la recompensa

D= demora de la recompensa

K= parámetro de la tasa descontadora

Cuando se entrega el reforzador sin demora D=0, el valor del reforzador está directamente relacionado con su magnitud (los reforzadores más grandes tienen valores mayores).

Incrementar la demora de las recompensas grande y pequeña hacce más FÁCIL que se muestre autocontrol seleccionando el reforzador más grande pero con más demora.

LAS FUNCIONES DESCONTADORAS Y LOS PROBLEMAS DE AUTOCONTROL EN LA ADICCIÓN A LA DROGA

El abuso de sustancias frecuentemente REFLEJA una serie de elecciones IMPULSIVAS.

Las funciones descontadoras de la recompensa era mucho más acusada para los adictos a la heroína, es decir, el valor del dinero DISMINUYO muy rápido si la recepción del dinero iba a demorarse. Esta función acusada del descuento de la recompensa indica UNA FALTA DE CONTROL es decir, IMPULSIVIDAD.

¿PUEDE ENTRENARSE EL AUTOCONTROL?

Sí. Una persona que no puede tolerar esperar el tiempo necesario para obtener recompensas grandes tiene que olvidarse de obtener estos reforzadores.

Siempre y cuando las tareas de entrenamiento implicasen BAJO ESFUERZO, el entrenamiento con la recompensa demorada INCREMENTÓ la preferencia por la recompensa más grande demorada. Por lo tanto, el entrenamiento con reforzamiento demorado produce AUTOCONTROL.

Tema 7: Mecanismos motivacionales.

Se han propuesto dos aproximaciones muy diferentes a intentar explicar por que ocurre la respuesta instrumental. Una de estas se inicio con el trabajo de Pavlov y se centra en explicar la estructura asociativa del condicionamiento instrumental. La otra se origino con el trabajo de Skinner y se centra en como la conducta está regulada en vista de las limitaciones o restricciones creadas por los procedimientos de condicionamiento instrumental.

Las teorías de la regulación conductual describen los efectos del reforzamiento dentro del amplio contexto del repertorio conductual de un organismo utilizando conceptos de varias áreas de investigación, incluyendo la economía conductual y la ecología conductual.

La aproximación asociacionista se centra en los mecanismos moleculares y no se preocupa de la meta a largo plazo o la función de la conducta instrumental. Por el contrario, la aproximación de la regulación conductual se centra n los aspectos molares de la conducta y considera los efectos del condicionamiento instrumental como manifestaciones de procesos de maximización u optimización.

La motivación de la respuesta instrumental ha sido considerada desde dos perspectivas radicalmente distintas. La primera se origino con Thorndike e incluye el análisis de la estructura asociativa del condicionamiento instrumental, radica en el concepto de asociaciones y es compatible con la tradición teórica del condicionamiento pavloviano. Toma una perspectiva molecular: se centra en las respuestas individuales y sus antecedentes estimulares y consecuencia especificas. Para alcanzar este nivel de detalles, la aproximación asociativa examina el aprendizaje instrumental en preparaciones conductuales aisladas. Debido a que las asociaciones pueden encontrar sustento en el sistema nervioso, la aproximación asociativa proporciona un marco conveniente para estudiar los mecanismos neurales del condicionamiento instrumental.

La aproximación alternativa a los procesos motivacionales en el aprendizaje instrumental es la regulación conductual. Se desarrolla dentro de la tradición skinneriana e incluye la consideración del condicionamiento instrumental en el contexto más amplio de las múltiples cosas que el organismo está haciendo. Está interesada en como un procedimiento de condicionamiento instrumental establece los límites al flujo de actividades de un organismo y las consecuencias conductuales de estas restricciones: considera la motivación de la conducta instrumental desde un punto de vista más molar, considera las metas y como los organismos sacan provecho de la complejidad de su ambiente y de sus múltiples opciones conductuales para alcanzar sus metas.

La aproximación asociativa y de regulación conductual casi se han desarrollado independientemente la una de la otra. Cada una ha identificado problemas importantes pero ninguna puede sostenerse sola

La estructura asociativa del condicionamiento instrumental

Thorndike fue el primer en reconocer que el condicionamiento instrumental incluye algo más que una respuesta y un reforzador. La respuesta instrumental ocurre en presencia de estímulos particulares. Deben considerarse tres sucesos en el análisis del

condicionamiento instrumental: el contexto estimular (E), la respuesta instrumental (R) y la consecuencia de la respuesta instrumental o reforzador (C). Skinner también suscribió la noción de tres sucesos y describió el condicionamiento instrumental es términos de una contingencia de tres términos que incluía E R y C.

La asociación E_R ya la ley del efecto

La asociación E-R fue postulada por Thorndike como la clave del aprendizaje instrumental en su ley del efecto; el papel del reforzador o de la consecuencia de la respuesta es establecer o estampar una asociación entre las claves contextuales E y la respuesta instrumental, pensó que una vez establecida esta asociación E-R seria, de forma única, responsable de la ocurrencia de la respuesta instrumental. Por tanto, el ímpetu básico o motivación para la respuesta instrumental era la activación de la asociación E-R mediante la exposición del sujeto a los estímulos en presencia de los cuales la respuesta instrumental fue previamente reforzada.

L ley del efecto asume que el único papel del reforzador es crear una asociación E-R, que el reforzador en sí mismo no es una parte o no participa en esta asociación. Esta presunción es bastante contraintuitiva.

Expectativa de recompensa y la asociación E-C

Cualesquiera que sean los estímulos, el reforzamiento de la respuesta instrumental producirá inevitablemente un emparejamiento entre E y el reforzador o consecuencia de la respuesta (C). Estos emparejamientos proporcionan el potencial para el condicionamiento clásico y el establecimiento de una asociación entre E y C.

Una de las explicaciones más tempranas e influyentes del papel del condicionamiento clásico en la conducta instrumental fue propuesta por Clark Hull (1930,1931) y más tarde elaborada por Kenneth Spence (1956) , durante el curso del condicionamiento instrumental, la respuesta instrumental llega a ser instigada o motivada por dos factores. En primer lugar, la presencia de E llega a evoca la respuesta instrumental directamente por asociación con E-R. En segundo lugar, la actividad instrumental también llega a realizarse en respuesta a la expectativa de recompensa debido al establecimiento de una asociación R-C: la forma concreta en que la asociación R-C llega a motivar la conducta instrumental ha sido tema de considerable debate e investigación experimental. Una formulación especialmente influyente fue la teoría moderna de los dos procesos /Rescorla y Salomon, 1967)

La teoría moderna de los dos procesos: Asume que hay dos tipos de distintos de aprendizaje, el condicionamiento pavloviano y el instrumental, además asume que estos dos procesos están relacionados de una forma especial, durante el curso de un condicionamiento instrumental, los estímulos (E)_ en presencia de los cuales se refuerza la respuesta instrumental- se presume que llegan a asociarse con la consecuencia de la respuesta (C) a través de condicionamiento pavloviano para establecer una asociación E-C. A través de la asociación E-C, el estimulo E llega a motivar la conducta instrumental mediante la activación de un estado emocional central. La naturaleza de ese estado emocional o motivación dependerá de la naturaleza del reforzador, Si se refuerza con comida esta asociación activa la expectativa de comida Mowrer (1960)= esperanza.

Recorla y Salomon (1967) apuntaron que si la expectativa pavloviana motiva la conducta instrumental, entonces la presentación de un estimulo condicionado pavloviano debería alterar el curso de la respuesta instrumentalmente reforzada. La implicación básica de la teoría moderna de los dos procesos es que la tasa de una respuesta instrumental será modificada por la presentación de un estimulo clásicamente condicionado. La presentación de un EC+ clásicamente condicionado con comida durante la ejecución de una respuesta reforzada con comida debería aumentar la esperanza que fue creada por la contingencia instrumental e incrementar la respuesta.

Resultados consecuentes con la teoría moderna de los dos procesos. Utiliza normalmente un diseño experimental llamado experimento de transferencia de control, consta de tres fases; la fase uno incluye un condicionamiento instrumental de una respuesta operante utilizando algún programa de reforzamiento positivo o negativo. En la fase dos se entrena a los participantes con un condicionamiento clásico, en el cual se asocia un EC explicito con la presencia o ausencia de un estimulo incondicionado. Es necesario que el procedimiento de condicionamiento instrumental no esté en funcionamiento durante la fase de condicionamiento pavloviano. La fase tres es la fase de transferencia crítica. Aquí se permite e los participantes que realicen la respuesta instrumental, y se presenta periódicamente el EC de la fase dos para observar su efecto en la tasa de conducta instrumental. Ver ej. pág. libro 195.

Interacciones de respuesta en los experimentos de transferencia de control. Los estímulos condicionados clásicamente elicitan no solamente estados emocionales, sino también respuestas abiertas, en consecuencia, un estimulo clásicamente condicionado puede influir sobre la conducta instrumental a través de respuestas abiertas que elicita. No es necesaria la apelación a estados emocionales centrales para explicar este resultado. La apelación a estados centrales emocionales también es innecesaria si un estimulo condicionado clásicamente elicitase respuestas abiertas que fuesen similares a la conducta instrumental. En este caso, la presentación del EC incrementaría la respuesta porque las respuestas elicitada por el EC se añadirían a las respuestas que se están realizando porque el animal recibe reforzamiento instrumental.

Los investigadores han estado muy interesados en la posibilidad de que los resultados de los experimentos de transferencia de control sean debidos a que los ECs pavlovianos elicitan respuestas que interfieren en o facilitan la conducta requerida por el reforzamiento instrumental. Se han diseñado barias estrategias experimentales para eliminar estas interacciones, en general han logrado mostrar que muchos efectos de transferencia de control no están producidos por interacciones entre respuestas abiertas

¿Estados emocionales centrales condicionados o expectativas especificas de recompensa?

La teoría moderna de los dos procesos asume que el condicionamiento clásico media la conducta instrumental a través del condicionamiento de estados emocionales centrales como la esperanza (en el caso de reforzamiento positivo) o el medo (en el caso del reforzamiento negativo). Este estudio pág. 196, indican claramente que en ciertas circunstancias los animales adquieren expectativas especificas del reforzador en lugar de un estado emocional mas general de esperanza durante el condicionamiento instrumental y clásico. El aprendizaje de expectativa específica de recompensa es una alternativa importante a la teoría de los dos procesos para explicar ciertos tipos de

resultados, está basada en la asunción de que el condicionamiento instrumental incluye aprendizaje de una asociación E-C.

Las asociaciones E-C parecen ser fundamentales para la motivación de la conducta instrumental, Berridge (2001) apunto que la asociación E-C,E llega a ser un estimulo de incentivo; E en si mismo llega a ser atractivo. Esta motivación adquirida de incentivo contribuye significativamente a la motivación de la respuesta instrumental.

Relaciones R-C y E(R-C) en el condicionamiento instrumental

La intuición sugiere que la conducta instrumental involucra asociaciones R-C, estas no existen en el modelo de los dos procesos.

Otra peculiaridad de la estructura asociativa del condicionamiento instrumental asumida por las teorías de los dos procesos es que E supone que llega a estar asociado directamente con C en la idea de que el emparejamiento de E con C es suficiente para la ocurrencia de condicionamiento clásico. Los emparejamientos EC-EI no son suficientes para el desarrollo de asociaciones pelvianas. El EC debe también proporcionar información acerca del EI, o estar de alguna manera relacionado con el EI. Esta condicionalidad en la relación de E con C es desestimada en la teoría de los dos procesos.

Evidencia de asociaciones R-C; Algunas investigaciones han sugerido que el condicionamiento instrumental lleva el aprendizaje de asociaciones respuesta-consecuencia, se han obtenido evidencias varias en apoyo de esta posibilidad. La devaluación del reforzador ha sido utilizada para determinar si la repuesta instrumental esta mediada por una asociación entre la respuesta y la consecuencia reforzante, ver ej. pág. 197.

La supresión selectiva de respuesta que se obtuvo es difícil de explicar a partir de las asociaciones E-C o E-R que se supone que son aprendidas de acuerdo con la teoría de los dos procesos, la devaluación de un reforzador debilita selectivamente la respuesta particular que ha sido entrenada con ese reforzador. Este hallazgo indica que cada respuesta estaba asociada separadamente con su propio reforzador.

Evidencia del aprendizaje de una relación jerárquica E-(R-C); La evidencia citada anteriormente muestra de forma clara que los organismos aprenden a asociar la respuesta instrumental con su consecuencia. Sin embargo, las asociaciones R-C no pueden actuar aisladamente para producir la repuesta instrumental. Mackintosh y Dickinson (1979) el hecho de que la respuesta instrumental activa una expectativa del reforzador no es suficiente para clarificar lo que produzca la respuesta. Se necesita un factor adicional para activar la asociación R-C. Una posibilidad es que la asociación R-C sea activada por los estímulos E que están presentes cuando la respuesta es reforzada, E no activa R directamente, sino que activa la asociación R-C. El sujeto llega a pensar en la asociación R-C cuando se encuentra con E, y eso motiva que realice la respuesta instrumental.

Skinner (1938) sugirió que E, R y C en el condicionamiento instrumental están conectados a través de una relación condicional E-(R-C). Se ha acumulado evidencias que indican el aprendizaje de relaciones E-(R-C)

Regulación conductual

Los análisis de regulación conductual están basados en una visión del mundo completamente distinta. En lugar de considerar el condicionamiento instrumental en términos del reforzamiento de una respuesta, los análisis de la regulación conductual se centran en como las contingencias instrumentales ponen limitaciones a las actividades de un organismo.

Antecedentes de la regulación conductual

Los teóricos estaban de acuerdo en que los reforzadores eran estímulos especiales que fortalecías la conducta instrumental durante medio siglo después de la ley del efecto de Thorndike

La teoría de la respuesta consumatoria: E primer reto a esta idea vino de Fred Sheffield que formularon la teoría de respuesta consumatoria, esta atribuye el reforzamiento a estas conductas típicas de la especie. Se establece que las respuestas consumatorias típicas de la especie son en sí mismas el rasgo crítico de los reforzadores. Fue una innovación radical debido a que traslado la investigación de los reforzadores desde tipos especiales de estímulos a tipos especiales de respuestas. Se considero que las respuestas reforzadoras eran especiales porque involucraban la consumación o el completamiento de una secuencia instintiva de conducta. David Premack retomo el tema con su teoría y sugirió que las respuestas reforzadoras son especiales solo debido a que es más probable que ocurran que las respuestas instrumentales a las que siguen.

El principio de Premack: Apunto que las respuestas incluidas en los reforzadores comúnmente utilizados eran actividades que es altamente probable que realicen los animales. Las respuestas instrumentales son actividades que normalmente ocurren a una baja probabilidad. Propuso que esta diferencia en las probabilidades de respuesta es crítica para el reforzamiento. Puede establecerse como sigue: “dadas dos respuestas de diferente probabilidad A y B, la oportunidad para realizar la respuesta de alta probabilidad A después de la respuesta de baja probabilidad B tendrá como resultado el reforzamiento de la respuesta B. (B A refuerza B). La oportunidad para realizar la respuesta B de baja probabilidad después de la respuesta A de alta probabilidad no dará como resultado el reforzamiento de la respuesta A. (A B no refuerza A).

Se centra en la diferencia de en la probabilidad de las respuestas instrumental y reforzadora: en consecuencia también es denominado el principio de la probabilidad diferencial.

Estimulo la consideración de los reforzadores como respuestas más que como estímulos.

La hipótesis de la privación de respuesta: En la mayoría de los procedimientos de condicionamiento instrumental, la probabilidad momentánea de una respuesta reforzada se mantiene a un nivel alto mediante la restricción al acceso a la respuesta reforzante.

Premack (1965) reconoció la importancia de restringir el acceso a respuesta reforzadora para el condicionamiento instrumental. Caracterizo la privación de respuesta no solo como una condición necesaria para el reforzamiento sino como algo adjunto al principio

de probabilidad diferencial. La respuesta reforzadora todavía tiene que ser una conducta más probable que la respuesta instrumental. Por el contrario, Timberlake y Allison (1974) abandonaron totalmente el principio de probabilidad diferencial y argumentaron que la restricción de la respuesta reforzadora era el factor crítico para el reforzamiento instrumental, esta propuesta es denominada Hipótesis de privación de respuesta, hace explicita la idea radicalmente diferente de que un reforzador es producido por la contingencia instrumental en si misma. Posteriores desarrollos de las teorías de regulación conductual han establecido como las contingencias instrumentales crean los reforzadores y los efectos del reforzamiento

Regulación conductual y el punto de deleite conductual

Las teorías de la regulación conductual asumen que existen mecanismos homeostáticos análogos respecto a la conducta: Se propone que los organismos tienen una distribución de actividades preferida u óptima que luchan por mantener frente a los cambios o interrupciones. Se centran en el grado en que la contingencia instrumental respuesta- reforzador rompe la estabilidad conductual y empuja al individuo fuera de su distribución de actividades preferida u optima.

El punto de deleite conductual: La teoría de la regulación conductual asume que si los organismos son libres para distribuir sus respuestas entre las alternativas disponibles, lo harán de la forma en que sea mas cómodo o en algún sentido optimo para ellos: Esta distribución de respuestas define el punto de deleite conductual.

El punto de deleite conductual puede identificarse mediante la frecuencia relativa de ocurrencia de todas las respuestas de un organismo en una situación sin restricciones.

Imposición de una contingencia instrumental. La teoría de regulación conductual establece que los organismos defenderán el punto de deleite conductual contra los cambios. Lo interesante es que la línea de base libre del punto de deleite conductual no siempre puede ser restablecida después de que se haya introducido una contingencia instrumental. Este es a menudo el dilema que impone una contingencia instrumental. No permite volver al punto de deleite.

El punto de deleite proporciona la motivación para la conducta instrumental. La teoría de regulación conductual asume que para volver al punto conductual establecido continua siendo una meta en la distribución de respuestas. Cuando esta meta no puede alcanzarse, la redistribución de las respuestas entre las conductas instrumental y contingente llega a ser una cuestión de ajuste. La tasa de una respuesta se mantiene lo más cerca posible del nivel preferido sin cambiar la otra respuesta demasiado de su nivel preferido.

Staddon propuso un modelo de desviación mínima de regulación conductual para resolver el dilema de las restricciones del programa, la introducción de una contingencia respuesta-reforzador provoca que los organismos redistribuyan sus conductas entre las respuestas instrumentales y contingentes de manera que se minimice la desviación total de las dos respuestas con respecto al punto óptimo o de deleite.

Explicación los efectos de reforzamiento de: La regulación conductual incluye la defensa de un punto de deleite conductual frente a restricciones de respuesta impuestas

por una contingencia respuesta-reforzador. El aumento en la respuesta instrumental / un efecto de reforzamiento) es el resultado de mecanismos reguladores de la conducta que funcionan para minimizar las desviaciones del puto de deleite conductual.

Una visión sobre las contingencias de reforzamiento en un contexto conductual mas amplio: Las contingencias instrumentales no suceden en un vacio conductual ocurren en el contexto de una variedad de respuestas y reforzadores que puede obtener el sujeto. Centrarse solo en la respuesta instrumental y sus estímulos antecedentes y consecuentes (esto es, la estructura asociativa de la conducta instrumental) desatiende el contexto conductual más amplio ya que puede influir de forma significativa en el resultado de los procedimientos particulares de condicionamiento instrumental.

Conceptos económicos y distribución de respuesta

En las situaciones de condicionamiento instrumental, las restricciones están proporcionadas por el numero de respuestas que un organismo es capaz de realizar y el numero de respuestas requerido para obtener cada reforzador

Demanda del consumidor: La relación entre el precio de una comodidad y cuanto se obtiene se denomina curva de la demanda.

El grado en el cual el precio influye en el consumo se denomina elasticidad de la demanda.

El concepto de demanda del consumidor puede utilizarse para analizar el reforzamiento instrumental considerando el número de respuestas realizadas como análogo al dinero. EL precio de un reforzador es el tiempo o numero de respuestas requeridas para obtener un reforzador. Por tanto, el precio del reforzador está determinado por el programa de reforzamiento.

Madeen y Biekel (1999) ver ej., pág. 210 libro.

Determinantes en la elasticidad de la demanda: Los conceptos económicos han ayudado a identificar tres factores principales que influyen en como las restricciones de un programa moldean la redistribución de la conducta.

1. Disponibilidad de sustitutos: Es el factor que más influye en la elasticidad de la demanda. La disponibilidad de sustitutos aumenta la sensibilidad del artículo a los precios altos.

o Una fuente de reforzadores sustituible es la disponibilidad de un reforzador fuera de la sesión experimental. La parte de comida que no comen durante la sesión experimental se les da luego en la jaula hogar, esta situación se denomina una economía abierta, Esto se contrapone con una economía cerrada, en la cual los sujetos no reciben alimentación suplementaria. En general la elasticidad de la demanda es mayor en situaciones de economía abierta que en economías cerradas.

2. Rango de precios: Un aumento en el precio tiene menos efecto en precios bajos que en precios altos.

3. Nivel de ingresos: En estudios de condicionamiento instrumental, el número de respuestas o la cantidad de tiempo disponible para responder corresponde a los

ingresos. Cuantas más respuestas o tiempo tengan disponibles los animales, menos estará su conducta influida por los aumentos en el coste del reforzador.

Problemas con las aproximaciones de regulación conductual

El punto de deleite es una característica molar de la conducta. Se basa en una medida de cada respuesta acumulada a lo largo del bloque temporal amplio. Un punto de deleite molar dado puede alcanzarse de varias formas, de acuerdo con esta aproximación, las diferencias en las pautas de respuesta no deberían tener importancia. Pero la evidencia experimental indica que es importante como se alcanza el punto de deleite molar. En consecuencia una adecuada caracterización del deleite conductual requiere información sobre las pautas de elección moleculares.

Otra dificultad, tal vez más seria es que las respuestas durante un periodo de línea base libre no siempre tiene el mismo valor como respuestas que ocurren como parte de una contingencia instrumental impuesta, Hacer algo cuando no hay requerimientos impuestos externamente (correr por placer ) parece ser diferente a hacer lo mismo cuando se requiere por una contingencia instrumental impuesta.

Finalmente, debido a que las aproximaciones no comprenden procesos conductuales moleculares, no dicen nada de cómo los organismos defienden una combinación favorita de bienes o actividades.

Contribuciones de la regulación conductual

1. Nos alejo de la consideración de los reforzadores como tipos especiales de respuestas. Los efectos del reforzamiento se ven como producidos por las restricciones del programa en el devenir de las actividades de un organismo.

2. Los procedimientos de condicionamiento instrumental ya no se considera que estampan o fortalecen la conducta instrumental: en su lugar el condicionamiento instrumental es visto como la creación de una nueva distribución, o asignación de respuestas, la reasignación de la conducta incluye un aumento en la respuesta instrumental y una disminución de la respuesta reforzadora.

3. No existe una distinción fundamental entre las respuestas instrumentales y las reforzadoras, se distinguen solo por los papeles asignados a ellas mediante u n procedimiento de condicionamiento instrumental.

4. Aceptan la idea de que los organismos responden para maximizar sus beneficios. 5. Han proporcionado caminos nuevos y precisos para describir las restricciones

que imponen varios procedimientos de condicionamiento instrumental en el repertorio de conducta de un organismo. Mas importante, han enfatizado que la conducta instrumental no puede ser estudiada en un vacio o en un tubo de ensayo conductual. Todas las opciones de respuesta del organismo que se dan en un momento dado deben ser consideradas como un sistema.

Comentarios finales

Las dos aproximación parecen centrarse en asuntos completamente distintos, pero ambas han contribuido de forma significativa a la comprensión de la motivación de la conducta instrumental.

Incluyen diferentes niveles de análisis. La aproximación asociacionista involucra un nivel molecular donde el objetivo son los estímulos específicos, las respuestas, y sus conexiones. La regulación conductual opera a un nivel molar de agregados de conducta y el contexto conductual más amplia en el que operan las contingencias instrumentales.

Una se relaciona con procesos y la otra está más relacionada con funciones o metas a largo plazo. La aproximación asociacionista describe procesos específicos (asociaciones E-R, E-C, R-C y E-(R-C)) que sirven para generar y dirigir la conducta instrumental. Este es el punto de vista de la regulación conductual y la economía conductual, que asumen que los organismos trabajan para defender una distribución óptima de actividades. La defensa del punto de deleite conductual se alcanza mediante los procesos moleculares de las asociaciones.

Tema 8: Control por el estímulo.

Es tan importante la adecuación de una respuesta instrumental al contexto estimular en el que se realiza, que la falta de un apropiado control por el estimulo se considera a menudo anormal, desvestirse en privado es aceptable en publico motivo de arresto.

El control de la conducta por el estimulo es un aspecto importante de la forma en que los organismos se adaptan al ambiente. Para acomodarse de forma efectiva y evitar el peligro los animales tienen que comportarse de forma congruente con las circunstancias cambiantes.

Identificación y medida del control por el estimulo

¿Cómo se puede afirmar que una respuesta instrumental esta bajo el control de ciertos estímulos?

Respuesta diferencial y discriminación de estímulos

El control por el estimulo de la conducta instrumental se demuestra mediante variaciones en la respuesta (respuesta diferencial) relacionadas con las variaciones en los estímulos. Si un organismo responde de una manera en presencia de un estimulo, y de forma diferente en presencia de otro, se puede decir que su conducta esta bajo el control de esos estímulos. Estas respuestas diferenciales resultan evidentes en el comportamiento de las dos palomas del experimento de Reynolds, ver ej. pág. 219 libro.

La respuesta diferencial a dos estímulos también indica que las palomas estaban tratando cada estimulo de forma diferente. Esto se denomina discriminación de estímulos: se dice que un organismo muestra discriminación de estímulos si responde de forma diferente a dos o más estímulos. La discriminación de estímulos y el control por el estimulo constituyen dos maneras de considerar el mismo fenómeno: una no existe sin la otra. Si un organismo no discrimina entre dos estímulos, su conducta no está bajo el control de esas claves.

Otro aspecto interesante del experimento de Reynolds es que la conducta de cada pájaro estaba controlada por un estimulo diferente.

En ausencia de procedimientos especiales, los investigadores no siempre pueden predecir cuál de varios estímulos de aquellos que un organismo experimenta adquirirá control sobre su conducta instrumental

Generalización de estímulos

Identificar y diferenciar varios estímulos no es algo tan simple. Los estímulos pueden definirse de formas muy diversas. En ocasiones, objetos o eventos muy diferentes se consideran ejemplos del mismo estimulo debido a que comparten la misma función. En otros casos, los estímulos se identifican y distinguen partiendo de rasgos físicos precisos, como la longitud de onda.

Los análisis experimentales del problema han dependido en su mayoría del fenómeno de la generalización de estímulos, que es lo opuesto a la respuesta diferencial, o discriminación de estímulos. Se dice que un organismo muestra generalización de estímulos si responde manera similar a dos o más estímulos. Este fenómeno fue observado en primer lugar por Pavlov.

En un experimento clásico Guttman y Kalish palomas programa IV picotear con luz amarillenta con longitud de onda 580 nanómetros, después se observa que palomas también responde a 570 y590. Estos resultados mostraron un gradiente de respuesta en función de la semejanza entre cada estimulo de prueba y el estimulo original de entrenamiento. Este resultado es un ejemplo de lo que se denomina gradiente de generalización de estimulo.

Los gradientes de generalización del estimulo como medidas del control por el estimulo

Se utilizan a menudo para medir el control por el estimulo porque facilitan información acerca del grado de sensibilidad de la conducta de un organismo ante la variación de un aspecto particular del ambiente.

Guttman y Kalish (1956) y el experimento hipotético con las palomas ciegas a los colores indica que lo acusado del gradiente de generalización de un estimulo proporciona una medida precisa del grado de control del estimulo. Se obtiene un gradiente de generalización plano si el organismo responde de forma similar a todos los estímulos de la prueba. Esta falta de respuesta diferencial demuestra que el rasgo del estimulo que se varia en la prueba de generalización no controla la conducta instrumental. Por el contrario, se obtiene un gradiente de generalización acusado si el organismo responde en mayor medida a algunos de los estímulos de prueba que a otros. Esta respuesta diferencial evidencia el hecho de que la conducta instrumental esta bajo el control del rasgo del estimulo que varía entre los estímulos de prueba.

Si se da una gran cantidad de generalización, se dará poca respuesta diferencial. Si la respuesta es altamente diferencial ante los estímulos, se obtendrá una mínima generalización.

Factores del estimulo y la respuesta en el control por el estimulo.

La cuestión principal es la siguiente ¿Qué es lo que determina que una de las muchas características de una situación estimular adquiera control sobre la conducta instrumental?

Capacidad sensorial y orientación

El factor que determina de forma más evidente si una característica particular del estimulo llega a controlar la respuesta es la capacidad sensorial y de orientación del individuo. La presentación de estímulos con ciertas características de interés para un organismo no garantiza que otro organismo responderá a las mismas características.

Los sucesos fuera del rango de lo que un organismo puede detectar con sus órganos sensoriales simplemente no existen para ese organismo a menos que se amplifiquen o

sean transducidos a algo que el organismo pueda detectar. Las limitaciones en los estímulos que pueden llegar a controlar la conducta dependen también de si el individuo llega a tomar contacto con el estimulo.

Facilidad relativa del condicionamiento de varios estímulos. La intensidad con que los organismos aprenden sobre un estimulo depende de la facilidad relativa de condicionamiento de otras claves presentes en la situación. Este fenómeno se llama ensombrecimiento. Pavlov fue el primero en observar que si dos estímulos se presentan al mismo tiempo, la presencia del estimulo que se puede entrenar más fácilmente puede ocultar el aprendizaje del otro. En general cuanto más intenso sea el estimulo, mas rápido se condicionara y ensombrecerá el aprendizaje del estimulo más débil. Pavlov encontró que el estimulo débil podía llegar a condicionarse (algo más lentamente) si se presentaba solo.

Tipo de reforzamiento

Es más probable que ciertos tipos de estímulos adquieran control sobre la conducta instrumental con reforzamiento positivo que con reforzamiento negativo. Ver ej. pág. 225 libro

Estos hallazgos indican que el control por el estimulo de la conducta instrumental esta determinado en parte por el tipo de reforzamiento utilizado. Es más probable que los estímulos visuales adquieran control sobre la conducta en situaciones apetitivas que las claves auditivas, mientras que es más probable que estas adquieran control en situaciones aversivas, esto está probablemente relacionado con los sistemas de conducta que se activan en los dos casos, la activación del sistema de alimentación puede involucrar una sensibilidad incrementada a los estímulos visuales. En contraste los procedimientos de evitación de la descarga activan el sistema de conducta defensiva. Responder a claves auditivas puede ser particularmente adaptativo para evitar el peligro.

Tipo de respuesta instrumental

Otro factor que puede determinar que rasgos de un estimulo compuesto obtendrán control sobre la conducta es la naturaleza de la respuesta requerida por el reforzamiento, ver ej. pág. 227 libro.

Los resultados indican que las respuestas que se diferencian por la localización es más probable que lleguen a estar bajo el control de la característica espacial de las claves auditivas. Por el contrario las respuestas que se diferencian por la naturaleza (hacer/no hacer) es más probable que lleguen a estar bajo el control de la naturaleza de las claves auditivas, Este fenómeno se denomina efecto de la naturaleza-localización. Este efecto es una forma de asociación selectiva.

Elementos del estimulo frente a claves configuracionales en los estímulos compuestos

En el análisis anterior sobre el control de la conducta por varios elementos del estimulo, se asumió que los organismos tratan a estos elementos del estimulo como rasgos distintivos y separados del ambiente. Esto se denomina aproximación elemental del estimulo. Por tanto, en el efecto de naturaleza-localización, la naturaleza y la

localización de un estimulo auditivo se consideran características separables de las claves auditivas. Se suponía que una característica particular del estimulo (la naturaleza del sonido) se percibía de la misma manera independientemente del estatus de la otra característica (la localización del sonido). Una alternativa teórica importante presuma que los organismos tratan los estímulos complejos como un todo integral que no se divide en partes o elementos. Esto se denomina aproximación de la clave configuracional.

De acuerdo con la aproximación de la clave configuracional, los individuos responden a un estimulo compuesto en función de la configuración única de sus elementos. Se asume que los elementos no se tratan como entidades separadas. Pueden incluso no ser identificables cuando se presenta el estimulo compuesto, los elementos del estimulo son importantes no en cuanto a su individualidad sino en función de cómo contribuyen a la configuración total de la estimulación proporcionada por el compuesto.

El ensombrecimiento, según esta teoría, refleja diferentes grados de decremento de la generalización desde la fase de entrenamiento a la de prueba para los grupos de ensombrecimiento y de control, (Pearce, 1987): No hay decremento de la generalización para el grupo de control cuando se prueba el estimulo débil a porque es el mismo estimulo que recibieron durante el condicionamiento. Por el contrario, se da un considerable decremento de la generalización cuando se prueba el estimulo a en el grupo de ensombrecimiento tras el condicionamiento con el compuesto ab. Para el grupo de ensombrecimiento, la respuesta se condiciona al compuesto ab, que es muy diferente de presentar solo a durante la generalización, este mayor decremento de la generalización es la causa del efecto de ensombrecimiento.

En ciertas condiciones, los organismos claramente responden a los estímulos compuestos principalmente en términos de la configuración de los elementos que forman el compuesto.

Esta teoría es incompatible con varios ejemplos de asociaciones selectivas que se han descrito con anterioridad, no explica por qué el control por el estimulo está en función del tipo de reforzamiento utilizado o del tipo de respuesta requerida. La conclusión más prudente es que los organismos responden a los compuestos estimulares tanto a partir de los elementos del estimulo que forman el compuesto como en función de configuraciones estimulares únicas creadas por los elementos del estimulo. En ciertas circunstancias predomina el control elemental, mientras que en otras condiciones predomina el control de las características configuracionales de los compuestos estimulares.

La estructura de una teoría unificada de este tipo ha sido descrita recientemente por Wagner y Brandon (2001), estímulos como el sonido de un tono contienen rasgos distintivos (tono, intensidad, localización). Cuando un estimulo se combina con otro se crean nuevos elementos estimulares configuracionales que son únicos para este nueva combinación estimular. Además, algunos de los rasgos individuales de los estímulos originales se pierden en la combinación. Esto sesga el control por el estimulo a favor de los elementos configuracionales y produce resultados congruentes con la aproximación de la clave configuracional

Factores de aprendizaje en el control por el estímulo

Los factores del estimulo y la respuesta son los puntos de arranque del control por el estimulo. El que ciertos estímulos lleguen a controlar la conducta a menudo depende de lo que el organismo ha aprendido acerca de esos estímulos.

La sugerencia de que la experiencia con los estímulos puede determinar hasta qué punto estos llegan a controlar la conducta tuvo su origen en los esfuerzos por explicar el fenómeno de la generalización de estímulos. Pavlov sugirió que la generalización del estimulo se da porque el aprendizaje sobre el EC llega a transferirse a otros estímulos en función de la semejanza física de esos estímulos de prueba con el EC original.

Lashley y Wade (1946) adoptaron una postura contraria a la de Pavlov. Rechazaron la idea de que la generalización del estimulo reflejase la transferencia del aprendizaje y argumentaron que reflejaba la ausencia de aprendizaje. En particular propusieron que la generalización del estimulo ocurre si los organismos no han aprendido a distinguir las diferencias entre los estímulos. Defendían que los animales tenían que aprender a tratar los estímulos como diferentes uno de otro. Consideraban la forma del gradiente de generalización del estimulo como determinada principalmente por las experiencias previas de aprendizaje del organismo más que por las propiedades físicas de los estímulos.

Entrenamiento en discriminación de estímulos

Numerosos estudios han demostrado que el control por el estimulo puede alterarse de forma notable por las experiencias de aprendizaje. En un procedimiento de discriminación de estímulos los participantes se exponen al menos a dos estímulos diferentes, pero el reforzamiento por realizar la respuesta instrumental está disponible solo en presencia de uno de los colores. Los procedimientos de discriminación de estímulos establecen un control por los estímulos que señalan cuando esta o no disponible el reforzamiento. Cuando E+ y E- han adquirido control sobre la conducta del organismo, se denominan estímulos discriminativos. El E+ es un estimulo discriminativo para la realización de la respuesta instrumental, y el E- es un estimulo discriminativo para la supresión de la respuesta.

También pueden establecerse discriminaciones de estímulos utilizando procedimientos de condicionamiento clásico.

Los procedimientos instrumentales de discriminación de estímulos se diferencian de los procedimientos de condicionamiento clásico solo en que el reforzador se presenta de forma contingente a la respuesta durante el E+.

En un programa múltiple de reforzamiento funcionan diferentes programas de reforzamiento en presencia de diferentes estimulo.

Efectos del entrenamiento en discriminaciones sobre el control por el estimulo

El entrenamiento en discriminación sitúa la conducta instrumental bajo el control del E+ y el E-. Los investigadores deben también determinar lo acusado del gradiente de generalización cuando los participantes responden en presencia de estímulos que varían sistemáticamente a partir del E+: Es mas debe determinarse que aspecto del

procedimiento del entrenamiento en discriminación es responsable del tipo de gradiente de generalización del estimulo que se obtiene.

Jenkins y Harrison (1960,1962) examinaron como los estímulos auditivos que diferían en el tono llegaban a controlar la conducta de picoteo de las palomas reforzada con comida. Un grupo de pájaros fue reforzado por picotear en presencia de un tono de 1000 hertzios y no recibía reforzamiento cuando el tono no se presentaba. El tono de 1000 hz servía como E+ y la ausencia de tono como E-.

Para el segundo grupo, el tono de 1000 hz sirvió de nuevo como E+, pero el E- fue un tono de 950 hz. El tercer grupo de palomas sirvió como grupo de control y no recibió entrenamiento, el tono de 1000 hz sonaba constantemente y siempre podían recibir reforzamiento por picotear cuando estaban en la cámara experimental.

Después de acabar el entrenamiento, en cada grupo se puso a prueba la conducta de picoteo en presencia de tonos de varia frecuencias para ver con que precisión controlaba el tono dicha conducta. El grupo control respondió de forma casi idéntica en presencia de todos los estímulos de prueba; el tono de los sonidos no controlaba su conducta: Cada uno de nosotros procedimientos de entrenamiento produjo un mayor nivel de control estimular por el tono. El gradiente de generalización más acusado y por tanto el control por el estimulo más fuerte se observo en los pájaros que habían sido entrenados con el tono de 1000 hz como E+ y el tono de 950 como E-. Las otras (1000 hz y ausencia de tono) mostraron un grado intermedio de control.

Este experimento aporto dos conclusiones importantes ¡el entrenamiento en discriminación aumenta el control por el estimulo de la conducta instrumental, y 2 una dimensión particular del estimulo (como la frecuencia tonal) es más probable que adquiera control sobre la respuesta si el E+ y el E- difieren a lo largo de la dimensión del estimulo.

Rango de posibles estímulos discriminativos

Los procedimientos de entrenamiento en discriminación se emplean a menudo para evaluar la capacidad sensorial de los animales. Schsterman y colaboradores lo han utilizado para determinar los umbrales visuales y auditivos .Los investigadores también se han interesado por el estudio de si los animales son capaces de detectar las sensaciones internas creadas por una droga. Esta investigación ha mostrado que los mecanismos de control por el estimulo con drogas son asombrosamente parecidos a los mecanismos identificados por Jenkins y Harrison para el control del picoteo de una tecla por claves visuales en las palomas. El gradiente de generalización fue mucho más acusado, lo que indica un control por las drogas mucho más fuerte.

¿Qué se aprende en el entrenamiento de discriminación?

Teoría de Spence del aprendizaje de discriminación: Esta basada en la idea de que lo que se aprende tanto el significado del E+ como del E-, e sea aprender tanto a responder al E+ como a suprimir la respuesta ante el E-. El reforzamiento de una respuesta en presencia del E+ condiciona tendencias excitatorias de respuesta al E+. Por el contrario, el no reforzamiento de la respuesta durante el E- condiciona propiedades inhibitorias al E-, lo que sirve para suprimir la conducta instrumental. Se asume que la respuesta

diferencial al E+ y al E- refleja tanto la excitación por responder ante el E+ como la inhibición por responder ante el E-Comprobar esta requiere pruebas sofisticadas. una posibilidad es utilizar los gradientes de generalización del estimulo; Debe observarse un gradiente de generalización acusado, con la mayor cantidad de respuesta ante el E+, un resultado como este se llama gradiente de generalización del estimulo excitatorio, Por el contrario, si se ha condicionado una tendencia inhibitoria al E-, entonces los estímulos que difieran progresivamente del E- deberían ser cada vez menos efectivos en inhibir la respuesta instrumental, este resultado se llama gradiente de generalización del estimulo inhibitorio.

Las pruebas conductuales llevadas a cabo décadas después comprobaron que las ideas de Spence eran sustancialmente correctas. En un experimento clásico honig, Boneau, Burstein y pennypacker, 1963. Un grupo de palomas es reforzado cuando la tecla estaba iluminada con luz blanca y una línea vertical negra (E+) sin la línea vertical no refuerzo (E-). 2º Grupo el E+ y E- intercambiados, después de que los dos grupos aprenden a responder al E+, se llevaron a cabo las pruebas de generalización del estimulo para averiguar el grado de control de la barra vertical negra sobre la conducta; en el grupo 1, mayor tasa de respuesta ante la raya vertical y progresivamente descendiendo, esto ilustra un gradiente de generalización del estimulo excitatorio. En el grupo 2los estímulos que eran cada vez mas diferentes del original E- producían progresivamente menos inhibición en la conducta, ilustrando un gradiente de generalización del estimulo inhibitorio.

Este experimento muestra que el entrenamiento en discriminación puede producir tanto condicionamiento excitatorio al E* como condicionamiento inhibitorio al E-. El hecho de que los gradientes de excitación e inhibición puedan ocurrir alrededor del E+ y del E- proporciona un fuete apoyo a la teoría de Spence del aprendizaje de discriminación.

Se obtienen diferentes resultados si los estímulos E+ y E- difieren cuantitativamente en una característica en lugar de cualitativamente (incluyendo muchas características.)

Interacciones entre el E+ y el E-: desplazamiento del máximo

Lo que los sujetos aprenden sobre el E+ es independiente de lo que aprenden sobre el E-. Esta suposición es demasiado simplista. Lo que se aprende sobre el E+ puede influir en la respuesta al E- y viceversa. Estas interacciones son particularmente probables si el E+ y el E- se relacionan de alguna manera.

Una de las maneras en que el E+ y el E- puede estar relacionados es siendo semejantes excepto por un rasgo o atributo. Un procedimiento de entrenamiento en que solo difieren por el valor de una característica del estimulo se llama discriminación intradimensional: son de particular interés debido a que están relacionadas con el problema de la ejecución experta, esta implica normalmente realizar distinciones sutiles. Distinguir los estímulos que difieren en una única característica es más difícil que distinguir entre estímulos que difieren en muchos aspectos. La discriminación intradimensional requiere la detección de un único rasgo diferenciador entre el E+ y el E- y, en consecuencia, es una forma de ejecución experta.

Una característica importante de la discriminación intradimesional es que a veces dan como resultado una interesante interacción entre las respuestas al E+ y al E-, en un

experimento clásico Hanson (1959) examinaba el grado en que varios colores controlaban la conducta de picoteo en paloma. Todos los sujetos fueron reforzados con una luz de 550nn, el E+ era el mismo para todos los grupos, diferían en lo similar que era el E- al E+. Un grupo recibió un E- de 590nn, para otro grupo el E- era de 555nm, y u n grupo de control que no recibió entrenamiento en discriminación pero que también fue reforzado por picotear en presencia del estimulo de 550 nm. El grupo de control mostró un gradiente de generalización del estimulo excitatorio normal centrado alrededor del E+, el grupo en que el E- fue de 590nm mostró un desplazamiento del máximo del gradiente de generalización desde el E+ llamativo porque la respuesta nunca se reforzó en 540 o 530donde se obtuvieron las tasas más altas de respuesta, estos estímulos nunca habían sido presentados durante el entrenamiento original.

El desplazamiento del máximo del gradiente de generalización alejado del E+ original se denomina efecto del desplazamiento del máximo, este puede ocurrir en cualquier discriminación intradimensional.

Explicación de Spence del desplazamiento del máximo. El efecto de desplazamiento de máximo es importante porque muestra que el único estimulo en cuya presencia se refuerza la respuesta (e+) no es necesariamente es estimulo que evoca la tasa de respuesta más alta, Spence sugirió que los gradientes excitatorio e inhibitorio pueden producir el fenómeno de desplazamiento del máximo, asumió que el entrenamiento en discriminación intradimensional produce gradientes de generalización excitatorios e inhibitorios centrados en el E+ y el E-, sin embargo, debido a que el E* y el E_ son semejantes en las tareas de discriminación intradimensional, los gradientes de generalización de la inhibición y excitación se superpondrán. Es más, el grado de superposición dependerá del grado de semejanza entre el E+ y el E-. La inhibición generalizada del E- suprimirá la respuesta al E+, dando como resultado un efecto de desplazamiento del máximo.

Explicaciones alternativas del desplazamiento del máximo: Una cuestión importante es si vemos los estímulos en función de sus propiedades individuales y absolutas, o en función de su relación con otros estímulos que experimentamos, existe evidencia consistente con cada una de estas aproximaciones, que sugiere que ambos tipos de mecanismos están implicados en la forma de responder de los organismos.

El modelo de Spence es un modelo de aprendizaje absoluto del estimulo. Predice la conducta basada en las propiedades excitatorias netas de los estímulos individuales. Una aproximación alternativa asume que los organismos aprenden a responder a un estimulo basándose en la relación de ese estimulo con otras claves de la situación. Una predicción interesante de esta aproximación es que la forma de un gradiente de generalización cambiara en función del rango de los estímulos de prueba que se presenten durante la sesión de generalización. Estas y oras predicciones de la teoría relacional han sido confirmadas.

Entrenamiento de equivalencia de estímulos

De la misma forma que el entrenamiento en discriminación potencia la respuesta diferencial, el entrenamiento en equivalencia potencia la respuesta generalizada o equivalencia de estímulos.

Se dispone de varias aproximaciones para promover la generalización en lugar de la discriminación, 1º (Herrnstein, Loveland y Cable 1976, la estrategia básica de entrenamiento es reforzar la misma respuesta en presencia de varias imágenes que contiene agua, una vez que aprenden la discriminación agua/no agua, su conducta se generalizo a nuevas fotografía.

Los investigadores también han explorado la posibilidad de que la equivalencia funcional entre dos estímulos diferentes podría establecerse enlazando cada una de las distintas claves con un tercer estimulo común Ej. Honey y Hall (1989) un grupo ruido y click con comida, grupo control ruido y click, solo el click con comida después ambos recibe ruido con descarga-miedo al ruido. Los investigadores estaban interesados en saber si este miedo condicionado se generalizaría al clik, se dio significativamente más generalización en los animales entrenados en equivalencia que en el grupo de control.

El emparejamiento de estímulos diferentes con la misma consecuencia crea equivalencia funcional entre esos estímulos, con la consecuencia de que una respuesta condicionada a uno de ellos se generalizara a los oros. Una definición más formal de clase de equivalencia ha sido propuesta por Siedman y colaboradores. Se dice que existe una clase equivalencia si sus miembros poseen propiedades matemáticas 1 reflexividad o igualdad, 2 simetrías 3 transitividad. La reflexividad o igualdad se refiere a la relación A=A: la simetría existe si una relación es bidireccional, la transitividad se refiere a la integración de dos relaciones en una tercera.

Claves contextuales y relaciones condicionales

Un estimulo se dice que es discreto si se presenta durante un breve periodo y tiene un comienzo y un final claros. Un análisis más comprensivo de los estímulos que los organismos experimentan durante el curso del condicionamiento instrumental indica que los estímulos discriminativos discretos suceden en presencia de un fondo de claves contextuales. Estas pueden ser visuales, auditivas o claves olfatoria de la habitación. La investigación reciente indica que las claves contextuales pueden proporcionar una importante fuente adicional de control de la conducta aprendida

Control por claves contextuales

Ver libro págs. 243 y 244

Control por las relaciones condicionales

En capítulos anteriores se han destacado las relaciones que involucran solo dos eventos, un Ec y un EI, o una respuesta y un reforzador. Las relaciones entre dos eventos se llaman relaciones binarias. En ciertas circunstancias, la naturaleza de una relación binaria está determinada por un tercer suceso, llamado modulador, la relación de un modulador con la relación binaria que señala se denomina una relación condicional. Numerosos experimentos han indicado que los animales pueden aprender a utilizar moduladores para decir cuando está en funcionamiento una relación binaria particular.

Un procedimiento en el que un organismo es reforzado por responder en presencia del E+ pero no es reforzado en presencia del E-, los estímulos discriminativos E+ y E- son moduladores que señalan la relación entre la respuesta y el reforzador. Existe una

relación respuesta-reforzador durante el E+ y una relación diferente durante el E-, por tanto los procedimientos de discriminación instrumental incluyen el control condicional de la relación entre la respuesta y el reforzador.

Control condicional en el condicionamiento pavloviano: El concepto fundamental del control condicional es que un evento señala la relación entre otros dos eventos. Habitualmente se concibe el condicionamiento clásico como una relación binaria entre un estimulo condicionado y uno incondicionado. Establecer una relación condicional requiere introducir un tercer suceso (el modulador), ver ej. pág. 246

En los procedimientos de discriminación instrumental, los moduladores (E+ y E-) se denominan estímulos discriminitativos, en el condicionamiento pavloviano, algunos investigadores han denominado al control condicional de la respuesta facilitación debido a que el modulador facilita la respuesta, el modulador se llama facilitador. Más común, el control condicional en el condicionamiento clásico se llama establecimiento de la ocasión porque el modulador establece la ocasión para los emparejamientos del EC con el EI, en esta terminología el modulador se llama establecedor de la ocasión.

Distinción entre la excitación y la modulación: El establecimiento de la ocasión es un aspecto importante del condicionamiento clásico porque parece involucrar mecanismos de aprendizaje diferentes. En varios estudios, los intentos de obtener evidencia de las propiedades excitatorias condicionadas de los moduladores han fracasado, estos experimentos indican que un estimulo puede establecer la ocasión para la respuesta condicionada elicitada por otra clave sin elicitar por sí mismo una respuesta condicionada visible. Otros estudios han mostrado que condicionar las propiedades excitatorias simples a un estimulo no hace que este funcione como un modulador.

La evidencia adicional para mantener la distinción entre modulación y excitación condicionada se basa en los efectos de los procedimientos de extinción. La extinción es un procedimiento en el cual un estimulo previamente condicionado se presenta repetidamente pero se omite el EI.

Un estimulo condicionado excitatorio señala la próxima presentación del Ei. La ausencia del EI después de la presentación del EC durante la extinción es una violación de esa expectativa. Por tanto, el valor como señal del EC tiene que reajustarse en la extinción para estar en consonancia con la nueva realidad. Un reajuste como este no se requiere en un procedimiento de extinción de un establecedor de la ocasión

Un establecedor de la ocasión señala una relación entre un EC y un EI. La ausencia del EI cuando se presenta el establecedor de la ocasión por si solo durante la extinción no significa que la relación entre el EC y el EI haya cambiado. La información señalada por un establecedor de la ocasión no se prueba que sea incorrecta mediante la presentación del modulador por si mismo durante la extinción. En consecuencia, la habilidad del modulador para promover la respuesta elicitada se reduce si se altera la relación EC-EI señalada por el modulador.

Otra evidencia que apoya la conclusión de que el establecedor de la ocasión es distinto de la excitación convencional se ha obtenido en las pruebas de transferencia, estas fueron llevadas a cabo para determinar si un estimulo que había sido condicionado para establecer la ocasión de responder a un EC critico particular también incrementaría la

respuesta a orto EC. Se ha obtenido evidencia de transferencia positiva de los efectos de un modulador a un nuevo EC crítico, los efectos de transferencia son más probables si los nuevos estímulos críticos han servido previamente como estímulos críticos de otros estímulos moduladores. Las limitaciones en la transferencia proporcionan evidencia adicional de que los moduladores tienen sus efectos mediante algún mecanismo distinto de la excitación.

Modulación frente a condicionamiento configuracional: Los efectos modulatorios requieren la respuesta al compuesto estimular como constituido por elementos independientes estimulares, Los investigadores han presentado los elementos uno tras otro más que simultáneamente, en lo que se llama compuesto serial. En los ensayos reforzados, el establecedor de la ocasión es presentado normalmente primero, seguido por el EC crítico y el reforzamiento. Holland y colaboradores han encontrado que los organismos responden a las discriminaciones condicionales que incluyen compuestos seriales en términos de relaciones condicionales. En contraste, la utilización de compuestos simultáneos en la discriminación condicional a menudo no produce efectos modulatorios.

Tema 9: Extinción.

La extinción puede llevarse a cabo sólo después de que haya sido establecida una respuesta o una asociación utilizando condicionamiento pavloviano o instrumental. El objetivo es revertir los efectos de la adquisición, pero raramente se alcanza y en la mayoría resultan imposible. Fenómenos como la recuperación espontánea, la renovación y el restablecimiento muestran que la extinción no elimina lo que se aprendió de forma original.

Los estudios sobre devaluación del reforzador sugieren que la extinción no tiene virtualmente ningún impacto sobre las asociaciones E-C o R-C. Parece implicar el nuevo aprendizaje de una asociación E-R inhibitoria que se superpone a lo que se aprendió con anterioridad.

La inhibición surge de los efectos de la frustación y esta falta inesperada de recompensa es responsable de una serie de efectos “paradójicos” de la recompensa, incluyendo el efecto del reforzamiento parcial en la extinción.

El reforzamiento parcial o intermitente permite a los organismos aprender sobre la falta de recompensa de manera que les sirva para inmunizarse frente a los efectos de la extinción, como demuestra los estudios acerca del momento conductual.

La extinción implica la omisión del EI o reforzador. Por tanto, la extinción en condicionamiento clásico incluye presentaciones repetidas del estimulo condicionado por solo; la extinción en el condicionamiento instrumental implica no volver a presentar reforzador como una consecuencia de la respuesta instrumental. El resultado es que respuesta condicionada disminuye. La extinción no es lo contrario de la adquisición.

La extinción se produce por la omisión del EI que sigue a las presentaciones del EC o la omisión del reforzador que sigue a la respuesta instrumental. El olvido, por el contrario, es una disminución de la respuesta condicionada que se da por la ausencia prolongada de experiencia con el estimulo condicionado o con la respuesta instrumental.

La extinción no siempre funciona en la terapia de conducta, los avances sugieren que los fallos en la extinción reflejan las limitaciones normales de la misma. La extinción no revierte los efectos de la adquisición, en lugar de ello, implica el aprendizaje de algo nuevo que se superpone sobre lo que se aprendió antes (sin la perdida de lo que se aprendió anteriormente).

Efectos de los procedimientos de extinción

La extinción disminuye la tasa de respuesta e incrementa la variabilidad de respuesta, pero no altera de otro modo la estructura de la conducta.

Si un organismo está acostumbrado a recibir reforzamiento por una respuesta particular, puede trastornarse cuando no vuelve a entregar los reforzadores. Las reacción emocional inducida por la falta de un reforzador esperado se denomina frustación. La ausencia frustrante de recompensa proporciona energía a la conducta que en ocasiones puede ser lo suficietemente severa como para implicar reacciones agresivas.

Extinción y aprendizaje original

Aunque la extinción produce importantes efectos conductuales y emocionales, no revierte los efectos de la adquisición. La evidencia de que la extinción no elimina lo que se aprendió originalmente se ha obtenido a través de estudios sobre la renovación espontanea, la renovación, el restablecimiento y los efectos de la devaluación del reforzador.

Recuperación espontanea

La recuperación espontanea tras el condicionamiento pavloviano: La extinción se disipa con el tiempo, y como consecuencia, la respuesta condicionada original vuelve a presentarse si el sujeto se pone a prueba tras una demora que siga al procedimiento de extinción.

Recuperación espontanea tras el condicionamiento instrumental: La recuperación espontánea es un fenómeno notable en la extinción tras el condicionamiento instrumental. La introducción de un periodo de descanso tras la extinción produce una recuperación sustancial en la respuesta.

Renovación del condicionamiento excitatorio original

La renovación se refiere a la recuperación de la ejecución propia de la adquisición que se da cuando se cambian las claves contextuales que estaban presentes durante la extinción. El cambio puede consistir en una vuelta al contexto de la adquisición original o a un cambio a un contexto “neutral”.

El efecto de la renovación no sólo se ha observaldo en el condicionamiento pavloviano del miedo, sino también en el condicionamiento apetitivo del miedo, la inhibición condicionada y en varias situaciones de condicionamiento instrumental. El fenómeno se evidencia no sólo con claves externas contextuales sino con claves contextuales creadas por estados provocados por drogas. También puede darse si el sujeto se retira del contexto de adquisición a uno alternativo que no es el de la adquisición original. Este tipo de renovación no es tan sólido como cuando se reinstaura en el contexto original de adquisición.

La mayor parte de la evidencia indica que el efecto de renovación se produce porque la memoria de la extinción es específica de las claves que estaban presentes durante la fase de extinción. En consecuencia, un cambio en el contexto de la extinción dificulta la recuperación de la memoria de extinción, con el resultado de que se pierde la ejecución propia de la extinción.

Bouton (1993,1994) ha sugerido que las claves contextuales sirven para eliminar la ambigüedad del significado de un estimulo condicionado. Un EC que adquiere condicionamiento excitatorio y luego se extingue también tiene un significado ambiguo, en el sentido de que podría indicar la cercanía del EI (adquisición) o su ausencia (extinción). Esta ambigüedad permite al EC ponerse bajo el control contextual de manera más fácil. Tras el entrenamiento de adquisición por sí solo, el EC no es ambiguo porque solo significa una cosa (la proximidad de la entrega del EI). En consecuencia, este EC no es susceptible de control contextual.

Los investigadores han explorado la forma de reducir el efecto de renovación. Un procedimiento que se muestra prometedor es llevar a cabo la extinción en distintos contextos. Otras técnicas para reducir el efecto de renovación implican entrenamiento en inhibición condicionada, condicionamiento diferencial, y la presentación del EC explícitamente emparejado con el EI.

Restauración de la ejecución propia de la extinción

El efecto de renovación representa reactivar una conducta aprendida previamente mediante el cambio del contexto a condiciones más aproximadas a las presentes cuando la conducta se adquirió con anterioridad. Esta estrategia puede aplicarse a la extinción, es decir, la ejecución propia de la extinción puede restaurarse introduciendo claves contextuales que reactiven la memoria de extinción.

La recuperación espontanea implica la recuperación de la conducta condicionada originalmente que sigue a la extinción si transcurre un periodo suficiente de tiempo tras la fase de extinción. La conducta propia de la extinción puede restaurarse (contrarrestando la recuperación espontaneas) presentando las claves que estaban presentes durante la fase de extinción. La recuperación expontánea se debe a un eterioro de las claves contextuales de la extinción que se da con el paso del tiempo.

Restablecimiento de la excitación condicionada

El restablecimiento se refiere a la recuperación de la respuesta excitatoria a un estimulo extinguido, producida por exposiciones al estimulo incondicionado. Las respuestas que se extinguen con éxito, pueden recuperarse si el individuo se enfrenta de nuevo con el estímulo incondicionado.

Investigaciones durante los últimos 20 años sobre el efecto del restablecimiento, han indicado que el condicionamiento contextual es importante, pero no porque permita la suma de la extinción sino por suprimir la ambigüedad del significado de un estimulo que tiene una historia mezclada de condicionamiento y extinción. El contexto tiene poco efecto en los estímuos con una historia sólo de condicionamiento.

Bouton considera el restablecimiento como una forma de renovación. Las claves contextuales condicionadas proporcionan algunas de las claves contextuales para la respuesta excitatoria en circunstancias normales. Estas se extinguen cuando se presenta el EC por si solo durante la extinción.

Sensibilidad a la devaluación del reforzador

La persistencia del aprendizaje original a pesar de la extinción puede también investigarse analizando los efectos de la devaluación del reforzador. Rescorla ha utilizado la técnica de devaluación del EI para determinar si la asociación EC-EI establecida a través de condicionamiento pavloviano persiste a lo largo de la extinción.

Los hallazgos han fortalecido la conclusión de que la extinción no elimina las asociaciones R-C y E-C que se aprende durante el condicionamiento instrumental.

¿Qué se pretende con la extinción?

Si como hemos visto la extinción no implica “desaprendizaje” y deja intacta las asociaciones R-C y E-C, ¿por qué disminuye las respuestas en los procedimientos de extinción?

Asociaciones ER inhibitorias

Los investigadores han vuelto a considerar la relevancia de las asociaciones E-R. En lugar de centrarse en las asociaciones excitatorias E-R, como hizo originalmente Thorndike, han llegado a la conclusión de que la falta de reforzamiento produce una asociación E-R inhibitoria: La falta de reforzamiento de una respuesta en presencia de un estímulo específico, produce una asociación E-R inhibitoria que sirve para suprimir esa respuesta siempre y cuando el E esté presente. Esta hipótesis, predice que los efectos de la extinción serán altamente específicos del contexto en el que la respuesta fue extinguida.

La omisión de una recompensa esperada genera desilusión o frustración. Estos efectos emocionales se presume que desempeñan un papel crítico en la disminución conductual que se da en la extinción. La ausencia de recompensa esperada desencadena una reacción frustante aversiva incondicionada que sirve para que se deje de responder durante el curso de la extinción mediante el establecimiento de una asociación inhibitoria.

La afirmación de que la extinción implica el aprendizaje de una asociación inhibitoria resulta controvertida frente a las teorías convencionales que consideraban la inhibición condicionada y la extinción como fenómenos diferentes.

Efectos paradójicos de la recompensa

Efecto de sobreentrenamiento en la extinción. Cuanto más entrenamiento con reforzamiento se proporciona más fuerte es la expectativa de recompensa, y más fuerte la frustración cuando se introduce la extinción. La disminución en la respuesta se debe a los efectos frustrantes de la ausencia de recompensa, el entrenamiento de reforzamiento más extenso produce una extinción más rápida. Especialmente evidente cuando el entrenamiento incluye reforzamiento continuo.

Ejemplo: Podriamos pensar que un entrenamiento más extenso crearía una respuesta “más fuerte”, que sería más resistente a la extinción, pero sucede lo contrario.

Efecto de magnitud del reforzamiento en la extinción: se refiere al hecho de que la respuesta disminuye más rápido durante la extinción que sigue a un reforzamiento con un reforzador mayor. Es más evidente cuando el entrenamiento incluye reforzamiento continuo.

Ejemplo: Si consideramos dos posibiliades: en una, que se recibe 100€ al mes; en la otra, 20€ al mes.

Si se deja de percibir la cantidad, es más aversiva si nos hemos acostumbramos a 100 que a 20.

Efecto del reforzamiento parcial en la extinción: Es el efecto paradójico más estudiado.

Un factor crítico que determina la magnitud de los efectos tanto conductuales como emocionales de un procedimiento de extinción es el programa de reforzamiento que opera antes de que se introduzca el procedimiento de extinción. Pero la característica dominante del programa que determina los efectos de la extinción es si la respuesta instrumental se reforzó cada vez que ocurría (reforzamiento continuo) o sólo algunas veces (reforzamiento intermitente o parcial). La extinción es mucho más lenta y produce menos reacciones de frustración si estaba en activo un programa de reforzamiento parcial antes de la introducción del procedimiento de extinción. Este fenómeno se denomina el efecto de reforzamiento parcial en la extinción o ERPE,

Mecanismos del efecto del reforzamiento parcial en la extinción

La explicación más evidente del ERPE es que la introducción de la extinción es más fácil de detectar tras el reforzamiento continuo que tras el reforzamiento parcial. La ausencia de reforzamiento es presumiblemente mucho más fácil de detectar tras el reforzamiento continuo. Esta explicación del efecto del reforzamiento parcial en la extinción se llama hipótesis de la discriminación.

El reforzamiento parcial parece enseñar a los sujetos a no rendirse ante la ausencia de reforzador. El reforzamiento parcial favorece la persistencia de dos formas diferentes.

Una explicación seria la teoría de la frustración, basada en que los sujetos aprenden sobre los efectos emocionales de la ausencia de recompensa durante el entrenamiento en reforzamiento parcial. La otra explicación, la teoría secuencial, está basada en lo que los sujetos aprenden sobre la memoria de la ausencia de recompensa.

Teoría de la frustración: Desarrollada por Abram Amsel, la persistencia en la extinción es resultado del aprendizaje de algo paradójico, es decir, continuar respondiendo cuando se espera no ser reforzado o ser frustrado. Asume que el reforzamiento intermitente da como resultado aprender a responder a pesar de esperar la ausencia de reforzamiento. Sin embargo, este aprendizaje requiere considerable experiencia con reforzamiento intermitente.

El reforzamiento intermitente incluye ensayos reforzados y no reforzados. Lo recompensados animan a los sujetos a esperar reforzamiento y los no recompensados les llevan a espera la ausencia de recompensa. Por tanto el reforzamiento intermitente produce el aprendizaje de expectativas tanto de recompensa como de no recompensa. La expectativa de recompensa alienta a los sujetos a responder, y la anticipación de la ausencia de reforzamiento desalienta la respuesta, al principio del entrenamiento los sujetos entran en conflicto con lo que se ha de hacer. Sus expectativas motivan tendencias de respuesta opuestas. Sin embargo a medida que el entrenamiento continua, el conflicto se resuelva a favor de responder.

La resolución del conflicto ocurre debido a que el reforzamiento no es predecible en el típico programa de reforzamiento parcial. Debido a estas experiencias, la respuesta instrumental se condiciona a la expectativa de la ausencia de recompensa. De acuerdo con la teoría de la frustración, esta es la clave de la persistencia en responder durante la extinción. Con suficiente entrenamiento, el reforzamiento intermitente da como resultado el aprendizaje de realizar la respuesta instrumental como reacción a la expectativa de ausencia de recompensa. Por el contrario no existe nada en la experiencia

del reforzamiento continuo que motive a los sujetos a responder cuando esperan ausencia de recompensa. El reforzamiento continuo no produce persistencia en la extinción.

Teoría secuencial; Capaldi, está formulada en términos de memoria. Asume que los sujetos pueden recordar si fueron reforzados por realizar la respuesta instrumental en el pasado reciente. Recuerdan los ensayos recientes tanto recompensados como no recompensados.

Se asume además que durante el entrenamiento en reforzamiento intermitente, la memoria de la ausencia de recompensa llega a ser una clave para la realización de la respuesta instrumental, esto produce persistencia en le extinción.

Considerese un ensayo: RNNRRNR. El sujeto es recompensado en el primer ensayo, no recompensado en los dos siguientes, recompensado dos veces, luego no reforzado y finalmente recompensado de nuevo. Con suficientes experiencias de este tipo, el sujeto aprende a responder siempre y cuando recuerde no haber sido reforzado en los ensayo precedentes. Este aprendizaje provoca la persistencia de la respuesta instrumental en la extinción.

Desde que la dos teorías fueron propuestas se ha obtenido gran evidencia en apoyo de cada teoría. Ambas representan dos formas diferentes en las que el reforzamiento parcial puede influir sobre la respuesta durante la extinción. Los mecanismos de memoria pueden contribuir en mayor medida cuando los ensayos de entrenamiento no estén separados por largos intervalos entre ensayos. El aprendizaje emocional descrito por la teoría de la frustración es menos sensible a los intervalos entre ensayos y, por tanto, proporciona una mejor explicación del ERPE cuando se utilizan ensayos ampliamente espaciados.

Resistencia a la extinción y momento conductual

Otra forma de considerar la persistencia de la respuesta en la extinción es que representa la resistencia al cambio en las contingencias de reforzamiento que sucede cuando se introduce la extinción. Nevin y colaboradores han estudiado la resistencia al cambio de forma más general y han propuesto el concepto de momentos conductual para caracterizar la susceptibilidad de la conducta a las interrupciones. Está basada en el concepto de momento de la física newtoniana. Predice que la conducta que posee un momento elevado también será difícil de “parar” o interrumpir por las manipulaciones.

Un experimento en el que participó HCB, una chica de 17 años y una edad mental de 3. Los resultados obtenidos con HCB ilustran dos conclusiones normales de los estudios de momento conductual. La primera es que el momento conductual está directamente relacionado con la tasa de reforzamiento. Una tasa más alta de reforzamiento produce una conducta que tiene un mayor momento y que es menos susceptible a la interrupción; otro hallazgo es que el momento conductual no está relacionado con la tasa de respuesta. Dos conductas que se dan a tasas semejantes no es preciso que tengan grados similares de momento conductual. Nevin ha destacado la tasa de reforzamiento en lugar de la tasa de respuesta como el determinante fundamental del momento conductual. Esta conclusión está confirmada por otros estudios que demuestran que los

programas que proporcionan tasas similares de reforzamiento pero tasa diferentes de respuesta tienen similares momentos o resistencias al cambio.

La primacía de la tasa de reforzamiento sobre la tasa de respuesta como determinante del momento conductual ha llevado a Nevin y Grace (2000) a atribuir el momento conductual principalmente al condicionamiento pavloviano o de asociaciones E-C, aunque la forma exacta en que estas asociaciones promueven el momento conductual no se han averiguado todavía.

El reto principal a la proposición básica de que el momento conductual está directamente relacionado con la tasa de reforzamiento es el efecto ERPE, este es un caso en que la resistencia a la extinción es mayor después de una baja tasa o probabilidad de reforzamiento. Nevin y Grace han sugerido que el ERPE puede explicarse asumiendo que la extinción es menos discriminable tras el reforzamiento intermitente que tras el continuo

Comentarios finales

Los estudios sobre extinción ilustran la naturaleza duradera de ciertos temas en la teoría de la conducta. Los primeros estudios sobre la extinción se centraron en los efectos del reforzamiento parcial enla extinción y otros efectos “paradójicos” de la recompensa, y se llevaron a cabo dentro de la tradición hulliana que daba preeminencia al aprendizaje E-R.

Los mecanismos E-R cayeron en desuso con la creciente evidencia de que el condicionamiento pavloviano y el intrumental involucraban asociaciones E-C y R-C, que estaban controladas o moduladas por claves contextuales. Estas evidencias fueron parte de la “revolución cognitiva” que se introdujo en la psicología en el último cuarto de siglo XX.

Ésta proporcionó una mejor compresión de la recuperación espontánea y llevó al descubrimiento de nuevos fenómenos como la renovación y el restablecimiento. Sin embargo, estos fenómenos representas los fallos de la extinción más que la exticnión en sí misma. Como se ha descrito, la compresión de la extinción en sí misma ha requerido la vuelta a los conceptos E-R, esta vez en forma de asociaciones E-R inhibitorias. Los investigadores sigun interesados en qué es lo que hace que conducta sea resistente al cambio. Esta resistencia o momento conductual plantea especiales desafíos para la terapia de conducta.

Date post:	10-Aug-2015
Category:	Documents
Upload:	veronica-gonzalez-ocana
View:	878 times
Download:	7 times

Aprendizaje de un solo estímulo Habituación y sensibilización.pdf

Documents