jueves, 8 de agosto de 2013

Reforzamiento y aprendizaje

REFORZAMIENTO Y APRENDIZAJE

ALGUNOS CONCEPTOS Y PRINCIPIOS BÁSICOS
Idea principal: El aprendizaje proporciona un conocimiento de las contingencias de reforzamiento de las acciones, y los organismos por lo general seleccionan la acción más benéfica dado su conocimiento.
La idea de que los organismos buscan lo bueno y evitan lo malo es tan vieja como la antigüedad (y los argumentos filosóficos acerca de lo “bueno” y lo “malo” son igual de vetustos). No obstante, en psicología, lo evidente es que las contingencias de reforzamiento asociadas con un comportamiento tienen una relación directa con el hecho de que el organismo sí ejecute dicho comportamiento.

Una pregunta antigua es: ¿Cuál es la relación entre aprendizaje y reforzamiento? Thorndike propuso una relación particularmente íntima en su ley del efecto: el aprendizaje sólo ocurr8iría si había reforzamiento, idea que fue reforzada por muchos conductistas y fue lo que dividió a Hull y Tolman. Con el tiempo ha sido claro en numerosos casos, que el aprendizaje tiene lugar sin ningún reforzamiento, lo cual ha dejado sin sustento la ley del efecto. Sin embargo, todavía continúa la discusión acerca de la relación del reforzamiento con el aprendizaje. La respuesta fue delineada de un modo general en otro inciso anterior. En este inciso, se vislumbrará la forma en que los reforzadores proporcionan esas metas.
La tesis básica de este inciso consiste en que los organismos tienden a comportarse en forma racional. Usan las contingencias aprendidas en el ambiente y seleccionan el comportamiento que posibilita el mejor estado de cosas para ellos.

Por lo regular los organismos tienden a hacer lo correcto; no obstante, en este inciso se revisan algunos de sus comportamientos que están lejos de ser óptimos. Esta situación puede verse como un vaso medio lleno o medio vacío. Desde el punto de vista histórico, la psicología ha optado por una perspectiva medio vacía y ha destacado las desviaciones de lo óptimo. Sin embargo, en años recientes, los psicólogos han sido sorprendidos por el comportamiento casi óptimo de organismos simples. Con frecuencia, casos no óptimos pueden entenderse como tendencias conductuales, por lo general adaptativas, que erraron el camino hacia situaciones por las cuales no evolucionaron.

CONTROL AVERSIVO DEL COMPORTAMIENTO

Comportamiento racional
Idea principal: El comportamiento racional implica la combinación de las probabilidades de los resultados de las acciones con sus valores y la selección de la acción con el valor más alto esperado.

Efectos del reforzamiento sobre el aprendizaje
Idea principal: Los organismos ponen más atención al material asociado con una recompensa mayor, pero si se controla la atención, no hay efecto de la cantidad de recompensa en el aprendizaje.


Recompensa y castigo

Idea principal: Los organismos se comportan en los experimentos de condicionamiento instrumental de tal forma que obtienen estímulos deseables y evitan estímulos aversivos.

Control aversivo del comportamiento
Idea principal: El castigo es efectivo cuando se administra de inmediato, con severidad y en forma consistente y en la medida en que se ofrecen al organismo comportamientos alternativos.

Reforzamiento negativo
Idea principal: Pueden mantenerse patrones estables de comportamiento si éstos evitan consecuencias aversivas.

LA NATURALEZA DEL REFORZAMIENTO

Teoría de la reducción de la pulsión
Idea principal: la teoría de la reducción de las pulsiones propuso que el reforzamiento consistía en la reducción de varias pulsiones biológicas.

Teoría del reforzamiento de Premack
Idea principal: Premack propuso que hacer contingente un comportamiento A con un comportamiento B reforzaría B si A era más valioso y castigaría B si A era menos valioso.

Bases nerviosas del reforzamiento
Idea principal: el hipotálamo parece estar íntimamente asociado con el reforzamiento, y los animales encuentran placentera tanto la estimulación eléctrica como la farmacológica del hipotálamo.

Teoría del equilibrio y puntos preferidos de satisfacción
Idea principal: Los organismos eligen su comportamiento de modo que los acerque lo más posible a algún punto preferido de satisfacción general de los comportamientos y experiencias.


ESTUDIOS DE COMPORTAMIENTO DE ELECCIÓN
Según la concepción actual del reforzamiento, un organismo equilibra necesidades o metas competidoras a fin de lograr la combinación más cercana a su puto preferido de satisfacción. La investigación sobre el reforzamiento busca determinar la forma en que los organismos hacen elecciones, dada su experiencia con las restricciones de su ambiente. Investigaciones recientes se han centrado en el comportamiento de elección de los animales. Antes de mencionar estas investigaciones, es importante revisar algunos de los efectos básicos de diferentes programas de reforzamiento, en vista de que muchos de estos estudios recientes ofrecen a los animales elecciones entre programas de reforzamiento. Resulta que la comprensión del comportamiento, aun bajo un solo programa, también requiere concebir al organismo como elector entre comportamientos alternativos.

Programas de reforzamiento
Idea principal: Los organismos ajustan su patrón de respuestas de manera adaptativa dados varios programas de reforzamiento.

Programas de intervalo variable y la ley de igualación
Idea principal: Frente a dos programas de intervalo variable, un organismo divide sus respuestas entre ellos en proporción a sus dos tasas de reforzamiento.

Maximización momentánea
Idea principal: Los organismos eligen la alternativa que en ese momento ofrece la tasa más alta de recompensa.

Igualación de probabilidad
Idea principal: Cuando son enfrentados con dos alternativas, sólo una es exitosa en cualquier ensayo, los organismos eligen la alternativa más exitosa con una probabilidad que iguala a su tasa de éxito.

Teoría del forrajeo óptimo
Idea principal: Los animales escogen entre parcelas para forrajear como una función del tiempo de viaje a las parcelas y los estados de agotamiento actuales de estas parcelas.

Efectos de la demora del reforzamiento

Idea principal: Los organismos devalúan el futuro de tal manera que preferirán una recompensa pequeña de inmediato a una recompensa grande con una demora.

MECANISMOS DE ELECCIÓN
Idea principal: Los animales parecen tomar decisiones por reglas empíricas simples que se aproximan al punto óptimo global.

Hasta ahora se ha descrito a los animales como bastante racionales en su toma de decisiones. Se esfuerzan por lograr el intercambio óptimo entre sus necesidades competidoras, exhibiendo tasas de respuesta en diferentes programas que se acercan lo más posible a su punto preferido de satisfacción.
Aquí se plantea la cuestión de la forma en que los animales logran un grado casi óptimo de su comportamiento de elección. Es poco probable que estén efectuando algo como calcular en forma explícita la prescripción para la elección racional establecida en el primer inciso de este capítulo. También es poco plausible que siempre acierten en las elecciones que hacen. Más bien, los animales pueden verse como gobernados por reglas empíricas, las cuales funcionan relativamente bien en la mayor parte de las situaciones.

Toma de decisiones humana  

Idea principal: Los humanos a menudo usan reglas empíricas para aproximarse a als mejores decisiones, en particular cuando están bajo presión de tiempo.

Pueden obtenerse conocimientos sobre la toma de decisiones de los animales al observar la toma de decisiones de los humanos. Se supone que nosotros somos más deliberativos y racionales que otras criaturas, y por consiguiente debemos definir el punto máximo de racionalidad. Sin embargo, nosotros también tendemos a tomar decisiones usando estas reglas empíricas a corto plazo. Muchas investigaciones han implicado hacer elecciones entre conjuntos de alternativas.

Se ha observado a las personas hacer muchas cosas al tomar decisiones. Las siguientes son dos de las estrategias atípicas que se han observado en sujetos humanos:

- Eliminación por aspectos (Tversky, 1972). El problema con la eliminación por aspectos es que, al enfocarse en a dimensión inicial, es posible eliminar una opción que podría ser tan buena en otras dimensiones como para ser la mejor en general.

- Satisfacción (Simon, 1955). Considera las alternativas una por una en el orden en que ocurren. Establece un límite para el valor de una alternativa de cada dimensión. Rechaza una alternativa si cualquiera de sus valores es peor que el límite. Acepta la primera alternativa cuyos valores en todas las dimensiones están por encima del umbral.

Aunque estas estrategias no siempre dan los mejores resultados, a menudo producen el mejor o uno cercano al mejor con resultados rápidos debido a que permiten a quien toma la decisión enfocarse en un subconjunto de la información. Payne, Bettman y Hohnson (1988) mostraron que bajo presión de tiempo, la estrategia de eliminación por aspectos produce con más frecuencia la decisión correcta, mientras que la estrategia de eliminación por aspectos puede haberla identificado ya. También mostraron que los sujetos son sensibles a la presión de tiempo y tienden a cambiar de una estrategia exhaustiva a una estrategia de eliminación por aspectos cuando se incrementa la presión de tiempo.
Por tanto, los humanos como los animales inferiores, usan reglas empíricas para tomar decisiones, y estas no siempre producen la elección óptima.

1 comentario: