Es un procedimiento donde se busca aumentar la probabilidad
de una respuesta al ser seguida por un reforzador (positivo o negativo).
Es una forma de aprendizaje mediante el cual un sujeto tiene
más probabilidades de repetir las formas de conducta que conllevan
consecuencias positivas y, por el contrario, menos probabilidades de repetir
las que conllevan consecuencias negativas. El condicionamiento operante es un
tipo de aprendizaje asociativo que tiene que ver con el desarrollo de nuevas
conductas en función de sus consecuencias, y no con la asociación entre
estímulos y conductas como ocurre en el condicionamiento clásico.
El término
“condicionamiento instrumental” fue introducido por Edward Thorndike y sugiere
que la conducta sirve de "instrumento" para conseguir un fin y se da
por ensayo y error, a diferencia del Condicionamiento Operante planteado por
Skinner el cual establece que aquellas respuestas que se vean reforzadas tienen
tendencia a repetirse y aquellas que reciban un castigo tendrán menos
probabilidad de repetirse.
El Condicionamiento Operante o instrumental es distinto al
condicionamiento clásico o pauloviano ya que éste último consiste en aumentar
la probabilidad de que un determinado estímulo provoque una respuesta al
emparejar ese estímulo con uno que ya provoca esa respuesta (reforzadores
primarios: comida, agua, etc.).
La investigación sobre el condicionamiento operante ha dado
lugar a una tecnología muy minuciosa para la enseñanza, denominada modificación
de conducta.
Primeras Investigaciones:
El psicólogo Edward Thorndike (1874-1949) fue uno de los
pioneros en el estudio del condicionamiento instrumental. Para ello, ideó sus
denominadas “cajas de solución de problemas”, que eran jaulas de las que los
gatos (que eran los animales con los que trabajaba) podían escapar mediante
acciones simples como manipular un cordón, presionar una palanca o pisar una
plataforma. Como incentivo para resolver el problema, el gato podía ver y oler
que fuera de la caja había comida, pero no podía alcanzarla. Al principio, el
gato comenzaba a hacer movimientos azarosos, hasta que casualmente resolvía el
problema, por ejemplo tirando de la polea que abría la jaula. Sin embargo, cada
vez que Thorndike metía al gato en la jaula, tardaba menos en salir. Esto se
debía a que se estaba produciendo un condicionamiento operante: la conducta de
tirar de la polea estaba siendo reforzada por su consecuencia (la apertura de
la caja y la obtención de la comida). Esta conducta, al ser reforzada, se
convertía en la conducta más probable en un futuro cuando las circunstancias
eran similares.
A partir de estos experimentos, Thorndike estableció un
principio que denominó Ley del efecto: «Cualquier conducta que en una situación
produce un efecto satisfactorio, se hará más probable en el futuro». Si la
respuesta va seguida de una consecuencia satisfactoria, la asociación entre el
estímulo y la respuesta se fortalece; si a la respuesta le sigue una
consecuencia desagradable, la asociación se debilita. En otras palabras,
Thorndike defendía que todos los animales, incluyendo al ser humano, resuelven
los problemas mediante el aprendizaje por ensayo y error.
También los estudios de Pávlov sobre condicionamiento
clásico tuvieron una gran influencia en el estudio del condicionamiento
operante. Si bien se trata de procesos de aprendizaje diferentes, el
condicionamiento clásico y el operante comparten varios de sus principios, como
la adquisición, la extinción, la discriminación o la generalización.
El autor más importante en el estudio del condicionamiento
operante es B.F. Skinner. A finales de la década de 1920 empezó a trabajar con
palomas. Para ello, utilizaba un ambiente libre de distracciones denominado
caja de Skinner, en el que se podían manipular las condiciones en las que se
proporcionaba alimento a los animales. Sus exhaustivos estudios utilizando este
artefacto permitieron a Skinner descubrir muchos de los factores que influyen
en el condicionamiento operante.
Procedimientos de condicionamiento
Existen cuatro procedimientos o tipos de condicionamiento instrumental:
1.- Refuerzo positivo o condicionamiento de recompensa: Un refuerzo positivo es un objeto, evento o conducta cuya presencia incrementa la frecuencia de la respuesta por parte del sujeto. Se trata del mecanismo más efectivo para hacer que tanto animales como humanos aprendan. Se denomina “refuerzo” porque aumenta la frecuencia de la conducta, y “positivo” porque el refuerzo está presente. Refuerzos positivos típicos son las alabanzas, los regalos o las aportaciones monetarias. Sin embargo, hay que tener en cuenta que en ocasiones algo que ordinariamente se considera desagradable puede funcionar como refuerzo positivo, ya que de hecho incrementa la probabilidad de la respuesta (como cuando se grita a un niño ante una rabieta, y este se siente reforzado porque así llama la atención).
2.- Refuerzo negativo: Un refuerzo negativo es un objeto, evento o conducta cuya retirada incrementa la frecuencia de la respuesta por parte del sujeto. Al igual que el anterior, se denomina “refuerzo” porque aumenta la frecuencia de la conducta, pero “negativo” porque la respuesta se incrementa cuando el refuerzo desaparece. En el refuerzo negativo se pueden distinguir dos procedimientos:
- Condicionamiento de escape: En este caso, la frecuencia de una respuesta aumenta porque interrumpe un estímulo aversivo, es decir, un suceso que está ocurriendo y que el sujeto considera desagradable. Un ejemplo típico sería el de un animal que aprieta una palanca porque así elimina una corriente eléctrica o el de un padre que le compra una chuchería a su hijo para dejar de oírle llorar.
- Condicionamiento de evitación: En este caso, la frecuencia de una respuesta aumenta porque pospone o evita un estímulo aversivo futuro. Un ejemplo típico sería el de un alumno que estudia para evitar una mala nota.
3.- Entrenamiento de omisión: Se produce cuando la respuesta operante impide la presentación de un refuerzo positivo o de un hecho agradable; es decir, consiste en retirar el estímulo positivo de una conducta para así provocar la extinción de la respuesta. Un ejemplo importante es el de “tiempo fuera”, en el que se retira la atención de un niño aislándolo durante un cierto período de tiempo.
4.- Castigo: El castigo provoca la disminución de una conducta porque el suceso que la sigue es un estímulo aversivo. Un ejemplo típico es castigar a una rata con una pequeña corriente eléctrica cuando pulsa una palanca. Aunque el castigo puede ser en ocasiones muy eficaz para hacer que desaparezca una conducta, se recomienda utilizarlo lo menos posible, ya que tiene muchos efectos adversos o no deseados. En muchas ocasiones la conducta solo desaparece temporalmente o únicamente en los contextos en los que es probable el castigo. Además, genera gran cantidad de consecuencias secundarias (como frustración, agresividad, etc.) que pueden hacer que se detenga el proceso de aprendizaje. Por eso, en la aplicación de castigos es importante seguir ciertas reglas, como reforzar al mismo tiempo conductas alternativas a la castigada, aplicarlo inmediatamente después de la conducta que se quiere suprimir, o ser constante (ya que castigar una conducta solo a veces produce un efecto contrario al que se desea).
Fases del condicionamiento operante:
- Adquisición: La adquisición de la respuesta se refiere a la fase del aprendizaje en que la respuesta es seguida por reforzadores. Durante la adquisición la respuesta se vuelve más fuerte o más frecuente, debido a su relación con la consecuencia reforzante.
- Generalización: Las respuestas fortalecidas mediante procedimientos operantes en un conjunto de circunstancias tienden a extenderse o a generalizarse en situaciones similares, al igual que ocurre en el condicionamiento clásico. Cuando más parecidos sean los contextos, más probable es la generalización.
- Discriminación: Los individuos desarrollan también discriminaciones al reforzarse las respuestas en una situación, pero no en otra.
- Extinción: Cuando se retira el reforzamiento para alguna respuesta particular, dicha conducta disminuye su frecuencia gradualmente hasta que solo ocurre con la misma frecuencia con que ocurría antes del reforzamiento. Sin embargo, es importante advertir que en muchas ocasiones, después de que se retiren los reforzadores, se advierte inicialmente un aumento de la cantidad de respuesta y de la frustración antes de que empiece la disminución.
- Recuperación espontánea: Al igual que en el condicionamiento clásico, las respuestas que se han extinguido vuelven a aparecer algunas veces, es decir, se da una recuperación espontánea después de un descanso
Distinción entre condicionamiento clásico y operante
- En el condicionamiento clásico la asociación se da entre un estímulo condicionado y uno incondicionado. En el condicionamiento instrumental, la asociación se da entre las respuestas y las consecuencias que se derivan de ellas.
- En el condicionamiento clásico, el estímulo incondicionado no depende de la respuesta del sujeto, mientras que en el operante las consecuencias dependen de la respuesta del sujeto.
- En el condicionamiento clásico, la respuesta del sujeto es involuntaria, mientras que en el instrumental es generalmente voluntaria.
No hay comentarios:
Publicar un comentario