Condicionamiento operante

La versión actual de la página aún no ha sido revisada por colaboradores experimentados y puede diferir significativamente de la versión revisada el 25 de mayo de 2021; las comprobaciones requieren 2 ediciones .

El condicionamiento operante  es la influencia de las consecuencias de la conducta sobre la conducta misma, las consecuencias se entienden como cambios en el entorno (cambio en el estímulo) que ocurren inmediatamente después de la conducta y afectan la frecuencia de ocurrencia de esta conducta en el futuro [1] . Este proceso es similar a la selección natural darwiniana en que el comportamiento se selecciona por sus consecuencias durante la vida de un individuo, al igual que las especies se seleccionan por sus consecuencias de supervivencia durante la evolución. El concepto de condicionamiento operante fue introducido por BF Skinner .

El aprendizaje operante se basa en la conducta operante  : conducta que afecta el entorno, que está controlada por las consecuencias inmediatas de esta conducta, a diferencia de la conducta de respuesta (respondedor) , que está controlada por un estímulo anterior [2] . B. F. Skinner formuló el concepto de condicionamiento operante después de muchos años de experimentos con animales realizados por él en la Universidad de Harvard.

condicionamiento operantedesvaneciendo
Refuerzo
Refuerza el comportamiento
El castigo
debilita el comportamiento.
Refuerzo positivo
Estímulo agradable
en respuesta a la conducta correcta
reforzamiento negativoCastigo positivo
Estímulo desagradable
en respuesta a una mala conducta
Castigo negativo
Eliminación de un estímulo placentero
en respuesta a una mala conducta
Eliminación
Eliminación de un estímulo desagradable
en respuesta a un comportamiento correcto
Evitación activa
de un estímulo desagradable.

El conjunto de acciones determinadas por las consecuencias (influencias posteriores) se denomina operante . Las operantes se definen funcionalmente, es decir, según los cambios que la conducta de una persona provoca en su entorno inmediato. Las conexiones entre la conducta operante y los eventos que la rodean se denominan contingencias [3] . El esquema más común para el análisis operante es una contingencia de tres partes , que consiste en una conexión entre un evento anterior, o ambiente , en el que ocurrió el comportamiento, el comportamiento y las consecuencias [2] .

El término condición se refiere a combinaciones que son probables pero no inevitables. En la investigación del comportamiento, se debe probar el efecto de una condición sobre el comportamiento.

Los postulados teóricos del conductismo operante se aplican en la práctica en algunas variantes del aprendizaje programado , la terapia conductual [4] , el análisis conductual aplicado [2] .

Historia

El condicionamiento operante a veces se denomina aprendizaje instrumental y fue estudiado cuidadosamente por primera vez por Edward Thorndike (1874-1949): examinó el comportamiento de los gatos que tenían que salir de una "caja de problemas" [5] . Un gato podía salir de la caja con una simple acción, como tirar de una cuerda o empujar un poste, pero la primera vez, le tomó mucho tiempo salir. En experimentos repetidos, las reacciones ineficaces ocurrieron con menos frecuencia y las exitosas con mayor frecuencia, por lo que los gatos salieron de la caja cada vez más rápido [5] . Thorndike resumió estos datos en su Ley del efecto, que establece que el comportamiento que produce placer tiende a repetirse, y es menos probable que se repita el comportamiento que conduce a consecuencias desagradables. En resumen, algunas consecuencias refuerzan el comportamiento y otras lo debilitan. Al graficar el tiempo que le tomó a un gato salir de la caja versus el número de intentos, Thorndike creó las primeras curvas de aprendizaje de animales conocidas con dicho procedimiento. [6] Este proceso ahora se llama condicionamiento operante.

El padre del término condicionamiento operante es B. F. Skinner (1904-1990). Su libro de 1938 El comportamiento de los organismos: un análisis experimental inició el estudio del condicionamiento operante y su aplicación al comportamiento humano y animal [7] . Siguiendo las ideas de Ernst Mach , Skinner rechazó confiar en estados mentales no observables como la satisfacción (como lo hizo Thorndike), construyendo su análisis sobre el comportamiento observable y sus consecuencias, que también pueden observarse [8] .

Conceptos y procedimientos

Cambio Operante de Comportamiento: Refuerzo y Castigo.

El refuerzo y el castigo  son las dos herramientas mediante las cuales se modifica el condicionamiento operante. En total hay 5 tipos de sus consecuencias:

  1. Refuerzo positivo  : inmediatamente después de una respuesta conductual, se presenta un estímulo que conduce a un aumento en la frecuencia de aparición de esta clase de respuestas en el futuro [1] .
  2. Refuerzo negativo (evitación)  : inmediatamente después de una respuesta conductual, se elimina un cierto estímulo aversivo del entorno, lo que conduce a un aumento en la frecuencia de aparición de esta clase de reacciones en el futuro [1] . En los experimentos de Skinner, este estímulo era un sonido fuerte dentro de una caja . Cuando la rata presionó la palanca, el sonido se detuvo, por lo que el comportamiento de la rata recibió un refuerzo negativo.
  3. Castigo positivo  : inmediatamente después de la respuesta conductual, se presenta un estímulo aversivo, y esto conduce al hecho de que la frecuencia de aparición del comportamiento en el futuro disminuye [1] .
  4. Castigo negativo  : después de una respuesta de comportamiento, el estímulo deseado se elimina del entorno y esto conduce a una disminución en la ocurrencia de este comportamiento en el futuro [1] .
  5. La extinción  es el debilitamiento de una respuesta conductual al nivel observado antes del inicio del reforzamiento, o su completa desaparición como resultado de la terminación de su reforzamiento. El análisis de comportamiento aplicado también utiliza el procedimiento de extinción, es decir, el procedimiento para generar extinción cancelando el refuerzo. En el proceso de aplicación de este procedimiento, suele ocurrir un desvanecimiento de la exacerbación, es decir, un aumento en la frecuencia de las reacciones inmediatamente después de que se cancela el refuerzo [1] . Ejemplo: primero, la rata obtiene comida muchas veces después de presionar la palanca, luego la comida deja de salir después de presionar la palanca; con el tiempo, la rata comienza a presionar la palanca cada vez menos.

Véase también

Notas

  1. ↑ 1 2 3 4 5 6 John O. Cooper, Timothy E. Heron, William L. Heward. Analisis de comportamiento aplicado. Por. del inglés - Moscú: Práctica, 2016. - S. 767. - 864 p. - 1200 copias.  - ISBN (inglés) 978-0-13-142113-4. - ISBN (ruso) 978-5-89816-157-6.
  2. 1 2 3 Vargas J. Análisis de actividades estudiantiles. Metodología para la mejora del rendimiento escolar. — M.: Operante, 2015.
  3. Vargas E. A. “Comportamiento verbal” por B. F. Skinner: Introducción // Boletín de la Universidad Estatal de Novosibirsk. Serie: Psicología. - 2010. - V. 4 , N º 2 . — págs. 56–78 .
  4. Skinner Burres Frederick / Zinchenko V.P., Meshcheryakov B.G.  Gran diccionario psicológico. — M.: OLMA-PRESS, 2003.
  5. ↑ 1 2 Thorndike, EL "Inteligencia animal: un estudio experimental de los procesos asociativos en animales" // Suplemento de la monografía de Psychological Review. - 1901. - Nº 2 . - S. 1-109 .
  6. Miltenberger, R.G. Modificación del comportamiento: principios y procedimientos. - Thomson/Wadsworth, 2008. - Pág. 9.
  7. Skinner, BF El comportamiento de los organismos: un análisis experimental" . - Nueva York: Appleton-Century-Crofts, 1938.
  8. Skinner, BF "¿Son necesarias las teorías del aprendizaje?"  // Revisión psicológica. - 1950. - T. 4 , N º 57 . — S. 193–216 . -doi : 10.1037/ h0054367 . —PMID 15440996 . Archivado desde el original el 28 de febrero de 2021.