La columna de Ris

El Refuerzo , aquello de lo que habla todo el mundo, pero muy pocos saben de lo que están hablando…

Acido como nadie , pero cargado de fundamento como pocos , Ricardo de Pascual Verdú enriquece periódicamente este blog destinado a psicólogos, entrenadores de animales, estudiantes de psicología , adiestradores en formacion o aquellas personas interesadas en la conducta animal y humana que no estén contaminados por el “movimiento Walt Disney” y que busquen la verdad, la única verdad , que subyace a todo aprendizaje.

Ricardo de Pascual Verdú es licenciado en Psicología por la Universidad Autónoma de Madrid, Máster en Psicología de la Salud por la Universidad Autónoma de Madrid y Máster en Terapia de Conducta por el Instituto Terapéutico de Madrid, además de profesor honorario de la Universidad Autónoma de Madrid por su participación como tutor profesional en el Prácticum de Terapia Asistida en colaboración con la Fundación Bocalán. También es coordinador de la revista Clínica y Salud, publicación empírica del Colegio Oficial de Psicólogos de Madrid.
Tiene experiencia clínica tratando gran variedad de casos, desde problemas de depresión o ansiedad hasta problemas de conducta alimentaria y de pareja, en poblaciones adultas e infantojuveniles.
En la actualidad compagina su labor clínica con la investigación de procesos psicológicos en la Universidad Autónoma de Madrid.

El refuerzo , condicion “sine qua non” para que se instaure una conducta, ha sido vilipendiado  por ignorancia  ; las cosas se pueden hacer bien o mal ,pero la unica realidad es que el refuerzo es la base sobre la que sustenta cualquier conducta .

” El cosmos es como es y no como a uno le gustaria que fuera” Ricardo nos baja a la tierra y da un golpe de realidad ,como siempre, en este nuevo articulo

La mano que da el refuerzo …

Ricardo de Pascual Verdú

A menudo, cuando se habla del entrenamiento basado en refuerzos, uno oye ,o lee, en boca tanto de legos en el tema como, por desgracia, de supuestos expertos cosas como:

-Pero si le doy comida a mi perro, lo hará por la comida y no porque esté bien.

-A mí es que eso de darle premios por hacer las cosas me parece chantaje.

-Yo quiero que mi perro quiera hacerlo, no obligarle con comida.

-Eso es indigno, es obligar a los perros a hacer trucos por comida.

Hoy voy a dedicar a tratar de eliminar o modificar esas ideas tan equivocadas acerca de lo que supone un refuerzo y la conducta guiada por reforzadores. Y, por qué no, a empezar a definir un problema que existe en el entrenamiento animal –pero también en la psicología en general- y que, a falta de un nombre mejor, voy a llamar “buenismo”. Pero lo primero es lo primero, y lo primero siempre son las definiciones. ¿Qué es un refuerzo? Me encanta hacer esta pregunta cuando doy clase en algún sitio porque, pese a la tan cacareada simplicidad de la modificación de conducta, raro es que me encuentre con una sola persona en una sala repleta que sea capaz de darme la respuesta correcta. Lo que la gente suele decir va en la línea de: -Un premio. -Algo agradable que se da al animal cuando hace lo que queremos. -Una señal que le dice al animal que lo ha hecho bien. Y eso es erróneo en todos los casos:-Un refuerzo no es un premio salvo en su sentido más banal, porque un premio es algo que se da como reconocimiento a un logro concreto; si estás reforzando a tu animal como reconocimiento a un logro, te estás equivocando a un nivel conceptual básico. -Un refuerzo no tiene por qué ser algo agradable. Su, digamos, signo o carácter de apetitivo o aversivo no es lo que define al refuerzo. Algunos tipos de refuerzo, como casi todos sabréis, no solo no consisten en dar algo agradable, sino que consisten en retirar algo (sea o no agradable ese algo). -Un refuerzo no es una “señal” de nada. Esa palabra se aplica mejor a los estímulos discriminativos, de los que ya hablaremos. Y además, “bien” o “mal” no son términos que convenga usar aquí: el animal ha realizado el ejercicio de la forma deseada o no, eso es todo. Y entonces, ¿qué es un refuerzo? Fácil: un evento que, si ocurre de manera contingente a una conducta (esto es, durante o inmediatamente después), aumenta la probabilidad de ocurrencia, intensidad o duración de esta conducta (Skinner, 1953). Como veis, nada que ver con que sea “agradable” o con el concepto de “premio”. ¿Por qué, entonces, tenemos tantos problemas a la hora de admitir que el refuerzo sea no sólo recomendable, sino imprescindible a la hora de entrenar a un perro? Es una cuestión cultural el hablar de que es mejor que la gente (o los perros, los gatos, los gobiernos o lo que sea) hagan las cosas “porque están bien”, y no por conseguir algo a cambio. Esto puede parecer una postura moralmente muy loable, pero, como suele suceder con las posturas que son sólo morales, deja de lado un hecho significativo y muy importante: el de cómo aprendemos qué “está bien” y qué “está mal”. Y esto, amigos, lo aprendemos por condicionamiento (ver por ejemplo Bandura y McDonald, 1963). Consideramos que está bien aquello por lo que nos han reforzado consistentemente, y que está mal aquello que ha aparejado la ocurrencia de estímulos aversivos (que no es lo mismo que castigos, ojo). Desde el perro que no muerde las patas de la mesa hasta el filósofo que divaga sobre la naturaleza del bien y del mal, el control de la propia conducta está regido por la experiencia pasada que condiciona como apetitivo o aversivo el propio hecho de llevar a cabo una conducta. Por ejemplo: si quieres que a tu hijo “le salga” estudiar, refuérzale por hacerlo. No por aprobar, no por decir que va a estudiar: por estudiar. Si lo haces de la manera adecuada, la propia conducta será intrínsecamente reforzante para él. Si quieres que tu perro venga cuando le llamas siempre, y contento, refuérzale por hacerlo (sea con caricias, palabras amistosas o comida, lo que su historia de aprendizaje haya convertido en reforzante). La mayoría de nosotros no damos comida a nuestro perro cuando viene (por ejemplo), y nuestro perro viene sonriendo y moviendo el rabo. Pero pensar que esta conducta existe independientemente de un reforzador es, en el mejor de los casos, ignorante. Toda conducta que se mantiene, se mantiene porque está siendo reforzada de alguna manera (por ejemplo, Martin y Pear, 2008). Pero claro, a los críticos de la modificación de conducta les resulta sencillo caricaturizar los procedimientos de manera que se pinta a los entrenadores como seres robóticos y crueles que buscan afinar hasta extremos ridículos una conducta, nunca preocupándose por el estado del animal, nunca dándole cariño, sino solo comida. Los malvados conductistas, esclavizando a los perros a base de comida. Esto, evidentemente, es un error, por un sencillo motivo: todos los entrenadores de perros, todos los (otros) perros, tu madre, tu padre, tu pareja, tus amigos, el propio entorno… Todos estamos ejerciendo control los unos sobre los otros por medio de las consecuencias que aplicamos a la conducta de los demás (sea este control intencionado o consciente o no, que es lo de menos; véase Skinner, 1986 para una exposición particularmente elocuente de esto); la diferencia entre un entrenador formado en modificación de conducta (que no es lo mismo que un entrenador conductista) y otro que no lo está es que el primero sabe lo que está haciendo y cómo maximizar el efecto de su actuación. Esto significa que el perro se encontrará con menos incertidumbre porque siempre puede anticipar las consecuencias de sus actos –por así decirlo- y, por supuesto, aprenderá más rápido y sin sufrimiento (Hiby, Rooney y Bradshaw, 2004; Haverbeke, Laporte, Depiereux, Giffroy y Diederich, 2007). Esa es la meta. Cuando un entrenador no sabe “traducir” a lenguaje funcional lo que está haciendo, es como si estuviera jugando a los dardos sin mirar a la diana: seguro que a veces da, incluso puede tener una suerte excelente y conocer de memoria el movimiento de brazo que tiene que hacer, la distancia que hay entre él y la diana… Pero fallará más que uno que mire, aunque tenga más experiencia. Puede conseguir la misma puntuación, pero desde luego que va a dejar la pared de alrededor de la diana llena de agujeros.  ¿Habéis visto trabajar a los perros entrenados con lo que algunos entrenadores americanos, en pleno proceso aparente de contrarreforma, llaman “no-nonsense training”? Son animales asustados, temerosos de equivocarse e incluso de actuar, no sea que se lleven un palo. Comparadlo con los perros entrenados por cualquier organización que use los principios de la modificación de conducta, especialmente el énfasis en el refuerzo por encima de la aplicación de estimulación aversiva: el perro está jugando. Para él es divertido; no hay carga de angustia, no hay incertidumbre, no hay sufrimiento. ¿Esto os parece indigno? Es un pobre amante de los animales el que, escudándose en su propio sentido antropocéntrico de la dignidad, pone sus propias fantasías de moralidad, sus escrúpulos originados en la ignorancia, por encima del bienestar del animal. Y me resulta tremendamente irónico y frustrante cuando gente que se hace llamar amante de los animales favorece entrenamientos “tradicionales” que suponen un sufrimiento tal vez no continuo, pero sin duda innecesario, por no querer “comprar” a su perro. Y me pregunto si, cuando besan a su madre o sonríen a sus amigos, lo hacen con la intención de comprarles. Si se sienten ofendidos cuando su pareja se ríe de un chiste que han hecho. Si, en fin, tienen la más ligera idea de cómo funciona su propia conducta. Y me temo que no.

Una nota sobre las referencias: En la medida en que el tema lo requiera, intentaré ofrecer algunas referencias para que el lector interesado pueda “tirar del hilo”; mi interés no es que las referencias sean exhaustivas ni mucho menos, sino un buen punto de partida. Además, algunos temas –como el del refuerzo social citado hoy aquí- son demasiado amplios como para dar nada que no sea una pequeña pincelada. De nuevo: el lector interesado puede (y debe) buscar las fuentes relevantes, aunque pueda usar las que yo proporciono como base. Es por esto que ocasionalmente las referencias serán a trabajos clásicos que se remontan a hace unas décadas, con el objetivo de que uno pueda leer la fuente inicial, a menudo ignorada por los propios críticos.
Referencias:

  • Bandura, A. y McDonald, F. J. (1963). Influence of social reinforcement and the behavior of models in shaping children’s moral judgment. The Journal of Abnormal and Social Psychology, Vol 67(3), 274-281.
  • Haverbeke, A., Laporte, B., Depiereux, E., Giffroy, J.M. y Diederich, C. (2008) Training methods of military dog handlers and their effects on the team’s performances. Applied Animal Behaviour Science, Vol 113, 110-122.
  • Hiby, E.F.; Rooney, N.J. y Bradshaw, J.W.S. (2004). Dog training methods: their use, effectiveness and interaction with behaviour and welfare. Animal welfare, 13, 63-69.
  • Martin, G. y Pear, J. (2008). Modificación de conducta: qué es y cómo aplicarla. Madrid. Pearson Educación.
  • Skinner, B.F. (1986). Más allá de la libertad y la dignidad. Barcelona. Ediciones Martínez Roca.
  • Skinner, B.F. (1953). Science and human behavior. New York, The Free Press.