Konditionierte Bestärker und das Dopaminsystem
Der Clicker wird sehr
eindrücklich als "Marker" oder als "Brücke" bezeichnet. Damit
wird klar, was man mit ihm operativ betonen möchte. Es ist
zum einen genau
der Moment desjenigen Verhaltens, das unseren Vorstellungen
entgegen
kommt. (Das genau ist ja der Inhalt des Formens, shaping, von
Verhalten.) Zum anderen überbrückt man die Zeit zwischen dem
Verhalten, um das es uns geht und der Bestärkung, die wir
dafür vorgesehen haben. Je kürzer diese Zeit ist, desto
wirksamer die Bestärkung.
Mit dem Clicker "erkaufen" wir uns Zeit, ohne an Wirksamkeit
in der Bestärkung zu verlieren.
Wie kommt diese Wirkung zustande?
Wir benutzen die klassische (Pawlowsche) Konditionierung, um die
Verbindung Click - Belohnung aufzubauen. Das geht besonders schnell,
wenn der Hund das Geräusch noch nicht kennt. In einer
ablenkungsarmen Umgebung genügen ein bis vier Clicks, um diese
Verknüpfung sicher zu stellen. Wirksam ist hier vor allem die
Aufmerksamkeit, die alles Neue auf sich zieht. Danach, so beobachtet
man, "weiß" der Hund, was das Click-Geräusch bedeutet. Er
erwartet die Belohnung!
Was man bei fast allen Hunden beobachten kann, ist der Versuch, den
Clicker durch direktes Berühren oder Anstoßen zum
erwünschten Geräusch zu veranlassen.
Der Hund bekommt eine Vorstellung von den Zusammenhängen.
Es git eine kognitive Dimension des Hundes.
Aber soweit sind es nur Beobachtungen und deren Interpretationen.
Inzwischen weiß man mehr. Man hat sicherstellen können, dass
ein solcher "konditionierter Bestärker" bereits das
Dopamin-Belohnungssystem in Gang setzt. Wenn der Hund das Click
wahrnimmt, hat er sofort angenehme Empfindungen. Und so wird auch
erklärlich, dass viele Hunde nach solchem Training "süchtig"
werden. Hunde, die nur Gutes dabei erfahren haben, lieben den Clicker.
Wir können angenehme Empfindungen punktgenau in den Hund zaubern!
Eine weitere Entdeckung war verblüffend.
Wenn ein Bestärker voll vorhergesagt war, das Tier ihn erwartete,
trat kaum eine Erhöhung der Dopaminaktivität auf! Das
widersprach dem bisherigen Verständnis der Botenstoffe.
In letzter Zeit hat man noch eine viel wichtigere Folgeentdeckung
gemacht.
Das Dopaminsystem wird ganz besonders aktiv, wenn ein
"Vorhersagefehler" aufgetreten
ist. Wenn eine nicht erwartete Belohnung
erfolgte oder wenn eine erwartete Belohnung ausblieb, wenn also die
Vorhersagen des Tieres über die nächste Zukunft sich als
falsch erwiesen hatte.
Das sind offensichtlich die Momente, in denen ein Tier am intensivsten
lernt. Nur bei sicheren Vorhersagen kann es sich in dieser Welt sicher
bewegen.
Diese Befunde bestärken eine alte Theorie aus dem Gebiet des
Behaviorismus (Tolman).
Quelle: W. Schultz
Reward Signalling Prediction by Dopamin Neurons
(Der Artikel beginnt mit der zweiten Seite)
|

|
Hunde haben, wie
alle höheren Lebewesen, bestimmte Erwartungen und Vorstellungen an
ihre Umwelt. Nero sucht eine vertraute Beziehung, nachdem ihn die
Listenhund-Kampagne ins Tierheim gespült hat.
|
 |
| Beim Training ist
eine erwartete Belohnung ausgeblieben. Janosch ist
irritiert. Seine Erwartung wurde enttäuscht. Er zeigt seinen
Zustand
genauso an, wie ein Mensch, der sich verblüfft am Kopf kratzt.
Dieses
Verhalten kann man immer wieder bei intensivem Training beobachten. |
Gegenwärtig neigt man zu der Ansicht, dass die Hauptfunktion von
Dopamin nicht die Vermittlung des reinen Wohlbefindens ist. Es bewirkt
vor allem eine hohe Aufmerksamkeit, die Lernvorgänge effektiv
gestaltet. Deswegen ist der Reiz des Neuen mit schnellen Lerneffekten
verbunden. Und deswegen sind die ersten Versuche mit dem Clicker oft am
beeindruckendsten. Die Neuheit trifft auf Neugier, die stark motiviert.
Die Aufmerksamkeit erhöhte durch das Dopaminsignal, sorgt für wirksames
Lernen.
Lernvorgänge finden im Langzeitgedächtnis statt, das auf chemischen
Vorgängen basiert, die Zeit benötigen. Das dauerhafte Lernergebnis
steht nicht sofort zur Verfügung. Studien sind eindeutig. Belohnte
Zusammenhänge werden deutlich besser erinnert als unbelohnte. Auch
aversive Zusammenhänge werden besser erinnert als neutrale.
Das Kurzzeitgedächtnis, das ständig aktiv ist, wird von Belohnungen nicht beeinflusst!
Das war ein überraschendes Ergebnis. Wir verstehen jetzt aber auch die
Beobachtung, dass Trainingseinheiten manchmal recht zäh und mit
wenig überzeugenden Fortschritten laufen können, der Hund trotzdem am
nächsten Tag, das wichtigste scheinbar über Nacht gelernt hat.
Ständige Wiederholungen gleicher Übungen stumpfen ab, der Lerneffekt
geht gegen Null und man dümpelt zwischen Fehler A und Fehler B hin und
her. Ein Überraschung im Training, wie sie obige Ergebnisse nahe legen,
kann hier Wunder wirken. Insgesamt kann man hieraus Regeln eines guten
Trainingsaufbaus ableiten.
Quelle:
Bianca Wittmann, Diss. Magdeburg (2006)
Belohnung, Neuheitsdetektion und Gedächstnisbildung:
Interaktion von dopaminergem Mittelhirn und medialem Temporallappen beim Menschen.
Zusammenfassung
Volltext
Diese Zusammenhänge waren schon in Tierversuchen gefunden worden. Sie
konnten hier durch funktionelle Magnetresonanz Bildgebung
dreidimensional lokalisiert werden. |
|