Grundkurs i belöningsbaserad träning – Katrin Wallberg på Ridakademi Norr

Instruktör: Carolina Fransson
Tid: 16-18 januari 2015
Plats: Ridakademi Norr

När vi går på kurs eller tar lektioner med våra hästar ligger ofta fokus på hur hästen ska arbeta med sin kropp, hur olika övningar ska utföras för att få rätt effekt, hur ryttaren ska sitta i olika övningar, vilka hjälper som ska användas mm. Man utgår då ofta från att man med rätt hjälper ska kunna forma hästens kropp korrekt så att hästen utför det vi har för avsikt att göra. Det är inte lika ofta som själva inlärningsmomentet får lika stort fokus. Möjligtvis ligger fokus på inlärning just när man introducerar en ny hjälp eller en ny övning, men därefter förväntas hästen ofta förstå vad man ber den om. Ändå är sanningen den att hästen hela tiden när vi hanterar eller tränar den lär sig saker och inlärningen kan både ske avsiktligt och oavsiktligt.

I all träning av hästar är därför inlärning en viktig del. Ofta fokuserar vi på vad hästen rent fysiskt ska göra och resonerar att problemen kommer att lösa sig när hästen blir starkare. I väldigt många fall beror dock problemen på att vi inte tillräckligt tydligt har lyckats förklara för hästen vad det är den ska utföra. Om en häst i en öppna sänker ytterbogen och lägger vikt på det yttre frambenet så är det inte särskilt troligt att den kommer att sluta göra det bara för att vi fortsätter träna dessa öppnor. Snarare så inträffar det motsatta; hästen tränas mer och mer på beteendet att sänka ytterbogen och lägga över vikten på ytter fram när vi ger öppnahjälper. Det är alltså inte mängden träning som kommer att lösa vårt problem, utan förmågan att förklara för hästen vad vi vill att den ska göra och sedan uppmuntra rätt reaktion. Med andra ord är det inlärningen vi måste förbättra (eller i vissa fall ominlärning).

Vi har därför ägnat en hel helg på Ridakademi Norr till att förbättra vår förmåga att lära hästarna. Det var Carolina Fransson från Uppsala som kom hit och guidades oss i det här arbetet. Enligt Carolinas sätt att se på det är det fel att resonera att en häst VILL vara en till lags eller att en häst INTE VILL följa en hjälper. Istället handlar det helt och hållet om vilka beteenden som uppmuntras.

Vad lär sig hästen?

Hästen lär sig saker hela tiden, även när vi inte tänker på att vi tränar den. Hästen lär sig av vilka konsekvenser ett beteende får. Konsekvensen är det som händer OMEDELBART efter ett beteende.

Vilka konsekvenser kan ett beteende få?

Något trevligt inträffar: Beteendet ökar (förstärkning). Det trevliga kan t.ex. vara godis eller att bli kliad.
Något oönskat upphör: Beteendet ökar (förstärkning). Det vanligaste exemplet på detta är tryck och eftergift.
Något oönskat inträffar: Beteendet minskar (bestraffning). Ett exempel är en katt som blir duschad när den gör något man vill bestraffa.
Något trevligt upphör: Beteendet minskar (bestraffning). Ett exempel är när en häst kliar för hårt på en kompis och kompisen då slutar att klia tillbaka.
Ingenting händer: Beteendet försvinner (släcks ut). Om ett beteende är väldigt väl befäst så får man ofta mer av det först, innan man får mindre. Ett exempel på detta är en häst som nafsar på händerna för att få godis. Om man börjar ignorera detta beteende för att få det att försvinna så provar hästen först att nafsa ännu mer för att få godis. Först när hästen upptäcker att det inte lönar sig att göra ännu mer så tappar den intresset för att nafsa.

Tänk på att vad som upplevs som belönande eller bestraffande varierar både mellan olika individer och mellan olika situationer.

Det spelar ingen roll vad vi har tänkt belöna eller bestraffa. Det är hästens upplevelser som räknas. Hur vet vi då om det fungerar? Det vet vi föst när vi ser hur hästens beteende förändras över tiden.

Det finns många oönskade beteenden hos många av våra hästar. Ibland kan det vara så att vi omedvetet har uppmuntrat sådana oönskade beteenden, men ibland kan de ha uppkommit på grund av något annat hos hästen eller i dess omgivning. Hur blir man då av med oönskade beteenden? Ett sätt är att ändra grundorsaken till beteendet, dvs att ta bort det som gett upphov till beteendet. Det kan t.ex. vara att hästen har ont eller är rädd för något. Ett annat sätt är att istället för att fokusera på det man INTE vill att hästen ska göra så fokuserar man på det man VILL att hästen ska göra. Har man t.ex. en häst som står och krafsar med framhoven när man ska ge den mat så kan man belöna att hästen står stilla med båda framhovarna i marken. Den enklaste belöningen i ett sådant läge är att vänta med att ge hästen maten tills den står stilla med båda framhovarna i marken.

Vad är viktigt i all träning?

Timing
Fokus på det du vill att hästen ska göra (inte det du inte vill)
Dela upp det hästen ska göra i lagom stora steg, så att de blir lätta att lära in
Planera inlärningssituationen så att hästen lätt kan lyckas
Lyssna på och anpassa dig till vad hästen kommunicerar till dig
Träna på vad du själv säger till hästen, dvs se till att du säger samma sak varje gång
Mår hästen dåligt är det svårt att lära den
Fundera på i vilket sinnestillstånd hästen är när du tränar den

I korthet kan man säga att det finns två helt skilda system för att lära en häst något. Det ena är systemet som bygger på tryck och eftergift. Det bygger på att man lägger ett tryck på hästen, t.ex. genom att lägga till en hjälp. Får man inte avsedd reaktion så upprepar man trycket och vid behov förstärker man det. Direkt när hästen reagerar korrekt så ger man eftergift, dvs trycket upphör. Ett tryck behöver inte vara fysiskt, utan det kan lika gärna vara ett mentalt tryck, t.ex. att man sträcker på sig och går emot hästen när man vill att den ska backa undan. Det andra systemet bygger på att man belönar den reaktion man vill förstärka. Belöningen består ofta av godis av något slag, men det kan även vara någon annan slags belöning som hästen uppskattar. Man kan renodlat använda sig av enbart ett av dessa system i hästens träning, men man kan också använda en kombination av båda systemen. Vid kursen i belöningsbaserad hästträning (BBHT) låg fokus förståss på att använda belöningar i inlärningen, men teorin omfattade båda inlärningssystemen och mycket diskussioner fördes kring för- och nackdelar med att kombinera de båda systemen.

Använda belöningar i inlärningen

Belöningar av olika slag kan vara en väldigt stark uppmuntran för hästen i inlärningen. Det kan både snabba på själva inlärningen, men också förstärka hästens benägenhet att göra det man vill lära den.

En belöning kan vara vad som helst som hästen tycker om, t.ex:

Mat
Bli kliad
Att få gå i önskad riktning (t.ex. till kompisarna)
Att få göra en favoritövning (ofta en övning som man tidigare har förstärkt väldigt kraftigt)

Timingen när man belönar
Ett problem man ofta kan uppleva när man arbetar med belöningar i inlärningen är att få rätt timing. Det kan vara svårt att ge hästen belöningen i exakt det ögonblick då hästen utför det man vill uppmuntra. Ett tydligt exempel på detta är om vi tränar galoppfattningar och vill belöna dem med godis. När hästen har fattat galopp så stannar vi den och ger den en godis. Vad är det då vi belönar? Galoppfattningen? Nej, knappast! Hästen kommer snarare att tro att det är halten vi belönar. I bästa fall kan hästen tro att det är halt ur galopp som vi belönar. En lösning på problemet är att skapa en brygga mellan beteendet och belöningen. Att använda en klicker är ett sätt att skapa en sådan brygga. Principen är då att man klickar i exakt det ögonblick då hästen utför det vi vill (t.ex. när hästen fattar galopp) och sedan ger man hästen godis (eller något annat positivt). En klicker är en liten manick som ger ifrån sig ett distinkt klick när man trycker på en knapp. Fördelen med den är att ljudet är väldigt tydligt och att det är ett ljud som hästen inte hör i andra sammanhang. Vill man inte behöva ha med sig en klickar varje gång man tränar sin häst (det kan ju vara svårt att kombinera med dubbla tyglar och ridspö när man rider) så kan man istället använda ett ord eller något annat ljud. När man väljer ljud bör man tänka sig för så att man inte väljer någonting som man använder i andra situationer. Ordet ”bra” är därför mindre lämpligt, eftersom det används av så många som en allmän uppmuntran. Att ”klicka” med tungan kan också vara olämpligt ifall man använder ett liknande ljud för att markera takten eller öka energin i vissa övningar i ridningen. Själv valde jag ordet ”tack”, vilket har ett distinkt ljud, inte är ett ord som hästen annars hör i tid och otid och dessutom är ett ganska trevligt ord. Det låter betydligt trevligare om man säger ”tack” till sin häst än om man säger något så obegripligt som t.ex. ”klick”.

När vi börjar träna en häst belöningsbaserat så måste vi först lära hästen att förstå innebörden av den brygga vi valt att använda. Det gör vi enklast genom att ge hästen en väldigt enkel övning. Man kan t.ex. hålla upp en ”target” (t.ex. en flugsmälla eller en liten petflaska) och när hästen nosar på den så tackar man och belönar (ger godis, kliar, eller vilken belöning som fungerar med just den hästen). En annan tydligt första övning är att t.ex. tacka och belöna när hästen spontant sänker sitt huvud. Fördelarna med dessa övningar är dels att det är väldigt lätt att förklara för hästen vad den sak utföra, man kan upprepa övningarna med väldigt korta mellanrum (dvs ha en hög frekvens) och det är lätt att belöna snabbt efter tacket, vilket snabbare får hästen att koppla ihop tack och godis och därigenom förstå innebörden av bryggan.

Förklara för hästen vad den ska göra
Man märker en ganska tydlig skillnad när hästen har förstått vad det är vi vill att den ska utföra. Då blir hästen helt plötsligt väldigt intresserad av att göra det vi håller på att träna (den trycket t.ex. snabbt mulen mot targeten eller sänker direkt huvudet). Om hästen mer slumpartat verkar göra rätt ibland och däremellan är ganska ointresserad och funderar på annat så har den antagligen inte förstått vad den ska utföra. Det finns några olika sätt att förtydliga inlärningen:

Förklara bättre för hästen (så att vi får något att belöna)
Använda en starkare belöning (något som hästen uppskattar bättre)
Öka frekvensen (så att uppgiften och belöningen upprepas med så kort mellanrum som möjligt)

En del övningar kan vara svåra att förklara för hästen. Då får man försöka förenkla så mycket som möjligt i början. Ett sätt är att försöka dela upp en övning i flera små delar. Om vi tar en öppna som exempel så kan man t.ex. börja med att lära hästen att flytta det inre bakbenet i rätt riktning, att korsa sina framben eller att lyfta sin ytterbog. Ett annat sätt att förenkla en övning vid inlärningen är att börja med att göra övningen stillastående. Ska man göra en öppna stillastående så innebär det att hästen ska svara på öppnahjälperna med att sträcka nosen framåt mot insidan, öka rotationen i kroppen och avlasta sitt yttre framben. När hästen placerar sig i den ”posen” så tackar man och belönar. På det här sättet så passar det stillastående arbetet i den akademiska ridkonsten väldigt bra för att förtydliga hästens inlärning och även för att på ett effektivt sätt kunna använda belöningsbaserad träning.

Reagera spontant eller på signal
Det finns två olika sätt att forma fram beteenden eller reaktioner hos hästen:

Styrd shaping
Fri shaping

Använder man sig av styrd shaping så guidar man hästen till den reaktion man vill ha redan från början. Man ger alltså en signal och belönar hästen när man får avsedd reaktion. Hästen kommer då bara att utföra det man tränar när man ger signalen. Om man vill att beteendet (reaktionen) ska drivas av belöningen så ska man undvika att eskalera i tryck (alltså undvika att förstärka trycket) om hästen inte reagerar.

Vid fri shaping utnyttjar man att hästen frivilligt och på eget initiativ erbjuder ett visst beteende och passar då på att belöna det. I början kommer man alltså inte att ha en viss signal för att be om en reaktion, utan man väntar bara ut hästen. När man på så sätt arbetar med hästens egna initiativ får man väldigt engagerade hästar. När beteendet har format fram färdigt kan man koppla ihop det med en signal.

När man använder sig av fri shaping så är det viktigt att man har en startsignal, för att inte hästen ska ta till det belönade beteendet i tid och otid. En startsignal kan t.ex. vara att hästen ska trycka mulen mot en target. Man bör undvika att själv bli hästens startsignal, eftersom den då kommer att utföra det man förstärkt hela tiden när man är i hästens närhet.

Minska belöningarna utan att tappa effekt
När man tränar belöningsbaserat är det ganska lätt att lära hästen nya saker. I början känns det dock mest som att man står och matar hästen. Efter hand ska belöningarna minskas ned, men vi vill ändå att hästen ska fortsätta att ivrigt göra det vi ber den om. Om man minskar ned belöningarna för snabbt, eller helt tar bort belöningarna, är risken stor för utsläckning, dvs att effekten avtar och försvinner. Ett sätt att undvika utsläckning är att långsamt fasa ut förstärkningen. Det innebär att man bara vissa gånger som hästen ger rätt reaktion tackar och belönar. Det blir som ett lotteri för hästen. Den fortsätter att göra det vi ber om, eftersom den vissa gånger blir belönad. Den här metoden kräver dock att beteendet (reaktionen) redan är befäst.

Man kan också sätta ihop olika övningar till hela moment och belöna i slutet av momentet.

Om man helt och hållet använder sig av belöningsbaserad träning så kan man få en del hjälper eller övningar så välförstärkta att de i sig fungerar som belöningar för hästen. Man kan då förstärka (belöna) en övning med att låta hästen göra en annan välförstärkt övning.

Risker vid belöningsbaserad träning
Den största risken vid belöningsbaserad träning är att hästen blir för upphetsad. Det sker ofta i kombination med frustration, som nästan alltid grundas på att hästen inte förstår eller inte tycker sig ha kontroll över situationen. Ett sätt att motverka den här frustrationen är att skapa förutsägbarhet, vilket kräver att hästen förstår vad man vill att den ska utföra. Ju tydligare man är desto mindre är risken för frustration. Tydligheten baseras t.ex. på en korrekt timing, tydliga kriterier för vad man belönar och en för just den hästen bra förstärkning (belöning). Försöker man lära hästen något väldigt komplext där man själv är lite osäker på när det blir rätt och fel så kommer det att vara svårt att vara tydlig mot hästen.

Kombinera tryck och eftergift med belöningar
Man skulle kunna tänka sig att systemet med tryck och eftergift och systemet med belöningsbaserad träning samverkar och endast utgör olika grader av uppmuntran. Den lägsta graden av belöning vore i så fall eftergift och vill man förstärka mer så lägger man till en extra belöning. Rent generellt bör man dock undvika att kombinera den belöningsbaserade träningen med korrigeringar (upprepat eller eskalerat tryck), eftersom det annars är risk att den positiva förstärkningen avtar (alltså att effekten av belöningen avtar). Vill man blanda träning som bygger på tryck och eftergift med träning som baseras på belöningar så är det bästa att välja ut något eller några moment som man särskilt vill förstärka och träna dem helt belöningsbaserat. Det ger oftast bättre resultat än att kombinera de båda metoderna i samma träningssituation.

Om en häst är väldigt starkt tränad med belöningar så kan det i vissa fall till och med omöjliggöra användandet av tryck och eftergift. Om den positiv förstärkning är väldigt väl befäst så kan hästen börja uppfatta en signal (t.ex. en skänkelhjälp) som en belöning i sig (dvs något som hästen vill åt), eftersom den vet att signalen följs av en belöning. Hästen kan då bli frustrerad om man använder en sådan signal för att korrigera hästen. Är signalen i dessa fall en belöning i sig eller ett tryck som hästen vill ska upphöra?

Detta tar jag med mig från kursen
För mig fungerar den träningsmetod jag använder idag väldigt bra. Den bygger på ett tydligt ledarskap och signaler (tryck), som vid rätt reaktion följs av omedelbar eftergift. Det systemet ger för mig väldigt avslappnade och trygga hästar, som lämnar över kontrollen till mig och vet vad de har att rätta sig efter. Jag har därför inte för avsikt att överge det systemet och helt byta till en belöningsbaserad träningsmetod.

Däremot har den här kursen gett mig fler verktyg att använda mig av i en inlärningssituation, när en häst är stressad eller spänd, när en häst behöver lite starkare motivation för att arbeta korrekt eller när man vill förändra ett visst beteende hos sin häst. Hos alla mina hästar håller jag därför på att befästa ordet ”Tack” som en brygga mellan reaktion och belöning. Jag har börjat använda metoden för att lära en häst att slappna av i boxen, lära en häst att inte smånafsa när man drar åt sadelgjorden och att lära en svårfångad häst att komma fram till en och sticka in huvudet i grimman när man håller fram en grimma. Jag har också börjat experimentera kring vilken nytta jag kan ha av belöningsförstärkning i själva träningen av hästarna. Det jag har börjat förstärka hos alla hästar är att de lyfter ryggen, länger ut halsen och för fram nosen när jag i ridningen lägger till inner eller ytter skänkel. Redan efter en vecka märker jag en kraftig skillnad hos de hästar som har haft svårast för att länga halsen och lyfta sin rygg. Detta har bland annat lett till att de för fram och lyfter ytterbogen bättre och att de gör mjuka och stabila övergångar från skritt till trav.

Film från kursen
Här finns en film som visar lite av det arbete vi provade under kursen.