Det är ingen tvekan om att det är toksvårt att döma dressyr för en människa. En artikel i Hippson uppmärsammade detta nyligen. Förutom att det går fort är det komplext. Det är massor med olika faktorer som påverkar och allt detta ska domaren samtidigt ta in och göra en bedömning av. Dessutom finns det inte några helt tydliga och vedertagna bedömningskriterier. Det finns beskrivningar av hur rörelserna idealt ska utföras, och det finns dokumenterat vad som ska ses som allvarliga fel. Men det finns ingen nedbrytning av bedömningen, och det finns inte heller särskilt mycket vägledning för bedömning i lättare klasser. Jag har försökt få fram någon slags beskrivning av vad som är eftersträvansvärt i de lättare klasserna men inte lyckats.
En fråga som har väckts på sistone är om AI skulle kunna helt eller till viss del ersätta domarna i tävlingsdressyren. Bland annat har det skrivits en kandidatuppsats på ämnet, även den behandlad i en artikel i Hippson. Dressyrfolket och domarna är tämligen positiva till tanken. Det är nog om inte annat ett resultat av att man ser svårigheterna i dressyrbedömning och vi vill gärna hitta bättre och mer objektiva bedömningsformer.
Vad skulle då AI kunna göra? Här känner jag att jag vill börja med att göra en skillnad på AI, Artificiell intelligens, och maskinbedömning. AI innebär att en dator lär sig hur bedömning går till genom att studera en stor mängd bedömningar. AI tittar alltså på bedömning av mänskliga domare, i väldigt stor mängd, och drar slutsatser utifrån det och tillämpar sedan slutsatserna. Med maskinbedömning menar jag istället att människan matar in olika saker som datorn kan mäta och därmed göra en objektiv bedömning av.
Det som händer när AI lär sig av mänskliga domare är ju att döma likadant som människorna gör. Erfarenheter inom andra områden visar att AI väldigt fort plockar upp fördomar, förenklade resonemang och förutfattade meningar – och kan även accelerera dem. Det har till exempel visat sig att AI som lär sig av diskussioner av människor ganska snabbt blir starkt polariserade, ofta rasistiska och fördömande. I fallet med dressyrbedömning får man ju hoppas att underlaget inte bara är stort utan även av hög kvalitet. Men det kommer ändå vara så att AI härmar den mänskliga bedömningen, utan att lägga några värderingar i VAD de bedömer. Det kan alltså bli så att t ex svarta hästar döms högt eftersom det ofta är så att svarta hästar får höga poäng, att AI plockar upp vissa rörelsemönster som favoriseras. Det kan till och med vara så att om holländarna dominerar dressyren döms ryttare med orange krage på fracken upp rent generellt. Det här leder inte till en mer objektiv bedömning, tvärt om.
Maskinbedömning, å andra sidan, blir ju helt objektivt. Maskinen mäter, analyserar och sätter en poäng utifrån vad den faktiskt registrerar. Nackdelen är ju att det som bedöms på något sätt behöver kunna mätas och jämföras. Det finns förstås saker där detta kan funka – t ex takt. Det går att få fram, helt objektivt, hur hästens takt ser ut och förändras under programmet. Här behövs en omfattande mänsklig analys av vad vi FAKTISKT efterssträvar, och det måste omvandlas med matematisk precision. Problemet här är förstås att hästar och ekipage är olika. Därför går det inte att modellera fram ett ideal som alla ska efterlikna exakt, utan man måste hitta vad som är eftersträvansvärt och hur det kan yttra sig hos olika individer.
Men vad ska vi göra då? Hur ska vi få en mer objektiv bedömning i dressyr? Kan vi kanske kombinera lite olika tekniker med mänsklig bedömning för att göra domarnas jobb lättare och bedömningarna mer objektiva? Jag menar att oavsett hur vi går framåt bör vi börja med att göra ordentliga och djupa analyser av exakt vad vi vill ha. Vad är det vi eftersträvar, och hur kan det definieras? Går det att bryta ner i bitar? Vad är kärnan i det vi eftersöker och hur ser det ut hos hästar med olika exteriör och rörelsemönster? Här kanske vi skulle kunna ta hjälp av AI för att hitta vad det är vi egentligen menar med våra bedömningar? Även maskinbedömning kan troligen hjälpa oss att förstå VAD vi bedömer och på vilket sätt.
Slutligen måste domarnas jobb göras enklare. Genom att bryta ner bedömningen skulle det kanske gå att dela upp den så olika domare bedömer olika saker. Det är ju något som görs i en del andra bedömningssporter. Sen skulle digitala verktyg också kunna underlätta domarens jobb. Vissa delar kanske kan bedömas helt maskinellt, vissa delar kan en välinstruerad AI bedöma. Vissa delar kanske vi behöver mänsklig bedömning för? Jag vet inte vilken väg som är den bästa framåt – men jag tror verkligen vi måste börja i pudelns kärna – vad är det vi bedömer och vad är det vi eftersträvar? Innan vi vet det kommer maskinerna inte kunna göra ett bra jobb – och även de mänskliga domarna skulle vara mycket hjälpta av det.