Bei verstärkenden Lernen bekommt die KI den Zustand des Systems in Form von Daten als Eingabe. Sie kann dann Agieren, um den Zustand zu verändern. Das Agieren wird bewertet und die Bewertung wird der KI in Form einer Zahl zurückgemeldet. Die KI passt dann ihre Strategie so an, dass die Bewertung beim nächsten Durchlauf möglichst hoch wird.
Positive Bewertungen werden oft als "Belohnung" der KI interpretiert, negative als "Bestrafung".
Verstärkendes Lernen kommt z.B. zum Einsatz
Sehen Sie sich dieses Video an, in dem ein einfaches System gezeigt wird, das verstärkendes Lernen zum Einsatz kommt.
Seite 167/2, 3