Reinforcement Learning (RL)
Reinforcement Learning (Verstärkendes Lernen) ist der dritte große Bereich des ML. Ein Agent lernt durch Versuch und Irrtum in einer Umgebung. Für jede 'gute' Aktion bekommt er eine Belohnung (Reward), für 'schlechte' eine Bestrafung. Es ist das Prinzip der Dressur. Berühmte Erfolge: AlphaGo, Robotersteuerung und ChatGPT (RLHF).