Tanítási módszerek a mélytanulásban
A deep learning modellek különböző paradigmák szerint tanulhatnak – felügyelten, felügyelet nélkül, vagy megerősítő visszajelzés alapján. A feladat és az adatok jellege határozza meg a helyes választást.
Felügyelt tanulás (Supervised Learning)
A legszélesebb körben alkalmazott megközelítés. A modell cimkézett adatpárok alapján tanul: minden bemeneti mintához tartozik egy várt kimenet (label).
Folyamata
- Adathalmaz előkészítése (input–label párok)
- Modell tanítása: predikció → loss → backprop → súlyfrissítés
- Validációs halmazon értékelés
- Teszthalmaz végleges kiértékelése
Tipikus feladatok
- Osztályozás: Spam szűrés, képosztályozás, betegségdiagnosztika
- Regresszió: Ingatlanár előrejelzés, hőmérséklet-becslés
- Gépi fordítás: Forrás–cél mondatpárok alapján
Nem felügyelt tanulás (Unsupervised Learning)
Cimkézetlen adatokból tanul. A modell maga fedezi fel a struktúrát, mintázatokat, csoportosításokat.
Fő módszerek
- Klaszterezés: K-means, DBSCAN, agglomeratív – csoportok feltárása
- Dimenziócsökkentés: PCA, t-SNE, UMAP – vizualizáció, tömörítés
- Autoencoder: Reprezentáció tanulás, anomáliadetekció
- GAN: Valós adathoz hasonló szintetikus adat generálása
Megerősítéses tanulás (Reinforcement Learning)
Egy ágens (agent) egy környezetben cselekszik, és visszajelzést (reward/penalty) kap döntéseire. Célja a hosszú távú kumulatív jutalom maximalizálása.
Kulcsfogalmak
- Agent: A döntést hozó rendszer
- Environment: A környezet, amellyel az ágens interakcióba lép
- State: A környezet aktuális állapota
- Action: Az ágens által lehetséges lépések
- Reward: A jutalom/büntetés visszajelzés
- Policy: Az ágens stratégiája – milyen állapotban milyen akciót hajt végre
Alkalmazások
- Játékstratégiák (AlphaGo, OpenAI Five)
- Robotika és mozgástervezés
- Autonóm járművezetés
- RLHF – emberi visszajelzéssel finomhangolt LLM-ek (pl. ChatGPT)
Félfelügyelt és önfelügyelt tanulás
Félfelügyelt tanulás
Kevés cimkézett + sok cimkézetlen adat kombinálása. A cimkézetlen adatból előzetes tanulás, majd a cimkézett adaton finomhangolás.
Önfelügyelt tanulás (Self-supervised)
Az adatból automatikusan generál "pszeudo-labeleket". Pl. BERT: véletlenszerűen maszkolt szavak előrejelzése, ezzel gazdag szövegreprezentáció tanulása cimkézés nélkül.
Mi az a fine-tuning és miben különbözik a pretraining-től?
Pretraining: Nagy adathalmazon, általános feladaton tanítják a modellt (pl. GPT szöveg-predikció).
Fine-tuning: Az előtanított modell specifikus feladathoz adaptálása kisebb adathalmazal, alacsonyabb tanulási rátával. A korábbi rétegek súlyait részben vagy teljesen befagyaszthatják.