Tanítási módszerek a mélytanulásban

A deep learning modellek különböző paradigmák szerint tanulhatnak – felügyelten, felügyelet nélkül, vagy megerősítő visszajelzés alapján. A feladat és az adatok jellege határozza meg a helyes választást.

Felügyelt tanulás (Supervised Learning)

A legszélesebb körben alkalmazott megközelítés. A modell cimkézett adatpárok alapján tanul: minden bemeneti mintához tartozik egy várt kimenet (label).

Folyamata

Adathalmaz előkészítése (input–label párok)
Modell tanítása: predikció → loss → backprop → súlyfrissítés
Validációs halmazon értékelés
Teszthalmaz végleges kiértékelése

Tipikus feladatok

Osztályozás: Spam szűrés, képosztályozás, betegségdiagnosztika
Regresszió: Ingatlanár előrejelzés, hőmérséklet-becslés
Gépi fordítás: Forrás–cél mondatpárok alapján

Nem felügyelt tanulás (Unsupervised Learning)

Cimkézetlen adatokból tanul. A modell maga fedezi fel a struktúrát, mintázatokat, csoportosításokat.

Fő módszerek

Klaszterezés: K-means, DBSCAN, agglomeratív – csoportok feltárása
Dimenziócsökkentés: PCA, t-SNE, UMAP – vizualizáció, tömörítés
Autoencoder: Reprezentáció tanulás, anomáliadetekció
GAN: Valós adathoz hasonló szintetikus adat generálása

Megerősítéses tanulás (Reinforcement Learning)

Egy ágens (agent) egy környezetben cselekszik, és visszajelzést (reward/penalty) kap döntéseire. Célja a hosszú távú kumulatív jutalom maximalizálása.

Kulcsfogalmak

Agent: A döntést hozó rendszer
Environment: A környezet, amellyel az ágens interakcióba lép
State: A környezet aktuális állapota
Action: Az ágens által lehetséges lépések
Reward: A jutalom/büntetés visszajelzés
Policy: Az ágens stratégiája – milyen állapotban milyen akciót hajt végre

Alkalmazások

Játékstratégiák (AlphaGo, OpenAI Five)
Robotika és mozgástervezés
Autonóm járművezetés
RLHF – emberi visszajelzéssel finomhangolt LLM-ek (pl. ChatGPT)

Félfelügyelt és önfelügyelt tanulás

Félfelügyelt tanulás

Kevés cimkézett + sok cimkézetlen adat kombinálása. A cimkézetlen adatból előzetes tanulás, majd a cimkézett adaton finomhangolás.

Önfelügyelt tanulás (Self-supervised)

Az adatból automatikusan generál "pszeudo-labeleket". Pl. BERT: véletlenszerűen maszkolt szavak előrejelzése, ezzel gazdag szövegreprezentáció tanulása cimkézés nélkül.

Transfer learning: Egy előre tanított modell (pl. ImageNet-en tanult ResNet) tudásának felhasználása új feladatra – kevesebb adattal, rövidebb tanítási idővel. A modern deep learning alapköve.

Mi az a fine-tuning és miben különbözik a pretraining-től?

Pretraining: Nagy adathalmazon, általános feladaton tanítják a modellt (pl. GPT szöveg-predikció).

Fine-tuning: Az előtanított modell specifikus feladathoz adaptálása kisebb adathalmazal, alacsonyabb tanulási rátával. A korábbi rétegek súlyait részben vagy teljesen befagyaszthatják.