EL ExpertLab

Tanítási módszerek a mélytanulásban

A deep learning modellek különböző paradigmák szerint tanulhatnak – felügyelten, felügyelet nélkül, vagy megerősítő visszajelzés alapján. A feladat és az adatok jellege határozza meg a helyes választást.

Számítógépes munka

Felügyelt tanulás (Supervised Learning)

A legszélesebb körben alkalmazott megközelítés. A modell cimkézett adatpárok alapján tanul: minden bemeneti mintához tartozik egy várt kimenet (label).

Folyamata

  1. Adathalmaz előkészítése (input–label párok)
  2. Modell tanítása: predikció → loss → backprop → súlyfrissítés
  3. Validációs halmazon értékelés
  4. Teszthalmaz végleges kiértékelése

Tipikus feladatok

  • Osztályozás: Spam szűrés, képosztályozás, betegségdiagnosztika
  • Regresszió: Ingatlanár előrejelzés, hőmérséklet-becslés
  • Gépi fordítás: Forrás–cél mondatpárok alapján

Nem felügyelt tanulás (Unsupervised Learning)

Cimkézetlen adatokból tanul. A modell maga fedezi fel a struktúrát, mintázatokat, csoportosításokat.

Fő módszerek

  • Klaszterezés: K-means, DBSCAN, agglomeratív – csoportok feltárása
  • Dimenziócsökkentés: PCA, t-SNE, UMAP – vizualizáció, tömörítés
  • Autoencoder: Reprezentáció tanulás, anomáliadetekció
  • GAN: Valós adathoz hasonló szintetikus adat generálása

Megerősítéses tanulás (Reinforcement Learning)

Egy ágens (agent) egy környezetben cselekszik, és visszajelzést (reward/penalty) kap döntéseire. Célja a hosszú távú kumulatív jutalom maximalizálása.

Kulcsfogalmak

  • Agent: A döntést hozó rendszer
  • Environment: A környezet, amellyel az ágens interakcióba lép
  • State: A környezet aktuális állapota
  • Action: Az ágens által lehetséges lépések
  • Reward: A jutalom/büntetés visszajelzés
  • Policy: Az ágens stratégiája – milyen állapotban milyen akciót hajt végre

Alkalmazások

  • Játékstratégiák (AlphaGo, OpenAI Five)
  • Robotika és mozgástervezés
  • Autonóm járművezetés
  • RLHF – emberi visszajelzéssel finomhangolt LLM-ek (pl. ChatGPT)

Félfelügyelt és önfelügyelt tanulás

Félfelügyelt tanulás

Kevés cimkézett + sok cimkézetlen adat kombinálása. A cimkézetlen adatból előzetes tanulás, majd a cimkézett adaton finomhangolás.

Önfelügyelt tanulás (Self-supervised)

Az adatból automatikusan generál "pszeudo-labeleket". Pl. BERT: véletlenszerűen maszkolt szavak előrejelzése, ezzel gazdag szövegreprezentáció tanulása cimkézés nélkül.

Transfer learning: Egy előre tanított modell (pl. ImageNet-en tanult ResNet) tudásának felhasználása új feladatra – kevesebb adattal, rövidebb tanítási idővel. A modern deep learning alapköve.
Mi az a fine-tuning és miben különbözik a pretraining-től?

Pretraining: Nagy adathalmazon, általános feladaton tanítják a modellt (pl. GPT szöveg-predikció).

Fine-tuning: Az előtanított modell specifikus feladathoz adaptálása kisebb adathalmazal, alacsonyabb tanulási rátával. A korábbi rétegek súlyait részben vagy teljesen befagyaszthatják.