Neurális hálózat alapjai
A mesterséges neurális hálózat a biológiai agy sematizált modelljéből inspirált számítási rendszer – rétegelt strukturált egységek, amelyek adatból tanulnak.
Mi az a neurális hálózat?
A mesterséges neurális hálózat (ANN – Artificial Neural Network) összekötött csomópontok (neuronok) rétegelt rendszere, amelyet arra terveztek, hogy mintákat ismerjen fel bemeneti adatokban. A rendszer tanulás útján finomítja belső paramétereit.
Felépítés
Bemeneti réteg
Az adatokat fogadja. Minden egység (neuron) egy bemeneti jellemzőnek felel meg – pl. kép esetén egy pixel értékének, táblázatos adatnál egy numerikus attribútumnak.
Rejtett rétegek
A hálózat "megértési" rétegei. Az első rejtett réteg egyszerű jellemzőket (él, sarok) tanul, a mélyebb rétegek összetettebb absztrakciókat (forma, szöveg, tárgy).
Kimeneti réteg
A feladatnak megfelelő formában adja az eredményt – bináris osztályozásnál egyetlen neuron sigmoid aktivációval; többosztályos esetben softmax; regressziónál lineáris aktiváció.
Súlyok és biasok
Minden kapcsolathoz tartozik egy súly (weight), és minden neuronhoz egy bias. Ezek az értékek határozzák meg a hálózat viselkedését – ezek optimalizálódnak a tanulás során.
A z értéket ezután az aktivációs függvény transzformálja – pl. ReLU: max(0, z).
Forward pass – előre terjesztés
Az adatok a bemenettől a kimeneti rétegig rétegről rétegre haladnak. Minden réteg súlyozza, összeadja és transzformálja a bemenetet. Ez a folyamat egy predikciót állít elő.
Tanulási mechanizmus
- Forward pass: predikció számítása
- Loss számítása: predikció és valós érték különbsége
- Backpropagation: gradiens kiszámítása minden súlyra
- Súlyfrissítés: gradiens süllyedés algoritmussal
- Ismétlés minden batchre és epochra
Mélység és szélesség
Mély hálózat: Sok rejtett réteg – ez teszi lehetővé a hierarchikus jellemzőkinyerést.
Széles hálózat: Sok neuron egy rétegben – több párhuzamos jellemzőt reprezentál, de nehezebb általánosítani.