Neurális hálózat alapjai

A mesterséges neurális hálózat a biológiai agy sematizált modelljéből inspirált számítási rendszer – rétegelt strukturált egységek, amelyek adatból tanulnak.

Mi az a neurális hálózat?

A mesterséges neurális hálózat (ANN – Artificial Neural Network) összekötött csomópontok (neuronok) rétegelt rendszere, amelyet arra terveztek, hogy mintákat ismerjen fel bemeneti adatokban. A rendszer tanulás útján finomítja belső paramétereit.

Felépítés

Bemeneti réteg

Az adatokat fogadja. Minden egység (neuron) egy bemeneti jellemzőnek felel meg – pl. kép esetén egy pixel értékének, táblázatos adatnál egy numerikus attribútumnak.

Rejtett rétegek

A hálózat "megértési" rétegei. Az első rejtett réteg egyszerű jellemzőket (él, sarok) tanul, a mélyebb rétegek összetettebb absztrakciókat (forma, szöveg, tárgy).

Kimeneti réteg

A feladatnak megfelelő formában adja az eredményt – bináris osztályozásnál egyetlen neuron sigmoid aktivációval; többosztályos esetben softmax; regressziónál lineáris aktiváció.

Súlyok és biasok

Minden kapcsolathoz tartozik egy súly (weight), és minden neuronhoz egy bias. Ezek az értékek határozzák meg a hálózat viselkedését – ezek optimalizálódnak a tanulás során.

z = w₁x₁ + w₂x₂ + ... + wₙxₙ + b

A z értéket ezután az aktivációs függvény transzformálja – pl. ReLU: max(0, z).

Forward pass – előre terjesztés

Az adatok a bemenettől a kimeneti rétegig rétegről rétegre haladnak. Minden réteg súlyozza, összeadja és transzformálja a bemenetet. Ez a folyamat egy predikciót állít elő.

Tanulási mechanizmus

Forward pass: predikció számítása
Loss számítása: predikció és valós érték különbsége
Backpropagation: gradiens kiszámítása minden súlyra
Súlyfrissítés: gradiens süllyedés algoritmussal
Ismétlés minden batchre és epochra

Megjegyzés: A tanulási ráta (learning rate) kritikus hiperparaméter – túl nagy: instabil tanulás; túl kis: lassú konvergencia. Adam optimizer adaptívan szabályozza.

Mélység és szélesség

Mély hálózat: Sok rejtett réteg – ez teszi lehetővé a hierarchikus jellemzőkinyerést.

Széles hálózat: Sok neuron egy rétegben – több párhuzamos jellemzőt reprezentál, de nehezebb általánosítani.

Hány réteg és neuron szükséges egy feladathoz?

Nincs általánosan érvényes szabály – kísérletezéssel (hyperparameter search) és tapasztalattal határozható meg. Egyszerű feladatokhoz (XOR, lineáris szeparáció) 1-2 réteg elég; képosztályozásnál 10-100+ réteg szokásos.