A HuBrain Encoder egy 3072 dimenziós látens térbe képezi le a magyar nyelvet. Semmiféle finetuningot vagy felcímkézett nyelvtani adatot nem kapott! Tisztán nyers szövegből, felügyelet nélküli tanulással, karakter-szinten hozza létre az elvont jelentést.
TensorFlow Projector elemzések a szavak és mondatok elrendeződéséről
A hálózat 100%-os vakság mellett (Sokk-terápia) képes megérteni a szófajokat. Tisztán a karakterbitek pozíciójából és a kontextusból elkülöníti a főneveket az igéktől és melléknevektől.
A "Mean Pooling" segítségével az Encoder a szavak vektorait egyetlen 3072D-s pontba sűríti. A hasonló hangulatú és funkciójú mondatok szoros fürtökbe rendeződnek.
Az "A kutya alszik a szőnyegen" és "Az eb szundít a padlón" teljesen más szavakból áll, a modell mégis ugyanoda helyezi őket a latens térben. Valódi megértés.
A Multi-Head Attention leváltása: Gated Linear Mixer (SGU) 80 rétegben.
A diagram felépítése a klasszikus Transformer papírt követi, de a Multi-Head Attention blokkot kicseréltük a saját Spatial Gated Unit-unkra. Itt nincsenek bonyolult query-key szorzások (O(N²)), hanem a teljes szekvencia lineárisan keveredik össze, amit a sokk-terápiás betanítás kényszerít ki. Ez adja a modell brutális hatékonyságát.
Részlet az encoder_training.log fájlból (115,000+ lépés). A modell 100%-os vakság mellett 83.4%-os másolási és 37.1%-os MLM pontosságot ért el!
Részlet a test_pos_encoder.py naplójából. Bár a modell semmilyen finetuningot nem kapott, tisztán a nyers szövegek olvasásából "magától" jött rá a nyelvtan szabályaira és a szófajokra!
PS C:\src\HuBrainLinearLayers> python .\test_pos_encoder.py
--- Mondat: 'A magas budai vár nagyon szép .' ---
Szó: vár | POS: [/N] (Főnév - Helyes!)
--- Mondat: 'Péter a buszmegállóban vár a barátjára .' ---
Szó: vár | POS: [/V] (Ige - Helyes!)
--- Mondat: 'Ma nagyon kék az ég .' ---
Szó: ég | POS: [/N] (Főnév - Helyes!)
--- Mondat: 'A száraz fa ropogva ég a tábortűzben .' ---
Szó: ég | POS: [/V] (Ige - Helyes!)
Amikor a "vár" szót elírjuk "vát"-ra, a nyers karakterhasonlóság mindössze 90%. De az Encoder kontextusba helyezve felismeri a mondat célját, és 0.9884 (98.8%) pontossággal visszahúzza a megfelelő latens pozícióra a vektort.
Töltsd le a nyers TSV fájlokat, Python teszt scripteket és a logokat, majd vizsgáld meg a TensorBoard Projectorban.
vectors.tsv).metadata.tsv).