Univerzális fordítás mesterséges nyelvvel


Nem tudom, hogy ez a gépi fordítás dolog hogy áll, de a Google Translate teljesítményét elnézve azért még van hová fejlődni, legalábbis angol-magyar viszonylatban biztosan. Nem is az a gond vele, hogy nem lehet folyékonyan olvasni a generált szöveget, hanem sok esetben egyszerűen értelmezhetetlen a fordítás, pedig a Google Translate még messze a legjobb az ilyen megoldások közt (legalábbis amit én ismerek). Az itt szerintem a probléma, hogy a fordításhoz egy számítógépes algoritmus szempontjából nem elég input maga a szöveg. Egy emberi fordításnál ehhez még nagyon sok metaadat társul, amiből végül előáll a fordítás. Magyarán érteni kell a szöveget ahhoz, hogy normálisan le lehessen fordítani. Innentől viszont a gépi fordítás nagyon komoly MI-be csap át.

Azon gondolkodtam, hogy talán létre lehetne hozni valamilyen reprezentációt erre, valamilyen mesterséges nyelvet ami a mondatok teljes értelmét hordozza. Olyasmire gondolok amikkel a szakértői rendszerek esetén is le szokták írni a tudást. Így a szöveget először erre a mesterséges nyelvre (ezek ilyen fogalom gráfok szoktak lenni) fordítanánk, amiből aztán értelmes mondatokat tudnánk generálni bármilyen nyelvre, hiszen ezek már hordoznák mindazt a tudást amire szüksége van az algoritmusnak ahhoz, hogy tökéletes (vagy legalábbis az eddigieknél sokkal jobb) fordítást állítson elő úgy, hogy e közben nem "érti" a szöveget. Ettől még persze a gráf előállításához intelligencia kell. Itt viszont újra bejöhetne a képbe az ember. Úgy képzelem az egészet, hogy a helyett, hogy valaki lefordítana egy szöveget mondjuk angolra, inkább erre a mesterséges nyelvre fordítja le, ahonnan már egy gombnyomással generálható angol, német, francia, stb. fordítás. Persze kézzel gráfokat leírni azért elég bonyodalmas, illetve a folyamat részben automatizálható lenne, így egy fordító program valamilyen szinten legenerálhatná a gráfot, amit aztán például kérdések feltevésével pontosíthatna, vagy a fordító grafikusan szerkeszthetne, kiegészíthetne, stb.

Rengeteg előnye lenne egy ilyen megoldásnak. Először is a fordítónak nem kellene ismernie semmilyen idegen nyelvet, bárki képes lenne ezzel a módszerrel lefordítani az általa előállított tartalmat. Ha eleve ebben a formában illeszthetnénk be a szövegeket a weboldalakba, akkor azok automatikusan az adott nyelven jelennének meg mindenkinek. De ami a legjobb lenne az egészben, hogy így a kereső motorok értelmezni tudnák a tartalmat, hisz azt a tartalom előállítója kvázi gépi tudássá konvertálta. Egy ilyen tartalmakból felépülő web olyan lenne mint egy szakértői rendszer memóriája, mint egy hatalmas agy, aminek kérdéseket tehetünk fel, amire ő a tudása alapján válaszolni tud. Egy ilyen kezdeményezést talán a Google-nek érné meg felkarolni több szempontból is. Talán már dolgoznak is valami hasonlón ... 

#blog