A Word2Vec lényege, hogy megetetsz a rendszerrel egy rakás szöveget, és ha megfelelő mennyiségben állnak rendelkezésre adatok, kvázi képes róla alapvető fogalmakat alkotni. Tehát megmondani mondjuk, hogy milyen országnak mi a fővárosa, vagy olyan kérdésekre válaszolni, hogy mi a király női megfelelője (királynő). E mellett akár fordítani is lehet vele. Itt ez kvázi egy matematikai művelet, egyik vektor térből a másikba kell leképezni a szavakat. Mindezt úgy, hogy nem tud angolul, és emberi értelemben nem "érti" a szöveget, csak karakter halmazokkal manipulál. Annyi csak a lényeg, hogy legyen elég adat, a rendszer "kitalálja" a többit. Ez már magában "varázslat", de ami a legszebb az egészben, hogy ez mára kvázi rutin feladat. Az ember letölt netről egy ilyen cuccot, és használja. Bárki számára elérhető, ott a forráskód, minden. Ugyanígy be lehet szerezni képeken objektumokat felismerni képes konvolúciós neurális hálózatokat, hangfelismerő, vagy beszéd szintetizáló rendszereket, stb. Ha valaki ilyesmivel akar foglalkozni, lassan már csak annyi a feladata, hogy "összedrótozzon" magának egy robotagyat ...
#blog
http://deeplearning4j.org/word2vec.html
Deeplearning4j - Open-source, distributed deep learning for the JVM
Open-Source Deep-Learning Software for Java and Scala on Hadoop and Spark