ANALIZA ALGORITAMA ZA VEKTORSKU REPREZENTACIJU TEKSTA
DOI:
https://doi.org/10.24867/06BE26StankovicKljučne reči:
enkapsulacija, vektorsko predstavljanje reči, duboko mašinsko učenje, glove, word2vec, skipgram, cbowApstrakt
Obrada teksta odnosno NLP (Natural Language Processing) predstavlja atraktivnu oblast u oblasti računarske inteligencije. U ovom radu će biti predstavljeno više načina za pretvaranje teksta u vektore. Postoje dve velike kategorije, prva se zasniva na statističkim metodama a druga na korišćenju neuronskih mreža. Prednost vektorske predstave je mogućnost da se takvi vektori porede ili dalje lakše koriste u nekoj od metoda mašinskog učenja. Vektorska reprezentacija održava deo semantike, tako da predstavlja pogodnu metodu za reprezentaciju i poređenje kompleksnijeg teksta.
Reference
[1] Quoc Le, Tomas Mikolov, ``GloVe: Global Vectors for Word Representation'', Computer Science Department, Stanford University, Stanford, CA 94305, 2014.
[2] Quoc Le, Tomas Mikolov, ``Distributed Representations of Sentences and Documents'', Google Inc, 1600 Amphitheatre Parkway, Mountain View CA 94043, May 2014.
[3] Mikolov, Tomas & Chen, Kai & Corrado, G.s & Dean, Jeffrey. (2013). Efficient Estimation of Word Representations in Vector Space. Proceedings of Workshop at ICLR. 2013.
[2] Quoc Le, Tomas Mikolov, ``Distributed Representations of Sentences and Documents'', Google Inc, 1600 Amphitheatre Parkway, Mountain View CA 94043, May 2014.
[3] Mikolov, Tomas & Chen, Kai & Corrado, G.s & Dean, Jeffrey. (2013). Efficient Estimation of Word Representations in Vector Space. Proceedings of Workshop at ICLR. 2013.
##submission.downloads##
Objavljeno
2019-12-28
Broj časopisa
Rubrika
Elektrotehničko i računarsko inženjerstvo