Representación vectorial de palabras
Una representación vectorial es un nombre general para varios enfoques del modelado del lenguaje y el entrenamiento de representación en el procesamiento del lenguaje natural destinado a hacer coincidir palabras (y posiblemente frases) de algún diccionario de vectores de for , un número mucho menor de palabras en el diccionario. La base teórica de las representaciones vectoriales es la semántica distributiva .


Hay varios métodos para construir tal mapeo. Así, utilizan redes neuronales [1] , métodos de reducción de dimensionalidad aplicados a matrices de co-ocurrencia de palabras [2] y aprendizaje de representaciones explícitas sobre contextos de menciones de palabras (representaciones explícitas) [3] .
demostrado[ ¿por quién? ] que las representaciones vectoriales de palabras y frases pueden mejorar significativamente la calidad de algunos métodos de procesamiento automático del lenguaje natural (por ejemplo, análisis sintáctico [4] y análisis de sentimientos [5] ).
Enlaces
- ↑ Mikolov, Tomás; Sutskever, Ilya; Chen, Kai; Corrado, Greg & Dean, Jeffrey (2013), Representaciones distribuidas de palabras y frases y su composicionalidad, arΧiv : 1310.4546 [cs.CL].
- ↑ Lebret, Rémi & Collobert, Ronan (2013), Word Emdeddings a través de Hellinger PCA, arΧiv : 1312.5542 [cs.CL].
- ↑ Levy, Omer; Goldberg, Yoav. Regularidades lingüísticas en representaciones de palabras dispersas y explícitas // Actas de la decimoctava conferencia sobre aprendizaje de lenguaje natural computacional, Baltimore, Maryland, EE. UU., junio. Asociación de Lingüística Computacional. 2014: revista.
- ↑ Socher, Richard; Bauer, John; Manning, Cristóbal; Ng, Andrés. Análisis sintáctico con gramáticas de vectores composicionales (indefinido) // Actas de la conferencia ACL. 2013.
- ↑ Socher, Richard; Perelyguin, Alex; Wu, Juan; Chuang, Jason; Manning, Chris; Ng, Andrés; Potts, Chris. Modelos profundos recursivos para la composicionalidad semántica sobre un árbol de sentimientos // Conferencia sobre métodos empíricos en el procesamiento del lenguaje natural: revista.