academia/machinelearning/deep_learning/word2vec

Word2Vec note

引入

Word2Vec是从大量文本语料中以无监督的方式学习语义知识的一种模型,它被大量的用在自然语言处理中。Word2Vec其实就是通过学习文本来用词向量的方式表征词的语义信息,即通过一个嵌入空间使得语义上相似的单词在该空间内距离很近。Embedding其实就是一个映射,将单词从原先所属的空间映射到新的多维空间中,也就是把原先词所在的空间嵌入到一个新的空间中去。