\( \def\vector#1{\boldsymbol{#1}} \)

word2vec

Takami Torao #word2vec
  • このエントリーをはてなブックマークに追加

概要

word2vec は与えられた系列における節の位置関係に基づいて、節の特徴ベクトル (分散表現; word embedding) を作成するアルゴリズム。2 層のニューラルネットワークで構成され、自然言語処理において単語の特徴ベクトルを作成するために利用される。入力はテキストのコーパスであり、出力はコーパス内の単語の特徴を表すベクトルの集合である。word2vec は深層ニューラルネットワーク (DNN) ではないが、テキストを DNN が解釈できる数値形式に変換する。

Word2Vec のアルゴリズムは自然言語処理のみならず遺伝子、コード、プレイリスト、ソーシャルグラフ、パターンとして認識可能なその他の言語または記号的系列にも同様に適用することができる。

アルゴリズム

参照

  1. Word2vec (Wikipedia)