View on GitHub

memo

Vector space model

Vector Space model

text documentをvectorとして扱う手法。 類似度はcosine類似度ではかるのが一般的。

この類似度を以下で計測する。

\[s(d_{j}, q) := \frac{ <d_{j}, q> }{ \|d_{j} \| \|q \| }\]

Reference