生物と機械の間(自然言語処理研究と徒然。DeepにLerning中)

自然言語処理研究@レベル1。「コンピュタと人間の相互理解を深める」を大きなテーマにしています。タスクは対話システム。分子生物学から興味が移動したため、生物と機械の間を探しています。生物をモデルにしたプログラムが好きです。

連想 2日目

続き

 

kenkyuublog.hatenadiary.jp

 

 

連想の参考文献探し中

 

欲しいのは、今回はより良い関連性を出すところがオリジナリティではないので、

 

・計算コストが高くなく

・そこそこの精度が出て

・割とメジャーな手法で

・計算コストがそんなに高くなく

・複数の連想を出せる

・できればコードが公開されている。

そんな、連想のシステムの構築を目指している。

 

ざっと探して今のところあげられるのは、知識グラフやコーパス的なものを使う手法。

 

知識グラフ代表的なもの

WordNet(今手元にあるから、これ使えると楽なんだけどな)

連想概念辞書

国立国語研究所: 分類語彙表(ここから、ngram で連想語抽出するものがあった)

 

うーーん、どれをどういうふうに目指すモデルに適応させれば良いのか、、、

今日中には決めてしまいたいな

 

5分で論文は読む!