(整理予定)言語処理道一合目

対話システム・言語処理についてぼちぼち頑張るブログ

スライド作成とプロトタイプ作成 2日目

 続き

kenkyuublog.hatenadiary.jp

 

全然進んでいないけれど、とにかく毎日書くことを目標に。

 

送別会などが続き、なかなか時間確保ができない。

そしてプロトタイプはやっぱりデータ問題に行き着く、

自分で対話データのまとめるより、ほかの人でまとめている人いそうだから探そう。

 

とにかく手元にあるのはtwitterとyahoo知恵袋。

データ収集はめちゃめちゃ時間かかるから、常にしてるべきだった、、、

今週の木曜日とかに設定してみよう。

 

でも、作業するCPU毎日見にいけないのつらいな

 

 

 

?疑問  memory network の各セルはなぜAE(オートエンコーダ)の隠れ層だと思ったのか。

 

スライド作成とプロトタイプ作成 1日目

めためたに言われたスライドを直し、またミニマムなデータでプロトタイプを今週中に何がなんでも完成させる、

 

今日中にスライドをざっくり完成させて、火、水でミニマムなデータで一連の流れのプロトタイプを作ってしまいたい。

 

スライドなかなか進まないけど、とりあえず書いてしまいたい

 

自分に「何でも書いていいんだよ」と言い聞かせよう。 校閲作業をしながら書き進めるのはとても難しい。 しょっちゅう、 「それはダメ」 「そんな書き方じゃダメ」 「それは話題が違う」 などと言われながら書けるもんじゃない。

「何でも書いていいんだよ」 「うまい表現だね。もっとうまい表現はあるかな」 「その話題もいいね。一応書いておいてあとで編集すればいいね」

などと自分に言いながら書くのだ。

 引用:結城浩 文章を書く心がけ

連想 五日目

連想四日目の続き。

連想と遺伝的アルゴリズムの参考はなんとなく揃ったので、よし、実装だ!
と思ったが、ちょっと待てよ。と。
そもそも、連想の部分はステップ的には二番目。
システムの処理順で作るべきじゃないの、と。

と、なると、ステップ1からやらなきゃならない。
そして、実装を急いで最初の道すじを忘れないよう
メタメタに言われた(ありがたい)スライドを書き直す必要がある。

でも、スライド作りだと飽きるから月曜からはスライド実装との二本だてで。なんとしても、やる。

誰になんといわれようとミニマムなデータでプロトタイプ今週中につくりたい。
誰になんと言われようと。
こういうの大事。

今日の反省
日曜日は仕事とおなじつもりで研究!がモットーなのにダラダラ作業の極みでいらだち。

色々と、締切りとか周りの目とかのある環境に身をおきたい。けどなかなかなぁ。
とにかく、来年度のNLPにはならかの形でできるようにしたい。
英語も頑張ろう。

連想 4日目

続き

 

kenkyuublog.hatenadiary.jp

 

遺伝的アルゴリズムを利用した、対話文中の話題語の連想語の選択を実行中。

 

 

今日中に、お試しに実装してみようと思ったけどなかなかに難しそう。

 

 

 

夜になってくると睡眠不足がたたって眠たくて集中できない。

でも、今日中にやってしまいたい、、の悪循環。

朝などの大事な時間に重要じゃないことするの本当やめないと何もできないぞ。

(日々の考え事など。)

 

朝の時間帯は脱線しやすいものを目に入れさせない。何か思いついたら、夕方やるよう持ってくる。

 

多分、細かな小さいタスクをやる時間を設ければ、その時間にやればいいやってなるはず。

夕方5時以降は貯めた細かなリストやる時間にする。

それまでは、メモ帳に貯めておく。

 

睡眠は好奇心と集中力のために、大事!!!

もっと効率的にやれる方法身につけろ!

 

明日は遺伝的アルゴリズム、実装してみるぞ〜〜

あとスライド作り!1時間交代!!

連想 3日目

続き

 

kenkyuublog.hatenadiary.jp

 「対話システムにおけるランダム性を考慮した話題展開手法(三上佳孝さん)」

の論文を大筋に、システムの連想部を組み込むことになりそう。

 

遺伝的アルゴリズム、ずっとやってみたかったからそれを使うことになりそうで嬉しい!!

メタヒューリステックなアルゴリズムを偏愛しているから嬉しい!

 

来週までに

◻︎もう一回、文脈(落合式)からモデルの細部までスライドにまとめ直す

◻︎連想部もう少し固める

◻︎オリジナリティはどこかをもう一度考える

 

3月にはモデル決めて、4月に実装するぞ!!!!

 

余談、生活について

この時間に研究するっていうのを絶対守りたい。気が乗らなくても守りたい。

 

 

土日の方が時間あるのに、平日仕事があるときの方が研究が捗るのはなぜだ、、

忙しい。この時間しかやるしかない!って危機感が集中力を上げさせたいるのかも。

やっぱり、この時間までって厳守するの大事ね。

連想 2日目

続き

 

kenkyuublog.hatenadiary.jp

 

 

連想の参考文献探し中

 

欲しいのは、今回はより良い関連性を出すところがオリジナリティではないので、

 

・計算コストが高くなく

・そこそこの精度が出て

・割とメジャーな手法で

・計算コストがそんなに高くなく

・複数の連想を出せる

・できればコードが公開されている。

そんな、連想のシステムの構築を目指している。

 

ざっと探して今のところあげられるのは、知識グラフやコーパス的なものを使う手法。

 

知識グラフ代表的なもの

WordNet(今手元にあるから、これ使えると楽なんだけどな)

連想概念辞書

国立国語研究所: 分類語彙表(ここから、ngram で連想語抽出するものがあった)

 

うーーん、どれをどういうふうに目指すモデルに適応させれば良いのか、、、

今日中には決めてしまいたいな

 

5分で論文は読む!

連想 1日目

人間の連想についてを再現するシステムの参考文献を捜索中。

また、それを再現したシステムを対話システムに組み込みたい。

 

だがしかし、連想のシステムでコード付の論文探せないなぁ。

なかなか海外文献のメジャーどころに辿りつけないl。

 

ものによっては、LDAとかも使わないかもしれない。

でも、やっぱり、memorynetwork作るときは使う気がする。

 

今日、東京に行ってしまわれる今までお世話になっていたTAの先生にお会いしした。

お話していてやっぱりスピード感が大事だな、と思った。

「そんなに時間かかって研究していたら、すぐ一年経っちゃう。その間にみんな解決しちゃうよ」

 

というお言葉が印象的だった。

 

確かに。闇雲にやってもうまくいかないけど、だからと行って作らなくちゃ始まらない。

 

納得のいく理論と、見切りのバランス感覚が難しい。