素晴らしきブロガーとの出会い

概要


卒研の概要提出まであと一週間を切っているが、ここ最近、自分の研究で思うような結果が出せずに、卒研の方向性を見失っていた。

今日も朝まで作業をしていたが、眠くなって力尽きベッドへ。しかし「このままじゃ卒業できないのではないか?」という不安に押しつぶされそうになり、寝れず・・・Google先生に「卒業研究 失敗」と尋ねたところ、いくつかのサイトへ導いてもらった。卒業研究 失敗 - Google 検索

導かれたサイトを読んでいく中で、大学の助教である id:next49 さんのはてなブログ 発声練習 に往きついた。卒研生や修士に対しての記事がとても多く、指導者としての立場とご自身の経験から id:next49 さんが思う研究の進め方や注意点を唱えていて、眠気も吹き飛ぶほど夢中になってエントリーを読んでしまった。

今回は、エントリー等を読んで身にしみたことなどを書くことで自分の気持ちを整理する、これからの自分の卒業研究の方針などを明確にするという目的で書いている。

続きを読む

クラスタリングとクラス分類って違うらしい

概要

卒業研究の題目について担当の先生に相談した際にハッと気付かされた。

題目を「評価要因に着目した評価情報分類」で考えています。と切り出し研究の内容について紹介した。

レビュー集合を用意(Amazon.co.jp, kakaku.com)
 ↓
レビュー文から評価表現辞書を用いた評価要因を抽出するパターンを考案・実装・適用
 ↓
評価要因の抽出
 ↓
抽出した結果をtf-idf法を用いてベクトル化し、レビュー集合をクラスタリング
 ↓
レビュー集合を直接クラスタリングしたものと比較
 ↓
今回の提案手法を用いると、評価軸ごとにレビュー集合を分類できることを検証する

という内容で相談メールを送信したところ、先生から返答をしてもらった、以下が先生の返答の一部の抜粋。

「分類」と「クラスタリング」のどっち?
「評判情報分類」で終わってよいのか?

衝撃的だった。えっ!?分類とクラスリングって意味違うの???一瞬混乱した。意味の違いがわからなかったので、調べてみることにした。その際のメモ。

続きを読む

読んだ論文リスト

論文は、今まで読んできたが、読んだ知識を保存したほうが賢いと思ったのでメモすることに。2010/12月〜のリスト


因果関係に着目した口コミWebサイトからの評判表現抽出 高橋敦子 等
http://www.jstage.jst.go.jp/article/tjsai/24/3/322/_pdf/-char/ja/
テキストマイニングによる評価表現の収集 小林のぞみ 等
http://www.syncha.org/papers/signl154.pdf
意見情報の抽出/構造化のタスク仕様に関する考察 小林のぞみ 等
http://www.syncha.org/papers/signl171.pdf

卒業研究メモ - 自然言語処理系

2011/10/9 追記

思い返すと、当時の自分はかなり視野が狭い・無知だったと(今でも十分に無知だが)感じている。
このようなメモを晒していたことを恥んでいるが、これも思い出として削除しないで残しておくことに。
研究関連の話もこのブログにまとめようと思う。いつか。気が向いたら。


論文

コーパス

知識系

NLPの研究が盛んな研究機関

私がWEBから、この研究室(人物・研究機関)盛んやな〜と主観で感じたらメモることに。
順不同。特に意味はないです。

山下達雄
http://nais.to/~yto/
乾 孝司
http://www.mibel.cs.tsukuba.ac.jp/~inui/
小林 のぞみ
http://www.syncha.org/
金山博
http://www.trl.ibm.com/people/kanayama/index_j.htm
健太郎
http://www.cl.ecei.tohoku.ac.jp/~inui/index-j.html

東京工業大学 奥村研究室
http://www.lr.pi.titech.ac.jp/
京都大学 黒橋・河原研究室
http://nlp.ist.i.kyoto-u.ac.jp/