• TOP
  • ブログ
  • 【概要ご紹介】特選論文にも選出された共著論文「バースト現象におけるトピック分析」前編

ホットリンク 公式ブログ

データから見えてくる注目のトピックスをとりあげます。

テック

【概要ご紹介】特選論文にも選出された共著論文「バースト現象におけるトピック分析」前編

開発本部研究開発グループR&Dチーム マネージャーのです。

早速ですが、自慢話です。当社と東京大学 鳥海先生との共著論文「バースト現象におけるトピック分析」が、情報処理学会の論文誌の特集号「ネットワーク科学」に採択されました。さらに、本年度の特選論文にも選出していただきました。

▼情報処理学会 論文誌 特選論文▼
http://www.ipsj.or.jp/award/ssp_award.html

今回は、こちらの論文の概要について、前後編に分けて簡単にご紹介したいと思います(詳細は論文をご精読ください)。

 

「バースト現象におけるトピック分析」そのアプローチ方法とは

この論文は、いわゆるソーシャルメディア上のバースト現象(ある話題について短時間に大量の投稿が行われること)が起きた際に、その話題がどのように拡散されたかを定量的に俯瞰する技術を提案しています。もう少し具体的に言うと「その話題をいくつかのトピックに分割し、それらがどのようにユーザに拡散されたか?」を整理して可視化する手法を提案しています。ここでは、特にTwitterのリツイートを分析対象とします。

提案手法では、2つの軸でバースト現象を整理します。一つ目の軸は投稿の類似性、二つ目の軸はユーザの類似性です。一つ目の軸では、投稿の類似性に基づいて、バーストに含まれる全投稿をいくつかのグループに分類し、それぞれのグループを一つのトピックとみなします。二つ目の軸では、ユーザの類似性に基づいて、バーストに関わった全ユーザをいくつかのコミュニティに分類します(詳細なアプローチは論文をご参照ください)。

 

「御嶽山の噴火」バースト事例にみる話題の拡散を可視化する方法

論文で用いたバースト事例の一つは御嶽山の噴火です。2014年9月に発生した御嶽山の噴火に関するバースト現象であり、約100万のツイートが含まれています。このデータに提案手法を適用し、各投稿をトピックに分類し、各投稿ユーザをコミュニティに分類しました。実際に、御嶽山噴火におけるバースト現象の事例について、抽出したトピックのうち、リツイート数が多い上位10トピックを表に提示します。

表より、御嶽山の噴火について、様々な話題が拡散されたことがわかります。

次に、これらの個々のトピックについて、ユーザコミュニティの分布からトピックのエントロピを算出します。エントロピとは一般的には「乱雑さ」を表す指標です。ここでは、「各トピックが多くのコミュニティに拡散したか」を表す指標として用います。つまり、あるトピックのエントロピが高ければ高いほど、そのトピックは多くのコミュニティに拡散されていた(乱雑であった)ことになります。逆にあるトピックのエントロピが低ければ低いほど、そのトピックは少数のコミュニティに偏って拡散されていたことになります。

 

では、御嶽山の噴火の事例について、各トピックのエントロピを下記に示します。

グラフよりT10のみエントロピが極端に低いことが見て取れます。トピック10を見てみますと、御嶽山の噴火に関するオカルト的な話題(UFOの出現や誰かによる噴火予知)が含まれるトピックでした。つまり、オカルト的な話題は、Twitter上でも限られた範囲にしか拡散されなかったことがわかります。

 

以上、「御嶽山の噴火」バースト現象を例に、話題がどのように拡散されたかを可視化する分析手法のご紹介でした。後半では、もう一つのバースト事例をご紹介したいと思います。明日のブログもお楽しみに!

 

▼最近さんが執筆したテックブログ

「AKB48の計算社会科学」イベントレポート前編 ~やっぱり現役アイドルはすごかった、そのプレゼン力に完敗~

「AKB48の計算社会科学」イベントレポート後編 ~アイドルがファンを獲得するにはソーシャルメディア上でどう振る舞うべき?~

Twitterデータから測る幸福度について ~幸福について考えるのは〇曜日、実際に幸福を感じるのは〇曜日~