• TOP
  • ブログ
  • 【参加報告】第11回テキストアナリティクス・シンポジウム

ホットリンク 公式ブログ

データから見えてくる注目のトピックスをとりあげます。

テック

【参加報告】第11回テキストアナリティクス・シンポジウム

こんにちは。R&D部のです。

今回は、タイトルの通りシンポジウムに参加した際の報告をお届けします。
9月7~8日に、成蹊大学で「第11回テキストアナリティクス・シンポジウム(以下、TASympo11th)」というイベントが開催されました。

私は言語理解とコミュニケーション研究会(以下、NLC)の副委員長として、本イベントの開催・運営に携わりました。ただし、本記事では一参加者として、イベントの内容およびその所感をご紹介したいと思います。

なお、NLCでは、自然言語処理研究会(NL研)とともに12月20日(水)、21日(木)に「第4回自然言語シンポジウム」を早稲田大学で開催します。発表の応募締め切りは1019日(木)※までですので、ご興味がある方はぜひご応募ください。

※タイトルと400字程度の概要で応募可能です。その後、11月に論文を投稿していただく形となります。

概要

テキストアナリティクス・シンポジウムは、学術・産業の双方を対象としたイベントです。テキストアナリティクス(以下、TA)について、技術を作る側・使う側の両者が集い、新たな技術を活用するアイデアや、ニーズに即した研究内容を発見する場の創出を目指しています。

2011年から毎年開催されており、現在は夏季に東京で、冬季に関西で、年に2回開催しており、毎回学術側、企業側からの多くの参加者が集まっています。今までの開催内容はこちらをご覧ください。

TASympo11thでは、一般発表に加え、国際会議参加者からの国際会議報告、現在勢いのあるIT企業4社による講演とパネルディスカッションで構成される特別企画を行いました。2日間で述べ200名以上の参加者が来場しました。研究会の規模としては、十分成功と言えるでしょう。

※英語圏では「text mining」という言葉が一段落し、近年は「text analytics」と呼ばれるようになってきたため、今年より名称を「テキストアナリティクス・シンポジウム」改めました。

所感

TMSympo11thに参加した立場として、所感を述べたいと思います。

●一般発表について

今回は、14件の一般発表がありましたが、これらを通じて、
・多様な領域でテキストアナリティクスを活用する試みられるようになってきた
・やはりテキストアナリティクスの領域においても深層学習を用いた手法が浸透しつつある
ということが感じられました。

1点目について、分析対象の観点から見ると、ニュース記事や地方議会の議事録、転職サイトのアンケートから、病院の診療記録や性犯罪記録に至るまで、かなり幅広い領域のテキストが解析対象となっていました。
2点目について、手法の観点から見ると、文の自動生成や評判分析、ユーザ属性の抽出から汎用的なテキスト基盤の構築まで、こちらも様々な課題が扱われていましたが、総じてDeep Learning手法が増加してきたのが印象的でした。

●国際会議報告について

テキストアナリティクス・シンポジウムでは、毎回、トップレベルの国際会議に参加した方から、そこでの雰囲気や研究のトレンドを発表していただく企画を開催しています。
今回は、ACLという自然言語処理のトップカンファレンス、SIGIR(なんと東京開催でした)という情報検索のトップカンファレンスについて発表していただきました。個別の発表については、NLCのWebサイトに発表資料が公開されているのでご参照ください。

全体を通して見えてきたことは、下記の2点です。
・Deep Learningの隆盛
・中国の存在感の増加

1点目について、ACL/SIGIRともにDeep Learningを用いた研究が多数あり、またその実用化に関する発表もありました。一般発表のセッションと同様ですが、自然言語処理におけるDeep Learning活用も実用化段階まできたことが感じられました。
2点目について、自然言語処理に限らずですが、中国の存在感は情報処理の分野でますますましており、米中が2強の様相を呈してきました。日本ももっとこの分野を盛り上げていかねばならないと考えています。

企画発表について

今回は、「ウェブサービスにおけるテキストアナリティクス」というタイトルで、テキストアナリティクスを実ビジネスに活用している4企業から講演をいただき、さらにTAをテーマにディスカッションしていただきました。

発表をしてくださった新進気鋭の企業は以下の4社です。

・不満を買い取るサービス「不満買取センター」を運営するInsight Tech
・ニュース配信サービス「グノシー」を運営するGunosy
・名刺管理サービス「eight」を運営するSansan
・フリマアプリ「メルカリ」を運営するメルカリ

各社の個別の話に触れるスペースはないですが、4社の講演とパネルディスカッションを通じて印象的だった内容は「ただテキスト(データ)があるだけでは有効に活用できない」ということでした。

 ・予めテキストを活用する目的を定めて、メンバーで共有し、

 ・その目的にあわせてデータを分析しやすい形で蓄積し、

 ・高速に試行錯誤を繰り返すことができる環境を構築する

ということが、テキストアナリティクスを実ビジネスに活用する上で、重要であるというお話でした。
自分も含め、学術出身だとどうしても手法の精度ばかり目が行きがちですので、非常に良いお話だったと思います。

全体を通して

産業界においては、テキストアナリティクスが多様な領域に浸透しつつあり、また実際にビジネスに活用してテキストデータを価値化している事例が増えており、今後ますますテキストアナリティクスという分野は成長していくことでしょう。

一方、学術界においては、Deep Learningの隆盛もあいまって、次々と新たな手法が提案され、今までは実現困難であった様々なタスクの精度も向上しています。
そのような現状において、産業界と学術界はより密に情報を共有・交換することで、最先端の手法のスピーディー実用化や必要性の高い手法の開発などが実現できるかもしれません。

NLCおよびテキストアナリティクス・シンポジウムはそのような場を醸成することを目指していきますので、ご興味のある方はぜひご参加ください。

おわりに

弊社R&D部では、自社のための研究開発を行うだけではなく、学術イベントの開催への協力・学術イベントのスポンサー・大学との共同研究の遂行・研究成果の対外発表/論文誌への投稿など、学術コミュニティへの貢献を積極的に行っています。(ぜひ、研究業績も合わせてご覧ください。)

▼R&D部との共同研究・R&D部での採用/インターンにご興味ある方はお問い合わせください▼
 問い合わせ先:recruit@hottolink.co.jp