• TOP
  • ブログ
  • 【参加報告】NLP若手の会(YANS)第13回シンポジウム

ホットリンク 公式ブログ

データから見えてくる注目のトピックスをとりあげます。

テック

【参加報告】NLP若手の会(YANS)第13回シンポジウム

R&D部の郡司です。
2018年8月27日〜29日の日程で開催されたNLP若手の会(YANS)第13回シンポジウムに昨年度から引き続き、スポンサーとして参加してきました。
本日のブログ記事はYANSの参加レポートをお送りします。

概要

NLP若手の会は、自然言語処理および関連分野の若手研究者・若手技術者の交流を促進し、若手のアクティビティを高めることを目指したコミュニティです。毎年1回、若手の会主催でシンポジウムが開催されており、始まったばかりの研究について発表・議論する場となっています。今年は香川県高松市で開催されました。

近年では二泊三日の合宿形式を取っており、同じ部屋に宿泊した方々と多岐にわたってお話することができ、大変有意義な時間を過ごさせていただきました。

シンポジウム参加者の研究発表に加えて、招待講演として甲南大学 永田亮先生の英語論文執筆に関するお話と東京大学 牛久祥孝先生の視覚と言語の融合に関する研究のお話がありました。英語論文執筆に関するご講演の質疑応答の中で、英語と日本語ではそもそも情報の構造が違うので、日本語で原稿を書いて英訳するよりも最初から英語で原稿を書いたほうがよいのではないかというやり取りがありましたが、これは個人的な経験とも合致するところがあり、大変参考になりました。

シンポジウムの運営の皆様には大変お世話になりました。この場を借りて御礼申し上げます。

発表内容

弊社からはスポンサー発表として、弊社で提供しているサービスとこれを支える技術の概要、最近の弊社R&D部での取り組み、今後是非共同で取り組みたい研究課題の3つについてお話させていただきました。

最近の弊社の取り組みとしては、Twitterユーザのタイムラインの情報から、様々なタスクにおいて汎用的に利用可能な分散表現を計算する方法についてご紹介しました。計算方法そのものより、SNSドメインにおけるデータセットや言語資源の少なさについて共感をいただく声が企業の方からいくつかあり、リソースの問題は弊社に限った話ではないのだと認識を新たにしました。

今後の課題として、SNSドメインにおけるデータセットの整備に取り組みたいというお話をさせていただきましたが、こちらについても課題感については共感いただけたのではないかと感じています。

発表を聞きに来てくださった皆様、ありがとうございました。

所感

全体のトレンドとして機械翻訳と単語分散表現に関する研究が多かったように思います。

機械翻訳関係の研究発表で特に興味深かったのは翻訳結果の自動評価に関する研究です(RUSE: 文の分散表現を用いた回帰モデルによる機械翻訳の自動評価)。従来の評価指標には問題があることが指摘されてきたものの、同じ評価指標が使われ続けてきたわけですが、これを置き換えるような評価指標を作ることができればより機械翻訳の研究が加速されると思います。また、自動的に生成されたコンテンツのクオリティの自動評価は、正解が1つに定まっているわけではないので分野を問わず難しく、クラウドソーシングを利用した評価などがよく用いられていますが、分野を超えて利用可能な知見が得られることを期待しています。

また、自然言語処理に関する研究発表が中心であるのは当然なのですが、その中でも画像を併用した研究発表がいくつかあり(たとえば、言語・視覚情報の統合による自動論文要約システム)、牛久先生の招待講演と併せてコンピュータビジョンと自然言語処理の両分野にまたがった研究はこれからますます盛んに行われていくのではないかと感じました。弊社で扱っているSNSのデータもテキストのみならず画像や動画などを含んでおりますので、そのような研究から得られた知見を是非活かしていきたいと考えております。

終わりに

今回のイベントでは、特に、SNSドメインにおけるデータセットの整備を取り組みたい共同研究として紹介しました。そのような共同研究に興味がある方はぜひお問い合わせ下さい。

弊社R&D部では、自社のための研究開発を行うだけではなく、学術イベントのスポンサー・大学との共同研究の遂行・研究成果の対外発表/論文誌への投稿など、学術コミュニティへの貢献を積極的に行っています。(ぜひ、研究業績も合わせてご覧ください。)
▼R&D部との共同研究・R&D部での採用/インターンにご興味ある方はお問い合わせください▼