
2008年11月07日
株式会社ホットリンク
エージェントシステム開発の株式会社ホットリンク(本社:東京都千代田区、代表取締役社長:内山幸樹、以下ホットリンク)は、インターネット上で増加しているスパムブログ(スプログともいう)を排除するための高性能スパム排除技術を開発した。特徴は
である。
広告に誘導し、アフィリエイト収入を得る。営利目的などで特定のサイトに誘導する。近年、そういった目的で作成された、ユーザーにとって迷惑なブログ、いわゆるスパムブログがインターネット上で増加し、大きな問題となっている。
総務省情報通信政策研究所の調査によれば、2008年1月の時点で、1か月に1回以上更新されているアクティブのブログのうち約12%がスパムブログだったという。インターネットを快適に利用したいユーザーにとって、スパムブログは非常に目障りな存在であることは間違いない。ブログサイトを運営するブログサービス事業者は、より質の高いサービスを提供するために、スパムブログを排除することは必要不可欠である。
そこで、当社では、膨大な量のブログの中から、スパムブログであるかどうか判定し、これを削除するスパム排除技術の開発に取り組んできたが、このたび、非常に高い精度でスパムブログが排除されていることが判明した。社内で行われた直近の性能テストでは、9割を超えるスパムブログが排除されたという結果が出ている。
スパムブログ排除率(スパムブログを排除した割合) 90・25%
スパムブログ通過率(スパムブログを取りこぼした割合) 9・74%
スパムブログ誤検出率(スパムでないブログをスパムブログと誤って検出した割合) 3・28%
ブログの作成者(ブロガー)自身がスパムかどうかを判定する機能と、作成されたブログの内容(ブログ記事)がスパムかどうかを判定する機能を併せ持っており、その両方の機能を使用することができる。
一口にスパムブログといっても、その内容、形態は多岐に渡っている。そこで、当社では、今回、手法による分類と内容による分類の二通りの方法で、改めてスパムブログを定義した。
a. コピー&ペースト型
他人が書いたブログやSNS、掲示板、Wikipedia、ニュースサイト、メルマガ、RSS、検索結果の内容などをそのままコピーして貼りつけたもの。または、それらを合成して作り上げた文章を載せているもの。
b. ワードサラダ型
話題の人名や商品名と文章を組み合わせて機械的に生成されたもの。
c. テンプレート型
自社で扱う商品、またはアフィリエイト商品等のキーワードを、定型の文章の中に機械的に埋め込んだもの。
d. マルチポスト型
同一の記事を複数のブログに機械的に大量に投稿するもの。
e. 混合型
上記の手法を組み合わせたもの。
a. アダルト・ギャンブル型
閲覧者を不快な気持ちにさせるものや、アダルト、ギャンブル、キャッシングなど、閲覧者に対する高額な利用料請求を目的としている可能性があるもの。ワンクリック詐欺などの詐欺目的のもの。
b. 悪質アフィリエイト型
独自に書いた文章に大量なアフィリエイトリンクを意図的に行っているものや、複数のブログを営利目的で運営しているものなど、一般に個人が運営するブログの量を超えているもの。
今後、このスパムブログ排除エンジンを当社のサービスである「電通バズリサーチ」、「クチコミ@係長」に順次搭載し、サービスを提供していく予定。また、ブログサービス事業者に対しても、スパムブログ排除機能を有料にて提供していく。
ホットリンクは、レコメンデーションエンジンや口コミマーケティングツール「電通バズリサーチ」、「クチコミ@係長」の提供を中心に、クライアント企業のインターネットマーケティング活動を先端技術で支援するエージェントテクノロジーカンパニーです。