ニフティ、スパムブログの自動判別技術を開発。国内ブログの4割がスパム
スパムブログについては、他ブログやニュース記事、注目されているキーワードの検索結果などの引用を自動的に取得している「引用スパム」、アフィリエイトリンクを大量に自動掲載している「アフィリエイトスパム」、文章をフレーズ単位で機械的に組み合わせて生成している「ワードサラダ」を「自動生成系」と定義。わいせつな内容の「わいせつ記事」、出会い系サイトの運営や入り口となっている「出会い系」、ワンクリック詐欺の運営や誘導を行なっている「ワンクリック詐欺」といった「アダルト系」として定義
分析対象である国内の約9割強に相当するとする4.5億件のブログ記事のうち、2007年10月から2008年2月の各月ごとにそれぞれ約10万記事をサンプリングして行なったもの。2007年10月は39.3%、2007年11月が40.1%、2007年12月が39.7%、2008年1月が39.9%、2008年2月が40.5%という結果となり、5カ月間の平均で約40%のブログがスパムブログであった
・・・思ったより少ない?

コメントする