Image by AbsolutVision, from Unsplash
出版社、AIボットのブロックでコンテンツを保護
ニュース出版社は、AIボットに対して引き続き闘っており、テクノロジー企業を訴え、スクレイピングがジャーナリズム、公正な報酬システム、そして開放的なウェブの未来に危険をもたらすと警告しています。
急いでいる方のために、要点をまとめています:
- ChatGPTのようなAIツールは、ニュースサイトへのトラフィックを減らします。
 - Cloudflareは、不正なAIスクレイパーをブロックするためのツールを導入しました。
 - RedditやiFixitは、AnthropicのようなAI企業を訴えたり、ブロックしたりしています。
 
ウォール・ストリート・ジャーナル(WSJ)による新たな報告書では、ニュース出版社が、自社のウェブサイトからコンテンツを無償で収集するAI企業に対抗していることが明らかになりました。ChatGPTやGoogleのGeminiのようなAIツールの成長に伴い、多くのメディア企業が、自社の作品を許可なく使用するボットをブロックしようとしています。
「あなたのサイトを読むのは人間であって、ボットではありません。特に、あなたに何の価値も返さないボットは望ましくありません」と、The AtlanticのCEOであるニコラス・トンプソン氏は述べています。彼の会社はOpenAIとライセンス契約を結んでいますが、他のAI企業をブロックする計画を立てていると、WSJによって報告されています。
この戦術は、「スクレイピング」として知られており、Googleの初期の日々から存在しています。その当時、検索エンジンは出版社のウェブサイトへのトラフィックを促進していました。今では、AIチャットボットがニュースの要約を可能にし、読者が元のソースを訪れるのを阻止するようになりました。ボットによるトラフィックの減少と広告収入の減少の組み合わせは、多くの出版社で共通の問題となっています。
反撃するため、出版社たちはCloudflareのようなテクノロジー企業に頼り、AIボットがコンテンツにアクセスできるかどうかをコントロールするツールを最近立ち上げました。Dotdash MeredithのCEOであるNeil Vogel氏は、同社もOpenAIにコンテンツのライセンスを提供しているが、「知的財産を創造する人々は保護される必要があります。そうでなければ、誰ももう知的財産を作り出すことはないでしょう」とWSJで報じられました。
RedditやiFixitのような企業は法的手段に訴えています。Redditは、AI企業のAnthropicを訴えました。これは、停止の要請にも関わらず、100,000回以上もスクレイピングしたためです。iFixitは、Anthropicが1日でそのサーバーに100万回もアクセスしたと述べています。
訴訟でも争いは続いています。ニューヨークタイムズはマイクロソフトとOpenAIを訴えていますし、ニューズコープとその子会社はPerplexityに対して訴訟を起こしています。またBBCも法的措置を脅かしています、AIスタートアップのPerplexityを、そのデフォルトモデルの訓練のために自社のコンテンツをスクレイピングしたとして告発しています。
一方で、WSJによれば、より厳格な反スクレイピングルールが、学術研究のような正当な利用を阻む可能性があると、一部で心配されています。
データプロビナンス・イニシアチブのシェイン・ロングプレが警告したように、「ウェブは最高入札者に分割されています。これは市場集中とオープン性にとって非常に悪いことです」と、WSJが報じました。