取引成立後Googleと とOpenAI, Reddit CEOのSteve Huffman氏は、Microsoftなどに対し、サイトのデータのスクレイピングを継続したい場合は料金を支払うよう呼び掛けている。

これらの合意がなければ、私たちはデータがどのように表示され、何に使用されるかについて何の発言権も知識もありません。そのため、私たちは現在、同意していないユーザーをブロックする立場に置かれています。自分たちのデータをどのように使用するか使用しないかを決めるためだ」とハフマン氏は今週のインタビューで語った。同氏は交渉を拒否したマイクロソフト、アンスロピック、パープレクシティの名前を具体的に挙げ、「これらの企業を阻止するのは本当に大変だった」と述べた。

Redditはここ数カ月、クローラーとの戦いを激化させている。7月の初めに、robots.txt ファイルが更新されました契約を結んでいない Web クローラーをブロックします。それから人々は気づき始めたReddit の結果は Google の結果にのみ表示され、Reddit はデータの表示に対して報酬を支払っています。Bing などの他の検索エンジンには表示されませんでした。

ハフマン氏は、MicrosoftはRedditのデータを使って自社のAIをトレーニングし、そのコンテンツをBingの結果に要約することを「私たちに何も言わずに」行っており、またRedditのデータはBing APIを通じて他の検索エンジンにも販売されていると述べた。。インタビューの中で、彼は Microsoft AI CEO ムスタファ・スレイマン氏のカンファレンスでの最近のコメントに言及し、データを公開していると述べました。インターネット上では「フリーウェア」です。

「我々はマイクロソフト、アンスロピック、パープレクシティに対し、あたかもインターネット上のすべてのコンテンツを無料で使用できるかのように振る舞わせた」とハフマン氏は語った。「それが彼らの本当の立場です。」

最近 Reddit の結果が Bing から消えたことに応えて、Microsoft の検索責任者、ジョルディ・リバス氏は次のように述べています。Xで言いました「Reddit は、Bing による自社サイトの検索クロールをブロックし、別の検索エンジンを優先し、Bing および Bing を利用したエンジンとの競争に影響を与えています。」 Microsoft の広報担当者 Caitlin Roulston別途言われたザ・ヴァージ先週「当社は、ページ上のコンテンツを当社の生成 AI モデルで使用することを望まない Web サイトから提供される指示を尊重します。」

「検索エンジンによる従来の価値交換は変わりました」

ハフマン氏は OpenAI を指摘したSearchGPT の最近の発表、今年初めに両社が合意したおかげで、彼が再現したいモデルとしてRedditの結果を表示できるようになります。広報担当者のティム・ラスシュミット氏によると、レディットがこれまでに行ったコンテンツライセンス取引には、そのデータの排他的使用事例は含まれていないという。

Reddit はライセンス契約を呼びかけることで、より伝統的なメディアパブリッシャーに加わる(含むザ・バージズ親会社 Vox Media) は、コンテンツを生成 AI にフィードさせることに対する支払いを求めています。「検索エンジンによる従来の価値交換は変わってきたと思います」とハフマン氏は語った。「検索と要約とトレーニングが融合し、トラフィックバックと引き換えにクローリングするという価値交換が曖昧になりつつあります。」

この記事が公開された後、Anthropic の広報担当者 Jennifer Martinez は次の声明を送りました。「Reddit は 5 月中旬から Web クローリングのブロック リストに載っており、それ以来、Reddit の URL を当社のクローラーに追加していません。」私たちは、Web クローリングをブロックするための業界で認められたシグナルである robots.txt を尊重します。 

Microsoftはこの件についてコメントを控えた。Perplexityはコメントの要請に応じなかった。

コマンドライン

/アレックス・ヒースによるテクノロジー業界の内部会話に関するニュースレター。

7 月 31 日の更新:Anthropic の声明を追加し、Microsoft はコメントを拒否し、Perplexity は返答しなかったことを指摘しました。