データの使用 reddit と Google 。現在、関連する開発において、RedditはGoogleと議論して、AIトレーニングのコンテンツ共有契約を修正しました。これは、1年以上前に年間6,000万ドルで設立されました。

両社間の講演は、2つの重要な領域に焦点を当てています( Bloomberg )。まず、報告によると、Redditは、固定支払いから動的な価格設定モデルに移行する新しい取引構造を提案しています。このモデルでは、Redditの補償は、GoogleのAIの概要などのAIプラットフォームによって生成された回答のソースとして、そのコンテンツが引用または使用される頻度によって決定されます。 Redditの幹部は、現在の条件がAI企業に対するデータの価値を適切に反映していないと考えています。

redditは、より多くのトラフィックとユーザーを提供するGoogleとのAI取引を望んでいます

second、 redditは トラフィックを促進する別の種類のパートナーシップを促進します。この取り組みは、現在の関係での課題に対処することを目的としています。GoogleでRedditコンテンツから回答を見つけたユーザーは、多くの場合、プラットフォーム自体にアクセスしません。これにより、Redditがユーザーベースを拡大し、将来のAIトレーニング用に新しいコンテンツを生成する能力が制限されます。ユーザーエンゲージメントを深める方法を見つけることにより、パートナーシップはAIモデルの高品質データのより一貫したソースを提供できます。

RedditのデータはAI企業にとって貴重なリソースであるため、議論が行われています。大規模な言語モデルでは、インターネットから広大なデータセットが削られます。 Redditのユニークな形式は、幅広いトピックに関する詳細なユーザー駆動型の会話を備えたもので、頻繁に引用されるソースです。データは、RedditがPerplexityやGoogle独自のAI概要などのAIツールの最も引用されたドメインであることを示唆しています。

公正な補償を求めている他の出版社やプラットフォーム

この状況はReddit専用ではありません。 News Publishersを含む他のコンテンツプロバイダーは、AIモデルのトレーニングにどのように使用されるかについても取り組んでいます。たとえば、ニューヨークタイムズは、OpenaiとGoogleの両方を訴えました。メディアプラットフォームは、その作業が不適切に使用されたと主張しています。同様のケースでは、RedditはOpenaiのライバル人類も訴えています。この場合、プラットフォームは、AIの起動がモデルを訓練するためにデータを違法に廃棄したと主張しました。 RedditとGoogle Talksの結果はまだ保留中です。ただし、議論は、コンテンツプラットフォームがコンテンツの公正な補償を得るための新しい方法を確立しようとしていることを強調しています。

Categories: IT Info