米国の大手掲示板サイトのRedditは膨大なコンテンツが日々集積されていく場として存在感を高めていて、そうしたコンテンツの存在はAI企業にとっては貴重なデータとなっています。Redditは複数のAI企業とデータライセンシングで契約を締結し、重要な収益源としていますが、これを回避しようとするAI企業もあるようです。
The Vergeが報じたニュースは衝撃的でした。Redditの広報担当者のティム・ラトシュミット氏は「AI企業がプラットフォームポリシーに違反し、Internet ArchiveのWayback MachineからRedditのデータをスクレイピングしている事例を確認した」と説明。RedditとInternet Archiveは大部分のコンテンツのインデックス化を取り止めたそうです。