Wikimedia財団が2024年初頭から、特にWikimedia Commonsに保存された1億4400万点を超える画像、動画などのマルチメディアコンテンツへのアクセス需要が急増していると報告しています。この急増の裏にあるのは、大規模言語モデル(LLM)の学習データ収集を目的としたスクレイピングボットの活動です。
「自動化されたコンテンツへのリクエストは、スクレイピング、API、一括ダウンロードなどのメカニズムを通じて、より広範なテクノロジー経済とともに指数関数的に成長してきました」とWikimedia財団は声明で述べています。