Visual Bank株式会社は11月28日、東洋経済新報社とデータパートナーシップ契約を締結したと発表しました。この提携により、東洋経済新報社が保有する記事やグラフなどの大規模データを、Visual Bankが提供するAI学習用データセット開発サービス「Qlean Dataset」を通じて販売開始します。
近年、AI技術の進化が著しく、特に2022年以降は生成AIやマルチモーダルAIの技術革新が注目を集めています。こうした中、AI開発には良質で信頼性の高い学習用データセットが不可欠となっています。しかし、日本においては信頼性の高いテキストデータを大量に入手する手段が限られており、日本語の独自LLM(大規模言語モデル)開発にはデータの質と量がボトルネックとなっていました。
今回の提携では、東洋経済新報社が保有する「東洋経済オンライン」「会社四季報オンライン」「週刊東洋経済」などの記事、グラフ、表のデータを、AI開発企業や研究機関向けに提供します。対象となるデータは過去20年以上にわたる膨大な量で、各業界の専門記者が執筆してきた良質な日本語データが含まれています。
Visual Bankの代表取締役CEOである永井真之氏は「東洋経済新報社様との今回のデータパートナーシップ契約により、貴重な素材をAI開発現場に届けることで、新たなテクノロジーやユースケースが創出される一助になることを目指します」とコメントしています。
一方、東洋経済新報社の取締役である廣田充彦氏は「AI規制が進むなかで、法的に問題がないことが明らかな学習用データを提供している『Qlean Dataset』の存在が重要性を増しており、その充実に微力ながら貢献して参ります」と述べています。
本提携によって提供されるデータセットは、LLM、生成AI、マルチモーダルAIの学習用途に使用可能で、経済領域での特化型LLM開発やファインチューニング、IR資料や決算資料に関連するマルチモーダルAIの開発などが想定されています。
日本のAI開発現場では、高品質な日本語コーパスの必要性が高まっています。今回の提携は、信頼性の高い大規模データを適切な権利処理のもとでAI学習用に提供することで、日本のAI開発の加速と発展に貢献することが期待されます。