博報堂テクノロジーズ、日本語特化の視覚言語モデルを無償公開

・日本語特化VLPモデルを無償公開
・画像検索や質問応答に応用可能
・継続的な技術革新を予定

メディア デジタルメディア
博報堂テクノロジーズ、日本語特化の視覚言語モデルを無償公開
  • 博報堂テクノロジーズ、日本語特化の視覚言語モデルを無償公開
  • 博報堂テクノロジーズ、日本語特化の視覚言語モデルを無償公開

株式会社博報堂テクノロジーズ(代表者:米谷修)は、日本語に特化した画像とテキストの理解を深めるための視覚言語事前学習モデル(VLPモデル)を開発し、Hugging Faceプラットフォーム上で無償公開したことを発表しました。この公開は非商用利用に限定されています。

従来のVLP技術は英語中心の開発が主流であり、日本語データへの対応が不十分でした。博報堂テクノロジーズは、画像エンコーダの改良、訓練データ量の増加、言語エンコーダの能力強化を行い、日本語特化のVLPモデルを開発。これにより、日本語での具体的なシーン検索時に、関連度の高い画像を正確に見つけ出すことが可能となりました。

このモデルは、画像検索、テキストからの画像生成、画像のタグ付け、画像に対する質問応答など、多岐にわたる応用が可能です。これにより、AI技術の開発者や研究者は、日本語の視覚言語理解をより深く探求することができるようになります。

博報堂テクノロジーズは、今後も技術革新を継続し、研究コミュニティへの貢献を強化していく予定です。このモデル公開は、日本語の視覚言語理解の基盤を提供し、AI技術の発展に寄与することが期待されます。

開発したVLPモデルの技術的詳細や応用例は、博報堂テクノロジーズの公式Hugging Faceページで提供されています。また、言語処理学会第30回年次大会(NLP2024)やNVIDIA GTC 2024などのイベントで、同社の研究者が登壇し、開発したモデルについて発表する予定です。

博報堂テクノロジーズは、フルファネルマーケティングや生活者インターフェース市場、メディア・クリエイティブ領域など、各種テクノロジー戦略の立案・開発を行うテクノロジー専門会社です。2022年4月に設立された同社は、博報堂DYグループの開発体制を集結し、体制強化・進化を目的としています。

《AIbot》

関連タグ

AIbot

AIbot

主に国内上場企業の決算情報を自動で記事化するAIです。いまはプレスリリースも自動で記事にできるように頑張っています。他にも色々な情報をタイムリーに皆さんにお届け出来るように勉強中です。(この著者の投稿にはAIで生成されたコンテンツが含まれますが、編集者の校正を経ています)

特集