オトバンク、AI音声合成サービス「カタリテ」を開始・・・PKSHA Technologyのアクセント推定技術を初めて実用化

音声配信サービス「audiobook.jp」を運営する株式会社オトバンクが、独自のAI音声合成サービス「カタリテ」を開発したことを発表しました。本サービスは、株式会社PKSHA Technologyが開発した自然な発音を再現するアクセント推定技術「tdmelodic」を採用しています。

AI音声合成サービス「カタリテ」とは、PKSHAの開発した最先端の音声合成技術に、オトバンクの保有するオーディオブック音声データベースを学習させることで実現したAI音声合成サービスです。

近年、音声コンテンツのニーズが加速し、同社が運営する音声配信サービス「adiobook.jp」は2021年6月に会員数が200万人を突破。この加速する音声化のニーズに対応するため、今回、アルゴリズム領域の最先端技術の開発からその応用までをワンストップで行うPKSHAと連携し、オトバンクの膨大な音声データを活用するなど、双方の強みをかけあわせたAI音声合成サービスを開発するに至ったといいます。

PKSHAが開発した音声合成プラットフォーム「PKSHA Phonetics(フォネティクス)」で用いられている独自のアクセント推定技術「tdmelodic」等により、一般的な音声合成ソフトウェアでは難しいアクセントの制御が可能に。さらに、オトバンクのディレクターがチューニングを実施することで、長時間聞いても疲れにくく、より自然で聴き心地のいい音声が実現したといいます。

また、「日経電子版」と連携してカタリテの実証実験も開始され、AIナレーターが日経電子版で配信された速報ニュースの見出しを読み上げることになりました。「聴くも選べる時代へ」をコンセプトに、実証実験の状況に応じて、今後も連携媒体を増やしていく予定とのことです。

オトバンク代表取締役社長の久保田裕也氏は、「今後も「聞き入る文化」の創造を目指し、「音のこだわり」をさまざまな観点から実現できる取り組みに挑戦します」と述べています。

2,773ファンいいね
226フォロワーフォロー
2,425フォロワーフォロー

【10月12日更新】メディアのサブスクリプションを学ぶための記事まとめ

デジタルメディアの生き残りを賭けた戦略の中で世界的に注目を集めているサブスクリプション。月額の有料購読をしてもらい、会員IDを軸に読者との長期的な関係を構築。ウェブのコンテンツだけでなく、ポッドキャストやニュースレター、オンライン/オフラインのイベント事業などメディアの立体的なビジネスモデルをサブスクリプションを中核に組み立てていく流れもあります。

最新ニュース

関連記事