株式会社朝日新聞社が、自然言語処理研究(注1)の成果の一つである「自動見出し生成」の機能を体験できるAPI(Application Programming Interface)を、評価用途に限って無償で公開しました。このAPIはウェブページで利用者登録の上、どなたでもご利用・ご評価いただけます。
注1)「自然言語」は、人間が使う言葉の総称で、自然言語処理は人工知能(AI)を支える研究分野の一つ

見出し生成APIとは、記事本文を入力すると、数秒のうちに自動で見出しの候補を出力するものです。過去30年分の朝日新聞記事のデータを活用し、学習データとしての処理効率を上げるためのフィルタリングなどをした上で、ディープラーニング(深層学習)により、記事本文に対する見出しをなるべく正しく出力できるよう事前に学習させています。
主な特徴は、出力する見出しの長さをコントロールし、ユーザーが指示した文字数に合わせて見出しを生成できる点です。これは、記事が掲載されるメディアやデバイスによって、見出しの長さに厳しい文字数制限がある場合が多いため、実用上必要な技術でした。同時に複数の見出しを出力することもできます。
今回のAPIは必ずしも毎回完璧な見出しを出力できるわけではありませんが、公開することによって利用者からの評価や、需要・用途のフィードバックがくることを期待しています。
公開は8月末までを予定。公開したAPIのモデルは評価用のため、現在開発中のものより精度が低くなっています。
朝日新聞社は、自動見出し生成の研究を通じて得られたノウハウをもとに、利用者の要望に応じたAPIのカスタマイズやチューニングも有償で対応していくとのこと。また、研究を通じて得られた成果は、今後も本サイトで継続的に公開していく予定です。