日本経済新聞と国語研、日経記事を元にした日本語の書き言葉コーパスを公開

日本経済新聞社は、大学共同利用機関法人人間文化研究機構国立国語研究所(国語研)と共同で、「日本経済新聞記事オープンコーパス」を開発し、公開しました。

「日本経済新聞記事オープンコーパス」は、2013年1~2月の日本経済新聞 朝夕刊から約100本の記事を選択し、それを元にした日本語の書き言葉コーパスです。日本経済新聞社が記事データを提供し、国語に関する総合的研究機関である国語研がコーパスを開発しました。

コーパスとは、文章をセンテンスごと(一文)に分けたものを構造化し、言語情報(品詞など)を付与した言語資源です。人工知能(AI)が日本語を理解するための学習データに使われるなどしています。

「日本経済新聞記事オープンコーパス」は、コーパスデータとその元となる記事データをセットで公開。研究用途に限り無償で利用することができます。なお、ダウンロードは、日本経済新聞記事オープンコーパスダウンロードサイトからすることができます。

2,779ファンいいね
226フォロワーフォロー
2,470フォロワーフォロー

【12月6日更新】メディアのサブスクリプションを学ぶための記事まとめ

デジタルメディアの生き残りを賭けた戦略の中で世界的に注目を集めているサブスクリプション。月額の有料購読をしてもらい、会員IDを軸に読者との長期的な関係を構築。ウェブのコンテンツだけでなく、ポッドキャストやニュースレター、オンライン/オフラインのイベント事業などメディアの立体的なビジネスモデルをサブスクリプションを中核に組み立てていく流れもあります。

最新ニュース

オプト、広告クリエイティブの制作にChatGPTと効果予測AIを活用 広告業界初

株式会社オプトは、広告業界初の取り組みとなる、O...

2月TVCM放送回数ランキング 体調不良を予防する商品のCMが増加

SMN株式会社のグループ会社である株式会社ゼータ...

黒人テックコミュニティを支援するメディア「The Plug」が活動終了、新たな道へ

米国で黒人のテックコミュニティの支援を行ってきた...

関連記事