JP7373099B2

JP7373099B2 - テキスト生成システム

Info

Publication number: JP7373099B2
Application number: JP2022147442A
Authority: JP
Inventors: 宏幸大曽根
Original assignee: インダストリアル・ドリーム株式会社
Priority date: 2021-04-30
Filing date: 2022-09-15
Publication date: 2023-11-02
Anticipated expiration: 2041-04-30
Also published as: JP2022174244A

Description

特許法第３０条第２項適用以下の各ウェブサイトに掲載、ｈｔｔｐｓ：／／ｗｗｗ．ｙｏｕｔｕｂｅ．ｃｏｍ／ｗａｔｃｈ？ｖ＝Ｇｂｏ９６Ｏｐａｍ６Ｙ（掲載日２０２０年０５月２１日）、ｈｔｔｐｓ：／／ｄｉｇｉｔａｌｎａｔｕｒｅ．ｓｌｉｓ．ｔｓｕｋｕｂａ．ａｃ．ｊｐ／２０２０／０５／ｂｕｎｃｈｏ／（掲載日２０２０年０５月２１日）、ｈｔｔｐｓ：／／ｂｕｎ－ｃｈｏ．ｗｏｒｋ／（掲載日２０２０年０５月２４日）、ｈｔｔｐｓ：／／ｎｏｔｅ．ｃｏｍ／ｓｏｎｅｏ／ｎ／ｎ２３９ｆ４４ｆ７ａ２ｃ０（掲載日２０２０年０５月２４日）、ｈｔｔｐｓ：／／ｎｏｔｅ．ｃｏｍ／ｓｏｎｅｏ／ｎ／ｎ２２ｂ４ｆｂｆ６ｆ８ａ７（掲載日２０２０年０７月２２日）、ｈｔｔｐｓ：／／ｎｏｔｅ．ｃｏｍ／ｓｏｎｅｏ／ｎ／ｎ３ｃ６ｆ０ａ１ａ７９ｂ８（掲載日２０２０年０７月２９日）、ｈｔｔｐｓ：／／ｎｏｔｅ．ｃｏｍ／ｓｏｎｅｏ／ｎ／ｎ７ｂ６８５１９２３ｆ６８（掲載日２０２０年０８月０７日）、ｈｔｔｐｓ：／／ｗｗｗ．ｙｏｕｔｕｂｅ．ｃｏｍ／ｗａｔｃｈ？ｖ＝ｆＤｑｙｒｋ８Ｋｋｘｌ（掲載日２０２０年０９月１１日）、ｈｔｔｐｓ：／／ｎｏｔｅ．ｃｏｍ／ｓｏｎｅｏ／ｎ／ｎ５ｂ５１５ｅ７ｂｅｅａｃ（掲載日２０２０年１２月０６日）

本発明は、テキスト生成システムに関する。

特許文献１には文章を生成する装置が開示されている。

特開２０２０－０９５６１５号公報

しかしながら、創作の多様性を支援することが難しい。

本発明はこのような背景を鑑みてなされたものであり、創作の多様性を支援することのできる技術を提供することを目的とする。

上記課題を解決するための本発明の主たる発明は、テキスト生成システムであって、ジャンル、タイトル、あらすじ及び本文を学習させたテキスト生成器と、ジャンル、キーワードの入力を受け付け、受け付けた前記ジャンル及び前記キーワードを前記テキスト生成器に与えてタイトルを生成するタイトル生成部と、生成した前記タイトルを出力するテキスト出力部と、を備えることを特徴とする。

その他本願が開示する課題やその解決方法については、発明の実施形態の欄及び図面により明らかにされる。

本発明によれば、創作の多様性を支援することができる。

本発明の一実施形態に係るＡＩシステムの全体構成例を示す図である。フロントエンドサーバ２０及びＡＰＩサーバ３０のハードウェア構成例を示す図である。フロントエンドサーバ２０のソフトウェア構成例を示す図である。ＡＰＩサーバ３０のソフトウェア構成例を示す図である。本実施形態のＡＩシステムを用いた小説の執筆の流れを説明する図である。ＡＩシステムの動作を説明する図である。タイトル生成のための執筆画面５１の一例を示す図である。あらすじ生成のための執筆画面５２の一例を示す図である。本文執筆のための執筆画面５３の一例を示す図である。

＜概要＞
以下、本発明の一実施形態に係るＡＩシステムについて説明する。本実施形態のＡＩシステムは、小説の執筆を支援しようとするものであり、小説の作家と人工知能（ＡＩ）とがストーリーを共創することにより、小説作品の多様性を増加させようとしている。本実施形態のＡＩシステムを用いることで、作家はキーワードからタイトルやあらすじ、本文を生成することができ、対話型の作業により楽しみながら執筆を行うことができる。

＜ＡＩ＞
本実施形態にて用いるＡＩ（テキスト生成器）は、日本語のウェブテキスト及びウェブ小説の大規模データセットを用いて学習されたＧＰＴ－２（教師なしマルチタスク言語モデル）である。教師なしマルチタスク学習に基づいた最新の言語モデルの一つであるＧＰＴ－２を用いて、日本語のブログやニュース記事、ウィキペディア（登録商標）から収集した大規模データセット（約４０ＧＢ）を用いて事前学習を行った。次に、小説を生成するＡＩを構築するために、小説投稿サイトから複数のカテゴリの多様なウェブ小説（１１万冊以上）を収集した。収集した小説のテキストには、小説投稿サイトからジャンル、キーワード、あらすじ、本文データが含まれる。また、日本の読者によるクラウドソーシングを活用して、収集したウェブ小説のあらすじから不要な表現（本の出版情報やプラットフォームでのランキングなど）を削除した。

自然言語処理（ＮＬＰ）のアルゴリズムは、質問回答、機械翻訳、文章要約などの複数のタスクで幅広く開発されており、特に、ＥＬＭｏ（言語モデルからの埋め込み）、ＢＥＲＴ、ＧＰＴ－２などのＴｒａｎｓｆｏｒｍｅｒを用いた言語モデルは、急速に応用が進んでいる。Ｔｒａｎｓｆｏｒｍｅｒの成功は、ストーリー生成など自然言語生成（ＮＬＧ）分野にまで拡張されている。そこで本実施形態のＡＩシステムでは、最新のＮＬＧ技術を創造性支援を行うためのインターフェースに応用する。

＜ＡＩＴＲＰＧ＞
さらに、書き手の興味・関心を高め、よりクリエイティブなコンテンツを作るアイデアを引き出すために、小説執筆体験をゲーム感覚にすることで、よりクリエイティブで多様なコンテンツ制作を支援するための共創の選択肢として、ＡＩ支援型ロールプレイングゲーム（ＡＩＴＲＰＧ）を提案する。

ＴＲＰＧとは、Ｗｉｋｉｐｅｄｉａ（登録商標）によると「テーブルトークＲＰＧ、あるいはテーブルトーク・ロールプレイングゲーム（英：Ｔａｂｌｅｔｏｐｒｏｌｅ－ｐｌａｙｉｎｇｇａｍｅ）とは、テーブルゲームのジャンルのひとつ。ゲーム機などのコンピュータを使わずに、紙や鉛筆、サイコロなどの道具を用いて、人間同士の会話とルールブックに記載されたルールに従って遊ぶ“対話型”のロールプレイングゲーム（ＲＰＧ）を指す言葉」とされている。本実施形態のＡＩシステムにおけるのＡＩＴＲＰＧでは、物語の世界観設定と本文に合わせてＡＩが対応する文章の選択肢を提案することで、ユーザーが物語のキャラクターとなって他のキャラクターと対話的に会話をすることでより没入して執筆を行うことができたり、作家自身の引き出しにはないキャラクターの幅を出すことができるようにしている。

＜システム構成＞
図１は、本発明の一実施形態に係るＡＩシステムの全体構成例を示す図である。本実施形態のＡＩシステムは、ＡＰＩサーバ３０及びフロントエンドサーバ２０を含んで構成される。ＡＰＩサーバ３０は、フロントエンドサーバ２０と通信ネットワークを介して通信可能に接続されており、フロントエンドサーバ２０はユーザ端末１０と通信ネットワークを介して通信可能に接続される。通信ネットワークは、たとえばインターネットであり、公衆電話回線網や携帯電話回線網、無線通信路、イーサネット（登録商標）などにより構築される。

ユーザ端末１０は、文章を作成しようとするユーザ（小説の作家）が操作する、例えば、スマートフォンやタブレットコンピュータ、パーソナルコンピュータなどのコンピュータである。ユーザ端末１０ではＷｅｂブラウザが動作し、フロントエンドサーバ２０にアクセスすることができる。

フロントエンドサーバ２０は、ユーザ端末１０とのデータのやりとりを行うコンピュータである。なお、フロントエンドサーバ２０とＡＰＩサーバ３０とを一つの物理的又は仮想的なコンピュータとして実装してもよい。フロントエンドサーバ２０は、Ｗｅｂサーバとして機能し、ユーザ端末１０に対して、ＨＴＭＬにより記載された画面（Ｗｅｂページ）を提供し、小説の創作手続に係るテキストの入出力を行わせることができる。

ＡＰＩサーバ３０は、タイトルやあらすじなどのテキストの生成を行うコンピュータである。ＡＰＩサーバ３０は、フロントエンドサーバ２０を介してユーザから入力されたキーワードを受け付けてタイトル、あらすじ、本文（に追加する文章）を生成することができる。

＜サーバの構成＞
フロントエンドサーバ２０及びＡＰＩサーバ３０は、例えばワークステーションやパーソナルコンピュータのような汎用コンピュータとしてもよいし、あるいはクラウド・コンピューティングによって論理的に実現されてもよい。

図２は、フロントエンドサーバ２０及びＡＰＩサーバ３０のハードウェア構成例を示す図である。なお、図示された構成は一例であり、これ以外の構成を有していてもよい。また、ユーザ端末１０も同様の構成を備えることができる。フロントエンドサーバ２０及びＡＰＩサーバ３０は、ＣＰＵ１０１、メモリ１０２、記憶装置１０３、通信インタフェース１０４、入力装置１０５、出力装置１０６を備える。記憶装置１０３は、各種のデータやプログラムを記憶する、例えばハードディスクドライブやソリッドステートドライブ、フラッシュメモリなどである。通信インタフェース１０４は、通信ネットワークに接続するためのインタフェースであり、例えばイーサネット（登録商標）に接続するためのアダプタ、公衆電話回線網に接続するためのモデム、無線通信を行うための無線通信機、シリアル通信のためのＵＳＢ（Universal Serial Bus）コネクタやＲＳ２３２Ｃコネクタなどである。入力装置１０５は、データを入力する、例えばキーボードやマウス、タッチパネル、ボタン、マイクロフォンなどである。出力装置１０６は、データを出力する、例えばディスプレイやプリンタ、スピーカなどである。

＜フロントエンドサーバ２０＞
図３は、フロントエンドサーバ２０のソフトウェア構成例を示す図である。フロントエンドサーバ２０は、入力処理部２１１、テキスト送信部２１２、表示部２１３を備える。

入力処理部２１１は、ユーザからテキストデータの入力を受け付ける。テキストデータには、制作する小説のジャンル、タイトルに関するキーワード（以下、タイトルキーワードという。）、タイトル、あらすじに関するキーワード（以下、あらすじキーワードという。）、あらすじ、本文がありうる。本実施形態では、ユーザ端末１０から送信されるテキストデータを受信する。後述する表示部２１３により作成された画面データに基づいてユーザ端末１０に表示されたフォームに入力されたテキストデータがユーザ端末１０からフロントエンドサーバ２０に送信させるようにすることができる。

テキスト送信部２１２は、受け付けたテキストデータをＡＰＩサーバ２０に送信する。テキスト送信部２１２は、ＡＰＩサーバ２０が提供するＡＰＩを呼び出す形で、ＡＰＩに与えるパラメータとしてテキストデータを送信することができる。

表示部２１３は、ＡＰＩサーバ３０が生成したテキストデータ（タイトル、あらすじ、本文）を表示する。本実施形態では、表示部２１は、テキストデータをユーザ端末１０に表示させる。表示部２１３は、ＨＴＭＬ、ＣＳＳ及びＪａｖａＳｃｒｉｐｔを用いて画面データを作成し、作成した画面データをユーザ端末１０に送信することによりユーザ端末１０においてテキストデータを表示させる。また、ユーザ端末１０では、これらのテキストデータを画面上で編集できるようにすることができる。

＜ＡＰＩサーバ３０＞
図４は、ＡＰＩサーバ３０のソフトウェア構成例を示す図である。ＡＰＩサーバ３０は、文章生成器３１１、トークナイザー３１２、リクエスト入力部３１３、タイトル生成部３１４、あらすじ生成部３１５、本文生成部３１６、テキスト出力部３１７、短文モデル記憶部３３１、長文モデル記憶部３３２、小説データ記憶部３３３を備える。

小説データ記憶部３３３は、作成した小説に係るす小説データを記憶する。小説データには、作成者のユーザを示すユーザＩＤ、ジャンル、タイトル、あらすじ、本文を含むことができる。

＜モデル＞
短文モデル記憶部３３１及び長文モデル記憶部３３２には、文章生成器３１１が用いる学習モデルが記憶される。短文モデル記憶部３３１には、タイトル及び短い文章を作成するための学習モデルが記憶される。長文モデル記憶部３３２には、あらすじ及び長い文章を作成するための学習モデルが記憶される。学習モデルにはＧＰＴ－２を採用することができる。ＯｐｅｎＡＩのＧＰＴ－２は、翻訳やＱ＆Ａなど複数の文章生成タスクにおいて教師なしか少しの教師データで人間に近い能力を発揮することが述べられている。本実施形態のＡＩシステムにおけるＡＩのモデルにはＧＰＴ－２のパラメータ数１５億のモデルを利用することができる。本実施形態では、事前学習のために、日本語記事（４０ＧＢ）とウェブ小説（１１０ｋ本）の大規模データを用いてＧＰＴ－２を訓練し、継続的に学習したテキスト生成器を想定している。キーワードなどの条件をつけた文章生成のため、単語の同時分布を自己回帰的に学習する言語モデルの特性を利用することができる。学習データは、モデルがあらすじの学習に用いる情報に基づいて、正解のあらすじを生成できるように整理する。このようにして、学習時には要素とあらすじの同時分布をモデル化し、推論時には与えられた要素の条件付き分布からあらすじを生成できる。

文章生成器３１１は、短文モデル又は長文モデルにテキストを与えることにより文章のテキストデータを生成することができる。なお、文章生成器３１１、短文モデル記憶部３３１及び長文モデル３３２に代えて、短文モデルを組み込んだ短文文章生成器と、長文モデルを組み込んだ長文文章生成器とを設けるようにしてもよい。ＧＰＴ－２の学習モデルの入力データフォーマットは次のようなものである。ジャンル、キーワード、タイトル、あらすじ、及び本文テキストを示す特別なトークンを用い、学習モデルに対してタイトルやあらすじが始まることを指示することができる。データはカテゴリ（タイトルキーワード、タイトル、あらすじキーワード、あらすじ）を示すトークンにより連結される。

（入力データのフォーマット）
［ＳＴＡＲＴＯＦＴＥＸＴ］［ＣＡＴＥＧＯＲＹ］ジャンル［ＫＥＹＷＯＲＤ］キーワード１キーワード２ …［ＴＩＴＬＥ］タイトル［ＥＸＴＲＡＣＴＥＤＫＥＹＷＯＲＤ］あらすじキーワード［ＳＹＮＯＰＳＩＳ］あらすじ［ＢＯＤＹＴＥＸＴ］本文

タイトルの生成には、次のデータを入力する。
［ＳＴＡＲＴＯＦＴＥＸＴ］［ＣＡＴＥＧＯＲＹ］ジャンル［ＫＥＹＷＯＲＤ］キーワード１キーワード２ …［ＴＩＴＬＥ］

あらすじの生成には、次のデータを入力する
［ＳＴＡＲＴＯＦＴＥＸＴ］［ＣＡＴＥＧＯＲＹ］ジャンル［ＫＥＹＷＯＲＤ］キーワード１キーワード２ …［ＴＩＴＬＥ］タイトル［ＥＸＴＲＡＣＴＥＤＫＥＹＷＯＲＤ］あらすじキーワード［ＳＹＮＯＰＳＩＳ］

なお、タイトルキーワード（ＫＥＹＷＯＲＤ）は、ユーザが指定したキーワードである。あらすじキーワード（ＥＸＴＲＡＣＴＥＤＫＥＹＷＯＲＤ）は、あらすじからＥｍｂｅｄｒａｎｋにより抽出された単語である。Ｅｍｂｅｄｒａｎｋは、教師データを用いることなく文章中からキーフレーズを抽出するアルゴリズムとして知られている。なお、あらすじキーワードについてもユーザが指定をするようにすることもできる。

トークナイザー３１２は、テキストデータをトークンに分解する。本実施形態では、トークナイザー３１２としてＳｅｎｔｅｎｃｅＰｉｅｃｅを用いた。他のトークナイザーと比較して、データ中の未知語を除去し、トークンサイズを小さくすることができるため、文生成や翻訳などの作業に適しているとされる。トークン数は５００００とし、収集した日本語記事や小説の合計６０ＧＢ以上のデータを用いてのトークナイザー３１２を学習させた。

リクエスト入力部３１３は、ＡＰＩのリクエストを受け付ける。本実施形態では、フロントエンドサーバ２０からのＡＰＩの呼出しはリクエストの送信により行われ、リクエスト入力部３１３は、フロントエンドサーバ２０からのリクエストを受け付ける。リクエストには、タイトルの生成リクエスト、あらすじの生成リクエスト、本文の生成リクエストがありうる。

タイトル生成リクエストには、キーワードが設定される。本実施形態では、タイトル生成リクエストにはジャンルも設定される。

あらすじ生成リクエストには、タイトル及びあらすじキーワードが含まれる。本実施形態では、ジャンル、タイトルキーワードもあらすじ生成リクエストに設定される。

本文生成リクエストには、タイトル、あらすじが設定される。また、作成中の本文も本文生成リクエストに含めることができる。本実施形態では、ジャンル、タイトルキーワード、あらすじキーワードも本文生成リクエストに設定される。

タイトル生成部３１４は、タイトルキーワードを文章生成器３１１に与えてタイトルを生成する。本実施形態では、タイトル生成部３１４は、ジャンル及びキーワードを文章生成器３１１に与える。本実施形態では、タイトル生成部３１４は、［ＳＴＡＲＴＯＦＴＥＸＴ］［ＣＡＴＥＧＯＲＹ］ジャンル［ＫＥＹＷＯＲＤ］キーワード１キーワード２ …［ＴＩＴＬＥ］を文章生成器３１１に与えてタイトルを生成させることができる。本実施形態では、文章生成器３１１は、複数の短文の文章を作成するようにパラメータを設定しておくことができ、タイトル生成部３１４は、複数のタイトルを生成させ、これらをタイトルの候補としてユーザに提示し、タイトルをユーザに選択させることができる。

あらすじ生成部３１５は、タイトル及びあらすじキーワードを文章生成器３１１に与えてあらすじを生成する。本実施形態では、あらすじ生成部３１５は、ジャンル、タイトルキーワード、あらすじキーワード及びタイトルを文章生成器３１１に与える。あらすじ生成部３１５は、［ＳＴＡＲＴＯＦＴＥＸＴ］［ＣＡＴＥＧＯＲＹ］ジャンル［ＫＥＹＷＯＲＤ］キーワード１キーワード２ …［ＴＩＴＬＥ］タイトル［ＥＸＴＲＡＣＴＥＤＫＥＹＷＯＲＤ］あらすじキーワード［ＳＹＮＯＰＳＩＳ］を文章生成器３１１に与えることによりあらすじを生成させることができる。

本文生成部３１６は、タイトル及びあらすじを文章生成器３１１に与えて本文を生成する。執筆途中の本文をさらに与えることにより、本文の続きの文書を生成することができる。本実施形態では、本文生成部３１６は、ジャンル、タイトルキーワード、及びあらすじキーワードも文章生成器３１１に与える。本文生成部３１６は、［ＳＴＡＲＴＯＦＴＥＸＴ］［ＣＡＴＥＧＯＲＹ］ジャンル［ＫＥＹＷＯＲＤ］キーワード１キーワード２ …［ＴＩＴＬＥ］タイトル［ＥＸＴＲＡＣＴＥＤＫＥＹＷＯＲＤ］あらすじキーワード［ＳＹＮＯＰＳＩＳ］あらすじ［ＢＯＤＹＴＥＸＴ］本文（執筆途中の本文がある場合のみ）を文章生成器３１１に与えることにより本文に加える文章を生成させることができる。本実施形態では、文章生成器３１１は、複数の文章を作成するようにパラメータを設定しておくことができ、本文生成部３１６は、複数の文章を生成させ、これらを本文に追加する文章の候補としてユーザに提示し、本文に続ける文章をユーザに選択させることができる。

テキスト出力部３１７は、タイトル生成部３１４、あらすじ生成部３１５、本文生成部３１６が作成したタイトル、あらすじ、本文を出力する。本実施形態では、テキスト出力部３１７は、リクエストに対する応答としてタイトル、あらすじ、本文を出力することができる。

＜執筆の流れ＞
図５は、本実施形態のＡＩシステムを用いた小説の執筆の流れを説明する図である。

ユーザは、ジャンル及びタイトルキーワードを入力し（Ｓ４０１）、ＡＩシステムはジャンル及びタイトルキーワードをテキスト生成器に与えてタイトル候補を生成する（Ｓ４０２）。ユーザは、生成されたタイトル候補の中からタイトルを選択する（Ｓ４０３）。ここでユーザは、タイトル候補を参考にタイトルを自身で作成するようにしてもよい。

次にユーザは、あらすじキーワードを入力し（Ｓ４０４）、ＡＩシステムは、ジャンル、タイトル、及びあらすじキーワード（加えてタイトルキーワードを用いてもよい。）をテキスト生成器に与えてあらすじを生成する（Ｓ４０５）。ここでユーザは生成されたあらすじを編集することもできる。

ＡＩシステムは、ジャンル、タイトル、あらすじ及び本文（加えてタイトルキーワード、あらすじキーワードを用いてもよい。）をテキスト生成器に与えて本文に追加する文章の候補を生成する（Ｓ４０６）。本文は空文字としてもよいし、ユーザが作成した書き出しを設定してもよい。ユーザは、文章の候補から本文に追加するものを選択し、選択した文章を本文に追加する（Ｓ４０７）。ユーザは、文章の候補を参考に、自身で作成した文章を本文に追加することもできる。

執筆を終了するまで（Ｓ４０８：ＮＯ）、ステップＳ４０６からの処理を繰り返す。なお、ステップＳ４０６の前にタイトルやあらすじをユーザが編集してもよい。

以上のようにして、ユーザはＡＩシステムと対話をしながら小説を執筆することができる。

＜システムの動作＞
図６は、ＡＩシステムの動作を説明する図である。

ユーザ端末１０がフロントエンドサーバ２０にアクセスすると、フロントエンドサーバ２０の表示部２１３は、執筆画面を表示するための画面データをユーザ端末１０に送信し（Ｓ４２１）、ユーザ端末１０において執筆画面５１が表示され、執筆画面５１においてユーザはジャンル及びタイトルキーワードを入力する（Ｓ４２２）。また、執筆画面５１にあらすじを入力してもよい。

図７は、タイトル生成のための執筆画面５１の一例を示す図である。執筆画面５１は、ジャンルの入力欄５１１及びサブジャンルの入力欄５１２を備える。入力欄５１１及び５１２には、ジャンル及びサブジャンルをフリーテキストで入力するようにしてもよいし、学習時に学習させてジャンル（及びサブジャンル）の中から選択させるようにしてもよい。入力欄５１１及び５１２に入力されたジャンル及びサブジャンルは、例えば、空白文字で連結してひとつの「ジャンル」を表す文字列とすることができる。執筆画面５１はまた、タイトルキーワードの入力欄５１３を備える。入力欄５１３は複数配置してよい。さらに、執筆画面５１は、あらすじの入力欄５１４を備える。あるすじがある場合には、ユーザは入力欄５１４にあらすじを入力することができる。なお、入力欄５１４には何も入力しなくてもよい。なお、図示しないが、執筆画面５１において、ユーザがＳＮＳやブログなどに投稿したテキストから抽出したキーワードをタイトルキーワードに設定することもできる。この場合、例えばフロントエンドサーバ２０が、ＳＮＳサーバやブログサーバにアクセスして投稿のテキストを取得し、取得した投稿のテキストからキーワードを抽出してユーザ端末１０に送信することができる。

執筆画面５１にてタイトル生成ボタン５１５が押下されると、ユーザ端末１０からジャンル及びタイトルキーワードがフロントエンドサーバ２０に送信される（Ｓ４２３）。あらすじが入力された場合にはジャンル及びタイトルキーワードとともにあらすじがフロントエンドサーバ２０に送信される。

フロントエンドサーバ２０の入力処理部２１１は、ユーザ端末１０から受信したジャンル及びタイトルキーワード（ならびに、存在すればあらすじ）を設定したタイトル生成リクエストをＡＰＩサーバ３０に送信する（Ｓ４２４）。

ＡＰＩサーバ３０では、リクエスト入力部３１３がタイトル生成リクエストを受信すると、タイトル生成部３１４は、タイトル生成リクエストに設定されているジャンル及びタイトルキーワードを文章生成器３１１に与えてタイトルの候補を所定数（１個でもよいし、５個などの任意の個数でもよい。）生成する（Ｓ４２５）。タイトル生成部３１４は、ジャンルとサブジャンルとを空白文字で連結してジャンル（ＣＡＴＥＧＯＲＹ）に与えることができる。また、タイトル生成部３１４は、タイトルキーワードをキーワード（ＫＥＹＷＯＲＤ）として与えることができる。また、タイトル生成リクエストにあらすじが含まれている場合には、トークナイザー３１２があらすじからキーワードを抽出して、タイトルキーワードとともにキーワード（ＫＥＹＷＯＲＤ）に加えることができる。

テキスト出力部３１７は、生成されたタイトル候補をフロントエンドサーバ２０に送信し（Ｓ４２６）、フロントエンドサーバ２０のテキスト送信部２１２は、受信したタイトル候補をユーザ端末１０に送信する（Ｓ４２７）。

ユーザ端末１０においては、執筆画面５１の入力欄５１６にタイトル候補が表示される。執筆画面５１は入力欄５１６を複数備えることができ、フロントエンドサーバ２０から送信されたタイトル候補の全て又は一部を入力欄５１６に選択可能に表示することができる。ユーザは入力欄５１６においてタイトル候補を編集することができる。各入力欄５１６の近傍には、それぞれボタン５１７が配置され、ボタン５１７が押下されると、対応する入力欄５１６に表示されたタイトルが選択されたものとみなされる。ユーザは、ジャンルやタイトルキーワードなどを変更してタイトルの生成を繰り返すこともできる。

執筆画面５１においてタイトルが選択されると（Ｓ４２８）、ユーザ端末１０ではあらすじの執筆画面５２が表示され、あらすじキーワードの入力を受け付けるとともに、必要に応じてジャンル、タイトル、タイトルキーワードの編集を行うことができる（Ｓ４３１）。執筆画面５２は、ステップＳ４２１で受信した画面データに基づいてユーザ端末１０側で遷移するようにしてもよいし、フロントエンドサーバ２０にアクセスして、執筆画面５２用の画面データを取得するようにしてもよい。

図８は、あらすじ生成のための執筆画面５２の一例を示す図である。執筆画面５２は、ジャンル及びサブジャンルの入力欄５２１及び５２２と、あらすじキーワードの入力欄５２３、タイトルキーワードの入力欄５２４、タイトルの入力欄５２５を備える。入力欄５２１、５２２、５２４、５２５には、図７の執筆画面５１で入力したジャンル、サブジャンル、タイトルキーワード及びタイトルが設定される。これらはユーザが編集することもできる。また、入力欄５２３には、ユーザがあらすじキーワードを入力することができる。なお、あらすじキーワードを、例えばＳＮＳやブログなどへの投稿や学習データなどから自動生成するようにしてもよい。

執筆画面５２において、あらすじキーワードが入力され、また必要に応じてジャンル、タイトル、タイトルキーワードなどの編集が行われ、あらすじ生成ボタン５２６が押下されると、ユーザ端末１０からジャンル、タイトルキーワード、タイトル及びあらすじキーワードがフロントエンドサーバ２０に送信される（Ｓ４３１）。フロントエンドサーバ２０の入力処理部２１１は、ユーザ端末１０からジャンル、タイトルキーワード、タイトル及びあらすじキーワードを設定したあらすじ生成リクエストをＡＰＩサーバ３０に送信する（Ｓ４３２）。

ＡＰＩサーバ３０では、リクエスト入力部３１３があらすじ生成リクエストを受信すると、あらすじ生成部３１５は、あらすじ生成リクエストに設定されているジャンル、タイトルキーワード、タイトル及びあらすじキーワードを文章生成器３１１に与えてあらすじを生成する（Ｓ４３３）。あらすじ生成部３１５は、ジャンル及びサブジャンルを空白文字で連結してジャンル（ＣＡＴＥＧＯＲＹ）として文章生成器３１１に与えることができる。また、あらすじ生成部３１５は、複数のタイトルキーワードと、複数のあらすじキーワードとの全てを空白文字で連結して、キーワード（ＫＥＹＷＯＲＤ）として文章生成器３１１に与えることができる。なお、執筆画面５２の入力欄５２８においてユーザがあらすじを入力又は編集した場合に、ユーザ端末１０からフロントエンドサーバ２０を介してＡＰＩサーバ３０に送信されるあらすじ生成リクエストに、入力欄５２８に入力されているあらすじを設定するようにし、あらすじ生成部３１５は、文章生成器３１１にあらすじを与えるようにしてもよい。この場合、文章生成器３１１は、例えば、「［ＳＴＡＲＴＯＦＴＥＸＴ］［ＣＡＴＥＧＯＲＹ］ジャンル［ＫＥＹＷＯＲＤ］キーワード１キーワード２ …［ＴＩＴＬＥ］タイトル［ＥＸＴＲＡＣＴＥＤＫＥＹＷＯＲＤ］あらすじキーワード［ＳＹＮＯＰＳＩＳ］あらすじ」をＧＰＴ－２の学習モデルに与えてあらすじに追記する文章を生成させ、あらすじ生成部３１５は、生成された文章をあらすじに追加するようにしてもよい。また、あらすじ生成リクエストにあらすじが設定された場合に、トークナイザー３１２があらすじからキーワードを抽出して、あらすじ生成部３１５は、抽出されたキーワードを、タイトルキーワード及びあらすじキーワードとともにキーワード（ＫＥＹＷＯＲＤ）に加えるようにしてもよい。

テキスト出力部３１７は、生成されたあらすじをフロントエンドサーバ２０に送信し（Ｓ４３５）、フロントエンドサーバ２０のテキスト送信部２１２は、受信したあらすじをユーザ端末１０に送信する（Ｓ４３６）。

ユーザ端末１０では執筆画面５２においてあらすじの入力欄５２８にフロントエンドサーバ２０から受信したあらすじを表示する。ユーザは入力欄５２８においてあらすじを編集することができる。ユーザはこのあらすじを確認して、必要に応じてジャンル、タイトル、タイトルキーワード、あらすじキーワードを変更して再度あらすじを自動生成することもできる。執筆画面５２において対話型執筆ボタン５２９が押下されると、ユーザ端末３０では、本文の執筆のための執筆画面５３が表示される。執筆画面５３は、ステップＳ４２１で受信した画面データに基づいてユーザ端末１０側で遷移するようにしてもよいし、フロントエンドサーバ２０にアクセスして、執筆画面５３用の画面データを取得するようにしてもよい。

図９は、本文執筆のための執筆画面５３の一例を示す図である。執筆画面５３は、あらすじの入力欄５３１、ジャンルの入力欄５３２、タイトルの入力欄５３３、タイトルキーワードの入力欄５３４、あらすじキーワードの入力欄５３５を備え、これらの入力欄５３１，５３２，５３３，５３４，５３５にはそれぞれ、執筆画面５２で入力されていたあらすじ、ジャンル、タイトル、タイトルキーワード、あらすじキーワードが設定される。なお、入力欄５３２には、例えば、ジャンル及びサブジャンルを空白文字で連結したテキストを設定することができる。入力欄５３４には、例えば、複数のタイトルキーワードを空白文字で連結したテキストを設定することができる。入力欄５３５には、例えば、複数のあらすじキーワードを空白文字で連結したテキストを設定することができる。これらの入力欄のテキストを編集することもできる。

また、執筆画面５３は本文の入力欄５３８を備える。入力欄５３８は空欄であってよい。ユーザは自身で本文を入力欄５３８に入力することもできる。執筆画面５３において、ジャンル、タイトル、タイトルキーワード、あらすじキーワード、及び本文の編集が終わり（Ｓ４４１）、生成ボタン５３６が押下されると、ジャンル、タイトル、タイトルキーワード、あらすじキーワード、及び本文がフロントエンドサーバ２０に送信される（Ｓ４４２）。

フロントエンドサーバ２０の入力処理部２１１は、ユーザ端末１０から受信したジャンル、タイトル、タイトルキーワード、あらすじキーワード、及び本文を設定した本文生成リクエストをＡＰＩサーバ３０に送信する（Ｓ４４３）。

ＡＰＩサーバ３０では、リクエスト入力部３１３が本文生成リクエストを受信すると、本文生成部３１６は、本文生成リクエストに設定されているジャンル、タイトル、タイトルキーワード、あらすじキーワード、及び本文を文章生成器３１１に与えて本文に追加する文章の候補を所定数（１個でもよいし、５個などの任意の個数でもよい。）生成する（Ｓ４４４）。なお、本文生成部３１６は、複数のタイトルキーワードと、複数のあらすじキーワードとを全て空白文字で連結して、キーワード（ＫＥＹＷＯＲＤ）として文章生成器３１１に与えることができる。

テキスト出力部３１７は、生成された文章をフロントエンドサーバ２０に送信し（Ｓ４４５）、フロントエンドサーバ２０のテキスト送信部２１２は、受信した文章をユーザ端末１０に送信する（Ｓ４４６）。ユーザ端末１０では、選択肢の入力欄５３７に、フロントエンドサーバ２０から受信した文章の候補が表示され、ユーザが入力欄５３７に表示された文章を選択すると（Ｓ４４７）、選択された文章が入力欄５３８に入力されている本文に追記されるようにすることができる（Ｓ４４８）。

ステップＳ４４１からＳ４４８までの処理を繰り返すことにより、ユーザはＡＩシステムと対話を行いながら小説の本文を執筆することができる。執筆が終了すると、ユーザ端末１０は、ジャンル、タイトル、あらすじ及び本文をフロントエンドサーバ２０に送信し（Ｓ４５１）、フロントエンドサーバ２０の入力処理部２１１は、ユーザ端末１０から受信したジャンル、タイトル、あらすじ及び本文をＡＰＩサーバ３０に送信する（Ｓ４５２）。ＡＰＩサーバ３０は、ユーザを特定するユーザＩＤに対応付けて、受信したジャンル、タイトル、あらすじ及び本文を小説データ記憶部３３３に登録することができる（Ｓ４５３）。

以上のように、本実施形態のＡＩシステムによれば、タイトルやあらすじの生成方法を多様に提供することで、創作の手間を軽減し、ユーザの発想の幅を広げることができる。また、ゲームのようにインタラクティブに物語を作成できるＡＩＴＲＰＧを活用することで、ユーザーがより楽しんで執筆することができる。

以上、本実施形態について説明したが、上記実施形態は本発明の理解を容易にするためのものであり、本発明を限定して解釈するためのものではない。本発明は、その趣旨を逸脱することなく、変更、改良され得ると共に、本発明にはその等価物も含まれる。

たとえば、本実施形態では、ＡＰＩサーバ３０とフロントエンドサーバ２０とを別体のサーバであるものとしたが、１台の物理的又は仮想的なサーバとして実現することもできる。また、ＡＰＩサーバ３０が備える記憶部をＡＰＩサーバ３０とは異なるデータベースサーバに管理させるようにしてもよい。

また、本実施形態では、本文の作成は、本文に追記する文章を提案するものとしたが、文章の生成時に、地の文と会話の両方を生成するか、会話のみを生成するかをオプションとして設定可能としてもよい。

また、学習モデルに与える各種のパラメータをユーザ端末１０において設定可能としてもよい。この場合、ユーザ端末１０から当該パラメータの設定値がフロントエンドサーバ２０を介してＡＰＩサーバ３０に伝達することができる。

また、あらすじを生成する際に、あらすじキーワードに人名・場所などの固有名詞を指定して生成できるようにしてもよい。

また、あらすじから三幕構成の幕ごとに応じた構成を生成するようにしてもよい。

また、本文に応じて背景画像や立ちキャラ、セリフの声、モーションをＡＩが生成るようにしてもよい。この場合、背景画像は画像にアノテーションしたタグや説明文から、本文とマッチする背景画像を検索し、提示することができる。立ちキャラは本文に書いてあるキャラ名から認識することができる。声はキャラごとに音声合成を行うことができる。モーションはセリフを感情分析し、予め用意した感情と紐付けておいたモーションを当てはめることができる。

＜開示事項＞
なお、本開示には、以下のような構成が含まれる。
［項目１］
ジャンル、タイトル、あらすじ及び本文を学習させたテキスト生成器と、
ジャンル、キーワードの入力を受け付け、受け付けた前記ジャンル及び前記キーワードを前記テキスト生成器に与えてタイトルを生成するタイトル生成部と、
生成した前記タイトルを出力するテキスト出力部と、
を備えることを特徴とするテキスト生成システム。
［項目２］
項目１に記載のテキスト生成システムであって、
ジャンル、キーワード及びタイトルの入力を受け付け、受け付けた前記ジャンル、前記キーワード及び前記タイトルを前記テキスト生成器に与えてあらすじを生成するあらすじ生成部をさらに備え、
前記テキスト出力部は、生成した前記あらすじを出力すること、
を特徴とするテキスト生成システム。
［項目３］
項目１又は２に記載のテキスト生成システムであって、
ジャンル、キーワード、タイトル及びあらすじの入力を受け付け、受け付けた前記ジャンル、前記キーワード、前記タイトル、及び前記あらすじを前記テキスト生成器に与えて本文に加える文章を生成する本文生成部をさらに備え、
前記テキスト出力部は、生成した前記文章を出力すること、
を特徴とするテキスト生成システム。
［項目４］
項目３に記載のテキスト生成システムであって、
前記本文生成部がさらに、ジャンル、キーワード、タイトル、あらすじ及び本文の入力を受け付け、受け付けた前記ジャンル、前記キーワード、前記タイトル、前記あらすじ及び前記本文を前記テキスト生成器に与えて前記本文に加える文章を生成し、
前記テキスト出力部がさらに、生成した前記文章を出力すること、
を特徴とするテキスト生成システム。

２１１入力処理部
２１２テキスト送信部
２１３表示部
３１１文章生成器
３１２トークナイザー
３１３リクエスト入力部
３１４タイトル生成部
３１５あらすじ生成部
３１６本文生成部
３１７テキスト出力部
３３１短文モデル記憶部
３３２長文モデル記憶部
３３３小説データ記憶部

Claims

小説の少なくとも第１のジャンル及び第１の本文を教師なし学習モデルを用いて学習させたテキスト生成器と、
ユーザから第２のジャンル、所望のあらすじ及び第２の本文の入力を受け付け、前記所望のあらすじからキーワードを抽出し、抽出した前記キーワード、第２のジャンル及び前記第２の本文を前記テキスト生成器に与えて前記第２の本文に加える文章を生成する本文生成部と、
生成した前記文章を出力するテキスト出力部と、
を備えることを特徴とするテキスト生成システム。
請求項１に記載のテキスト生成システムであって、
前記本文生成部は、前記ユーザからキーワードをさらに受け付け、前記第２のジャンル、前記第２の本文及び前記キーワードを前記テキスト生成器に与えて前記文章を作成すること、
を特徴とするテキスト生成システム。
請求項１に記載のテキスト生成システムであって、
前記テキスト生成器は、少なくとも前記第１のジャンル、前記第１の本文及び前記小説の第１のあらすじを学習させていること、
を特徴とするテキスト生成システム。
請求項１に記載のテキスト生成システムであって、
前記本文生成部は、複数の前記文章を生成し、
前記テキスト出力部は、前記複数の文章を出力し、
前記ユーザから選択された前記複数の文章のうちの１つが前記本文に追加されること、
を特徴とするテキスト生成システム。
請求項１に記載のテキスト生成システムであって、
前記テキスト生成器は、少なくとも前記第１のジャンル、前記第１の本文及び前記小説の第１のタイトルを学習させており、
前記第２のジャンルを前記テキスト生成器に与えて第２のタイトルを生成するタイトル生成部をさらに備え、
前記テキスト出力部は、生成された前記第２のタイトルを出力すること、
を特徴とするテキスト生成システム。
請求項１に記載のテキスト生成システムであって、
前記テキスト生成器は、少なくとも前記第１のジャンル、前記第１の本文及び前記小説の第１のあらすじを学習させており、
前記第２のジャンルを前記テキスト生成器に与えて第２のあらすじを生成するあらすじ生成部をさらに備え、
前記テキスト出力部は、生成された前記第２のあらすじを出力すること、
を特徴とするテキスト生成システム。