WO2023032100A1

WO2023032100A1 - 文書作成支援装置、文書作成支援方法、及びプログラム

Info

Publication number: WO2023032100A1
Application number: PCT/JP2021/032194
Authority: WO
Inventors: 章竹内; 正浩外間; 美永子原
Original assignee: 日本電信電話株式会社
Priority date: 2021-09-01
Filing date: 2021-09-01
Publication date: 2023-03-09
Also published as: JPWO2023032100A1

Abstract

近年、文書分類、翻訳や要約、Ｑ＆Ａのようなタスクに対しては高い性能が得られるようになったものの、文章を創造するという点においては、ＡＩだけでは不十分であり、ＡＩが人を支援することの必要性が高いということができる。本発明は、人の発想を支援して新たな文章を作成することで、文書の作成を支援することを目的とする。　本発明は、文書の作成を支援する文書作成支援装置であって、文書のデータを形態素解析して当該文書を単語に分割する形態素解析部（１２）と、この分割された単語のうち、所定の単語に対してマスクを行うことでマスク単語を設定するマスク単語設定部（１３）と、学習済みの自然言語処理モデル（２）を用い、マスク単語に基づいて、単語の候補及び文脈を考慮した尤度を探索し、この尤度に応じてマスク単語の代替え候補を決定することで、文書の候補を完成させる単語探索部（１４）とを有する。

Description

文書作成支援装置、文書作成支援方法、及びプログラム

　本開示内容は、文書作成支援装置、文書作成支援方法、及びプログラムに関する。

　人を支援する分野においては、近年、人工知能（ＡＩ）や機械学習の手法が注目されている。例えば、特許文献１に開示された技術は、人が作成する解決したい課題を表す文書の作成を支援する。

　一方、文書をコンピュータで機械的に処理するため、ニューラルネットワークを用いて単語を埋め込みベクトルとして表現する手法（例えばWord2vec）がある。さらに、文脈を考慮した言語モデルとして、例えばBidirectional Encoder Representations from Transformers（BERT）があり、大量のテキストデータを用いて汎用的な事前学習済み言語モデルを獲得し、様々な自然言語タスクにファインチューニングして高い性能が得られるようになった。

特開２０２０－０４２６９５号公報

　しかしながら、文書分類、翻訳や要約、Ｑ＆Ａのようなタスクに対しては高い性能が得られるようになったものの、文章を創造するという点においては、ＡＩだけでは不十分であり、ＡＩが人を支援することの必要性が高いということができる。

　本発明は、上記の点に鑑みてなされたものであって、人の発想を支援して新たな文章を作成することで、文書の作成を支援することを目的とする。

　上記課題を解決するため、請求項１に係る発明は、文書の作成を支援する文書作成支援装置であって、前記文書のデータを形態素解析して当該文書を単語に分割する形態素解析手段と、前記分割された単語のうち、所定の単語に対してマスクを行うことでマスク単語を設定するマスク単語設定手段と、学習済みの自然言語処理モデルを用い、前記マスク単語に基づいて、単語の候補及び文脈を考慮した尤度を探索し、当該尤度に応じて前記マスク単語の代替え候補を決定することで、前記文書の候補を完成させる単語探索手段と、を有することを特徴とする文書作成支援装置である。

　以上説明したように本発明によれば、文書作成支援装置１が、入力した文書の単語の代替え候補を決定することによって、人の発想を支援して新たな文書を作成することで、文書の作成を支援することができる。

本実施形態の文書作成支援装置の電気的なハードウェア構成図である。本実施形態の文書作成支援装置の機能ブロック図である。文書の作成を支援する処理を示すフローチャートである。入力された文書の一例を示す図である。マスク単語が設定された単語シーケンスの一例を示す図である。文書の候補の一例を示す図である。

　以下、図面に基づいて本発明の実施形態を説明する。本実施形態では、人の発想を支援して新たな文章を作成することで、文書の作成を支援する文書作成支援装置について説明する。

　〔文書作成支援装置のハードウェア構成〕
　次に、図１を用いて、文書作成支援装置１の電気的なハードウェア構成を説明する。図１は、本実施形態の文書作成支援装置の電気的なハードウェア構成図である。

　　文書作成支援装置１は、ＰＣ（パーソナルコンピュータ）として、図１に示されているように、ＣＰＵ(Central Processing Unit)１０１、ＲＯＭ(Read Only Memory)１０２、ＲＡＭ(Random Access Memory)１０３、ＳＳＤ(Solid State Drive)１０４、ディスプレイ１０５、キーボード１０６、外部機器Ｉ／Ｆ１０７、ネットワークＩ／Ｆ１０８、メディアＩ／Ｆ１０９、及びバスライン１１０を備えている。

　これらのうち、ＣＰＵ１０１は、文書作成支援装置１全体の動作を制御する。ＲＯＭ１０２は、ＩＰＬ(Initial Program Loader)等のＣＰＵ１０１の駆動に用いられるプログラムを記憶する。ＲＡＭ１０３は、ＣＰＵ１０１のワークエリアとして使用される。

　ＳＳＤ１０４は、ＣＰＵ１０１の制御にしたがって、文書作成支援装置１のプログラム等の各種データの読み出し又は書き込みを行う記憶装置である。なお、ＳＳＤではなく、ＨＤＤ(Hard Disk Drive)等の記憶装置であってもよい。

　ディスプレイ１０５は、文字や画像等を表示する液晶や有機ＥＬ(Electro Luminescence)などの表示手段の一種である。

　キーボード１０６は、文字、数値、各種指示などの入力のための複数のキーを備えた入力手段の一種である。

　外部機器Ｉ／Ｆ１０７は、各種の外部機器を接続するためのインターフェースである。この場合の外部機器は、表示手段の一例としての外付けのディスプレイ、入力手段の一例としてのマウス、外付けのキーボード、又はマイク、及び出力手段の一例としてのプリンタ又はスピーカ、記憶手段の一例としてのＵＳＢ(Universal Serial Bus)メモリ等である。

　ネットワークＩ／Ｆ１０８は、インターネットを介して、他の評価装置とデータ等を送受信するための回路である。

　メディアＩ／Ｆ１０９は、フラッシュメモリ等の記録メディア１０９ｍに対するデータの読み出し又は書き込み（記憶）を制御する。記録メディア１０９ｍには、ＤＶＤ(Digital Versatile Disc)やＢｌｕ-ｒａｙＤｉｓｃ（登録商標）等も含まれる。

　バスライン１１０は、図１に示されているＣＰＵ１０１等の各構成要素を電気的に接続するためのアドレスバスやデータバス等である。

　〔文書作成支援装置の機能構成〕
　続いて、図２を用いて、文書作成支援装置１の機能構成について説明する。図２は、本実施形態の文書作成支援装置の機能ブロック図である。図２に示されているように、文書作成支援装置１は、記憶部１０を有する。記憶部１０は、図１のＲＡＭ１０３又はＳＳＤ１０４によって実現される。

　また、文書作成支援装置１は、文書入力部１１、形態素解析部１２、マスク単語設定部１３、単語探索部１４、及び文書出力部１５を有する。これら各部は、プログラムに基づき図１のＣＰＵ１０１による命令によって実現される機能である。

　これらのうち、文書入力部１１は、ユーザ等から、所定の文書のデータの入力を受け付ける。

　形態素解析部１２は、文書入力部１１によって入力された文書のデータを形態素解析して当該文書を単語に分割する。

　マスク単語設定部１３は、形態素解析部１２によって分割された単語のうち、所定の単語に対してマスクを行うことでマスク単語を設定することで、単語シーケンスを作成する。

　単語探索部１４は、学習済みの自然言語処理モデルを用い、マスク単語設定部１３によって設定されたマスク単語（単語シーケンス）に基づいて、単語の候補及び（単語の前後の）文脈を考慮した尤度を探索し、この尤度に応じてマスク単語の代替え候補を決定することで、文書の候補を完成させる。また、単語探索部１４は、尤度に比例した確率で代替え候補を決定する、又は尤度の高い単語を所定数選択し当該選択した単語の中からランダムに前記代替え候補を決定する。更に、単語探索部１４は、複数のマスク単語に対して、一単語ずつ代替え候補を決定する。なお、学習済みの自然言語処理モデルは、ニューラルネットワークによる公知の機械学習アルゴリズムを用いた機械学習を行い、ここでは、入力された文書の内容の分野に適したモデルが用いられる。

　文書出力部１５は、単語探索部１４によって完成された文書の候補を評価指標に基づいてソートして出力する。出力の種類は、図１のディスプレイ１０５に表示する表示出力、図１の外部機器Ｉ／Ｆ１０７を介して外部装置であるプリンタで行う印刷出力、及び図１のネットワークＩ／Ｆ１０８を介して他の装置に行う送信出力等が挙げられる。

　〔実施形態の処理又は動作〕
　続いて、図３乃至図６を用いて、本実施形態の処理又は動作について詳細に説明する。図３は、文書の作成を支援する処理を示すフローチャートである。

　図３において、まず、文書入力部１１は、ユーザから文書のデータを入力する（Ｓ１１）。図４は、入力された文書の一例を示す図である。図４には、SDGs（持続可能な開発目標）の内容が記載された文章を示している。

　次に、形態素解析部１２は、文書入力部１１によって入力された文書のデータを形態素解析して、文章を単語に分割する（Ｓ１２）。形態素解析の手法の一例として、MeCab、ChaSen、KyTea等が挙げられる。

　次に、マスク単語設定部１３は、形態素解析部１２によって分割された全ての単語のうちの一部の所定の単語を選択し、この所定の単語に対してマスクを行うことでマスク単語を設定し、各マスク単語を含んだ単語シーケンスを作成する（Ｓ１３）。図５は、マスク単語が設定された単語シーケンスの一例を示す図である。所定の単語の選択方法としては、マスク単語設定部１３が、tf-idfやアテンション機構等の既存の手法により、単語の重要度を評価して選択する方法が挙げられる。tf-idf(Term Frequency- Inverse Document Frequency）は、文書中に含まれる単語の重要度を評価する手法の１つであり、主に情報検索やトピック分析などの分野で用いられている。また、アテンション機構(Attention Mechanism)は、主に機械翻訳や画像処理等を目的としたEncoder-Decoderモデルに導入される要素ごとの関係性、注意箇所を学習する機構である。なお、ユーザが、所定の単語を手動で選択してもよい。

　次に、単語探索部１４は、BERT等の既存の手法によって事前学習された学習済みの自然言語処理モデルへ単語シーケンスのデータを入力して、単語の候補及び（単語の前後の）文脈を考慮した尤度を探索し、この尤度に応じて確率的にマスク単語の代替え候補を決定する（Ｓ１４）。BERT(Bidirectional Encoder Representations from Transformers)は、自然言語処理（NLP）の事前学習用ためのTransformerベースの機械学習手法である。また、「尤度に応じて」としては、尤度に比例した確率で代替え候補（単語）を決定してもよいし、尤度の高い単語を所定数選択し、この選択した単語の中からランダムに代替え候補（単語）を決定してもよい。この場合、単語探索部１４は、各マスク単語に対して、一単語ずつ代替え候補を決定していく。一単語ずつ決定していくのは、代替え候補を１つ決定することによって、次のマスク単語の候補や尤度が変わるためである。なお、単語探索部１４が代替えして行く単語の順序は、文頭からとしても良いし、ランダムであってもよい。

　次に、マスク単語設定部１３は、マスク単語の全てを代替えしたかを判断する（Ｓ１５）。そして、全て代替えしていない場合には（Ｓ１５；ＮＯ）、上記ステップＳ１４の処理に戻る。一方、全て代替えしている場合には（Ｓ１５；ＹＥＳ）、マスク単語設定部１３は、１つの文書の候補を完成させて、マスク単語のマスクを戻す（外す）（Ｓ１６）。図６は、文書の候補の一例を示す図である。図６において、（１）には最初の文書の候補が示されており、（２）には２番目の文書の候補が示されている。

　次に、マスク単語設定部１３は、所定数の文書の候補を完成したかを判断する（Ｓ１７）。そして、所定数の文章の候補が完成していない場合には（Ｓ１７；ＮＯ）、上記ステップＳ１３の処理に戻る。文書の候補の所定数は、予めユーザによって設定されている。一方、所定数の文書の候補が完成している場合には（Ｓ１７；ＹＥＳ）、文書出力部１５は、ディスプレイ１０５に、所定数の文書の候補を出力表示する（Ｓ１８）。この場合、文書出力部１５は、ユーザによって予め設定された評価指標に基づき、ソートして出力表示する。評価指標としては、例えば、自然言語処理モデル２の予測性能を示すパープレキシティ(perplexity)が挙げられる。なお、文書出力部１５は、図１の外部機器Ｉ／Ｆ１０７を介して外部装置であるプリンタに印刷出力してもよいし、図１のネットワークＩ／Ｆ１０８を介して他の装置に送信出力してもよい。

　なお、図４乃至図６に示されている文書の他に、文書作成支援装置１が作成支援できる文書の例を挙げると、以下のような例がある。
（１）既存のレシピ文章を入力として、食材を示す単語の代わりに別の食材候補、およびその食材に合う調味料などを提示することによって、レシピのアレンジを支援する。
（２）既存の標語を入力することによって、新たな標語作成を支援する。
（３）過去に作成した将来予測シナリオを入力として、更なる未来のシナリオ作成を支援する。

　以上のように、学習済み自然言語処理モデル２をその分野の文章を用いてファインチューニングしておくことによって、より適切な単語を提示することが期待できる。

　〔実施形態の主な効果〕
　以上説明したように、本実施形態によれば、文書作成支援装置１が、入力した文書の分野に適した学習済み自然言語処理モデル２を用い、前後の文脈を反映した単語の代替え候補を確率的に探索して提示することによって、人の発想を支援して新たな文書を作成することができる。

　〔補足〕
　本発明は上述の実施形態に限定されるものではなく、以下に示すような構成又は処理（動作）であってもよい。
（１）文書作成支援装置１はコンピュータとプログラムによっても実現できるが、このプログラムを記録媒体に記録することも、通信ネットワーク１００を介して提供することも可能である。
（２）上記実施形態では、文書作成支援装置１の一例としてパソコンが示されているが、これに限るものではなく、例えば、タブレット端末、スマートフォン、スマートウォッチ等であってもよい。
（３）ＣＰＵ１０１は、単一だけでなく、複数であってもよい。

１　文書作成支援装置
２　学習済み自然言語処理モデル
１０　記憶部
１１　文書入力部（文書入力手段の一例）
１２　形態素解析部（形態素解析手段の一例）
１３　マスク単語設定部（マスク単語設定手段の一例）
１４　単語探索部（単語探索手段の一例）
１５　文書出量部（文書出力手段の一例）

Claims

　文書の作成を支援する文書作成支援装置であって、
　前記文書のデータを形態素解析して当該文書を単語に分割する形態素解析手段と、
　前記分割された単語のうち、所定の単語に対してマスクを行うことでマスク単語を設定するマスク単語設定手段と、
　学習済みの自然言語処理モデルを用い、前記マスク単語に基づいて、単語の候補及び文脈を考慮した尤度を探索し、当該尤度に応じて前記マスク単語の代替え候補を決定することで、前記文書の候補を完成させる単語探索手段と、
　を有することを特徴とする文書作成支援装置。
　前記マスク単語設定手段は、前記マスク単語を設定することで、単語シーケンスを作成し、
　前記単語探索手段は、前記学習済みの自然言語処理モデルを用い、前記作成された単語シーケンスに基づいて前記尤度を探索することを特徴とする請求項１に記載の文書作成支援装置。
　前記単語探索手段は、前記尤度に比例した確率で前記代替え候補を決定する、又は前記尤度の高い単語を所定数選択し当該選択した単語の中からランダムに前記代替え候補を決定することを特徴とする請求項１に記載の文書作成支援装置。
　前記単語探索手段は、複数の前記マスク単語に対して、一単語ずつ前記代替え候補を決定することを特徴とする請求項１に記載の文書作成支援装置。
　前記学習済みの自然言語処理モデルは、BERTであることを特徴とする請求項１に記載の文書作成支援装置。
　請求項１乃至５のいずれか一項に記載の文書作成支援装置であって、
　前記単語探索手段によって完成された複数の前記文書の候補を、評価指標に基づきソートして出力する文書出力手段を有することを特徴とする文書作成支援装置。
　文書の作成を支援する文書作成支援装置が実行する文書作成支援方法であって、
　前記文書のデータを形態素解析して当該文書を単語に分割する形態素解析ステップと、
　前記分割された単語のうち、所定の単語に対してマスクを行うことでマスク単語を設定するマスク単語設定ステップと、
　学習済みの自然言語処理モデルを用い、前記マスク単語に基づいて、単語の候補及び文脈を考慮した尤度を探索し、当該尤度に応じて前記マスク単語の代替え候補を決定することで、前記文書の候補を完成させる単語探索ステップと、
　を実行することを特徴とする文書作成方法。
　コンピュータに、請求項７に記載の方法を実行させるプログラム。