JP7511381B2

JP7511381B2 - 文生成装置、文生成方法および文生成プログラム

Info

Publication number: JP7511381B2
Application number: JP2020083255A
Authority: JP
Inventors: 美沙佐藤; 孝介柳井
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 2020-05-11
Filing date: 2020-05-11
Publication date: 2024-07-05
Anticipated expiration: 2040-05-11
Also published as: JP2021179673A

Description

本発明は、文を生成する文生成装置、文生成方法および文生成プログラムに関する。

文を要約したり、文から質問文を生成したりするなど、文を適切な形に変換したいニーズがある。文を観点ごとに要約する技術として、たとえば、下記特許文献１のテキスト要約装置がある。

このテキスト要約装置では、部分木保持ＺＤＤ作成部がＺＤＤを構築する。観点情報抽出部が、複数の観点の各々について、文書に含まれる単語毎に、観点との関連度を算出し、単語毎に観点の各々について算出された関連度に基づいて、文書における複数の観点の比率を算出する。観点部分木保持ＺＤＤ生成部が、観点の比率に応じた長さ上限と、ノードの各々に対応する単語の観点との関連度と、単語の長さとに基づいて、構築されたＺＤＤが表す部分木の集合のうちの部分木の部分集合を表すＺＤＤを、観点に対応する観点ＺＤＤとして生成する。最適部分木算出部が、観点ＺＤＤが表す部分木の部分集合に共通する部分木を表す共通ＺＤＤのパスのうち、要約の長さ上限を満たす最適なパスを探索し、探索されたパスが表す前記部分木を出力する。要約出力部が、部分木に基づいて、入力テキストの要約を出力する。

また、文から要約語を抽出する技術として、たとえば、下記特許文献２の情報処理装置がある。この情報処理装置は、１又は複数の文からなる文書を取得する取得部と、文章に含まれる各語に、その格要素に応じて重み付けをする基礎スコア付与部と、文における述語に応じて当該文に含まれる各語の重みを更新するスコア更新部と、各語の重みに基づいて文書の要約語を選択する要約語選択部と、選択した要約語を出力する出力部と、を備える。

特開２０１８－８１４６３号公報特開２０１９－２０４４４５号公報

特許文献１のテキスト要約装置のように文を観点ごとに要約する場合、文の長さや文内の単語数により制限されるが、実際の文では、名詞の長さにばらつきがあるなど、文の長さと文に含まれる情報量とは一致しないため適切でない。また、特許文献１のテキスト要約装置は、要約の長さ上限に基づき、観点の比率で按分して各部分木の長さを決めているため、観点ごとの情報量を文法的な条件で制御することができない。加えて、議事録の要約や対話資材の生成では、実用上、文の長さについて数値的な制約はない。また、特許文献２の情報処理装置は、文の主題を一言で表す要約語を生成するため、文を生成したり、出力したりすることができない。このようなことは、要約などの文短縮に限らず、質問文や回答文の生成、見出しの生成などについても同様である。

本発明は、文を適切な形に変換することを目的とする。

本願において開示される発明の一側面となる文生成装置は、プログラムを実行するプロセッサと、前記プログラムを記憶する記憶デバイスと、を有する文生成装置であって、前記プロセッサは、入力文を木構造解析して前記入力文を構成する単語列である１以上の要約要素からなる木構造解析結果を出力する木構造解析処理と、前記要約要素を抽出する抽出条件を含む抽出ルールを用いて、前記木構造解析処理によって出力された木構造解析結果から、前記抽出条件に該当する特定の要約要素を取得する取得処理と、前記要約要素を指定して当該要約要素から内容語または特定の品詞の単語を抽出する１以上の指定要素によって文のひな型を構成する文生成テンプレートを参照して、前記特定の要約要素ごとに、前記特定の要約要素を指定した特定の指定要素に該当する特定の単語を前記特定の要約要素から抽出して前記文生成テンプレートに適用することにより、出力文を生成する生成処理と、を実行することを特徴とする。

本発明の代表的な実施の形態によれば、文を適切な形に変換することができる。前述した以外の課題、構成及び効果は、以下の実施例の説明により明らかにされる。

図１は、実施例１にかかる文生成装置による文生成例を示す説明図である。図２は、文生成装置のハードウェア構成例を示すブロック図である。図３は、抽出ルールＤＢ（データベース）の一例を示す説明図である。図４は、文生成テンプレートＤＢの一例を示す説明図である。図５は、実施例１にかかる文生成装置による文生成処理手順例を示すフローチャートである。図６は、実施例１にかかる木構造解析（ステップＳ５０１）による入力文１００の木構造解析結果の一例を示す説明図である。図７は、実施例１にかかる要約要素の取得（ステップＳ５０２）による要約要素の取得結果を示す説明図である。図８は、実施例１にかかる要約要素の修正（ステップＳ５０３）による枝刈り結果を示す説明図である。図９Ａは、要約要素からの単語列の抽出（ステップＳ５０４）による抽出結果例１を示す。図９Ｂは、要約要素からの単語列の抽出（ステップＳ５０４）による抽出結果例２を示す。図９Ｃは、要約要素からの単語列の抽出（ステップＳ５０４）による抽出結果例３を示す。図９Ｄは、要約要素からの単語列の抽出（ステップＳ５０４）による抽出結果例４を示す。図９Ｅは、要約要素からの単語列の抽出（ステップＳ５０４）による抽出結果例５を示す。図９Ｆは、要約要素からの単語列の抽出（ステップＳ５０４）による抽出結果例６を示す。図１０は、実施例１にかかる文生成テンプレートによる連結（ステップＳ５０５）での連結結果を示す説明図である。図１１Ａは、実施例１にかかる活用語尾の変換（ステップＳ５０６）の例１を示す説明図である。図１１Ｂは、実施例１にかかる活用語尾の変換（ステップＳ５０６）の例２を示す説明図である。図１２Ａは、文生成装置による文生成の具体例１を示す説明図である。図１２Ｂは、文生成装置による文生成の具体例２を示す説明図である。図１２Ｃは、文生成装置による文生成の具体例３を示す説明図である。図１３は、実施例２にかかる時制の検出例を示す説明図である。図１４は、実施例２にかかる否定形の検出例を示す説明図である。図１５は、実施例２にかかる仮定形の検出例を示す説明図である。図１６は、実施例３にかかる照応関係の推定例を示す説明図である。図１７は、実施例３にかかるゼロ代名詞の補完例を示す説明図である。図１８は、英語の入力文の一例を示す説明図である。図１９は、実施例４にかかる抽出ルールＤＢの一例を示す説明図である。図２０は、実施例４にかかる文生成テンプレートＤＢの一例を示す説明図である。図２１は、実施例４にかかる木構造解析（ステップＳ５０１）による入力文の木構造解析結果の一例を示す説明図である。図２２は、実施例４にかかる要約要素の取得（ステップＳ５０２）による要約要素の取得結果を示す説明図である。図２３は、実施例４にかかる要約要素の修正（ステップＳ５０３）による枝刈り結果を示す説明図である。図２４は、実施例４にかかる文生成テンプレートによる連結（ステップＳ５０５）での連結結果を示す説明図である。

本明細書では、一例として、会議における発言の書き起こしからの議事録を自動作成する場合の文短縮について説明する。ここで、議事録とは、会議での決定事項や会議で出た意見、質問等をコンパクトにまとめた文書であり、情報共有や認識合わせのために必須である。

議事録の要約では、会議で話された内容をまんべんなく記録するよりも、決定事項などの会議として重要な種類の情報を読みやすい形でまとめることが求められる。また、短時間で会議の内容を把握可能であることが重視されるため、議事録の要約では、不要な語が可能な限り少ないことが重要である。

また、文書要約の手法として、重要な文を特定しその文をそのまま使うことが考えられるが、発話文は長くなることが多く、１つの文に複数の情報が含まれることもある。このため、重要な種類の情報に該当する箇所だけを用いた短い文を作成する必要がある。

このことから、以下に示す各実施例にかかる文生成装置は、まず議事録に残したい種類の情報を抽出し、その結果を結合することにより議事録に適した文を生成する。これにより、議事録作成を可能な限り自動化して人的作業の低減を図る。なお、以下に示す各実施例では、議事録の作成を例に挙げて説明するが、要約などの文短縮のほか、質問文や回答文の生成、見出しの生成など、文の平易化に有用であれば、議事録に限られない。以下、添付図面を用いて各実施例にかかる文生成装置について説明する。

＜文生成例＞
図１は、実施例１にかかる文生成装置による文生成例を示す説明図である。図１は、会議の音声から平易化された文を生成し、議事録を作成する例である。（１）まず、議事録の作成担当者が、会議の音声を手作業により書き起こす。この書き起こしは、既存の音声テキスト変換装置が会議の録音音声を文に変換してもよい。

（２）文生成装置は、（１）で得られた文から抽出ルールを適用して、関係抽出を実行する。関係抽出とは、事物間の特定の関係について、その要素を文から抽出することである。たとえば、情報の種類ごとに必須の要素があるため、決定の内容に関する要素を文から抽出したい場合には、決定事項の抽出に特化した抽出ルールが適用される。

関係抽出を実行する場合、文生成装置は、議事録生成元の文を木構造解析（形態素解析および係り受け解析により文の木構造を生成する処理）し、木構造パターンである抽出ルールに該当する要素を、木構造解析結果から抽出する。たとえば、議事録生成元となる入力文１００は、『運用については今後ということで、当事者の方の御意見なども明日聞いてやっていただきたいと思います。』という文字列とする。入力文１００は、指示を含む文である。

文生成装置は、要約要素を抽出する抽出ルールを適用する。要約要素とは、入力文１００を構成する単語列を抽出ルールによって要約した単語列である。単語列とは、１以上の単語が連続する文字列である。入力文１００の内容が指示を示す場合に適用可能な指示抽出ルールの１つとして、文生成装置は、たとえば、指示抽出ルールｉｒ１を適用する。これにより、「運用については」が要約要素＃ａ１として、「当事者の方の御意見なども」が要約要素＃ａ２として、「明日聞いてやっていただきたい」が要約要素＃ａ０として、抽出される（図１中、点線矩形で表記）。

（３）文生成装置は、文生成テンプレートにより平化された文を生成する。具体的には、たとえば、文生成装置は、（２）で抽出された要約要素＃ａ１，＃ａ２，＃ａ０を文生成テンプレートｔｐ１に適用する。文生成テンプレートｔｐ１は、「♯ａ１は♯ａ２♯ａ２．ｃａｓｅ♯ａ０．ｌｅｍｍａ」である。文生成テンプレートｔｐ１で指定する要約要素♯ａ１，♯ａ２，♯ａ２．ｃａｓｅ，♯ａ０．ｌｅｍｍａを、（２）で抽出された要約要素と区別するため、指定要素と称す。

文生成装置は、要約要素＃ａ１の「運用については」から指定要素＃ａ１として「運用」を抽出し、要約要素＃ａ２の「当事者の方の御意見なども」から指定要素＃ａ２として「当事者の方の御意見」を抽出し、要約要素＃ａ２の「当事者の方の御意見なども」から指定要素＃ａ２．ｃａｓｅとして助詞（ｃａｓｅ）の「も」を抽出し、指定要素＃ａ０の「聞いてやっていただきたい」から要約要素ａ０．ｌｅｍｍａとして要約要素＃ａ０の内容語（動詞）を示す「聞い」の基本形「聞く」を抽出する。

そして、文生成装置は、抽出した指定要素♯ａ１，♯ａ２，♯ａ２．ｃａｓｅ，♯ａ０．ｌｅｍｍａを文生成テンプレートｔｐ１に適用して、入力文１００を短縮した文（以下、出力文）１０１として『運用は当事者の方の御意見を聞く』を生成する。出力文１０１は、入力文１００ごとに生成される。ただし、入力文１００が抽出ルールに該当しなければ要約要素が抽出されず、文生成テンプレートに適用できないため、出力文１０１は生成されない場合もある。また、該当する抽出ルールや文生成テンプレートが異なれば、出力文１０１の内容も異なる。なお、出力文１０１は、どの抽出ルールや文生成テンプレートｔｐで作成されたかが関連付けられた状態で出力される。この例では、出力文１０１は、指示抽出ルールから作られていることから、「指示」ラベルが付加された状態で出力される。

（４）議事録の作成担当者は、（３）で得られた複数の出力文１０１を、出力文１０１に関連付けられたラベルも参考にして選択したり、並び替えたりして、議事録１０２を作成する。これにより、会議における発言から議事録に残すべき情報を特定し、読みやすい文にまとめる作業労力の軽減を図ることができる。

＜文生成装置のハードウェア構成例＞
図２は、文生成装置のハードウェア構成例を示すブロック図である。文生成装置２００は、プロセッサ２０１と、記憶デバイス２０２と、入力デバイス２０３と、出力デバイス２０４と、通信インターフェース（通信ＩＦ）２０５と、を有する。プロセッサ２０１、記憶デバイス２０２、入力デバイス２０３、出力デバイス２０４、および通信ＩＦ２０５は、バス２０６により接続される。プロセッサ２０１は、文生成装置２００を制御する。記憶デバイス２０２は、プロセッサ２０１の作業エリアとなる。また、記憶デバイス２０２は、各種プログラムやデータを記憶する非一時的なまたは一時的な記録媒体である。記憶デバイス２０２としては、たとえば、ＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）、ＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）、ＨＤＤ（ＨａｒｄＤｉｓｋＤｒｉｖｅ）、フラッシュメモリがある。入力デバイス２０３は、データを入力する。入力デバイス２０３としては、たとえば、キーボード、マウス、タッチパネル、テンキー、スキャナがある。出力デバイス２０４は、データを出力する。出力デバイス２０４としては、たとえば、ディスプレイ、プリンタ、スピーカがある。通信ＩＦ２０５は、ネットワークと接続し、データを送受信する。

なお、文生成装置２００は、クライアントサーバシステムのサーバでもよい。この場合、クライアントが入力文１００を文生成装置２００に送信し、文生成装置２００が出力文１０１をクライアントに送信する。また、文生成装置２００は、スタンドアロン型でもよい。たとえば、文生成装置２００は、文生成プログラムがインストールされたスマートフォンやパーソナルコンピュータでもよい。クライアントサーバシステムまたはスタンドアロン型のいずれであっても、文生成装置２００は、たとえば、入力音声から入力文１００を生成（入力文１００のテキスト入力でもよい）し、出力文１０１を音声出力（画面表示でもよい）するチャットボットに利用可能である。また、文生成装置２００にインストールされる文生成プログラムは、外部装置の記憶媒体からネットワーク経由で、および／または、可搬型記憶媒体経由で導入されてもよい。

＜データベース＞
図３は、抽出ルールＤＢ（データベース）の一例を示す説明図である。抽出ルールＤＢ３００は、各種抽出ルールを記憶するデータベースである。抽出ルールＤＢ３００は、文生成装置２００の記憶デバイス２０２に記憶される。また、抽出ルールＤＢ３００は、文生成装置２００と通信可能なコンピュータに記憶されていてもよい。

抽出ルールＤＢ３００は、たとえば、指示抽出ルールｉｒ１，ｉｒ２，…（ｉｒ１，ｉｒ２，…を区別しない場合は、単にｉｒと表記）と、決定抽出ルールｄｒ１，…（ｄｒ１，…を区別しない場合は、単にｄｒと表記）と、意見抽出ルールｏｒ１，…（ｏｒ１，…を区別しない場合は、単にｏｒと表記）と、質問抽出ルールｑｒ１，…（ｑｒ１，…を区別しない場合は、単にｑｒと表記）と、共通抽出ルールｃｒ１，…（ｃｒ１，…を区別しない場合は、単にｃｒと表記）とを記憶する。

決定抽出ルールｄｒは、入力文１００の内容が決定を示す場合に適用可能な抽出ルールである。意見抽出ルールｏｒは、入力文１００の内容が意見を示す場合に適用可能な抽出ルールである。質問抽出ルールｑｒは、入力文１００の内容が意見を示す場合に適用可能な抽出ルールである。共通抽出ルールｃｒは、入力文１００の内容にかかわらず適用可能な抽出ルールである。

入力文１００自体には、入力文１００がどのような内容を示すかというインデックスは付与されていない。たとえば、指示抽出ルールｉｒ１が入力文１００に適用されれば、指示に関する要約要素が入力文１００から抽出され、決定抽出ルールｄｒ１が入力文１００に適用されれば、決定に関する要約要素が入力文１００から抽出される。意見抽出ルールｏｒ１や質問抽出ルールｑｒ１についても同様である。

ここで、指示抽出ルールｉｒ１の詳細について具体的に説明する。１行目の「（（ｉｄ．ｉｎｓｔｒｕｃｔｉｏｎ＿０１））」は、指示抽出ルールｉｒ１のインデックスを示す。

２行目の「（♯ａ０．ｓｕｆ＝たい＆．ＰＯＳ＝動詞＊…＊）」は、動詞と、助動詞「たい」と、を含む文節を、要約要素ａ０として入力文１００から抽出する抽出条件Ｃ１である。「＊」は、その親の文節を係り受け先とする文節がどのようなものでも存在してもよいことを示す。入力文１００の場合、要約要素＃ａ０として、「明日聞いてやっていただきたい」が抽出される。

３行目の「.ｌｅｍｍａ＝こと＆．ＰＯＳ＝名詞＆．ＰＯＳ２＝非自立＊」は、２行目の抽出条件の子ノードとなる条件であるが、抽出条件ではない。具体的には、たとえば、内容語（ｌｅｍｍａ）である非自立な名詞「こと」が、＃ａ０のノードを係り先とする子ノードとして存在することを検出するための検出条件Ｄである。入力文１００の場合、「こと」の存在が検出される。

４行目の「♯ａ１.ｃａｓｅ＝については＆.ＰＯＳ＝名詞＊」は、３行目の検出条件Ｄの子ノードとなる抽出条件Ｃ２であり、具体的には、たとえば、名詞と、助詞等の「については」と、を含む文節を、要約要素＃ａ１として入力文１００から抽出する。入力文１００の場合、要約要素＃ａ１として、「運用については」が抽出される。

６行目の「♯ａ２．ｃａｓｅ＝も＆．ＰＯＳ＝名詞＊」は、名詞と、助詞「も」と、を含む文節を、要約要素ａ２として入力文１００から抽出する抽出条件Ｃ３である。入力文１００の場合、要約要素＃ａ２として、「当事者の方の御意見なども」が抽出される。

また、共通抽出ルールｃｒ１は、対象となる要約要素＃ａ０から削除対象の単語列を特定して削除、いわゆる枝刈りをおこなうための削除ルール（枝刈り条件）である。共通抽出ルールｃｒ１となる文節は、形態素解析で副詞可能に分類された語を先頭に持つ文節である。この文節を根に持つ部分木が枝刈りされる。要約要素＃ａ０の「明日聞いてやっていただきたい」の場合、「明日」が削除、すなわち、枝刈りされて、要約要素＃ａ０は「聞いてやっていただきたい」になる。

このように、文生成装置２００は、抽出ルールを適用することにより、入力文１００の文節間の修飾関係（係り受け解析結果）と形態素解析結果とを手掛かりとして要約要素を抽出することが可能になる。

図４は、文生成テンプレートＤＢの一例を示す説明図である。文生成テンプレートＤＢ４００は、文生成テンプレートｔｐ１，ｔｐ２，ｔｐ３，ｔｐ４，ｔｐ５，…（ｔｐ１，ｔｐ２，ｔｐ３，ｔｐ４，ｔｐ５，…を区別しない場合は、単にｔｐ）を記憶するデータベースである。文生成テンプレートＤＢ４００は、文生成装置２００の記憶デバイス２０２に記憶される。また、文生成テンプレートＤＢ４００は、文生成装置２００と通信可能なコンピュータに記憶されていてもよい。

文生成テンプレートｔｐは、抽出した要約要素から指定要素の単語列を抽出して文生成テンプレートｔｐ内の当該構成要素の位置に設定することにより、出力文１０１を生成するためのテンプレートである。文生成テンプレートｔｐ１の場合、指定要素＃ａ１，＃ａ２，＃ａ２．ｃａｓｅおよび＃ａ０．ｌｅｍｍａが適用される。

なお、図示はしないが、文生成装置２００は、単語辞書を参照する。単語辞書は、単語ごとに、品詞、基本形、活用形、読みなど、形態素解析に必要な情報を記憶する。単語辞書は、文生成装置２００の記憶デバイス２０２に記憶される。また、単語辞書は、文生成装置２００と通信可能なコンピュータに記憶されていてもよい。

＜文生成処理手順＞
図５は、実施例１にかかる文生成装置２００による文生成処理手順例を示すフローチャートである。文生成装置２００は、木構造解析（ステップＳ５０１）、要約要素の取得（ステップＳ５０２）、要約要素の修正（ステップＳ５０３）、要約要素からの単語列の抽出（ステップＳ５０４）、文生成テンプレートによる連結（ステップＳ５０５）、および活用語尾の変換（ステップＳ５０６）を実行して、一連の処理を終了する。木構造解析（ステップＳ５０１）～活用語尾の変換（ステップＳ５０６）の処理は、具体的には、たとえば、記憶デバイス２０２に記憶された文生成プログラムにしたがって、プロセッサが実行する。以下、ステップＳ５０１～Ｓ５０６について順に説明する。

図６は、実施例１にかかる木構造解析（ステップＳ５０１）による入力文１００の木構造解析結果の一例を示す説明図である。木構造解析結果６００は、抽出ルールの抽出対象となるデータである。木構造解析（ステップＳ５０１）では、文生成装置２００は、入力文１００を木構造解析する。具体的には、たとえば、文生成装置２００は、入力文１００に対して文節単位で形態素解析および係り受け解析を実行する。これにより、木構造解析結果６００が得られる。

図７は、実施例１にかかる要約要素の取得（ステップＳ５０２）による要約要素の取得結果を示す説明図である。要約要素の取得（ステップＳ５０２）では、文生成装置２００は、たとえば、抽出ルールＤＢ３００のすべての抽出ルールを木構造解析結果６００に適用して、要約要素を抽出する。具体的には、たとえば、文生成装置２００は、指示抽出ルールｉｒ１の２行目の抽出条件Ｃ１を木構造解析結果６００から特定し、抽出条件Ｃ１に該当する要約要素＃ａ０として「明日聞いてやっていただきたい」を抽出する。

また、文生成装置２００は、指示抽出ルールｉｒ１の３行目の抽出条件Ｃ２を木構造解析結果６００から特定し、抽出条件Ｃ２に該当する要約要素＃ａ１として「運用については」を抽出する。また、文生成装置２００は、指示抽出ルールｉｒ１の４行目の抽出条件Ｃ３を木構造解析結果６００から特定し、抽出条件Ｃ３に該当する要約要素＃ａ２として「当事者の方の御意見なども」を抽出する。また、文生成装置２００は、入力文１００が検出条件Ｄを充足することを検出する。

また、要約要素の取得（ステップＳ５０２）では、文生成装置２００は、抽出した要約要素について共通抽出ルールｃｒ１に該当する場合には、枝刈りを実行する。なお、文生成装置２００は、要約要素＃ａ０～＃ａ２を、文生成装置２００と通信可能な他のコンピュータから取得してもよい。

図８は、実施例１にかかる要約要素の修正（ステップＳ５０３）による枝刈り結果を示す説明図である。図８では、要約要素＃ａ０から、形態素解析結果が副詞可能である「明日」が枝刈りされる。以降、特に指定しない限り、実施例１において、要約要素＃ａ０は、枝刈り後の「聞いてやっていただきたい」とする。

図９Ａ～図９Ｆは、要約要素からの単語列の抽出（ステップＳ５０４）による抽出結果例１～６を示す。要約要素からの単語列の抽出（ステップＳ５０４）では、文生成装置２００は、要約要素＃ａ０～＃ａ２から、文生成テンプレートを構成する要約要素（以下、指定要素）に従って、単語列を抽出する。指定要素には、たとえば、＃ａｎ（ｎは０以上の整数）、＃ａｎ．ｌｅｍｍａ、＃ａｎ．ｃａｓｅ、＃ａｎ．ｓｕｆ、＃ａｎ．ｔｅｎｓｅがある。

たとえば、＃ａｎは、要約要素＃ａｎに含まれるルートの文節の内容語（たとえば、動詞、名詞、形容詞。助詞および助動詞は除外）および子ノードの語を抽出する指定要素である。＃ａｎ．ｌｅｍｍａは、要約要素＃ａｎからそのルートの文節の内容語を抽出する指定要素である。

＃ａｎと＃ａｎ．ｌｅｍｍａとの相違は、子ノードの語を抽出するかしないかである。たとえば、要約要素＃ａ２の「当事者の方の御意見」に指定要素＃ａ２が適用されると、ルートとなる「御意見」の子ノード「当事者の方の」も含めて、「当事者の方の御意見」が抽出される。一方、要約要素＃ａ２の「当事者の方の御意見」に指定要素＃ａ２．ｌｅｍｍａが適用されると、ルートとなる「御意見」の子ノード「当事者の方の」を含まずに、ルートである「御意見」のみが抽出される。

＃ａｎ．ｃａｓｅは、要約要素＃ａｎからルートの文節の特定の助詞を抽出する指定要素である。このとき，副助詞の「など」や副助詞の「ばかり」等の文意へ大きな影響を与えない助詞は、特定の助詞には含めず抽出しない。＃ａｎ．ｓｕｆは、要約要素＃ａｎからルートの文節の特定の助動詞を抽出する指定要素である。＃ａｎ．ｔｅｎｓｅは、要約要素＃ａｎからルートの文節の時制を表す助動詞を抽出する指定要素である。

文生成テンプレートｔｐ１の場合、指定要素は、＃ａ１、＃ａ２、＃ａ２．ｃａｓｅ、＃ａ０．ｌｅｍｍａである。

図９Ａに示したように、文生成装置２００は、要約要素＃ａ１の「運用については」から、指定要素＃ａ１により、名詞「運用」を抽出する。すなわち、「について」および「は」は形態素解析により助詞と判断されたため、抽出対象外となる。

図９Ｂに示したように、文生成装置２００は、要約要素＃ａ２の「当事者の方の御意見なども」から、指定要素＃ａ２により、名詞句「当事者の方の御意見」を抽出する。すなわち、「など」および「も」は形態素解析により内容語ではないと判断されたため、抽出対象外となる。

図９Ｃに示したように、文生成装置２００は、要約要素＃ａ２の「当事者の方の御意見なども」から、指定要素＃ａ２．ｃａｓｅにより、「も」を抽出する。「など」も助詞であるが、上述した特定の助詞以外であるため抽出対象外となる。

図９Ｄに示したように、文生成装置２００は、要約要素＃ａ０の「聞いてやっていただきたい」から、指定要素＃ａ０．ｌｅｍｍａにより、ルートの文節の内容語である動詞「聞い」の基本形「聞く」を抽出する。すなわち、２つの「て」は助詞、「たい」は助動詞であると形態素解析により判断されたため、また、「やっ」および「いただき」は内容語ではないと判定されるため、抽出対象外となる。

図９Ｅおよび図９Ｆは、文生成テンプレートｔｐ１には含まれていない指定要素による単語列の抽出を示す。図９Ｅおよび図９Ｆに限り、要約要素＃ａ０の「聞いてやっていただきたい」を、例として、過去形の「聞いてやっていただきたかった」とする。文生成装置２００は、要約要素＃ａ０の「聞いてやっていただきたかった」から、指定要素＃ａ０．ｔｅｎｓｅにより、過去を表す助動詞「た」を抽出する。図９Ｆの場合、文生成装置２００は、要約要素＃ａ０の「聞いてやっていただきたかった」から、指定要素＃ａ０．ｓｕｆにより、希望を表す助動詞「たかっ」の基本形「たい」を抽出する。

図１０は、実施例１にかかる文生成テンプレートによる連結（ステップＳ５０５）での連結結果を示す説明図である。文生成テンプレートによる連結（ステップＳ５０５）では、文生成装置２００は、要約要素からの単語列の抽出（ステップＳ５０４）によって抽出された「運用」、「は」、「当事者の方の御意見」、「も」、および「聞く」（図９Ａ～図９Ｄを参照）を、文生成テンプレートｔｐ１に適用することにより、連結結果１０００として「運用は当事者の方の御意見も聞く」を生成する。

活用語尾の変換（ステップＳ５０６）では、文生成装置２００は、文生成テンプレートによる連結（ステップＳ５０５）での連結結果１０００について活用語尾を変換し、出力文１０１を出力する。

図１１Ａは、実施例１にかかる活用語尾の変換（ステップＳ５０６）の例１を示す説明図である。連結結果１０００の場合、動詞「聞く」は文末に位置し、かつ、動詞「聞く」の基本形は終止形と同じであるため、動詞「聞く」の活用語尾「く」は変換されない。これにより、文生成装置２００は、出力文１０１として「運用は当事者の方の御意見も聞く」を出力する。

図１１Ｂは、実施例１にかかる活用語尾の変換（ステップＳ５０６）の例２を示す説明図である。図１１Ｂの連結結果１１００の場合、各々基本形である動詞「聞く」と「まとめる」とが連結されている。このような場合、動詞「聞く」は文末に位置せず、かつ、後続に動詞「まとめる」が存在するため、文生成装置２００は、動詞「聞く」の活用語尾「く」を連用形の「い」に変換し、かつ、動詞「まとめる」と接続するための接続助詞「て」を追加する。

動詞「まとめる」は文末に位置し、かつ、動詞「まとめる」の基本形は終止形と同じであるため、動詞「まとめる」の活用語尾「る」は変換されない。これにより、文生成装置２００は、出力文１１０１として「運用は当事者の方の御意見も聞いてまとめる」を出力する。

＜文生成の具体例＞
図１２Ａ～図１２Ｃは、文生成装置２００による文生成の具体例１～３を示す説明図である。図１２Ａ～図１２Ｃでは、同一の入力文１２１１の『○○首相が一昨日Ｘが慌ただしく出国したと昨日未明に発表した』に対し異なる文生成テンプレートを適用した場合の出力文の違いを示す。

図１２Ａは、上述した出力文１０１と同様、文短縮の文生成テンプレートｔｐ２を適用した場合の例である。なお、適用された抽出ルールで抽出する関係は、「発表」である。抽出ルールによって抽出された要約要素の取得結果１２１２は、＃ａ１が「○○首相」、＃ａ２が「一昨日Ｘが慌ただしく出国した」、＃ａ０が「昨日未明に発表した」とする。したがって、文生成テンプレートｔｐ２が適用されると、出力文１２１３として『○○首相が一昨日Ｘが出国したと発表した』が出力される。

図１２Ｂは、質問文および回答文を生成するための文生成テンプレートｔｐ３，ｔｐ４が適用した場合の例である。なお、適用された抽出ルールで抽出する関係は、「発表」である。図１２Ｂでは、図１２Ａと同じ取得結果１２１２とする。したがって、文生成テンプレートｔｐ３が適用されると、出力文１２２３として『○○首相が昨日未明に発表したのはなんですか？』という質問文が出力される。また、文生成テンプレートｔｐ４が適用されると、出力文１２２４として『一昨日Ｘが慌ただしく出国したことです』という回答文が出力される。

図１２Ｃは、見出しを生成するための文生成テンプレートｔｐ５を適用した場合の例である。なお、適用された抽出ルールで抽出する関係は、「出国」である。抽出ルールによって抽出された要約要素の取得結果１２３２は、＃ａ１が「Ｘ」、＃ａ０が「慌ただしく出国した」とする。したがって、文生成テンプレートｔｐ５が適用されると、出力文１２３３として『Ｘ出国』が出力される。

このように、実施例１によれば、入力文を平易化した出力文を出力することにより、可能な限り文生成を自動化して人間の人的作業の低減を図ることができる。

実施例２について説明する。実施例２は、実施例１において、入力文に複文が含まれる場合に、複文から抽出された要約要素＃ａｎの時制や、要約要素＃ａｎにおける否定形および仮定形を検出し、要約要素＃ａｎ間で整合性をとる例である。実施例２では、実施例１との相違点を中心に説明するため、実施例１についての説明は省略する。なお、実施例２では、複文を例に挙げて説明するが、重文でも同様である。

図１３は、実施例２にかかる時制の検出例を示す説明図である。文生成装置２００は、入力文１３００に対し木構造解析（ステップＳ５０１）を実行することにより、入力文１３００が、先行文『Ａが社内システムに関する資料を速やかに配布し、』と後続文『休憩後にＢがその資料を使ってプレゼンした。』との複文であることを検出する。また、文生成装置２００は、要約要素の取得（ステップＳ５０２）を実行することにより、抽出結果１３０１を出力する。抽出結果１３０１は、要約要素＃ａｎとして要約要素１３１１～１３１５を含む。

要約要素の修正（ステップＳ５０３）において、文生成装置２００は、複文の各々の文の動詞「配布し」および「説明し」を含む要約要素１３１３，１３１５を比較し、要約要素１３１３には、動詞「配布し」の時制を表す助動詞が存在せず、要約要素１３１５には、動詞「説明し」の時制を表す助動詞「た」が存在することを検出する。この場合、要約要素１３１３の動詞「配布し」の意味としては、現在形の「配布する」ではなく、過去形の「配布した」が正しい。したがって、文生成装置２００は、先行文の要約要素１３１３の動詞「配布し」の時制を過去形にするために、過去を表す助動詞「た」を要約要素１３１３に追加して、「速やかに配布した。」に修正する。

このあと、文生成装置２００は、修正後の時制に基づいて、後続の要約要素からの単語列の抽出（ステップＳ５０４）、文生成テンプレートによる連結（ステップＳ５０５）、および活用語尾の変換（ステップＳ５０６）を実行する。これにより、文生成装置２００は、あたかも入力文１００の意図を読み取って、出力文１０１を適切な時制で表現することができる。

図１４は、実施例２にかかる否定形の検出例を示す説明図である。文生成装置２００は、入力文１４００に対し木構造解析（ステップＳ５０１）を実行することにより、入力文１４００が、先行文『会議の出席者は、社内システムに関する資料を社外に持ち出し、』と後続文『本日の会議の内容を社外の人に漏らさないでください。』との複文であることを検出する。また、文生成装置２００は、要約要素の取得（ステップＳ５０２）を実行することにより、抽出結果１４０１を出力する。抽出結果１４０１は、要約要素＃ａｎとして要約要素１４１１～１４１５を含む。

要約要素の修正（ステップＳ５０３）において、文生成装置２００は、複文の各々の文の動詞「持ち出し」および「漏らさ」を含む要約要素１４１３，１４１５を比較し、要約要素１４１３には、動詞「持ち出し」の否定を表す助動詞が存在せず、要約要素１４１５には、動詞「漏らさ」の否定を表す助動詞「ない」が存在することを検出する。この場合、要約要素１４１３の動詞「持ち出し」の意味としては、肯定形の「持ち出す」ではなく、否定形の「持ち出さない」が正しい。したがって、文生成装置２００は、先行文の要約要素１４１３の動詞「持ち出し」を否定形にするために、否定を表す助動詞「ない」を、要約要素１４１３に追加して、「持ち出さない」に修正する。

このあと、文生成装置２００は、修正後の時制に基づいて、後続の要約要素からの単語列の抽出（ステップＳ５０４）、文生成テンプレートによる連結（ステップＳ５０５）、および活用語尾の変換（ステップＳ５０６）を実行する。活用語尾の変換（ステップＳ５０６）では、「持ち出さない」は「持ち出さず」に変換される。これにより、文生成装置２００は、あたかも入力文１４００の意図を読み取って、出力文を適切な用法で表現することができる。

図１５は、実施例２にかかる仮定形の検出例を示す説明図である。文生成装置２００は、入力文１５００に対し木構造解析（ステップＳ５０１）を実行することにより、入力文１５００の『社内システムに関する資料のデータを自宅に持ち帰り、自宅のパソコンに保存すれば、』が、先行文『社内システムに関する資料のデータを自宅に持ち帰り、』と後続文『自宅のパソコンに保存すれば、』との複文であることを検出する。また、文生成装置２００は、要約要素の取得（ステップＳ５０２）を実行することにより、抽出結果１５０１を出力する。抽出結果１５０１は、要約要素＃ａｎとして要約要素１５１１～１５１５を含む。

要約要素の修正（ステップＳ５０３）において、文生成装置２００は、複文の各々の文の動詞「持ち帰り」および「保存すれ」を含む要約要素１５１２，１５１３を比較し、要約要素１５１２には、動詞「持ち帰り」の仮定を表す接続助詞が存在せず、要約要素１５１３には、動詞「保存すれ」の仮定を表す接続助詞「ば」が存在することを検出する。この場合、要約要素１５１２の動詞「持ち帰り」の意味としては、断定形の「持ち帰る」ではなく、仮定形の「持ち帰れば」が正しい。したがって、文生成装置２００は、先行文の要約要素１５１２の動詞「持ち帰り」を仮定形にするために、仮定を表す接続助詞「ば」を、要約要素１５１２に追加して、「持ち帰れば」に修正する。

このあと、文生成装置２００は、修正後の時制に基づいて、後続の要約要素からの単語列の抽出（ステップＳ５０４）、文生成テンプレートによる連結（ステップＳ５０５）、および活用語尾の変換（ステップＳ５０６）を実行する。活用語尾の変換（ステップＳ５０６）では、連結結果の「自宅に持ち帰れば自宅のパソコンに保存すれば」は「自宅に持ち帰ったり、自宅のパソコンに保存したりすれば」に変換される。これにより、文生成装置２００は、あたかも入力文１５００の意図を読み取って、出力文を適切な用法で表現することができる。

このように、実施例２によれば、複文内の複数の動詞の時制や否定形、仮定形を一致させ、出力文の適正化を図ることができる。なお、実施例２では、複文内の動詞を例に挙げて説明したが、形容詞や形容動詞でも同様である。

実施例３は、実施例１または実施例２において、入力文に対し照応解析を実行する例である。照応解析とは、代名詞や指示詞といった照応詞の指示対象を推定したり、省略された名詞句（ゼロ代名詞）を補完したりする処理である。実施例３では、実施例１および実施例２との相違点を中心に説明するため、実施例１および実施例２についての説明は省略する。

図１６は、実施例３にかかる照応関係の推定例を示す説明図である。文生成装置２００は、先行入力文１６０１の『Ａが社内システムに関する資料を配布した。』と後続入力文１６０２の『その後、彼が社内システムを説明した。』とのそれぞれに対し、木構造解析（ステップＳ５０１）を実行する。木構造解析（ステップＳ５０１）では、「Ａ」は、人名の固有名詞であると特定され、「彼」は、代名詞であると特定される。

また、文生成装置２００は、要約要素の取得（ステップＳ５０２）を実行することにより、先行入力文１６０１に関する抽出結果１６１０と、後続入力文１６０２に関する抽出結果１６２０とを出力する。先行入力文１６０１に関する抽出結果１６１０は、要約要素＃ａｎとして要約要素１６１１～１６１３を含む。後続入力文１６０２に関する抽出結果１６２０は、要約要素＃ａｎとして要約要素１６２１，１６２２を含む。

要約要素の修正（ステップＳ５０３）において、文生成装置２００は、照応解析を実行することにより、先行入力文１６０１に関する抽出結果１６１０と後続入力文１６０２に関する抽出結果１６２０との間で照応関係を特定する。具体的には、たとえば、文生成装置２００は、先行入力文１６０１に関する抽出結果１６１０の要約要素１６１１内の「Ａ」の代名詞「彼」を、後続入力文１６０２に関する抽出結果１６２０から特定する。文生成装置２００は、「Ａ」と照応関係のある代名詞「彼」を「Ａ」に変換する。これにより、要約要素１６２１の「彼が」は、要約要素１６３１の「Ａが」に修正される。

このあと、文生成装置２００は、抽出結果１６１０と修正後の抽出結果１６２０とに基づいて、単語列の抽出（ステップＳ５０４）、文生成テンプレートによる連結（ステップＳ５０５）、および活用語尾の変換（ステップＳ５０６）を実行する。このように、文生成装置２００は、照応関係から代名詞を固有名詞に変換して、適切な出力文を生成することができる。

図１７は、実施例３にかかるゼロ代名詞の補完例を示す説明図である。文生成装置２００は、先行入力文１６０１の『Ａが社内システムに関する資料を配布した。』と後続入力文１７０２の『その後、社内システムを説明した。』とのそれぞれに対し、木構造解析（ステップＳ５０１）を実行する。木構造解析（ステップＳ５０１）では、「Ａ」は、人名の固有名詞であると特定される。

また、文生成装置２００は、要約要素の取得（ステップＳ５０２）を実行することにより、先行入力文１６０１に関する抽出結果１６１０と、後続入力文１６０２に関する抽出結果１７２０とを出力する。先行入力文１６０１に関する抽出結果１６１０は、要約要素＃ａｎとして要約要素１６１１～１６１３を含む。後続入力文１７０２に関する抽出結果１７２０は、要約要素＃ａｎとして要約要素１６２２を含む。

要約要素の修正（ステップＳ５０３）において、文生成装置２００は、照応解析を実行することにより、先行入力文１６０１に関する抽出結果１６１０と後続入力文１７０２に関する抽出結果１７２０との間で照応関係を特定する。具体的には、たとえば、文生成装置２００は、後続入力文１７０２には主語が存在しないため、後続文の主語は先行文の主語「Ａが」であると特定する。したがって、文生成装置２００は、抽出結果１６１０内の主語「Ａが」を含む要約要素１６１１をゼロ代名詞として抽出結果１６２０に追加する。これにより、ゼロ代名詞が補完される。

このあと、文生成装置２００は、抽出結果１６１０と要約要素１６１１が追加された補完後の抽出結果１７２０とに基づいて、単語列の抽出（ステップＳ５０４）、文生成テンプレートによる連結（ステップＳ５０５）、および活用語尾の変換（ステップＳ５０６）を実行する。このように、文生成装置２００は、ゼロ代名詞を補完して、適切な出力文を生成することができる。

実施例４について説明する。実施例１～実施例３では、文生成装置２００は、日本語の入力文に対して日本語の出力文を生成する例について説明した。実施例４では、文生成装置２００は、英語の入力文に対して英語の出力文を生成する例について説明する。実施例４では、実施例１～実施例３との相違点を中心に説明するため、実施例１についての説明は省略する。

図１８は、英語の入力文の一例を示す説明図である。入力文１８００は、日本語の『運用については今後ということで、当事者の方の御意見なども聞いてやっていただきたいと思います。』の英訳文である。

図１９は、実施例４にかかる抽出ルールＤＢ３００の一例を示す説明図である。抽出ルールＤＢ１９００は、入力文１８００の言語が英語である場合に対応可能な抽出ルールを記憶するデータベースである。抽出ルールＤＢ１９００は、各種抽出ルールを記憶するデータベースである。抽出ルールＤＢ１９００は、文生成装置２００の記憶デバイス２０２に記憶される。また、抽出ルールＤＢ１９００は、文生成装置２００と通信可能なコンピュータに記憶されていてもよい。

抽出ルールＤＢ１９００は、図３の抽出ルールＤＢ３００と同様、たとえば、指示抽出ルールｉｒｅ１，ｉｒｅ２，…（ｉｒ１ｅ，ｉｒ２ｅ，…を区別しない場合は、単にｉｒｅと表記）と、決定抽出ルールｄｒ１ｅ，…（ｄｒ１ｅ，…を区別しない場合は、単にｄｒｅと表記）と、意見抽出ルールｏｒ１ｅ，…（ｏｒ１ｅ，…を区別しない場合は、単にｏｒｅと表記）と、質問抽出ルールｑｒ１，…（ｑｒ１ｅ，…を区別しない場合は、単にｑｒｅと表記）と、共通抽出ルールｃｒ１ｅ，…（ｃｒ１ｅ，…を区別しない場合は、単にｃｒｅと表記）とを記憶する。

ここで、指示抽出ルールｉｒ１ｅの詳細について具体的に説明する。２行目の「.ｔｙｐｅ＝ｒｏｏｔ＆．ＰＯＳ＝ＶＢＮ＆．ｌｅｍｍａ＝ｄｉｓｃｕｓｓ」は、係り受けの種類（ｔｙｐｅ）がルートであり、かつ、品詞が動詞の過去分詞形（ＶＢＮ）であり、かつ、その内容語（動詞）が「ｄｉｓｃｕｓｓ」を指定する記述である。これにより、文生成装置２００は、議論された内容に関する英語の入力文を要約要素の取得対象とすることができる。

３行目の「♯ａ１．ｔｙｐｅ＝ｎｓｕｂｊｐａｓｓ＆．ＰＯＳ＝ＮＮ＊」は、２行目の記述の子ノードとして、係り受けの種類（ｔｙｐｅ）が受動態の主語となる名詞（ｎｓｕｂｊｐａｓｓ）であり、かつ、品詞が名詞の単数形（ＮＮ）である要約要素♯ａ１を抽出する抽出条件である。

４行目の「．ｔｙｐｅ＝ａｕｘ＆．ＰＯＳ＝ＭＤ＆．ｌｅｍｍａ＝ｗｉｌｌ」は、２行目の記述の子ノードとして、係り受けの種類（ｔｙｐｅ）が動詞に係る助動詞（ａｕｘ）であり、かつ、品詞が助動詞（ＭＤ）である内容語「ｗｉｌｌ」を指定する記述である。

６行目の「♯ａ０．ｔｙｐｅ＝ａｄｖｃｌ＆．ＰＯＳ＝ＶＢ＆．ｌｅｍｍａ＝ｌｉｋｅ」は、係り受けの種類（ｔｙｐｅ）が副詞節修飾語（ａｄｖｃｌ）であり、かつ、品詞が動詞の原形（ＶＢ）である内容語「ｌｉｋｅ」を、要約要素＃ａ０として抽出する抽出条件である。

８行目の「．ｔｙｐｅ＝ｎｓｕｂｊ＆．ＰＯＳ＝ＰＲＰ＆．ｌｅｍｍａ＝Ｉ」は、６行目の抽出条件の子ノードとして、係り受けの種類（ｔｙｐｅ）が能動態の主語となる名詞（ｎｓｕｂｊ）であり、かつ、品詞が代名詞（ＰＲＰ）である内容語「Ｉ」を指定する記述である。

９行目の「．ｔｙｐｅ＝ａｕｘ＆．ＰＯＳ＝ＭＤ＆．ｌｅｍｍａ＝ｗｏｕｌｄ」は、６行目の抽出条件の子ノードとして、係り受けの種類（ｔｙｐｅ）が動詞に係る助動詞（ａｕｘ）であり、かつ、品詞が助動詞（ＭＤ）である内容語「ｗｏｕｌｄ」を指定する記述である。

１０行目の「．ｔｙｐｅ＝ｘｃｏｍｐ＆．ＰＯＳ＝ＶＢ」は、６行目の抽出条件の子ノードとして、係り受けの種類（ｔｙｐｅ）が開放句補語（ｘｃｏｍｐ）である動詞の原形（ＶＢ）を指定する記述である。

１１行目の「．ｔｙｐｅ＝ａｕｘ＆．ＰＯＳ＝ＴＯ＆．ｌｅｍｍａ＝ｔｏ」は、１０行目の記述の子ノードとして、係り受けの種類（ｔｙｐｅ）が動詞に係る助動詞（ａｕｘ）であり、かつ、品詞がＴＯ不定詞（ＴＯ）である内容語「ｔｏ」を指定する記述である。

１２行目の「♯ａ２．ｔｙｐｅ＝ｄｏｂｊ＆．ＰＯＳ＝Ｎ．＊＊)」は、１０行目の記述の子ノードとして、係り受けの種類（ｔｙｐｅ）が直接目的語（ｄｏｂｊ）であり、かつ、名詞である要約要素＃ａ２を抽出する抽出条件である。

また、共通抽出ルールｃｒ１ｅは、共通抽出ルールｃｒ１と同様、対象となる要約要素＃ａ０から削除対象の語を特定するという、いわゆる枝刈りをおこなうための枝刈り条件である。共通抽出ルールｃｒ１ｅの「（ｔｙｐｅ＿ｐｒｕｎｅｄ．ｄｏｂｊ）」は、係り受けの種類（ｔｙｐｅ）が直接目的語（ｄｏｂｊ）であるという条件式であり、「（ＰＯＳ＿ｐｒｕｎｅｄ．ＩＮ）」は、品詞が前置詞または従属接続詞（ＩＮ）であることを示す。すなわち、共通抽出ルールｃｒ１ｅは、要約要素＃ａ０から直接目的語（ｄｏｂｊ）と、前置詞または従属接続詞と、を削除するという枝刈り条件である。

図２０は、実施例４にかかる文生成テンプレートＤＢ４００の一例を示す説明図である。文生成テンプレートＤＢ２０００は、図４の文生成テンプレートＤＢ４００と同様、たとえば、文生成テンプレートｔｐ１ｅ，ｔｐ２ｅ，ｔｐ３ｅ，…（ｔｐ１ｅ，ｔｐ２ｅ，ｔｐ３ｅ，…を区別しない場合は、単にｔｐｅ）を記憶するデータベースである。文生成テンプレートＤＢ４００は、文生成装置２００の記憶デバイス２０２に記憶される。また、文生成テンプレートＤＢ２０００は、文生成装置２００と通信可能なコンピュータに記憶されていてもよい。

文生成テンプレートｔｐは、抽出した要約要素を文生成テンプレートｔｐｅ内の当該構成要素の位置に設定することにより、出力文を生成するためのテンプレートである。文生成テンプレートｔｐ１ｅの場合、要約要素＃ａ１，＃ａ２，＃ａ０が適用される。

＜文生成処理手順＞
実施例４にかかる文生成装置２００による文生成処理手順例では、文生成装置２００は、図５に示した木構造解析（ステップＳ５０１）、要約要素の取得（ステップＳ５０２）、要約要素の修正（ステップＳ５０３）、文生成テンプレートによる連結（ステップＳ５０５）、および活用語尾の変換（ステップＳ５０６）を実行して、一連の処理を終了する。

図２１は、実施例４にかかる木構造解析（ステップＳ５０１）による入力文１８００の木構造解析結果の一例を示す説明図である。木構造解析結果２１００は、抽出ルールの抽出対象となるデータである。木構造解析（ステップＳ５０１）では、文生成装置２００は、入力文１８００を木構造解析する。具体的には、たとえば、文生成装置２００は、入力文１００に対して単語単位で形態素解析および係り受け解析を実行する。これにより、木構造解析結果２１００が得られる。

なお、図２１の木構造解析結果２１００において、図１９で示したもののほか、「ｄｅｔ」は限定詞、「ｐｒｅｐ」は前置詞、「ｐｏｂｊ」は前置詞の目的語、「ＤＴ」は冠詞、「ｍａｒｋ」は接続詞、「ＮＮＳ」は名詞（複数形）、「ｒｃｍｏｄ」は関係詞節、「ＷＰはＷｈ代名詞（単数形）である。

図２２は、実施例４にかかる要約要素の取得（ステップＳ５０２）による要約要素の取得結果を示す説明図である。要約要素の取得（ステップＳ５０２）では、文生成装置２００は、たとえば、抽出ルールＤＢ１９００のすべての抽出ルールを木構造解析結果２１００に適用して、要約要素を抽出する。具体的には、たとえば、文生成装置２００は、指示抽出ルールｉｒ１ｅの３行目の抽出条件Ｃ１ｅを木構造解析結果２１００から特定し、抽出条件Ｃ１ｅに該当する要約要素＃ａ１として、動詞の受動態「ｄｉｓｃｕｓｓｅｄ」の主語である「ｔｈｅｏｐｅｒａｔｉｏｎ」を抽出する。

また、文生成装置２００は、指示抽出ルールｉｒ１ｅの６行目の抽出条件Ｃ２ｅを木構造解析結果６００から特定し、抽出条件Ｃ２ｅに該当する要約要素＃ａ０として「ｓｏＩｗｏｕｌｄｌｉｋｅｔｏｈｅａｒｔｈｅｏｐｉｎｉｏｎｏｆｔｈｏｓｅｗｈｏａｒｅｉｎｖｏｌｖｅｄｉｎｔｈｅｐｒｏｊｅｃｔ」を抽出する。また、文生成装置２００は、指示抽出ルールｉｒ１ｅの１２行目の抽出条件Ｃ２ｅを木構造解析結果２１００から特定し、抽出条件Ｃ２ｅに該当する要約要素＃ａ２として「ｔｈｅｏｐｉｎｉｏｎｏｆｔｈｏｓｅｗｈｏａｒｅｉｎｖｏｌｖｅｄｉｎｔｈｅｐｒｏｊｅｃｔ．」を抽出する。

また、要約要素の取得（ステップＳ５０２）では、文生成装置２００は、抽出した要約要素について共通抽出ルールｃｒ１ｅに該当する場合には、枝刈りを実行する。

図２３は、実施例４にかかる要約要素の修正（ステップＳ５０３）による枝刈り結果を示す説明図である。図２３では、要約要素＃ａ０から、共通抽出ルールｃｒ１ｅに規定された直接目的語である「ｔｈｅｏｐｉｎｉｏｎｏｆｔｈｏｓｅｗｈｏａｒｅｉｎｖｏｌｖｅｄｉｎｔｈｅｐｒｏｊｅｃｔ」と、前置詞または従属接続詞である「ｓｏ」を削除して、要約要素＃ａ０を「Ｉｗｏｕｌｄｌｉｋｅｔｏｈｅａｒ」にする。以降、特に指定しない限り、実施例４において、要約要素＃ａ０は、枝刈り後の「Ｉｗｏｕｌｄｌｉｋｅｔｏｈｅａｒ」とする。

実施例４では、要約要素の修正（ステップＳ５０３）のあと、文生成装置２００は、木構造解析（ステップＳ５０１）において単語単位で木構造解析を実行したため、要約要素からの単語列の抽出（ステップＳ５０４）を実行せずに、文生成テンプレートによる連結（ステップＳ５０５）を実行する。

図２４は、実施例４にかかる文生成テンプレートによる連結（ステップＳ５０５）での連結結果を示す説明図である。文生成テンプレートによる連結（ステップＳ５０５）では、文生成装置２００は、要約要素＃ａ０～＃ａ２を、文生成テンプレートｔｐ１ｅに適用することにより、連結結果２４００として「Ａｂｏｕｔｔｈｅｏｐｅｒａｔｉｏｎ，Ｉｗｏｕｌｄｌｉｋｅｔｏｈｅａｒｔｈｅｏｐｉｎｉｏｎｏｆｔｈｏｓｅｗｈｏａｒｅｉｎｖｏｌｖｅｄｉｎｔｈｅｐｒｏｊｅｃｔ．」を生成する。

活用語尾の変換（ステップＳ５０６）では、文生成装置２００は、文生成テンプレートによる連結（ステップＳ５０５）での連結結果２４００について活用語尾を変換し、出力文を出力する。活用語尾の変換（ステップＳ５０６）としては、主語に合わせて動詞に三単現のｓ（ｅｓ）を付与したり削除したりする処理があるが、連結結果２４００ではその必要がないため、文生成装置２００は、連結結果２４００を出力文として出力する。

このように、入力文１８００の言語が英語であっても、実施例１と同様、入力文１８００を平易化した出力文を出力することにより、可能な限り文生成を自動化して人間の人的作業の低減を図ることができる。また、複文間の時制、否定形および仮定形の検出およびその検出結果に関する要約要素の修正（ステップＳ５０３）についても、実施例４にかかる文生成装置２００は、実施例２で示した処理に従って、実行することができる。また、照応解析（照応およびゼロ代名詞）およびその照応解析結果に関する要約要素の修正（ステップＳ５０３）についても、実施例４にかかる文生成装置２００は、実施例３で示した処理に従って、実行することができる。

また、上述した実施例１～実施例４では、言語が日本語または英語の例について説明したが、文法が共通する他の言語については、文法が共通する範囲で実施例１～実施例４を適用することができる。

また、上述した実施例１～実施例４にかかる文生成装置２００は、下記（１）～（１１）のように構成することもできる。

（１）プログラムを実行するプロセッサ２０１と、プログラムを記憶する記憶デバイス２０２と、を有する文生成装置２００では、プロセッサ２０１は、入力文１００を構成する単語列である１以上の要約要素（＃ａ０，＃ａ１，＃ａ２）を取得する取得処理（ステップＳ５０２）と、単語列の少なくとも一部を指定する１以上の指定要素によって文のひな型を構成する文生成テンプレートｔｐを参照して、取得処理（ステップＳ５０２）によって取得された要約要素（＃ａ０，＃ａ１，＃ａ２）の単語列の少なくとも一部を指定可能な文生成テンプレートｔｐ内の指定要素（♯ａ１、♯ａ２、♯ａ２.ｃａｓｅ、♯ａ０.ｌｅｍｍａ）で指定することにより、出力文１０１を生成する生成処理（ステップＳ５０５）と、を実行する。

あらかじめ文生成テンプレートｔｐを設定しておくことにより、入力文１００を適切な形に変換することができる。これにより、入力文１００に基づく出力文１０１の作成を可能な限り自動化し、人的作業の低減を図ることができる。

（２）上記（１）の文生成装置２００において、プロセッサ２０１は、入力文１００を木構造解析して木構造解析結果を出力する木構造解析処理（ステップＳ５０１）を実行し、取得処理（ステップＳ５０２）では、プロセッサ２０１は、要約要素（＃ａ０，＃ａ１，＃ａ２）を抽出する抽出ルールｉｒを用いて、木構造解析処理（ステップＳ５０１）によって出力された木構造解析結果６００に基づいて、入力文１００から要約要素（＃ａ０，＃ａ１，＃ａ２）を抽出する（Ｓ５０２）。

あらかじめ抽出ルールｉｒおよび文生成テンプレートｔｐを設定しておくことにより、抽出ルールｉｒによって入力文１００から抽出された要約要素の単語列を用いて、入力文１００を適切な形に変換することができる。これにより、入力文１００に基づく出力文１０１の作成を可能な限り自動化し、人的作業の低減を図ることができる。

（３）上記（１）の文生成装置２００において、プロセッサ２０１は、要約要素（＃ａ０，＃ａ１，＃ａ２）を修正する修正処理（ステップＳ５０３）を実行し、生成処理（ステップＳ５０５）では、プロセッサ２０１は、文生成テンプレートｔｐを参照して、修正処理（ステップＳ５０３）による修正後の要約要素の単語列（「聞いてやっていただきたい」）を指定可能な文生成テンプレートｔｐ内の指定要素（＃ａ０．ｌｅｍｍａ）で指定することにより、出力文１０１を生成する。

これにより、修正済みの要約要素を用いて、入力文１００を入力文１００よりも平易化された適切な形に変換することができる。したがって、出力文１０１の作成を可能な限り自動化し、人的作業の低減を図ることができる。

（４）上記（３）の文生成装置２００において、修正処理（ステップＳ５０３）では、プロセッサ２０１は、要約要素の一部の単語列を削除する削除ルール（共通抽出ルールｃｒ１）に基づいて、要約要素（「聞いてやっていただきたい」）の一部の単語列（「明日」）を削除する。

これにより、文生成テンプレートｔｐの適用前に不要な単語を削除することができるため、入力文１００を入力文１００よりも簡素化された適切な形に変換することができる。したがって、出力文１０１の作成を可能な限り自動化し、人的作業の低減を図ることができる。

（５）上記（３）の文生成装置２００において、修正処理（ステップＳ５０３）では、プロセッサ２０１は、入力文１００に含まれている複文の先行文を構成する第１述語（「配布し」）を含む第１要約要素１３１３と、複文の後続文を構成する第２述語（「説明した」）を含む第２要約要素１３１５と、について、第１述語の時制と第２述語の時制とが異なる場合、第１述語の時制を第２述語の時制に変更する。

これにより、文生成テンプレートｔｐの適用前に時制の一致が実行されるため、入力文１００をより意味が明確な形に変換することができる。したがって、出力文１０１の作成を可能な限り自動化し、人的作業の低減を図ることができる。

（６）上記（３）の文生成装置２００において、修正処理（ステップＳ５０３）では、プロセッサ２０１は、入力文１００に含まれている複文の先行文を構成する第１述語（「持ち出して」）を含む第１要約要素１４１３と、複文の後続文を構成する第２述語（「漏らさないでください」）を含む第２要約要素１４１５と、について、第１述語が肯定形であり、かつ、第２述語が否定形である場合、第１述語を否定形に変更する。

これにより、文生成テンプレートｔｐの適用前に否定表現の一致が実行されるため、入力文１００をより意味が明確な形に変換することができる。したがって、出力文１０１の作成を可能な限り自動化し、人的作業の低減を図ることができる。

（７）上記（３）の文生成装置２００において、修正処理（ステップＳ５０３）では、プロセッサ２０１は、入力文１００に含まれている複文の先行文を構成する第１述語（「持ち帰って」）を含む第１要約要素１５１２と、複文の後続文を構成する第２述語（「保存すれば」）を含む第２要約要素１５１３と、について、第１述語が断定形であり、かつ、第２述語が仮定形である場合、第１述語を仮定形に変更する。

これにより、文生成テンプレートｔｐの適用前に仮定表現の一致が実行されるため、入力文１００をより意味が明確な形に変換することができる。したがって、出力文１０１の作成を可能な限り自動化し、人的作業の低減を図ることができる。

（８）上記（３）の文生成装置２００において、修正処理（ステップＳ５０３）では、プロセッサ２０１は、先行入力文１６０１に含まれる特定の名詞の第１単語列（「Ａ」）と、先行入力文１６０１に後続する後続入力文１６０２に含まれる照応詞の第２単語列（「彼」）と、が照応することを検出し、第２単語列（「彼」）を、第１単語列（「Ａ」）に変更する。

これにより、文生成テンプレートｔｐの適用前に照応解析が実行されるため、入力文１００を照応関係が明確な形に変換することができる。したがって、出力文の作成を可能な限り自動化し、人的作業の低減を図ることができる。

（９）上記（３）の文生成装置２００において、修正処理（ステップＳ５０３）では、プロセッサ２０１は、第１入力文１６０１に含まれる特定の名詞の単語列（「Ａ」）またはその照応詞（「彼」または「彼女」）が、第１入力文１６０１に後続する第２入力文１６０２に含まれていないことを検出し、特定の名詞の単語列（「Ａ」）を含む要約要素１６１１を、第２入力文１６０２の１以上の要約要素の集合に追加する。

これにより、文生成テンプレートｔｐの適用前に照応解析が実行されるため、入力文１００をゼロ代名詞の単語列を補完して明確な形に変換することができる。したがって、出力文の作成を可能な限り自動化し、人的作業の低減を図ることができる。

（１０）上記（１）の文生成装置２００において、プロセッサ２０１は、出力文１０１において２つの動詞（「聞く」と「まとめる」）が連結されている場合、先頭側の動詞（「聞く」）の活用語尾（「く」）を変換する変換処理（ステップＳ５０６）を実行する。

これにより、入力文１００を文法的に正しくて違和感のない適切な形に変換することができる。したがって、出力文１０１の作成を可能な限り自動化し、人的作業の低減を図ることができる。

（１１）上記（１）の文生成装置２００において、プロセッサ２０１は、出力文１０１における主語と述語との関係に基づいて、述語内の動詞の活用語尾を変換する変換処理（ステップＳ５０６）を実行する。

なお、本発明は前述した実施例に限定されるものではなく、添付した特許請求の範囲の趣旨内における様々な変形例及び同等の構成が含まれる。たとえば、前述した実施例は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに本発明は限定されない。また、ある実施例の構成の一部を他の実施例の構成に置き換えてもよい。また、ある実施例の構成に他の実施例の構成を加えてもよい。また、各実施例の構成の一部について、他の構成の追加、削除、または置換をしてもよい。

また、前述した各構成、機能、処理部、処理手段等は、それらの一部又は全部を、たとえば集積回路で設計する等により、ハードウェアで実現してもよく、プロセッサ２０１がそれぞれの機能を実現するプログラムを解釈し実行することにより、ソフトウェアで実現してもよい。

各機能を実現するプログラム、テーブル、ファイル等の情報は、メモリ、ハードディスク、ＳＳＤ（ＳｏｌｉｄＳｔａｔｅＤｒｉｖｅ）等の記憶装置、又は、ＩＣ（ＩｎｔｅｔｐａｔｅｄＣｉｒｃｕｉｔ）カード、ＳＤカード、ＤＶＤ（ＤｉｇｉｔａｌＶｅｒｓａｔｉｌｅＤｉｓｃ）の記録媒体に格納することができる。

また、制御線や情報線は説明上必要と考えられるものを示しており、実装上必要な全ての制御線や情報線を示しているとは限らない。実際には、ほとんど全ての構成が相互に接続されていると考えてよい。

ｃｒ共通抽出ルール
ｄｒ決定抽出ルール
ｉｒ指示抽出ルール
ｏｒ意見抽出ルール
ｑｒ質問抽出ルール
ｔｐ文生成テンプレート
３００抽出ルールＤＢ
４００文生成テンプレートＤＢ
１００入力文
１０１出力文
１０２議事録
２００文生成装置
２０１プロセッサ
２０２記憶デバイス
６００木構造解析結果
１９００抽出ルールＤＢ

Claims

プログラムを実行するプロセッサと、前記プログラムを記憶する記憶デバイスと、を有する文生成装置であって、
前記プロセッサは、
入力文を木構造解析して前記入力文を構成する単語列である１以上の要約要素からなる木構造解析結果を出力する木構造解析処理と、
前記要約要素を抽出する抽出条件を含む抽出ルールを用いて、前記木構造解析処理によって出力された木構造解析結果から、前記抽出条件に該当する特定の要約要素を取得する取得処理と、
前記要約要素を指定して当該要約要素から内容語または特定の品詞の単語を抽出する１以上の指定要素によって文のひな型を構成する文生成テンプレートを参照して、前記特定の要約要素ごとに、前記特定の要約要素を指定した特定の指定要素に該当する特定の単語を前記特定の要約要素から抽出して前記文生成テンプレートに適用することにより、出力文を生成する生成処理と、
を実行することを特徴とする文生成装置。
請求項１に記載の文生成装置であって、
前記プロセッサは、
前記生成処理では、前記プロセッサは、前記特定の指定要素と前記特定の単語との組み合わせを出力する、
ことを特徴とする文生成装置。
請求項１に記載の文生成装置であって、
前記プロセッサは、
前記要約要素を修正する修正処理を実行し、
前記生成処理では、前記プロセッサは、前記文生成テンプレートを参照して、前記修正処理による修正後の特定の要約要素ごとに、前記修正後の特定の要約要素を指定した特定の指定要素に該当する特定の単語を前記修正後の特定の要約要素から抽出して前記文生成テンプレートに適用することにより、前記出力文を生成する、
ことを特徴とする文生成装置。
請求項３に記載の文生成装置であって、
前記修正処理では、前記プロセッサは、前記要約要素の一部の単語列を削除する削除ルールに基づいて、前記要約要素の一部の単語列を削除する、
ことを特徴とする文生成装置。
請求項３に記載の文生成装置であって、
前記修正処理では、前記プロセッサは、前記入力文に含まれている複文の先行文を構成する第１述語を含む第１要約要素と、前記複文の後続文を構成する第２述語を含む第２要約要素と、について、前記第１述語の時制と前記第２述語の時制とが異なる場合、前記第１述語の時制を前記第２述語の時制に変更する、
ことを特徴とする文生成装置。
請求項３に記載の文生成装置であって、
前記修正処理では、前記プロセッサは、前記入力文に含まれている複文の先行文を構成する第１述語を含む第１要約要素と、前記複文の後続文を構成する第２述語を含む第２要約要素と、について、前記第１述語が肯定形であり、かつ、前記第２述語が否定形である場合、前記第１述語を否定形に変更する、
ことを特徴とする文生成装置。
請求項３に記載の文生成装置であって、
前記修正処理では、前記プロセッサは、前記入力文に含まれている複文の先行文を構成する第１述語を含む第１要約要素と、前記複文の後続文を構成する第２述語を含む第２要約要素と、について、前記第１述語が断定形であり、かつ、前記第２述語が仮定形である場合、前記第１述語を仮定形に変更する、
ことを特徴とする文生成装置。
請求項３に記載の文生成装置であって、
前記修正処理では、前記プロセッサは、第１入力文に含まれる特定の名詞の第１単語列と、前記第１入力文に後続する第２入力文に含まれる照応詞の第２単語列と、が照応することを検出し、前記第２単語列を、前記第１単語列に変更する、
ことを特徴とする文生成装置。
請求項３に記載の文生成装置であって、
前記修正処理では、前記プロセッサは、第１入力文に含まれる特定の名詞の単語列またはその照応詞が、前記第１入力文に後続する第２入力文に含まれていないことを検出し、前記特定の名詞の単語列を含む要約要素を、前記第２入力文の１以上の要約要素の集合に追加する、
ことを特徴とする文生成装置。
請求項１に記載の文生成装置であって、
前記プロセッサは、
前記出力文において２つの動詞が連結されている場合、先頭側の動詞の活用語尾を変換する変換処理を実行する、
ことを特徴とする文生成装置。
請求項１に記載の文生成装置であって、
前記プロセッサは、
前記出力文における主語と述語との関係に基づいて、前記述語内の動詞の活用語尾を変換する変換処理を実行する、
ことを特徴とする文生成装置。
プログラムを実行するプロセッサと、前記プログラムを記憶する記憶デバイスと、を有する文生成装置が実行する文生成方法であって、
前記文生成方法は、
前記プロセッサが、
入力文を木構造解析して前記入力文を構成する単語列である１以上の要約要素からなる木構造解析結果を出力する木構造解析処理と、
前記要約要素を抽出する抽出条件を含む抽出ルールを用いて、前記木構造解析処理によって出力された木構造解析結果から、前記抽出条件に該当する特定の要約要素を取得する取得処理と、
前記要約要素を指定して当該要約要素から内容語または特定の品詞の単語を抽出する１以上の指定要素によって文のひな型を構成する文生成テンプレートを参照して、前記特定の要約要素ごとに、前記特定の要約要素を指定した特定の指定要素に該当する特定の単語を前記特定の要約要素から抽出して前記文生成テンプレートに適用することにより、出力文を生成する生成処理と、
を実行することを特徴とする文生成方法。
プロセッサに、
入力文を木構造解析して前記入力文を構成する単語列である１以上の要約要素からなる木構造解析結果を出力する木構造解析処理と、
前記要約要素を抽出する抽出条件を含む抽出ルールを用いて、前記木構造解析処理によって出力された木構造解析結果から、前記抽出条件に該当する特定の要約要素を取得する取得処理と、
前記要約要素を指定して当該要約要素から内容語または特定の品詞の単語を抽出する１以上の指定要素によって文のひな型を構成する文生成テンプレートを参照して、前記特定の要約要素ごとに、前記特定の要約要素を指定した特定の指定要素に該当する特定の単語を前記特定の要約要素から抽出して前記文生成テンプレートに適用することにより、出力文を生成する生成処理と、
を実行させることを特徴とする文生成プログラム。