JP5256654B2

JP5256654B2 - 文章分割プログラム、文章分割装置および文章分割方法

Info

Publication number: JP5256654B2
Application number: JP2007173440A
Authority: JP
Inventors: 秀富士; 友樹長瀬; 清司大倉; 明潮田
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2007-06-29
Filing date: 2007-06-29
Publication date: 2013-08-07
Anticipated expiration: 2027-06-29
Also published as: US9009023B2; US20090006080A1; JP2009015398A

Description

この発明は、文章分割プログラム、文章分割装置および文章分割方法に関する。

一般に、定型性の高い文章（例えば、特許分野における「請求項」の文章、料理分野における「レシピ」の文章など）に対して処理を行うにあたっては、文章を構成要素に分割してから処理を行うことで、処理の精度や効率が向上すると考えられている。例えば、機械翻訳のような言語処理システムによる処理を行うにあたっては、言語処理システムに入力された文章を予め短い単位に分割してから処理を行うことで、処理の精度が向上する。なぜなら、言語処理システムは、長い文章に対する処理の精度が低い一方で、短い文章に対する処理の精度が格段に高いからである。なお、人手による翻訳作業を行うにあたっても、翻訳対象の文章を予め短い単位に分割してから処理を行うことで、処理の効率が向上する。なぜなら、分割された文章は翻訳作業を行う人にとって見通しがよく、原文で出現する情報の順序関係を保持した訳文を作成し易いからである。

このため、従来より、定型性の高い文章に対して処理を行うシステムにおいて活用することを目的として、文章を自動的に分割する『自動分割技術』が開発されている。例えば、『表層上の手がかりによって文章を分割するシステム』や、『文法規則によって文章を分割するシステム』などである。また、自動分割技術に関連する技術として、『定型パターンを用いて翻訳を行うシステム』などもある。

上記したシステムについて簡単に説明すると、まず、『表層上の手がかりによって文章を分割するシステム』は、「〜し、」や「〜と、」などの正規表現を予め指定し、指定した正規表現に該当する箇所で文章を分割するものである。また、『文法規則によって文章を分割するシステム』は、構文解析の規則として分割箇所を見つけるような文法規則を予め作成し、作成した文法規則による構文解析を実行して文章を分割するものである。また、『定型パターンを用いて翻訳を行うシステム』は、「これは本（変数部分）です」などの定型パターンを予め作成し、入力された文章が定型パターンの変数部分を置換したものである場合に、定型パターンに沿った訳文を出力するものである。

なお、特許文献１には、システムが、入力された文章を解析する際の最小解析範囲を決定して表示部に表示し、システムの利用者が、最小解析範囲に関する修正指示を入力するなどして、文章を分割する技術が開示されている。また、特許文献２には、システムが、形態素をまとめ上げる辞書や規則を予め保持し、保持している辞書や規則にしたがって形態素のまとめ上げを行うなどして、文章を分割する技術が開示されている。

特開平１０−４９５３５号公報特開平７−１０５２１４号公報

ところで、上記した従来の技術では、以下に説明するように、定型性の高い文章を分割する際に、文章全体として妥当性の高い分割結果を得ることができないという課題があった。すなわち、例えば、『表層上の手がかりによって文章を分割するシステム』は、局所的な表層上の手がかりによって文章を分割するにすぎないことから、構文的なあいまい性に対応することができず、結果として、文章全体として妥当性の高い分割結果を得ることができない。また、例えば、『文法規則によって文章を分割するシステム』は、文法規則による構文解析を実行して文章を分割するにすぎないことから、定型の特徴に沿って分割することはできず、結果として、文章全体として妥当性の高い分割結果を得ることができない。また、例えば、『定型パターンを用いて翻訳を行うシステム』は、名詞句等を変数部分とする定型パターンを予め作成するにすぎないことから、そもそも入力された文章が定型パターンにヒットする確率が低い。なお、同様に、特許文献１や２に開示されている技術も、定型性の高い文章を分割する際に、文章全体として妥当性の高い分割結果を得ることができるものではない。

また、上記した従来の技術では、以下に説明するように、上記の課題に加え、定型性の高い文章を、簡易かつ柔軟に分割することができないという課題があった。すなわち、例えば、『文法規則によって文章を分割するシステム』において、文法規則を作成することができるのは、システムを熟知した開発者に限られることから、文法規則は、システムに作り付けの状態で提供されることになる。そうであるとすると、システムの利用者は、定型の特徴に沿って文法規則をチューニングすることができず、また、システムが対応していない新規の文種（文章の種類）に関する文法規則を作成することもできないので、定型性の高い文章を、簡易かつ柔軟に分割することができない。

また、上記した従来の技術では、以下に説明するように、上記の課題に加え、複数の分割候補が結果として得られた場合に、最適な候補を選択することができないという課題があった。すなわち、例えば、『定型パターンを用いて翻訳を行うシステム』において、文章を定型パターンにヒットさせると、複数の定型パターンにヒットする場合があるが、このような場合に、最適な定型パターンを選択することができない。

また、上記した従来の技術では、以下に説明するように、上記の課題に加え、長い文章に対応することができないという課題があった。すなわち、例えば、『文法規則によって文章を分割するシステム』等に関連する一般的な構文解析システムにおいて、先に文章全体の構文解析を実行してから分割箇所を見つける手法の場合には、入力された文章が長いと、そもそも構文解析自体に失敗してしまい、文章を分割することができない。

そこで、この発明は、上記した従来技術の課題を解決するためになされたものであり、定型性の高い文章を分割する際に、文章全体として妥当性の高い分割結果を得ることが可能な文章分割プログラム、文章分割装置および文章分割方法を提供することを第一の目的とする。

また、この発明は、上記の目的に加え、定型性の高い文章を、簡易かつ柔軟に分割することが可能な文章分割プログラム、文章分割装置および文章分割方法を提供することを第二の目的とする。

また、この発明は、上記の目的に加え、複数の分割候補が結果として得られた場合に、最適な候補を選択することが可能な文章分割プログラム、文章分割装置および文章分割方法を提供することを第三の目的とする。

また、この発明は、上記の目的に加え、長い文章に対応することが可能な文章分割プログラム、文章分割装置および文章分割方法を提供することを第四の目的とする。

上述した課題を解決し、目的を達成するため、本発明は、文章の構造に特有の定型性を有する定型文章を分割する文章分割方法をコンピュータに実行させる文章分割プログラムであって、前記構造との関係で前記定型文章の分割に適した箇所が利用者によって文章の属性情報を用いて表現された小節定義が記憶部に予め記憶されている状況で、分割対象となる定型文章を当該記憶部に記憶されている小節定義に基づいて分割し、分割後の個々の文章である小節を並べた小節列を生成する小節列生成手順と、前記定型文章に適した構造が利用者によって前記小節定義ごとの組み合わせとして表現された構造パターンが記憶部に予め記憶されている状況で、前記小節列生成手順によって生成された小節列と当該記憶部に記憶されている構造パターンとを照合する照合手順と、前記照合手順によって前記小節列と一致すると照合された構造パターンを当該定型文章の分割結果として選択する選択手順と、をコンピュータに実行させることを特徴とする。

また、本発明は、上記の発明において、前記照合手順によって照合された結果、複数の構造パターンが前記小節列と一致すると照合された場合に、前記小節列と当該複数の構造パターン各々との一致の度合いを評価する評価手順と、前記評価手順によって評価された結果に従って、前記照合手順によって前記小節列と一致すると照合された複数の構造パターンの順序をソートするソート手順とをさらにコンピュータに実行させることを特徴とする。

また、本発明は、上記の発明において、前記小節列生成手順によって生成された小節列について、当該小節列を構成する小節間の係受けを解析する係受け解析手順と、前記係受け解析手順によって解析された結果に従って、前記定型文章の構造において骨格となる骨格小節を修飾する小節を消失させることで、前記小節列を当該骨格小節のみの骨格小節列とする骨格小節列作成手順とをさらにコンピュータに実行させ、前記照合手順は、前記骨格小節列作成手順によって作成された骨格小節列と前記構造パターンとを照合することを特徴とする。

また、本発明は、文章の構造に特有の定型性を有する定型文章を分割する文章分割装置であって、前記構造との関係で前記定型文章の分割に適した箇所が利用者によって文章の属性情報を用いて表現された小節定義を予め記憶している小節定義記憶手段と、前記定型文章に適した構造が利用者によって前記小節定義ごとの組み合わせとして表現された構造パターンを予め記憶している構造パターン記憶手段と、分割対象となる定型文章を前記小節定義記憶手段に記憶されている小節定義に基づいて分割し、分割後の個々の文章である小節を並べた小節列を生成する小節列生成手段と、前記小節列生成手段によって生成された小節列と前記構造パターン記憶手段に記憶されている構造パターンとを照合する照合手段と、前記照合手段によって前記小節列と一致すると照合された構造パターンを当該定型文章の分割結果として選択する選択手段と、を備えたことを特徴とする。

また、本発明は、文章の構造に特有の定型性を有する定型文章を分割する文章分割方法であって、前記構造との関係で前記定型文章の分割に適した箇所が利用者によって文章の属性情報を用いて表現された小節定義が記憶部に予め記憶されている状況で、分割対象となる定型文章を当該記憶部に記憶されている小節定義に基づいて分割し、分割後の個々の文章である小節を並べた小節列を生成する小節列生成工程と、前記定型文章に適した構造が利用者によって前記小節定義ごとの組み合わせとして表現された構造パターンが記憶部に予め記憶されている状況で、前記小節列生成工程によって生成された小節列と当該記憶部に記憶されている構造パターンとを照合する照合工程と、前記照合工程によって前記小節列と一致すると照合された構造パターンを当該定型文章の分割結果として選択する選択工程と、を含んだことを特徴とする。

本発明によれば、文章の構造に特有の定型性を有する定型文章を分割する文章分割方法をコンピュータに実行させる文章分割プログラムであって、構造との関係で定型文章の分割に適した箇所が利用者によって文章の属性情報を用いて表現された小節定義が記憶部に予め記憶されている状況で、分割対象となる定型文章を記憶部に記憶されている小節定義に基づいて分割し、分割後の個々の文章である小節を並べた小節列を生成し、定型文章に適した構造が利用者によって小節定義ごとの組み合わせとして表現された構造パターンが記憶部に予め記憶されている状況で、生成した小節列と記憶部に記憶されている構造パターンとを照合し、小節列と一致すると照合された構造パターンを定型文章の分割結果として選択するので、定型性の高い文章を分割する際に、文章全体として妥当性の高い分割結果を得ることが可能になる。また、請求項１、４または５の発明によれば、定型性の高い文章を、簡易かつ柔軟に分割することが可能になる。

また、本発明によれば、照合した結果、複数の構造パターンが小節列と一致すると照合された場合に、小節列と複数の構造パターン各々との一致の度合いを評価し、評価した結果に従って、小節列と一致すると照合された複数の構造パターンの順序をソートするので、複数の分割候補が結果として得られた場合に、最適な候補を選択することが可能になる。

また、本発明によれば、生成した小節列について、小節列を構成する小節間の係受けを解析し、解析した結果に従って、定型文章の構造において骨格となる骨格小節を修飾する小節を消失させることで、小節列を骨格小節のみの骨格小節列とし、作成した骨格小節列と構造パターンとを照合するので、長い文章であっても単純な構造パターンで記述することが可能になる。

以下に添付図面を参照して、本発明に係る文章分割プログラム、文章分割装置および文章分割方法の実施例を詳細に説明する。なお、以下では、以下の実施例で用いる主要な用語、実施例１に係る文章分割装置の概要および特徴、実施例１に係る文章分割装置の構成および処理の手順、実施例１の効果を順に説明し、次に、他の実施例について説明する。

［用語の説明］
まず最初に、以下の実施例で用いる主要な用語を説明する。以下の実施例で用いる「文章」とは、形態素（意味を有する最小の言語単位）で構成された一つもしくは複数の文のことである。例えば、「文章」とは、『生姜をすりおろし、肉を食べやすい大きさに切り、よく混ぜ合わせる。』などの文のことである。

ところで、「文章」は、一般的には、「文章」の書き手や話し手によって自由な「構造」で作成されるものであるが、このような自由な「構造」の「文章」の他に、「定型性」を有する「定型文章」というものが存在する。

ここでいう「定型性」とは、「文章」の属する分野などによって、当該「文章」の「構造」が、ある程度限定的に（型にあてはめられるように）定められる性質のことである。具体的に例を挙げて説明すると、『生姜をすりおろし、肉を食べやすい大きさに切り、よく混ぜ合わせる。』という「文章」が、料理の分野における「定型文章」であるとする。仮に、料理の分野における「定型文章」の「定型」が、動詞連用中止形の後に読点が連接する表現（例えば、『〜し、』など）が料理の準備手順を表し、動詞終止形の後に句点が連接する表現（例えば、『〜する。』など）が準備手順で準備してきた食材に対する処理を表す、というものであるとすると、『生姜をすりおろし、』が、料理の準備手順の一つであり、『肉を食べやすい大きさに切り、』が、料理の準備手順の一つであり、『よく混ぜ合わせる。』が、すりおろした生姜や食べやすい大きさに切った肉に対する処理であるということになる。

もっとも、「定型性」は、どの「文章」にもあてはまるというものではない。例えば、『電話し、夕食を食べて、寝る。』という「文章」において、『電話し、』や『夕食を食べて、』は、動詞連用中止形の後に読点が連接する表現であるが、料理の準備手順を表すものではなく、『寝る。』は、動詞終止形の後に句点が連接する表現であるが、準備手順で準備してきた食材に対する処理を表すものではない。すなわち、「定型性」とは、「文章」の属する分野などによって、当該「文章」に特有なものであると考えられる。

上記してきたように、「定型文章」は、一般的な「文章」とは異なり、その「構造」に特有の「定型性」を有するものであることから、このような「定型性」の高い文章を分割する際には、文章全体として妥当性の高い分割結果を得ることができるのではないかとの期待がある。本発明に係る文章分割装置は、このような期待に応えるべく、「定型性」の高い「文章」を分割する際に、文章全体として妥当性の高い分割結果を得ることを目的の一つとするものである。

なお、以下の実施例においては、「文章」として日本語の「文章」を想定し、本発明に係る文章分割装置が、日本語の「文章」を分割する事例について説明するが、本発明はこれに限られるものではない。日本語以外の他の言語の「文章」を想定し、本発明に係る文章分割装置が、日本語以外の他の言語の「文章」を分割する事例にも、本発明を同様に適用することができる。また、以下の実施例においては、「文章」として一つの文を想定し、本発明に係る文章分割装置が、一つの文を分割する事例について説明するが、本発明はこれに限られるものではない。「文章」として複数の文を想定し、本発明に係る文章分割装置が、複数の文を分割する事例にも、本発明を同様に適用することができる。

［実施例１に係る文章分割装置の概要および特徴］
続いて、図１を用いて、実施例１に係る文章分割装置の概要および特徴を説明する。図１は、実施例１に係る文章分割装置の概要および特徴を説明するための図である。

実施例１に係る文章分割装置は、上記したように、文章の構造に特有の定型性を有する定型文章を分割することを概要とし、文章全体として妥当性の高い分割結果を得ることを主たる特徴とする。

この主たる特徴について簡単に説明すると、実施例１に係る文章分割装置は、図１に示すように、小節定義記憶部に、小節定義を予め記憶している。ここで、小節定義とは、定型文章の構造との関係で当該定型文章の分割に適した箇所が、利用者によって文章の属性情報を用いて表現されたものである。図１の例で説明すると、小節定義記憶部は、料理の分野における定型文章の分割に適した小節定義を記憶するものであり、「＊＋連用中止句＋読点」、「＊＋動詞連用形」および「＊＋動詞終止形＋句点」を予め記憶している。このように、図１の例では、小節定義は、形態素をまとめ上げた文節列の右端の表現で表現されている。

「＊＋連用中止句＋読点」は、動詞連用中止形の後に読点が連接する表現（例えば、『〜し、』など）を右端として、左隣の小節の直前の文節まで伸ばしたものを、小節としてまとめ上げることを意味している。また、「＊＋動詞連用形」は、動詞連用形の表現（例えば、『〜して』など）を右端として、左隣の小節の直前の文節まで伸ばしたものを、小節としてまとめ上げることを意味している。また、「＊＋動詞終止形＋句点」は、動詞終止形の後に句点が連接する表現（例えば、『〜する。』など）を右端として、左隣の小節の直前の文節まで伸ばしたものを、小節としてまとめ上げることを意味している。なお、（連中）、（連用）および（終止）は、各々の小節定義について小節ラベルを付与したものである。

また、実施例１に係る文章分割装置は、図１に示すように、定型パターン記憶部に、定型パターン（特許請求の範囲に記載の「構造パターン」に対応する）を予め記憶している。ここで、定型パターンとは、定型文章の構造として適した構造が、利用者によって、小節定義ごとの組み合わせとして表現されたものである。図１の例で説明すると、定型パターン記憶部は、料理の分野における定型文章の構造パターンを記憶するものであり、「（連中）＋（連中）＋（連用）＋（終止）→〔準備１〕＋〔準備２〕＋〔準備３〕＋〔処理〕」の定型パターンを記憶している。このように、図１の例では、定型パターンは、小節ラベルの組み合わせとして表現されている。

〔準備１〕〜〔準備３〕は、各々料理の準備手順を表し、〔処理〕は、準備手順で準備してきた食材に対する処理を表す意味である。つまり、「（連中）＋（連中）＋（連用）＋（終止）→〔準備１〕＋〔準備２〕＋〔準備３〕＋〔処理〕」は、定型文章の小節列の小節ラベルが「（連中）＋（連中）＋（連用）＋（終止）」である場合は、当該定型文章は、前から料理の準備手順が３つ並び、最後が準備手順で準備してきた食材に対する処理である構造であることを意味している。なお、図１の例においては、説明の便宜上から、定型パターン記憶部が、定型パターンとして１つの定型パターンのみを記憶している事例を説明するが、本発明はこれに限られるものではなく、定型パターンとして複数の定型パターンを記憶していてもよい。

このような構成のもと、実施例１に係る文章分割装置は、まず、分割対象となる定型文章を、小節定義記憶部に記憶されている小節定義に基づいて分割し、分割後の個々の文章である小節を並べた小節列を生成する（図１の（１）を参照）。

例えば、実施例１に係る文章分割装置は、分割対象となる定型文章『生姜をすりおろし、肉を食べやすい大きさに切り、ネギを刻んでよく混ぜ合わせる。』を、小節定義に基づいて分割すると、『生姜をすりおろし、』が「＊＋連用中止句＋読点」に該当するので小節として分割され、『肉を食べやすい大きさに切り、』が「＊＋連用中止句＋読点」に該当するので小節として分割され、『ネギを刻んで』が「＊＋動詞連用形」に該当するので小節として分割され、『よく混ぜ合わせる。』が「＊＋動詞終止形＋句点」に該当するので小節として分割される。そして、文章分割装置は、『生姜をすりおろし、』と『肉を食べやすい大きさに切り、』と『ネギを刻んで』と『よく混ぜ合わせる。』とを並べた小節列を生成する。

次に、文章分割装置は、生成された小節列と、定型パターン記憶部に記憶されている定型パターンとを照合する（図１の（２）を参照）。

例えば、文章分割装置は、（連中）の小節ラベルで定義されている『生姜をすりおろし、』、（連中）の小節ラベルで定義されている『肉を食べやすい大きさに切り、』、（連用）の小節ラベルで定義されている『ネギを刻んで』、および、（終止）の小節ラベルで定義されている『よく混ぜ合わせる。』から成る小節列と、定型パターン「（連中）＋（連中）＋（連用）＋（終止）→〔準備１〕＋〔準備２〕＋〔準備３〕＋〔処理〕」とを照合する。

続いて、文章分割装置は、小節列と一致すると照合された定型パターンを、定型文章の分割結果として選択する（図１の（３）を参照）。

図１の例で説明すると、小節列と定型パターンとが一致するので、例えば、定型パターン「〔準備１〕＋〔準備２〕＋〔準備３〕＋〔処理〕」を、定型文章の分割結果として選択する。なお、文章分割装置は、例えば、定型文章の分割結果として選択された定型パターンと小節列とを対応付けて、ディスプレイやプリンタあるいは記憶部などに出力するなどしてもよい。

このようなことから、実施例１に係る文章分割装置は、定型性の高い文章を分割する際に、文章全体として妥当性の高い分割結果を得ることが可能になる。

［実施例１に係る文章分割装置の構成］
次に、図２〜９を用いて、実施例１に係る文章分割装置の構成を説明する。図２は、実施例１に係る文章分割装置の構成を示すブロック図であり、図３は、実施例１における小節定義記憶部（小節定義の例）について説明するための図であり、図４は、実施例１における定型パターン記憶部（構造パターンの例）について説明するための図であり、図５は、実施例１における入力文受付部（入力文）について説明するための図であり、図６は、実施例１における文節合成部（入力文の文節列）について説明するための図であり、図７は、実施例１における小節合成部（小節定義の適用）について説明するための図であり、図８は、実施例１における小節合成部（小節定義適用結果）について説明するための図であり、図９は、実施例１における定型パターン適用部（構造パターン適用結果）について説明するための図である。

図２に示すように、実施例１に係る文章分割装置１０は、入力部１１と、出力部１２と、入出力制御Ｉ／Ｆ部１３と、記憶部２０と、制御部３０とから構成される。

入力部１１は、制御部３０による各種処理に用いるデータや、各種処理をするための操作指示などを入力するキーボード、マウス、記憶媒体または通信部などである。具体的には、入力部１１は、後述する入力文受付部３１によって受け付けられる定型文章を入力したり、後述する小節定義記憶部２１に登録される小節定義や、定型パターン記憶部２２に登録される定型パターンなどを入力するなどする。また、入力部１１は、後述する形態素解析部３２などによる処理に関する操作指示を入力するなどする。

出力部１２は、制御部３０による各種処理の結果や、各種処理を実行するための操作指示などを出力するディスプレイやプリンタなどである。具体的には、出力部１２は、入力部１１によって、定型文章や小節定義、定型パターンなどを入力させるための画面や、後述する結果表示部３６によって表示される分割結果などを出力するなどする。

入出力制御Ｉ／Ｆ部１３は、入力部１１および出力部１２と、記憶部２０および制御部３０との間におけるデータ転送を制御する。

記憶部２０は、制御部３０による各種処理に用いるデータを記憶し、特に本発明に密接に関連するものとしては、図２に示すように、小節定義記憶部２１と定型パターン記憶部２２とを備える。なお、小節定義記憶部２１は、特許請求の範囲に記載の「記憶部」に対応し、定型パターン記憶部２２は、特許請求の範囲に記載の「記憶部」に対応する。

小節定義記憶部２１は、小節定義を記憶する。ここで、小節定義とは、文章の構造との関係で定型文章の分割に適した箇所が、利用者によって文章の属性情報を用いて表現されたものである。具体的には、小節定義記憶部２１は、文章分割装置１０による文章分割処理を行う前に、予め小節定義を記憶しており、記憶している小節定義は、後述する小節合成部３４などによる処理に利用される。

例えば、小節定義記憶部２１は、図３に示すような小節定義を記憶する。図３の例で説明すると、小節定義記憶部２１は、料理の分野における定型文章の分割に適した小節定義を、＜定型の小節＞として表現されるものと、＜係り先候補の小節＞として表現されるものとに区別して記憶している。また、小節定義記憶部２１は、形態素をまとめ上げた文節列の右端の表現で表現されている小節定義を記憶している。

＜定型の小節＞として表現される小節定義は、「＊＋連用中止句＋読点」である。「＊＋連用中止句＋読点」は、動詞連用中止形の後に読点が連接する表現（例えば、『〜し』など）を右端として、左隣の小節の直前の文節まで伸ばしたものを、小節としてまとめ上げることを意味している。これに対して、＜係り先候補の小節＞として表現される小節定義は、「＊＋動詞連用形」および「＊＋動詞終止形＋句点」である。「＊+動詞連用形」は、動詞連用形の表現（例えば、『〜して』など）を右端として、左隣の小節の直前の文節まで伸ばしたものを、小節としてまとめ上げることを意味している。また、「＊＋動詞終止形＋句点」は、動詞終止形の後に句点が連接する表現（例えば、『〜する。』など）を右端として、左隣の小節の直前の文節まで伸ばしたものを、小節としてまとめ上げることを意味している。なお、（連中）、（連用）および（終止）は、各々の小節定義について便宜上から小節ラベルを付与したものである。

ここで、＜係り先候補の小節＞とは、例えば、『〜し、』という表現を受ける可能性のある小節のことである。例えば、『〜し、〜し、○○する××を□□する』という文章では、構文的には、『〜し、』を受ける可能性のある係り先候補として、『○○する』および『□□する』の２者が考えられる。定型文章を分割する際、最終的には、文章全体のバランスや意味属性などから、意味的に妥当な係り先を決定することになるが、文章分割処理の最小単位である小節定義の時点では、可能性のある両方の候補を定義しておくのである。

ところで、文章分割装置１０が定型性の高い文章を分割する際には、後述する定型パターン記憶部２２に記憶されている定型パターンと分割対象となる文章とを照合（マッチ）させる枠組みが必要となるが、この時、定型パターンと文章との照合は、表層上の文字列自体ではなく、形態素や文節など文章の構造（構文構造）を反映した要素に対して行えることが望ましい。また、長文の文章は、多数の形態素や文節で構成されることから、これらを予めまとめ上げ、解析候補として可能な数を予め絞っておくことが、解析や照合の精度を向上させる意味でも望ましい。小節定義は、これらの点を満たすものとして、利用者によって表現されるものである。

また、かかる小節定義は、単なる表層上の手がかりである正規表現とは異なるものであることはもちろんのこと、従来の構文解析システムなどにおいて利用されてきた文法規則とも全く異なるものである。すなわち、文法規則は、システムを熟知した開発者によって作成されるもので、一般に、複雑なものである。結果として、文法規則は、システムに作り付けの状態で提供されることになることから、システムの利用者は、定型の特徴に沿って文法規則をチューニングすることができず、また、システムが対応していない新規の文種（文章の種類）に関する文法規則を作成することもできない。

これに対し、小節定義は、文章の属する分野に関する知識を持った者であれば、非技術者である利用者であっても作成できるもので、一般に、簡単なものである。結果として、小節定義は、システムに作り付けの状態で提供されることにはならず、システムの利用者は、定型の特徴に沿って小節定義をチューニングすることができ、また、システムが対応していない新規の文種（文章の種類）に関する小節定義を作成することもできる。

定型パターン記憶部２２は、定型パターンを記憶する。ここで、定型パターンとは、定型文章に適した構造が、利用者によって小節定義ごとの組み合わせとして表現されたもの（小節を単位として定型文章の構造を記述したもの）である。具体的には、定型パターン記憶部２２は、文章分割装置１０による文章分割処理を行う前に、予め定型パターンを記憶しており、記憶している定型パターンは、後述する定型パターン適用部３５などによる処理に利用される。

例えば、定型パターン記憶部２２は、図４に示すような定型パターンを記憶する。図４の例で説明すると、定型パターン記憶部２２は、料理の分野における定型文章の構造パターンを記憶している。ここで、『Ｐ１』、『Ｐ２』および『Ｐ３』などは、定型パターンの識別番号を表し、識別番号の右手は、マッチ対象である入力小節列を小節定義単位に記述したものである。また、『→』の次の行は、マッチした小節に対応する定型パターンを記述したものである。ここで、入力小節列は、『（連中）』のような小節ラベルを用いて記述され、定型パターンは、『〔準備１〕』のような構造ラベルを用いて記述される。また、小節列、定型パターンともに、『＋』は、連接を表す。

『Ｐ１』と『Ｐ２』とでは、小節ラベルの数と構造ラベルの数とは一致しており、１対１で対応する。なお、『Ｐ３』の入力における『（（連用）＋（終止））』は、小節ラベルをまとめることを表し、入力の『（連用）＋（終止）』は、出力の『〔処理〕』と対応することを表す。

また、〔準備１〕〜〔準備４〕は、各々料理の準備手順を表し、〔処理〕は、準備手順で準備してきた食材に対する処理を表す意味である。つまり、例えば、「（連中）＋（連中）＋（連用）＋（終止）→〔準備１〕＋〔準備２〕＋〔準備３〕＋〔処理〕」は、定型文章の小節列の小節ラベルが「（連中）＋（連中）＋（連用）＋（終止）」である場合は、当該定型文章は、前から料理の準備手順が３つ並び、最後が準備手順で準備してきた食材に対する処理である構造であることを意味している。

かかる定型パターンは、小節定義同様、従来の構文解析システムなどにおいて利用されてきた文法規則と全く異なるものである。すなわち、定型パターンは、文章の属する分野に関する知識を持った者であれば、非技術者である利用者であっても作成できるもので、一般に、簡単なものである。結果として、定型パターンは、システムに作り付けの状態で提供されることにはならず、システムの利用者は、定型の特徴に沿って定型パターンをチューニングすることができ、また、システムが対応していない新規の文種（文章の種類）に関する定型パターンを作成することもできる。

制御部３０は、文章分割装置１０を制御して各種処理を実行し、特に本発明に密接に関連するものとしては、図２に示すように、入力文受付部３１と、形態素解析部３２と、文節合成部３３と、小節合成部３４と、定型パターン適用部３５と、結果表示部３６とを備える。なお、小節合成部３４は、特許請求の範囲に記載の「小節列生成手順」に対応し、定型パターン適用部３５は、特許請求の範囲に記載の「照合手順」および「選択手順」に対応する。

入力文受付部３１は、文章分割装置１０において文章分割処理の対象となる定型文章の入力を受け付ける。具体的には、入力文受付部３１は、入力部１１によって入力された定型文章を受け付け、受け付けた定型文章は、形態素解析部３２による処理に利用されるなどする。例えば、入力文受付部３１は、図５に示すような定型文章を受け付ける。図５の例で説明すると、入力文受付部３１は、『生姜をすりおろし、肉を食べやすい大きさに切り、ネギを刻んでよく混ぜ合わせる。』という定型文章を受け付ける。

形態素解析部３２は、定型文章の形態素を解析する。具体的には、形態素解析部３２は、入力文受付部３１によって受け付けられた定型文章を形態素に解析し、形態素に解析した定型文章は、文節合成部３３による処理に利用されるなどする。

文節合成部３３は、形態素に解析された定型文章の文節を合成する。具体的には、文節合成部３３は、形態素解析部３２によって形態素に解析された定型文章から文節列を生成し、生成した文節列は、小節合成部３４による処理に利用されるなどする。例えば、文節合成部３３は、図６に示すように、文節を合成し、文節列を生成する。図６の例で説明すると、文節合成部３３は、『生姜を』、『すりおろし、』、『肉を』、『食べやすい』、『大きさに』、『切り、』、『ネギを』、『刻んで』、『よく』、『混ぜ合わせる。』のように文節を合成し、文節を並べた文節列を生成する。なお、文節合成部３３によるこのような処理は、従来技術である文節合成を行うことで実現することができる。

小節合成部３４は、定型文章を小節定義に基づいて合成し、合成後の小節を並べた小節列を生成する。具体的には、小節合成部３４は、文節合成部３３によって生成された文節列から、小節定義記憶部２１によって記憶されている小節定義に基づいて小節列を生成し、生成した小節列は、定型パターン適用部３５による処理に利用されるなどする。例えば、小節合成部３４は、図７に示すように、小節を合成し、小節列を生成する。図７の例で説明すると、小節合成部３４は、『生姜をすりおろし、』、『肉を食べやすい大きさに切り、』、『ネギを刻んで』、『よく混ぜ合わせる。』のように小節を合成し、小節を並べた小節列を生成する。

例えば、小節合成部３４は、分割対象となる定型文章『生姜をすりおろし、肉を食べやすい大きさに切り、ネギを刻んでよく混ぜ合わせる。』を、小節定義記憶部２１によって記憶されている小節定義に基づいて分割すると、図７に示すように、『生姜をすりおろし、』が「＊＋連用中止句＋読点」に該当するので小節として分割され、『肉を食べやすい大きさに切り、』が「＊＋連用中止句＋読点」に該当するので小節として分割され、『ネギを刻んで』が「＊＋動詞連用形」に該当するので小節として分割され、『よく混ぜ合わせる。』が「＊＋動詞終止形＋句点」に該当するので小節として分割される。そして、文章分割装置は、『生姜をすりおろし、』と『肉を食べやすい大きさに切り、』と『ネギを刻んで』と『よく混ぜ合わせる。』とを並べた小節列を生成する。このようにして、小節合成部３４は、図８に示すような小節列を生成する。

定型パターン適用部３５は、小節列と定型パターンとを照合し、一致すると照合されたパターンを、定型文章の分割結果として選択する。具体的には、定型パターン適用部３５は、小節合成部３４によって生成された小節列と、定型パターン記憶部２２によって記憶されている定型パターンとを照合し、小節列と一致すると照合された定型パターンを、定型文章の分割結果として選択し、選択した定型パターンは、結果表示部３６による処理に利用されるなどする。

例えば、定型パターン適用部３５は、（連中）の小節ラベルが付与されている『生姜をすりおろし、』、（連中）の小節ラベルが付与されている『肉を食べやすい大きさに切り、』、（連用）の小節ラベルが付与されている『ネギを刻んで』、および、（終止）の小節ラベルが付与されている『よく混ぜ合わせる。』から成る小節列と、定型パターン『Ｐ１』である「（連中）＋（連中）＋（連用）＋（終止）→〔準備１〕＋〔準備２〕＋〔準備３〕＋〔処理〕」とを照合し、小節列と定型パターン『Ｐ１』とが一致するので、図９に示すように、定型パターン『Ｐ１』である「〔準備１〕＋〔準備２〕＋〔準備３〕＋〔処理〕」を、定型文章の分割結果として選択する。

なお、実施例１における定型パターン適用部３５は、小節合成部３４によって生成された小節列が入力された際、ファイルの先頭から定型パターン（先頭パターンである『Ｐ１』）との照合を行い、『Ｐ２』、『Ｐ３』と照合を進めて、最初にマッチした定型パターンのところで処理を終了する（ここでは、『Ｐ１』で入力文とマッチするので、ここで処理を終了し、『Ｐ１』の構造ラベル列を出力として得る）が、本発明はこれに限られるものではなく、実施例２において説明するように、全ての定型パターンとの照合を各々行い、マッチ度が最大である定型パターンを一つ選択するなどしてもよい。

結果表示部３６は、定型文章の分割結果を表示する。具体的には、結果表示部３６は、定型パターン適用部３５によって選択された定型パターンを、出力部１２に出力するなどする。例えば、結果表示部３６は、定型文章の分割結果として選択された定型パターンと小節列とを対応付けて、図９に示すような形式（構造要素の列とそれぞれの構造ラベルとを対応づけた形式など）で、ディスプレイやプリンタあるいは記憶部などに出力するなどしてもよい。

［実施例１に係る文章分割装置による処理の手順］
次に、図１０を用いて、実施例１に係る文章分割装置による処理の手順を説明する。図１０は、実施例１に係る文章分割装置による処理の手順を示すフローチャートである。

まず、実施例１に係る文章分割装置１０は、入力文受付部３１において、入力文（文章分割処理の対象となる定型文章）を受け付けたか否かを判定する（ステップＳ１０１）。入力文を受け付けていない場合には（ステップＳ１０１否定）、文章分割装置１０は、入力文受付部３１において、入力文を受け付けたか否かを判定する処理に戻る。

一方、入力文を受け付けた場合には（ステップＳ１０１肯定）、文章分割装置１０は、次に、形態素解析部３２において、入力文から形態素列を得る（ステップＳ１０２）。そして、文章分割装置１０は、文節合成部３３において、形態素列から文節列を得る（ステップＳ１０３）。

続いて、文章分割装置１０は、小節合成部３４において、文節列から小節列を得る（ステップＳ１０４）。具体的には、文章分割装置１０は、小節合成部３４において、小節定義記憶部２１によって記憶されている小節定義に基づいて、小節列を得る。

そして、文章分割装置１０は、定型パターン適用部３５において、小節列に対して定型パターンを適用し、結果を一つ得る（ステップＳ１０５）。具体的には、文章分割装置１０は、定型パターン適用部３５において、定型パターン記憶部２２によって記憶されている定型パターンを参照しながら、マッチする定型パターンを探索し、最初にマッチした定型パターンのところで処理を終了する。

その後、文章分割装置１０は、結果表示部３６において、得られた定型パターンを表示する（ステップＳ１０６）。なお、実施例１に係る文章分割装置１０は、入力文から形態素列を得て、形態素列から文節列を得た上で、小節列を生成する手法について説明したが、本発明はこれに限られるものではなく、入力文から形態素列を得て、形態素列から直接小節列を生成したり、入力文から直接小節列を生成する手法などにも、本発明を同様に適用することができる。

［実施例１の効果］
上記してきたように、実施例１によれば、文章の構造に特有の定型性を有する定型文章を分割する文章分割方法をコンピュータに実行させる文章分割プログラムであって、構造との関係で定型文章の分割に適した箇所が利用者によって文章の属性情報を用いて表現された小節定義が記憶部に予め記憶されている状況で、分割対象となる定型文章を記憶部に記憶されている小節定義に基づいて分割し、分割後の個々の文章である小節を並べた小節列を生成し、定型文章に適した構造が利用者によって小節定義ごとの組み合わせとして表現された構造パターンが記憶部に予め記憶されている状況で、生成した小節列と記憶部に記憶されている構造パターンとを照合し、小節列と一致すると照合された構造パターンを定型文章の分割結果として選択するので、定型性の高い文章を分割する際に、文章全体として妥当性の高い分割結果を得ることが可能になる。また、実施例１によれば、定型性の高い文章を、簡易かつ柔軟に分割することが可能になる。

具体的に説明すると、文章分割装置が定型性の高い文章を分割する際には、利用者によって指定された構造パターン（定型パターン）と、分割対象となる文章とを、照合（マッチ）させる枠組みが必要となる。この時、構造パターンと文章との照合は、表層上の文字列自体ではなく、形態素や文節など文章の構造（構文構造）を反映した要素に対して行えることが望ましい。また、長文の文章は、多数の形態素や文節で構成されることから、これらを予めまとめ上げ、解析候補として可能な数を予め絞っておくことが、解析や照合の精度を向上させる意味でも望ましい。

実施例１によれば、定型の特徴に沿って形態素や文節をまとめた単位を「小節」と呼び、「小節」によって形態素や文節を予めまとめ上げることから、解析や照合の精度を向上させることが可能になる。いわば、定型文章に対する表層的なパターンマッチ処理に、「小節」という構文的な要素を導入することによって、両者の融合を図ることが可能になる。また、利用者によって記述される構造パターンをシンプルなものにすることが可能になり、ひいては、システムを熟知した開発者ではなく、文章の属する分野に関する知識を持った非技術者である利用者であっても、簡単な構造パターンを記述するだけで、文章の分割箇所を指定することが可能になる。

ところで、これまで、実施例１として、文章分割装置が、生成した小節列と複数の定型パターンとを照合し、最初に小節列と一致すると照合された定型パターンを分割結果として選択する手法について説明してきた。しかしながら、本発明はこれに限られるものではない。文章分割装置が、生成した小節列と複数の定型パターンとを照合し、小節列と一致すると照合された定型パターンの内、最適な定型パターンを分割結果として選択する手法にも、本発明を同様に適用することができる。言い換えると、文章分割装置は、複数の構造的な可能性を出し、その中から最適と思われる候補を選び出すことで、解析や照合の精度をさらに向上させることが可能になるのである。以下では、実施例２として、最適な定型パターンを分割結果として選択する手法について説明する。なお、実施例２に係る文章分割装置について、実施例１に係る文章分割装置と同様の部分については説明を割愛することとし、実施例２に係る文章分割装置に特徴的な機能を中心に説明することとする。

［実施例２に係る文章分割装置の構成］
まず、図１１〜１９を用いて、実施例２に係る文章分割装置の構成を説明する。図１１は、実施例２に係る文章分割装置の構成を示すブロック図であり、図１２は、実施例２における加点表記憶部（加点の例）について説明するための図であり、図１３は、実施例２における入力文受付部（入力文）について説明するための図であり、図１４は、実施例２における文節合成部（入力文の文節列）について説明するための図であり、図１５は、実施例２における小節合成部（小節定義の適用）について説明するための図であり、図１６は、実施例２における小節合成部（小節定義適用結果）について説明するための図であり、図１７は、実施例２における複数定型パターン適用部（構造パターン適用結果）について説明するための図であり、図１８は、実施例２における候補群ソート部（加点の適用結果）について説明するための図であり、図１９は、実施例２における候補群ソート部（ソート後構造パターン出力結果）について説明するための図である。

図１１に示すように、実施例２に係る文章分割装置１０は、実施例１における定型パターン適用部３５が複数定型パターン適用部３５ａに置き換えられ、また、記憶部２０に加点表記憶部２３が追加され、さらに、制御部３０に候補群ソート部３７が追加されている点で、実施例１と異なる。なお、図１１において、点線は、実施例２に係る文章分割装置１０が実施例１に係る文章分割装置と同様の構成である部分、実線は、実施例２に係る文章分割装置１０が実施例１に係る文章分割装置と異なる構成である部分を示す意味で、便宜上用いるものである。

まず、実施例１に係る文章分割装置１０と異なる部について特に説明すると、加点表記憶部２３は、小節列と複数の定型パターン各々との一致の度合いを評価する加点表を記憶する。具体的には、加点表記憶部２３は、複数定型パターン適用部３５ａによって小節列と一致すると照合された複数の定型パターン各々について、小節列との一致の度合いを評価する加点表を記憶しており、記憶している加点表は、後述する候補群ソート部３７による処理に利用される。

例えば、加点表記憶部２３は、図１２に示すような加点表を記憶する。図１２の例で説明すると、加点表記憶部２３は、小節列と一致すると照合された複数の定型パターン（候補）各々について、並列構造に対する加点を規定している。並列構造に対する加点とは、並列要素数と一致加点との乗算によって得られるものである。

＜格要素の一致＞において、『(a)』、『(b)』、および『(c)』は、加点項目の識別番号を表す。例えば、(a)は、『すべての並列要素が「は格」を含む場合』には、加点として「+3」を加えることを規定している。つまり、定型文章として、例えば、『Ａは〜し、Ｂは〜し、Ｃは〜する。』という文章が入力された場合、並列要素数は『３』となり、すべての並列要素が「は格」を持っていることから、格要素による一致加点『３』が得られ、その乗算である３×３＝９が、総合加点となる。

その他の規定についても説明すると、＜格要素の一致＞において、例えば、(b)は、『すべての並列要素が「を格」を含む場合』には、加点として「+3」を加えることを規定しており、(c)は、『すべての並列要素が「に格」を含む場合』には、加点として「+2」を加えることを規定している。また、＜右端動詞の一致＞において、例えば、(d)は、『右端動詞がすべて同一動詞』の場合には、加点として「+5」を加えることを規定し、(e)は、『右端動詞がすべて同一態』の場合には、加点として「+3」を加えることを規定している。また、＜文節数の一致＞において、例えば、(f)は、『すべての並列要素が同じ文節数を含む場合』には、加点として「+2」を加えることを規定している。

かかる加点表は、小節定義や定型パターン同様、従来の構文解析システムなどにおいて利用されてきた文法規則とは全く異なるものである。すなわち、加点表は、文章の属する分野に関する知識を持った者であれば、非技術者である利用者であっても作成できるもので、一般に、簡単なものである。結果として、加点表は、システムに作り付けの状態で提供されることにはならず、システムの利用者は、定型の特徴に沿って加点表をチューニングすることができ、また、システムが対応していない新規の文種（文章の種類）に関する加点表を作成することもできる。

複数定型パターン適用部３５ａは、実施例１と同様、小節列と定型パターンとを照合するが、最初に小節列と一致すると照合された定型パターンを分割結果として選択するのではなく、生成した小節列と複数の定型パターンとを照合し、小節列と一致すると照合された定型パターンを、全て分割結果として選択する点で、実施例１とは異なるものである。

候補群ソート部３７は、分割結果として選択される複数の定型パターン（候補群）をソートする。具体的には、候補群ソート部３７は、複数定型パターン適用部３５ａによって照合された結果、複数の定型パターンが小節列と一致すると照合された場合に、小節列と複数の定型パターン各々との一致の度合いを、加点表記憶部２３によって記憶されている加点表に基づいて評価し、評価した結果に従って、小節列と一致すると照合された複数の定型パターンの順序をソートする。例えば、候補群ソート部３７は、加点表記憶部２３によって記憶されている加点表を参照し、マッチした複数の定型パターン各々全てについて加点を行い、加点の点数順に定型パターン候補をソートする。なお、候補群ソート部３７は、特許請求の範囲に記載の「評価手順」と「ソート手順」とに対応する。

それでは、以下に、図１３〜１９に示す例を用いて、実施例２に係る文章分割装置１０の一連の処理について説明する。なお、実施例２においては、構造の類似した『文１』と『文２』とを用いて説明する。

実施例２における入力文受付部３１は、例えば、図１３に示すような定型文章を受け付ける。図１３の例で説明すると、入力文受付部３１は、『生姜をすりおろし、肉を食べやすい大きさに切り、ネギを刻んでよく混ぜ合わせる。』という『文１』の定型文章と、『生姜をすりおろし、肉を食べやすい大きさに切り、熱した鍋に投入して炒める。』という『文２』の定型文章を受け付ける。

実施例２における文節合成部３３は、例えば、図１４に示すように、文節を合成し、文節列を生成する。図１４の例で説明すると、文節合成部３３は、『生姜を』、『すりおろし、』、『肉を』、『食べやすい』、『大きさに』、『切り、』、『ネギを』、『刻んで』、『よく』、『混ぜ合わせる。』のように『文１』の文節を合成し、文節を並べた文節列を生成する。また、文節合成部３３は、『生姜を』、『すりおろし、』、『肉を』、『食べやすい』、『大きさに』、『切り、』、『熱した』、『鍋に』、『投入して』、『炒める。』のように『文２』の文節を合成し、文節を並べた文節列を生成する。

実施例２における小節合成部３４は、例えば、図１５に示すように、小節を合成し、小節列を生成する。図１５の例で説明すると、小節合成部３４は、『生姜をすりおろし、』、『肉を食べやすい大きさに切り、』、『ネギを刻んで』、『よく混ぜ合わせる。』のように『文１』の小節を合成し、小節を並べた小節列を生成する。また、小節合成部３４は、『生姜をすりおろし、』、『肉を食べやすい大きさに切り、』、『熱した鍋に投入して』、『炒める。』のように『文２』の小節を合成し、小節を並べた小節列を生成する。このようにして、小節合成部３４は、図１６に示すような小節列を生成する。

複数定型パターン適用部３５ａは、例えば、実施例１と同様、（連中）の小節ラベルで定義されている『生姜をすりおろし、』、（連中）の小節ラベルで定義されている『肉を食べやすい大きさに切り、』、（連用）の小節ラベルで定義されている『ネギを刻んで』、および、（終止）の小節ラベルで定義されている『よく混ぜ合わせる。』から成る小節列と、定型パターン『Ｐ１』である「（連中）＋（連中）＋（連用）＋（終止）→〔準備１〕＋〔準備２〕＋〔準備３〕＋〔処理〕」とを照合し、小節列と定型パターン『Ｐ１』とが一致するので、図１７に示すように、定型パターン『Ｐ１』である「〔準備１〕＋〔準備２〕＋〔準備３〕＋〔処理〕」を、定型文章の分割結果として選択する。

また、複数定型パターン適用部３５ａは、さらに、小節列と定型パターン『Ｐ２』や『Ｐ３』とを照合し、定型パターン『Ｐ３』である「（連中）＋（連中）＋（（連用）＋（終止））→〔準備１〕＋〔準備２〕＋〔処理〕」とを照合し、小節列と定型パターン『Ｐ３』とが一致するので、図１７に示すように、定型パターン『Ｐ３』である「〔準備１〕＋〔準備２〕＋〔処理〕」をも、定型文章の分割結果として選択する。なお、『文１』を入力とすると、『Ｐ１』および『Ｐ３』とマッチするが、これをそれぞれ、『文１−Ｐ１』、『文１−Ｐ３』として表している。

また、複数定型パターン適用部３５ａは、『文２』についても同様に、小節列と定型パターン『Ｐ１』、『Ｐ２』および『Ｐ３』各々とを照合し、一致すると照合された複数の定型パターン全てを、定型文章の分割結果（候補）として選択する。なお、『文２』を入力とすると、『Ｐ１』および『Ｐ３』とマッチするが、これをそれぞれ、『文２−Ｐ１』、『文２−Ｐ３』として表している。

候補群ソート部３７は、加点表記憶部２３によって記憶されている加点表を参照し、例えば、図１８の『文１−Ｐ１』に示すように、並列要素『生姜をすりおろし、』、『肉を食べやすい大きさに切り、』および『ネギを刻んで』が、『すべての並列要素が「を格」を含む場合』であることから、加点として「+3」を加え、『右端動詞がすべて同一態』であることから、加点として「+3」を加えている。この結果と要素数との乗算が、図１８の『文１−Ｐ１』に示すように、『18』となる。

また、候補群ソート部３７は、例えば、図１８の『文２−Ｐ１』に示すように、並列要素『生姜をすりおろし、』、『肉を食やすい大きさに切り、』および『熱した鍋を投入して』が、『右端動詞がすべて同一態』であることから、加点として「+3」を加えている。この結果と要素数との乗算が、図１８の『文２−Ｐ１』に示すように、『9』となる。

同様に、候補群ソート部３７は、図１８に示すように、『文１−Ｐ３』や『文２−Ｐ３』についても、加点を評価する。そして、候補群ソート部３７は、図１９に示すように、複数の定型パターン（候補）の順序をソートする。例えば、『文１』についてみると、『文１−Ｐ１』の加点は『18』であり、『文１−Ｐ３』の加点は『12』であることから、第一候補は、定型パターン『Ｐ１』であり、第二候補が、定型パターン『Ｐ３』であるという順序に、複数の定型パターン（候補）の順序をソートする。

同様に、候補群ソート部３７は、図１９に示すように、例えば、『文２』についてみると、『文２−Ｐ３』の加点は『12』であり、『文２−Ｐ１』の加点は『9』であることから、第一候補は、定型パターン『Ｐ３』であり、第二候補が、定型パターン『Ｐ１』であるという順序に、複数の定型パターン（候補）の順序をソートする。

なお、結果表示部３６は、実施例１と同様、例えば、ソートされた順序の複数の定型パターンと小節列とを対応付けて、図１９に示すような形式で、ディスプレイやプリンタあるいは記憶部などに出力するなどしてもよい。

［実施例２に係る文章分割装置による処理の手順］
次に、図２０を用いて、実施例２に係る文章分割装置による処理の手順を説明する。図２０は、実施例２に係る文章分割装置による処理の手順を示すフローチャートである。

まず、実施例２に係る文章分割装置１０は、実施例１と同様、入力文受付部３１において、入力文を受け付けたか否かを判定し（ステップＳ２０１）、次に、形態素解析部３２において、入力文から形態素列を得て（ステップＳ２０２）、そして、文節合成部３３において、形態素列から文節列を得る（ステップＳ２０３）。

続いて、文章分割装置１０は、実施例１と同様、小節合成部３４において、文節列から小節列を得る（ステップＳ２０４）。そして、文章分割装置１０は、実施例１と異なり、複数定型パターン適用部３５ａにおいて、小節列に対して適用できる定型パターンをすべて適用し、定型パターンの候補群を得る（ステップＳ２０５）。

その後、文章分割装置１０は、実施例１と異なり、候補群ソート部３７において、定型パターン候補群に評価値を付与し、ソートする（ステップＳ２０６）。その後、文章分割装置１０は、結果表示部３６において、ソート済み定型パターン群を表示する（ステップＳ２０７）。

［実施例２の効果］
上記してきたように、実施例２によれば、照合した結果、複数の構造パターンが小節列と一致すると照合された場合に、小節列と複数の構造パターン各々との一致の度合いを評価し、評価した結果に従って、小節列と一致すると照合された複数の構造パターンの順序をソートするので、複数の分割候補が結果として得られた場合に、最適な候補を選択することが可能になる。

具体的に説明すると、実施例１に係る文章分割装置は、構造パターンと小節列との照合が一度一致すると、そこで処理を終了することによって、処理を扱いやすくするものであった。しかしながら、実施例２に係る文章分割装置は、複数の構造的な可能性を出し、その中から、最適と思われる候補を選び出すことで、解析や照合の精度をさらに向上させることが可能になる。

ところで、これまで、実施例１や２として、文章分割装置が、小節合成部３４によって生成された小節列を、そのまま定型パターン適用部３５による処理に利用する手法について説明してきた。ここで、定型パターンは、小節そのものを単位として記述するものであったため、特に文章が長文になってくると、記述すべき定型パターンの数が増えてしまい、これを制御する枠組みが必要となる。このため、実施例３に係る文章分割装置は、小節を単位とした構文解析を行い、生成可能な複数の木構造を生成し、この木構造の中で、定型の表現に直接関係のない部分を「痕跡」小節として縮退することによって、構造パターンを飛躍的に単純化することを可能にする。以下では、実施例３として、上記の手法について、説明する。なお、実施例３に係る文章分割装置について、実施例１や２に係る文章分割装置と同様の部分については説明を割愛することとし、実施例３に係る文章分割装置に特徴的な機能を中心に説明することとする。また、実施例３に係る文章分割装置に入力される定型文章は、実施例１に係る文章分割装置に入力された定型文章として図５に例示したものと同じものを想定している。

［実施例３に係る文章分割装置の構成］
まず、図２１〜２９を用いて、実施例３に係る文章分割装置の構成を説明する。図２１は、実施例３に係る文章分割装置の構成を示すブロック図であり、図２２は、実施例３における定型パターン記憶部（骨格小節に対するパターンの適用例）について説明するための図であり、図２３は、実施例３における小節係受け解析部（解析単位としての小節の利用）について説明するための図であり、図２４は、実施例３における小節係受け解析部（小節間係受け解析結果）について説明するための図であり、図２５は、実施例３における骨格小節作成部（入力文の骨格小節）について説明するための図であり、図２６は、実施例３における骨格小節作成部（係受け結果から骨格小節の作成）について説明するための図であり、図２７は、実施例３における複数定型パターン適用部（骨格小節に対する構造パターン適用結果）について説明するための図であり、図２８は、実施例３における候補群ソート部（加点の適用結果）について説明するための図であり、図２９は、実施例３における候補群ソート部について説明するための図である。

図２１に示すように、実施例３に係る文章分割装置１０は、制御部３０に、小節係受け解析部３８と骨格小節作成部３９とが追加されている点で、実施例２と異なる。

なお、実施例３における定型パターン記憶部２２は、実施例１や２における定型パターンが、小節列に直接適用するものであったのに対し、図２２に示すように、骨格小節に対して適用するものである点で、異なっている。例えば、実施例３における定型パターンは、『Ｐ３』が実施例１や実施例２の『Ｐ３』と異なっている。実施例１や実施例２において、『（連用）＋（終止）』となっていた部分が、単に『（終止）』として記述されている。後に説明するが、骨格小節作成部３９では、『（連用）』の小節が痕跡置換されるが、これに対応した定型パターンとなっているのである。この記述によって、例えば、この『（連用）』の位置に来る可能性のある小節群であって、定型パターンの適用に直接関係のない小節群については、記述を省くことができる。これによって、定型パターンとの照合に影響を与えることなく、定型パターンの記述を単純化することができるのである。

小節係受け解析部３８は、小節間の係受けを解析する。具体的には、小節係受け解析部３８は、小節合成部３４によって生成された小節列について、小節列を構成する小節間の係受けを解析し、解析した結果は、骨格小節作成部３９による処理に利用される。

例えば、小節係受け解析部３８は、図２３に示すように、小節合成部３４によって生成された小節列の小節各々について、『小節属性』および『小節係り先』を解析している。ここで、『小節属性』は、その小節自身が、用言であるか、体言であるかを表すものである。『係り先小節／係りタイプ』は、その小節が、係り先となることができる小節と、係るときの係りタイプを表している。係りタイプとしては『並列』と『修飾』の２種類がある。１つめの小節である「生姜をすりおろし、」は、『連中』および『終止』に係ることができ、『連中』に係るときは『並列』タイプとして、『終止』に係るときは『修飾』タイプとして係ることを表す。２つめの小節である「肉を食べやすい大きさに切り、」は、『連用』および『終止』に係ることができ、『連用』に係るときは『並列』タイプとして、『終止』に係るときは『修飾』タイプとして係ることを表す。３つめの小節である「ネギを刻んで」は、『終止』および『連中』に係ることができ、『終止』に係るときも『終止』に係るときも『修飾』タイプとして係ることを表す。４つめの小節である「よく混ぜ合わせる。」は、他の小節には係らず、文の終わりとなる。

例えば、図２４は、実施例３における小節係受け解析部３８による小節間係受けの解析結果である。図２３の小節群を対象とし、従来技術である構文解析を行って、小節を単位とした係受けを行った結果である。図２３に対応して、係りタイプには、『並列』と『修飾』との２種類がある。ここでは、小節間係受けによって生成することのできる二つの候補を、それぞれ『木１』および『木２』として表している。『木１』では、２つの『連中』小節が並列関係にあり、残りは修飾関係でつながっている。『木２』では、３つの小節（『連中』２つと『連用』）が並列関係にあり、残りが修飾関係でつながっている。『木１』と『木２』では、２つめの小節の『係り先小節』が異なっており、それにつれて『係りタイプ』も異なっている。図２３の２つめの小節（「肉を食べやすい大きさに切り、）の『係り先小節／係りタイプ』は『（連用）／並列』もしくは『（終止）／修飾』であるが、この小節が、４つめの小節である『終止』小節に係るときは『修飾』係りタイプで係って『木１』が生成され、３つめの小節である『連用』小節に係るときは『並列』係りタイプで係って『木１』が生成される。このようにして、２種類の異なった木が生成される。

骨格小節作成部３９は、小節列を骨格小節のみの骨格小節列とする。具体的には、骨格小節作成部３９は、小節係受け解析部３８によって解析された結果に従って、定型文章の構造において骨格となる骨格小節を修飾する小節を消失させることで、小節列を骨格小節のみの骨格小節列とし、骨格小節列は、複数定型パターン適用部３５ａによる処理に利用される。

例えば、骨格小節作成部３９は、図２５に示すような骨格小節を作成する。『木１』に対する骨格小節作成によって『骨格小節１』が生成され、『木２』に対する骨格小節作成によって『骨格小節２』が生成される。ここでは、木構造の形によって、特定の小節が消失し、『痕跡』として扱われる。『痕跡』への置き換えの処理手順は、図２６に示される。

ここで、図２６は、小節を単位とした木構造に対して、特定の小節を『痕跡』に置き換えるための手順例である。ここで、『ＣＰ』（＝current point）は、処理のためのポインタ位置を表し、処理の開始時点では、最も右の小節にセットされる（ステップＳ３０１）。基本的な動作としては、ポインタのある小節に対する係り小節が１つの場合は（ステップＳ３０３否定）、痕跡置換を行わずにポインタを１つ左隣に移動するが（ステップＳ３０４）、ポインタのある小節に対する係り小節が複数ある場合は（ステップＳ３０３肯定）、ポインタの左隣の小節および左隣に係るすべての小節を痕跡置換する（ステップＳ３０６）。このようにして、骨格小節作成部３９は、複数の係り小節全てのチェックを行って、ポインタを残っている左隣の小節に１つ移動して（ステップＳ３０９）、処理を進める。なお、最左端の小節に関する例外処理では（ステップＳ３０２肯定）、係り関係の種別によって処理が分かれる場合がある（ステップＳ３１１〜３１４）。

複数適用パターン適用部３５ａは、骨格小節作成部３９によって生成された骨格小節列（痕跡小節を除いた小節列）を、適用パターンに記述された小節の並びと比較し、過不足なく小節が一致した定型パターンを選択する。例えば、図２７は、骨格小節に対する定型パターンの適用結果である。過不足のないマッチは、骨格小節１とＰ３との組み合わせ、および、骨格小節２とＰ１との組み合わせ、において得られたため、この二つを示している。各候補では、マッチの結果、定型パターンに付与されている構造ラベルが付与されている。

なお、候補群ソート部３７は、実施例２と同様、加点表記憶部２３によって記憶されている加点表を参照し、例えば、図２８の『骨格小節１−Ｐ３』や『骨格小節２−Ｐ１』に示すように、加点を計算する。また、候補群ソート部３７は、実施例２と同様、図２９に示すように、複数の定型パターン（候補）の順序をソートする。

なお、結果表示部３６は、実施例１と同様、例えば、ソートされた順序の複数の定型パターンと小節列とを対応付けて、図２９に示すような形式で、ディスプレイやプリンタあるいは記憶部などに出力するなどしてもよい。

［実施例３に係る文章分割装置による処理の手順］
次に、図３０を用いて、実施例３に係る文章分割装置による処理の手順を説明する。図３０は、実施例３に係る文章分割装置による処理の手順を示すフローチャートである。

まず、実施例３に係る文章分割装置１０は、実施例２と同様、入力文受付部３１において、入力文を受け付けたか否かを判定し（ステップＳ４０１）、次に、形態素解析部３２において、入力文から形態素列を得て（ステップＳ４０２）、そして、文節合成部３３において、形態素列から文節列を得る（ステップＳ４０３）。

続いて、文章分割装置１０は、実施例２と同様、小節合成部３４において、文節列から小節列を得る（ステップＳ４０４）。次に、文章分割装置１０は、実施例２と異なり、小節係受け解析部３８において、小節列に対して係受け解析を行って、係受け候補群を得る（ステップＳ４０５）。続いて、文章分割装置１０は、実施例２と異なり、骨格小節作成部３９において、各係受け候補群に対して骨格小節を作成する（ステップＳ４０６）。

そして、文章分割装置１０は、実施例２と同様、複数定型パターン適用部３５ａにおいて、小節列に対して適用できる定型パターンをすべて適用し、定型パターンの候補群を得るが、実施例２と異なり、骨格小節に対して定型パターンを適用する（ステップＳ４０７）。

その後、文章分割装置１０は、実施例２と同様、候補群ソート部３７において、定型パターン候補群に評価値を付与し、ソートする（ステップＳ４０８）。その後、文章分割装置１０は、結果表示部３６において、ソート済み定型パターン群を表示する（ステップＳ４０９）。

［実施例３の効果］
上記してきたように、実施例３によれば、生成した小節列について、小節列を構成する小節間の係受けを解析し、解析した結果に従って、定型文章の構造において骨格となる骨格小節を修飾する小節を消失させることで、小節列を骨格小節のみの骨格小節列とし、作成した骨格小節列と構造パターンとを照合するので、長い文章であっても単純な構造パターンで記述することが可能になる。

具体的に説明すると、実施例１や２に係る文章分割装置は、小節そのものを単位として構造パターンを記述するものであったため、特に文章が長文になってくると、記述すべき構造パターンの数が増えてしまい、これを制御する枠組みが必要となった。このため、実施例３に係る文章分割装置は、小節を単位とした構文解析を行い、生成可能な複数の木構造を生成し、この木構造の中で、定型の表現に直接関係のない部分を「痕跡」小節として縮退することによって、構造パターンを飛躍的に単純化することが可能になる。

言い換えると、実施例３に係る文章分割装置は、定型文章の構造パターンを利用者が自由に記述することができる構造パターン処理と、構文的に可能な木構造を生成できる構文解析処理とを統合することにより、広域的な処理および統語的な処理の両方を実現させることが可能になる。ここで、定型文章の特徴に合わせた構文解析の最小単位として、従来の文節をまとめ上げた小節を解析対象としており、これにより、利用者が記述する構造パターンがシンプルになると同時に、構文解析における構文的に可能な組み合わせの数が削減されることから、構文解析精度の向上につながる。また、構文情報を用いることによって、定型に直接関係のない小節をまとめ上げることができることから、さらに構造パターンはシンプルになり、記述すべき構造パターンの数が少なくてすむようになる。このようにして、文章解析技術の詳細に関する知識がなくても扱えるレベルのシンプルな構造パターン記述の枠組みを用意することによって、利用者は文章の構造パターンを記述することができるようになる。

さて、これまで本発明の実施例について説明したが、本発明は上記した実施例以外にも、種々の異なる形態にて実施されてよいものである。

［プログラム］
上記の実施例で説明した各種の処理は、予め用意されたプログラムやパーソナル・コンピュータやワークステーションなどのコンピュータで実行することによって実現することができる。そこで、以下では、図３１を用いて、上記の実施例１と同様の機能を有する文章分割プログラムを実行するコンピュータの一例を説明する。図３１は、文章分割プログラムを実行するコンピュータを示す図である。

図３１に示すように、文章分割プログラム（コンピュータ）４０は、キャッシュ４１、ＲＡＭ４２、ＨＤＤ４３、ＲＯＭ４４およびＣＰＵ４５をバス４６で接続して構成される。ここで、ＲＯＭ４４には、上記の実施例１と同様の機能を発揮する文章分割プログラム、つまり、図３１に示すように、入力文受付プログラム４４ａ、形態素解析プログラム４４ｂ、文節合成プログラム４４ｃ、小節合成プログラム４４ｄ、定型パターン適用プログラム４４ｅおよび結果表示プログラム４４ｆが予め記憶されている。

そして、ＣＰＵ４５は、これらのプログラム４４ａ〜４４ｆを読み出して実行することで、図３１に示すように、各プログラム４４ａ〜４４ｆは、入力文受付プロセス４５ａ、形態素解析プロセス４５ｂ、文節合成プロセス４５ｃ、小節合成プロセス４５ｄ、定型パターン適用プロセス４５ｅおよび結果表示プロセス４５ｆとなる。なお、各プロセス４５ａ〜４５ｆは、図２に示した、入力文受付部３１、形態素解析部３２、文節合成部３３、小節合成部３４、定型パターン適用部３５および結果表示部３６に各々対応する。

また、ＨＤＤ４３には、図３１に示すように、小節定義テーブル４３ａおよび定型パターンテーブル４３ｂが設けられる。なお、各テーブル４３ａおよび４３ｂは、図２に示した、小節定義記憶部２１および定型パターン記憶部２２に各々対応する。

ところで、上記した各プログラム４４ａ〜４４ｆについては、必ずしもＲＯＭ４４に記憶させておく必要はなく、例えば、コンピュータ４０に挿入されるフレキシブルディスク（ＦＤ）、ＣＤ−ＲＯＭ、ＭＯディスク、ＤＶＤディスク、光磁気ディスク、ＩＣカードなどの「可搬用の物理媒体」、または、コンピュータ４０の内外に備えられるハードディスクドライブ（ＨＤＤ）などの「固定用の物理媒体」、さらには、公衆回線、インターネット、ＬＡＮ、ＷＡＮなどを介してコンピュータ４０に接続される「他のコンピュータ（またはサーバ）」に記憶させておき、コンピュータ４０がこれらからプログラムを読み出して実行するようにしてもよい。

［システム構成等］
実施例１〜３においては、小節定義を予め記憶している記憶部や、定型パターンを予め記憶している記憶部が、文章分割処理を行う制御部と同じ装置に構成されている手法を説明したが、本発明はこれに限られるものではない。小節定義を予め記憶している記憶部や、定型パターンを予め記憶している記憶部が、文章分割処理を行う制御部と異なる装置に構成されている手法や、これらの記憶部に記憶されている小節定義や定型パターンの情報が、可搬性のある記憶媒体に記憶されている手法などにも、本発明を同様に適用することができる。

また、実施例３においては、文章分割装置が骨格小節列に対して全ての定型パターンを各々適用し、評価値を付与して分割結果をソートする手法について説明したが、文章分割装置が骨格小節列に対して定型パターンを適用するものの、一致した定型パターンがあればそのまま処理を終了する手法（評価値の付与やソートを行わない手法）などにも、本発明を同様に適用することができる。

また、本実施例において説明した各処理のうち、自動的におこなわれるものとして説明した処理の全部または一部を手動的におこなうこともでき、あるいは、手動的におこなわれるものとして説明した処理の全部または一部を公知の方法で自動的におこなうこともできる。この他、上記文書中や図面中で示した処理手順（図１０、図２０および図３０など）、制御手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。

また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示（図２、図１１および図２１）の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる（例えば、小節定義記憶部と定型パターン記憶部とを統合して構成するなど）。さらに、各装置にて行なわれる各処理機能は、その全部または任意の一部が、ＣＰＵおよび当該ＣＰＵにて解析実行されるプログラムにて実現され、あるいは、ワイヤードロジックによるハードウェアとして実現され得る。

（付記１）文章の構造に特有の定型性を有する定型文章を分割する文章分割方法をコンピュータに実行させる文章分割プログラムであって、
前記構造との関係で前記定型文章の分割に適した箇所が利用者によって文章の属性情報を用いて表現された小節定義が記憶部に予め記憶されている状況で、分割対象となる定型文章を当該記憶部に記憶されている小節定義に基づいて分割し、分割後の個々の文章である小節を並べた小節列を生成する小節列生成手順と、
前記定型文章に適した構造が利用者によって前記小節定義ごとの組み合わせとして表現された構造パターンが記憶部に予め記憶されている状況で、前記小節列生成手順によって生成された小節列と当該記憶部に記憶されている構造パターンとを照合する照合手順と、
前記照合手順によって前記小節列と一致すると照合された構造パターンを当該定型文章の分割結果として選択する選択手順と、
をコンピュータに実行させることを特徴とする文章分割プログラム。

（付記２）前記照合手順によって照合された結果、複数の構造パターンが前記小節列と一致すると照合された場合に、前記小節列と当該複数の構造パターン各々との一致の度合いを評価する評価手順と、
前記評価手順によって評価された結果に従って、前記照合手順によって前記小節列と一致すると照合された複数の構造パターンの順序をソートするソート手順とをさらにコンピュータに実行させることを特徴とする付記１に記載の文章分割プログラム。

（付記３）前記小節列生成手順によって生成された小節列について、当該小節列を構成する小節間の係受けを解析する係受け解析手順と、
前記係受け解析手順によって解析された結果に従って、前記定型文章の構造において骨格となる骨格小節を修飾する小節を消失させることで、前記小節列を当該骨格小節のみの骨格小節列とする骨格小節列作成手順とをさらにコンピュータに実行させ、
前記照合手順は、前記骨格小節列作成手順によって作成された骨格小節列と前記構造パターンとを照合することを特徴とする付記１または２に記載の文章分割プログラム。

（付記４）文章の構造に特有の定型性を有する定型文章を分割する文章分割装置であって、
前記構造との関係で前記定型文章の分割に適した箇所が利用者によって文章の属性情報を用いて表現された小節定義を予め記憶している小節定義記憶手段と、
前記定型文章に適した構造が利用者によって前記小節定義ごとの組み合わせとして表現された構造パターンを予め記憶している構造パターン記憶手段と、
分割対象となる定型文章を前記小節定義記憶手段に記憶されている小節定義に基づいて分割し、分割後の個々の文章である小節を並べた小節列を生成する小節列生成手段と、
前記小節列生成手段によって生成された小節列と前記構造パターン記憶手段に記憶されている構造パターンとを照合する照合手段と、
前記照合手段によって前記小節列と一致すると照合された構造パターンを当該定型文章の分割結果として選択する選択手段と、
を備えたことを特徴とする文章分割装置。

（付記５）前記照合手段によって照合された結果、複数の構造パターンが前記小節列と一致すると照合された場合に、前記小節列と当該複数の構造パターン各々との一致の度合いを評価する評価手段と、
前記評価手段によって評価された結果に従って、前記照合手段によって前記小節列と一致すると照合された複数の構造パターンの順序をソートするソート手段とをさらに備えたことを特徴とする付記４に記載の文章分割装置。

（付記６）前記小節列生成手段によって生成された小節列について、当該小節列を構成する小節間の係受けを解析する係受け解析手段と、
前記係受け解析手段によって解析された結果に従って、前記定型文章の構造において骨格となる骨格小節を修飾する小節を消失させることで、前記小節列を当該骨格小節のみの骨格小節列とする骨格小節列作成手段とをさらに備え、
前記照合手段は、前記骨格小節列作成手段によって作成された骨格小節列と前記構造パターンとを照合することを特徴とする付記４または５に記載の文章分割装置。

（付記７）文章の構造に特有の定型性を有する定型文章を分割する文章分割方法であって、
前記構造との関係で前記定型文章の分割に適した箇所が利用者によって文章の属性情報を用いて表現された小節定義が記憶部に予め記憶されている状況で、分割対象となる定型文章を当該記憶部に記憶されている小節定義に基づいて分割し、分割後の個々の文章である小節を並べた小節列を生成する小節列生成工程と、
前記定型文章に適した構造が利用者によって前記小節定義ごとの組み合わせとして表現された構造パターンが記憶部に予め記憶されている状況で、前記小節列生成工程によって生成された小節列と当該記憶部に記憶されている構造パターンとを照合する照合工程と、
前記照合工程によって前記小節列と一致すると照合された構造パターンを当該定型文章の分割結果として選択する選択工程と、
を含んだことを特徴とする文章分割方法。

（付記８）前記照合工程によって照合された結果、複数の構造パターンが前記小節列と一致すると照合された場合に、前記小節列と当該複数の構造パターン各々との一致の度合いを評価する評価工程と、
前記評価工程によって評価された結果に従って、前記照合工程によって前記小節列と一致すると照合された複数の構造パターンの順序をソートするソート工程とをさらに含んだことを特徴とする付記７に記載の文章分割方法。

（付記９）前記小節列生成工程によって生成された小節列について、当該小節列を構成する小節間の係受けを解析する係受け解析工程と、
前記係受け解析工程によって解析された結果に従って、前記定型文章の構造において骨格となる骨格小節を修飾する小節を消失させることで、前記小節列を当該骨格小節のみの骨格小節列とする骨格小節列作成工程とをさらに含み、
前記照合工程は、前記骨格小節列作成工程によって作成された骨格小節列と前記構造パターンとを照合することを特徴とする付記７または８に記載の文章分割方法。

以上のように、本発明に係る文章分割プログラム、文章分割装置および文章分割方法は、文章の構造に特有の定型性を有する定型文章を分割することに有用であり、特に、文章全体として妥当性の高い分割結果を得ることに適する。

実施例１に係る文章分割装置の概要および特徴を説明するための図である。実施例１に係る文章分割装置の構成を示すブロック図である。実施例１における小節定義記憶部（小節定義の例）について説明するための図である。実施例１における定型パターン記憶部（構造パターンの例）について説明するための図である。実施例１における入力文受付部（入力文）について説明するための図である。実施例１における文節合成部（入力文の文節列）について説明するための図である。実施例１における小節合成部（小節定義の適用）について説明するための図である。実施例１における小節合成部（小節定義適用結果）について説明するための図である。実施例１における定型パターン適用部（構造パターン適用結果）について説明するための図である。実施例１に係る文章分割装置による処理の手順を示すフローチャートである。実施例２に係る文章分割装置の構成を示すブロック図である。実施例２における加点表記憶部（加点の例）について説明するための図である。実施例２における入力文受付部（入力文）について説明するための図である。実施例２における文節合成部（入力文の文節列）について説明するための図である。実施例２における小節合成部（小節定義の適用）について説明するための図である。実施例２における小節合成部（小節定義適用結果）について説明するための図である。実施例２における複数定型パターン適用部（構造パターン適用結果）について説明するための図である。実施例２における候補群ソート部（加点の適用結果）について説明するための図である。実施例２における候補群ソート部（ソート後構造パターン出力結果）について説明するための図である。実施例２に係る文章分割装置による処理の手順を示すフローチャートである。実施例３に係る文章分割装置の構成を示すブロック図である。実施例３における定型パターン記憶部（骨格小節に対するパターンの適用例）について説明するための図である。実施例３における小節係受け解析部（解析単位としての小節の利用）について説明するための図である。実施例３における小節係受け解析部（小節間係受け解析結果）について説明するための図である。実施例３における骨格小節作成部（入力文の骨格小節）について説明するための図である。実施例３における骨格小節作成部（係受け結果から骨格小節の作成）について説明するための図である。実施例３における複数定型パターン適用部（骨格小節に対する構造パターン適用結果）について説明するための図である。実施例３における候補群ソート部（加点の適用結果）について説明するための図である。実施例３における候補群ソート部について説明するための図である。実施例３に係る文章分割装置による処理の手順を示すフローチャートである。文章分割プログラムを実行するコンピュータを示す図である。

符号の説明

１０文章分割装置
１１入力部
１２出力部
１３入出力制御Ｉ／Ｆ部
２０記憶部
２１小節定義記憶部
２２定型パターン記憶部
２３加点表記憶部
３０制御部
３１入力文受付部
３２形態素解析部
３３文節合成部
３４小節合成部
３５定型パターン適用部
３５ａ複数定型パターン適用部
３６結果表示部
３７候補群ソート部
３８小節係受け解析部
３９骨格小節作成部
４０コンピュータ
４１キャッシュ
４２ＲＡＭ
４３ＨＤＤ
４４ＲＯＭ
４５ＣＰＵ
４６バス

Claims

文章の構造に特有の定型性を有する定型文章を分割する文章分割方法をコンピュータに実行させる文章分割プログラムであって、
前記構造との関係で前記定型文章の分割に適した箇所が利用者によって文章の属性情報を用いて表現された小節定義が記憶部に予め記憶されている状況で、分割対象となる定型文章を当該記憶部に記憶されている小節定義に基づいて分割し、分割後の個々の文章である小節を並べた小節列を生成する小節列生成手順と、
前記小節列生成手順によって生成された小節列について、当該小節列を構成する小節間の係受けを解析する係受け解析手順と、
前記係受け解析手順によって解析された結果に従って、前記定型文章の構造において骨格となる骨格小節を修飾する小節を消失させることで、前記小節列を当該骨格小節のみの骨格小節列とする骨格小節列作成手順と、
前記定型文章に適した構造が利用者によって前記小節定義ごとの組み合わせとして表現された構造パターンが記憶部に予め記憶されている状況で、前記骨格小節列作成手順によって作成された骨格小節列と当該記憶部に記憶されている構造パターンとを照合する照合手順と、
前記照合手順によって前記小節列と一致すると照合された構造パターンを前記定型文章の分割結果として選択する選択手順と、
をコンピュータに実行させることを特徴とする文章分割プログラム。
前記照合手順によって照合された結果、複数の構造パターンが前記骨格小節列と一致すると照合された場合に、前記骨格小節列と当該複数の構造パターン各々との一致の度合いを評価する評価手順と、
前記評価手順によって評価された結果に従って、前記照合手順によって前記骨格小節列と一致すると照合された複数の構造パターンの順序をソートするソート手順とをさらにコンピュータに実行させることを特徴とする請求項１に記載の文章分割プログラム。
文章の構造に特有の定型性を有する定型文章を分割する文章分割装置であって、
前記構造との関係で前記定型文章の分割に適した箇所が利用者によって文章の属性情報を用いて表現された小節定義を予め記憶している小節定義記憶手段と、
前記定型文章に適した構造が利用者によって前記小節定義ごとの組み合わせとして表現された構造パターンを予め記憶している構造パターン記憶手段と、
分割対象となる定型文章を前記小節定義記憶手段に記憶されている小節定義に基づいて分割し、分割後の個々の文章である小節を並べた小節列を生成する小節列生成手段と、
前記小節列生成手段によって生成された小節列について、当該小節列を構成する小節間の係受けを解析する係受け解析手段と、
前記係受け解析手段によって解析された結果に従って、前記定型文章の構造において骨格となる骨格小節を修飾する小節を消失させることで、前記小節列を当該骨格小節のみの骨格小節列とする骨格小節列作成手段と、
前記骨格小節列作成手段によって作成された骨格小節列と前記構造パターン記憶手段に記憶されている構造パターンとを照合する照合手段と、
前記照合手段によって前記小節列と一致すると照合された構造パターンを前記定型文章の分割結果として選択する選択手段と、
を備えたことを特徴とする文章分割装置。
文章の構造に特有の定型性を有する定型文章を分割する文章分割方法であって、
コンピュータが、前記構造との関係で前記定型文章の分割に適した箇所が利用者によって文章の属性情報を用いて表現された小節定義が記憶部に予め記憶されている状況で、前記記憶部を参照して、分割対象となる定型文章を当該記憶部に記憶されている小節定義に基づいて分割し、分割後の個々の文章である小節を並べた小節列を生成する小節列生成工程と、
前記コンピュータが、前記小節列生成工程において生成された小節列について、当該小節列を構成する小節間の係受けを解析する係受け解析工程と、
前記コンピュータが、前記係受け解析工程において解析された結果に従って、前記定型文章の構造において骨格となる骨格小節を修飾する小節を消失させることで、前記小節列を当該骨格小節のみの骨格小節列とする骨格小節列作成工程と、
前記コンピュータが、前記定型文章に適した構造が利用者によって前記小節定義ごとの組み合わせとして表現された構造パターンが記憶部に予め記憶されている状況で、前記記憶部を参照して、前記骨格小節列作成工程において作成された骨格小節列と当該記憶部に記憶されている構造パターンとを照合する照合工程と、
前記コンピュータが、前記照合工程において前記小節列と一致すると照合された構造パターンを前記定型文章の分割結果として選択する選択工程と、
を含んだことを特徴とする文章分割方法。