JP5142897B2

JP5142897B2 - 文検索装置，文検索プログラム，文検索方法

Info

Publication number: JP5142897B2
Application number: JP2008232098A
Authority: JP
Inventors: 博司楢崎
Original assignee: Kobe Steel Ltd
Current assignee: Kobe Steel Ltd
Priority date: 2008-09-10
Filing date: 2008-09-10
Publication date: 2013-02-13
Anticipated expiration: 2028-09-10
Also published as: JP2010066964A

Description

本発明は，複数の検索対象文が順に並ぶ検索対象文集合から所望の文を検索して出力する文検索装置，文検索プログラム及び文検索方法に関するものである。

文書データにはそれぞれ複数の語句を含む複数の文（句点で区分される語句の集合）が含まれる。従来，コンピュータにより，検索対象となる文書データに含まれる複数の文（検索対象文）の中から，所定のキーワードを含む文を検索して出力する処理を実行することが行われている。
例えば，特許文献１や特許文献２には，入力された文に含まれるキーワードやそれをさらに拡張したキーワードを抽出或いは生成し，そのキーワードを含む文を文書データの中から検索することについて示されている。

ところで，複数の検索対象文の中から所望の文を検索する場合に，特定のキーワード（語句）を含む文を検索するのではなく，検索条件として入力した事例文と内容（文としての内容）の一致度（近似度或いは類似度ともいえる）が高い文を検索したいというニーズがある。
さらに，比較的短い事例文章，即ち，複数の事例文が順に並ぶ事例文集合が検索条件として入力された場合に，比較的長い検索対象となる文章，即ち，複数の検索対象文が順に並ぶ検索対象文集合から，前記事例文章が表す文脈やシナリオについて一致度が高い一部の文章（文の集合）を検索したいというニーズもある。この場合，複数の前記事例文の並び順（前後関係）が，検索結果として得たい文章のシナリオや文脈を表す指標となる。従って，上記ニーズは，複数の事例文が順に並ぶ事例文集合（事例文章ともいえる）が入力された場合に，複数の検索対象文が順に並ぶ検索対象文集合（検索対象文章ともいえる）において，前記事例文それぞれと一致度の高い複数の検索対象文が，前記事例文集合における前記事例文の並びの順と同じ順序で登場するときに，それら複数の検索対象文の組合せを，より優先して検索結果に含めたいというニーズであるといえる。
特開平８−１６１３５４号公報特開２００７−６５７４５号公報

しかしながら，特許文献１や特許文献２に示される技術はいずれも，複数の検索対象文のうち，検索条件として入力される情報に基づくキーワード（語句）を含む文を検索結果として出力するものでる。そのため，特許文献１や特許文献２に示される技術は，入力された事例文章に対して文の内容及び複数の文の並び（文脈やシナリオを表す）について一致度の高い文章（文の集合）を検索したいというニーズに対応できないという問題点があった。
従って，本発明は上記事情に鑑みてなされたものであり，その目的とするところは，検索対象文章（複数の検索対象文が順に並ぶ検索対象文集合）から，入力された事例文章（複数の事例文が順に並ぶ事例文集合）に対して文内容及び複数の文の並びについて一致度の高い文章（文の集合）を検索したいというニーズに対応することができる文検索装置，文検索プログラム及び文検索方法を提供することにある。

上記目的を達成するために本発明に係る文検索装置は，予め記憶手段に記憶され複数の検索対象文が順に並ぶ検索対象文集合から所望の文を検索して出力する装置であり，次の（１）〜（６）に示される各構成要素を備えるものである。
（１）検索結果に含めたい文を例示する複数の事例文が順に並ぶ事例文集合の情報を入力して記憶手段に記録する事例文集合入力手段。
（２）前記検索対象文それぞれについて，前記事例文それぞれとの一致度合いの指標値である文一致度を算出する文一致度算出手段。
（３）前記検索対象文それぞれについて，前記事例文それぞれとの間の前記文一致度が高いものを優先して対応する前記事例文である対応事例文を特定する対応事例文特定手段。
（４）複数の前記検索対象文の中から前記事例文それぞれとの間の前記文一致度が高いものを優先して１つ又は複数の代表検索対象文を選択する代表検索対象文選択手段。
（５）前記代表検索対象文それぞれについて，前記検索対象文集合の内での並び順が当該代表検索対象文に対して予め設定された前後の範囲内にある前記検索対象文である前後検索対象文と当該代表検索対象文との間の並びの前後関係が，前記前後検索対象文についての前記対応事例文と当該代表検索対象文についての前記対応事例文との間の前記事例文集合内における並びの前後関係と一致する場合に，当該前後検索対象文における前記対応事例文に対する前記文一致度と当該代表検索対象文における前記対応事例文に対する前記文一致度の一方又は両方を高める方向に補正する文一致度補正手段。
（６）前記検索対象文それぞれについて，前記文一致度補正手段による補正を経た前記文一致度に応じて，検索結果として出力するか否かの判別及び検索結果として出力する優先順位の判別の一方又は両方を行う検索対象文出力判別手段。
なお，「情報を入力」とは，キーボードやマウス等の操作部に対する操作に応じて情報を入力することの他，通信手段を通じて外部装置から情報を入力することや，ハードディスクやＤＶＤ等の情報記録媒体に記録（記憶）された情報を読み出して入力すること等，各種の情報入力の態様を含むことを意味する。
同様に，「出力する」とは，通信手段を通じて外部装置に情報を送信することの他，表示部に情報を表示することや，ハードディスクやＤＶＤ等の情報記録媒体に情報を記録する（記憶させる）こと等，各種の情報出力の態様を含むことを意味する。
また，本明細書において，「一致度が高い」，「一致度が低い」という記載は，「一致度」を表す数値の高低を意味するものではなく，「一致している度合い」の高低を意味するものである。従って，例えば，「一致度」の数値が小さいほど「一致している度合い」が高いことを意味する場合や，「一致度」がａ，ｂ，ｃ，ｄ…等の評価ランクとして表現される場合等も考えられる。同様に，「一致度」の加算／減算は，それぞれ「一致している度合い」を高くする方向／低くする方向に値（評価値）を変更することを意味するものである。従って，「評価値が高い（大きい）」，「評価値が低い（小さい）」という記載も，１つの前記検索対象文と，前記正事例文及び前記負事例文それぞれとの間の「一致している度合い」を統合評価した結果の高低を意味するものである。

本発明においては，前記検索対象文集合から，入力された前記事例文集合における各事例文に対して一致度の高い検索対象文が前記代表検索対象文として選択され，さらに，その代表検索対象文及びその前後の所定範囲内に並ぶ検索対象文（前記前後検索対象文）について，その並びの前後関係が，対応する（比較的一致度の高い）前記事例文の並びの前後関係と一致すれば，その代表検索対象文及びその前後の前後検索対象文の一方又は両方の前記一致度がより高まるよう補正される。その結果，前記事例文集合に対して文内容及び複数の文の並びについて一致度の高い文章（前記検索対象文の集合）が，より優先して検索結果に反映されることになる。
例えば，本発明に係る文検索装置が，さらに，次の（７）に示す構成要素を備えればなお好適である。
（７）前記検索対象文，前記積極的事例文及び前記消極的事例文それぞれについて，構文解析処理を施すことにより文中における文法上の属性と語句との対応関係を表す構文解析結果情報を生成する構文解析手段。
この場合，前記文一致度算出手段が，前記検索対象文それぞれについて，前記事例文それぞれとの間で前記構文解析結果情報を比較することにより前記文一致度を算出する。
これにより，複数の前記検索対象文の中から，積極的な検索条件を表す複数の前記事例文それぞれに対し文としての内容（例えば，構文解析結果）の一致度が高い文が検索される。
なお，前記文法上の属性が，文法上の格，品詞，語句の時制，受動態か能動態か，肯定形の語句か否定形の語句か，及び１つの文に複数の単文が含まれる場合におけるある語句が属する単文の他の単文に対する文法上の階層関係の深さのうちの１つ又は複数を含むことが考えられる。

また，例えば，前記対応事例文特定手段が，前記検索対象文それぞれについて，前記文一致度が最も高い前記事例文を前記対応事例文として特定することが考えられる。
また，例えば，前記代表検索対象文選択手段が，複数の前記検索対象文の中から，前記事例文それぞれとの間の前記文一致度の合計又は平均が高いものから順に予め定められた数の前記代表検索対象文を選択することが考えられる。
また，本発明に係る文検索装置が，さらに，次の（８）に示す構成要素を備え，かつ，前記文一致度算出手段が次の（９）に示す処理を実行すればなお好適である。
（８）前記検索対象文，前記積極的事例文及び前記消極的事例文それぞれに含まれる語句について，記憶手段に記憶されたシソーラス辞書の情報に基づいてカテゴリを判別するカテゴリ判別手段。
（９）前記文一致度算出手段が，前記構文解析結果情報の比較において比較対象となる２つの語句の一致を判別する際に，該２つの語句が一致しない場合には該２つの語句について前記カテゴリ判別手段により判別されたカテゴリの比較によって語句の一致を判別する。
これにより，２つの文の一致度を算出する際に，比較対象となる２つの語句（属性が一致する語句）が表現において異なる場合でも，その語句の意味を広く解釈すれば実質的な意味が同じ或いは類語である（前記シソーラス辞書における前記カテゴリが同じである）場合には，その２つの語句の一致度合いが比較的高い（完全な不一致ではない）として処理され，より柔軟な検索が行われる。なお，シソーラス辞書は，語句（単語）と，語句の上位／下位の関係や同義関係，類義関係等によって分類されたカテゴリ（の識別情報）との対応関係を表す周知の概念辞書である。
また，本発明は，以上に示した本発明に係る文検索装置が備える各構成要素が実行する処理をコンピュータに実行させるための文検索プログラム（予め記憶手段に記憶された複数の検索対象文の中から所望の文を検索し，検索結果を情報出力手段を通じて出力する処理をコンピュータに実行させるための文検索プログラム）として捉えることもできる。
同様に，本発明は，以上に示した本発明に係る文検索装置が備える各構成要素が実行する処理をコンピュータによって実行する文検索方法（予め記憶手段に記憶された複数の検索対象文の中から所望の文を検索し，検索結果を情報出力手段を通じて出力する処理をコンピュータに実行する文検索方法）として捉えることもできる。

本発明によれば，複数の検索対象文が順に並ぶ検索対象文集合から，入力された事例文章（複数の事例文が順に並ぶ事例文集合）に対して文内容及び複数の文の並びについて一致度の高い文章（文の集合）を検索したいというニーズに対応することができる。

以下添付図面を参照しながら，本発明の実施の形態について説明し，本発明の理解に供する。尚，以下の実施の形態は，本発明を具体化した一例であって，本発明の技術的範囲を限定する性格のものではない。
ここに，図１は本発明の実施形態に係る文検索装置Ｘ（コンピュータ）の概略構成を表すブロック図，図２は文検索装置Ｘによる文検索処理の手順を表すフローチャート，図３は文検索装置Ｘが表示装置に表示させる初期画面の一例を表す図，図４は検索対象文の構文解析処理のプロセス及び処理結果の一例を表す図，図５は文検索装置Ｘにおける文一致度補正処理による補正前後のデータ内容の一例を表す図である。

まず，図１を参照しつつ，本発明の実施形態に係る文検索装置Ｘの構成について説明する。
文検索装置Ｘは，予めハードディスク等の記憶手段に記憶された検索対象データＤ０に含まれる複数の検索対象文の中から，その検索対象文と検索条件として入力される複数の文の集合（後述する複数の事例文からなる事例文情報Ｄ１）との間で文内容を比較することによって所望の文（検索対象文）を検索して出力する処理を実行するコンピュータである。即ち，コンピュータが備えるＣＰＵ１が，予め記憶手段に記憶された文検索プログラム１０を実行することにより，そのコンピュータが文検索装置Ｘとして機能する。言い換えると，前記文検索プログラム１０は，コンピュータを文検索装置Ｘとして機能させるためのプログラムである。
ここで，前記検索対象データＤ０は，複数の検索対象文が順に並ぶ検索対象文集合のデータである。また，前記事例文情報Ｄ１は，検索結果に含めたい文を例示する複数の事例文が順に並ぶ事例文集合の情報である。

図１に示されるように，文検索装置Ｘは，ＣＰＵ１，ＲＡＭ２，ＲＯＭ３，入力装置４，表示装置５及びデータ記憶部７等を備えている。
前記ＣＰＵ１は，各種プログラムを実行することにより各種の演算処理を行う演算装置（プロセッサ）である。前記ＲＡＭ２は，前記ＣＰＵ１により実行されるプログラムや一時記憶データが展開される高速メモリである。前記ＲＯＭ３は，前記ＣＰＵ１により実行されるＢＩＯＳ等のプログラムが予め記憶された不揮発性メモリである。前記入力装置４は，キーボードやマウス等，操作部に対する操作に応じて情報を入力する情報入力手段である。前記表示装置５は，前記ＣＰＵ１による演算結果等の各種情報を映像として出力する液晶表示パネルやＣＲＴ等である。前記データ記憶部７は，前記ＣＰＵ１により実行或いは参照される前記文検索プログラム１０や各種情報が記憶されるハードディスク等の情報記憶手段である。
このデータ記憶部７には，検索対象データＤ０，事例文情報Ｄ１，検索文解析結果情報Ｄ２，事例文解析結果情報Ｄ３，構文解析辞書情報Ｄ４及びシソーラス辞書情報Ｄ５などの情報が記憶される他，前記ＣＰＵ１により実行される文検索プログラム１０も記憶される。なお，文検索プログラム１０には，周知の構文解析プログラム（プログラムモジュール）も含まれる。なお，前記検索文解析結果情報Ｄ２及び前記事例文解析結果情報Ｄ３を総称して構文解析結果情報Ｄ２，Ｄ３という。
なお，前記データ記憶部７には，当該文検索装置Ｘ（コンピュータ）を構成する各ハードウェアと前記文検索プログラム１０を含む各種アプリケーションプログラムとの間の中継処理を行うＯＳ（オペレーションシステム）及びファイルシステムのプログラムも記憶されている（不図示）。

次に，図２に示されるフローチャートを参照しつつ，前記文検索装置ＸのＣＰＵ１が前記文検索プログラム１０を実行することによって実現される文検索処理の手順について説明する。なお，以下に示すＳ１，Ｓ２，…は，前記ＣＰＵ１が実行する処理の手順（ステップ）の識別符号を表す。

＜ステップＳ１，Ｓ２＞
まず，ＣＰＵ１は，各種ワーク変数を初期化する処理を実行する（Ｓ１）。この文検索処理で用いられワーク変数（ステップＳ１で初期化される変数）としては，構文解析の結果の情報が設定される解析結果変数Ｓ，Ｐ，カウンタ変数ｉ，ｊ，ｋ，後述する統合一致度，最大一致度及び対応事例文番号の各々を表す変数Ｅsum，Ｅmax及びＱ，検索対象文を検索した結果の情報が設定される変数ｙ等がある。
次に，ＣＰＵ１は，所定の初期画面ｇ０（図３参照）を前記表示装置５に表示させ，その初期画面ｇ０の表示中における前記入力装置４に対する操作入力に応じて，次の（Ｓ２−１）〜（Ｓ２−３）に示す各処理を実行する（Ｓ２）。
（Ｓ２−１）複数の検索対象文が順に並ぶ検索対象文の集合のデータである前記検索対象データＤ０を指定する処理。
（Ｓ２−２）複数の事例文が順に並ぶ事例文集合の情報（前記事例文情報Ｄ１）を入力して前記データ記憶部７に記録する（記憶させる）事例文情報入力処理。
（Ｓ２−３）検索処理の開始操作を検知する処理。
ここで，前記事例文は，検索結果に含めたい文を例示する文である。
なお，ステップＳ２の処理を実行するＣＰＵ１が，前記事例文情報入力手段の一例である。

図３は，前記初期画面ｇ０の一例である。
前記初期画面ｇ０には，検索対象フォルダ名入力枠ｇ１と，参照ボタンｇ２と，検索結果表示枠ｇ３と，事例文入力枠ｇ４と，検索実行ボタンｇ５とが含まれる。
ステップＳ２において，複数の検索対象文を含む文章のデータである前記検索対象データＤ０を指定する処理は，そのデータが存在するフォルダ名（以下，検索対象フォルダ名という）を入力する処理である。
図３における前記検索対象フォルダ名入力枠ｇ１は，前記検索対象フォルダ名の入力枠（情報入力枠）である。ＣＰＵ１は，この検索対象フォルダ名入力枠ｇ１に対し前記入力装置４におけるキーボードを通じて入力されたフォルダ名を前記検索対象フォルダ名として入力する処理の他，前記参照ボタンｇ２の操作に応じて前記初期画面ｇ０に前記データ記憶部７内のフォルダ名のリスト（選択肢）を表示させ，そのリストの中から前記入力装置４におけるマウス等を通じた選択操作に応じて１つ又は複数のフォルダ名を選択し，選択したフォルダ名を前記検索対象フォルダ名として入力する処理も実行する。以後，ＣＰＵ１は，入力された前記検索対象フォルダ名により特定されるフォルダ内に存在する１又は複数の文書データを参照し，その文書データに含まれる複数の文を検索対象文として文検索処理を実行する。

また，ステップＳ２において，ＣＰＵ１が実行する前記事例文情報Ｄ１の入力処理は，前記事例文入力枠ｇ４に対し前記入力装置４におけるキーボードを通じて順次入力された複数の文の集合を，その入力順に並ぶ前記事例文の集合である前記事例文情報Ｄ１として入力する処理である。
なお，ＣＰＵ１が，不図示の通信手段（通信インターフェース）を通じて外部装置から前記検索対象フォルダ名，前記事例文情報Ｄ１を入力することや，ハードディスクやＤＶＤ等の情報記録媒体に記録（記憶）された情報を読み出すことにより同情報を入力すること等も考えられる。
また，ステップＳ２において，ＣＰＵ１が実行する検索処理の開始操作の検知処理は，前記初期画面ｇ０における前記検索実行ボタンｇ５が前記入力装置４におけるマウス等によって操作されたことを検知する処理である。

＜ステップＳ３＞
そして，ＣＰＵ１は，検索処理の開始操作があったことを検知すると，前記検索対象データＤ０内の各検索対象文及び前記事例文情報Ｄ１内の各事例文について，周知の構文解析処理を施す。そして，ＣＰＵ１は，その構文解析処理によって文中における文法上の属性と語句との対応関係を表す構文解析結果情報である前記検索文解析結果情報Ｄ２及び前記事例文解析結果情報Ｄ３を生成し，それらの情報Ｄ２，Ｄ３を前記データ記憶部７に記録する（Ｓ３，前記構文解析手段の一例）。このステップＳ３の処理は，ＣＰＵ１が，周知の構文解析プログラムを実行することによって実現される。

以下，構文解析処理の一例について説明する。なお，構文解析処理の対象となる前記検索対象文及び前記事例文（それぞれ，句点により区切られた文）のことを解析対象文と称する。
例えば，前記ＣＰＵ１は，前記解析対象文について，周知の形態素解析処理を実行し，その解析結果を前記データ記憶部７に一次的に記録する。これにより，前記解析対象文が語句（単語）ごとに区分され，その結果がデータ記憶部７に記録される。
さらに，ＣＰＵ１は，形態素解析処理の結果をデータ記憶部７から読み出しつつ，周知の係り受け解析処理等を実行することにより，前記解析対象文を，それに含まれる単文ごとに，前記解析対象文の文中における文法上の属性と，その単文に含まれる語句との対応関係を表す構文解析結果情報（前記検索文解析結果情報Ｄ２及び前記事例文解析結果情報Ｄ３）を生成する。その構文解析結果情報Ｄ２，Ｄ３は，単文ごとに１つのレコードが構成され，そのレコードは，その単文が属する前記解析対象文の識別番号のフィールド（文番号フィールド），及び複数の文法上の属性ごとに設定された複数のフィールド（属性フィールド）それぞれに対応づけられたデータの集合である。
例えば，前記解析対象文が，「彼が来た。」という文のように，主節一つからのみ構成される文（単文）である場合，その解析対象文の構文解析結果情報は一つのレコードに展開される。一方，前記解析対象文が，「彼が加入したことにより，作業が円滑化した。」という文のように，複数（この例では，２つ）の単文が接続詞でつながれているような複文である場合や，「彼が帰り，彼女が来た。」という文のように複数（この例では２つ）の単文が並列された「重文」である場合には，その解析対象文の構文解析結果情報は，単文ごとの複数のレコードに展開される。
ここで，文法上の属性（構文解析結果情報Ｄ２，Ｄ３における属性フィールド）としては，文法上の格（ハ格，ガ格，ヲ格など），品詞（形容詞，動詞など），語句の時制（現在形，過去形等），受動態か能動態か，肯定形の語句か否定形の語句か，及び１つの文に複数の単文が含まれる場合におけるある語句が属する単文の他の単文に対する文法上の階層関係の深さ等が考えられる。

図４は，前記解析対象文についての構文解析処理（係り受け解析処理等）のプロセス及び処理結果の一例を表す図である。
例えば，「本を買った店は有名だ。」という文について構文解析処理が実行された場合について説明する。
この場合，ＣＰＵ１は，前記構文解析辞書情報Ｄ４の参照により品詞が動詞である語句「だ」を特定し，この動詞「だ」を含む深さｄ３４が第０層の節（即ち，主節）「有名だ」を特定する。さらに，ＣＰＵ１は，前記構文解析辞書情報Ｄ４の参照により品詞が動詞である語句「買った」を特定し，この動詞「買った」を含む深さｄ３４が第１層の節「本を買った」を特定する。
このように，ＣＰＵ１は，構文解析処理を実行することにより，前記解析対象文それぞれについて，その文に含まれる単文（節）の前記解析対象文の文中における階層の深さｄ３４（他の単文に対する文法上の階層関係の深さ）を判別し，その判別結果を「深さフィールド」（属性フィールドの一例）のデータとして前記データ記憶部７に記録する。この深さｄ３４は，その値（内容）が０層であるか否かにより，その単文（節）が主節であるか否かを特定する情報でもある。

さらに，ＣＰＵ１は，構文解析処理において，前記構文解析辞書情報Ｄ４の参照により，前記解析対象文に含まれる語句それぞれの品詞ｄ２５と，品詞が動詞である語句それぞれの時制ｄ３６とを自動判別し，その判別結果を品詞フィールド（動詞フィールド，形容詞フィールド等）や時制フィールド（属性フィールドの一例）のデータとして前記データ記憶部７に記録する。
また，前記ＣＰＵ１は，構文解析処理を実行して前記構文解析辞書情報Ｄ４を参照することにより，品詞ｄ２５が名詞である語句とその語句に付加されている助詞の語句とを特定し，さらに，その組み合わせに基づいて語句の文法上の格ｄ５５（ハ格，ガ格，ヲ格など）を特定し，その特定結果を格フィールド（ハ格フィールド，ガ格フィールド，ヲ格フィールド等）のデータとして前記データ記憶部７に記録する。なお，図４における「ハ格」，「ガ格」及び「ヲ格」は，それぞれ「未格」，「主格」及び「目的格」と同義である。このように，構文解析結果情報Ｄ２，Ｄ３は，文中における文法上の属性と語句との対応関係を表す情報である。
なお，図４には図示されていないが，ＣＰＵ１は，構文解析処理を実行して前記構文解析辞書情報Ｄ４を参照することにより，前記解析対象文に含まれる各語句について，品詞が動詞である語句が受動態であるか能動態であるか，及び肯定形の語句（「…である」等）であるか否定形の語句（「…ではない」等）であるかについても自動判別し，その判別結果を対応する属性フィールドのデータとして前記データ記憶部７に記録する。
ここで，「語句が否定形である」ということは，品詞が動詞である語句に付随する語句が否定形の属性を有すること，即ち，品詞が動詞である語句に，当該文が否定文であることを表す語句が付随していること，と等価であり，それ以外の状態が，「語句が肯定形である」状態である。従って，肯定形の語句であるか否定形の語句であるかの情報は，当該文が肯定文であるか否定文であるかを表す情報である。例えば，構文解析処理において，「停止せず」という動詞の語句は，「停止」＋「する」＋「ぬ」という語句に分解され，動詞の語句に「ぬ」という否定形の語句（否定の助動詞）が付随しているため，「停止せず」という語句を含む文は，否定文であると判別される。
以上のようにしてＣＰＵ１は，ステップＳ３において，前記検索対象文それぞれについての構文解析結果の情報である前記検索文解析結果情報Ｄ２と，前記事例文それぞれについての構文解析結果の情報である前記事例文解析結果情報Ｄ３とを生成し，それらを前記データ記憶部７に記録する。

また，ＣＰＵ１は，構文解析処理を実行した文（各単文が属する文）それぞれの識別子である文番号ｄ４１も，各レコードに対応づけて構文解析結果情報Ｄ２，Ｄ３に含める。なお，図４に示す例では，各構文解析結果情報Ｄ２，Ｄ３に含められる各語句は基本形で表現されたもの（見出し語表現）である。例えば，品詞が動詞である語句については，その時制が現在である場合の表現で表される。前記ＣＰＵ１は，前記構文解析辞書情報Ｄ４に含まれる語句の基本形（見出し表現）と活用形（過去形表現，受動態表現等）との対応関係の情報に基づいて，語句の見出し語表現を特定する。

＜ステップＳ４＞
以上に示したような構文解析処理が終了すると，次に，ＣＰＵ１は，構文解析処理によって区分された語句（前記検索対象データＤ０及び前記事例文情報Ｄ１に含まれる語句）それぞれについて，前記シソーラス辞書情報Ｄ５に基づいてそのカテゴリｄ２６を判別し，その判別結果を判別対象となった語句に対応づけて構文解析結果情報Ｄ２，Ｄ３に含めて前記データ記憶部７に記録する（図４参照）。
前述したように，前記シソーラス辞書情報Ｄ５は，複数の語句とその語句それぞれのカテゴリの識別情報（同義語及び類義語の区分ごとに割り当てられた識別情報）とが対応付けられた周知の概念辞書の情報である。
例えば，前記シソーラス辞書情報Ｄ５においては，「発揮」，「表面化」，「登場」等の複数の語句が同じカテゴリ（の識別情報）に対応づけられている。

＜ステップＳ５，Ｓ６＞
そして，以上に示したステップＳ１〜Ｓ４の処理が終了すると，ＣＰＵ１は，カウンタ変数ｉ（初期値は１）を参照し，前記検索対象データＤ０にｉ番目の検索対象文が存在するか否かを判別する（Ｓ５）。なお，ｉは，当該検索対象文の識別番号であるとともに，前記検索対象データＤ０内における当該検索対象文の並び順の番号でもある。
ここで，ｉ番目の検索対象文が存在する場合，ＣＰＵ１は，前記検索文解析結果情報Ｄ２の中から，そのｉ番目の検索対象文についての構文解析結果である語句とその語句の属性との組合せ（フィールドとレコードのデータとの組合せ）を変数Ｓに代入する（Ｓ６）。これにより，変数Ｓに割り当てられたＲＡＭ２の記憶領域に構文解析結果が記憶される。但し，対応する前記カテゴリｄ２６（前記シソーラス辞書情報に基づき判別されたカテゴリ）が存在する語句については，そのカテゴリｄ２６も，語句と対応づけて変数Ｓに代入される。
また，ｉ番目の検索対象文に複数の単文が含まれる場合には，各単文に対応する複数のレコードのデータが変数Ｓに代入される。
その後，ＣＰＵ１は，以下に示すように，ｉ番目の前記検索対象文について，前記事例文それぞれと一致する度合いを評価する処理（Ｓ７〜Ｓ１４）を実行する。

＜ステップＳ７〜Ｓ９＞
まず，ＣＰＵ１は，カウンタ変数ｊ（初期値は１）を参照し，前記事例文情報Ｄ１にｊ番目の事例文が存在するか否かを判別する（Ｓ７）。
ここで，ｊ番目の事例文が存在する場合，ＣＰＵ１は，前記事例文解析結果情報Ｄ３の中から，そのｊ番目の事例文についての構文解析結果であるレコードのデータを変数Ｐに代入する（Ｓ８）。但し，対応する前記カテゴリｄ２６が存在する語句については，そのカテゴリｄ２６も，語句と対応づけて変数Ｐに代入される。また，ｊ番目の事例文に複数の単文が含まれる場合には，各単文に対応する複数のレコードのデータが変数Ｐに代入される。
次に，ＣＰＵ１は，変数Ｓに代入された検索対象文の構文解析結果と変数Ｐに代入された前記事例文の構文解析結果とを比較し，それぞれの構文解析結果における語句とその語句の文法上の属性との組合せの一致の程度を表す事例文一致度Ｅ(i,j)（Ｓ・Ｐ間の文一致度）を算出する（Ｓ９，文一致度算出処理）。
より具体的には，ＣＰＵ１は，検索対象文の構文解析結果（変数Ｓの内容）と前記事例文の構文解析結果（変数Ｐの内容）との間で，語句（レコードのデータ）とその語句の文法上の属性（レコードのデータに対応するフィールド）との組合せを順次比較し，その組合せが一致するごとに前記事例文一致度Ｅ(i,j)の値を所定値だけ増加させる。

また，ＣＰＵ１は，構文解析結果の比較（Ｓ，Ｐの内容の比較）において比較対象となる２つの語句の一致を判別する際に，それら２つの語句が一致しない場合には，それら２つの語句についてステップＳ４で判別した前記カテゴリｄ２６の比較によって語句の一致を判別する。但し，比較対象となる２つの語句そのものが一致する（このとき，当然に前記カテゴリｄ２６も一致する）場合と，それら２つの語句そのものは一致しないが対応する前記カテゴリｄ２６が一致する場合とで，前記事例文一致度Ｅ(i,j)の加算値（増加値）を異なる値とする（語句そのものが一致する場合の加算値の方が大きな値とする）ことが望ましい。もちろん，語句又はそのカテゴリが一致しても，その語句と文法上の属性との組合せとして一致していなければ，前記事例文一致度Ｅ(i,j)は増加させない。この点が，従来のキーワード検索と異なる点である。

また，構文解析結果の比較（Ｓ，Ｐの内容の比較）の比較において，比較対象となる属性（フィールド）ごとに，予め前記事例文一致度Ｅ(i,j)の加算値（増加値）に対する重みを設定しておくことも考えられる。例えば，「ハ格」，「ガ格」，「ヲ格」，「動詞」等の文法上の属性（フィールド）は，文の内容を大きく左右する重要な語句の属性であるため，それらの属性についての重みを，他の属性についての重みよりも高く設定しておくことが考えられる。

以上に示したことを考慮した前記事例文一致度Ｅ(i,j)の算出式の一例としては，次の（１）式が考えられる。

＜ステップＳ１０〜Ｓ１２＞
次に，ＣＰＵ１は，ｉ番目の検索対象文とｊ番目の事例文との間の前記事例文一致度Ｅ(i,j)を，ｉ番目の検索対象文についての統合一致度Ｅsum(i)に加算する（Ｓ１０）。ここで，統合一致度Ｅsum(i)は，ｉ番目の検索対象文を，検索結果として出力するか否かの判別や検索結果として出力する優先順位の判別に用いる指標値である。なお，前記統合一致度Ｅsum(i)の初期値は最小値（＝０）である。
さらに，ＣＰＵ１は，ｉ番目の検索対象文における各事例文との間の前記事例文一致度Ｅ(i,j)の最大値である最大一致度Ｅmax(i)と，その最大一致度Ｅmax(i)が得られる前記事例文の前記事例文情報Ｄ１内での並び順の番号（以下，対応事例文番号Ｑ(i)という）とを，必要に応じて更新する（Ｓ１１）。ここで，対応事例文番号Ｑ(i)は，前記事例文の識別番号でもあり，その番号Ｑ(i)により識別される前記事例文のことを，以下，対応事例文という。
即ち，ＣＰＵ１は，ｉ番目の検索対象文とｊ番目の事例文との間の前記事例文一致度Ｅ(i,j)が，その時点における前記最大一致度Ｅmax(i)よりも大きく，かつ，その文一致度Ｅ(i,j)が予め設定されたしきい値以上である場合に，その最大一致度Ｅmax(i)の値を，前記事例文一致度Ｅ(i,j)の値に更新する。さらにその場合，ＣＰＵ１は，前記対応事例文番号Ｑ(i)の内容を，当該事例文一致度Ｅ(i,j)が得られた前記事例文の識別番号ｊに更新する。また，前記事例文一致度Ｅ(i,j)が，その時点における前記最大一致度Ｅmax(i)と等しい場合，前記対応事例文番号Ｑ(i)の内容に，当該事例文一致度Ｅ(i,j)が得られた前記事例文の識別番号ｊを追加する。これにより，１つの前記検索対象文に対して複数の前記対応事例文番号Ｑ(i)が設定される場合があり得る。なお，前記最大一致度Ｅmax(i)の初期値は最小値（＝０）である。
そして，ＣＰＵ１は，変数ｊを１ずつカウントアップしつつ（Ｓ１２），入力された全ての前記事例文についてのステップＳ８〜Ｓ１１の処理が終了するまで（ｊ番目の事例文が存在しないと判別する（Ｓ７）まで），ステップＳ７〜Ｓ１１の処理を繰り返す。

＜ステップＳ１３，Ｓ１４＞
以上のようにしてステップＳ７〜Ｓ１２の処理が終了すると，続いて，ＣＰＵ１は，前記検索対象文の番号ｉと，その検索対象文について得られた前記統合一致度Ｅsum(i)と，前記対応事例文番号Ｑ(i)と，前記最大一致度Ｅmax(i)との組合せ情報を，変数ｙに追加記録する（Ｓ１３）。これにより，変数ｙには検索対象文それぞれについての前記統合一致度Ｅsum(i)，前記対応事例文番号Ｑ(i)及び前記最大一致度Ｅmax(i)が蓄積される。
そして，ＣＰＵ１は，変数ｉを１ずつカウントアップするとともに変数ｊを初期化（ｊ＝１）しつつ（Ｓ１４），前記検索対象データＤ０に含まれる全ての検索対象文についてステップＳ６〜Ｓ１３の処理が終了するまで（ｉ番目の検索対象文が存在しないと判別する（Ｓ５）まで）ステップＳ５〜Ｓ１３の処理を繰り返す。
ここで，前記検索対象文ごとの前記対応事例文番号Ｑ(i)を求める処理（Ｓ１１，Ｓ１３：対応事例文特定処理）は，前記検索対象文それぞれについて，前記文一致度Ｅ(i,j)が最も高い前記事例文を前記対応事例文として特定する処理である。これは，前記検索対象文それぞれについて，前記事例文それぞれとの間の前記文一致度Ｅ(i,j)が高いもの（予め設定されたしきい値以上であるもの）を優先して前記対応事例文を特定する対応事例文特定処理の一例である。
なお，前記対応事例文特定処理の他の例としては，前記文一致度Ｅ(i,j)が予め定められたしきい値以上であれば，その文一致度Ｅ(i,j)が得られた前記j事例文を前記対応事例文として特定すること等が考えられる。

以上のようにしてＣＰＵ１により算出及び変数ｙに記録される前記統合一致度Ｅsum(ｉ)（ｉ＝１〜Ｉ，Ｉは全ての検索対象文の数）は，前記検索対象文それぞれについて算出した前記文一致度Ｅ(i,j)の合計に相当するものである。
その結果，前記統合一致度Ｅsum(ｉ)は，対応する前記検索対象文の構文解析結果（文の内容）が，前記事例文それぞれの構文解析結果に対して一致する度合いが高いほど高い値となる。
なお，前記（１）式に基づきｉ番目の検索対象文とｊ番目の事例文との間の前記事例文一致度Ｅ(i,j)を算出する場合，ｉ番目の検索対象文と全ての事例文との間の文の一致度の指標値である前記統合一致度Ｅsum(i)は，次の（２）式により算出できる。

＜ステップＳ１５＞
そして，全ての検索対象文について，前記統合一致度Ｅsum(i)，前記対応事例文番号Ｑ(i)及び前記最大一致度Ｅmax(i)を求める処理が終了すると，ＣＰＵ１は，変数ｙを参照し，前記統合一致度Ｅsum(i)の高いものから順に（降順に）予め設定された数（指定数）の検索対象文を選択する（Ｓ１５：代表検索対象文選択処理）。前述したように，本実施形態においては，前記統合一致度Ｅsum(i)は，前記事例文それぞれとの間の前記文一致度Ｅ(i,j)の合計である。なお，このステップＳ１５で選択される前記検索対象文を，以下，代表検索対象文という。
このステップＳ１５の処理は，複数の前記検索対象文の中から，前記事例文それぞれとの間の前記文一致度Ｅ(i,j)が高いものを優先して１つ又は複数の前記代表検索対象文を選択する代表検索対象文選択処理の一例である。
なお，前記代表検索対象文選択処理の他の例としては，複数の前記検索対象文の中から，前記統合一致度Ｅsum(i)が予め定められたしきい値以上であるものを前記代表検索対象文として選択する処理等が考えられる。
また，前記検索対象文それぞれについて算出した前記文一致度Ｅ(i,j)の平均値又は最大値を前記統合一致度Ｅsum(i)とすること等も考えられる。

＜ステップＳ１６〜Ｓ１８＞
次に，ＣＰＵ１は，カウンタ変数ｋ（初期値は１）を参照し，ステップＳ１５で選択された文にｋ番目の前記代表検索対象文が存在するか否かを判別する（Ｓ１６）。なお，ｋは，ステップＳ１５で選択された前記代表検索対象文の中における各代表検索対象文の識別番号である。
そして，ｋ番目の前記代表検索対象文が存在する場合，ＣＰＵ１は，以下に示す文一致度補正処理（ステップＳ１７−１〜Ｓ１７−４）を実行する（Ｓ１７）。
＜ステップＳ１７−１＞
即ち，前記文一致度補正処理において，ＣＰＵ１は，まず，前記検索対象データＤ０（検索対象文の集合）の内での並び順がｋ番目の前記代表検索対象文に対して予め設定された前後の範囲内にある前記検索対象文（以下，前後検索対象文という）を特定する（Ｓ１７−１）。
＜ステップ１７−２＞
次に，ＣＰＵ１は，前記前後検索対象文とｋ番目の前記代表検索対象文との間の前記検索対象データＤ０内での並びの前後関係が，前記前後検索対象文についての前記対応事例文とｋ番目の前記代表検索対象文についての前記対応事例文との間の前記事例文情報Ｄ１内における並びの前後関係と一致するか否かを判別する（Ｓ１７−２）。ここで，ｋ番目の前記代表検索対象文の前記検索対象データＤ０内での並び順の番号をｋｘとする。この場合，ｋ番目の前記代表検索対象文についての前記対応事例文の前記事例文情報Ｄ１内での並び順の番号は，前記対応事例番号Ｑ(kx)である。
また，前記前後検索対象文の前記検索対象データＤ０内での並び順の番号を（ｋｘ＋α）とする。前記前後の範囲を表す予め設定された正の整数をＷとした場合，αは（−ｗ≦α≦＋ｗ）を満たす整数である。
＜ステップＳ１７−３＞
そして，ＣＰＵ１は，ステップＳ１７−２において前記前後関係が一致すると判別した場合に，前記前後関係が一致すると判別された前記前後検索対象文，即ち，（ｋｘ＋α）番目の前記検索対象文における前記最大一致度Ｅmax(kx+α)と，ｋ番目の前記代表検索対象文における前記最大一致度Ｅmax(kx)との一方又は両方を高める方向に補正する。
例えば，前記最大一致度Ｅmax(kx+α)及び前記最大一致度Ｅmax(kx)のうちの小さい方の値を，大きい方の値に更新する（値を大きい方に揃える）。
或いは，前記最大一致度Ｅmax(kx+α)及び前記最大一致度Ｅmax(kx)の両方を，予め定められた値だけ増大させる（一致度を高める）補正を行うことも考えられる。
＜ステップＳ１７−４＞
さらに，ＣＰＵ１は，前記最大一致度Ｅmax(kx+α)及び前記最大一致度Ｅmax(kx)の一方又は両方を補正した分（増大分）だけ，それに対応する前記統合一致度Ｅsum(kx+α)及び前記統合一致度Ｅsum(kx)の一方又は両方を補正する。
そして，ＣＰＵ１は，カウンタ変数ｋを１ずつカウントアップしつつ（Ｓ１８），以上に示したステップＳ１７−１〜Ｓ１７−４の処理を，前記代表検索対象文それぞれについて実行する（Ｓ１６〜Ｓ１８）。
なお，ステップＳ１７−２において前記前後関係が一致しないと判別された場合には，補正は行われない。

図５は，前記文一致度補正処理による補正前後のデータ内容の一例を表す図である。
図５に示される例は，ｋ番目の前記代表検索対象文の前記検索対象データＤ０内での並び順の番号ｋｘ＝１０，前記前後の範囲を表す整数Ｗ＝３である場合の例である。従って，６つの前記前後検索対象文の前記検索対象データＤ０内での並び順は，それぞれ７〜９番及び１１〜１３番である。
図５に示される例では，ｋ番目の前記代表検索対象文を中心とする７番目〜１３番目の前記検索対象文それぞれに対する前記対応事例文の並び順は，それぞれ１番，３番，対応事例文なし，２番，対応事例文なし，３番，４番である。なお，「対応事例文なし」とは，前記最大一致度Ｅmaxが予め設定された下限値（図５に示される例では，下限値＝３０）未満であるために，前記対応事例文が存在しないことを表す。
そして，図５に示される例では，前記前後検索対象文（７〜９番，１１〜１３番）と前記代表検索対象文（１０番）それぞれとの組合せのうち，その並びの前後関係が，前記前後検索対象文についての前記対応事例文（１番，３番，なし，３番，４番）と前記代表検索対象文についての前記対応事例文（２番）との間の並びの前後関係と一致するものは，７番目，１２番目及び１３番目の前記前後検索対象文それぞれと前記代表検索対象文（１０番）との組合せである。
そして，図５に示される例は，それら前後関係が一致する組合せについて，前記最大一致度Ｅmax(７)，Ｅmax(１２)，Ｅmax(１３)それぞれと前記最大一致度Ｅmax(１０)とのうちの小さい方の値を，大きい方の値に更新補正される状況を表している。図５に示される例では，小さい方の前記最大一致度Ｅmax(７)，Ｅmax(１２)，Ｅmax(１３)が，大きい方の前記最大一致度Ｅmax(１０)に揃えられるよう補正されている。さらに，それと併せて，その補正分だけ，前記統合一致度Ｅsum(７)，Ｅsum(１２)，Ｅsum(１３)も補正されている。
この図５に示されるような処理が，ステップＳ１７において行われる。

最後に，ＣＰＵ１は，前記文一致度補正処理が行われた後の一致度が格納された変数ｙを参照し，前記統合一致度Ｅsum(i)の高いものから順に（降順に）予め設定された数（指定数）の検索対象文を選出し，選出した検索対象文のリストを，前記統合一致度Ｅsum(i)の高いものから順に前記表示装置５の画面における前記検索結果表示枠ｇ３（図３参照）に検索結果として表示させる（Ｓ１９）。
或いは，ＣＰＵ１が，前記統合一致度Ｅsum(i)が予め設定されたしきい値以上である検索対象文を選出し，選出した検索対象文のリストを前記統合一致度Ｅsum(i)が高いものから順に前記表示装置５に表示させることも考えられる。
また，ＣＰＵ１が，全ての検索対象文を，前記統合一致度Ｅsum(i)が高いものから順に（前記統合一致度Ｅsum(i)が高い検索対象文の優先順位を上げて）前記表示装置５の画面に表示させることも考えられる。
このように，ＣＰＵ１は，前記検索対象文それぞれについて，前記事例文それぞれとの間の前記文一致度Ｅ(i,j)に基づく前記統合一致度Ｅsum(i)を算出し（Ｓ１０，Ｓ１７），その前記統合一致度Ｅsum(i)のレベルに応じて検索結果として出力するか否かの判別や，検索結果として出力する優先順位の判別（Ｓ１９）を行う（前記検索対象文出力判別手段の一例）。

以上に示した文検索装置Ｘは，前記検索対象データＤ０から，入力された前記事例文情報Ｄ１における各事例文に対して一致度の高い検索対象文を前記代表検索対象文として選択する（Ｓ１５）。
さらに，文検索装置Ｘは，その代表検索対象文及びその前後の所定範囲内に並ぶ前記前後検索対象文について，その並びの前後関係が，対応する（比較的一致度の高い）前記事例文（前記対応事例文）の並びの前後関係と一致すれば，その代表検索対象文及びその前後の前後検索対象文の一方又は両方の前記一致度がより高まるよう補正する（Ｓ１７）。
その結果，前記事例文情報Ｄ１に対して文内容及び複数の文の並びについて一致度の高い文章（前記検索対象文の集合）が，より優先して検索結果に反映されることになる。

本発明は，複数の検索対象文が順に並ぶ検索対象文集合から所望の文を検索して出力する文検索装置等に利用可能である。

本発明の実施形態に係る文検索装置Ｘ（コンピュータ）の概略構成を表すブロック図。文検索装置Ｘによる文検索処理の手順を表すフローチャート。文検索装置Ｘが表示装置に表示させる初期画面の一例を表す図。検索対象文の構文解析処理のプロセス及び処理結果の一例を表す図。文検索装置Ｘにおける文一致度補正処理による補正前後のデータ内容の一例を表す図。

符号の説明

Ｘ：本発明の実施形態に係る文検索装置（コンピュータ）
１：ＣＰＵ
２：ＲＡＭ
３：ＲＯＭ
４：入力装置
５：表示装置
７：データ記憶部
１０：文検索プログラム
Ｄ０：検索対象データ
Ｄ１：事例文情報
Ｄ２：検索文解析結果情報
Ｄ３：事例文解析結果情報
Ｄ４：構文解析辞書情報
Ｄ５：シソーラス辞書情報
Ｓ１，Ｓ２，…：処理手順（ステップ）

Claims

予め記憶手段に記憶され複数の検索対象文が順に並ぶ検索対象文集合から所望の文を検索して出力する文検索装置であって，
検索結果に含めたい文を例示する複数の事例文が順に並ぶ事例文集合の情報を入力して記憶手段に記録する事例文集合入力手段と，
前記検索対象文それぞれについて，前記事例文それぞれとの一致度合いの指標値である文一致度を算出する文一致度算出手段と，
前記検索対象文それぞれについて，前記事例文それぞれとの間の前記文一致度が高いものを優先して対応する前記事例文である対応事例文を特定する対応事例文特定手段と，
複数の前記検索対象文の中から前記事例文それぞれとの間の前記文一致度が高いものを優先して１つ又は複数の代表検索対象文を選択する代表検索対象文選択手段と，
前記代表検索対象文それぞれについて，前記検索対象文集合の内での並び順が当該代表検索対象文に対して予め設定された前後の範囲内にある前記検索対象文である前後検索対象文と当該代表検索対象文との間の並びの前後関係が，前記前後検索対象文についての前記対応事例文と当該代表検索対象文についての前記対応事例文との間の前記事例文集合内における並びの前後関係と一致する場合に，当該前後検索対象文における前記対応事例文に対する前記文一致度と当該代表検索対象文における前記対応事例文に対する前記文一致度との一方又は両方を高める方向に補正する文一致度補正手段と，
前記検索対象文それぞれについて，前記文一致度補正手段による補正を経た前記文一致度に応じて，検索結果として出力するか否かの判別及び検索結果として出力する優先順位の判別の一方又は両方を行う検索対象文出力判別手段と，
を具備してなることを特徴とする文検索装置。
前記検索対象文及び前記事例文それぞれについて，構文解析処理を施すことにより文中における文法上の属性と語句との対応関係を表す構文解析結果情報を生成する構文解析手段を具備し，
前記文一致度算出手段が，前記検索対象文それぞれについて，前記事例文それぞれとの間で前記構文解析結果情報を比較することにより前記文一致度を算出してなる請求項１に記載の文検索装置。
前記文法上の属性が，文法上の格，品詞，語句の時制，受動態か能動態か，肯定形の語句か否定形の語句か，及び１つの文に複数の単文が含まれる場合におけるある語句が属する単文の他の単文に対する文法上の階層関係の深さのうちの１つ又は複数を含んでなる請求項２に記載の文検索装置。
前記対応事例文特定手段が，前記検索対象文それぞれについて，前記文一致度が最も高い前記事例文を前記対応事例文として特定してなる請求項１〜３のいずれかに記載の文検索装置。
前記代表検索対象文選択手段が，複数の前記検索対象文の中から，前記事例文それぞれとの間の前記文一致度の合計又は平均が高いものから順に予め定められた数の前記代表検索対象文を選択してなる請求項１〜４のいずれかに記載の文検索装置。
前記検索対象文及び前記事例文それぞれに含まれる語句について，記憶手段に記憶されたシソーラス辞書の情報に基づいてカテゴリを判別するカテゴリ判別手段を具備し，
前記文一致度算出手段が，前記構文解析結果情報の比較において比較対象となる２つの語句の一致を判別する際に，該２つの語句が一致しない場合には該２つの語句について前記カテゴリ判別手段により判別されたカテゴリの比較によって語句の一致を判別してなる請求項１〜５のいずれかに記載の文検索装置。
予め記憶手段に記憶され複数の検索対象文が順に並ぶ検索対象文集合から所望の文を検索し，検索結果を情報出力手段を通じて出力する処理をコンピュータに実行させるための文検索プログラムであって，
コンピュータに，
検索結果に含めたい文を例示する複数の事例文が順に並ぶ事例文集合の情報を入力して記憶手段に記録する事例文集合入力処理と，
前記検索対象文それぞれについて，前記事例文それぞれとの一致度合いの指標値である文一致度を算出する文一致度算出処理と，
前記検索対象文それぞれについて，前記事例文それぞれとの間の前記文一致度が高いものを優先して対応する前記事例文である対応事例文を特定する対応事例文特定処理と，
複数の前記検索対象文の中から前記事例文それぞれとの間の前記文一致度が高いものを優先して１つ又は複数の代表検索対象文を選択する代表検索対象文選択処理と，
前記代表検索対象文それぞれについて，前記検索対象文集合の内での並び順が当該代表検索対象文に対して予め設定された前後の範囲内にある前記検索対象文である前後検索対象文と当該代表検索対象文との間の並びの前後関係が，前記前後検索対象文についての前記対応事例文と当該代表検索対象文についての前記対応事例文との間の前記事例文集合内における並びの前後関係と一致する場合に，当該前後検索対象文における前記対応事例文に対する前記文一致度と当該代表検索対象文における前記対応事例文に対する前記文一致度との一方又は両方を高める方向に補正する文一致度補正処理と，
前記検索対象文それぞれについて，前記文一致度補正処理による補正を経た前記文一致度に応じて，検索結果として出力するか否かの判別及び検索結果として出力する優先順位の判別の一方又は両方を行う検索対象文出力判別処理と，
を実行させるための文検索プログラム。
予め記憶手段に記憶され複数の検索対象文が順に並ぶ検索対象文集合から所望の文を検索し，検索結果を情報出力手段を通じて出力する処理をコンピュータによって実行する文検索方法であって，
コンピュータにより，
検索結果に含めたい文を例示する複数の事例文が順に並ぶ事例文集合の情報を入力して記憶手段に記録する事例文集合入力処理と，
前記検索対象文それぞれについて，前記事例文それぞれとの一致度合いの指標値である文一致度を算出する文一致度算出処理と，
前記検索対象文それぞれについて，前記事例文それぞれとの間の前記文一致度が高いものを優先して対応する前記事例文である対応事例文を特定する対応事例文特定処理と，
複数の前記検索対象文の中から前記事例文それぞれとの間の前記文一致度が高いものを優先して１つ又は複数の代表検索対象文を選択する代表検索対象文選択処理と，
前記代表検索対象文それぞれについて，前記検索対象文集合の内での並び順が当該代表検索対象文に対して予め設定された前後の範囲内にある前記検索対象文である前後検索対象文と当該代表検索対象文との間の並びの前後関係が，前記前後検索対象文についての前記対応事例文と当該代表検索対象文についての前記対応事例文との間の前記事例文集合内における並びの前後関係と一致する場合に，当該前後検索対象文における前記対応事例文に対する前記文一致度と当該代表検索対象文における前記対応事例文に対する前記文一致度との一方又は両方を高める方向に補正する文一致度補正処理と，
前記検索対象文それぞれについて，前記文一致度補正処理による補正を経た前記文一致度に応じて，検索結果として出力するか否かの判別及び検索結果として出力する優先順位の判別の一方又は両方を行う検索対象文出力判別処理と，
を実行してなることを特徴とする文検索方法。