JP2000242650A - 類似文書検索方法、類似文書検索装置、および類似文書検索プログラムを記録したコンピュータ読み取り可能な記憶媒体 - Google Patents

類似文書検索方法、類似文書検索装置、および類似文書検索プログラムを記録したコンピュータ読み取り可能な記憶媒体

Info

Publication number
JP2000242650A
JP2000242650A JP11039924A JP3992499A JP2000242650A JP 2000242650 A JP2000242650 A JP 2000242650A JP 11039924 A JP11039924 A JP 11039924A JP 3992499 A JP3992499 A JP 3992499A JP 2000242650 A JP2000242650 A JP 2000242650A
Authority
JP
Japan
Prior art keywords
search
semantic
analysis
sentence
result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Abandoned
Application number
JP11039924A
Other languages
English (en)
Inventor
Takeyuki Aikawa
勇之 相川
Yasuhiro Takayama
泰博 高山
Yamahiko Ito
山彦 伊藤
Katsushi Suzuki
克志 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP11039924A priority Critical patent/JP2000242650A/ja
Publication of JP2000242650A publication Critical patent/JP2000242650A/ja
Abandoned legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 多様な表現に対応して検索漏れを防ぎつつ、
検索ゴミの少ない検索結果を得る。 【解決手段】 検索文を入力する入力ステップS201
と、入力された検索文を解析用単語辞書(103)に基づい
て単語単位に分割する形態素解析ステップS202と、
単語間の構文的係り受け関係を解析する構文解析ステッ
プS203と、構文解析ステップの構文解析結果に基づ
き文書データベース105を検索する一次検索ステップ
S204と、領域依存の概念知識を格納した概念知識デ
ータベース108を基に検索文と一次検索ステップの検
索結果との意味的な照合を行い類似あるいは非類似の検
索結果を出力する意味照合ステップS205とを備えて
いる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、ヘルプデスク支
援システム等で利用される類似文書検索方法、および類
似文書検索装置等に関するものである。
【0002】
【従来の技術】検索文に厳密に一致する検索結果だけで
なく、異なる表現で同じ意味内容を表す文書を検索した
いという要求が強い。こうした要求に対して、これまで
以下の技術が開示されている。 (1)検索入力文をシソーラス等により展開して検索も
れを少なくする。(特開平10−232877号公報) (2)単語間の構文的もしくは意味的関係を関係対応テ
ーブルに記述しておき、同テーブルを用いて検索入力文
を展開して検索もれを少なくする。(特開平10−11
462号公報) (3)データベース中より2単語の関係を自動抽出して
知識ベースとして蓄え、さらに専門家の知識を補助的に
使用することにより検索もれを少なくする。(特開平4
−357568号公報)
【0003】図14は、上記先行技術(1)に示された
従来の検索方式である。まず、第一の文字列入力部14
01において入力した検索キーワード(ここでは「hype
rtension」)を、第一のシソーラス辞書システム140
2により類義の表現「高血圧」に変換する。つぎにデー
タベース側のキーワードである「血圧が高い」と類似度
評価部1405において文字列照合を行い、該評価部に
よる評価値を、しきい値設定部1406において設定さ
れたしきい値と判定部1407において、入力キーワー
ド「hypertension」がデータベース側のキーワード「血
圧が高い」に一致するか否かを判定する。一致すると判
定されれば、「hypertension」という検索入力に対し
て、「血圧が高い」というキーワードをもつデータが、
データベースより検索される。
【0004】先行技術(2)においては、入力検索文を
意味解析し、関係対応テーブルを参照して上記解析結果
を類似の意味表現に展開して検索することにより、例え
ば「日本が米国に輸出する」という検索文より「日本か
ら米国が輸入する」という表現を検索可能としている。
【0005】先行技術(3)においては、データベース
中より「を格」と動詞、「に格」と動詞に代表される2
単語の関係を自動抽出して知識ベースとして蓄え、さら
に専門家の知識を補完テンプレートとして手作業により
入力し、これを補助的に使用することにより検索もれを
少なくして、入力検索文と意味の類似する文書を検索す
るという方法が開示されている。
【0006】
【発明が解決しようとする課題】しかし、従来技術には
以下の問題点がある。従来技術(1)および(2)で
は、過剰な展開により、検索ゴミが増加する。例えば、
従来方式によれば、「点灯する」の類義語展開として
「つく」が得られたとしても、キーワード単位でしか処
理していなかったり、格要素を指定することができない
ため、「ランプが点灯しない」という検索文に対して
「ランプがつかない」を検索できるようになるものの、
「金具がつかない」「蓋がつかない」「ランプが点灯す
る」などの大量の検索ゴミが発生する問題があった。
【0007】一方、従来技術(3)においては、データ
ベース中より抽出した知識ベースおよび専門家の知識を
利用して類似文書検索を行うことにより、精度のよい検
索を試みている。しかし、利用する知識ベースは2単語
間の関係に限定されたものであり、類似度計算において
も同知識ベースに基づく限定された方法であり、十分な
精度を与えるものではない。また、上記いずれの従来技
術においても、未知語を含んだ入力、および構文的に誤
りを含んだ検索文に対する類似検索処理については考慮
されていなかった。
【0008】この発明は上記のような問題点を解決する
ためになされたもので、領域限定の概念知識(領域オン
トロジー)を用いた推論を行うことにより、多様な表現
に対応して検索漏れを防ぎつつ、検索ゴミの少ない検索
結果を得ることが出来る類似文書検索方法、類似文書検
索装置、および類似文書検索プログラムを記録したコン
ピュータ読み取り可能な記憶媒体を得ることを目的とす
る。また、構文的に誤りを含んだ文が検索文として入力
されても、概念知識を用いて自動的に修正することによ
り、適切な検索結果を得ることを目的とする。さらに、
入力検索文が未知語を含んでいる場合でも、概念知識を
用いて当該未知語の概念を推定し、適切な検索結果を得
ることが出来る類似文書検索方法、類似文書検索装置、
および類似文書検索プログラムを記録したコンピュータ
読み取り可能な記憶媒体を得ることを目的とする。
【0009】
【課題を解決するための手段】この発明に係る類似文書
検索方法は、検索文を入力する入力ステップと、入力さ
れた検索文を解析用単語辞書に基づいて単語単位に分割
する形態素解析ステップと、単語間の構文的係り受け関
係を解析する構文解析ステップと、構文解析ステップの
構文解析結果に基づき文書データベースを検索する一次
検索ステップと、領域依存の概念知識を格納した概念知
識データベースを基に検索文と一次検索ステップの検索
結果との意味的な照合を行い類似あるいは非類似の検索
結果を出力する意味照合ステップとを備えている。
【0010】また、文書データベースは、文書の構文解
析結果を有し、一次検索ステップは、構文解析結果を索
引として検索する。
【0011】また、一次検索ステップが索引として用い
る構文解析結果は、木構造である。
【0012】また、一次検索ステップは、照合対象範囲
を絞り込む一次検索絞込みステップを有する。
【0013】また、意味照合ステップは、構文的要素の
重要度によって意味構造の照合を行う。
【0014】また、意味照合ステップは、構文的要素が
必須格要素であるか任意格要素であるかによって意味構
造の照合計算に重みづけをする。
【0015】また、概念知識データベースは、意味的な
包含関係を示すIS−A知識を有し、意味照合ステップ
は、IS−A知識に基づいて意味構造の照合を行う。
【0016】また、概念知識データベースは、意味的な
部分−全体の関係を示すHAS−A知識を有し、意味照
合ステップは、HAS−A知識に基づいて意味構造の照
合を行う。
【0017】また、概念知識データベースは、格関係知
識を有し、意味照合ステップは、格関係知識に基づいて
意味構造の照合を行う。
【0018】また、形態素解析ステップは、未知語範囲
を推定する未知語推定ステップを有し、構文解析ステッ
プは、概念知識データベースを参照して未知語の概念を
推定する未知語概念推定ステップを有する。
【0019】また、構文解析ステップは、概念知識デー
タベースを参照して異常な係り受け関係を修正する係り
受け関係修正ステップを有する。
【0020】また、意味照合ステップは、照合の詳細度
を設定する意味照合詳細度設定ステップを有する。
【0021】また、照合の詳細度として木構造の深さを
指定する。
【0022】また、この発明に係る類似文書検索装置
は、検索文を入力する入力手段、入力された検索文を解
析用単語辞書に基づいて単語単位に分割する形態素解析
手段、単語間の構文的係り受け関係を解析する構文解析
手段、構文解析ステップの構文解析結果に基づき文書デ
ータベースを検索する一次検索手段と、領域依存の概念
知識を格納した概念知識データベースを基に検索文と一
次検索手段の検索結果との意味的な照合を行い類似ある
いは非類似の検索結果を出力する意味照合手段とを備え
ている。
【0023】また、この発明に係る類似文書検索プログ
ラムを記録したコンピュータ読み取り可能な記憶媒体
は、(a)検索文を入力する入力手順、(b)入力され
た検索文を解析用単語辞書に基づいて単語単位に分割す
る形態素解析手順、(c)単語間の構文的係り受け関係
を解析する構文解析手順、(d)構文解析ステップの構
文解析結果に基づき文書データベースを検索する一次検
索手段手順、(e)領域依存の概念知識を格納した概念
知識データベースを基に検索文と一次検索手段の検索結
果との意味的な照合を行い類似あるいは非類似の検索結
果を出力する意味照合手順、を備えている。
【0024】
【発明の実施の形態】実施の形態1.図1は本発明の類
似文書検索装置を示す構成図である。図1に示した類似
文書検索装置は、検索文を入力する入力手段としての検
索文入力部101、検索文を単語単位に分割する形態素
解析手段としての形態素解析部102、前記形態素解析
部102において使用する解析用単語辞書103、形態
素解析結果を文法にしたがって係り受け解析する構文解
析手段としての構文解析部104、大量の文書を検索し
やすいよう索引つきで格納する文書データベース10
5、構文解析結果に基づいて前記文書データベースを検
索する一次検索手段としての一次検索部106、前記一
次検索部106の処理結果を格納する一次検索結果格納
部107、領域依存の概念知識を記述した概念知識デー
タベース108(図中および以下では領域限定概念知識
108と略記する)、前記領域限定概念知識108を参
照しつつ、入力文の構文解析結果と一次検索結果格納部
の各文との意味照合を行う意味照合手段としての意味照
合部109、および検索結果を出力する検索結果出力部
110から構成される。
【0025】図2は本発明の類似文書検索処理のフロー
チャートである。以下、適宜図1および詳細図面を参照
しつつ、図2のフローチャートにしたがって検索処理に
ついて具体例を用いて説明する。まず、ステップS20
1において、本装置の利用者が検索文入力部101によ
り、所望の文書を検索するための検索文を入力する。こ
のとき、キーボードによる入力はもちろんのこと、文字
認識装置または音声認識装置による入力でも良い。ここ
では、例えば「OSがCDROMドライブを認識しな
い」という検索文が入力されるものとする。
【0026】つぎに、ステップS202において検索文
305の形態素解析を行なう。図3は形態素解析部10
2の詳細ブロック図である。コスト最小法解析部301
では、解析用単語辞書103、付属語辞書302、およ
び付属語接続表303を参照しつつ、コスト最小法(文
献1:「未登録語を含む日本語文の形態素解析」、吉村
他、情報処理学会論文誌Vol.30, No.3, pp.294-301(198
9))にしたがって形態素解析を行う(図4:ステップS
401)。コスト最小法、付属語辞書および付属語接続
表については、前記文献1に詳述されているので説明は
省略する。なお以下の説明では、図3の解析途中結果3
09のように、形態素の区切りを「/」によって示して
略記することとする。
【0027】解析途中結果309の自立語部分から、解
析用単語辞書に記述された情報、見出し306、品詞情
報307、概念情報308を参照可能となるよう構成す
る。このとき、辞書を参照するためのポインタ情報を保
持しても良いし、辞書が二次記憶に存在するなど参照に
時間を要する場合、一次記憶上に前記情報をコピーして
もよい。なお以下の説明では、図3における308のよ
うに単語を<>でくくった場合は、概念情報を表すもの
とする。
【0028】未知語範囲推定部304では、解析途中結
果309に未知語が含まれていないかどうかを検知し、
含まれている場合は未知語範囲を推定して未知語形態素
として切り出す(図4:ステップS402)。ここで
は、解析途中結果309に未知語が検出されないため、
形態素解析出力結果310は解析途中結果309に等し
くなる。
【0029】つぎに、図2のステップS203において
検索文の構文解析を行う。図5は構文解析部104の詳
細ブロック図である。構文解析部104は、係り受け解
析を行う基本単位である文節構造506を生成する文節
構造生成部501、文法規則503を参照しながら係り
受け解析を行う係り受け解析部502、領域限定概念知
識108を参照して未知語概念の推定を行う未知語概念
推定部504、同じく領域限定概念知識108を参照し
て係り受け関係の修正を行う係り受け関係修正部505
から構成される。
【0030】図6は構文解析ステップS203の動作を
詳細に説明したフローチャートである。以下、図5を参
照しつつ図6の各ステップについて説明する。
【0031】ステップS601では、文節構造生成部5
01が図3の形態素解析出力結果310を入力とし、係
り受け解析を行う基本単位である文節構造506を生成
する。文節構造は、最低1つの自立語形態素および同自
立語形態素に連なる0個以上の付属語形態素からなる。
文節構造506の一例を図7に示す。図7において文節
構造は、係り属性701、受け属性702、自立語情報
703、付属語情報704からなる。自立語情報703
は、当該文節を構成する自立語形態素情報へのポインタ
である。付属語情報704は、0個以上の複数の付属語
形態素情報へのポインタ配列である。
【0032】つぎにステップS602において、文節構
造506に未知語形態素が含まれるかどうかを判定す
る。未知語形態素が含まれている場合は、ステップS6
03において未知語概念推定部504が未知語概念の推
定を行う。本実施の形態における入力(図3:検索文3
05)の場合、未知語は含まれないので未知語概念推定
処理は行われずステップS604に進む。(ステップS
603における処理については実施の形態2.において
説明する。)
【0033】ステップS604では、係り受け解析制御
部502が文法規則503にしたがって文節構造506
の係り受け解析を行なう。例えばCYK法(文献2:
「自然言語理解」、田中、辻井共編、オーム社、198
9年、第3章 統語解析の手法[1]CYK法)にした
がって解析を行なう。文法規則に基づいた係り受け解析
の方法については、文献2をはじめとして多くの文献に
解説されているので、ここでは詳細な説明は省略する。
なお一般に、係り受け解析の際には多数の曖昧性を生ず
るが、該曖昧性を解消するために領域限定概念知識10
8を適宜参照することとする。
【0034】つぎに、ステップS605において、係り
受け解析が成功したかどうかを判定する。失敗していた
場合は、ステップS506に進み、係り受け関係修正部
406が異常な係り受け関係を修正する。本実施の形態
における入力(図3:検索文305)の場合は、解析が
成功するので係り受け関係修正処理は行われない。(ス
テップS606における処理については実施の形態3.
において説明する。)
【0035】つぎに、図2のステップS204において
文書データベースの一次検索を行なう。文書データベー
ス105が少量の文書しか含まなければ、入力検索文を
すべての対象文書内の文と意味照合を行うという方法も
考えられるが、一般には大量の文書が格納されているた
め、すべての文と照合処理を行うと処理時間に問題が生
じる。この問題を解決するために、図8に示した索引を
用いて、図9に示した一次検索処理を行い、意味照合処
理を行なう対象文書および文を絞り込む。
【0036】検索アルゴリズムを説明する前に、一次検
索用の索引の構成について説明する。図8は文書データ
ベースの一次検索用索引の一例である。索引には、登録
文書に含まれる各文の構文解析結果801を用いる。本
発明においては、類似文書の検索にあたって、検索文と
類似する文を含む文書を検索するものとする。図8では
簡単のため、各文書について1文のみの構文解析結果を
示したが、実際には各文書に対して複数の文が対応す
る。ここで、各文書に含まれるすべての文によって一次
検索用の索引を構成しても良いし、各文書において当該
文書の特徴を表わす文をあらかじめ抽出しておき、検索
に用いる文を絞り込んでおいてから索引を構成しても良
い。
【0037】ここで、構文解析結果の木構造の深さに応
じて、ルートノードから第一レベル、第二レベルという
ようにノードを分類して意味シンボルによる索引を作成
する。まず、第一レベルのノード(ルートノード)がも
つ意味シンボル801aによる索引802を作成する。
つぎに、索引802が参照する文書すべてについて、第
二レベルのノードがもつ意味シンボルによる索引80
3、804および805などを作成する。第二レベル以
下の索引は、第一レベルの索引おのおのすべてについて
同様に作成する。各索引は、意味シンボル802a、参
照する総文書数802b、次レベル索引へのポインタ8
02cからなる。次レベル索引へのポインタの最後は、
実際の文書および文の位置への参照ポインタを記したリ
ーフノード806に至る。
【0038】図9は一次検索のアルゴリズムを説明する
フローチャートである。まずステップS901におい
て、処理終了判定に用いる閾値件数を設定する。この閾
値については、システムごとに固有の値であっても良い
し、別途、閾値設定手段を設けて対象文書に応じて使用
者が適宜設定するように構成しても良い。ここでは、閾
値件数として100件が設定されるとする。
【0039】つぎにステップS902において、検索入
力文の構文解析結果(図5:係り受け構造507)の第
一レベルノードの意味シンボルにより、図8における第
一レベルの索引を検索する。簡略化のため図8には示し
ていないが、第一ノードの索引を意味シンボルにより検
索するための索引は別途作成しておくものとする。
【0040】つぎに、ステップS903において、検索
結果の有無を判定する。ここでは、意味シンボル<検出
動作>による検索に成功するので、ステップS906に
進む。検索結果は図1の一次検索結果格納部107に格
納される。入力意味シンボルの検索に失敗した場合に
は、ステップS904において領域限定概念知識108
を参照し、上位概念による検索を行なう。ステップS9
04での検索に失敗した場合は、一次検索の時点で類似
文書検索結果が0件として終了する(ステップS90
5)。
【0041】ステップS906において、検索結果の件
数を判定する。閾値件数Nmaxに比べて件数が多い場
合はステップS907に進む。件数が少ない場合は一次
検索ステップS204を終了する。第一レベルノード索
引802を参照すると、総文書数802bが590件な
ので、ステップS907に進む。
【0042】ステップS907からステップS911の
ループ処理では、第二レベルのノードの検索を行なう。
説明を簡易にするため図9には記載しなかったが、第三
レベル以下でも絞込みを行なうために、前記ループの外
側でもうひとつのループを構成するようアルゴリズムを
修正することは容易である。
【0043】まずステップS907において、検索入力
文の構文解析結果(図5:係り受け構造507)の第二
レベルの最初のノードの意味シンボル<基本S/W>を
第二レベルの索引より検索する。検索は802cのポイ
ンタを用いて行なう。係り受け構造507において第二
レベルのノードが複数存在するのに対して、ここでは、
任意の順に検索するものとするが、「を格」を優先する
というように、検索順序を指定してもよい。
【0044】つぎにステップS908において、検索結
果の有無を判定する。ステップS907における絞込み
検索が失敗した場合は、ステップS909に進み直前の
検索結果を採用し、一次検索ステップS204を終了す
るものとする。絞込み検索に成功した場合は図1の一次
検索結果格納部107の内容を更新してステップS91
0に進む。
【0045】ステップS910において、件数を判定す
る。件数が多い場合はステップS911に進む。件数が
少ない場合は一次検索ステップS204を終了する。件
数判定に使用するスレッショルドNは、ステップS90
6と同じ値を使用する。ここでは、索引803により総
文書数が480件であることがわかるのでステップS9
11に進む。ステップS911では、係り受け構造50
7の第二レベルに他ノードがあるかどうかを判定し、な
ければ一次検索ステップS204を終了し、あればステ
ップS907からのループ処理を続行する。
【0046】ループ処理を続行する際には、図1の一次
検索結果格納部107に一時記憶されている直前の検索
結果を使用する。次ノードの検索結果文書一覧をリーフ
ノードまで参照して、直前の検索結果との積集合の要素
数を検索結果の件数としてステップS909の件数判定
を行なう。ここでは、第二レベルのノードは2つしかな
いので、二度目のステップS910の判定においてルー
プ処理を抜けて、一次検索処理ステップS204の処理
を終了する。
【0047】つぎに、図2のステップS205におい
て、図1の一次検索結果格納部107に格納された各文
書の該当文と、入力された検索文の係り受け解析結果5
07との意味照合処理を行なう。意味照合処理について
は、同処理において使用する領域限定概念知識108の
一例を図10に示し、これを参照しつつ図11に示すフ
ローチャートにしたがって説明する。
【0048】まず、ステップS1101においてループ
処理のための初期化を行なう。つぎに、ステップS11
02からステップS1104までのループ処理を一次検
索結果の各文に対して実行する。ステップS1103に
おいて、一次検索結果のi番めの文と入力検索文S0
(図5:係り受け構造507)との類似度計算を行な
う。
【0049】類似度の計算については、図12を用いて
説明する。図11のステップS1103における類似度
計算関数Sim(A,B,D)において、引数のAおよ
びBは、構文解析結果である係り受け構造であり、図1
2に示したような木構造である。引数のDは、類似度計
算の際の照合の詳細度であり、図12に示した2つの木
構造の類似度計算の際に、ルートノードから何階層めま
でを処理対象とするかを示す値である。ここでは簡単の
ため、D=2として説明する。
【0050】最初に初期類似度1.0を与える。類似度
1.0は、入力された2つの文が、まったく同じ意味を
表わすということを意味する。以下の処理では、木構造
をたどりながら各ノードの情報を比較し、異なる部分に
ペナルティをあたえ、1.0から減じていく。類似度が
0になった時点で、比較対象は類似していないとみなし
て類似度計算を停止する。類似度計算におけるペナルテ
ィ計算規則の一例を図13に示す。
【0051】まず、第一レベルのノード間の比較をす
る。ここでは、意味シンボルが等しく、実際の単語が異
なるので図13の規則1301にしたがって、ペナルテ
ィ値−0.01を与える。つぎに、第二レベルの比較を
行う。このとき、左側のノード(OS<基本S/W>)
については、情報が完全に一致するのでペナルティはな
い。右側のノードは意味シンボルが異なるので図13の
規則1304にしたがってペナルティ−0.3を与え
る。このようにして、類似度は、0.69として計算さ
れる。かりに、前記引数の値Dが1として与えられてい
れば、類似度計算は第一レベルのみとし、類似度は0.
99として与えられる。このように、Dの値により、類
似度計算の精度を制御できるので、検索状況に応じた柔
軟な処理が可能である。
【0052】前記構造507に対して図13の規則13
02を適用すると、図10に示したIS−A知識100
1によって「MOドライブを認識しない」という文との
類似度は0.9となる。一方、図13に示した規則13
06を入力検索文「OSがCDROMを認識しない」の
係り受け構造507に適用すると、「OSがCDROM
を認識した」との類似度は0.1となり、類似していな
いことになる。
【0053】また前記と同様にして「マウスボタンの入
力を受け付けない」という文に対して図13の規則13
03を適用すると、図10のHAS−A知識1002を
用いて、「マウスの入力を受け付けない」という文との
類似度が高くなる。
【0054】また「モデムを電話に接続する」という文
を入力すると、さきに説明した形態素解析ステップS2
02および構文解析ステップS203において、「<周
辺装置〉を<電話機>に<接続動作>」という解析結果
が得られる。同様にして、「モデムをパソコンに接続す
る」という文からは「<周辺装置>を<計算機>に<接
続動作>」という解析結果が得られる。上述2文の類似
度を求める際に規則1305を適用すると、前者の文が
「<電話犠>に」を含み後者の文が「<計算機>に」を
含むので、図10における格関係知識1003に記載さ
れた「<周辺装置>を<計算機>に<接続動作>」とい
う知識を参照し、構文構造における重要な要素(重要
度)である必須格要素が異なっているため類似度は小さ
くなる。ここでは説明を簡単にするために、格関係知識
1003に記述された格を必須格とし、それ以外を任意
格としているが、格関係知識1003の中に必須格か任
意格かを記述するフィールドを設けるような構成として
も良い。規則1305においてペナルティ値は固定であ
るが、このペナルティ値を格関係知識1003の中に記
述することにより、動詞ごとに柔軟な処理を行なうこと
も可能である(構文的要素が必須格要素か任意格要素か
によって意味構造の照合計算に重みづけをする)。
【0055】最後に、ステップS1105において、検
索結果を類似度順にソートして、図2のステップS20
6において、図1の検索結果出力部110に出力する。
このように、本方式によれば例えキーワードレベルでは
完全に一致していても、文の意味内容が異なれば類似度
が小さくなり、IS−A知識1001によって「MOド
ライブを認識しない」との類似度が高くなる。従来のキ
ーワードベースの検索においては、このようなきめの細
かい処理はしていないため、前記の否定文などが検索ゴ
ミとして上位に出力されてしまうが、本方式によれば、
例えば類似度が0.5以下の文は表示しないように設定
することで出力しないようにすることができる。
【0056】以上のように、形態素解析ステップS20
2において入力検索文を単語単位に分割し、構文解析ス
テップS203において前記入力検索文に対する係り受
け構造を生成し、一次検索ステップS204において同
係り受け構造による一次検索を行ない、意味照合ステッ
プS205において概念知識データベース108を参照
しつつ前記入力文と前記一次検索結果との類似度を計算
し、同類似度にしたがって検索結果を出力することで、
多様な表現を吸収しつつ検索ゴミの少ない類似文書検索
を実現している。
【0057】また、一次検索ステップS204におい
て、照合対象候補を絞り込むことによって、処理負荷の
高い高度な意味照合処理をも可能にしている。前記照合
対象候補の絞込みにあたって、前記入力検索文の構文解
析結果である係り受け構造を用いることにより、前記意
味照合ステップS205において、より詳細な照合が可
能となるよう絞込みを行なっている。
【0058】実施の形態2.次に、入力検索文に未知語
が含まれる場合に、当該未知語の概念を推定して類似文
書を検索する場合について説明する。全体構成および全
体処理については、実施の形態1.において示した図1
および図2と同様なので説明を省略する。以下、図2の
ステップS202およびステップS203について、図
3から図6までを参照しながら説明する。
【0059】以下、図3に示した形態素解析処理部に対
して、検索入力文「DVDRAMをPCに接続する方
法」が入力された場合について説明する。図4のステッ
プS401において、図3のコスト最小法解析部301
が実施の形態1.と同様にして形態素解析を行なう。こ
のとき、「DVDRAM」という単語が辞書に登録され
ていないものとする。すると、コスト最小法解析部30
1は、「DVDRAM」の辞書検索に失敗するので、こ
の部分を単なる記号列として解析を行ない、「DVDR
AM(記号列)/を(格助詞)/PC(名詞)/に(格
助詞)/接続(サ変名詞)/する(活用語尾)/方法
(名詞)」という解析結果を出力する。つぎに、ステッ
プ304では、前記解析結果に「DVDRAM」という
未知の記号列が出現したことを検知し、この部分を未知
語であるとみなして、形態素解析結果「DVDRAM
(未知語)/を(格助詞)/PC(名詞)/に(格助
詞)/接続(サ変名詞)/する(活用語尾)/方法(名
詞)」を出力する。
【0060】次に、図2のステップS204に進み、実
施の形態1.と同様にして、図6のステップS601に
おいて、文節構造「(DVDRAMを)(PCに)(接
続する)(方法)」を生成する。なお、ここでは説明を
簡易にするため、文節構造として形態素のまとまりの単
位のみ示すが、実際には、図7に示したような構造をも
つものとする。続けてステップS602において、未知
語ありと判定され、ステップS603に進む。
【0061】ステップS603では、係り受け解析制御
部502が未知語概念推定部604に前記文節構造を入
力する。未知語概念推定部504は、領域限定概念知識
108を参照して、未知語の概念を推定する。未知語概
念推定部504は、入力された文節構造から「(<未知
概念>を)(<計算機>に)(<接続動作>する)(<
方法>)」という意味シンボル列を得て、図10に示し
た格関係知識1003を検索する。すると、「<周辺装
置>を<計算機>に<接続>する」という格関係記述が
見つかり、<未知概念>が<周辺装置>であるというこ
とを推定し、係り受け解析制御部502に推定結果を出
力する。
【0062】係り受け解析制御部502では、前記推定
結果を受け取り、実施の形態1.と同様にして、ステッ
プS604において構文解析を実行する。以下、解析が
成功するのでステップS605を経てステップS203
の処理を終了する。
【0063】以下、図2におけるステップS204およ
びステップS205を経て、ステップS206において
入力検索文と類似の表現である「CDROMをパソコン
に接続する方法」などが出力される。
【0064】このようにして、未知語を含む検索入力文
に対しても、未知語範囲推定部が未知語の範囲を推定
し、未知語概念推定部が領域限定概念知識を参照して未
知語の概念を推定することにより、所望の類似文書検索
結果を得ることができる。
【0065】なお、前記の例では辞書に登録されていな
い新しい製品名が入力された場合を想定しているが、そ
の他にも検索文入力のタイプミス等による未知語も処理
可能である。例えば、「ディスプレイ」と入力するつも
りが「ティスプレイ」と誤入力した場合でも、未知語と
して検出され、概念が推定されるので、ヘルプデスク
等、電話による対話を進めながらキー入力する場合や、
音声認識および文字認識等による入力で認識誤りが含ま
れるような場合にも好適な検索結果を得ることができ
る。
【0066】実施の形態3.次に、入力検索文に構文的
な誤りが含まれる場合に、正しい係り受け関係を推定し
て類似文書を検索する場合について説明する。全体構成
および全体処理については、実施の形態1.において示
した図1および図2と同様なので説明を省略する。以
下、図2のステップS203について、図5および図6
を参照しながら説明する。
【0067】入力検索文として「CDROMをPCを接
続する」が与えられた場合について説明する。まず、実
施の形態1.と同様にして、図2のステップS201お
よびステップS202において、形態素解析結果「CD
ROM/を/PC/を/接続/する」が得られる。同じ
く実施の形態1.と同様にして、図6ステップS601
において文節構造「(CDROM<周辺装置>を)(P
C<計算機>を)(接続<接続動作>する)」が得られ
る。なお、ここでは説明を簡易にするため、文節構造と
して形態素のまとまりの単位のみ示すが、実際には、図
7に示したような構造をもつものとする。
【0068】つぎにステップS602を経てステップS
604に進み係り受け解析を行なう。ここで、入力され
た文節構造には、「(CDROMを)」および「(PC
を)」という2つの「を格」が含まれて重複しているた
め解析が失敗し、ステップS605を経てステップS6
06に進む。
【0069】ステップS606では、図5の係り受け関
係修正部505が領域限定知識108を参照して係り受
け関係を修正する。図10に示した格関係知識1003
には、「<周辺装置>を<計算機>に<接続動作>す
る」という知識が含まれているので、これを入力された
文節構造に適用し、「(PC<計算機>を)」の部分を
「(PC<計算機>に)」に修正してから、再度ステッ
プS604に進んで係り受け解析を行なう。
【0070】今度は解析に成功するので、ステップS6
05を経てステップS203を終了する。続けて、図2
におけるステップS204およびステップS205を経
て、ステップS206において入力検索文と類似の表現
である「MOをPCに接続する」などが出力される。
【0071】このようにして、構文的な誤りを含む検索
入力文に対しても、係り受け関係修正部が領域限定概念
知識を参照して係り受け関係を修正することにより、所
望の類似文書検索結果を得ることができる。例えば、ヘ
ルプデスク等、電話による対話を進めながらキー入力す
る場合や、音声認識および文字認識等による入力で認識
誤りが含まれるような場合にも好適な検索結果を得るこ
とができる。
【0072】
【発明の効果】この発明に係る類似文書検索方法は、検
索文を入力する入力ステップと、入力された検索文を解
析用単語辞書に基づいて単語単位に分割する形態素解析
ステップと、単語間の構文的係り受け関係を解析する構
文解析ステップと、構文解析ステップの構文解析結果に
基づき文書データベースを検索する一次検索ステップ
と、領域依存の概念知識を格納した概念知識データベー
スを基に検索文と一次検索ステップの検索結果との意味
的な照合を行い類似あるいは非類似の検索結果を出力す
る意味照合ステップとを備えている。そのため、領域依
存の概念知識を用いた推論を行うことにより、多様な表
現に対応して検索漏れを防ぎ、また意味照合ステップ
は、意味構造的な照合を行うので検索ゴミの少ない検索
結果を得ることができる。
【0073】また、文書データベースは、文書の構文解
析結果を有し、一次検索ステップは、構文解析結果を索
引として検索する。そのため、より詳細な照合が可能と
なる。
【0074】また、一次検索ステップが索引として用い
る構文解析結果は、木構造である。そのため、構造が簡
単で構築が容易である。
【0075】また、一次検索ステップは、照合対象範囲
を絞り込む一次検索絞込みステップを有する。そのた
め、処理負荷の高い高度な意味照合処理をも可能にして
いる。
【0076】また、意味照合ステップは、構文的要素の
重要度によって意味構造の照合を行う。そのため、より
詳細な照合が可能となる。
【0077】また、意味照合ステップは、構文的要素が
必須格要素であるか任意格要素であるかによって意味構
造の照合計算に重みづけをする。そのため、さらに詳細
な照合が可能となる。
【0078】また、概念知識データベースは、意味的な
包含関係を示すIS−A知識を有し、意味照合ステップ
は、IS−A知識に基づいて意味構造の照合を行う。そ
のため、きめ細かい検索処理をすることができ、さらに
検索ゴミを少なくすることができる。
【0079】また、概念知識データベースは、意味的な
部分−全体の関係を示すHAS−A知識を有し、意味照
合ステップは、HAS−A知識に基づいて意味構造の照
合を行う。そのため、きめ細かい検索処理をすることが
でき、さらに検索ゴミを少なくすることができる。
【0080】また、概念知識データベースは、格関係知
識を有し、意味照合ステップは、格関係知識に基づいて
意味構造の照合を行う。そのため、より詳細な意味構造
の照合を行うことができる。
【0081】また、形態素解析ステップは、未知語範囲
を推定する未知語推定ステップを有し、構文解析ステッ
プは、概念知識データベースを参照して未知語の概念を
推定する未知語概念推定ステップを有する。そのため、
入力で誤りが含まれるような場合にも好適な検索結果を
得ることができる。
【0082】また、構文解析ステップは、概念知識デー
タベースを参照して異常な係り受け関係を修正する係り
受け関係修正ステップを有する。そのため、構文的な誤
りを含む検索入力文に対しても、所望の類似文書検索結
果を得ることができる。
【0083】また、意味照合ステップは、照合の詳細度
を設定する意味照合詳細度設定ステップを有する。その
ため、詳細度を変更することができ汎用性が増す。
【0084】また、照合の詳細度として木構造の深さを
指定する。そのため、詳細度の設定が容易であり、ま
た、構造が簡単で構築が容易である。
【0085】また、この発明に係る類似文書検索装置
は、検索文を入力する入力手段、入力された検索文を解
析用単語辞書に基づいて単語単位に分割する形態素解析
手段、単語間の構文的係り受け関係を解析する構文解析
手段、構文解析ステップの構文解析結果に基づき文書デ
ータベースを検索する一次検索手段と、領域依存の概念
知識を格納した概念知識データベースを基に検索文と一
次検索手段の検索結果との意味的な照合を行い類似ある
いは非類似の検索結果を出力する意味照合手段とを備え
ている。そのため、領域依存の概念知識を用いた推論を
行うことにより、多様な表現に対応して検索漏れを防
ぎ、また意味照合手段は、意味構造的な照合を行うので
検索ゴミの少ない検索結果を得ることができる。
【0086】また、この発明に係る類似文書検索プログ
ラムを記録したコンピュータ読み取り可能な記憶媒体
は、(a)検索文を入力する入力手順、(b)入力され
た検索文を解析用単語辞書に基づいて単語単位に分割す
る形態素解析手順、(c)単語間の構文的係り受け関係
を解析する構文解析手順、(d)構文解析ステップの構
文解析結果に基づき文書データベースを検索する一次検
索手順、(e)領域依存の概念知識を格納した概念知識
データベース(108)を基に検索文と一次検索手段の検索
結果との意味的な照合を行い類似あるいは非類似の検索
結果を出力する意味照合手順、を備えている。そのた
め、領域依存の概念知識を用いた推論を行うことによ
り、多様な表現に対応して検索漏れを防ぎ、また意味照
合手順は、意味構造的な照合を行うので検索ゴミの少な
い検索結果を得ることができる。
【図面の簡単な説明】
【図1】 本発明の類似文書検索装置を示す構成図であ
る。
【図2】 本発明の類似文書検索処理のフローチャート
である。
【図3】 形態素解析部の詳細ブロック図である。
【図4】 形態素解析ステップ動作の詳細を示すフロー
チャートである。
【図5】 構文解析部の詳細ブロック図である。
【図6】 構文解析ステップ動作を詳細に示すフローチ
ャートである。
【図7】 文節構造の一例を示す図である。
【図8】 文書データベースの一次検索用索引の一例を
示す図である。
【図9】 一次検索のアルゴリズムを説明するフローチ
ャートである。
【図10】 領域限定概念知識の一例を示す図である。
【図11】 意味照合処理の詳細を示すフローチャート
である。
【図12】 類似度の計算の木構造を示す図である。
【図13】 類似度計算におけるペナルティ計算規則の
一例を示す図である。
【図14】 従来の検索方式を説明する図である。
【符号の説明】
101 入力手段(入力手順)、102 形態素解析手
段(形態素解析手順)、103 解析用単語辞書、10
4 構文解析手段(構文解析手順)、105文書データ
ベース、106 一次検索手段(一次検索手順)、10
8 概念知識データベース、109 意味照合手段(意
味照合手順)、801 構文解析結果、S201 入力
ステップ、S202 形態素解析ステップ、S203
構文解析ステップ、S204 一次検索ステップ、S2
05 意味照合ステップ、S402 未知語推定ステッ
プ、S506 係り受け関係修正ステップ、S603
未知語概念推定ステップ。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 伊藤 山彦 東京都千代田区丸の内二丁目2番3号 三 菱電機株式会社内 (72)発明者 鈴木 克志 東京都千代田区丸の内二丁目2番3号 三 菱電機株式会社内 Fターム(参考) 5B075 ND03 PP02 PP23 PR06 QM08 QP01

Claims (15)

    【特許請求の範囲】
  1. 【請求項1】 検索文を入力する入力ステップと、 入力された上記検索文を解析用単語辞書に基づいて単語
    単位に分割する形態素解析ステップと、 上記単語間の構文的係り受け関係を解析する構文解析ス
    テップと、 上記構文解析ステップの構文解析結果に基づき文書デー
    タベースを検索する一次検索ステップと、 領域依存の概念知識を格納した概念知識データベースを
    基に上記検索文と上記一次検索ステップの検索結果との
    意味的な照合を行い類似あるいは非類似の検索結果を出
    力する意味照合ステップとを備えたことを特徴とする類
    似文書検索方法。
  2. 【請求項2】 上記文書データベースは、文書の構文解
    析結果を有し、上記一次検索ステップは、該構文解析結
    果を索引として検索することを特徴とする請求項1記載
    の類似文書検索方法。
  3. 【請求項3】 上記一次検索ステップが索引として用い
    る上記構文解析結果は、木構造であることを特徴とする
    請求項2記載の類似文書検索方法。
  4. 【請求項4】 上記一次検索ステップは、照合対象範囲
    を絞り込む一次検索絞込みステップを有することを特徴
    とする請求項1乃至3のいずれか記載の類似文書検索方
    法。
  5. 【請求項5】 上記意味照合ステップは、構文的要素の
    重要度によって意味構造の照合を行うことを特徴とする
    請求項1乃至4のいずれか記載の類似文書検索方法。
  6. 【請求項6】 上記意味照合ステップは、上記構文的要
    素が必須格要素であるか任意格要素であるかによって意
    味構造の照合計算に重みづけをすることを特徴とする請
    求項5記載の類似文書検索方法。
  7. 【請求項7】 上記概念知識データベースは、意味的な
    包含関係を示すIS−A知識を有し、上記意味照合ステ
    ップは、該IS−A知識に基づいて意味構造の照合を行
    うことを特徴とする請求項1乃至6のいずれか記載の類
    似文書検索方法。
  8. 【請求項8】 上記概念知識データベースは、意味的な
    部分−全体の関係を示すHAS−A知識を有し、上記意
    味照合ステップは、該HAS−A知識に基づいて意味構
    造の照合を行うことを特徴とする請求項1乃至7のいず
    れか記載の類似文書検索方法。
  9. 【請求項9】 上記概念知識データベースは、格関係知
    識を有し、上記意味照合ステップは、該格関係知識に基
    づいて意味構造の照合を行うことを特徴とする請求項1
    乃至8のいずれか記載の類似文書検索方法。
  10. 【請求項10】 上記形態素解析ステップは、未知語範
    囲を推定する未知語推定ステップを有し、 上記構文解析ステップは、上記概念知識データベースを
    参照して未知語の概念を推定する未知語概念推定ステッ
    プを有することを特徴とする請求項1乃至9のいずれか
    記載の類似文書検索方法。
  11. 【請求項11】 上記構文解析ステップは、上記概念知
    識データベースを参照して異常な係り受け関係を修正す
    る係り受け関係修正ステップを有することを特徴とする
    請求項1乃至10のいずれか記載の類似文書検索方法。
  12. 【請求項12】 上記意味照合ステップは、照合の詳細
    度を設定する意味照合詳細度設定ステップを有すること
    を特徴とする請求項1乃至11のいずれか記載の類似文
    書検索方法。
  13. 【請求項13】 上記照合の詳細度として木構造の深さ
    を指定することを特徴とする請求項12記載の類似文書
    検索方法。
  14. 【請求項14】 検索文を入力する入力手段、 入力された上記検索文を解析用単語辞書に基づいて単語
    単位に分割する形態素解析手段、 上記単語間の構文的係り受け関係を解析する構文解析手
    段、 上記構文解析ステップの構文解析結果に基づき文書デー
    タベースを検索する一次検索手段と、 領域依存の概念知識を格納した概念知識データベースを
    基に上記検索文と上記一次検索手段の検索結果との意味
    的な照合を行い類似あるいは非類似の検索結果を出力す
    る意味照合手段とを備えることを特徴とする類似文書検
    索装置。
  15. 【請求項15】 以下の手順を備えた類似文書検索プロ
    グラムを記録したコンピュータ読み取り可能な記憶媒
    体。 (a)検索文を入力する入力手順; (b)入力された上記検索文を解析用単語辞書に基づい
    て単語単位に分割する形態素解析手順; (c)上記単語間の構文的係り受け関係を解析する構文
    解析手順; (d)上記構文解析ステップの構文解析結果に基づき文
    書データベースを検索する一次検索手順; (e)領域依存の概念知識を格納した概念知識データベ
    ースを基に上記検索文と上記一次検索手段の検索結果と
    の意味的な照合を行い類似あるいは非類似の検索結果を
    出力する意味照合手順。
JP11039924A 1999-02-18 1999-02-18 類似文書検索方法、類似文書検索装置、および類似文書検索プログラムを記録したコンピュータ読み取り可能な記憶媒体 Abandoned JP2000242650A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11039924A JP2000242650A (ja) 1999-02-18 1999-02-18 類似文書検索方法、類似文書検索装置、および類似文書検索プログラムを記録したコンピュータ読み取り可能な記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11039924A JP2000242650A (ja) 1999-02-18 1999-02-18 類似文書検索方法、類似文書検索装置、および類似文書検索プログラムを記録したコンピュータ読み取り可能な記憶媒体

Publications (1)

Publication Number Publication Date
JP2000242650A true JP2000242650A (ja) 2000-09-08

Family

ID=12566495

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11039924A Abandoned JP2000242650A (ja) 1999-02-18 1999-02-18 類似文書検索方法、類似文書検索装置、および類似文書検索プログラムを記録したコンピュータ読み取り可能な記憶媒体

Country Status (1)

Country Link
JP (1) JP2000242650A (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006252382A (ja) * 2005-03-14 2006-09-21 Fuji Xerox Co Ltd 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム
KR100657016B1 (ko) 2005-12-27 2006-12-14 중앙대학교 산학협력단 문서에서 연관성 있는 구문 검출을 위한 증거소스 결합과,증거소스 결합을 통한 질의 검색방법
US7272595B2 (en) 2002-09-03 2007-09-18 International Business Machines Corporation Information search support system, application server, information search method, and program product
JP2010117764A (ja) * 2008-11-11 2010-05-27 Nippon Telegr & Teleph Corp <Ntt> 単語間関連度判定装置、単語間関連度判定方法、プログラムおよび記録媒体
JP2011022630A (ja) * 2009-07-13 2011-02-03 Fuji Xerox Co Ltd 情報処理装置及び情報処理プログラム
JP2020187738A (ja) * 2019-05-09 2020-11-19 富士通株式会社 著者名の曖昧性解消のための情報処理装置、方法及び記憶媒体
JP2022050379A (ja) * 2021-02-09 2022-03-30 ペキン バイドゥ ネットコム サイエンス アンド テクノロジー カンパニー リミテッド 意味検索方法、装置、電子機器、記憶媒体およびコンピュータプログラム

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7272595B2 (en) 2002-09-03 2007-09-18 International Business Machines Corporation Information search support system, application server, information search method, and program product
JP2006252382A (ja) * 2005-03-14 2006-09-21 Fuji Xerox Co Ltd 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム
KR100657016B1 (ko) 2005-12-27 2006-12-14 중앙대학교 산학협력단 문서에서 연관성 있는 구문 검출을 위한 증거소스 결합과,증거소스 결합을 통한 질의 검색방법
JP2010117764A (ja) * 2008-11-11 2010-05-27 Nippon Telegr & Teleph Corp <Ntt> 単語間関連度判定装置、単語間関連度判定方法、プログラムおよび記録媒体
JP2011022630A (ja) * 2009-07-13 2011-02-03 Fuji Xerox Co Ltd 情報処理装置及び情報処理プログラム
JP2020187738A (ja) * 2019-05-09 2020-11-19 富士通株式会社 著者名の曖昧性解消のための情報処理装置、方法及び記憶媒体
JP2022050379A (ja) * 2021-02-09 2022-03-30 ペキン バイドゥ ネットコム サイエンス アンド テクノロジー カンパニー リミテッド 意味検索方法、装置、電子機器、記憶媒体およびコンピュータプログラム
JP7301922B2 (ja) 2021-02-09 2023-07-03 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド 意味検索方法、装置、電子機器、記憶媒体およびコンピュータプログラム

Similar Documents

Publication Publication Date Title
US20240028837A1 (en) Device and method for machine reading comprehension question and answer
KR101913191B1 (ko) 도메인 추출기반의 언어 이해 성능 향상장치및 성능 향상방법
RU2596599C2 (ru) Система и способ создания и использования пользовательских онтологических моделей для обработки пользовательского текста на естественном языке
US8874443B2 (en) System and method for generating natural language phrases from user utterances in dialog systems
US10585924B2 (en) Processing natural-language documents and queries
RU2584457C1 (ru) Система и способ создания и использования пользовательских семантических словарей для обработки пользовательского текста на естественном языке
JP5167546B2 (ja) 文単位検索方法、文単位検索装置、コンピュータプログラム、記録媒体及び文書記憶装置
US20070073745A1 (en) Similarity metric for semantic profiling
US20040054530A1 (en) Generating speech recognition grammars from a large corpus of data
KR20120009446A (ko) 자연 언어 텍스트의 자동화 의미적 라벨링 시스템 및 방법
US20120239378A1 (en) Methods and Systems for Alignment of Parallel Text Corpora
WO2012095696A2 (en) Text segmentation with multiple granularity levels
JPH06266780A (ja) 意味パターン認識による文字列検索方法及びその装置
WO2009029903A2 (en) Coreference resolution in an ambiguity-sensitive natural language processing system
JP2015060243A (ja) 検索装置、検索方法、およびプログラム
JP2011118689A (ja) 検索方法及びシステム
Bod et al. Data-Oriented Language Processing. An Overview
CN111859013A (zh) 数据处理方法、装置、终端和存储介质
JP2000242650A (ja) 類似文書検索方法、類似文書検索装置、および類似文書検索プログラムを記録したコンピュータ読み取り可能な記憶媒体
US20190012388A1 (en) Method and system for a semantic search engine using an underlying knowledge base
Chandra et al. Natural language interfaces to databases
CN112732885A (zh) 用于问答系统的答案扩展方法、装置及电子设备
JP3825645B2 (ja) 表現変換方法及び表現変換装置
KR19980038185A (ko) 자연언어 인터페이스 에이전트 및 그의 의미 분석방법
JP4033093B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040917

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061107

A762 Written abandonment of application

Free format text: JAPANESE INTERMEDIATE CODE: A762

Effective date: 20061226