JPH03229367A - テキストベース検索方式 - Google Patents

テキストベース検索方式

Info

Publication number
JPH03229367A
JPH03229367A JP2025559A JP2555990A JPH03229367A JP H03229367 A JPH03229367 A JP H03229367A JP 2025559 A JP2025559 A JP 2025559A JP 2555990 A JP2555990 A JP 2555990A JP H03229367 A JPH03229367 A JP H03229367A
Authority
JP
Japan
Prior art keywords
search
text
words
character string
sentence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2025559A
Other languages
English (en)
Inventor
Sueji Miyahara
末治 宮原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2025559A priority Critical patent/JPH03229367A/ja
Publication of JPH03229367A publication Critical patent/JPH03229367A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は、自然言語の文章データを文字コード列として
蓄積したデータベースC以下、「テキストベース」とい
う)に対して、該テキストベースを形成する文字や文字
列から検索用の索引を作成し、この索引を用いることに
より、自然言語による入力文や類似文書の提示等による
間合せに対して、品速て高精度な検索を可能としたテキ
ストベース検索方式に関する。
〔従来の技術1 従来、この種の技術としては、例入ば、杉山健司也の「
自然言語理解に基づく情報検索システムI RI SJ
情報処理学会自然言語処理研究会資料N L−58−8
(1986,11,22)に記載されている如く、デー
タとしての各テキストに対して、その内容に適したキー
ワード、すなわち、そのテキストの内容に合致する分野
名または言語を付与することにより、各テキストの内容
ないし特徴を表現し、検索時には利用者が求めるテキス
トの内容に関連したキーワードの論理的結合関係、つま
り、ANDまたはOR等を指定して、その検索条件を満
足するテキストを抽出する方法が用いられている。
上記文献に記載されている如く、従来は、自然言語によ
る質問文を受付けるインタフェースを有する場合にも、
質問文を解析することにより、ユーザの検索要求を対応
するキーワードに展開し、それらのキーワードの間の論
理的結合関係を決めて検索を行っている。すなわち、自
然言語によるインタフェースを有するか否かにかかわら
ず、テキストベースの検索は、いずれもキーワード検索
によっていた。
しかしながら、上述の如く、テキスト中に含まれている
キーワードな手掛りにして検索を行う方法では、検索の
精度が高くならないという問題があった。これは、通常
、再現率、つまり、ユーザの検索要求に関連するテキス
ト全体の中での検索された関連テキストの占める割合と
、適合率 つまり、検索されたテキスト全体の中での検
索された関連テキストの占める割合とで評価される。
実際には、テキストの内容にふされしいキーワードを付
与するということは、そのテキストの主題、要旨を表現
する言葉、あるいは、関連する主要な分野を表わす言葉
をそのテキストを代表する言葉として付与することであ
る。しかし、実際には、ユーザが検索要求時に思い浮か
べる言い方をすべてキーワードとして付与することは、
検索時に不要なテキストを多数出力することにもなり、
高い検索精度を確保しながら種々の表現に対応すること
は難かしいことである。また、補足的な記述中の情報を
検索したい場合でも、補足的な部分にキーワードを付与
することは一般的にはないので、キーワード検索により
検索することは不可能である。
なお、検索の精度を向上させるためには、例えば、絹用
博之他の「日本語文構造解析による自動インデクシング
方式」情報処理学会論文誌Vo1.2+、 Nn3(1
980,5)に記載されている如き方式も提案されてい
る。ここでは、各キーワードに意味的役割、すなわち、
テキスト中での主体9客体等を付与する方法が用いられ
ているか、検索時の手掛りとしてキーワードを用いるこ
とに関しては、前述の文献と同様である。
上記問題を解決するものとして、本発明者等が先に提案
したrテキストデータ検索方法」(特願平1−7601
2号明細書お↓び図面参照)では、テキストを検索する
ための検索要求(問合せ)を自然言語の文章によって入
力するようにしており、また、同「類似文書検索装置J
(特願平1−310562号明細書および図面参照)で
は、上記間合仕を、自然言語で記載した類似文書(適合
文書)によって入力するようにしている。
[発明が解決しようとする課題] これらの提案では、まず、品詞や文法情報を付与された
単語辞書を用いて、入力文である自然言語の文字列を形
態素解析して、単語に分解する。
この分割と同時に、入力文の文法的構造の解析を行い、
検索の標本となるべき星語間の構造を抽出する。次に、
類義語辞書を用いて、検索用の標本単語を同義ないし類
義な意味を有する単語に展開し、その展開結果を用いて
テキストベースを検索し、標本の検索構造と一致するも
のを含むテキスト、あるいは、構造が一致する単語を多
く含むテキストを、検索結果として出力するものである
しかし、上述のテキストベース検索方式において、大容
量のテキストベースを直接検索するには膨大な処理を要
することになる。本発明は、この場合に問題となる計算
機処理の時間を低減することを目的とするものである。
すなわち、本発明の目的は、テキストベースの検索にお
いて、言語解析技術と文字列索引技術とを用いることに
より、高い検索精度を保持するとともに、補足的に記述
されている事柄についても漏れなくテキストを検索する
ことが可能な、高精度でかつ高速な検索結果を得ること
が可能なテキストベース検索方式を提供することにある
[課題を解決するための手段] 本発明の上述の目的は、見出し単語と、該単語の品詞情
報1文法情報を記憶した単語辞書と、自然言語で書かれ
た文書を蓄積したテキストベースと、自然言語を用いて
文章等を入力する入力部と、入力された文章等を単語に
分割(形態素解析)し、分割した単語の品詞情報9文法
情報から、入力された文章等の文法的構造の解析(構文
解析)を行う文解析部と、該文解析部の解析結果に基づ
いて前記テキストベースを検索する処理部とを有するテ
キストベース検索システムにおいて、見出し単語と同義
あるいは類義な意味を有する単語を記憶した類義語辞書
と、文字列および該文字列を含む前記テキストベース中
のテキストを組にした情報を持つ文字列索引とを備え、
入力文中から検索時に対象となる単語を選別し、検索の
標本となるべき構造(検索構造〕を生成するステップと
、該構造生成ステップで作成した検索構造中の単語を類
義な意味の単語へ展開して検索構造を補強する類義語展
開ステップと、該類義語展開ステップで作成した検索構
造中の類義語に展開された単語群と前記文字列索引とか
ら、検索対象をテキストベース中の全テキストから選定
する検索対象選定ステップと、前記類義語展開ステップ
で作成した検索構造を標本として、前記検索対象選定ス
テップで選出したテキスト群を走査して、標本の検索構
造と一致するものを含むテキストを検索結果として出力
することを特徴とするテキストベース検索方式によって
達成される。
[作用] 本発明に係るテキストベース検索方式においては、テキ
ストベース検索のための検索要求、例えば、日本語の自
然言語による質問文を解析して、テキストベース中のす
べての文章の中から、検索要求の内容に合致するものを
抽出すること、および、検索処理を高速に行うことが特
徴である。
すなわち、検索要求としての入力文の内容に合致するテ
キストとして入力文の語およびその類義語とその結合関
係(格関係)が同様の語、および、その結合関係を有す
るものを抽出することにより処理の高速化を図り、実用
的な応答速度を実現するものである。
より詳細には、文字列とその文字列を含むテキストに関
する情報を持つ文字列索引を用いて、検索対象となるテ
キストを選定することで、高速な応答を実現するもので
ある。
[実施例] 以下、本発明の実施例を図面に基づいて詳細に説明する
第2図は、本発明の一実施例を示すテキストベース検索
システムの機能ブロック図である。
図において、lは検索のための質問文を自然言語の文章
により入力するための入力部、2は文章の文法的構造を
決定する文解析部であり、その実体はサブルーチンプロ
グラムである。3は単語辞書であって、メモリファイル
に格納されている。
4は単語相互間の関係から、検索に用いるための構造を
生成する構造生成部であり、これもサブルーチンプログ
ラムである。
5は検索構造中の単語について辞書を参照してその単語
と類似の意味を表わす単語を選択する類義語展開部、6
は類義な意味を表わす単語が格納される類義語辞書であ
り、メモリファイルに格納されている。7は検索対象選
定部であり、検索の対象を選択するサブルーチンプログ
ラム、8は後述する文字列索引、9はテキスト検索部で
あり、これもサブルーチンプログラムである。10はテ
キストベースてあり、検索対象となる文章の集まりか格
納されているメモリファイルである。
システムのハードウェアは、計算機等の情報処理装置と
、各辞aを格納する外部記憶装置および各辞書を格納す
る外部記憶装置と質問文を入力するためのキーボードや
スキャナ等の入力装置から構成されている。
上記入力部lは、テキストを検索するための検索要求(
質問)を自然言語の文章等により入ツノするものであり
、キー操作入力あるいは音声認識1文字パターン認識等
の文字符号化処理を介して、自然言語の文章や記事が、
装置に取込まれる。文解析部2は、入力部1を介して入
力された文章等を解析して、入力文の文法的構造を決定
する。これには、文章を構成する各単語の識別・分解を
行う形態素解析と、それの単語の結び付き方から、文の
構造を決定する構文解析とがある。文解析部2て行われ
る構文解析は、該文章中の各用言に対応した格構造を抽
出する。後述の単語辞書3には、文解析部2における形
態素解析および構文解析に用いる情報が記憶されている
第3図は、単語辞書3の内容の一部を示す図である。単
語辞書3には第3図に示す如く、その内容として、単語
の見出しとその単語の品詞および構文解析に必要な文法
情報が格納されている。第3図に示す例で、文法情報は
付属語についてその付属語か接続できる語の種類(格助
詞の場合は「体言J)を示しており、図の「:」より右
にはその付属語が接続する語の格情報(主格、対象格等
)を示している。但し、ここでは、表層的な格情報で示
しである。
構造構成部4は、前述の文解析部2の解析結果を受けて
、検索に用いる単語を取出し、それらの単語相互間の関
係から、検索に用いるための標準となるべき構造(以下
、「検索構造」という)を生成する。この際、同−内容
を表わす複数の自然言語表現が考えられる場合、その代
表たるべき表現の構造へ変換を行う。
次に、類義語展開部5は、上述の構造生成部4で生成さ
れた検索構造中の単語について、その単語の意味と類似
の意味を表わす11語を選抜し1、検索構造を補強する
。類義語辞書6には、類義の意味を表わす単語が格納さ
れており、類義語展開部5で参照される。
第4図は、類義語辞書6の内容の一部を示す図である。
類義語辞書6には、第4図に示す如く、その内容として
、単語の見出しとその単語と類義の意味を持つ単語(類
義語)の集まりが格納されている。
検索対象選定部7は、類義語展開部で補強された検索構
造を受けて、テキストベース中の全テキストの中から、
検索の対象となる記事テキストを選定する。文字列索引
8には、文字列とその文字列を含むテキストの組が記憶
されており、検索対象選定部7で参照される。
文字列索引8は、第5図に示す如く、テキストベース中
に出現した各文字列(ここでは、「2文字連接」の場合
を示している〕と、その文字列が記載されているテキス
トの識別番号の集まりから構成されている。この文字列
索引8は、事前に、テキストベース]0を処理し、新た
に出てきた文字列を索引に追加するとともに、索引の文
字列とテキスト番号との対応をとって、それをテーブル
の形で保持することによって作成されるものである。
テキスト検索部9は、上述の類義語展開部5までで生成
された検索構造を標本として、検索対象選定部7が選択
した各テキスト候補について、テキストベース10を走
査して、標本である検索構造に合致したものを検索結果
として出力する。この際、文解析部2と同様に、単語辞
書3を用い、形態素解析と構文解析を行う。
テキストベース10は、検索対象となるべき文章の集ま
りであり、計算機が直接取扱えるような状態、例えば、
磁気ディスクや磁気テープ等の中に格納されたものであ
る。
第1図は、本実施例に示すテキストベース検索システム
の動作フローチャートである。以下、本実施例のテキス
トベース検索システムの動作を、入力部1が入力文「テ
キストを検索するJを、後の処理に送った場合(ステッ
プ+0+)について説明する。
文解析部2は、入力文に対し、形態素解析および構文解
析を行い(ステップ102) 、入力文を「テキスト/
名詞」[を/格助詞J[検索するl′動詞Jに分解し、
更に、入力文の動作は「検索」てあり、「検索Jの対象
は「テキスト」であることを決定する。
構造生成部4は、これから検索対象となる単語と、それ
ら単語間の関係を示す検索構造を生成する(ステップ1
03)。すなわち、LJSP言語型の表現で示すならば
、 (検索(対象テキスト)) のようになる。このとき、同一内容を表わす複数の表現
、例えば、能働態と受動態による表現等がある場合には
、その代表たるべき構造へ変換を行う。つまFハ 「テ
キストを検索する」 「テキストが検索される」の両文
章からは、ともに(検索(対象テキスト〕) の構造が生成される。
類R語展開部5は、類義語辞書6を参照して、検索構造
に含まれる単語を類義語に展開する。類義語辞書6中に
、「検索Jの類義語として「探す」、rテキスト」の類
義語として「文書」、[文章Jがあった場合、上述の検
索構造は、 ((検索探す)(対象でテキスト文書文章戸〕のように
補強されろくステップ104)。
検索対象選定部7は、文字列索引8を用いて、テキスト
ベース中の全テキストの中から検索対象となり得るテキ
ストを選択する(ステップl05)。
例えば、「テキスト」という咽語かなければ検索結果と
ならないという場合には、「テキJという文字列を含む
テキストであり、かつ、「キス」と[ストJという文字
列を含む記事のみ(つまり、積集合〕が検索候補となる
また、例えば、「検索」の代替として、[探すJという
単語があれば検索結果となり得るという場合には、「検
索Jという単語の必須性の要請から1選定された検索候
補と「探す」という単語の必須性の要請から選定された
検索候補のいずれかにある候補(つまり、和集合)が、
検索候補となる。上述の如く、検索構造に従って、テキ
スト集合に対する集合演算を行う、:とで、検索候補の
選定が可能である。これは、文字列とそれを含むテキス
トを記憶している文字列索引8を用いることにより、高
速に処理する二とが可能となるものである。
テキスト検索部9は、検索選定部7で選択さねたテキス
ト群に一ついて、テキストベース10中を走査して、単
語が類義語展開部5から引き渡された検索構造と同様な
関係で出現したものを、一致した文書として出力する(
ステップl06)。
従って、前述の例の場合では、[文書を探すJと「文書
が検索される」とは一致したと判定するが、[テキスト
で検索するJは、非一致と判定する。何故ならば、「テ
キストで」は「テキスト」が検索の対象ではなく、手段
であって、入力した文章の意味が文法的に異なるためで
ある。
上記実施例によれば。
(イ)自然言語の文書から成るテキストベースを検索の
対象とすること、 (ロ)自然言語で、検索するテキストを指定すること。
(ハ)人力された検索を指定する自然言語文中の各単語
の関係をテキストの検索時に利用する−と、 (ニ)入力文中で使用された単語を、その単語と類義な
意味を表わす単語に展開したもので検索を行うこと、 (ホ)検索の対象を、テキストベースの全テキストから
高速に選択する機構を備えている二とにより、テキスト
ベースに対する事前の処理が不要であり、それによる情
報の欠落等を回避することができ、かつ、入力文で使用
した単語と検索結果が緩衝され、多様な入力文に対して
柔軟に対応でき、また、検索時間の短縮が可能なテキス
トペース検索方式を実現できる。
次に、上記実施例に示した検索対象選定部7において用
いる文字列索引8の也の構成方式について説明する。以
下に説明する実施例においては、文字索引や文字列索引
を、テキストベース中のテキストに存在する名詞や動詞
等の有意な単語、あるいは、未知語によって作成するも
のである。
このような索引を作成するには、単語辞書3を用いてテ
キストベース10のテキストを文解析部2によって解析
し、解析した結果から検索に利用することのない助詞や
接続詞等の単語、または、複合語における単語間のねた
りの語句を除いた残りの単語を用いて文字列索引を作成
すれば良い。
例えば、「文字列索引を作成するJというテキストに対
して、2文字連接の文字列索引を作成する場合、前述の
方法では、第6図中の文字列(a)に示す如き9個の索
引が抽出される。一方、本実施例の方法では、文解析に
よって、「文字列/名詞」「索引/名詞Jrを/格助詞
J「作成する/動詞Jを抽出し、この中から助詞や動詞
の語尾等の不要な語句を除くことにより、第6図中の文
字列(b)に示す如く、索引として、F文字」「字列」
「索引」「作成Jの4個の文字列が抽出される。
このような文字列索引8を用意することによって、索引
の容量が小さくて、かつ、検索対象を高速に選定するこ
とが可能な検索対象選定@7を実現することができる。
次に、文字列索引8の更に他の構成方式について説明す
る。以下に説明する実施例においては、文字索引や文字
列索引を、テキストベース中のテキストに存在する名詞
や動詞等の有意な単語、あるいは、未知語に限定し、更
に、低出視頻度の文字列(漢字等〕と高出現頻度の文字
列(平板名や片仮名等)等とで文字列索引の長さを変え
て、1個の索引に対する組となるテキスト数を平準化さ
せて作成するものである。
このような索引を作成するには、単語辞書3を用いてテ
キストベースIOのテキストを文解析部2によって解析
し、解析した結果から検索に利用することのない助詞や
接続詞等の単語、または、複合語における単語間のわた
りの語句を除いた残りの単語を用いて文字列索引を作成
し、更に、この文字列索引において組となるテキスト数
が多いものに対して文字列数を増した索引を用いて文字
列索引を作成すれば良い。この典型的な例として、高出
現頻度の文字列、例えば、平板名を単語単位で用意する
ことが考えられる。
例えば、「ひらがなの使用頻度を調べる」というテキス
トに対して、文字列索引を作成する場合、上述の方法で
は、FひらがなJT使用J「頻度JT調べるJ等の単語
が切出され、第7図(a)に示す如き6個の索引が抽出
される。しかし、テキストベースを調べた結果、「ひら
おり」や[ひらめかす」等、「ひら」という文字が多数
出現する場合、文字列索引は、第7図(b)の文字列索
引で示される如く、索引「ひら」の項目のテキスト識別
番号の数が多くなり、後続のテキスト検索部図9で、多
数のテキストを走査、検索することが必要になる。
そのため、ここでは、出現頻度の高い文字列については
、連接の長さを長くとることによって、一つの文字列索
引に対するテキスト識別番号の数が均一化するようにす
る。例えば、上の例の場合の「ひらがなの使用頻度を調
べるJというテキストに対しては、「ひらがなJという
文字列を索引にすれば、文字列索引は第7図(c)に示
す如く、4個の文字列索引になるとともに、テキスト識
別番号の数も減少する。
このような文字列索引8を用意することによって、索引
の容量が小さくて、かつ、検索対象を高速に選定するこ
とが可能な検索対象選定部7を実現することができる。
なお、上述の各実施例は、本発明の一例を示すものであ
り、本発明はこれらに限定されるべきものではないこと
は、言うまでもない。
[発明の効果] 以上、詳細に説明した如く、本発明によれば、テキスト
ベースの検索において、言語解析技術と文字列索引技術
とを用いることにより、高い検索精度を保持するととも
に、補足的に記述されている事柄についても漏れなくテ
キストを検索することが可能な、高精度でかつ高速な検
索結果を得ることが可能なテキストベース検索方式を実
現できるという顕著な効果を奏する。
【図面の簡単な説明】
第1図は本発明の一実施例を示すテキストベース検索シ
ステムの動作フローチャート、第2図は本実施例のテキ
ストベース検索システムの機能ブロック図、第3図は単
語辞書の内容の一部を例示する図、第4図は類義語辞書
の内容の一部を例示する図、第5図は文字列索引の内容
の一部を例示する図、第6図および第7図は文字列索引
の内容の他の例の一部を示す図である。 に入力部、21文解析部、3:単語辞書、4:構造生成
部、5:類義語展開部、6.類義語辞書、7:検索対象
選定部、81文字列索引、9:テキスト検索部、10:
テキストベース。 第 ■ 図 第 図 第 4 図 第 図 第 図

Claims (3)

    【特許請求の範囲】
  1. (1)見出し単語と、該単語の品詞情報、文法情報を記
    憶した単語辞書と、自然言語で書かれた文書を蓄積した
    テキストベースと、自然言語を用いて文章等を入力する
    入力部と、入力された文章等を単語に分割(形態素解析
    )し、分割した単語の品詞情報、文法情報から、入力さ
    れた文章等の文法的構造の解析(構文解析)を行う文解
    析部と、該文解析部の解析結果に基づいて前記テキスト
    ベースを検索する処理部とを有するテキストベース検索
    システムにおいて、見出し単語と同義あるいは類義な意
    味を有する単語を記憶した類義語辞書と、文字列および
    該文字列を含む前記テキストベース中のテキストを組に
    した情報を持つ文字列索引とを備え、入力文中から検索
    時に対象となる単語を選別し、検索の標本となるべき構
    造(検索構造)を生成するステップと、該構造生成ステ
    ップで作成した検索構造中の単語を類義な意味の単語へ
    展開して検索構造を補強する類義語展開ステップと、該
    類義語展開ステップで作成した検索構造中の類義語に展
    開された単語群と前記文字列索引とから、検索対象をテ
    キストベース中の全テキストから選定する検索対象選定
    ステップと、前記類義語展開ステップで作成した検索構
    造を標本として、前記検索対象選定ステップで選出した
    テキスト群を走査して、標本の検索構造と一致するもの
    を含むテキストを検索結果として出力することを特徴と
    するテキストベース検索方式。
  2. (2)前記文字列索引は、テキストベースを単語に分割
    し、分割した結果から検索で意味をなさない単語を除い
    て作成されるものであることを特徴とする請求項1記載
    のテキストベース検索方式。
  3. (3)前記文字列索引は、テキストベースを単語に分割
    し、分割した結果から検索で意味をなさない単語を除き
    、かつ、低出現頻度の文字列と高出現頻度の文字列とで
    文字列の長さを変えて作成されるものであることを特徴
    とする請求項1記載のテキストベース検索方式。
JP2025559A 1990-02-05 1990-02-05 テキストベース検索方式 Pending JPH03229367A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2025559A JPH03229367A (ja) 1990-02-05 1990-02-05 テキストベース検索方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2025559A JPH03229367A (ja) 1990-02-05 1990-02-05 テキストベース検索方式

Publications (1)

Publication Number Publication Date
JPH03229367A true JPH03229367A (ja) 1991-10-11

Family

ID=12169297

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2025559A Pending JPH03229367A (ja) 1990-02-05 1990-02-05 テキストベース検索方式

Country Status (1)

Country Link
JP (1) JPH03229367A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05135102A (ja) * 1991-11-11 1993-06-01 Ricoh Co Ltd 文書検索方式
JPH08180066A (ja) * 1994-12-26 1996-07-12 Toshiba Corp インデックス作成方法、文書検索方法及び文書検索装置
JPH09259132A (ja) * 1996-03-19 1997-10-03 Canon Inc 情報登録検索装置及びその方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05135102A (ja) * 1991-11-11 1993-06-01 Ricoh Co Ltd 文書検索方式
JPH08180066A (ja) * 1994-12-26 1996-07-12 Toshiba Corp インデックス作成方法、文書検索方法及び文書検索装置
JPH09259132A (ja) * 1996-03-19 1997-10-03 Canon Inc 情報登録検索装置及びその方法

Similar Documents

Publication Publication Date Title
US5794177A (en) Method and apparatus for morphological analysis and generation of natural language text
US5099426A (en) Method for use of morphological information to cross reference keywords used for information retrieval
US6442540B2 (en) Information retrieval apparatus and information retrieval method
JP2742115B2 (ja) 類似文書検索装置
US20050203900A1 (en) Associative retrieval system and associative retrieval method
JPH1145241A (ja) かな漢字変換システムおよびそのシステムの各手段としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2001043236A (ja) 類似語抽出方法、文書検索方法及びこれらに用いる装置
JPH0447364A (ja) 自然言語解析装置及び方法並びに自然言語解析用知識ベース構築方法
JP2010519655A (ja) 名前照合システムの名前インデックス付け
JP2011118689A (ja) 検索方法及びシステム
JPH0844771A (ja) 情報検索装置
JP4378106B2 (ja) 文書検索装置、文書検索方法及びプログラム
JPH03229367A (ja) テキストベース検索方式
JPH0827803B2 (ja) テキストベース検索方法
Al-Taani et al. Searching concepts and keywords in the Holy Quran
KR100374114B1 (ko) 에이치티엠엘 기반 한글 용어/약어 하이퍼링크 생성기
JP2005025555A (ja) シソーラス構築システム、シソーラス構築方法、この方法を実行するプログラム、およびこのプログラムを記憶した記憶媒体
JPH0320866A (ja) テキストベース検索方式
JPH0561902A (ja) 機械翻訳システム
JPH04130578A (ja) 未登録語検索方法および装置
JP4262529B2 (ja) 全文検索装置、方法、プログラム及び記録媒体
JPH03229366A (ja) テキストベースの多段検索方式
JPH04182871A (ja) 類似文書検索装置
JPH07325837A (ja) 抽象単語による通信文検索装置及び抽象単語による通信文検索方法
JPH11203312A (ja) キーワード検索装置、文書検索装置、キーワード検索プログラムを記録した記録媒体及び文書検索プログラムを記録した記録媒体