JPH10275159A - 情報検索方法及び装置 - Google Patents

情報検索方法及び装置

Info

Publication number
JPH10275159A
JPH10275159A JP9080830A JP8083097A JPH10275159A JP H10275159 A JPH10275159 A JP H10275159A JP 9080830 A JP9080830 A JP 9080830A JP 8083097 A JP8083097 A JP 8083097A JP H10275159 A JPH10275159 A JP H10275159A
Authority
JP
Japan
Prior art keywords
search
character string
unit
retrieval
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9080830A
Other languages
English (en)
Inventor
Hiroaki Karasawa
裕明 唐沢
Daiji Nanba
大二 難波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP9080830A priority Critical patent/JPH10275159A/ja
Publication of JPH10275159A publication Critical patent/JPH10275159A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 既存で既知のデータベース、さらには、不特
定多数のネットワーク上に散在する未知のデータベース
における検索キーに対して、ゆらぎがある検索条件入力
がなされた場合であっても、ゆらぎを吸収した検索を行
うことを可能とする情報検索方法及び装置を提供する。 【解決手段】 本発明は、既存で既知のデータベースま
たは、ネットワーク上に散在する未知のデータベース群
の同義の検索キーをグループ化しておき、データベース
群に対してゆらぎがある検索条件が入力された場合に、
該検索条件と同義の検索キーを取得して、検索する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、情報検索方法及び
装置に係り、特に、既存で既知のデータベース、さらに
は、不特定多数のネットワーク上に散在する未知のデー
タベースから、ある情報の検索を行う際に、情報検索の
対象となる検索キーに対して、別表現、人為的な省略、
倒置等のゆらぎを含む様々な表記をグループ化しておく
ことにより、検索対象上にある同義で表記の異なる検索
条件入力がなされた場合であっても、グループ化された
表記を検索キーとする全情報へ接近を可能とする情報検
索方法及び装置に関する。
【0002】
【従来の技術】従来、既存のデータベースにおける検索
キーに対して別表現、人為的な省略、倒置等のゆらぎが
ある検索条件入力において検索を可能とするために、同
義語等を用いた別名による登録を人為的に行う方法や、
前方一致検索等の検索手法を用いて、人為的な省略等の
末尾語等の曖昧性を考慮した検索を可能としている。
【0003】
【発明が解決しようとする課題】しかしながら、上記従
来の同義語等を用いた別名による登録を人為的にその都
度行っているが、人為的に個々に行うために、稼働を非
常に多く要するだけでなく、人為的な漏れや誤りが発生
したり、また、ネットワーク上に散在する未知のデータ
に対する別名登録を行うこと、例えば、 日石ビル →×日本石油ビル のように不可能である。
【0004】また、前方一致検索等の検索手法では、既
存のデータベースにおける検索キーより、 新宿駅 → × 中央線新宿駅 のようにゆらぎを含んだ検索条件入力文字列長が長い場
合の検索が不可能である。
【0005】本発明は、上記の点に鑑みなされたもの
で、既存で既知のデータベース、さらには、不特定多数
のネットワーク上に散在する未知のデータベースにおけ
る検索キーに対して、別表現、人為的な省略、倒置等の
ゆらぎがある検索条件入力がなされた場合であっても、
予め検索キーの登録、あるいは、追加を人為的に行うこ
となしに、ゆらぎを吸収した検索を行うことを可能とす
る情報検索方法及び装置を提供することを目的とする。
【0006】
【課題を解決するための手段】図1は、本発明の原理を
説明するための図である。本発明は、少なくとも1つの
データベースの検索キーに対して、ゆらぎのある検索条
件入力であっても、該検索キーに付随する情報を検索す
る情報検索方法において、既存で既知のデータベースま
たは、ネットワーク上に散在する未知のデータベース群
の同義の検索キーをグループ化しておき(ステップ1)
データベース群に対してゆらぎがある検索条件が入力さ
れた場合に(ステップ2)、該検索条件と同義の検索キ
ーを取得して(ステップ3)、検索する(ステップ
4)。
【0007】本発明は、少なくとも1つのデータベース
の検索キーに対して、ゆらぎのある検索条件入力であっ
ても、該検索キーに付随する情報を検索する情報検索方
法において、データベースの検索キーの文字列を単語単
位に分割し、分割された分割単語の各々の特徴を表す意
味を付与し、付与された意味に基づいて所定の規則に基
づいて文字列を仮生成し、仮生成された文字列について
相互に一致度を調べ、該一致度の高いものをグループ化
し、グループ化された少なくとも1つの文字列のいずれ
かを検索キーに変換し、入力された検索条件を、変換さ
れた検索キーに置換し、データベースを検索し、検索結
果を出力する。
【0008】また、本発明は、文字列を仮生成後に、分
割単語が漢字表記であるとき、フリガナ辞書を参照する
ことにより、該分割単語にフリガナを付与する。また、
本発明は、文字列を仮生成後、または、フリガナ付与後
に、分割単語に基づいて、予め異表記の同義語文字列が
登録された同義語テーブルを参照し、分割単語を同義語
文字列へ置換する。
【0009】また、本発明は、グループ化後、グループ
化された文字列を利用者に提示し、採否の確認を求め
る。図2は、本発明の原理構成図である。本発明は、検
索キーと該検索キーに付随する情報を蓄積する少なくと
も1つの情報蓄積手段14と、ゆらぎのある検索条件を
入力する入力手段11と、情報蓄積手段14から取得し
た検索キーの文字列を単語単位に分割し、分割された分
割単語の各々の特徴を表す意味を付与する自然語解析手
段15と、自然語解析手段15で付与された意味と、所
定の規則に基づいて文字列を仮生成する文字列処理手段
16と、文字列処理手段16により仮生成された文字列
について相互に一致度を調べ、該一致度の高いものをグ
ループ化するマージ手段18と、マージ手段18でグル
ープ化された少なくとも1つの文字列のいずれかを検索
キーに変換する変換手段12と、入力手段11から入力
された検索条件を、変換手段12で変換された検索キー
に置換し、情報蓄積手段14を検索し、検索結果を出力
する検索手段13とを有する。
【0010】また、本発明は、フリガナ辞書と、文字列
処理手段16により生成された分割単語の文字列が漢字
表記であるとき、フリガナ辞書を参照することにより、
該分割単語にフリガナを付与するフリガナ付与手段を更
に有する。また、本発明は、予め異表記の同義語文字列
が登録された同義語テーブルと、文字列処理手段16ま
たは、フリガナ付与手段により出力された表記に基づい
て、同義語テーブル20を参照し、該表記を同義語文字
列へ置換する同義語生成手段を更に有する。
【0011】また、本発明は、マージ手段18で、グル
ープ化された文字列を利用者に提示し、採否の確認を求
める利用者確認手段を含む。これにより、情報蓄積手段
から取得した検索キーを当該検索条件に類似する検索キ
ーに変換しておくことにより、ネットワーク上に散在す
る未知の情報蓄積手段(データベースまたは、データベ
ース群)における別表現や省略、倒置等の人為的なゆら
ぎがある検索条件が入力された場合であっても、当該検
索条件を検索キーに置換することで、当該検索キーで情
報蓄積手段を検索することが可能となる。
【0012】
【発明の実施の形態】図3は、本発明の情報検索装置の
構成を示す。同図に示す情報検索装置は、入出力部1
1、情報変換部12、検索制御部13、情報蓄積部1
4、自然語解析部15、文字列処理部16、フリガナ生
成部17、マージ処理部18、同義語生成部19、同義
語テーブル20、文字列表示確認部21から構成され
る。
【0013】入出力部11は、検索条件の入力や、検索
結果の出力及び、検索キーのグループ化の確認、修正等
を行う。情報変換部12は、予め、あるいは、検索条件
が入力される度に、単数あるいは複数の情報蓄積部14
から検索キーを取得し、自然語解析部15で処理を行っ
た検索キーの分割単語とその各々の付与された意味につ
いて文字列処理部16、フリガナ生成部17、同義語生
成部19で生成された文字列をマージ処理部18でグル
ープ化し、変換内容テーブルとして保持しておき、入出
力部11から入力された検索条件から、当該変換内容テ
ーブルに保持されているグループ化された情報に基づい
て、入力された検索条件を、情報蓄積部14を検索する
ための単数あるいは、複数の検索キーに置換して、検索
制御部13に渡す。
【0014】検索制御部13は、情報変換部12から得
られた検索キーを用いて、単数あるいは、複数の情報蓄
積部14に対し、実際の検索を実行し、情報を取得す
る。情報蓄積部14は、単数または、複数存在し、各々
の情報に対し、検索キーが付与され、その情報が格納、
蓄積されている。自然語解析部15は、情報蓄積部14
から取得した検索キーの単語分割を行い、当該分割単語
の各々に意味を付与する。
【0015】文字列処理部16は、自然語解析部15で
処理を行った検索キーの分割単語とその各々の付与され
た意味と、当該意味の存在する位置関係と個数等に基づ
いて、一定の規則から文字列生成を行う。フリガナ生成
部17は、検索キーの分割単語の漢字に対するフリガナ
候補として、文字列処理部16と同様に、文字列の生成
を行う。
【0016】マージ処理部18は、自然語解析部15で
処理を行った検索キーの分割単語とその各々の付与され
た意味について、文字列処理部16、フリガナ生成部1
7、同義語生成部19で処理された文字列から一致の判
定を行い、一致度の高い検索キー同士をグループ化す
る。詳細は、後述する。同義語生成部19は、同義語テ
ーブル20を参照し、自然語解析部15で処理を行った
検索キーの分割単語と同義の単語を置換し、同義単語候
補として、文字列処理部16と同様に、文字列の生成を
行う。
【0017】同義語テーブル20は、予め同義語が登録
されており、同義語生成部19から参照される。文字列
表示確認部21は、マージ処理部18によりグループ化
された情報変換部12に登録される、単数あるいは、複
数の文字列を表示し、利用者による採否の確認を行う。
【0018】図4は、本発明のマージ処理部の構成を示
す。同図に示すマージ処理部18は、全体制御部18
1、入出力バッファ182、照合判定部183から構成
される。全体制御部181は、入出力バッファ182の
管理及び、照合判定部183を駆動し、グループ化され
た検索キーを入出力バッファ182にて管理を行う。
【0019】入出力バッファ182は、他のモジュール
による検索キーの処理結果を保持し、また、グループ化
結果も保持する。照合判定部183は、全体制御部18
1により制御され、入出力バッファ182からの検索キ
ー処理結果データを相互に照合することにより、グルー
プ化を行い、当該結果を入出力バッファ182に反映さ
せる。
【0020】上記のように、情報蓄積部14から取得し
た検索キーを用いて、自然語解析部15、文字列処理部
16、フリガナ生成部17、同義語生成部19、マージ
処理部18で処理された検索キーを保持しておき、情報
変換部12において入出力部11を介して入力された検
索条件を、保持されている検索キーに置換して、検索制
御部13において、情報蓄積部14を検索する。
【0021】
【実施例】以下、図面と共に本発明の実施例を説明す
る。 [第1の実施例]図5は、本発明の第1の実施例の情報
蓄積部のレコードの例を示す。同図に示す情報蓄積部1
4は、建物名、住所コード、番地等からなる情報蓄積部
検索キーと、建物付随情報からなる情報内容から構成さ
れる。
【0022】図6は、本発明の第1の実施例の検索キー
生成の前提と仮生成例を示す。同図は、情報蓄積部14
の検索キー(建物名)、文字列処理部16、フリガナ生
成部17、同義語生成部19の各モジュールによる検索
キー処理結果の文字列の仮生成例である。本検索キー生
成の前提における情報蓄積部14のデータの住所コード
は全て同一のレコードする。
【0023】図7は、本発明の第1の実施例の情報変換
部での変換内容テーブルの例である。同図の例におい
て、「JR新宿駅ビル1階」の入力であっても「新宿駅
ビル」の入力であっても、「じぇーあーるしんじゅくえ
きビル」の入力であっても、情報変換部12で、情報蓄
積部14の検索キー『JR新宿駅ビル1階』、『新宿駅
ビル』、及び『じぇーあーるしんじゅくえきビル』の全
てへ置換され、情報蓄積部14の全ての関連情報に接近
できることを示している。
【0024】図8は、本発明の第1の実施例の分割単語
に付与される意味記号の一覧表の例である。同図は、自
然言語解析部15で情報蓄積部14の検索キーの単語分
割を行い、当該分割単語の各々に付与される意味の例で
ある。図9は、本発明の第1の実施例の文字列処理の例
(単純正規化処理)を示す。同図の例は、文字列処理部
16において、検索キー処理結果を単純な置換でゆらぎ
を吸収する単純正規化処理の例である。
【0025】図10は、本発明の第1の実施例の文字列
処理の例(変換ルール処理)を示す。同図の例は、自然
語解析部15で付与された検索キーの分割単語各々の意
味と、当該意味の存在する位置関係と個数を基に、文字
列処理部16において文字列生成を行う規則の例であ
る。図11は、本発明の第1の実施例の照合処理の例を
示す。同図は、マージ処理部18の内部の照合判断部1
83で行われる照合処理の例であり、照合判断は、同図
に示す一致度に対してある閾値を定めることにより決定
する。
【0026】図12は、本発明の第1の実施例の同義語
テーブルの例を示す。同図は、同義語テーブル20に登
録される同義語の内容であり、左右の単語を同義語とし
て扱い、同義語生成部19では、当該同義語テーブル2
0を参照し、相互に単語を置換することにより、同義語
を含む検索キーのマージ処理を可能とする。図13は、
本発明の第1の実施例の情報変換内容作成処理のフロー
チャートである。
【0027】ステップ101) 情報蓄積部14の検索
キー部より取得した『建物名』を自然語解析部15で処
理を行い、単語分割及び意味付与を行う。 ステップ102) 単語分割及び意味付与された自然語
解析部15から受け取った建物名データを、文字列処理
部16において、図10に示す変換ルール処理に基づい
て変換結果を生成する。
【0028】ステップ103) マージ処理部18によ
り後述するマージ処理ルーチンの処理を行い、同一建物
と推定される建物名検索キーで表記の異なるものをグル
ープ化する。 ステップ104) フリガナ生成部17において、文字
列処理部16における生成文字列の出力に対してフリガ
ナの候補を生成する。
【0029】ステップ105) ステップ103と同様
に、マージ処理部18によりマージ処理ルーチンの処理
を行い、同一建物と推定される建物名検索キーで表記の
異なるものをグループ化する。 ステップ106) 同義語生成部19により、同義語テ
ーブル20を参照して文字列処理部16における生成文
字列の出力、あるいは、フリガナ生成部17におけるフ
リガナ候補出力に対して、同テーブル上の同義語を相互
に単語を置換した文字列を生成する。
【0030】ステップ107) ステップ103及びス
テップ105と同様にマージ処理部18によりマージ処
理ルーチンの処理を行い、同一建物と推定される建物名
検索キーで表記の異なるものをグループ化する。 ステップ108) マージ処理部18において、入出力
バッファ182上にグループ化された検索キーを相互に
ヒット可能なように、情報変換部12の変換内容テーブ
ルに登録する。
【0031】次に、上記のステップ103、105、1
07で使用されているマージ処理ルーチンについて説明
する。 ステップ201) マージ処理部18の入出力バッファ
182に図12における情報変換内容作成処理のフロー
チャートにおいて、マージ処理ルーチンをコールする前
のステップの処理結果を取り込む。ステップ103で
は、ステップ102における変換結果を、ステップ10
5では、ステップ104におけるフリガナの候補を、ス
テップ107では、ステップ106の同義語変換候補を
それぞれ取得する。
【0032】ステップ202) 入出力バッファ182
の内容を文字列処理部16にて図9に示す単純正規化処
理を行う。 ステップ203) 照合判断部183において、同一住
所コードであることをチェックしながら、同一住所コー
ドを持つ入出力バッファ182の検索キーから生成され
た文字列同士の照合処理を図11に示す方法で行い、グ
ループ化を行う。グループ化された結果については、入
出力バッファ182に、互いに同一のグループコードを
付与することで、全体制御部181により管理される。
【0033】ステップ204) 全体制御部181によ
り、図13に示す情報変換内容作成処理のフローチャー
トにおいて、マージ処理ルーチンをコールする前のステ
ップの処理結果における全住所コードの処理が終了した
ことの判断を行う。全住所コードが終了していれば、マ
ージ処理ルーチンを終了し、図13のマージ処理ルーチ
ンをコールした後のステップへ処理を移行する。全住所
コードの処理が終了していなければ、図14のマージ処
理ルーチンフローの例のステップ202に処理を移行し
て、ループを全住所コードが終了するまでループを行
う。
【0034】図15は、本発明の第1の実施例の情報検
索フローチャートである。 ステップ301) 入力された検索条件を、情報変換部
12において、図13の情報変換内容作成処理フローチ
ャートにおいて、作成された情報変換内容と照合するこ
とにより、情報蓄積部14の検索キーに変換を行う。 ステップ302) 情報変換部12において、変換され
た情報蓄積部14の検索キーにより情報蓄積部14を検
索する。
【0035】ステップ303) 情報蓄積部14の検索
結果を受けて、入出力部11にて検索結果を表示する。 このような方法により、情報蓄積部14の検索キー部を
基に、自動的に作成された情報変換内容により、情報検
索時の入力検索条件に、別表現、省略、倒置等の人為的
なゆらぎがあっても吸収し、検索結果を入出力部11に
出力できる。
【0036】[第2の実施例]上記の第1の実施例で
は、文字列処理部16、フリガナ生成部17、同義語生
成部19で生成された文字列は、マージ処理部18にお
ける照合処理にしか用いられていないが、本実施例で
は、マージ処理によるグループ化に加えて、生成文字列
は、情報蓄積部14における各々の検索キーの別表現、
省略、倒置等の人為的なゆらぎを持つ文字列でもあるの
で、文字列も情報変換部12に登録しておくことによ
り、さらに、柔軟な別表現、省略、倒置等の人為的なゆ
らぎがあっても吸収できる情報検索を可能とする。
【0037】[第3の実施例]次に本実施例では、ネッ
トワーク上での道のデータベースを対象とした情報検索
を行う場合を説明する。図16は、本発明の第3の実施
例のネットワークを介した情報検索装置の概念図であ
る。同図において、ネットワーク上に散在するデータベ
ースを、情報蓄積部14と見立てることで、前述の第1
の実施例と同様に、ネットワーク上における未知の複数
のデータベースでの別表現、省略、倒置等の人為的なゆ
らぎがあっても吸収できる情報検索を可能とする。
【0038】なお、本発明は、上記の実施例に限定され
ることなく、特許請求の範囲内で種々変更・応用が可能
である。
【0039】
【発明の効果】上述のように、同義語等を用いた別名に
よる検索、例えば、 日石ビル → × 日本石油ビル や、既存のデータベースにおける検索キーより、ゆらぎ
を含んだ検索条件入力文字列長が長い場合の検索、例え
ば、 新宿駅 → × 中央線新宿駅 を、既存の情報蓄積部、あるいは、ネットワーク上に散
在する未知のデータベースの集合としての情報蓄積部の
検索キーに基づいて自動的に作成される情報変換内容を
参照した検索を行うことにより、新たに人為的な検索キ
ー登録を行うことなしに、検索できるという利点があ
る。
【図面の簡単な説明】
【図1】本発明の原理を説明するための図である。
【図2】本発明の原理構成図である。
【図3】本発明の情報検索装置の構成図である。
【図4】本発明のマージ処理部ブロック図である。
【図5】本発明の第1の実施例の情報蓄積部レコードの
例である。
【図6】本発明の第1の実施例の検索キー前提と仮定生
成例である。
【図7】本発明の第1の実施例の情報変換部での変換内
容テーブルの例である。
【図8】本発明の第1の実施例の分割単語に付与される
意味記号の一覧表である。
【図9】本発明の第1の実施例の文字列処理(単純正規
化処理)の例である。
【図10】本発明の第1の実施例の文字列処理(変換ル
ール処理)の例である。
【図11】本発明の第1の実施例の照合処理の例であ
る。
【図12】本発明第1の実施例の同義語テーブルの例で
ある。
【図13】本発明の第1の実施例の情報変換内容作成処
理のフローチャートである。
【図14】本発明の第1の実施例のマージ処理ルーチン
のフローチャートである。
【図15】本発明の第1の実施例の情報検索フローチャ
ートである。
【図16】本発明の第3の実施例の情報検索装置の例で
ある。
【符号の説明】
11 入出力部,入力手段 12 情報変換部,変換手段 13 検索制御部,検索手段 14 情報蓄積部,情報蓄積手段 15 自然語解析部,自然語解析手段 16 文字列処理部、文字列処理手段 17 フリガナ生成部 18 マージ処理部、マージ手段 19 同義語生成部 20 同義語テーブル 21 文字列表示確認部 181 全体制御部 182 入出力バッファ 183 照合判断部

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】 少なくとも1つのデータベースの検索キ
    ーに対して、ゆらぎのある検索条件入力であっても、該
    検索キーに付随する情報を検索する情報検索方法におい
    て、 既存で既知のデータベースまたは、ネットワーク上に散
    在する未知のデータベース群の同義の検索キーをグルー
    プ化しておき、 前記データベース群に対してゆらぎがある検索条件が入
    力された場合に、該検索条件と同義の検索キーを取得し
    て検索することを特徴とする情報検索方法。
  2. 【請求項2】 前記データベース群から取得した前記検
    索キーの文字列を単語単位に分割し、分割された分割単
    語の各々の特徴を表す意味を付与し、 付与された前記意味に基づいて所定の規則に基づいて文
    字列を仮生成し、 仮生成された前記文字列について相互に一致度を調べ、
    該一致度の高いものをグループ化し、 グループ化された少なくとも1つの文字列のいずれかを
    検索キーに変換して保持しておき、 前記ゆらぎのある検索条件が入力された場合に、変換さ
    れ保持されている前記検索キーに置換して前記データベ
    ースまたは、前記データベース群を検索し、検索結果を
    出力する請求項1記載の情報検索方法。
  3. 【請求項3】 前記文字列を仮生成後に、 前記分割単語が漢字表記であるとき、フリガナ辞書を参
    照することにより、該分割単語にフリガナを付与する請
    求項2記載の情報検索方法。
  4. 【請求項4】 前記文字列を仮生成後、または、フリガ
    ナ付与後に、 前記分割単語に基づいて、予め異表記の同義語文字列が
    登録された同義語テーブルを参照し、前記分割単語を同
    義語文字列へ置換する請求項2または、3記載の情報検
    索方法。
  5. 【請求項5】 前記グループ化後、グループ化された文
    字列を利用者に提示し、採否の確認を求める請求項2記
    載の情報検索方法。
  6. 【請求項6】 検索キーと該検索キーに付随する情報を
    蓄積する少なくとも1つの情報蓄積手段と、 ゆらぎのある検索条件を入力する入力手段と、 前記蓄積手段から取得した検索キーの文字列を単語単位
    に分割し、分割された分割単語の各々の特徴を表す意味
    を付与する自然語解析手段と、 前記自然語解析手段で付与された前記意味と、所定の規
    則に基づいて文字列を仮生成する文字列処理手段と、 前記文字列処理により仮生成された前記文字列について
    相互に一致度を調べ、該一致度の高いものをグループ化
    するマージ手段と、 前記マージ手段でグループ化された少なくとも1つの文
    字列のいずれかを検索キーに変換する変換手段と、 前記入力手段から入力された検索条件を、変換された前
    記検索キーに置換し、前記情報蓄積手段を検索し、検索
    結果を出力する検索手段とを有することを特徴とする情
    報検索装置。
  7. 【請求項7】 フリガナ辞書と、 前記文字列処理手段により生成された前記分割単語の文
    字列が漢字表記であるとき、前記フリガナ辞書を参照す
    ることにより、該分割単語にフリガナを付与するフリガ
    ナ付与手段を更に有する請求項6記載の情報検索装置。
  8. 【請求項8】 予め異表記の同義語文字列が登録された
    同義語テーブルと、 前記文字列処理手段または、前記フリガナ付与手段によ
    り出力された表記に基づいて、前記同義語テーブルを参
    照し、該表記を同義語文字列へ置換する同義語生成手段
    を更に有する請求項6または、7記載の情報検索装置。
  9. 【請求項9】 前記マージ手段で、グループ化された文
    字列を利用者に提示し、採否の確認を求める利用者確認
    手段を含む請求項6記載の情報検索装置。
JP9080830A 1997-03-31 1997-03-31 情報検索方法及び装置 Pending JPH10275159A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9080830A JPH10275159A (ja) 1997-03-31 1997-03-31 情報検索方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9080830A JPH10275159A (ja) 1997-03-31 1997-03-31 情報検索方法及び装置

Publications (1)

Publication Number Publication Date
JPH10275159A true JPH10275159A (ja) 1998-10-13

Family

ID=13729335

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9080830A Pending JPH10275159A (ja) 1997-03-31 1997-03-31 情報検索方法及び装置

Country Status (1)

Country Link
JP (1) JPH10275159A (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003042869A1 (fr) * 2001-11-14 2003-05-22 Jam Corporation Appareil de support de recherche d'informations, programme informatique et support contenant ledit programme
JP2006163941A (ja) * 2004-12-08 2006-06-22 Nec Corp 重複レコード検出システム、および重複レコード検出プログラム
JP2007172315A (ja) * 2005-12-22 2007-07-05 Nec Corp 同義語辞書生成システム、同義語辞書生成方法および同義語辞書生成プログラム
JP2011511341A (ja) * 2008-01-16 2011-04-07 アビニシオ テクノロジー エルエルシー 近似文字列マッチングのためのアーカイブ管理法
US8484215B2 (en) 2008-10-23 2013-07-09 Ab Initio Technology Llc Fuzzy data operations
US9037589B2 (en) 2011-11-15 2015-05-19 Ab Initio Technology Llc Data clustering based on variant token networks
JP2015179310A (ja) * 2014-03-18 2015-10-08 富士通株式会社 正式名称の候補出力方法、正式名称の候補出力プログラム、および正式名称の候補出力システム

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003042869A1 (fr) * 2001-11-14 2003-05-22 Jam Corporation Appareil de support de recherche d'informations, programme informatique et support contenant ledit programme
JPWO2003042869A1 (ja) * 2001-11-14 2005-03-10 株式会社ジャム 情報検索支援装置、コンピュータプログラム、プログラム格納媒体
JP2006163941A (ja) * 2004-12-08 2006-06-22 Nec Corp 重複レコード検出システム、および重複レコード検出プログラム
JP2007172315A (ja) * 2005-12-22 2007-07-05 Nec Corp 同義語辞書生成システム、同義語辞書生成方法および同義語辞書生成プログラム
US8775441B2 (en) 2008-01-16 2014-07-08 Ab Initio Technology Llc Managing an archive for approximate string matching
JP2011511341A (ja) * 2008-01-16 2011-04-07 アビニシオ テクノロジー エルエルシー 近似文字列マッチングのためのアーカイブ管理法
US9563721B2 (en) 2008-01-16 2017-02-07 Ab Initio Technology Llc Managing an archive for approximate string matching
US8484215B2 (en) 2008-10-23 2013-07-09 Ab Initio Technology Llc Fuzzy data operations
US9607103B2 (en) 2008-10-23 2017-03-28 Ab Initio Technology Llc Fuzzy data operations
US11615093B2 (en) 2008-10-23 2023-03-28 Ab Initio Technology Llc Fuzzy data operations
US9037589B2 (en) 2011-11-15 2015-05-19 Ab Initio Technology Llc Data clustering based on variant token networks
US9361355B2 (en) 2011-11-15 2016-06-07 Ab Initio Technology Llc Data clustering based on candidate queries
US10503755B2 (en) 2011-11-15 2019-12-10 Ab Initio Technology Llc Data clustering, segmentation, and parallelization
US10572511B2 (en) 2011-11-15 2020-02-25 Ab Initio Technology Llc Data clustering based on candidate queries
JP2015179310A (ja) * 2014-03-18 2015-10-08 富士通株式会社 正式名称の候補出力方法、正式名称の候補出力プログラム、および正式名称の候補出力システム

Similar Documents

Publication Publication Date Title
JP4639077B2 (ja) 語彙と文法を有する言語の上のストリングの内部構造の各レベルにインデックス付けを行うためのシステム及び方法
US5099426A (en) Method for use of morphological information to cross reference keywords used for information retrieval
US20020123995A1 (en) Pattern search method, pattern search apparatus and computer program therefor, and storage medium thereof
JP2002215619A (ja) 翻訳文書からの翻訳文抽出方法
JPH11184855A (ja) 翻訳方法およびシステム
US20080208566A1 (en) Automated word-form transformation and part of speech tag assignment
US5950184A (en) Indexing a database by finite-state transducer
CN112800769B (zh) 命名实体识别方法、装置、计算机设备和存储介质
CN111259262A (zh) 一种信息检索方法、装置、设备及介质
CN111782892B (zh) 基于前缀树的相似字符识别方法、设备、装置和存储介质
CN111814493B (zh) 机器翻译方法、装置、电子设备和存储介质
CN111597800A (zh) 同义句的获取方法及装置、设备及存储介质
CN113343692B (zh) 搜索意图的识别方法、模型训练方法、装置、介质及设备
JPH10275159A (ja) 情報検索方法及び装置
CN112597748A (zh) 语料生成方法、装置、设备及计算机可读存储介质
CN116955538A (zh) 医疗字典数据匹配方法及装置、电子设备及存储介质
CN111783425A (zh) 基于句法分析模型的意图识别方法及相关装置
CN115115432B (zh) 基于人工智能的产品信息推荐方法及装置
JP3363501B2 (ja) テキスト検索装置
CN114064820B (zh) 一种基于混合架构的表格语义查询粗排方法
CN114676258A (zh) 一种基于患者症状描述文本的疾病分类智能服务方法
CN113535883A (zh) 商业场所实体链接方法、系统、电子设备及存储介质
KR100327114B1 (ko) 문장골격을 기반으로 한 자동번역 시스템 및 그 방법
CN114490668B (zh) 文本翻译方法、装置、电子设备及存储介质
JP2807236B2 (ja) 形態素解析方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040127

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040326

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20050301