JPH11265385A - 情報検索装置及び方法及び情報検索プログラムを格納した記憶媒体 - Google Patents

情報検索装置及び方法及び情報検索プログラムを格納した記憶媒体

Info

Publication number
JPH11265385A
JPH11265385A JP10064943A JP6494398A JPH11265385A JP H11265385 A JPH11265385 A JP H11265385A JP 10064943 A JP10064943 A JP 10064943A JP 6494398 A JP6494398 A JP 6494398A JP H11265385 A JPH11265385 A JP H11265385A
Authority
JP
Japan
Prior art keywords
keyword
thesaurus
word
words
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10064943A
Other languages
English (en)
Inventor
Katsuto Bessho
克人 別所
Shigeto Iwase
成人 岩瀬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP10064943A priority Critical patent/JPH11265385A/ja
Publication of JPH11265385A publication Critical patent/JPH11265385A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 単語が後ろや前につくことによって派生する
複合語の商品のうち、代表的な意味をもつ商品のみをシ
ソーラスに登録しても、多様な複合語の入力キーワード
に対処可能とする。 【解決手段】 入力キーワードを単語辞書を用いて単語
単位に分解する形態素解析部42と、該キーワードで知
識ベースのシソーラスを検索する複合語解析部44を備
える。該複合語解析部44は、キーワードが複合語の場
合、該キーワード中の一部の単語群が知識ベース中のシ
ソーラス上にあれば、該キーワード中の該単語群を、該
シソーラス上の該当単語群の上位または下位の商品に置
換することによりキーワードを再構成し、その再構成し
たキーワードでシソーラスを再検索する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、情報検索装置及び
方法、更には情報検索プログラムを格納した記憶媒体に
係り、詳しくは、イエローページサービス等の職業情報
案内サービスなどにおいて、問合せがデータベースに登
録されている職業名と異なっていたり、問合せ中に職業
名が含まれていなくても検索を可能とする情報検索装置
及び方法、更には情報検索プログラムを格納した記憶媒
体に関するものである。
【0002】
【従来の技術】従来の自然語による情報検索では、入力
されうるキーワードで、キーワードを構成する単語数が
数語程度のものは全てシソーラスに登録を行っている。
検索する際は、入力キーワードをシソーラスに登録され
ているものに制限したり、または入力キーワードを構成
する単語群の一部でシソーラス検索を行っている。
【0003】
【発明が解決しようとする課題】従来のシソーラス構築
では、ある単語が後ろ(前)について新しい言葉を生成
するとき、前(後ろ)につく単語と類似の意味をもつ単
語の数だけ新しい言葉を登録する必要があり、シソーラ
ス構築が非効率になり、またシソーラスの膨大化を招く
問題があった。例えば、シソーラス上の商品「ペット」
の下位には「犬」「猫」「鳥」など様々な下位概念が存
在するが、後ろに『躾』をつけて新しい商品とすると
き、その数だけ後ろに単語「躾」をつけて、複合語の商
品として「ペットの躾」のみならず、「犬の躾」「猫の
躾」「鳥の躾」も新たに全部登録する必要があった。
【0004】本発明の目的は、単語が後ろ(前)につく
ことによって派生する複合語の商品等のうち、代表的な
意味をもつ商品等(上の例では「ペットの躾」)のみを
シソーラスに登録しても、多様な複合語の入力キーワー
ドに対応することが可能な情報検索装置及び方法、更に
は情報検索プログラムを格納した記憶媒体を提供するこ
とにある。
【0005】
【課題を解決するための手段】複合語のキーワードに対
し、キーワード中の一部の単語群がシソーラス上にあれ
ば、キーワード中のその単語群の部分を、単語群の上位
ないし下位の商品(言葉)に置換することによってキー
ワードを再構成して再検索する。
【0006】一般に、複合語を構成する一部の単語群
を、その単語群と包含関係にある上位または下位の単語
群に置換して得られる複合語も、元の複合語と包含関係
にあり、ユーザの意図を表す検索キーとなり得る。した
がって、複合語の一部の単語群を、その単語群と類似の
意味をもつ単語群に置換することによって派生する多様
な複合語のうち、シソーラスには代表的な意味をもつ複
合語を登録するだけで、派生する多様な複合語の入力キ
ーワードのいずれにも、ユーザの意図するシソーラス上
の商品を検索することができる。
【0007】
【発明の実施の形態】以下、本発明の一実施例について
図面により説明する。図1は本発明における情報検索装
置の一実施例の全体構成図を示す。図において、10は
キーワードを入力し、検索結果を出力する入出力装置、
20は名義、商品、職業等の語句を構成する単語と各単
語の属性を対の形で記憶しておく単語辞書記憶装置、3
0は商品や動詞、職業分類等のシソーラスを記憶する知
識ベース記憶装置、40は全体を制御する制御装置であ
る。図1は、いわゆるコンピュータシステムを利用して
構成され、入出力装置10はキーボードやマウス及びデ
ィスプレィやプリンタであり、単語辞書記憶装置及び知
識ベース記憶装置30はハードディスクや光ディスク等
の情報記憶装置であり、制御装置40は、プログラムや
所要データ等を格納するための内部メモリを有するCP
U本体である。ここで、制御装置40は、本発明に関連
する機能(手段)として、入力されたキーワードを単語
辞書記憶装置20を用いて単語単位に分解する形態素解
析部42と、キーワードを検索キーとして知識ベース記
憶装置中のシソーラスを検索する複合語解析部44を有
する。
【0008】図2は、知識ベース記憶装置30に記憶さ
れる知識の一覧を示したものである。後述するように、
本発明を適用した場合の商品シソーラス構築の具体例を
図5に示す。
【0009】図3は、本発明における情報検索方法の全
体的処理手順を示す。ステップS1で自然文のキーワー
ドを入力し、ステップS2で該キーワードの形態素解析
を行い、ステップS3において該キーワードでシソーラ
スを検索する。ここで、ステップS3では、入力キーワ
ード全体での検索に失敗し、該キーワードが複合語の場
合、該キーワード中の一部の単語群がシソーラス上にあ
れば、該キーワード中の該単語群を、該シソーラス上の
該当単語群の上位または下位の商品等に置換することに
よりキーワードを再構成し、その再構成したキーワード
でシソーラスを再検索する。図1の構成において、形態
素解析部42がステップS2の処理を行い、複合解析部
44がステップS3の処理を行う。
【0010】以下では、入出力装置10から入力された
キーワードは、すでに形態素解析部42において単語辞
書記憶装置20を用いて単語単位に分解されているとし
て、特に複合語解析部44の動作(図3のステップS3
の処理)について詳述する。
【0011】図4は、複合語解析部44が、複合語のキ
ーワードから一部上位商品への置換によって再検索を行
い、シソーラス中の商品を求める処理の一実施例であ
る。以下、これにしたがって説明する。
【0012】ステップ110;まず、入力キーワード全
体で、知識ベース記憶装置30中のシソーラスを検索す
る。ここで、検索に成功すれば、それを商品として、処
理を終了する。失敗した場合、ステップ120に進む。
【0013】ステップ120;入力時のキーワードを構
成する単語の数をN個としたとき、最終単語を除いたN
−1個の単語群からなる語句(An−1とする)で知識
ベース記憶装置30中のシソーラスを検索する。検索に
成功し、さらにその上位商品がある場合、ステップ13
0に進む。それ以外の場合、すなわち検索に失敗した
か、または検索に成功したけれどもその上位商品がない
場合、ステップ140に向かう矢印を辿る。
【0014】ステップ130;An−1の上位商品Bl
と、入力時のキーワードの最終単語とを順に結合して再
構成されるキーワード(B1+最終単語)で、知識ベー
ス記憶装置30中のシソーラスを検索する。ここで、検
索に成功すれば、それを商品として、処理を終了する。
失敗して、なおかつさらにB1の上位商品があれば(B
2とする)、B2と、入力時のキーワード(または直前
に再構成して得られたキーワードである(Bl+最終単
語))の最終単語とを順に結合して再構成されるキーワ
ード(B2+最終単語)で、知識ベース記憶装置30中
のシソーラスを検索する。そして、検索に成功すれば、
それを商品として、処理を終了する。一方、検索に成功
しない限り、上位商品+最終単語で構成されるキーワー
ドで再検索を続け、上位商品がなくなれば、キーワード
を一旦入力時のキーワードに戻して、ステップ140に
向かう矢印を辿る。
【0015】ステップ130より後〜140の直前ま
で;入力時のキーワードの最終の2単語、3単語、・・
・、N−2単語を除いた語句のそれぞれに関して、ステ
ップ120、130と同じ処理を行う。
【0016】ステップ140;入力時のキーワードの最
終のN−1単語を除いた語句すなわち先頭単語(Alと
する)で知識ベース記憶装置30中のシソーラスを検索
する。検索に成功し、さらにその上位商品がある場合、
ステップ150に進む。それ以外の場合、すなわち検索
に失敗したか、または検索に成功したけれどもその上位
商品がない場合、シソーラス検索は終了する。
【0017】ステップ150;A1の上位商品Clと、
入力時のキーワードの最終のN−1単語とを順に結合し
て再構成されるキーワード(Cl+最終のN−1単語)
で、知識ベース記憶装置30中のシソーラスを検索す
る。ここで、検索に成功すれば、それを商品として、処
理を終了する。失敗して、なおかつさらにClの上位商
品があれば(C2とする)、C2と、入力時のキーワー
ド(または直前に再構成して得られたキーワードである
(C1+最終のN−1単語))の最終のN−1単語とを
順に結合して再構成されるキーワード(C2+最終のN
−1単語)で、知識ベース記憶装置30中のシソーラス
を検索する。このように、検索に成功しない限り、上位
商品+最終のN−1単語で構成されるキーワードで再検
索を続け、上位商品がなくなれば、シソーラス検索は終
了する。
【0018】次に、図5により、具体例とて入力キーワ
ードが「犬の躾」であった場合の図4の処理による検索
過程を示す。
【0019】ステップ110;「犬の躾」で、シソーラ
スを検索するが、失敗する(1)。 ステップ120;最終単語を除いた部分「犬」で検索
し、成功する(2)。また、「犬」の上位の商品「ペッ
ト」が得られる(3)。商品「ペット」は商品「犬」を
意味的に包含する。 ステップ130;上位商品「ペット」と入力キーワード
の最終単語「躾」を順に結合して再構成されるキーワー
ド「ペットの躾」は、元の入力キーワード「犬の躾」を
意味的に包含し、ユーザの当初の意図を表すので検索キ
ーとなり得る(4)。再構成されたキーワード「ペット
の躾」で、シソーラスを再検索し(5)、成功して、
「ペットの躾」を商品として終了する。
【0020】図5の例でも分かるように、シソーラスに
は、「ペットの躾」と類似の「犬の躾」や「猫の躾」と
いった商品を全て登録しなくても、「ペットの躾」だけ
を登録しておくだけで、「犬の躾」や「猫の躾」といっ
た「ペットの躾」と類似の入力キーワードに対応でき
る。
【0021】以上、本発明の一実施例を説明したが、他
の実施例として、以下のような方法も考えられる。例え
ば、キーワードの前方部分でなく後方部分がシソーラス
上にあれば、キーワードの後方部分をその上位商品に置
換して再検索することでもよい。例えばキーワード「ペ
ットの餌」に対し、後方部分「餌」がシソーラス上にあ
れば、キーワードの後方部分「餌」を、商品「餌」の上
位商品「フード」に置換して得られるキーワード「ペッ
トフード」でシソーラスを再検索する。
【0022】また、キーワードの前方や後方でなく、中
間部分がシソーラス上にあれば、キーワードの中間部分
をその上位商品に置換して再検索することでもよい。例
えば、キーワード「北国の犬の病気」に対し、中間部分
「犬」がシソーラス上にあれば、キーワードの中間部分
「犬」を、商品「犬」の上位商品「ペット」に置換して
得られるキーワード「北国のペットの病気」でシソーラ
スを再検索する。
【0023】また、キーワードの一部の単語群がシソー
ラス上にあったとき、キーワードの該単語群を、該単語
群の上位商品でなく下位商品で置換して再検索すること
でもよい。例えば、キーワード「音楽学校」に対し、後
方部分「学校」がシソーラス上にあれば、キーワードの
後方部分「学校」を、商品「学校」の下位商品「教室」
に置換して得られるキーワード「音楽教室」でシソーラ
スを再検索する。
【0024】また、以上述べた方法を組み合わせて再検
索を行う方法も考えられる。例えば、キーワード「犬の
餌」に対し、前方部分「犬」がシソーラス上にあれば、
キーワードの前方部分「犬」を、商品「犬」の上位商品
「ペット」に置換して得られるキーワード「ペットの
餌」でシソーラスを再検索し、これで失敗したらさらに
キーワード「ペットの餌」の後方部分「餌」がシソーラ
ス上にあれば、キーワードの後方部分「餌」を、商品
「餌」の上位商品「フード」に置換して得られるキーワ
ード「ペットフード」でシソーラスを再検索する。
【0025】あるいは、例えばキーワード「車の免許」
に対し、前方部分「車」がシソーラス上にあれば、キー
ワードの前方部分「車」を、商品「車」の上位商品「乗
り物」に置換して得られるキーワード「乗り物の免許」
でシソーラスを再検索し、これで失敗したらさらにキー
ワード「乗り物の免許」の前方部分「乗り物」を、商品
「乗り物」の下位商品「自動車」に置換して得られるキ
ーワード「自動車の免許」でシソーラスを再検索する。
【0026】さらに、本発明による処理は、以上述べた
方法に限らず、様々な処理の方法が考えられることは云
うまでもない。
【0027】なお、図3や図4の処理手順は情報検索プ
ログラムとして、コンピュータが読み取り可能な記録媒
体、例えばフロッピーディスクやメモリカード、MO、
コンパクトディスク(CD−ROM)、テープなどに記
録して提供することが可能である。
【0028】
【発明の効果】以上説明したように、本発明では、複合
語のキーワードの一部の単語群がシソーラス上にあれ
ば、該キーワード中の該単語群を、該単語群の上位また
は下位の商品に置換して再検索するので、複合語の一部
の単語群の、その単語群と類似の意味をもつ単語群への
置換によって派生する複合語のうち、代表的な意味をも
つ複合語だけをシソーラスに登録しておくだけで、派生
する多様な複合語の入力キーワードから、ユーザの意図
する商品を検索することが可能である。
【図面の簡単な説明】
【図1】本発明における情報検索装置の一実施例の全体
構成図である。
【図2】知識ベース記憶装置中に記憶される知識の一覧
の一実施例である。
【図3】本発明における情報検索方法の一実施例の全体
的処理手順である。
【図4】本発明における一実施例の、キーワードの一部
の上位商品への置換による再検索の処理フローである。
【図5】図4におけるキーワードの検索過程の具体例を
説明する図である。
【符号の説明】
10 入出力装置 20 単語辞書記憶装置 30 知識ベース記憶装置 40 制御装置 42 形態素解析部 44 複合語解析部

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 自然文のキーワードを入力し、入力条件
    に合致する情報を出力する情報検索装置において、 キーワードを入力し、検索結果を出力する入出力装置
    と、語句を構成する単語と各単語の属性を対の形で記憶
    しておく単語辞書記憶装置と、シソーラスを記憶する知
    識ベース記憶装置と、全体を制御する制御装置を具備
    し、 前記制御装置は、入力キーワードを前記単語辞書記憶装
    置を用いて単語単位に分解する形態素解析部と、該キー
    ワードで前記知識ベース記憶装置中のシソーラスを検索
    する複合語解析部を具備し、 前記複合語解析部は、キーワードが複合語の場合、該キ
    ーワード中の一部の単語群が前記知識ベース記憶装置中
    のシソーラス上にあれば、該キーワード中の該単語群
    を、該シソーラス上の該当単語群の上位または下位の言
    葉に置換することによりキーワードを再構成し、その再
    構成したキーワードでシソーラスを再検索することを特
    徴とする情報検索装置。
  2. 【請求項2】 自然文のキーワードを入力し、入力条件
    に合致する情報を出力する情報検索方法において、 キーワードが入力されると、該キーワードの形態素解析
    を行い、該キーワードでシソーラスを検索し、キーワー
    ドが複合語の場合、該キーワード中の一部の単語群がシ
    ソーラス上にあれば、該キーワード中の該単語群を、該
    シソーラス上の該当単語群の上位または下位の言葉に置
    換することによりキーワードを再構成し、その再構成し
    たキーワードでシソーラスを再検索することを特徴とす
    る情報検索方法。
  3. 【請求項3】 自然文のキーワードを入力し、入力条件
    に合致する情報を出力するための情報検索プログラムを
    格納したコンピュータ読み取り可能な記憶媒体におい
    て、 キーワードが入力されると、該キーワードの形態素解析
    を行う形態素解析プロセスと、 該キーワードでシソーラスを検索し、キーワードが複合
    語の場合、該キーワード中の一部の単語群がシソーラス
    上にあれぱ、該キーワード中の該単語群を、該シソーラ
    ス上の該当単語群の上位または下位の言葉に置換するこ
    とによりキーワードを再構成し、その再構成したキーワ
    ードでシソーラスを再検素するシソーラス検索プロセス
    とを有することを特徴とする情報検索プログラムを格納
    した記憶媒体。
JP10064943A 1998-03-16 1998-03-16 情報検索装置及び方法及び情報検索プログラムを格納した記憶媒体 Pending JPH11265385A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10064943A JPH11265385A (ja) 1998-03-16 1998-03-16 情報検索装置及び方法及び情報検索プログラムを格納した記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10064943A JPH11265385A (ja) 1998-03-16 1998-03-16 情報検索装置及び方法及び情報検索プログラムを格納した記憶媒体

Publications (1)

Publication Number Publication Date
JPH11265385A true JPH11265385A (ja) 1999-09-28

Family

ID=13272638

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10064943A Pending JPH11265385A (ja) 1998-03-16 1998-03-16 情報検索装置及び方法及び情報検索プログラムを格納した記憶媒体

Country Status (1)

Country Link
JP (1) JPH11265385A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100522839B1 (ko) * 2001-04-06 2005-10-19 (주)케이테크 전자상거래에서 효과적으로 상품을 검색하기 위한시소러스의 점진적 구축 방법, 선택적 확장식의 브라우징그리고 지능형 질의 방식
US8224838B2 (en) 2005-09-09 2012-07-17 Fujitsu Limited Database search method, program, and apparatus

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08137892A (ja) * 1994-11-14 1996-05-31 Toshiba Corp 文書検索方法及び文書検索装置
JPH08137883A (ja) * 1994-11-08 1996-05-31 Oki Electric Ind Co Ltd 辞書装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08137883A (ja) * 1994-11-08 1996-05-31 Oki Electric Ind Co Ltd 辞書装置
JPH08137892A (ja) * 1994-11-14 1996-05-31 Toshiba Corp 文書検索方法及び文書検索装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100522839B1 (ko) * 2001-04-06 2005-10-19 (주)케이테크 전자상거래에서 효과적으로 상품을 검색하기 위한시소러스의 점진적 구축 방법, 선택적 확장식의 브라우징그리고 지능형 질의 방식
US8224838B2 (en) 2005-09-09 2012-07-17 Fujitsu Limited Database search method, program, and apparatus

Similar Documents

Publication Publication Date Title
JP4467184B2 (ja) 知識創造可能性を有するドキュメントの意味論的分析及び選択
JP5048934B2 (ja) 固有名称又は部分的な固有名称の認識を提供する方法及び装置
US8543565B2 (en) System and method using a discriminative learning approach for question answering
US8392436B2 (en) Semantic search via role labeling
KR101339103B1 (ko) 의미적 자질을 이용한 문서 분류 시스템 및 그 방법
US9720977B2 (en) Weighting search criteria based on similarities to an ingested corpus in a question and answer (QA) system
KR101136007B1 (ko) 문서 감성 분석 시스템 및 그 방법
US20110029545A1 (en) Syllabic search engines and related methods
JP2012520527A (ja) ユーザ質問及びテキスト文書の意味ラベリングに基づく質問応答システム及び方法
JP2006251866A (ja) 情報処理装置および方法、プログラム、並びに記録媒体
US7398196B1 (en) Method and apparatus for summarizing multiple documents using a subsumption model
JPH11110413A (ja) データベース検索結果を生成するための方法および装置
Mustafa et al. Kurdish stemmer pre-processing steps for improving information retrieval
Gupta et al. Designing and development of stemmer of Dogri using unsupervised learning
JP3565239B2 (ja) 情報検索装置
US7644074B2 (en) Search by document type and relevance
JP4361299B2 (ja) 評価表現抽出装置、プログラム、及び記憶媒体
Žitnik et al. SkipCor: Skip-mention coreference resolution using linear-chain conditional random fields
JP2894301B2 (ja) 文脈情報を用いた文書検索方法および装置
JPH11265385A (ja) 情報検索装置及び方法及び情報検索プログラムを格納した記憶媒体
JPH09319767A (ja) 類義語辞書登録方法
Manna et al. Question answering system in Bengali using semantic search
JPH1185766A (ja) キーワード抽出方法及び装置及びキーワード抽出プログラムを格納した記憶媒体
JP2004110435A (ja) プロファイル生成装置および情報提供装置
Testas Natural Language Processing with Pandas, Scikit-Learn, and PySpark

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040309

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040907