JPH10334103A - 検索装置および検索制御プログラムを記録した媒体 - Google Patents

検索装置および検索制御プログラムを記録した媒体

Info

Publication number
JPH10334103A
JPH10334103A JP9163258A JP16325897A JPH10334103A JP H10334103 A JPH10334103 A JP H10334103A JP 9163258 A JP9163258 A JP 9163258A JP 16325897 A JP16325897 A JP 16325897A JP H10334103 A JPH10334103 A JP H10334103A
Authority
JP
Japan
Prior art keywords
word
basic
keyword
search
words
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9163258A
Other languages
English (en)
Inventor
Mitsuo Shimohata
光夫 下畑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP9163258A priority Critical patent/JPH10334103A/ja
Publication of JPH10334103A publication Critical patent/JPH10334103A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 与えられた検索語が必ずしも適切でない場合
でも、検索者が所望するデータの収集を行うことのでき
る検索装置を得る。 【解決手段】 基本キーワード情報部5には、データベ
ース6中の、意味のある自立した語である基本語をキー
ワードとして格納する。基本語辞書3は基本語の情報を
格納する。検索語分割処理部2は、検索語1が与えられ
た場合、この検索語が、基本語辞書3の基本語と、基本
キーワード情報部5のキーワードとを含む複数の基本語
の合成語であるかを判定し、そうであった場合は、構成
している基本語に分割する。検索処理部7は、検索語分
割処理部2で分割された基本語をキーワードに持つデー
タをデータベース6から検索する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、検索語が与えられ
た場合に、その検索語に適合したデータをデータベース
から検索する検索装置に関する。
【0002】
【従来の技術】一般的な検索装置では、キーワードが付
加されたデータが集まっているデータベースを保持して
いる。検索者は収集したいデータに付加されていると考
える語を検索語として入力する。検索装置は、検索語を
キーワードとして持っているデータを収集して出力す
る。しかし、検索者が適切な検索語を与えるとは限らな
いため、このような場合でも適切な検索をサポートする
機能が要望されている。
【0003】このような機能の実現手段の一つとして、
類義語辞書を保持し、検索者が入力した検索語の類義語
を検索処理に追加するといった方法がある。このような
方法では、例えば、特開平8−77203号公報に開示
されているように、検索者が連続して検索作業を行うこ
とを利用し、追加する類義語として前回の検索情報に基
づき無駄な検索語を追加しないようにしている。
【0004】
【発明が解決しようとする課題】ところで、検索作業に
おいて、検索語とキーワードが日本語である場合、日本
語特有の助詞の省略による合成語が大きな問題となる。
合成語とは、基本語が連続してできた語のことを指す。
また、基本語とは、意味のある自立した語のことをい
う。
【0005】日本語では、「特許を出願する」ことを、
助詞を省略して、「特許出願する」と言い換えたり、
「大幅な減税」を「大幅減税」などと言い換えることが
多い。このような言い換えが、検索語とキーワードのど
ちらでも出現しうるとすると、両者で使用している語が
異なるため、適合しているデータを収集できなくなる可
能性が高くなる。
【0006】例えば、ある検索者が、特許の出願につい
てのデータを収集しようとして、「特許」と「出願」の
二つの語をキーワードとして持つデータを収集したとす
る。しかしながら、キーワードに「特許出願」とだけ持
つデータは収集されないことになる。逆に、検索者が
「特許出願」と検索語を入力すると、今度は「特許」と
「出願」の両方をキーワードとして持つデータが収集さ
れなくなってしまう。
【0007】このような点から、与えられた検索語が必
ずしも適切でない場合でも、検索者が所望するデータの
収集を行うことのできる検索装置の実現が望まれてい
た。
【0008】
【課題を解決するための手段】本発明は、前述の課題を
解決するため次の構成を採用する。 〈請求項1の構成〉データベース中に出現する、意味の
ある自立した語である基本語をキーワードとして格納す
る基本キーワード情報部と、データベースへの検索語が
与えられた場合、この検索語が基本キーワード情報部に
格納された複数のキーワードの合成語であるか否かを判
定し、そうであった場合は、構成している基本語に分割
する検索語分割処理部と、検索語分割処理部で分割され
た基本語をキーワードに持つデータをデータベースから
収集し、検索結果として出力する検索処理部とを備えた
ことを特徴とする検索装置である。
【0009】〈請求項1の説明〉基本キーワード情報部
のキーワードとしては、「市場」といった語として最小
単位の単語だけではなく、「都市銀行」といった複数の
単語を連結して構成された語も含むものとする。検索語
分割処理部では、検索語が与えられると、この検索語
が、基本キーワード情報部に格納されているキーワード
から構成されているかをチェックする。その結果、与え
られた検索語が複数のキーワードからなるものであった
場合は、検索語をその複数のキーワードに分割する。検
索処理部は、分割されたキーワードを持つデータをデー
タベースから収集して出力する。
【0010】このような動作により、例えば「特許出
願」という検索語を与えるだけで、この「特許出願」を
キーワードに持つデータだけでなく、「特許」をキーワ
ードに持つデータと、「出願」をキーワードに持つデー
タとを収集することができる。
【0011】〈請求項2の構成〉請求項1において、デ
ータベースに付与された任意のキーワードが、データベ
ースに付与された複数のキーワードの合成語であった場
合は、任意のキーワードの代わりに、任意のキーワード
を構成しているキーワードを基本キーワード情報部に登
録する検索語分割処理部を備えたことを特徴とする検索
装置である。
【0012】〈請求項2の説明〉請求項2の発明は、デ
ータベースに付与されているキーワードが、他のキーワ
ードの合成語であった場合は、そのキーワードを構成し
ているキーワードを、基本キーワード情報部に登録する
ようにしたものである。これにより、例えば、検索語と
して「特許」や「出願」を与えた場合であっても、「特
許出願」というキーワードを持つデータをデータベース
から収集することができる。
【0013】〈請求項3の構成〉請求項1において、意
味のある自立した語である基本語の情報を格納する基本
語辞書と、データベースに付与された任意のキーワード
が、基本語辞書に格納された基本語と、データベースに
付与されたキーワードとを含む複数の基本語の合成語で
あった場合は、任意のキーワードの代わりに、この任意
のキーワードを構成している基本語を基本キーワード情
報部に登録すると共に、データベースへの検索語が与え
られた場合、この検索語が基本語辞書に格納された基本
語と、基本キーワード情報部に格納されたキーワードと
を含む複数の基本語の合成語であった場合は、構成して
いる基本語に分割する検索語分割処理部とを備えたこと
を特徴とする検索装置である。
【0014】〈請求項3の説明〉請求項3の発明は、基
本語辞書の情報を、基本キーワード情報部のキーワード
と同様に利用して検索語の分割や合成語の分割に利用す
るようにしたものである。これにより、基本語がキーワ
ードとしてデータベースに付与されていない場合も、こ
の基本語が基本語辞書に登録されていれば、与えられた
検索語や、合成語のキーワードを分割することができ
る。従って、より適切な検索を行うことができる。
【0015】〈請求項4の構成〉検索語が与えられた場
合、この検索語が、データベース中に出現する意味のあ
る自立した語である基本語を複数結合させた語であるか
を判定し、そうであった場合は、構成している基本語に
分割する処理と、分割された基本語をキーワードに持つ
データをデータベースから収集し、検索結果として出力
する処理とをコンピュータで行うことを特徴とする検索
制御プログラムを記録した媒体である。
【0016】〈請求項4の説明〉請求項4の発明は、請
求項1の検索装置をコンピュータ上に実現する制御プロ
グラムを記録した媒体に関するものである。
【0017】
【発明の実施の形態】以下、本発明の実施の形態を図面
を用いて詳細に説明する。 《具体例》 〈構成〉図1は本発明の検索装置の具体例を示す構成図
である。図の装置は、コンピュータが検索制御プログラ
ムを実行することで実現され、検索語1、検索語分割処
理部2、基本語辞書3、キーワード情報部4、基本キー
ワード情報部5、データベース6、検索処理部7、検索
結果8からなる。
【0018】検索語1は、検索装置に対して検索者が入
力する語である。また、検索語分割処理部2は、大きく
分けて二つの機能を有している。その一つは、キーワー
ド情報部4に記述されているキーワード内の合成語を基
本語に分割した情報を基本キーワード情報部5に出力す
る機能である。もう一つは、検索語1が合成語であるか
を判定し、合成語である場合は、基本語辞書3や基本キ
ーワード情報部5を用いて基本語に分割し、検索処理部
7に出力する機能である。ここで述べた合成語とは、複
数の語が連結してできた語のことであり、基本語とは合
成語を構成する部分語のことである。例えば、「携帯電
話」は、「携帯」と「電話」という二つの基本語が連結
してできた合成語である。
【0019】基本語辞書3は、既知の基本語を記述して
ある辞書である。図2は、基本語辞書の内容説明図であ
る。
【0020】キーワード情報部4は、データベース6中
の各データと、それぞれに付加されたキーワードの情報
が記述されている。図3は、キーワード情報部4の内容
説明図である。図中の、データ番号とは、データベース
6中のデータを識別する番号であり、各データ番号毎に
キーワードが記述されている。
【0021】基本キーワード情報部5は、キーワード情
報部4内のキーワードで合成語であるものを基本語に分
割した情報を格納している。図4は、基本キーワード情
報部5の内容説明図である。図示のキーワードは、図3
のキーワード情報部4に基づいて抽出されたキーワード
であるが、この詳細については動作の項で説明する。
【0022】データベース6は、検索対象となるデータ
の集合体である。検索処理部7は、検索語分割処理部2
から出力された基本語キーワードに対して、基本キーワ
ード情報部5の基本キーワード情報とデータベース6か
らデータを検索し、検索結果8を出力する機能部であ
る。
【0023】〈動作〉検索の初期処理として、検索語分
割処理部2は、キーワード情報部4内の合成語を分割
し、基本キーワード情報部5を作成する。この処理で
は、先ず、キーワード情報部4内の各キーワードに対
し、次のような合成語判定を行う。
【0024】図5は、合成語判定処理のフローチャート
である。check(w[1,n])は、n文字のキー
ワードの合成語判定を示しており、検索語分割処理部2
は、この合成語判定でtrueが返ってきたキーワード
は、その語そのものを削除し、基本語リストに残った複
数の基本語を代わりに置き換えて基本キーワード情報部
5に書き込む。尚、基本語リストとは、合成語分解処理
で用いる一時的な情報格納部であり、処理対象語を構成
する基本語を格納する機能を有している。
【0025】例えば、図2のデータ番号1のキーワード
「市場動向」に分割処理を行った場合を考える。このよ
うな合成語判定処理では、先ず、i=1とする(ステッ
プS1)。そして、対象とするキーワードを2文字以上
とするため、iの値を+1とし(ステップS2)、次の
ステップS3でi=nであるかを判定する。即ち、対象
とするキーワードが2文字のみであるかを判定する。こ
のステップS3において、キーワードが2文字のみであ
った場合は、falseとなり、合成語とは判定されな
い。
【0026】尚、キーワードとして、1文字の語は対象
としないのは次のような理由からである。即ち、漢字1
文字の場合はひらがなが後に続いて形容詞や動詞を形成
することがほとんどであり、このような語は検索のキー
ワードとして余り用いられないことによる。また、漢字
以外の文字種で1文字の文字列として出現することは少
ないからである。
【0027】一方、ステップS3において、i=nでな
かった場合、即ち、上記の「市場動向」のように、対象
文字列が3文字以上であった場合は、ステップS4に進
み、w[1,i]が、キーワード情報部4や基本キーワ
ード情報部5のキーワードとして、または基本語辞書3
の基本語に存在するかを判定する。この場合は、「市
場」が判定対象となり、データ番号2に“市場”がキー
ワードとして存在するため、ステップS5に進み、i=
nかを判定する。このステップS5において、i=nで
はないため、ステップS6に進む。また、ステップS4
において、w[1,i]がキーワードまたは基本語辞書
3に存在しない場合は、ステップS2に戻る。
【0028】ステップS6では、check(w[i+
1,n])を行う。この例では、3,4文字目の「動
向」がキーワード情報部4や基本キーワード情報部5ま
たは基本語辞書3に存在するかを判定する。この場合の
処理は、上記の処理と同様に、2文字の文字列が、キー
ワード情報部4、基本キーワード情報部5または基本語
辞書3に存在するかを判定する。その結果、データ番号
2に“動向”がキーワードとして存在することから、ス
テップS4からステップS5に進み、ステップS5にお
いて、i=nとなるため、結果がtrueとなり、合成
語と判定される。この時、基本語リストには(市場、動
向)という二つの基本語が格納される(ステップS7)
ので、この2語を「市場動向」の代わりとして基本キー
ワード情報部5に書き込む。
【0029】また、データ番号2のキーワード「規制緩
和」の場合は、w[1,2]の部分文字列「規制」が基
本語辞書3に、また、w[3,4]の部分文字列「緩
和」がデータ番号2のキーワードとして存在するため、
合成語と判定される。この時、基本語リストには、(規
制、緩和)の2語が挙げられている。
【0030】一方、「都市銀行」は、「銀行」の部分
は、基本キーワード情報部5にあるが、「都市」の部分
がキーワード情報部4と基本キーワード情報部5や基本
語辞書3のいずれにも無いため合成語とは判定されな
い。
【0031】このような処理をキーワード情報部4の全
てのキーワードに施すことで、基本語キーワードが得ら
れる。そして、図4の状態が、最終的に得られた基本キ
ーワード情報である。
【0032】次に、検索語1が与えられた場合に、検索
語分割処理部2が検索語を分割し、この分割した検索語
により、検索処理部7が検索を行う動作について説明す
る。
【0033】検索語1として、「市場動向」が入力され
たとする。検索語分割処理部2は、先ず、基本語辞書3
の基本語や基本キーワード情報部5中のキーワードを利
用して検索語を分割する。これは上述した図5の合成語
判定と同様に行うことができる。「市場動向」の場合、
「市場」と「動向」の二つの基本語に分割することがで
きる。検索語分割処理部2は、この2語を同時にキーワ
ードに持つデータを収集するようなコマンドを検索処理
部7に出力する。検索処理部7では、「市場」と「動
向」の二つの語を同時に持つデータとして、データ番号
1、2を収集し、検索結果8として出力する。
【0034】また、「規制緩和」を検索語1として与え
た場合は、「規制」と「緩和」に分割され、検索処理部
7に出力される。そして、検索処理部7では、データ番
号1、2が収集され、これが検索結果8として出力され
る。一方、「都市銀行」を検索語として与えた場合、
「都市銀行」は合成語とは判定されないので、その語そ
のもので検索が行われる。従って、この場合は、データ
番号1が収集され、検索結果8に出力される。
【0035】〈効果〉日本語では、助詞を省略して合成
語を作ることが多いが、このような合成語が検索語やキ
ーワードに混在すると、データを検索漏れしてしまうこ
とが多くなる。上記具体例では、検索語とキーワードを
基本語に分割して扱うようにしたため、どちらに合成語
が含まれていても適合したデータを収集することができ
る。
【0036】尚、上記具体例において、必ずしも基本語
辞書3は必須ではなく、基本キーワード情報部5のキー
ワードのみを利用するよう構成してもよい。また、キー
ワード情報部4はデータベース6と統合されていてもよ
い。
【0037】また、上記具体例の全ての動作は、検索装
置の役割を行うコンピュータのプログラムによる制御で
実現することができる。従って、そのプログラムをフロ
ッピーディスクやCD−ROM等の記録媒体に記録して
から、コンピュータにインストールしたり、あるいはネ
ットワークからダウンロードしてインストールするとい
った方法や、そのプログラムをハードディスク等に予め
インストールするといった方法によって、本発明の検索
装置を実現することができる。
【図面の簡単な説明】
【図1】本発明の検索装置の具体例の構成図である。
【図2】本発明の検索装置の具体例における基本語辞書
の内容説明図である。
【図3】本発明の検索装置の具体例におけるキーワード
情報部の内容説明図である。
【図4】本発明の検索装置の具体例における基本キーワ
ード情報部の内容説明図である。
【図5】本発明の検索装置の具体例における合成語判定
処理のフローチャートである。
【符号の説明】
1 検索語 2 検索語分割処理部 3 基本語辞書 4 キーワード情報部 5 基本キーワード情報部 6 データベース 7 検索処理部 8 検索結果

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 データベース中に出現する、意味のある
    自立した語である基本語をキーワードとして格納する基
    本キーワード情報部と、 前記データベースへの検索語が与えられた場合、この検
    索語が前記基本キーワード情報部に格納された複数のキ
    ーワードの合成語であるか否かを判定し、そうであった
    場合は、構成している基本語に分割する検索語分割処理
    部と、 前記検索語分割処理部で分割された基本語をキーワード
    に持つデータを前記データベースから収集し、検索結果
    として出力する検索処理部とを備えたことを特徴とする
    検索装置。
  2. 【請求項2】 請求項1において、 データベースに付与された任意のキーワードが、前記デ
    ータベースに付与された複数のキーワードの合成語であ
    った場合は、前記任意のキーワードの代わりに、この任
    意のキーワードを構成しているキーワードを基本キーワ
    ード情報部に登録する検索語分割処理部を備えたことを
    特徴とする検索装置。
  3. 【請求項3】 請求項1において、 意味のある自立した語である基本語の情報を格納する基
    本語辞書と、 データベースに付与された任意のキーワードが、前記基
    本語辞書に格納された基本語と、前記データベースに付
    与されたキーワードとを含む複数の基本語の合成語であ
    った場合は、前記任意のキーワードの代わりに、この任
    意のキーワードを構成している基本語を基本キーワード
    情報部に登録すると共に、前記データベースへの検索語
    が与えられた場合、この検索語が前記基本語辞書に格納
    された基本語と、基本キーワード情報部に格納されたキ
    ーワードとを含む複数の基本語の合成語であった場合
    は、構成している基本語に分割する検索語分割処理部と
    を備えたことを特徴とする検索装置。
  4. 【請求項4】 検索語が与えられた場合、この検索語
    が、データベース中に出現する意味のある自立した語で
    ある基本語を複数結合させた語であるかを判定し、そう
    であった場合は、構成している基本語に分割する処理
    と、 前記分割された基本語をキーワードに持つデータを前記
    データベースから収集し、検索結果として出力する処理
    とをコンピュータで行うことを特徴とする検索制御プロ
    グラムを記録した媒体。
JP9163258A 1997-06-04 1997-06-04 検索装置および検索制御プログラムを記録した媒体 Pending JPH10334103A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9163258A JPH10334103A (ja) 1997-06-04 1997-06-04 検索装置および検索制御プログラムを記録した媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9163258A JPH10334103A (ja) 1997-06-04 1997-06-04 検索装置および検索制御プログラムを記録した媒体

Publications (1)

Publication Number Publication Date
JPH10334103A true JPH10334103A (ja) 1998-12-18

Family

ID=15770388

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9163258A Pending JPH10334103A (ja) 1997-06-04 1997-06-04 検索装置および検索制御プログラムを記録した媒体

Country Status (1)

Country Link
JP (1) JPH10334103A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018518764A (ja) * 2015-08-07 2018-07-12 ▲騰▼▲訊▼科技(深▲セン▼)有限公司 オブジェクト検索方法、装置およびサーバ

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018518764A (ja) * 2015-08-07 2018-07-12 ▲騰▼▲訊▼科技(深▲セン▼)有限公司 オブジェクト検索方法、装置およびサーバ

Similar Documents

Publication Publication Date Title
JP5437557B2 (ja) 検索処理方法及び検索システム
US20110029545A1 (en) Syllabic search engines and related methods
JPH11120203A (ja) データベースを合併する方法およびデータベースからドキュメントを検索する装置
JPH1115841A (ja) 情報検索装置及び情報検索プログラムを記録した媒体
JPH10334103A (ja) 検索装置および検索制御プログラムを記録した媒体
JP2000090093A (ja) 全文検索方法及び全文検索システム並びに全文検索プログラムを記録した記録媒体
JP2000276338A (ja) 視覚プログラミング方法およびシステムならびに視覚プログラミングのための記録媒体
JP2004145706A (ja) マルチメディアデータ検索システム
JPH10307835A (ja) 情報処理装置及びその方法
JPH10334109A (ja) 検索利用者支援装置
JP2002117043A (ja) 文書検索装置、文書検索方法およびその方法を実施するためのプログラムを記録した記録媒体
JP2639804B2 (ja) データベース検索装置
JP2004326220A (ja) 文書検索装置、方法、プログラム、及び記録媒体
JP2000112990A (ja) テキスト検索装置、有効語頻度作成装置、テキスト検索方法、及び有効語頻度作成方法並びに記録媒体
JPH01307865A (ja) 文字列検索方式
JP3804609B2 (ja) 検索チューニング方法および情報検索システム
JPH09146968A (ja) 文書検索方法
JPH11143904A (ja) データベース検索方法,装置およびデータベース検索プログラムを記録した記録媒体
JPH03137772A (ja) データベース利用システム
JP2004302618A (ja) キーワード頻度算出方法及びそれを実行するプログラム
JPH09269952A (ja) 文書検索装置及びその方法
JP2001067375A (ja) 名称検索装置、キーボード及び名称検索プログラムを記録した記録媒体
JPH08137883A (ja) 辞書装置
JP2000057156A (ja) 情報検索システム及び情報検索プログラムを記録した記録媒体
JPH06290094A (ja) 索引ファイル処理装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040420

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060606

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20061226