JP3574199B2 - データベース検索方式 - Google Patents

データベース検索方式 Download PDF

Info

Publication number
JP3574199B2
JP3574199B2 JP00033495A JP33495A JP3574199B2 JP 3574199 B2 JP3574199 B2 JP 3574199B2 JP 00033495 A JP00033495 A JP 00033495A JP 33495 A JP33495 A JP 33495A JP 3574199 B2 JP3574199 B2 JP 3574199B2
Authority
JP
Japan
Prior art keywords
kanji
search
character string
kana
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP00033495A
Other languages
English (en)
Other versions
JPH08190565A (ja
Inventor
正仁 谷村
Original Assignee
株式会社ハル研究所
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社ハル研究所 filed Critical 株式会社ハル研究所
Priority to JP00033495A priority Critical patent/JP3574199B2/ja
Publication of JPH08190565A publication Critical patent/JPH08190565A/ja
Application granted granted Critical
Publication of JP3574199B2 publication Critical patent/JP3574199B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【0001】
【産業上の利用分野】
本発明は、データベース検索方式に係り、特に漢字を含む文字列からの検索に対応していないCD−ROMなどを用いたデータベース検索方式において、漢字を含む文字列からの検索を簡便に行うためのデータベース検索方式に関する。
【0002】
【従来の技術】
近年、CDをROMとして使用する国語辞典や百科辞典が普及し始めているが、これをコンピュータで利用する場合には画面上に表示されている言葉や用語を文字列として指定し、この文字列の意味を取得することが要求される。しかし、前記文字列に漢字が含まれている場合に、CD−ROMが仮名文字の検索キーしか具備していないものにおいては、漢字を含む文字列からの検索が不可能となる。例えば、市販されているCDを利用した国語辞典の中には、仮名文字列から漢字を含む情報を検索する検索方式のみ対応し、CD−ROMの中に漢字を含む文字からの検索のためのインデックスが設けられていないものが存在するが、このようなCD−ROMを使用した場合には、その都度仮名文字をキーボードから入力しなければならないといった煩わしさがあった。
【0003】
また、このようなCD−ROMの使用に対しては、漢字を含む文字列から仮名文字に変換する変換表を別途設け、これにより求められる文字の読みを取得して検索を行う方式が考えられるが、この方式においても同音異義語のように同一キーが検索キーとなってしまう場合には、同音異義語から目的とする単語を選択する作業を行う必要が生じてしまうことになる。例えば“新興”という言葉を例に説明すると、“新興”からは“しんこう”が求められ、これによりCD−ROMのデータベースの検索を行うと、“進行”,“振興”,“親交”,“信仰”,“新興”・・・、など多くの同音異義語があるために、これらの中から“新興”を選ぶ作業を行う必要が生じる。
【0004】
同様なことが、仮名文字もしくはローマ字から漢字を含む文字列に変換する日本語入力処理手段を使用した場合にも発生する。仮名を入力して漢字に変換した後、この漢字が適切であるか否か辞書で確認する時に仮名文字に同音異義語があると、やはり同音異義語の中から目的とする単語を選択する操作が必要となってしまうことになる。
【0005】
【発明が解決しようとする課題】
本発明は、このような漢字を含む文字列からの検索に対応していないCD−ROMなどをデータベースとした辞書や辞典での検索の煩雑さを改善することを目的とし、漢字を含む文字列と漢字を含む情報の一致度合いを調べる比較手段を設けることにより、漢字を含む文字列からの検索を同音異義語があった場合にも、目的とする単語を自動的に選別することで簡便な操作で足りるようにした。
【0006】
【課題を解決するための手段】
本発明は上記課題を解決するために、第1に仮名文字列を検索キーとして、検索キーに対応する漢字を含む複数個の情報の取得を行うデータベース検索方式において、漢字を含む文字列から仮名文字列への変換テーブルと、変換された仮名文字列から漢字を含む複数個の情報を取得したのち該情報と前記漢字を含む文字列との一致度合いを調べる比較手段を備え、任意の漢字を含む文字列を指定することによりこれを仮名に変換してデータベースの検索を行い、前記比較手段により完全に一致もしくは一致度合いが高い漢字を含む情報を、検索により取得した漢字を含む複数個の情報の中から選択し、これを検索出力とするデータベース検索方式を手段とし、
【0007】
第2に仮名文字もしくはローマ字から漢字を含む文字列に変換する日本語入力処理手段と組み合わされ、仮名文字列を検索キーとして検索キーに対応する漢字を含む複数個の情報の取得を行うデータベース検索方式において、仮名文字列から漢字を含む複数個の情報を取得したのち該情報と前記漢字を含む文字列との一致度合いを調べる比較手段を備え、日本語入力処理手段が漢字に変換を行う元の仮名文字もしくはローマ字から、ローマ字の場合は仮名文字に変換してデータベースの検索を行い、前記比較手段により完全に一致もしくは一致度合いが高い漢字を含む情報を、検索により取得した漢字を含む複数個の情報の中から選択し、これを検索出力とするデータベース検索方式を手段とする。
【0008】
【実施例】
以下添付図面に基づいて本発明に係るデータベース検索方式の実施例を詳細に説明する。図1は、本発明の第1実施例に係るデータベース検索方式を実施する装置の機能構成図である。この図において、ROM1にはCPU2(中央処理装置)が動作するための各種処理プログラム、即ちワープロ処理プログラム3、検索文字指定プログラム4、漢字仮名変換プログラム5、CD−ROM検索プログラム6、比較プログラム7とデータとして漢字仮名変換テーブル8が蓄積されている。RAM9は情報の一時記憶用のワークエリアとして使用される。また、CD−ROMドライブ10にはディスクコントローラ11により制御される国語辞典CD−ROM12がセットされている。上記CPU2がI/Oコントローラ13を介してキーボード14から入力を受け付けると、アプリケーションプログラムであるワープロ処理プログラム3により処理が施され、CPU2は結果をディスプレイRAM15に書き込む。ディスプレイコントローラ16はディスプレイRAM15に書き込まれている文字コードにしたがってディスプレイ17上に文字を表示するように構成されている。このためにキーボード14から入力された情報は直ちに画面に表示される。
【0009】
図2は、画面上に検索文字列が表示されている状態を示す。例えば文章の中にある“新興勢力”の意味を取得するためにこれを検索する場合などである。図3は、この場合のCD−ROMの検索処理の流れを説明したものである。
【0010】
図3において、カーソルを“新”の文字に合わせてCD−ROMでの検索が指定されると検索文字指定プログラム4が“新”のカーソル位置から“新興勢力が”のごとく複数個の文字をディスプレイRAM15からワーク領域に検索文字データとして取り出す。次いで、漢字仮名変換プログラム5が漢字仮名変換テーブル8を検索し、先頭文字から最大の一致度を有する漢字まじり文字列に対応する仮名文字列“しんこう”を抽出する。即ち、この例では“新し”が一文字分の一致であるのに対して“新興”は二文字分が一致することから、この漢字に対応した仮名文字“しんこう”が選択されることになる。
【0011】
仮名文字列“しんこう”が抽出されると、次にCPU2はCD−ROM検索プログラム6を起動して、ディスクコントローラ16に対し“しんこう”に該当する項目の検索を行う。図3に示したようにCD−ROMには複数個の同音異義語の情報が記録されており、これらを全て読み出して出力候補とする。即ち、“しんこう”の同音異義語は“進行”、“振興”、“親交”、“信仰”“新興”の5種類あることから、これら全てが出力候補となる。次にCPU2は比較プログラム7を起動して、検索文字列データ“新興勢力が”と前出の出力候補とを先頭文字から比較し、完全に一致もしくは一致度合いが高いものを検索出力とする。従って、この例では“新興”の文字列部分が一致するので、残りの他の候補を読み飛ばし、この“新興”を同音異義語の中から自動的に選択する。そして、CD−ROMの中に蓄積されている“新興”の意味内容である“新たに興ること”が検索出力として画面上に表示されることになり、一度の操作で素早く“新興”の意味を把握することができる。この時、画面上に“新興−新たに興ること”と表わすことで、より明確に意味を確認することもできる。
【0012】
なお、上記実施例では、CD−ROMから同音異義語を全部読み出した後に検索文字データとの比較を行っているが、CD−ROMから出力候補を一つ一つ読み出すのと同時に比較を行っても良い。また、CD−ROMのデータは仮名文字の検索キーと“新興”のような項目名と、その内容が一緒に蓄積されている場合だけでなく別々に蓄積されていても良く、この場合には項目名に対し比較を行い、完全に一致もしくは一致度が高い項目名に対応する内容を検索してこれを検索出力とする。
【0013】
次に本発明の第2実施例について説明する。図4はこの実施例に係るデータベース検索方式を実施する装置の機能構成図である。ROM1内には先の実施例とは異なった種類のCPU2の動作処理プログラム、即ちキー入力処理プログラム20、仮名漢字変換プログラム21、CD−ROM検索プログラム6、比較プログラム7と、データとしての仮名漢字変換辞書22が蓄積されている。なお、ROM1以外の装置の機能は先の実施例と同じであり、RAM9は情報の一時記憶用のワークエリアとして使用され、またCPU2はI/Oコントローラ13を介してキーボード14から入力を受け付け、また処理結果をディスプレイRAM15に書き込む。ディスプレイコントローラ16はディスプレイRAM15に書き込まれている文字コードにしたがってディスプレイ17上に文字を表示するように構成されている。また、CD−ROMドライブ10にはディスクコントローラ11により制御される国語辞典CD−ROM12がセットされている。
【0014】
図5は、上記実施例でのCD−ROMにおける検索処理の流れを説明したものである。この実施例では例えばコンピュータの画面上で日本語の文章を作成する場合に、用いる言葉の意味に見合った漢字文字を検索する際に利用することができる。例えば、キーボード14から入力した“しんこうせいりょくが”の漢字文字を検索する場合、先ず入力された“しんこうせいりょくが”の仮名文字データから、操作者が仮名漢字変換プログラム21により仮名漢字変換辞書22を参照して“新興勢力が”の漢字文字列を生成する。次にCD−ROM検索を指定すると、前述の仮名漢字変換辞書22を参照して漢字変換を行ったもとになった仮名文字列“しんこう”を仮名漢字変換プログラム21から受け取る。次いでCPU2はCD−ROM検索プログラム6を起動して、ディスクコントローラ11に対して検索を指示し、“しんこう”に該当する項目の検索を行う。そして、先の実施例と同様に、CD−ROMには複数個の同音異義語を有する情報が記載されているから、これらを全て読み出して出力候補とする。次にCPU2は比較プログラム7を起動して検索文字列データ“新興勢力が”と前出の出力候補とを先頭文字から比較し、完全に一致もしくは一致度合いの高いものを検索出力とし、他の同音異義語は読み飛ばして画面上には“新興”の内容である“新たに興ること”を表示することになる。操作者は、画面上に表示された用語の意味が目的のものか否かを確認し、それで良ければ“新興”の漢字文字を選択する。
【0015】
【発明の効果】
以上説明したように、本発明に係るデータベース検索方式によれば、画面に表示された文字列の内容を検索する場合、又は画面にキーボードから入力した仮名文字列の内容を検索する場合などに、漢字混じりの単語を指定するだけで、その単語もしくはその単語に最も近い内容の検索出力を同音異義語の中から自動的に選び出すことができるので、辞書や辞典などからの検索が簡便になるといった効果を奏する。
【図面の簡単な説明】
【図1】本発明の第1実施例に係るデータベース検索方式を実施するための装置の機能構成図である。
【図2】コンピュータの画面上に表示された検索文字列の一例を示す説明図である。
【図3】上記実施例におけるCD−ROMの検索処理の流れを示す説明図である。
【図4】本発明の第2実施例に係るデータベース検索方式を実施するための装置の機能構成図である。
【図5】第2実施例におけるCD−ROMの検索処理の流れを示す説明図である。
【符号の説明】
1 ROM
5 漢字仮名変換プログラム
7 比較プログラム
8 漢字仮名変換テーブル
21 仮名漢字変換プログラム
22 仮名漢字変換辞書

Claims (2)

  1. 仮名文字列を検索キーとして、検索キーに対応する漢字を含む複数個の情報の取得を行うデータベース検索方式において、
    漢字を含む文字列から仮名文字列への変換テーブルと、変換された仮名文字列から漢字を含む複数個の情報を取得したのち該情報と前記漢字を含む文字列との一致度合いを調べる比較手段を備え、任意の漢字を含む文字列を指定することによりこれを仮名に変換してデータベースの検索を行い、前記比較手段により完全に一致もしくは一致度合いが高い漢字を含む情報を、検索により取得した漢字を含む複数個の情報の中から選択し、これを検索出力とするデータベース検索方式。
  2. 仮名文字もしくはローマ字から漢字を含む文字列に変換する日本語入力処理手段と組み合わされ、仮名文字列を検索キーとして検索キーに対応する漢字を含む複数個の情報の取得を行うデータベース検索方式において、
    仮名文字列から漢字を含む複数個の情報を取得したのち該情報と前記漢字を含む文字列との一致度合いを調べる比較手段を備え、日本語入力処理手段が漢字に変換を行う元の仮名文字もしくはローマ字から、ローマ字の場合は仮名文字に変換してデータベースの検索を行い、前記比較手段により完全に一致もしくは一致度合いが高い漢字を含む情報を、検索により取得した漢字を含む複数個の情報の中から選択し、これを検索出力とするデータベース検索方式。
JP00033495A 1995-01-05 1995-01-05 データベース検索方式 Expired - Lifetime JP3574199B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP00033495A JP3574199B2 (ja) 1995-01-05 1995-01-05 データベース検索方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP00033495A JP3574199B2 (ja) 1995-01-05 1995-01-05 データベース検索方式

Publications (2)

Publication Number Publication Date
JPH08190565A JPH08190565A (ja) 1996-07-23
JP3574199B2 true JP3574199B2 (ja) 2004-10-06

Family

ID=11471001

Family Applications (1)

Application Number Title Priority Date Filing Date
JP00033495A Expired - Lifetime JP3574199B2 (ja) 1995-01-05 1995-01-05 データベース検索方式

Country Status (1)

Country Link
JP (1) JP3574199B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008018287A1 (fr) 2006-08-07 2008-02-14 Sharp Kabushiki Kaisha dispositif de recherche et dispositif de génération de base de données de recherche
JP7034478B2 (ja) * 2018-03-13 2022-03-14 株式会社イシダ 検索システム、検索装置、及び検索プログラム

Also Published As

Publication number Publication date
JPH08190565A (ja) 1996-07-23

Similar Documents

Publication Publication Date Title
JPH03185561A (ja) 欧文単語入力方法
JPH0433069B2 (ja)
JPS62287336A (ja) 電子辞書
JP3574199B2 (ja) データベース検索方式
JPH0581326A (ja) データベース検索装置
JPH08137892A (ja) 文書検索方法及び文書検索装置
JPS62163174A (ja) 機械翻訳装置
JPH05181912A (ja) 文書検索装置
JPS62282364A (ja) 文字列検索方式
JP3340124B2 (ja) かな漢字変換装置
JPH08137841A (ja) 文書処理装置及び方法
JPH04281558A (ja) 文書検索方法および装置
JP2020035236A (ja) 検索支援装置および検索支援方法
JPH0727526B2 (ja) かな漢字変換装置
JPH06266765A (ja) 文章検索装置
JPH08185401A (ja) 文書検索装置
JP2000348055A (ja) 情報検索方法及びその装置並びにコンピュータ可読記録媒体
JPH0341551A (ja) 文字入力装置
JPS62174866A (ja) 仮名漢字相互変換装置
JPH05282365A (ja) 電子辞書装置
JP2004280255A (ja) 言語間対応付け装置、言語間対応付け方法、及びそのプログラム
JPH11149472A (ja) 単語変換方法および情報処理装置
JPH06168272A (ja) 関連語作成装置
JPH07319908A (ja) 文書検索方法及び文書検索装置
JPH07129554A (ja) 文書処理装置

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040618

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040701

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110709

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130709

Year of fee payment: 9

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term