JPH08190565A - データベース検索方式 - Google Patents

データベース検索方式

Info

Publication number
JPH08190565A
JPH08190565A JP7000334A JP33495A JPH08190565A JP H08190565 A JPH08190565 A JP H08190565A JP 7000334 A JP7000334 A JP 7000334A JP 33495 A JP33495 A JP 33495A JP H08190565 A JPH08190565 A JP H08190565A
Authority
JP
Japan
Prior art keywords
kanji
kana
character string
search
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP7000334A
Other languages
English (en)
Other versions
JP3574199B2 (ja
Inventor
Masahito Tanimura
正仁 谷村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
HARU KENKYUSHO KK
HAL Laboratory Inc
Original Assignee
HARU KENKYUSHO KK
HAL Laboratory Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by HARU KENKYUSHO KK, HAL Laboratory Inc filed Critical HARU KENKYUSHO KK
Priority to JP00033495A priority Critical patent/JP3574199B2/ja
Publication of JPH08190565A publication Critical patent/JPH08190565A/ja
Application granted granted Critical
Publication of JP3574199B2 publication Critical patent/JP3574199B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【目的】 漢字を含む文字列からの検索に対応していな
いCD−ROMなどをデータベースとした辞書や辞典で
の検索の煩雑さを改善する。 【構成】 仮名文字列を検索キーとして、検索キーに対
応する漢字を含む複数個の情報の取得を行うデータベー
ス検索方式において、漢字を含む文字列から仮名文字列
への漢字仮名変換テーブル8と、変換された仮名文字列
から漢字を含む複数個の情報を取得したのち該情報と前
記漢字を含む文字列との一致度合いを調べる比較プログ
ラム7を備え、任意の漢字を含む文字列を指定すること
によりこれを仮名に変換してデータベースの検索を行
い、前記比較プログラム7により完全に一致もしくは一
致度合いが高い漢字を含む情報を、検索により取得した
漢字を含む複数個の情報の中から選択し、これを検索出
力とする。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、データベース検索方式
に係り、特に漢字を含む文字列からの検索に対応してい
ないCD−ROMなどを用いたデータベース検索方式に
おいて、漢字を含む文字列からの検索を簡便に行うため
のデータベース検索方式に関する。
【0002】
【従来の技術】近年、CDをROMとして使用する国語
辞典や百科辞典が普及し始めているが、これをコンピュ
ータで利用する場合には画面上に表示されている言葉や
用語を文字列として指定し、この文字列の意味を取得す
ることが要求される。しかし、前記文字列に漢字が含ま
れている場合に、CD−ROMが仮名文字の検索キーし
か具備していないものにおいては、漢字を含む文字列か
らの検索が不可能となる。例えば、市販されているCD
を利用した国語辞典の中には、仮名文字列から漢字を含
む情報を検索する検索方式のみ対応し、CD−ROMの
中に漢字を含む文字からの検索のためのインデックスが
設けられていないものが存在するが、このようなCD−
ROMを使用した場合には、その都度仮名文字をキーボ
ードから入力しなければならないといった煩わしさがあ
った。
【0003】また、このようなCD−ROMの使用に対
しては、漢字を含む文字列から仮名文字に変換する変換
表を別途設け、これにより求められる文字の読みを取得
して検索を行う方式が考えられるが、この方式において
も同音異義語のように同一キーが検索キーとなってしま
う場合には、同音異義語から目的とする単語を選択する
作業を行う必要が生じてしまうことになる。例えば“新
興”という言葉を例に説明すると、“新興”からは“し
んこう”が求められ、これによりCD−ROMのデータ
ベースの検索を行うと、“進行”,“振興”,“親
交”,“信仰”,“新興”・・・、など多くの同音異義
語があるために、これらの中から“新興”を選ぶ作業を
行う必要が生じる。
【0004】同様なことが、仮名文字もしくはローマ字
から漢字を含む文字列に変換する日本語入力処理手段を
使用した場合にも発生する。仮名を入力して漢字に変換
した後、この漢字が適切であるか否か辞書で確認する時
に仮名文字に同音異義語があると、やはり同音異義語の
中から目的とする単語を選択する操作が必要となってし
まうことになる。
【0005】
【発明が解決しようとする課題】本発明は、このような
漢字を含む文字列からの検索に対応していないCD−R
OMなどをデータベースとした辞書や辞典での検索の煩
雑さを改善することを目的とし、漢字を含む文字列と漢
字を含む情報の一致度合いを調べる比較手段を設けるこ
とにより、漢字を含む文字列からの検索を同音異義語が
あった場合にも、目的とする単語を自動的に選別するこ
とで簡便な操作で足りるようにした。
【0006】
【課題を解決するための手段】本発明は上記課題を解決
するために、第1に仮名文字列を検索キーとして、検索
キーに対応する漢字を含む複数個の情報の取得を行うデ
ータベース検索方式において、漢字を含む文字列から仮
名文字列への変換テーブルと、変換された仮名文字列か
ら漢字を含む複数個の情報を取得したのち該情報と前記
漢字を含む文字列との一致度合いを調べる比較手段を備
え、任意の漢字を含む文字列を指定することによりこれ
を仮名に変換してデータベースの検索を行い、前記比較
手段により完全に一致もしくは一致度合いが高い漢字を
含む情報を、検索により取得した漢字を含む複数個の情
報の中から選択し、これを検索出力とするデータベース
検索方式を手段とし、
【0007】第2に仮名文字もしくはローマ字から漢字
を含む文字列に変換する日本語入力処理手段と組み合わ
され、仮名文字列を検索キーとして検索キーに対応する
漢字を含む複数個の情報の取得を行うデータベース検索
方式において、仮名文字列から漢字を含む複数個の情報
を取得したのち該情報と前記漢字を含む文字列との一致
度合いを調べる比較手段を備え、日本語入力処理手段が
漢字に変換を行う元の仮名文字もしくはローマ字から、
ローマ字の場合は仮名文字に変換してデータベースの検
索を行い、前記比較手段により完全に一致もしくは一致
度合いが高い漢字を含む情報を、検索により取得した漢
字を含む複数個の情報の中から選択し、これを検索出力
とするデータベース検索方式を手段とする。
【0008】
【実施例】以下添付図面に基づいて本発明に係るデータ
ベース検索方式の実施例を詳細に説明する。図1は、本
発明の第1実施例に係るデータベース検索方式を実施す
る装置の機能構成図である。この図において、ROM1
にはCPU2(中央処理装置)が動作するための各種処
理プログラム、即ちワープロ処理プログラム3、検索文
字指定プログラム4、漢字仮名変換プログラム5、CD
−ROM検索プログラム6、比較プログラム7とデータ
として漢字仮名変換テーブル8が蓄積されている。RA
M9は情報の一時記憶用のワークエリアとして使用され
る。また、CD−ROMドライブ10にはディスクコン
トローラ11により制御される国語辞典CD−ROM1
2がセットされている。上記CPU2がI/Oコントロ
ーラ13を介してキーボード14から入力を受け付ける
と、アプリケーションプログラムであるワープロ処理プ
ログラム3により処理が施され、CPU2は結果をディ
スプレイRAM15に書き込む。ディスプレイコントロ
ーラ16はディスプレイRAM15に書き込まれている
文字コードにしたがってディスプレイ17上に文字を表
示するように構成されている。このためにキーボード1
4から入力された情報は直ちに画面に表示される。
【0009】図2は、画面上に検索文字列が表示されて
いる状態を示す。例えば文章の中にある“新興勢力”の
意味を取得するためにこれを検索する場合などである。
図3は、この場合のCD−ROMの検索処理の流れを説
明したものである。
【0010】図3において、カーソルを“新”の文字に
合わせてCD−ROMでの検索が指定されると検索文字
指定プログラム4が“新”のカーソル位置から“新興勢
力が”のごとく複数個の文字をディスプレイRAM15
からワーク領域に検索文字データとして取り出す。次い
で、漢字仮名変換プログラム5が漢字仮名変換テーブル
8を検索し、先頭文字から最大の一致度を有する漢字ま
じり文字列に対応する仮名文字列“しんこう”を抽出す
る。即ち、この例では“新し”が一文字分の一致である
のに対して“新興”は二文字分が一致することから、こ
の漢字に対応した仮名文字“しんこう”が選択されるこ
とになる。
【0011】仮名文字列“しんこう”が抽出されると、
次にCPU2はCD−ROM検索プログラム6を起動し
て、ディスクコントローラ16に対し“しんこう”に該
当する項目の検索を行う。図3に示したようにCD−R
OMには複数個の同音異義語の情報が記録されており、
これらを全て読み出して出力候補とする。即ち、“しん
こう”の同音異義語は“進行”、“振興”、“親交”、
“信仰”“新興”の5種類あることから、これら全てが
出力候補となる。次にCPU2は比較プログラム7を起
動して、検索文字列データ“新興勢力が”と前出の出力
候補とを先頭文字から比較し、完全に一致もしくは一致
度合いが高いものを検索出力とする。従って、この例で
は“新興”の文字列部分が一致するので、残りの他の候
補を読み飛ばし、この“新興”を同音異義語の中から自
動的に選択する。そして、CD−ROMの中に蓄積され
ている“新興”の意味内容である“新たに興ること”が
検索出力として画面上に表示されることになり、一度の
操作で素早く“新興”の意味を把握することができる。
この時、画面上に“新興−新たに興ること”と表わすこ
とで、より明確に意味を確認することもできる。
【0012】なお、上記実施例では、CD−ROMから
同音異義語を全部読み出した後に検索文字データとの比
較を行っているが、CD−ROMから出力候補を一つ一
つ読み出すのと同時に比較を行っても良い。また、CD
−ROMのデータは仮名文字の検索キーと“新興”のよ
うな項目名と、その内容が一緒に蓄積されている場合だ
けでなく別々に蓄積されていても良く、この場合には項
目名に対し比較を行い、完全に一致もしくは一致度が高
い項目名に対応する内容を検索してこれを検索出力とす
る。
【0013】次に本発明の第2実施例について説明す
る。図4はこの実施例に係るデータベース検索方式を実
施する装置の機能構成図である。ROM1内には先の実
施例とは異なった種類のCPU2の動作処理プログラ
ム、即ちキー入力処理プログラム20、仮名漢字変換プ
ログラム21、CD−ROM検索プログラム6、比較プ
ログラム7と、データとしての仮名漢字変換辞書22が
蓄積されている。なお、ROM1以外の装置の機能は先
の実施例と同じであり、RAM9は情報の一時記憶用の
ワークエリアとして使用され、またCPU2はI/Oコ
ントローラ13を介してキーボード14から入力を受け
付け、また処理結果をディスプレイRAM15に書き込
む。ディスプレイコントローラ16はディスプレイRA
M15に書き込まれている文字コードにしたがってディ
スプレイ17上に文字を表示するように構成されてい
る。また、CD−ROMドライブ10にはディスクコン
トローラ11により制御される国語辞典CD−ROM1
2がセットされている。
【0014】図5は、上記実施例でのCD−ROMにお
ける検索処理の流れを説明したものである。この実施例
では例えばコンピュータの画面上で日本語の文章を作成
する場合に、用いる言葉の意味に見合った漢字文字を検
索する際に利用することができる。例えば、キーボード
14から入力した“しんこうせいりょくが”の漢字文字
を検索する場合、先ず入力された“しんこうせいりょく
が”の仮名文字データから、操作者が仮名漢字変換プロ
グラム21により仮名漢字変換辞書22を参照して“新
興勢力が”の漢字文字列を生成する。次にCD−ROM
検索を指定すると、前述の仮名漢字変換辞書22を参照
して漢字変換を行ったもとになった仮名文字列“しんこ
う”を仮名漢字変換プログラム21から受け取る。次い
でCPU2はCD−ROM検索プログラム6を起動し
て、ディスクコントローラ11に対して検索を指示し、
“しんこう”に該当する項目の検索を行う。そして、先
の実施例と同様に、CD−ROMには複数個の同音異義
語を有する情報が記載されているから、これらを全て読
み出して出力候補とする。次にCPU2は比較プログラ
ム7を起動して検索文字列データ“新興勢力が”と前出
の出力候補とを先頭文字から比較し、完全に一致もしく
は一致度合いの高いものを検索出力とし、他の同音異義
語は読み飛ばして画面上には“新興”の内容である“新
たに興ること”を表示することになる。操作者は、画面
上に表示された用語の意味が目的のものか否かを確認
し、それで良ければ“新興”の漢字文字を選択する。
【0015】
【発明の効果】以上説明したように、本発明に係るデー
タベース検索方式によれば、画面に表示された文字列の
内容を検索する場合、又は画面にキーボードから入力し
た仮名文字列の内容を検索する場合などに、漢字混じり
の単語を指定するだけで、その単語もしくはその単語に
最も近い内容の検索出力を同音異義語の中から自動的に
選び出すことができるので、辞書や辞典などからの検索
が簡便になるといった効果を奏する。
【図面の簡単な説明】
【図1】本発明の第1実施例に係るデータベース検索方
式を実施するための装置の機能構成図である。
【図2】コンピュータの画面上に表示された検索文字列
の一例を示す説明図である。
【図3】上記実施例におけるCD−ROMの検索処理の
流れを示す説明図である。
【図4】本発明の第2実施例に係るデータベース検索方
式を実施するための装置の機能構成図である。
【図5】第2実施例におけるCD−ROMの検索処理の
流れを示す説明図である。
【符号の説明】
1 ROM 5 漢字仮名変換プログラム 7 比較プログラム 8 漢字仮名変換テーブル 21 仮名漢字変換プログラム 22 仮名漢字変換辞書
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.6 識別記号 庁内整理番号 FI 技術表示箇所 9288−5L G06F 15/20 590 Z 9194−5L 15/403 350 C

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 仮名文字列を検索キーとして、検索キー
    に対応する漢字を含む複数個の情報の取得を行うデータ
    ベース検索方式において、 漢字を含む文字列から仮名文字列への変換テーブルと、
    変換された仮名文字列から漢字を含む複数個の情報を取
    得したのち該情報と前記漢字を含む文字列との一致度合
    いを調べる比較手段を備え、任意の漢字を含む文字列を
    指定することによりこれを仮名に変換してデータベース
    の検索を行い、前記比較手段により完全に一致もしくは
    一致度合いが高い漢字を含む情報を、検索により取得し
    た漢字を含む複数個の情報の中から選択し、これを検索
    出力とするデータベース検索方式。
  2. 【請求項2】 仮名文字もしくはローマ字から漢字を含
    む文字列に変換する日本語入力処理手段と組み合わさ
    れ、仮名文字列を検索キーとして検索キーに対応する漢
    字を含む複数個の情報の取得を行うデータベース検索方
    式において、 仮名文字列から漢字を含む複数個の情報を取得したのち
    該情報と前記漢字を含む文字列との一致度合いを調べる
    比較手段を備え、日本語入力処理手段が漢字に変換を行
    う元の仮名文字もしくはローマ字から、ローマ字の場合
    は仮名文字に変換してデータベースの検索を行い、前記
    比較手段により完全に一致もしくは一致度合いが高い漢
    字を含む情報を、検索により取得した漢字を含む複数個
    の情報の中から選択し、これを検索出力とするデータベ
    ース検索方式。
JP00033495A 1995-01-05 1995-01-05 データベース検索方式 Expired - Lifetime JP3574199B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP00033495A JP3574199B2 (ja) 1995-01-05 1995-01-05 データベース検索方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP00033495A JP3574199B2 (ja) 1995-01-05 1995-01-05 データベース検索方式

Publications (2)

Publication Number Publication Date
JPH08190565A true JPH08190565A (ja) 1996-07-23
JP3574199B2 JP3574199B2 (ja) 2004-10-06

Family

ID=11471001

Family Applications (1)

Application Number Title Priority Date Filing Date
JP00033495A Expired - Lifetime JP3574199B2 (ja) 1995-01-05 1995-01-05 データベース検索方式

Country Status (1)

Country Link
JP (1) JP3574199B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008018287A1 (fr) 2006-08-07 2008-02-14 Sharp Kabushiki Kaisha dispositif de recherche et dispositif de génération de base de données de recherche
JP2019159758A (ja) * 2018-03-13 2019-09-19 株式会社イシダ 検索システム、検索装置、及び検索プログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008018287A1 (fr) 2006-08-07 2008-02-14 Sharp Kabushiki Kaisha dispositif de recherche et dispositif de génération de base de données de recherche
JP2019159758A (ja) * 2018-03-13 2019-09-19 株式会社イシダ 検索システム、検索装置、及び検索プログラム

Also Published As

Publication number Publication date
JP3574199B2 (ja) 2004-10-06

Similar Documents

Publication Publication Date Title
US5794177A (en) Method and apparatus for morphological analysis and generation of natural language text
JP3356536B2 (ja) 機械翻訳装置
JPH11110416A (ja) データベースからドキュメントを検索するための方法および装置
US5890182A (en) Sentence processing method and apparatus
JPH09114852A (ja) 情報検索装置
JPH08190565A (ja) データベース検索方式
JPH0581326A (ja) データベース検索装置
JPH08212230A (ja) 文書検索方法及び文書検索装置
JPH07134720A (ja) 文章作成システムにおける関連情報提示方法及び装置
JPH10320399A (ja) 言語識別装置,言語識別方法および言語識別のプログラムを記録した記録媒体
JP3498635B2 (ja) 情報検索方法及びその装置並びにコンピュータ可読記録媒体
JPH0944521A (ja) インデックス作成装置および文書検索装置
JPH08221443A (ja) 漢字を含むテキストの検索方法及び装置
JPH0944496A (ja) 自然語解析方法及び装置
JP2537991B2 (ja) 文字入力装置および方法
JP2760432B2 (ja) 文字処理装置
JPS62282364A (ja) 文字列検索方式
JPH08137841A (ja) 文書処理装置及び方法
JPH0727526B2 (ja) かな漢字変換装置
JPH0628396A (ja) 電子化辞書装置
JPH06168272A (ja) 関連語作成装置
JPH06215038A (ja) データベース検索装置
JPH1091627A (ja) 漢字よみがな自動変換方法およびシステム
JPH05282290A (ja) 文章作成支援装置
JPH0816572A (ja) 英数字/仮名文字自動認識入力システム

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040618

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040701

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110709

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130709

Year of fee payment: 9

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term