JPH1011431A - 漢字検索装置および方法 - Google Patents

漢字検索装置および方法

Info

Publication number
JPH1011431A
JPH1011431A JP8158242A JP15824296A JPH1011431A JP H1011431 A JPH1011431 A JP H1011431A JP 8158242 A JP8158242 A JP 8158242A JP 15824296 A JP15824296 A JP 15824296A JP H1011431 A JPH1011431 A JP H1011431A
Authority
JP
Japan
Prior art keywords
kanji
word
dictionary
search
readable
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8158242A
Other languages
English (en)
Inventor
Hajime Nitta
元 新田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
OKINAWA NIPPON DENKI SOFTWARE KK
NEC Software Okinawa Ltd
Original Assignee
OKINAWA NIPPON DENKI SOFTWARE KK
NEC Software Okinawa Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by OKINAWA NIPPON DENKI SOFTWARE KK, NEC Software Okinawa Ltd filed Critical OKINAWA NIPPON DENKI SOFTWARE KK
Priority to JP8158242A priority Critical patent/JPH1011431A/ja
Publication of JPH1011431A publication Critical patent/JPH1011431A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 難読漢字を含む漢字単語のかな漢字変換を行
う漢字検索装置にある。 【解決手段】 漢字検索装置10は、難読漢字単語を検
索するための、可読部分の漢字または読みがな,漢字単
語の字数,可読部分の漢字の位置,漢字単語の品詞を含
む検索情報を入力する入力部11と,検索情報の入力処
理する入力処理手段12と,漢字単語を検索する検索エ
ンジン手段13と,単漢字辞書14と,漢字単語辞書1
5と,検索結果の表示処理する結果表示処理手段16
と,可視化出力する表示部17と,を備える。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、かな漢字変換辞
書を備えたかな漢字検索装置に関し、特に難読な漢字を
含む漢字単語のかな入力ができるかな漢字検索装置に関
する。
【0002】
【従来の技術】従来、漢字検索装置は、かな漢字変換手
段と漢字辞書を備え、読みがなを入力して、読みがなに
相当する漢字候補を抽出して可視化出力し、所要の漢字
を選択するに用いられる。しかし、漢字が難読のため読
みがなが入力できない場合がある。特開平5−1225
7号公報によれば、一部分しか読みの分からない単語で
も漢字辞書からの検索を行う文書作成装置を開示してい
る。この文書作成装置は、予め設定された複数の単語が
登録された辞書と、難読文字を意味する特殊文字と可読
文字のかなとを入力する入力手段と、入力手段によって
入力された特殊文字まじりの読みがな列から特殊文字を
除いて一致する単語を検索する検索手段と、この検索手
段によって得られた単語を変換候補として表示する表示
手段から構成されている。
【0003】
【発明が解決しようとする課題】第1の問題点は、検索
の手がかりとして入力する特殊文字まじり読みがな列に
よっては、膨大な検索結果を出力してしまうことであ
る。読みがな部分に相当する漢字を含む漢字単語の単語
数が膨大であるため、検索対象となる文字列によって
は、内容の合致する単語が多数存在することがあり、検
索漢字単語を選択しきれないことが生じる。
【0004】第2の問題点は、検索の手がかりとする対
象文字を入力する際に使用者が正しい読みがな、又は漢
字を入力出来なければ検索ができないことである。
【0005】使用者が検索の手がかりにする対象文字を
入力する際、従来の漢字辞書に含まれる漢字単語の読み
に合致していなければ検索処理が正しく動作できないか
らである。
【0006】具体的には、単語「国後半島(くなしりは
んとう)」を先頭、末尾それぞれ一文字を手がかりとし
て検索処理を実行する場合、使用者が「国−島」「くな
−とう」と入力したならば検索処理は正しく実行される
が、「くに−しま」「くに−とう」や、また読みと漢字
の組み合わせである「国−しま」「くに−島」などの場
合でも検索はできない。
【0007】この発明の目的は、使用者によって入力さ
れる探索対象の漢字や探索する漢字単語のうちの可読漢
字の読みがな,文字数,漢字単語内での可読漢字の位
置,及び品詞情報を受け取り、単漢字辞書を用いて変換
した可読漢字を合わせて、漢字単語辞書の探索を行うこ
とにより、該当する漢字単語を抽出する。
【0008】
【課題を解決するための手段】この発明の難読漢字を含
む漢字単語における可読漢字自体あるいは可読漢字の読
みがなと、前記漢字単語の字数と、前記可読漢字の前記
漢字単語内の位置と、前記漢字単語の品詞を含む属性識
別と、でなる検索情報を入力して、前記漢字単語を探索
出力する漢字検索装置にあって、前記検索情報を入力す
る入力部と、前記入力部の前記検索情報を入力処理する
入力処理手段と、読みがなの漢字変換に用いる単漢字辞
書と、漢字単語の探索に用いる漢字単語辞書と、前記検
索情報に基づいて、前記単漢字辞書ならびに漢字単語辞
書を用いて、漢字単語を探索する検索エンジン手段と、
前記検索エンジン手段の探索過程および探索結果を出力
処理する結果表示処理手段と、前記結果表示処理手段の
出力を表示する表示部と、を備えることを特徴とする。
【0009】更にこの発明の難読漢字を含む漢字単語に
おける可読漢字自体あるいは可読漢字の読みがなと、前
記漢字単語の字数と、前記可読漢字の前記漢字単語内の
位置と、前記漢字単語の品詞を含む属性識別と、でなる
検索情報を入力して、前記漢字単語を探索出力する漢字
検索装置の探索方法にあって、前記検索情報を入力部に
入力するステップと、前記可読漢字が漢字入力されると
き、漢字変換を省き、前記可読漢字が読みがな入力され
ているとき、前記読みがなを単漢字辞書によって、漢字
変換候補を抽出して、該当する漢字を選択するステップ
と、前記漢字,前記字数,前記位置によって、漢字単語
辞書を探索し、漢字単語候補を抽出するステップと、前
記漢字単語候補から、前記属性識別に適合する漢字単語
候補を抽出するステップと、前記漢字単語候補から該当
する漢字単語を選択するステップと、を含むことを特徴
とする。
【0010】使用者が、入力手段を用いて漢字単語探索
に必要な情報である可読漢字の読みがな,合計文字数,
単語内での可読漢字位置、品詞情報を入力することによ
り、検索エンジン部がこれらの情報を基に、単漢字辞
書、及び漢字単語辞書の探索を行い、条件に合致した漢
字単語を抽出し、抽出された漢字単語を探索結果として
結果表示部が出力手段へ表示する。これにより一部分し
か読みの分からない漢字単語の変換候補が表示され、よ
り的確な漢字単語の抽出が実現し、更に、漢字単語の入
力が容易になる。
【0011】
【発明の実施の形態】この発明について、図面を参照し
て説明する。
【0012】この発明の第1の実施例の構成を示す図1
を参照すると、漢字検索装置10は、使用者が検索処理
に必要な情報を入力する入力部11と、入力部11から
検索情報を受け取る入力処理手段12と、入力処理部1
2の検索情報を基に、単漢字辞書14および漢字単語辞
書15から該当する漢字単語を検索する検索エンジン手
段13と、探索の手がかりとなる可読漢字のかな漢字変
換に用いる単漢字辞書14と、可読漢字を包含する漢字
単語群及び漢字単語それぞれの属性情報を有する漢字単
語辞書15と、検索エンジン部13が漢字単語辞書15
から抽出した漢字単語を表示部17へ表示させるための
結果表示処理手段16と、検索結果を表示する表示部1
7と、を有する。
【0013】次に第1の実施例の動作について、漢字単
語辞書15の一部を例示する図2(a),単漢字辞書1
4の一部を例示する図2(b),検索情報を例示する図
4(a),単語辞書の検索結果を例示する図4(b),
該検索結果の表示を例示する図4(c),読みがな入力
の検索情報を例示する図5(a),該読みがなのかな漢
字変換を例示する図5(b),ならびに流れ図3を参照
して、説明する。図3に於いて、入力処理手段12は使
用者が入力部11を用いて入力した検索情報を取得し、
該検索情報を検索エンジン手段13へ渡す(図3のステ
ップ31)。検索エンジン手段13は、使用者の入力し
た検索情報より、検索の手がかりとなる可読文字が読み
がな、または漢字のいずれで入力されたかを確認し(ス
テップ32)、単漢字辞書14を用いて読みがなの漢字
変換を行うか否かを判断する。可読文字が読みがなで入
力されている場合(ステップ32の読み)、検索エンジ
ン手段13は単漢字辞書14を用いて、読みがなの漢字
情報を取得し、単語辞書を検索する可読漢字のかな漢字
変換した検索情報を作成する(ステップ33)。次に検
索エンジン手段13は、該検索情報を基に漢字単語辞書
15の検索を行い(ステップ34)、該当しそうな単語
を全て抽出する。全単語を抽出後、それぞれの単語に付
属する品詞情報を参照し、不要な単語を削除する(ステ
ップ35)。検索エンジン手段13は、選択した漢字単
語を検索結果として結果表示処理手段16に渡し、該単
語を受けとった結果表示処理手段16は、該単語を検索
結果として出力部17へ表示する(ステップ36)。
【0014】上述の動作について、例を用いて説明す
る。
【0015】例として、使用者が単語「転轍(てんて
つ)」について、可読文字を「転」として検索情報を入
力し、検索エンジン手段13に変換を実行させるものと
する。入力される検索情報は、図4(a)または図5
(a)に例示する可読文字の「転」または「てん」,単
語合計文字数は「2」,単語内での対象文字位置は
「1」,品詞は「名詞」となる。入力処理手段12は、
使用者の入力した検索情報を検索エンジン手段13へ渡
す。該検索情報を受け取った検索エンジン手段13は、
可読文字が読みがな、または漢字のいずれで入力された
かを確認し、単漢字辞書14を用いて、かな漢字変換を
行うか否かを判断する(ステップ32)。対象を漢字で
入力した場合を図4(a)、読みがなで入力した場合を
図5(a)となる。可読文字が漢字で入力された場合
(ステップ32の漢字)、検索エンジン手段13は「合
計文字数が2で、1文字目が「転」の単語」について漢
字単語辞書15を図4(a)に例示する検索情報により
検索を行う。次に検索エンジン手段13は、漢字単語辞
書15より抽出した漢字単語(図4(b))について品
詞情報を確認し、「名詞」以外の単語については対象外
の単語として削除する。残った単語を検索結果(図4
(c))として結果表示処理手段16へ渡す。
【0016】可読文字が読みがなで入力された場合(ス
テップ32の読み)、検索エンジン手段13は単語辞書
15を検索するために必要となる漢字情報を得るため、
図5(a)の検索情報を入力し、読みがなに対応する漢
字を単漢字辞書14より図5(b)の漢字を取得する。
検索エンジン手段13は、単漢字辞書14より取得した
漢字を基に、図4(a)と同じ検索情報を生成し、漢字
単語辞書15を検索して、図6(a)の漢字単語を取得
し、品詞によって不要な単語を削除して図6(b)の結
果を結果表示処理手段16へ渡す。検索された図6の
(b)の全漢字単語は、表示部17に表示され、使用者
へ通知される。
【0017】次に、この発明の第2の実施例について、
説明する。
【0018】第2の実施例は、第1の実施例の図1に対
し、漢字単語辞書15に加え、新たに補助漢字単語辞書
18を付加することにより、更なる検索効率を向上させ
るものである。第1の実施例で示した検索エンジンが検
索の手がかりとする検索情報を基に単語の検索を行う場
合、実際に単語検索を行う辞書を用途別に複数付加す
る。具体的には、補助漢字単語辞書18は、人名辞書や
地名辞書や熟語辞書で、ある特定の用途に応じた内容の
辞書である。該辞書を名詞および属性の識別子を含む品
詞指定によって選択して用いることにより、通常の漢字
単語辞書15の容量を最小限に押さえることができる。
【0019】
【発明の効果】以上説明したように、この発明の第1の
効果は、一部分しか読みの分からない漢字単語を漢字入
力させる場合においても、読みの分かる部分と分からな
い部分を分割して入力させる必要がない。これにより、
使用者へ与えるかな漢字変換操作の煩わしさを軽減させ
る。その理由は、難読な漢字単語を漢字入力させる場合
でも、読みの分かる部分を手がかりに漢字単語辞書の検
索を行い、該当する単語を使用者へ通知、選択させるこ
とが出来るからである。
【0020】更にこの発明の第2の効果は、検索の対象
となる可読文字を読みがなで指定する際、必ずしも目的
の漢字単語の読みがなに合致せずとも検索処理ができ
る。その理由は、可読文字が読みがなで指定された場
合、単漢字辞書を用いる事により、読みに対応する全て
の漢字の検査を行うためである。
【図面の簡単な説明】
【図1】この発明の第1の実施例の構成を示す図であ
る。
【図2】分図(a)は漢字単語辞書の一部を、分図
(b)は単漢字辞書の一部をそれぞれ例示する図であ
る。
【図3】第1の実施例の動作を示す流れ図である。
【図4】分図(a)は漢字入力の検索情報,分図(b)
は検索結果,分図(c)は検索結果の表示をそれぞれ例
示し、第1の実施例における漢字入力の検索情報による
検索を説明する図である。
【図5】分図(a)は読みがな入力の検索情報,分図
(b)は読みがなの変換漢字をそれぞれ例示し、第1の
実施例における読みがな入力の検索を説明する図であ
る。
【図6】分図(a)は漢字単語の検索結果,分図(b)
は検索結果の表示をそれぞれ例示する図である。
【図7】第2の実施例の構成を2つ示す図である。
【符号の説明】
10 漢字検索装置 11 入力部 12 入力処理手段 13 検索エンジン手段 14 単漢字辞書 15 漢字単語辞書 16 結果表示手段 17 表示部 18 補助漢字単語辞書

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 難読漢字を含む漢字単語における可読漢
    字自体あるいは可読漢字の読みがなと、前記漢字単語の
    字数と、前記可読漢字の前記漢字単語内の位置と、前記
    漢字単語の品詞を含む属性識別と、でなる検索情報を入
    力して、前記漢字単語を探索出力する漢字検索装置にあ
    って、 前記検索情報を入力する入力部と、 前記入力部の前記検索情報を入力処理する入力処理手段
    と、 読みがなの漢字変換に用いる単漢字辞書と、 漢字単語の探索に用いる漢字単語辞書と、 前記検索情報に基づいて、前記単漢字辞書ならびに漢字
    単語辞書を用いて、漢字単語を探索する検索エンジン手
    段と、 前記検索エンジン手段の探索過程および探索結果を出力
    処理する結果表示処理手段と、 前記結果表示処理手段の出力を表示する表示部と、 を備えることを特徴とする漢字検索装置。
  2. 【請求項2】 難読漢字を含む漢字単語における可読漢
    字自体あるいは可読漢字の読みがなと、前記漢字単語の
    字数と、前記可読漢字の前記漢字単語内の位置と、前記
    漢字単語の品詞を含む属性識別と、でなる検索情報を入
    力して、前記漢字単語を探索出力する漢字検索装置の探
    索方法にあって、 前記検索情報を入力部に入力するステップと、 前記可読漢字が漢字入力されるとき、前記漢字の漢字変
    換を省き、前記可読漢字が読みがな入力されていると
    き、前記読みがなを単漢字辞書によって、漢字変換候補
    を抽出して、該当する漢字を選択するステップと、 前記漢字,前記字数,前記位置によって、漢字単語辞書
    を探索し、漢字単語候補を抽出するステップと、 前記漢字単語候補から、前記属性識別に適合する漢字単
    語候補を抽出するステップと、 前記漢字単語候補から該当する漢字単語を選択するステ
    ップと、 を含むことを特徴とする漢字検索装置の探索方法。
  3. 【請求項3】 前記漢字単語辞書は、 通常の文書処理に用いる漢字辞書と、地名辞書および人
    名辞書ならびに熟語辞書を補助漢字単語辞書として付加
    することを特徴とする請求項1記載の漢字検索装置。
  4. 【請求項4】 前記属性識別は、 漢字単語の文法上の品詞ならびに地名および人名の固有
    名詞さらに熟語を区別する識別子を含むことを特徴とす
    る請求項1記載の漢字検索装置。
JP8158242A 1996-06-19 1996-06-19 漢字検索装置および方法 Pending JPH1011431A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8158242A JPH1011431A (ja) 1996-06-19 1996-06-19 漢字検索装置および方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8158242A JPH1011431A (ja) 1996-06-19 1996-06-19 漢字検索装置および方法

Publications (1)

Publication Number Publication Date
JPH1011431A true JPH1011431A (ja) 1998-01-16

Family

ID=15667375

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8158242A Pending JPH1011431A (ja) 1996-06-19 1996-06-19 漢字検索装置および方法

Country Status (1)

Country Link
JP (1) JPH1011431A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006099677A (ja) * 2004-09-30 2006-04-13 Casio Comput Co Ltd 情報表示制御装置、サーバ及びプログラム
JP2008546051A (ja) * 2005-05-20 2008-12-18 エヌエイチエヌ コーポレーション クエリマッチングシステム及びその方法、該方法を実行するためのプログラムが記録されたコンピュータ読取可能な記録媒体
JP2009265758A (ja) * 2008-04-22 2009-11-12 Hitachi Ltd 用語入力支援装置及び方法、並びにプログラム
JP2010020638A (ja) * 2008-07-11 2010-01-28 Canon Inc 言語処理装置および言語処理方法
JP2012038151A (ja) * 2010-08-09 2012-02-23 Aba Kk 漢字検索システム、漢字検索方法及びプログラム
US9762371B2 (en) 2003-08-20 2017-09-12 Panasonic Corporation Wireless communication apparatus and wireless communication method

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9762371B2 (en) 2003-08-20 2017-09-12 Panasonic Corporation Wireless communication apparatus and wireless communication method
JP2006099677A (ja) * 2004-09-30 2006-04-13 Casio Comput Co Ltd 情報表示制御装置、サーバ及びプログラム
JP2008546051A (ja) * 2005-05-20 2008-12-18 エヌエイチエヌ コーポレーション クエリマッチングシステム及びその方法、該方法を実行するためのプログラムが記録されたコンピュータ読取可能な記録媒体
JP2009265758A (ja) * 2008-04-22 2009-11-12 Hitachi Ltd 用語入力支援装置及び方法、並びにプログラム
JP2010020638A (ja) * 2008-07-11 2010-01-28 Canon Inc 言語処理装置および言語処理方法
JP2012038151A (ja) * 2010-08-09 2012-02-23 Aba Kk 漢字検索システム、漢字検索方法及びプログラム
CN102375871A (zh) * 2010-08-09 2012-03-14 阿霸有限会社 汉字检索系统、汉字检索方法及程序

Similar Documents

Publication Publication Date Title
JP4544674B2 (ja) 選択文字列に関連する情報を提供するシステム
JPH09198395A (ja) 文書検索装置
JPH1011431A (ja) 漢字検索装置および方法
JPS61248160A (ja) 文書情報登録方式
JP2621999B2 (ja) 文書処理装置
JPS63228326A (ja) キ−ワ−ド自動抽出方式
JPH0944521A (ja) インデックス作成装置および文書検索装置
JPH01266670A (ja) 日本語対象文固有用語抽出処理装置
JPH01259448A (ja) 漢字入力方式
WO2005098672A1 (ja) 電子辞書
JP2737662B2 (ja) 外国語キーワード文献検索処理装置
JPH0612453A (ja) 未知語抽出登録装置
JP2729342B2 (ja) 仮名漢字変換方法および装置
JPH05324610A (ja) 住所表記漢字入力装置
JPS62282364A (ja) 文字列検索方式
JPH0727526B2 (ja) かな漢字変換装置
JPH05165805A (ja) かな漢字変換装置
JPS61128364A (ja) 辞書検索装置
JPS63136264A (ja) 機械翻訳装置
JP2004355248A (ja) 電子辞書
JP2001290813A (ja) かな漢字変換方法及び装置及び記録媒体
JP2001125907A (ja) 辞書検索方法、装置、および辞書検索プログラムを記録した記録媒体
JPH0344760A (ja) 日本語処理装置
JPS62200456A (ja) 文書処理装置
JPS63133228A (ja) 情報抽出装置

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 19981208