JP2975529B2 - 電子化辞書検索装置 - Google Patents

電子化辞書検索装置

Info

Publication number
JP2975529B2
JP2975529B2 JP6118763A JP11876394A JP2975529B2 JP 2975529 B2 JP2975529 B2 JP 2975529B2 JP 6118763 A JP6118763 A JP 6118763A JP 11876394 A JP11876394 A JP 11876394A JP 2975529 B2 JP2975529 B2 JP 2975529B2
Authority
JP
Japan
Prior art keywords
notation
index
dictionary
search
character string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP6118763A
Other languages
English (en)
Other versions
JPH07325844A (ja
Inventor
太朗 森下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Consejo Superior de Investigaciones Cientificas CSIC
Original Assignee
Consejo Superior de Investigaciones Cientificas CSIC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Consejo Superior de Investigaciones Cientificas CSIC filed Critical Consejo Superior de Investigaciones Cientificas CSIC
Priority to JP6118763A priority Critical patent/JP2975529B2/ja
Publication of JPH07325844A publication Critical patent/JPH07325844A/ja
Application granted granted Critical
Publication of JP2975529B2 publication Critical patent/JP2975529B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、ワードプロセッサや電
子手帳などの電子機器において、電子化辞書を用いて言
語処理を行う電子化辞書検索装置に関するものである。
【0002】
【従来の技術及び発明が解決しようとする課題】ワープ
ロ、パソコン、電子手帳などの機器に国語辞典、英和辞
典といった辞書のデータを搭載し、電子的に検索できる
ようにした電子化辞書検索装置が普及している。
【0003】電子化辞書では、一般に、辞書のデータ容
量が大きいため、仮名漢字変換などの辞書検索以外の機
能を搭載するための容量や、豊富な検索機能を搭載する
ための容量を確保することが難しい。
【0004】このため、装置の容量の限られている小型
の電子化辞書検索装置においては、これまで、国語辞
典、和英辞典、漢和辞典など読みからも表記からも検索
可能な辞書データに対して、「読みからだけしか検索で
きない」、又は「表記検索は漢字1字の表記からしか検
索できない」といった制限付きのものしかなかった。
【0005】一方、パソコンなどメモリー容量の大きい
ものに関しては、読みからも表記からも検索できるもの
が存在するが、複数の表記をもつ同意味の辞書項目の検
索・表示といった複雑な処理を容量を十分に削減したよ
うなインデックス構造で実現しているものはなかった。
【0006】図11及び12は従来のインデックス・デ
ータ及び辞書本体データの構造例である。図11に示す
ように、一般に、表記検索においては、辞書項目にアク
セスするためには、通常、表記インデックスにすべての
表記文字列を用意しておく必要があるが、例えば、読み
検索など他の種類の検索により、その辞書項目へアクセ
スした場合でも検索結果として表記文字列が必要となる
ため、辞書データ本体の中にもすべての表記文字列を用
意しておかねばならない。すなわち、容量のかさむ表記
文字列データを、通常は同じデータであるにもかかわら
ず2カ所に記憶させることになってしまう。
【0007】この容量の増加を防ぐために、図12に示
すように、表記文字列データは辞書データ本体に用意さ
れたもののみを使用し、表記インデックスには表記文字
列データを記述せずにポインタのみを用意することによ
ってインデックス容量の削減を図ることができる。しか
しながらこの方法では、検索対象が異表記辞書項目のな
かの1つの表記文字列である場合、表記インデックスに
おいて文字列が照合できないため本来の表記インデック
ス上の位置を確定することが難しく、入力文字列の表記
順の前後の辞書項目を出すことができないという問題点
が生ずる。
【0008】本発明は、表記文字列データは辞書データ
本体に用意されたもののみを使用し、表記インデックス
には表記文字列データを記述せずにポインタのみをセッ
トしたような小容量の構造のインデックス・データを用
いながら、異表記辞書項目を、どの表記で検索しても、
その辞書項目に属するすべての異なる表記をその読み及
び意味内容とともに表示でき、かつ、検索表記の前・後
の辞書項目の表記順の検索・表示もできるようにするを
目的とする。
【0009】
【課題を解決するための手段】本発明は上記課題の解決
を目的としたなされたもので、請求項1記載の発明で
は、読みと、意味と、同一の読み及び意味を持つ複数の
漢字表記とを一塊のデータとして、読み順に記憶する辞
書記憶手段と、各漢字表記に対応した前記辞書記憶手段
への検索用インデックスを表記順に記憶するインデック
ス記憶手段と、検索対象文字列を入力する入力手段と、
前記検索対象文字列に対応する検索用インデックスを決
定する決定手段と、前記決定された検索用インデックス
にて、前記辞書記憶手段を検索して、前記検索対象文字
列と同一の漢字表記を備えるデータから、読み、意味及
び異表記を含む漢字表記を表示する異表記表示手段と、
前記決定された検索用インデックスの前後に記憶された
検索用インデックスにて、前記辞書記憶手段を検索し
て、前記検索対象文字列の表記順の前後にある文字列を
表示する表記順表示手段とを具備することを特徴とする
ものである。
【0010】更に、請求項2記載の発明では、前記イン
デックス記憶手段は、表記1次インデックス記憶部と表
記インデックス記憶部とから構成され、前記表記1次イ
ンデックス記憶部は一漢字毎に、該漢字から始まる文字
列の前記表記インデックス記憶部への検索用インデック
スを記憶し、前記表記インデックス記憶部は前記辞書記
憶手段への検索用インデックスを記憶することを特徴と
するものである。
【0011】
【作用】請求項1記載の発明では、入力された検索対象
文字列に対応する検索用インデックスを決定し、この決
定された検索用インデックスにて、辞書記憶手段を検索
して、検索対象文字列と同一の漢字表記を備えるデータ
から、読み、意味及び異表記を含む漢字表記を表示し、
また、決定された検索用インデックスの前後に記憶され
た検索用インデックスにて、辞書記憶手段を検索して、
検索対象文字列の表記順の前後にある文字列を表示する
ものである。
【0012】更に、請求項2記載の発明では、インデッ
クス記憶手段は、表記1次インデックス記憶部と表記イ
ンデックス記憶部とから構成され、表記1次インデック
ス記憶部は一漢字毎に、該漢字から始まる文字列の表記
インデックス記憶部への検索用インデックスを記憶し、
表記インデックス記憶部は辞書記憶手段への検索用イン
デックスを記憶することを特徴とするものである。
【0013】
【実施例】図1は本発明の機器構成図であり、図2は本
発明のブロック図である。図3は本発明のインデックス
・データ及び辞書本体データの構造例を示す図であり、
図4は本発明のインデックス・データ及び辞書本体デー
タの具体例を示す図である。図5は本発明のインデック
ス・データ及び辞書本体データの作成に係るフローチャ
ート図である。図6は本発明の辞書項目特定手段の処理
のフローチャート図であり、図7は本発明のインデック
ス位置特定手段の処理のフローチャート図である。図8
は本発明の検索結果の表示例であり、図9は本発明の入
力文字列の前後の辞書項目の検索結果の表示例である。
図10は入力文字列が「相撃ち」の場合の検索結果の表
示例である。以下、図をもとに本発明について詳細に説
明する。
【0014】図1において、本発明の機器は、中央処理
装置(CPU)1と、記憶装置(Memory)2と、
入力インターフェース(入力I/F)3と、入力装置4
と、出力インターフェース(出力I/F)5と、出力装
置6とから構成される。
【0015】次に、本発明を実現するためのブロック構
成を上記機器構成と対応付けて説明する。図2におい
て、入力手段7はキーボード、OCR、ペン等の入力装
置4及びコンピュータとのデータのやりとりをするため
の入力インターフェース3で構成され、検索対象となる
文字列や辞書のインデックス・データ等を入力する。記
憶手段8はROM及びRAMで構成されるコンピュータ
の通常の記憶装置2であり、検索用のインデックス・デ
ータ、検索手段11の実行オブジェクト、検索結果等必
要なデータを格納する。表示手段9は液晶ディスプレ
イ、CRT等の出力装置6及びコンピュータとのデータ
のやりとりをするための出力インターフェース5で構成
され、検索結果等を表示する。インデックス・データ作
成手段10は、後述するデータ構造に従って、入力手段
7及び記憶手段8により本発明を実現するために必要な
検索用のインデックス及びデータを作成し、記憶装置2
に記憶するものである。
【0016】検索手段11は、入力された検索対象文字
列と、文字列の比較を行いながら、メモリー中の検索用
インデックスをたどって、検索要件を満たす辞書の本体
データにアクセスして必要なデータを抽出するためのロ
ジックであり、記憶装置2の一部に相当するものであ
る。検索手段11は、検索機能の種類に応じて複数のロ
ジックを構成する必要があるが、ここでは読み検索と異
表記処理を含む表記検索の共存という点に絞って便宜
上、読みからの検索を行う読み検索手段12と表記から
の検索を行う表記検索手段13から成るものとし、更
に、表記検索手段13は、異表記処理のポイントとなる
2つの主要なロジックである辞書項目特定手段14とイ
ンデックス位置特定手段15から成るものとする。この
うち辞書項目特定手段14は検索対象文字列を表記とし
て持つ辞書項目を特定する手段であり、インデックス位
置特定手段15は表記検索用のインデックスの位置を確
定し、検索対象文字列が異表記の1つである場合でも表
記順の前後の辞書項目にアクセス可とするための手段で
ある。制御手段16は、記憶装置2中の検索手段11を
呼び出し、他の各手段を制御しながら一連の検索ロジッ
クを解釈実行するための手段であり、CPU1が対応す
る機器となる。図3及び4はインデックス・データの容
量を最低限に押さえるために、表記文字列を辞書本体デ
ータにのみセットした構成を例示したものである。図3
にその構造例を、図4に具体例を示す。
【0017】図3において、辞書本体データ17は辞書
の各項目を読みの順に並べたものであり、読みインデッ
クス18を通してアクセスできるようになっている。辞
書本体データ17中の1つの辞書項目は、その項目のサ
イズ(固定長)、読み文字列のサイズ(固定長)、表記文字
列のサイズ(固定長)、読み文字列(可変長)、すべての異
表記文字列を特定の区切り記号により結合した表記文字
列(可変長)、及び意味を表す文字列(可変長)から構成さ
れる。図4に、「あいうち」という異表記辞書項目が辞
書本体データ21中にセットされた具体例を示す。「あ
いうち」は「相打ち」、「相撃ち」、「相討ち」の3つ
の異なる表記記述が可能であるため、表記文字列の欄に
は例えば"相打ち・相撃ち・相討ち"という文字列をセッ
トしておく。この場合異表記文字列の区切り記号は中
点"・"である。
【0018】図3において、表記インデックス本体19
は、辞書本体データ17へのオフセット(先頭からのバ
イト数)の並びにより構成される。オフセットは、その
オフセットから始まる辞書項目の表記が表記順に並ぶよ
うに並べる。異表記がある場合は、異表記の個数分だけ
同じ値のオフセットを用意する。具体的には、図4の2
2に示すように、「相撃ち」は「相関」の後、「相互」
の前に、「相打ち」は「相続」の後、「相対」の前に、
更に「相討ち」は「相等」の後、「相伴」の前に、それ
らの表記順の位置があるため、表記インデックス本体2
2においても、「相撃ち」に対して用意された辞書本体
データ21「あいうち(相打ち・相撃ち・相討ち)」項目
へのオフセットは、「そうかん(相関)」項目へのオフセ
ットの後、「そうご(相互)」項目へのオフセットの前
に、「相打ち」に対して用意された辞書本体データ21
「あいうち(相打ち・相撃ち・相討ち)」項目へのオフセ
ットは、「そうぞく(相続)」項目へのオフセットの後、
「そうたい(相対)」項目へのオフセットの前に、更に、
「相討ち」に対して用意された辞書本体データ21「あ
いうち(相打ち・相撃ち・相討ち)」項目へのオフセット
は、「そうとう(相等)」項目へのオフセットの後、「し
ょうばん(相伴)」項目へのオフセットの前に、それぞれ
セットする。
【0019】図3において、表記1次インデックス20
は、全件検索を避けるための通常よく使われるインデッ
クスであり、表記インデックス本体19の何件か毎に表
記インデックスのオフセットをセットしておく方法が一
般的である。具体例を図4の23に示すが、1文字が変
わる場合にその先頭の項目のオフセットを表記1次イン
デックスにセットしている。
【0020】このようなインデックス構造にしておけ
ば、異表記として記述されているどんな表記からでも対
応する辞書本体データの辞書項目にアクセスできる。例
えば「相打ち」で表記検索した場合、表記1次インデッ
クス23の「相」に対応する位置、表記インデックス本
体22の「相応」に対応する位置、辞書本体データ21
の「そうおう(相応)」項目の位置に順にアクセスする。
「そうおう(相応)」項目中の表記文字列は、「表記」の
位置から「表記サイズ」分のデータを読み込むことによ
り得られる。得られた表記文字列「相応」は「相打ち」
と一致しないので、表記インデックス本体22の次の位
置に移動して、辞書本体データ21の表記順の次の項目
を調べる。以下順次この操作を繰り返し、入力文字列
と、辞書項目中の表記文字列または異表記文字列の1つ
とが一致した場合、その辞書項目が求めるべき項目であ
るということになる。図4の例では表記インデックス本
体22の「相応」、「相関」、「相撃ち」のオフセット
を順次調べてきたところで、本体データ中の「あいう
ち」項目が特定できることになる。
【0021】次にこのようなデータ構造にしておくこと
によって、容量的な工夫を加えない通常の構造よりも十
分小さな容量でインデックス・データが作成できること
を示す。
【0022】図11は従来のインデックス・データ及び
辞書本体データの構造例を示す図である。表記インデッ
クス本体は、異表記を個々に分けた上で表記文字列をそ
のままインデックス中にセットして表記順に並べたもの
である。このタイプのものでは、「相打ち」、「相討
ち」、「相撃ち」いずれからでも「あいうち(相打ち・
相撃ち・相討ち)」の辞書項目にアクセスできる。しか
しながら、表記インデックス本体にも辞書本体データと
同じ表記文字列が重複セットされる上に表記インデック
ス本体が可変長となりサイズデータが新たに必要となる
ためその分容量が大きくなってしまう。表記文字列の件
数をN、表記文字列の平均バイト数をHとすると、図1
1の従来の構造は、図3の本発明の構造よりもN×(H
+1)バイト容量が大きくなる。逆に、図3の場合で
は、例えば、N=50,000、H=7の場合で400KByteの容量
を削減できることになる。
【0023】また、図12の表記インデックス本体は図
11のインデックスの問題点である「表記文字列の重
複」を避けるために、表記インデックス本体だけに表記
を持たせ、辞書本体データ中には表記インデックスのオ
フセットをセットしたものである。例えば読み検索の場
合、このオフセットを通して表記インデックス本体にセ
ットされた表記文字列を取得する。図12の従来の構造
では表記文字列の重複という問題点はかなり解消されて
いるが、個々の異表記に関しては重複する表記文字列デ
ータが残されており、また辞書本体データ中に新たに表
記インデックス本体のオフセットが追加されるためその
分容量が大きくなる。表記インデックス本体のオフセッ
トをO、異表記の件数をM、異表記文字列の平均バイト
数をHとすると、図12の従来の構造では、図3の本発
明の構造よりもN×O+M×(H+1)バイト容量が大き
くなる。逆に、図3の場合では、例えば、O=3、N=
50,000、M=5,000、H=5の場合で180KByteの容量を削
減できることになる。図12の構造では、辞書本体デー
タ中の表記インデックスへのオフセットが容量の上でネ
ックとなるが、これがないと、読みから検索しても表記
が出ないこととなる。
【0024】図3の構造をもつインデックス・データ及
び辞書本体データを作成するための手段の実現例を図5
に示す。まず、図3の辞書本体データ17のもとになる
辞書のソースデータを用意する(ステップS1)。これ
はコンピュータなどに用意されている入力手段7を用い
て、辞書の内容を、各辞書項目の区切り、及び、各辞書
項目内での「読み」、「表記」、「意味」の区切り、が
明確に判別できるようなフォーマットでファイルに書き
込む。
【0025】次に、各辞書項目毎にその「意味と読みと
表記を合わせた文字列のサイズ」、「読み文字列のサイ
ズ」、「表記文字列のサイズ」をそれぞれ算出し(ステ
ップS2)、それらのサイズと「読み」「表記」「意
味」の各文字列を各項目毎に切れ目なしに並べることに
より、図3に示すような辞書本体データ17を得る(ス
テップS3)。辞書本体データ17の項目サイズの累積
和を計算して、各辞書項目と辞書本体データ内でのオフ
セット(先頭からのバイト数)を得、各辞書項目の表記
文字列と計算したオフセットの対応表を作成する(ステ
ップS4)。一方、検索可能なすべての表記文字列の集
合を、異表記辞書項目の表記文字列をその区切り記号の
前後で分解して、個々の各異表記文字列を切り出し、こ
れを表記順に並べる(ステップS5)。表記順に並べら
れた各表記文字列の辞書本体データ内でのオフセットを
ステップ4で作成した対応表から求め、順番を保ったま
ま各オフセットの値を固定長で切れ目なし並べることに
より表記インデックス本体を得る(ステップS6)。
【0026】図6のフローチャート図の処理は、「異表
記項目に対して、どの表記で検索してもその辞書項目に
属するすべての異なる表記をその読み及び意味内容とと
もに表示する」を解決するための検索ロジックを与える
ものである。これは、入力された検索対象文字列がある
異表記辞書項目の1つ表記文字列である場合に、その異
表記辞書項目を辞書本体データから特定できればよいの
で、ここでは「辞書項目特定手段」と名付けている。
【0027】図7のフローチャート図の処理は、「検索
した辞書項目の表記順の前後の辞書項目も表示できるよ
うにする」を同時に解決するための検索ロジックを与え
るものである。これを解決するためには、特定した辞書
項目が表記インデックス本体のどの位置から本来指し示
されるべきものであるかを特定する必要がある。という
のは、図4の具体例でいえば、「あいうち(相打ち・相
撃ち・相討ち)」の辞書項目は(相撃ち)、(相打ち)、(相
討ち)に対応する3カ所の異なる表記インデックスの位
置から指し示されていて、単に辞書項目特定手段で「相
打ち」の辞書項目を特定しただけでは、「相撃ち」に対
応する表記インデックスの位置からその辞書項目を特定
してしまうため、表記インデックスを前後することによ
り「相打ち」の表記順の前後の項目を出そうとしても、
「相撃ち」の前後の項目が出てしまうという問題が起こ
るからである。これを解決するための検索ロジックをこ
こでは「インデックス位置特定手段」と名付けている。
【0028】図6をもとに、辞書項目特定手段の処理に
ついて説明する。この処理は通常行われているように、
インデックスをたどって、入力文字列と一致する辞書項
目を辞書本体データ中から見付け出せばよい。まず、入
力文字列を取り込み(ステップS11)、例えば、入力
文字列の1文字目のコードから表記1次インデックスの
位置(=o1)を計算し(ステップS12)、その位置
にセットされた表記インデックス本体のオフセット(=
o2)を取得すると同時に、表記一次インデックスの次
の位置にセットされた表記インデックス本体のオフセッ
ト(o2nextとする)から、表記一次インデックス
o1がカバーする表記件数Nを計算する(N=(o2n
ext−o2)/オフセットサイズ)。また、o2から
の表記検索の回数カウンタiをクリアしておく(ステッ
プS13)。現在の表記インデックス位置にセットされ
ている辞書本体データのオフセット(=o3)を取得し
(ステップS14)、o3から始まる辞書本体データ中
の辞書項目中からその辞書項目の表記文字の集合Dst
rを求める(ステップS15)。なお、表記文字列は、
「表記」の位置から「表記サイズ」分のデータを読み込
むことにより得られる。辞書項目が異表記辞書項目でな
ければDstrの要素はただ1つで、表記文字列そのも
のである。異表記辞書項目であれば、区切り記号を取り
除いた個々の表記文字列がDstrの各要素となり、要
素個数は複数になる。
【0029】ここで、入力文字列がDstrのいずれか
の要素と一致するならば(ステップS16)、検索成功
でo3からの辞書項目を表示手段により出力装置に表示
すればよい(ステップS17)。一致しなければ、表記
インデックス本体の位置を次の位置にずらしてo2を更
新し(ステップS20)、次の辞書項目の内容を見に行
く(ステップS14〜16)。この動作を入力文字列とD
strの要素とが一致する辞書項目が出現するまで、表
記検索カウンタをインクメントしながら、繰り返す。も
し、カウンタ(i)がNに達すれば(ステップS1
8)、入力文字列に該当する辞書項目はなしということ
で検索を終了する(ステップS19)。辞書項目が特定
された場合はインデックス位置特定手段を呼び出し、表
記順の前後項目の表示要求に備える。
【0030】次に、図7をもとに、インデックス位置特
定手段の処理について説明する。Dstrの要素を表記
順にソートし、入力文字列と一致する表記がj番目にで
てくるならば、現在の表記インデックスのオフセット位
置からあと(j−1)回辞書項目特定手段を繰り返し適
用することにより、本来の表記インデックスの位置を求
める。まず、Dstrの要素数を求め(ステップS2
1)、要素数1すなわち単一表記ならば(ステップS2
2においてYES)、求めるインデックス位置はその時
点のo2であり(ステップS23)、o2を前後するこ
とで表記順の前後の辞書項目へアクセスできる。要素数
2以上の場合は(ステップS22においてNO)、特定
した辞書項目は異表記辞書項目であるから、入力文字列
に対応した本来のインデックス位置を求める必要があ
る。そこで、Dstrの要素を表記順に並べ変え(ステ
ップS24)、ソートした表記文字列の集合の何番目に
入力文字列と一致する表記文字列があるかを調べる(ス
テップS25)。
【0031】j番目の表記文字列が該当する文字列であ
ったとすると(ステップS26においてYES)、はじ
めてインデックス位置特定手段が呼ばれた時点では、す
べての異表記文字列の中で表記順で最も小さい文字列に
対応する表記インデックスの位置から辞書項目が特定さ
れているため、j=1でなければその位置は本来の入力
文字列に対応する位置ではない。その位置以降(j−
1)回目に出現する同一の辞書本体データのオフセット
を示す位置が本来の位置であるということになる。図4
の具体例で説明すると、入力文字列「相打ち」に対して
は、表記インデックス本体のp1の位置で最初に「あい
うち(相打ち・相撃ち・相討ち)」の辞書項目が特定され
る。しかし、p1位置に対応する表記は本来"相撃ち"で
ありこのままでは、「相打ち」の表記順の前後の項目が
出ない。インデックス位置特定手段に従うと、Dstr
をソートしたものは{"相撃ち”,”相打ち”,”相討
ち”}となり、「相打ち」は表記インデックスにおいて
は2度目に出現する「あいうち」へのオフセットがセッ
トされた位置から特定されるべきものであることが分か
る。そこで、p1の次の位置からもう一度辞書項目特定
手段を適用してp2の位置を得れば「相打ち」に対する
本来の表記順の位置が求まる。
【0032】図7の説明に戻ると、辞書項目特定手段の
呼び出し回数のカウンタJを初期値1にセットして(ス
テップS24)、現在の表記インデックス位置の次の位
置から再び辞書項目特定手段を繰り返し適用する。同じ
辞書項目が特定される毎にJをカウントアップし、jと
一致したらループを抜ける(ステップS26〜28)。
その時点のo2の値が特定すべき表記インデックスの位
置となる(ステップS23)。
【0033】図8は本発明の検索結果の表示例であり、
「相撃ち」、「相打ち」、「相討ち」のいずれから検索
しても、同様の検索結果を得る。図9は本発明の入力文
字列の前後の辞書項目の検索結果の表示例であり、「相
撃ち」の前は「相関」であり、「相撃ち」の後は「相
互」である。「相打ち」の前は「相続」であり、「相打
ち」の後は「相対」である。「相討ち」の前は「相等」
であり、「相討ち」の後は「相伴」である。
【0034】次に、図8の表示例であれば、「相撃
ち」、「相打ち」、「相討ち」のいずれから検索して
も、同様の検索結果を得る。このような場合では、検索
対象文字列が「相撃ち」、「相打ち」、「相討ち」のい
ずれから検索したものであるかは分からない。そこで、
図10のように検索対象文字列を特定するように表示し
て、他の漢字表記から検索対象文字列を区別することが
できる。
【0035】異表記辞書項目を検索対象の入力文字列か
ら特定し、辞書本体データ中にセットされたその異表記
辞書項目のすべての異表記文字列を得ることができる。
このプロセスの実現手段は先に詳述した。取得した異表
記文字列のコードから、表示手段9は、各文字に対して
内蔵されたフォントデータを呼び出しながら1文字づつ
ビットマップ・ディスプレイ上にその文字列を表示して
いく。通常、表示手段2には、キャラクタ単位のビット
反転、アンダーライン付け、異種フォント呼び出しなど
の強調表示のための手段が種々用意されているので、表
示の際に、入力文字列と一致する異表記文字列が現れた
ときのみその部分の文字の集合に対して、ビット反転、
アンダーライン付け、異種フォント呼び出しなどの処理
を追加して表示すれば、異表記辞書項目に記載された全
表記文字列を表示しながら、入力文字列として入力され
た文字列だけを強調して表示することができる。強調表
示の仕方は表示手段に応じて様々な方法が考えられる
が、ここではポイントとなるのは、強調表示法そのもの
ではなく、入力文字列と同じ表記のみを何らかの方法で
他の異表記と区別することであり、逆に言えば強調表示
の方法は何でもよいわけである。
【0036】図10において、表示例は1、検索結果の
表記文字列(「相打ち・相撃ち・相討ち」)に対して、
「相撃ち」だけをゴシック体のフォントで表示したもの
を示す。表示例2は、検索結果の表記文字列(「相打ち
・相撃ち・相討ち」)に対して、「相撃ち」だけをビッ
ト反転して表示したものを示す。表示例3は、検索結果
の表記文字列(「相打ち・相撃ち・相討ち」)に対し
て、「相撃ち」だけをアンダーライン処理して表示した
ものを示す。表示例4は、検索結果の表記文字列(「相
打ち・相撃ち・相討ち」)に対して、区切り記号"・"で
各文字列を1たん分解して、「相撃ち」だけを先頭から
表示し、その他を辞書本体データに記載された順に、区
切り記号と共に表示したものを示す。この例では特殊な
表示処理は不要であるが、辞書項目に記載された異表記
の順番を変更するため、ソース辞書とは情報が若干異な
るものとなる。
【0037】図10のような表示によれば、検索対象文
字列が何であったかを他のすべての異なる表記と区別で
きるような形で強調表示(フォント変更、ビット反転、
並べ変えなど)することで、使用者に異表記辞書項目の
情報量をすべて伝え、かつ、混乱をまねくことなく、そ
の項目の持つすべての情報を伝えられるようになり、電
子辞書の使い勝手がよくなる。
【0038】
【発明の効果】本発明によれば、インデックス容量を小
さく押さえられる。この結果、電子辞書装置を実現する
ためのメモリー容量が小さくなり、その分だけコストダ
ウンにつながる。また、異なる表記をもつ辞書項目に対
して、どの表記から検索してもその辞書項目の内容を異
なる他の表記とともに表示でき、かつ、検索した辞書項
目の表記順の前・後の辞書項目も表示できるようにな
る。このことにより、表記検索したときの情報量が増
え、電子辞書装置の検索機能が充実したものとなる更
に、インデックス・データの作成手段により作成された
表記インデックスの構造は、表記文字列をその中には含
まないデータ構造となっているため、通常の、表記イン
デックスのようにすべての異なる表記を別々に用意して
おく場合に比べて、大幅にメモリー容量を削減するよう
に作用する。
【図面の簡単な説明】
【図1】本発明の機器構成図である。
【図2】本発明のブロック図である。
【図3】本発明のインデックス・データ及び辞書本体デ
ータの構造例を示す図である。
【図4】本発明のインデックス・データ及び辞書本体デ
ータの具体例を示す図である。
【図5】本発明のインデックス・データ及び辞書本体デ
ータの作成に係るフローチャート図である。
【図6】本発明の辞書項目特定手段の処理のフローチャ
ート図である。
【図7】本発明のインデックス位置特定手段の処理のフ
ローチャート図である。
【図8】本発明の検索結果の表示例を示す図である。
【図9】本発明の入力文字列の前後の辞書項目の検索結
果の表示例を示す図である。
【図10】入力文字列が「相撃ち」の場合の検索結果の
表示例を示す図である。
【図11】従来のインデックス・データ及び辞書本体デ
ータの作成に係るフローチャート図である。
【図12】従来のインデックス・データ及び辞書本体デ
ータの作成に係るフローチャート図である。
【符号の説明】 1 CPU 2 Memory 3 入力I/F 4 入力装置 5 出力I/F 6 出力装置 7 入力手段 8 記憶手段 9 表示手段 10 インデックス・データ作成手段 11 検索手段 12 読み検索手段 13 表記検索手段 14 辞書項目特定手段 15 インデックス位置特定手段
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.6,DB名) G06F 17/30 G06F 17/22 G06F 17/28 JICSTファイル(JOIS)

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】 読みと、意味と、同一の読み及び意味を
    持つ複数の漢字表記とを一塊のデータとして、読み順に
    記憶する辞書記憶手段と、 各漢字表記に対応した前記辞書記憶手段への検索用イン
    デックスを表記順に記憶するインデックス記憶手段と、 検索対象文字列を入力する入力手段と、 前記検索対象文字列に対応する検索用インデックスを決
    定する決定手段と、 前記決定された検索用インデックスにて、前記辞書記憶
    手段を検索して、前記検索対象文字列と同一の漢字表記
    を備えるデータから、読み、意味及び異表記を含む漢字
    表記を表示する異表記表示手段と、 前記決定された検索用インデックスの前後に記憶された
    検索用インデックスにて、前記辞書記憶手段を検索し
    て、前記検索対象文字列の表記順の前後にある文字列を
    表示する表記順表示手段とを具備することを特徴とする
    電子化辞書検索装置。
  2. 【請求項2】 前記インデックス記憶手段は、表記1次
    インデックス記憶部と表記インデックス記憶部とから構
    成され、前記表記1次インデックス記憶部は一漢字毎
    に、該漢字から始まる文字列の前記表記インデックス記
    憶部への検索用インデックスを記憶し、前記表記インデ
    ックス記憶部は前記辞書記憶手段への検索用インデック
    スを記憶することを特徴とする請求項1記載の電子化辞
    書検索装置。
JP6118763A 1994-05-31 1994-05-31 電子化辞書検索装置 Expired - Fee Related JP2975529B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6118763A JP2975529B2 (ja) 1994-05-31 1994-05-31 電子化辞書検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6118763A JP2975529B2 (ja) 1994-05-31 1994-05-31 電子化辞書検索装置

Publications (2)

Publication Number Publication Date
JPH07325844A JPH07325844A (ja) 1995-12-12
JP2975529B2 true JP2975529B2 (ja) 1999-11-10

Family

ID=14744466

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6118763A Expired - Fee Related JP2975529B2 (ja) 1994-05-31 1994-05-31 電子化辞書検索装置

Country Status (1)

Country Link
JP (1) JP2975529B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8041557B2 (en) * 2005-02-24 2011-10-18 Fuji Xerox Co., Ltd. Word translation device, translation method, and computer readable medium

Also Published As

Publication number Publication date
JPH07325844A (ja) 1995-12-12

Similar Documents

Publication Publication Date Title
US5099426A (en) Method for use of morphological information to cross reference keywords used for information retrieval
US5805911A (en) Word prediction system
US4903206A (en) Spelling error correcting system
JPH0525138B2 (ja)
JP3003915B2 (ja) 単語辞書検索装置
EP0241717A2 (en) Linguistic analysis method and apparatus
JP2975529B2 (ja) 電子化辞書検索装置
JPH1153381A (ja) 類似文書検索装置および類似文書検索方法
JP3187671B2 (ja) 電子辞書表示装置
JP3902825B2 (ja) 文書検索システムおよび方法
JPH03118661A (ja) 単語検索装置
JP3045886B2 (ja) 手書き入力機能付き文字処理装置
JPH05158995A (ja) 文書処理装置
JPH0785236B2 (ja) 文字データ入力装置
JP3273778B2 (ja) 仮名漢字変換装置及び仮名漢字変換方法
JP3342028B2 (ja) かな漢字変換装置
JP2864418B2 (ja) 文書処理装置
JP3272536B2 (ja) 仮名漢字変換方法
JPH0991304A (ja) 情報検索方法、情報検索システム及び情報検索用記憶媒体
JPH0623973B2 (ja) 文字処理装置の頻度変更方式
JPH04120656A (ja) 文書処理装置
JPH0351958A (ja) 電子辞書
JPH05135112A (ja) 情報処理装置
JPH0863487A (ja) 文書検索方法及び文書検索装置
JPH0434645A (ja) 文書検索装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees