JPH02293967A - 単語辞書検索装置 - Google Patents
単語辞書検索装置Info
- Publication number
- JPH02293967A JPH02293967A JP1114081A JP11408189A JPH02293967A JP H02293967 A JPH02293967 A JP H02293967A JP 1114081 A JP1114081 A JP 1114081A JP 11408189 A JP11408189 A JP 11408189A JP H02293967 A JPH02293967 A JP H02293967A
- Authority
- JP
- Japan
- Prior art keywords
- word
- dictionary
- character
- section
- word dictionary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000010586 diagram Methods 0.000 description 6
- 238000000034 method Methods 0.000 description 2
- 230000007423 decrease Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Character Discrimination (AREA)
- Document Processing Apparatus (AREA)
Abstract
め要約のデータは記録されません。
Description
候補文字から正解文字を推定するため、認識候補文字を
検索キーとして単語辞書から該当単語を検索する単語辞
書検索装置に関するものである。
認識候補文字を出力する。その認識候補文字の中には、
ただ1個の正解文字が含まれるか、もしくは正解文字が
全く含まれないかのいずれかである。すなわち、認識候
補文字の大部分が正解文字ではない。たとえば、一つの
文字に対して16個の認識候補文字を出力する文字認識
装置の場合、少なくとも15個の認識候補文字は正解文
字ではない。また、文字認識装置は形が類似した候補文
字を出力するので、当然のことながら認識候補文字には
単語を形成しない文字が多く含まれる。
装置では、各認識候補文字を検索キーデータとして必ず
単語辞書を検索する構成になっていたので、冗長な辞書
検索の回数が増大し、認識候補文字から正解文字を推定
する性能を著しく低下させる大きな原因となっていた。
検索時間を短縮する単語辞書検索装置を提供することに
ある。
計算機、及び単語辞書検索装置を備えており、単語辞書
検索装置における単語辞書部は、単語を記憶する第1記
憶部と、使用する全文字に対して、各単語内で出現する
文字位置データを記憶した第2記憶領域とを設け、さら
に第2記憶領域のデータを記憶するテーブルメモリ、辞
書アクセス判定部、単語計数部を備えている。
、単語辞書に記憶されている単語を検索する際に、認識
した文字のコードと文字が出現する位置のデータを単語
辞書検索装置に送り、テーブルメモリの内容を参照して
辞書アクセス判定部において辞書を検索するかどうかを
判定する。また、検索した単語の数を単語計数部により
計数して、指定された文字出現位置に認識文字を持つ単
語が無ければ、テーブルメモリの内容を更新し、認識文
字を指定位置に持つ単講が単語辞書に記憶されているか
どうかを検索する前に判定できるようにする。該当する
単語が無いと判定されれば、辞書検索を中止し、これに
よって冗長な辞書検索を削減する。
認識装置、2は計算機、3は単語辞書検索装置、31は
単語辞書部、32は辞書アクセス制御部、33はテーブ
ルメモリ、34はキー情報格納部、35は辞書アクセス
判定部、36はバッファメモリ、37は単語計数部、3
8はインタフエース部である。
は管理情報記憶領域、312は単語記憶領域である。
。
33の構成と単語辞書部3lの管理情報記憶領域311
におけるデータ形式について説明する。なお、本実施例
では、説明の都合上、使用する文字コードはJISで規
定される漢字コードとしている。しかし、対象とする文
字コードはJISで規定されたコードに限られることは
なく、他の体系で規定された文字コードでもよいし、ま
た、その部分集合で規定される文字コードでもよい。
の数に等しいバイト数の書換え可能なメモリで構成し、
そのアドレスを漢字コードに1対1に対応させる。一方
、単語辞書部31はディスク装置などの大容量記憶装置
で構成され、管理情報記憶領域311はテーブルメモリ
33のアドレスと1対1に対応できるアドレス構成をな
し、単語記憶領域312に記憶されているすべての単語
について出現する文字Mとその出現文字位置Pに応じて
、文字Mに対応するアドレスのPビット目を”ON”状
態とする。
領域312に記憶されている場合を例として説明すると
、第1番目の文字位置の「東」に対応するテーブルメモ
リ33のアドレスの第1ビット目を、また第2番目の「
京」に対応するアドレスの第2ビット目を、第3番目の
「都」に対応するアドレスの第3ビット目をそれぞれ″
ON′状態とする。
ていない場合には、「都」に対応するアドレスの第4ビ
ット目を″OFF”状態とする。
合には、管理情報記憶領域311のデータも更新される
ものとする。
インタフェース部38が辞書アクセス制御部32に対し
単語辞書部31の管理情報記憶領域311のデータ読み
込みを指示し、辞書アクセス制御部32が該読み込みデ
ータをテーブルメモリ33に書き込む。
を受け取り、ある認識候補文字のコード(Mとする)と
出現文字位置(Pとする)を単語辞書検索装置3に送出
し単語の検索命令を発する。
部38は文字コードMと出現文字位置のデータPを受け
取り、キー情報格納部34に書き込む。辞書アクセス判
定部35はキー情報格納部34から文字コードMと出現
文字位置データPを受け取り、文字コードMに対応する
テーブルメモリ33のアドレスのデータを読み込み、P
ビット目のフラグの状態を調べる。この時、フラグの状
態が”ON”であれば辞書アクセス制御部32に対して
文字コードMと出現文字位置データPを送出し単語の検
索命令を発し、該フラグの状態が”OFF”であれば該
当単語なしの情報をインタフェース部38を介して計算
機2に通知する。
文字コードMと出現文字位置データPを受け取ると、単
語辞書部31の単語記憶領域312から該当単語を読み
出してバッファメモリ36に書き込む。
き込まれた単語の数を計数し、その結果をインタフェー
ス部38を介して計算機2へ通知する。この時、計数結
果が”0” (すなわち、該当単語なし)の場合には、
キー情報格納部34から文字コードMと出現文字位置デ
ータPを受け取り、MとPで定まるテーブルメモリ33
のフラグを″OFF”状態に書き換える。
ンタフエース部38を介してバッファメモリ36のデー
タを読み込み、次の検索要求を単語辞書検索装置3に対
して行う。
ったのち終了命令を発し、辞書アクセス制御部32がテ
ーブルメモリ33のデータを単語辞書部31の管理情報
記憶領域311に書き込んだのち終了する。
のすべてのフラグを”ON″に設定し、単語検索の経過
とともに、認識文字のコードと文字出現位置の判定の結
果、該当する単語が発見できなかった場合に、フラグを
”OFF”に書き換えることにより、管理情報記憶領域
311のデータを学習する構成とすることができること
は自明である。
文字数が8文字以内の単語が大部分を占めることから、
1文字コードに対して1バイトを割り当てることとして
いる。しかし、これより長い文字数の単語を取り扱う必
要があれば、必要とするメモリ容量は増加するが、例え
ば最大16文字の単語を処理するために2バイトを割り
当ててテーブルメモリを構成することも可能である。
語辞書部31に記憶された単語を形成しない文字を検索
キーとする単語検索を排除することができるので、冗長
な辞書検索の回数を大幅に削減し単語検索時間を短縮で
きる。従って、多くの認識候補文字の中から単諧照合に
より正解文字を推定する処理に要する時間を大幅に短縮
できるという利点がある。
す図、第2図は単語辞書部3lの構成を説明する図、第
3図はテーブルメモリ33の構成を説明する図である。
Claims (1)
- N個の文字コードからなる集合(C_1、C_2、・・
・、C_N)の要素の組合せで形成される単語を検索す
る単語辞書検索装置において、指定された文字コードC
i(1≦i≦N)を第m番目(1≦m)の文字として有
する単語の検索を可能ならしめるように単語を記憶する
第1の記憶領域と、第1の記憶領域に記憶された単語に
おいて前記N個の文字コードがどの文字位置に出現する
かを管理する管理情報を記憶する第2の記憶領域を持つ
単語辞書部と、単語辞書部のデータ入出力を制御する辞
書アクセス制御部と、辞書アクセス制御部を介して読み
出された単語辞書部の第2の記憶領域のデータを記憶す
るテーブルメモリと、文字コードと該文字コードが出現
する文字位置情報からなる検索キーデータを記憶するキ
ー情報格納部と、キー情報格納部に記憶した検索キーデ
ータでテーブルメモリのデータを参照し、該当単語が単
語辞書部に記憶されているか否かを判定する辞書アクセ
ス判定部と、辞書アクセス制御部を介して読み出した単
語を記憶するバッファメモリと、バッファメモリに記憶
した単語の個数を計数した結果にもとづいて、キー情報
格納部に記憶した検索キーデータでテーブルメモリにア
クセスしテーブルメモリのデータを書き換える単語計数
部と、外部装置とのデータ入出力を制御するインタフェ
ース部を有することを特徴とする単語辞書検索装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1114081A JP2810893B2 (ja) | 1989-05-09 | 1989-05-09 | 単語辞書検索装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1114081A JP2810893B2 (ja) | 1989-05-09 | 1989-05-09 | 単語辞書検索装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH02293967A true JPH02293967A (ja) | 1990-12-05 |
JP2810893B2 JP2810893B2 (ja) | 1998-10-15 |
Family
ID=14628591
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP1114081A Expired - Lifetime JP2810893B2 (ja) | 1989-05-09 | 1989-05-09 | 単語辞書検索装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2810893B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2003026856A1 (fr) * | 2001-09-20 | 2003-04-03 | Matsushita Electric Industrial Co., Ltd. | Procede de production d'un composant electronique ceramique lamine et appareil electronique |
JP2006099677A (ja) * | 2004-09-30 | 2006-04-13 | Casio Comput Co Ltd | 情報表示制御装置、サーバ及びプログラム |
-
1989
- 1989-05-09 JP JP1114081A patent/JP2810893B2/ja not_active Expired - Lifetime
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2003026856A1 (fr) * | 2001-09-20 | 2003-04-03 | Matsushita Electric Industrial Co., Ltd. | Procede de production d'un composant electronique ceramique lamine et appareil electronique |
JP2006099677A (ja) * | 2004-09-30 | 2006-04-13 | Casio Comput Co Ltd | 情報表示制御装置、サーバ及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP2810893B2 (ja) | 1998-10-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5418949A (en) | Page map, metamap, and relation group file management supervised by operation means for allocating, storing, and searching friendly and exclusive data items | |
US7231383B2 (en) | Search engine for large-width data | |
JPH1063578A (ja) | 情報記録再生装置 | |
US4059850A (en) | Memory system word group priority device with least-recently used criterion | |
EP0121072A2 (en) | Method for accessing a data set in a word processing system | |
WO2011049051A1 (ja) | キャッシュメモリおよびその制御方法 | |
US7032093B1 (en) | On-demand allocation of physical storage for virtual volumes using a zero logical disk | |
US6662287B1 (en) | Fast free memory address controller | |
CN114201648A (zh) | 用于高效扩展键值哈希表的系统及方法 | |
US5519860A (en) | Central processor index sort followed by direct record sort and write by an intelligent control unit | |
US6678816B2 (en) | Method for optimized representation of page table entries | |
JP2810893B2 (ja) | 単語辞書検索装置 | |
US6742077B1 (en) | System for accessing a memory comprising interleaved memory modules having different capacities | |
JPH06103128A (ja) | 記憶装置 | |
JP2665180B2 (ja) | ディスクキャッシュバッファの確保方式 | |
JPH07105092A (ja) | 記憶装置 | |
JPH06139147A (ja) | キャッシュメモリシステム | |
JP3359934B2 (ja) | データ記憶装置 | |
JPS58146946A (ja) | リストメモリ | |
JP2638777B2 (ja) | かな漢字変換装置 | |
JPH0394325A (ja) | データ処理装置 | |
JPH05204757A (ja) | キャッシュメモリ | |
JPS625728Y2 (ja) | ||
KR970029104A (ko) | 그룹 적응형 세그먼트 캐시버퍼 구현방법 | |
JPH06195381A (ja) | データ検索装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080807 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080807 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090807 Year of fee payment: 11 |
|
EXPY | Cancellation because of completion of term | ||
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090807 Year of fee payment: 11 |