JPH02293967A - 単語辞書検索装置 - Google Patents

単語辞書検索装置

Info

Publication number
JPH02293967A
JPH02293967A JP1114081A JP11408189A JPH02293967A JP H02293967 A JPH02293967 A JP H02293967A JP 1114081 A JP1114081 A JP 1114081A JP 11408189 A JP11408189 A JP 11408189A JP H02293967 A JPH02293967 A JP H02293967A
Authority
JP
Japan
Prior art keywords
word
dictionary
character
section
word dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP1114081A
Other languages
English (en)
Other versions
JP2810893B2 (ja
Inventor
Mamoru Okada
守 岡田
Toshiyuki Yoshida
敏之 吉田
Sueshige Harada
季栄 原田
Atsuko Kurihara
栗原 敦子
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
N T T DATA TSUSHIN KK
NTT Data Group Corp
Original Assignee
N T T DATA TSUSHIN KK
NTT Data Communications Systems Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by N T T DATA TSUSHIN KK, NTT Data Communications Systems Corp filed Critical N T T DATA TSUSHIN KK
Priority to JP1114081A priority Critical patent/JP2810893B2/ja
Publication of JPH02293967A publication Critical patent/JPH02293967A/ja
Application granted granted Critical
Publication of JP2810893B2 publication Critical patent/JP2810893B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Character Discrimination (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は、文字認識装置からの出力として得られる認識
候補文字から正解文字を推定するため、認識候補文字を
検索キーとして単語辞書から該当単語を検索する単語辞
書検索装置に関するものである。
[従来の技術] 文字認識装置は、一つの文字を認識した場合、複数個の
認識候補文字を出力する。その認識候補文字の中には、
ただ1個の正解文字が含まれるか、もしくは正解文字が
全く含まれないかのいずれかである。すなわち、認識候
補文字の大部分が正解文字ではない。たとえば、一つの
文字に対して16個の認識候補文字を出力する文字認識
装置の場合、少なくとも15個の認識候補文字は正解文
字ではない。また、文字認識装置は形が類似した候補文
字を出力するので、当然のことながら認識候補文字には
単語を形成しない文字が多く含まれる。
このような文字認識装置に対して、従来の単語辞書検索
装置では、各認識候補文字を検索キーデータとして必ず
単語辞書を検索する構成になっていたので、冗長な辞書
検索の回数が増大し、認識候補文字から正解文字を推定
する性能を著しく低下させる大きな原因となっていた。
[発明が解決しようとする課題] 本発明の目的は、冗長な辞書検索の回数を削減し単語の
検索時間を短縮する単語辞書検索装置を提供することに
ある。
[課題を解決するための手段] 上記手段を解決するために、本発明は、文字認識装置、
計算機、及び単語辞書検索装置を備えており、単語辞書
検索装置における単語辞書部は、単語を記憶する第1記
憶部と、使用する全文字に対して、各単語内で出現する
文字位置データを記憶した第2記憶領域とを設け、さら
に第2記憶領域のデータを記憶するテーブルメモリ、辞
書アクセス判定部、単語計数部を備えている。
[作用] 本発明は、上記の手段を利用して文字WLnを行うため
、単語辞書に記憶されている単語を検索する際に、認識
した文字のコードと文字が出現する位置のデータを単語
辞書検索装置に送り、テーブルメモリの内容を参照して
辞書アクセス判定部において辞書を検索するかどうかを
判定する。また、検索した単語の数を単語計数部により
計数して、指定された文字出現位置に認識文字を持つ単
語が無ければ、テーブルメモリの内容を更新し、認識文
字を指定位置に持つ単講が単語辞書に記憶されているか
どうかを検索する前に判定できるようにする。該当する
単語が無いと判定されれば、辞書検索を中止し、これに
よって冗長な辞書検索を削減する。
[実施例] 第1図は本発明の実施例を説明する図であり、1は文字
認識装置、2は計算機、3は単語辞書検索装置、31は
単語辞書部、32は辞書アクセス制御部、33はテーブ
ルメモリ、34はキー情報格納部、35は辞書アクセス
判定部、36はバッファメモリ、37は単語計数部、3
8はインタフエース部である。
第2図は単語辞書部31の構成を示す図であり、311
は管理情報記憶領域、312は単語記憶領域である。
第3図はテーブルメモリ33の構成を説明する図である
掌発明の動作の説明をする前に、まず、テーブルメモリ
33の構成と単語辞書部3lの管理情報記憶領域311
におけるデータ形式について説明する。なお、本実施例
では、説明の都合上、使用する文字コードはJISで規
定される漢字コードとしている。しかし、対象とする文
字コードはJISで規定されたコードに限られることは
なく、他の体系で規定された文字コードでもよいし、ま
た、その部分集合で規定される文字コードでもよい。
テーブルメモリ33は、JISで規定される漢字コード
の数に等しいバイト数の書換え可能なメモリで構成し、
そのアドレスを漢字コードに1対1に対応させる。一方
、単語辞書部31はディスク装置などの大容量記憶装置
で構成され、管理情報記憶領域311はテーブルメモリ
33のアドレスと1対1に対応できるアドレス構成をな
し、単語記憶領域312に記憶されているすべての単語
について出現する文字Mとその出現文字位置Pに応じて
、文字Mに対応するアドレスのPビット目を”ON”状
態とする。
第3図に示すように、「東京都」という単語が単語記憶
領域312に記憶されている場合を例として説明すると
、第1番目の文字位置の「東」に対応するテーブルメモ
リ33のアドレスの第1ビット目を、また第2番目の「
京」に対応するアドレスの第2ビット目を、第3番目の
「都」に対応するアドレスの第3ビット目をそれぞれ″
ON′状態とする。
第4文字目に「都」を持つ単語が単語辞書部に記憶され
ていない場合には、「都」に対応するアドレスの第4ビ
ット目を″OFF”状態とする。
また、単語記憶領域312に新たな単語が記憶される場
合には、管理情報記憶領域311のデータも更新される
ものとする。
以下、動作について説明する。
計算機2は初期設定命令を単語辞書検索装置3に発し、
インタフェース部38が辞書アクセス制御部32に対し
単語辞書部31の管理情報記憶領域311のデータ読み
込みを指示し、辞書アクセス制御部32が該読み込みデ
ータをテーブルメモリ33に書き込む。
次に、計算機2は文字認識装r!llから認識候補文字
を受け取り、ある認識候補文字のコード(Mとする)と
出現文字位置(Pとする)を単語辞書検索装置3に送出
し単語の検索命令を発する。
次に、単語辞書検索装置3が動作する。インタフェース
部38は文字コードMと出現文字位置のデータPを受け
取り、キー情報格納部34に書き込む。辞書アクセス判
定部35はキー情報格納部34から文字コードMと出現
文字位置データPを受け取り、文字コードMに対応する
テーブルメモリ33のアドレスのデータを読み込み、P
ビット目のフラグの状態を調べる。この時、フラグの状
態が”ON”であれば辞書アクセス制御部32に対して
文字コードMと出現文字位置データPを送出し単語の検
索命令を発し、該フラグの状態が”OFF”であれば該
当単語なしの情報をインタフェース部38を介して計算
機2に通知する。
辞書アクセス制御部32は辞書アクセス判定部35から
文字コードMと出現文字位置データPを受け取ると、単
語辞書部31の単語記憶領域312から該当単語を読み
出してバッファメモリ36に書き込む。
次に単語計数部37が動作し、バッファメモリ36に書
き込まれた単語の数を計数し、その結果をインタフェー
ス部38を介して計算機2へ通知する。この時、計数結
果が”0” (すなわち、該当単語なし)の場合には、
キー情報格納部34から文字コードMと出現文字位置デ
ータPを受け取り、MとPで定まるテーブルメモリ33
のフラグを″OFF”状態に書き換える。
計算機2は単語計数部37からの結果を受け取ると、イ
ンタフエース部38を介してバッファメモリ36のデー
タを読み込み、次の検索要求を単語辞書検索装置3に対
して行う。
上記の動作は、計算機2が必要な回数だけ辞書検索を行
ったのち終了命令を発し、辞書アクセス制御部32がテ
ーブルメモリ33のデータを単語辞書部31の管理情報
記憶領域311に書き込んだのち終了する。
上記説明において、初期設定時に、テーブルメモリ33
のすべてのフラグを”ON″に設定し、単語検索の経過
とともに、認識文字のコードと文字出現位置の判定の結
果、該当する単語が発見できなかった場合に、フラグを
”OFF”に書き換えることにより、管理情報記憶領域
311のデータを学習する構成とすることができること
は自明である。
また、テーブルメモリ33の構成は、1単語を構成する
文字数が8文字以内の単語が大部分を占めることから、
1文字コードに対して1バイトを割り当てることとして
いる。しかし、これより長い文字数の単語を取り扱う必
要があれば、必要とするメモリ容量は増加するが、例え
ば最大16文字の単語を処理するために2バイトを割り
当ててテーブルメモリを構成することも可能である。
[発明の効果] 上記の説明から明らかなように、本発明においては、単
語辞書部31に記憶された単語を形成しない文字を検索
キーとする単語検索を排除することができるので、冗長
な辞書検索の回数を大幅に削減し単語検索時間を短縮で
きる。従って、多くの認識候補文字の中から単諧照合に
より正解文字を推定する処理に要する時間を大幅に短縮
できるという利点がある。
単語計数部、 インタフェース部、 ・管理情報記憶領域、 ・単語記憶領域。
【図面の簡単な説明】
第1図は本発明の単語辞書検索装置の実施例の構成を示
す図、第2図は単語辞書部3lの構成を説明する図、第
3図はテーブルメモリ33の構成を説明する図である。

Claims (1)

    【特許請求の範囲】
  1. N個の文字コードからなる集合(C_1、C_2、・・
    ・、C_N)の要素の組合せで形成される単語を検索す
    る単語辞書検索装置において、指定された文字コードC
    i(1≦i≦N)を第m番目(1≦m)の文字として有
    する単語の検索を可能ならしめるように単語を記憶する
    第1の記憶領域と、第1の記憶領域に記憶された単語に
    おいて前記N個の文字コードがどの文字位置に出現する
    かを管理する管理情報を記憶する第2の記憶領域を持つ
    単語辞書部と、単語辞書部のデータ入出力を制御する辞
    書アクセス制御部と、辞書アクセス制御部を介して読み
    出された単語辞書部の第2の記憶領域のデータを記憶す
    るテーブルメモリと、文字コードと該文字コードが出現
    する文字位置情報からなる検索キーデータを記憶するキ
    ー情報格納部と、キー情報格納部に記憶した検索キーデ
    ータでテーブルメモリのデータを参照し、該当単語が単
    語辞書部に記憶されているか否かを判定する辞書アクセ
    ス判定部と、辞書アクセス制御部を介して読み出した単
    語を記憶するバッファメモリと、バッファメモリに記憶
    した単語の個数を計数した結果にもとづいて、キー情報
    格納部に記憶した検索キーデータでテーブルメモリにア
    クセスしテーブルメモリのデータを書き換える単語計数
    部と、外部装置とのデータ入出力を制御するインタフェ
    ース部を有することを特徴とする単語辞書検索装置。
JP1114081A 1989-05-09 1989-05-09 単語辞書検索装置 Expired - Lifetime JP2810893B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1114081A JP2810893B2 (ja) 1989-05-09 1989-05-09 単語辞書検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1114081A JP2810893B2 (ja) 1989-05-09 1989-05-09 単語辞書検索装置

Publications (2)

Publication Number Publication Date
JPH02293967A true JPH02293967A (ja) 1990-12-05
JP2810893B2 JP2810893B2 (ja) 1998-10-15

Family

ID=14628591

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1114081A Expired - Lifetime JP2810893B2 (ja) 1989-05-09 1989-05-09 単語辞書検索装置

Country Status (1)

Country Link
JP (1) JP2810893B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003026856A1 (fr) * 2001-09-20 2003-04-03 Matsushita Electric Industrial Co., Ltd. Procede de production d'un composant electronique ceramique lamine et appareil electronique
JP2006099677A (ja) * 2004-09-30 2006-04-13 Casio Comput Co Ltd 情報表示制御装置、サーバ及びプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003026856A1 (fr) * 2001-09-20 2003-04-03 Matsushita Electric Industrial Co., Ltd. Procede de production d'un composant electronique ceramique lamine et appareil electronique
JP2006099677A (ja) * 2004-09-30 2006-04-13 Casio Comput Co Ltd 情報表示制御装置、サーバ及びプログラム

Also Published As

Publication number Publication date
JP2810893B2 (ja) 1998-10-15

Similar Documents

Publication Publication Date Title
US5418949A (en) Page map, metamap, and relation group file management supervised by operation means for allocating, storing, and searching friendly and exclusive data items
US7231383B2 (en) Search engine for large-width data
JPH1063578A (ja) 情報記録再生装置
US4059850A (en) Memory system word group priority device with least-recently used criterion
EP0121072A2 (en) Method for accessing a data set in a word processing system
WO2011049051A1 (ja) キャッシュメモリおよびその制御方法
US7032093B1 (en) On-demand allocation of physical storage for virtual volumes using a zero logical disk
US6662287B1 (en) Fast free memory address controller
CN114201648A (zh) 用于高效扩展键值哈希表的系统及方法
US5519860A (en) Central processor index sort followed by direct record sort and write by an intelligent control unit
US6678816B2 (en) Method for optimized representation of page table entries
JP2810893B2 (ja) 単語辞書検索装置
US6742077B1 (en) System for accessing a memory comprising interleaved memory modules having different capacities
JPH06103128A (ja) 記憶装置
JP2665180B2 (ja) ディスクキャッシュバッファの確保方式
JPH07105092A (ja) 記憶装置
JPH06139147A (ja) キャッシュメモリシステム
JP3359934B2 (ja) データ記憶装置
JPS58146946A (ja) リストメモリ
JP2638777B2 (ja) かな漢字変換装置
JPH0394325A (ja) データ処理装置
JPH05204757A (ja) キャッシュメモリ
JPS625728Y2 (ja)
KR970029104A (ko) 그룹 적응형 세그먼트 캐시버퍼 구현방법
JPH06195381A (ja) データ検索装置

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080807

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080807

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090807

Year of fee payment: 11

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090807

Year of fee payment: 11