JP3073208B2 - データ選出装置 - Google Patents

データ選出装置

Info

Publication number
JP3073208B2
JP3073208B2 JP01230418A JP23041889A JP3073208B2 JP 3073208 B2 JP3073208 B2 JP 3073208B2 JP 01230418 A JP01230418 A JP 01230418A JP 23041889 A JP23041889 A JP 23041889A JP 3073208 B2 JP3073208 B2 JP 3073208B2
Authority
JP
Japan
Prior art keywords
data
output
input
result
sort
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP01230418A
Other languages
English (en)
Other versions
JPH0394325A (ja
Inventor
敏明 矢ケ崎
修五郎 上野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP01230418A priority Critical patent/JP3073208B2/ja
Publication of JPH0394325A publication Critical patent/JPH0394325A/ja
Priority to US08/460,836 priority patent/US5542091A/en
Application granted granted Critical
Publication of JP3073208B2 publication Critical patent/JP3073208B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F7/00Methods or arrangements for processing data by operating upon the order or content of the data handled
    • G06F7/22Arrangements for sorting or merging computer data on continuous record carriers, e.g. tape, drum, disc
    • G06F7/24Sorting, i.e. extracting data from one or more carriers, rearranging the data in numerical or other ordered sequence, and rerecording the sorted data on the original carrier or on a different carrier or set of carriers sorting methods in general

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Character Discrimination (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明はデータ処理装置、例えば文字認識装置等にお
いて識別演算処理のあとに候補データとして複数のデー
タを高速に選出するデータ処理装置に関するものであ
る。
[従来の技術] 従来、データ選出装置を備えるこの種の装置、つまり
文字認識装置等において、演算処理のあとの候補データ
の選出のためのソーテイングの方法としては次のような
方法が知られている。
入力された全てのデータのレンジに相当するアドレス
幅をもつメモリ空間が用意され、算出された結果をアド
レスとしてこのメモリ空間をアクセスする。このアクセ
スされたアドレスに、算出結果の識別子、例えば文字の
場合にはJISコード等を格納する。すべての演算が終了
した時点で、小さい順の場合(昇順)にはアドレスの小
さいほうから、大きい順の場合(降順)にはアドレスの
大きいほうから、格納されている識別子を出力する。
ここで、候補データ選出の一例として、第3図(a)
に従来の文字認識装置の識別部の構成を示す。辞書200
には入力データ201に対して参照されるデータとJISコー
ドなどの識別子が入つている。ここで、入力データ201
が入力されると辞書200にアクセスがかかり、データ202
とJISコード203が出力される。データ201と202とは演算
部204で計算されたあとアドレスバス207に、JISコード2
03はデータバス208に入り、メモリ206がアクセスされ
て、演算部204の計算結果をアドレスとしてJISコード20
3が書き込まれる。このときのメモリの構成が第3図
(b)であり、データ部にJISコードが入る。
[発明が解決しようとしている課題] しかしながら、前述従来例によると、識別演算された
結果が同一の数値データとして出力された場合にオーバ
ーライトされてしまい、前の識別子が消去されてしま
う。一方、一度書き込まれた場合にオーバーライトしな
いような構成にすると、書き込もうとするデータが消滅
してしまう。
又、一度データが書き込まれた場合には隣接するアド
レスをアクセスしてデータを書き込むようにしても、構
成が複雑になるし演算結果とアドレスが一対一に対応し
なくなる。
又、メモリのすべてのアドレス空間をアクセスしなけ
ればならず、つまりデータの書き込まれていない部分の
アクセスをも必要とするので、かなりのアクセスが意味
のないものとなる。
又、算術演算結果のデータの範囲を予め知つておく必
要があり、その範囲内のアドレス空間が必要となるた
め、かなり大規模なRAMが必要となる。もちろん、その
為のコスト、あるいはテープを使用する場合はテープの
サイズが大きくなつて、高速性などにも問題が生じる。
又、データの並びにおいて昇順及び降順でデータを読
み出す場合には、アドレスのデクリメント、インクリメ
ント等を制御する必要も生じてくる。
又、識別子しか読み出すことができず、該識別子にお
けるデータの読み出し(この場合アドレスが対応)がで
きない。特に前述文字認識等へのアプリケーシヨンにお
いては、前述演算結果に基づいてリジユクト処理を行な
う場合があるが、このようなときに対応することができ
ない。
本発明は、前記従来の欠点を除去し、データの数も幅
も抑えて大規模な記憶部を必要とせずに、簡単な構成で
処理効率良くデータを選択して並べ変えるデータ処理装
置を提供する。
[課題を解決するための手段] この課題を解決するために、本発明のデータ処理装置
は、複数個のデータより、各データに対応する演算結果
が所望のソート順で上位となる所定個数のデータを選択
して出力するデータ処理装置であって、前記所定個数の
データについて演算結果と識別子とを記憶するための記
憶手段と、前記記憶手段に、前記所定個数の各データに
対応する演算結果の初期値として、閾値を書き込む初期
化手段と、第1及び第2の入力を比較して、前記ソート
順で下位となる値を第1の出力とし、前記ソート順で上
位となる値を第2の出力として出力する比較手段と、前
記比較手段に対して、新たに獲得した演算結果を最初の
第1の入力とし、以下、順次第1の出力を次の第1の入
力として入力し、前記記憶手段の先頭アドレスのデータ
に対応する演算結果を最初の第2の入力とし、以下、前
記記憶手段の各アドレスのデータに対応する演算結果を
第2の入力として順次入力し、当該各アドレスに第2の
出力を順次記憶させることによって、前記新たに獲得し
た演算結果を持つデータと既に前記記憶手段に記憶され
たデータとを各データの演算結果の前記ソート順で前記
記憶手段に記憶させる第1のソート制御手段と、前記第
1のソート制御手段の制御動作を、獲得される各演算結
果について繰り返すことによって、前記複数個のデータ
に対する前記所望のソートの結果を前記記憶手段に記憶
させる第2のソート制御手段と、前記第2のソート制御
手段の動作終了時に前記記憶手段に記憶されているデー
タから、前記閾値とその識別データとを無効とし、それ
以外のデータをソート結果として出力する出力手段とを
有することを特徴とする。
ここで、前記記憶手段は、実施例のRAM108,109,120に
相当する。
[実施例] 以下、添付図面に従つて、実施例を詳細に説明する。
まず、本実施例の原理を説明する。本実施例のデータ
選出装置は、算術演算器の出力に大・小を比較すること
ができる比較器を有し、該比較器の結果に基づいて出力
データの切り換えをするセレクタ、さらに該結果を格納
するRAMより構成される。
第一回目の入力データの算術演算実行時に、昇順,降
順,符号付,符号なし等の条件に従い、上記RAMのイニ
シヤライズを実行する。つまり、昇順(小さい順)符号
付の場合にはメモリの中をすべて7FFFH(16ビツトのと
き)にし、符号なしのときはFFFFH(16ビツトのとき)
のデータがRAMに格納される。同様に降順(大きい順)
のときは、符号付で8000H符号なしで0000Hが格納される
ような構成になつている。これは、算術演算器から出力
される最大値/最小値であり、データが同じときは演算
結果の出力が格納されるようになつているため、RAMの
内容はすべて入れ換れることになつている。さらに、出
力として必要なだけのRAM領域だけ確保すればよく、サ
イズも大きな容量のものを用いなくてよい。
さらに、算術演算器の出力としてオーバーフローある
いはアンダーフローが生じた場合には、オーバーフロー
のときは最大値、アンダーフローのときは最大値が出力
され、データの幅をおさえている。これは、このレンジ
を越えるデータ値は、前述文字認識装置のようなアプリ
ケーシヨンにおいてリジユクトの対象になるため値とし
て意味をもたないことにより、最小値,最大値の代用を
行ない、データ幅を小さくすることができる。
又、データ出力として最大値,最小値の値を無効にし
たりして、それ以外のデータ出力を許可することで後続
の処理の適用化もはかれる。但し、この場合文字認識に
おいては以下の表のような点を特に考えなければならな
い。データは算術演算結果とその識別子とからなる。
ここで、無効は結果としては意味をもたないが識別子
としては有効になるために、後続の処理に可能という意
味であり、リジエクトは後続の処理で対象にしてはいけ
ないことを表わしている。
第1図(b)は本実施例のデータ選出装置を識別回路
15,ソーテイング部16として使用している文字認識装置
の構成図である。図中、スキヤナ11はイメージデータ
(文章等)を入力するものであり、イメージデータはス
キヤナ・インタフエース12を介してコントロールバスか
らイメージメモリ13に格納される。このイメージメモリ
13に格納されたイメージは、1文字ずつCPUボード14に
よつて切り出され、識別回路15に渡される。この識別回
路15からは識別子と演算結果がソーテイング部16に出力
される。ソーテイング部16においてソーテイング処理が
実行される。さらに該ソーテイング部16の結果は識別回
路17とソーテイング部18において実行されることもでき
る。ここで、第1の識別回路15を大分類といい、第2の
識別回路17を詳細分類という。もちろん、ソーテイング
部16の出力を最終出力としても問題はない。
第1図(a)は本実施例のデータ選出装置の構成を示
すブロツク図である。以下、これについて述べていく。
ここで太枠の部分が識別回路15に対応するもので細枠の
部分がソーテイング部16に対応する。100は上記識別回
路に使用される辞書ROMで4個使用している例である。
該辞書ROM100からの参照データは本データ選出装置で選
択され並べ変えられるデータであり、16ビットカウンタ
からの出力をアドレスとして順に読出され、ラツチを経
て、算術演算器101に入力されている。一方の入力デー
タは特徴データ、文字認識であれば入力文字の特徴デー
タであり、特徴RAM50の中にアドレスバスRAMA,データバ
スRAMDを経て、CPUにより該算術演算器101が動作する前
に格納される。この時には、CPUよりの信号SEL1により
特徴RAM50への書き込みが選択される。該データが格納
されると外部のスタート(START)信号により起動され
て、算術演算器101が動作しはじめる。
この演算結果、例えば参照データと特徴データの2乗
平均距離(文字認識では、小さい方が類似文字)はラツ
チ103に出力され、ラツチ103の出力は、1出力ごとにイ
ンクリメントされるラツチ/カウンタ102の出力ととも
に、セレクタ104,105に入力される。ここで、本例で
は、算術演算器101は前述のように、演算結果が最大値
以上になった(オバーフローした)場合は、最大値に置
き換えて演算結果として出力する。又、ラツチ/カウン
タ102の出力はROM100から順に読出される参照データを
特定する番号である。該セレクタ104,105からの出力の
うち、算術データの結果のみがコンパレータ106に入力
される。セレクタ104,105の出力は、演算結果の入力時
はそれぞれラツチ103、ラッチ/カウンタ102からの入力
が選択され、RAM108,109からのデータとの比較による並
べ変えの間は、それぞれセレクタ110、111からの入力が
選択されるように、ソートコントロールが制御する。一
方、ソートコントロールからのintl信号により、ラツチ
107からは、スタート時の最初の演算時に、イニシヤル
・データとして前述のモードに従つた値、例えば符号な
しの昇順の場合は全てのビットがONの最大値がRAM108,1
09に格納される。このとき、識別子は未知である。
ここで、RAM108,109は読み取り用と書き込み用にわか
れており、1回の算術演算ごとに切り換わる。例えば、
第1回目の演算結果については、RAM108から順に読み出
されたデータと比較されて、比較の結果に対応するいず
れかのデータがRAM109に書き込まれる。第2回目につい
ては、RAM109から順に読出され、比較の結果に対応する
いずれかのデータがRAM108に書き込まれる。この切り替
えは、ソートコントロールからのwrcl,recl信号により
制御される。さらに、RAM108又は109への書き込みと同
時に、RAM120には1回ごとの演算及び比較結果が格納さ
れる。
<特徴データと最初の参照データとの演算比較処理> まず、第1回目の演算終了時には、コンパレータ106
に入力された演算結果は、イニシヤライズされたRAM108
の先頭アドレスより読み出され、コンパレータ106のも
うひとつの入力に入るデータ、この例では全ビットONの
最大値と比較される。このとき、上記セレクタ104から
の演算結果とRAM108からの出力はそれぞれセレクタ110,
112に入り、セレクタ110,112からの出力はコンパレータ
106の結果に応じて異なつたデータとなる。つまり、本
例のような昇順の場合は、コンパレータ106からの比較
結果の信号によって、セレクタ110の出力は上記コンパ
レータ106に入力された大きい方のデータであり、セレ
クタ104に入力され、次の比較のためにコンパレータ106
に入力されることになる。同じ比較結果の信号が入力さ
れるセレクタ112の出力は上記コンパレータ106に入力さ
れた小さい方のデータであつて、これがRAM109及びRAM1
20の先頭アドレスに格納される。一方、これと同時にセ
レクタ111,113には識別子(ラッチ/カウンタ102の出
力)が入力され、上記同じ動作で大きいデータに対応す
る識別子はセレクタ105に入力され、小さい方のデータ
の識別子はRAM109及びRAM120にデータと共に格納され
る。尚、前述のように比較結果が等しい場合は入れ替え
るよう動作するが、説明が煩雑になるので、大小がある
として以下説明する。
次に、RAM108の次のアドレスからデータが読出され、
セレクタ104からの先の比較で大きかったデータと比較
される。そして、上記同様の動作により、小さい方のデ
ータがRAM109及びRAM120の次のアドレスに格納され、大
きい方のデータがセレクタ104に入力されて、更につぎ
のデータと比較される。
この比較とRAM109及び120への書き込みを、RAM108の
最終アドレスまで繰返すと、最初の演算結果による並び
変えが終了する。この場合に、第1回目の演算結果が、
RAM109及びRAM120の先頭アドレスに格納されることにな
る。
<特徴データと2番目の参照データとの演算比較処理> ROM100から2番目の参照データが読出されて、算術演
算器101で特徴RAM50からの同じ特徴データと演算され
て、ラッチ103を介してセレクタ104に入力される。この
時に、ラッチ/カウンタ102からの識別子が変更され
る。以下1回目と同様に比較と書き込みが、今度はRAM1
09から読出されて比較した後、本例では小さい方がRAM1
08及びRAM120に書き込まれるように実施されて、2回目
の並び変えが終了する。ここで、2回目の演算結果が1
回目の演算結果よりも小さければ、RAM108及びRAM120の
先頭アドレスに2回目の演算結果、次のアドレスに1回
目の演算結果が、2回目の演算結果が1回目の演算結果
より大きければ、先頭アドレスに1回目の演算結果、次
のアドレスに2回目の演算結果が格納されることにな
る。
このようにして、新たに演算された結果は、その大き
さに対応した順番のアドレス位置に挿入される。
<特徴データと残りの参照データとの演算比較処理> 以降、残りの参照データと特徴データの演算と、演算
結果による並べ変えが、参照データが無くなるまで続け
られる。本例では、最後に特徴データに最も類似する参
照データから順に並んだ結果がRAM120に得られる。
以上の動作終了時、RAM120より最終結果がCPUのアク
セスによつて、アドレスバスRAMA,データバスRAMDを経
て出力される。文字認識の場合、RAM120にある最大値の
部分はオバーフローの値を含む可能性があり、認識候補
として相応しくないので、最大値は出力しない。このと
きには、CPUからの信号SEL2によりRAM120からの出力が
選択される。RAM120におけるデータフオーマツトが第2
図に示されている。
本実施例により以下のような効果がある。
1.データの出力として識別子と該識別子に伴う算術結果
が出力されるため、該データに応じたリジエクトなどの
処理が容易となる。
2.データの出力として重複した値になつても該データが
失われない。
3.最小値,最大値などオーバーフローアンダーフロー時
の処理でデータサイズを少なくすることができる。
4.出力データが順番に格納されているためデータの読み
出しが容易であり、データエリアも少なくてすむ。
[発明の効果] 本発明により、ソート順の上位となる個数に対応する
容量の記憶手段に、ソートされたデータを記憶する場合
に、まず記憶手段にソート順に対応する閾値を書き込
み、各演算結果を記憶手段の値と順に比較してソート順
の位置に挿入すると共に、記憶手段の値を越えるデータ
については演算結果を記憶しないようにするソート処理
を、演算結果の数だけ繰り返して全演算結果のソートを
行い、出力の時は閾値を記憶しているデータを無効とし
て、記憶手段の容量を越える順位の演算結果は比較から
除かれていきソート結果として相応しくないデータも出
力されないので、データの数も幅も抑えて処理効率良く
データを選択して並べ変えるデータ処理装置を提供でき
る。
【図面の簡単な説明】
第1図(a)は本実施例のデータ選出装置の構成を示す
図、 第1図(b)は本実施例のデータ選出装置を文字認識装
置に適用した例を示すブロツク図、 第2図は本実施例のデータ選出の装置からの出力フオー
マツト例を示す図、 第3図(a)は従来の文字認識装置の識別部の構成を示
す図、 第3図(b)は第3図(a)のメモリの構成を示す図で
ある。 図中、15,17……識別回路、16,18……ソーテイング部、
100……辞書ROM、101……算術演算器、102……ラツチ/
カウンタ、103……ラツチ、104,105,110〜113……セレ
クタ、106コンパレータ、107……イニシヤルデータ・ラ
ツチ、108,109……RAMである。
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 昭64−46830(JP,A) 実開 昭62−66369(JP,U)

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】複数個のデータより、各データに対応する
    演算結果が所望のソート順で上位となる所定個数のデー
    タを選択して出力するデータ処理装置であって、 前記所定個数のデータについて演算結果と識別子とを記
    憶するための記憶手段と、 前記記憶手段に、前記所定個数の各データに対応する演
    算結果の初期値として、閾値を書き込む初期化手段と、 第1及び第2の入力を比較して、前記ソート順で下位と
    なる値を第1の出力とし、前記ソート順で上位となる値
    を第2の出力として出力する比較手段と、 前記比較手段に対して、新たに獲得した演算結果を最初
    の第1の入力とし、以下、順次第1の出力を次の第1の
    入力として入力し、前記記憶手段の先頭アドレスのデー
    タに対応する演算結果を最初の第2の入力とし、以下、
    前記記憶手段の各アドレスのデータに対応する演算結果
    を第2の入力として順次入力し、当該各アドレスに第2
    の出力を順次記憶させることによって、前記新たに獲得
    した演算結果を持つデータと既に前記記憶手段に記憶さ
    れたデータとを各データの演算結果の前記ソート順で前
    記記憶手段に記憶させる第1のソート制御手段と、 前記第1のソート制御手段の制御動作を、獲得される各
    演算結果について繰り返すことによって、前記複数個の
    データに対する前記所望のソートの結果を前記記憶手段
    に記憶させる第2のソート制御手段と、 前記第2のソート制御手段の動作終了時に前記記憶手段
    に記憶されているデータから、前記閾値とその識別デー
    タとを無効とし、それ以外のデータをソート結果として
    出力する出力手段とを有することを特徴とするデータ処
    理装置。
JP01230418A 1989-09-07 1989-09-07 データ選出装置 Expired - Fee Related JP3073208B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP01230418A JP3073208B2 (ja) 1989-09-07 1989-09-07 データ選出装置
US08/460,836 US5542091A (en) 1989-09-07 1995-06-05 Device for selecting and rearranging data based on arithmetic operation

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP01230418A JP3073208B2 (ja) 1989-09-07 1989-09-07 データ選出装置

Publications (2)

Publication Number Publication Date
JPH0394325A JPH0394325A (ja) 1991-04-19
JP3073208B2 true JP3073208B2 (ja) 2000-08-07

Family

ID=16907578

Family Applications (1)

Application Number Title Priority Date Filing Date
JP01230418A Expired - Fee Related JP3073208B2 (ja) 1989-09-07 1989-09-07 データ選出装置

Country Status (2)

Country Link
US (1) US5542091A (ja)
JP (1) JP3073208B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI511038B (zh) * 2013-06-19 2015-12-01 Univ Nat Chiao Tung 可重組之排序裝置與排序方法
US9965788B2 (en) * 2014-09-26 2018-05-08 Wal-Mart Stores, Inc. System and method for prioritized product index searching
US20160092519A1 (en) 2014-09-26 2016-03-31 Wal-Mart Stores, Inc. System and method for capturing seasonality and newness in database searches

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3587057A (en) * 1969-06-04 1971-06-22 Philip N Armstrong Data sorting system
US4090249A (en) * 1976-11-26 1978-05-16 International Business Machines Corporation Apparatus for sorting records in overlap relation with record loading and extraction
US4295206A (en) * 1979-06-06 1981-10-13 Ncr Canada Ltd.-Ncr Canada Ltee Document sorting method
JPS6446830A (en) * 1987-08-17 1989-02-21 Nippon Telegraph & Telephone Data selection system
US5226174A (en) * 1988-11-25 1993-07-06 Canon Kabushiki Kaisha Character recognition system for determining a class of similarity based on computer distance with a smallest value indicating close similarity
US5303381A (en) * 1990-07-19 1994-04-12 Canon Kabushiki Kaisha Method and apparatus for sorting sequential input signals by concurrently comparing successive input signals among signals in first and second memory sections

Also Published As

Publication number Publication date
US5542091A (en) 1996-07-30
JPH0394325A (ja) 1991-04-19

Similar Documents

Publication Publication Date Title
US4835734A (en) Address translation apparatus
US5140644A (en) Character string retrieving system and method
US5467088A (en) Huffman code decoding circuit
US5081608A (en) Apparatus for processing record-structured data by inserting replacement data of arbitrary length into selected data fields
EP0962865A1 (en) File processing method, data processing device, and storage medium
JP3073208B2 (ja) データ選出装置
EP0510694A2 (en) Method of and apparatus for extracting image data
EP0322888B1 (en) Cache memory device
EP0381245A2 (en) Address translation system
JP3459049B2 (ja) 文字列検索方法およひ装置
EP0468402B1 (en) Character string retrieving system and method
JP2503702B2 (ja) アドレス変換装置
JP2772125B2 (ja) 辞書検索方式
JP2535655B2 (ja) 辞書検索方式
JP3115459B2 (ja) 文字認識辞書の構成方法及び検索方法
DE69330908T2 (de) Kompakt-gespeicherte Wortgruppen
JP3325326B2 (ja) 電子ファイリング装置
JP2772124B2 (ja) 辞書検索方式
JP3121401B2 (ja) 認識辞書及び文字認識装置
JPH048816B2 (ja)
JPS63140389A (ja) 漢字ocr装置
JP3145510B2 (ja) 圧縮符号の復号化方法及び装置
JP3722231B2 (ja) コンパクトにエンコードされて記憶されたストリングの組を有する製品
EP0471473A2 (en) Image recognition apparatus
JPH03290730A (ja) データの種別分類方式

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090602

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees