JPH0620097A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH0620097A
JPH0620097A JP4172279A JP17227992A JPH0620097A JP H0620097 A JPH0620097 A JP H0620097A JP 4172279 A JP4172279 A JP 4172279A JP 17227992 A JP17227992 A JP 17227992A JP H0620097 A JPH0620097 A JP H0620097A
Authority
JP
Japan
Prior art keywords
character
vector
detailed
calculation
arithmetic operation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP4172279A
Other languages
English (en)
Inventor
Kazuhiro Takehara
和宏 竹原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP4172279A priority Critical patent/JPH0620097A/ja
Publication of JPH0620097A publication Critical patent/JPH0620097A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】 文字認識装置において入力文字の認識が短時
間で行なえるようにすること。 【構成】 ステャナ等によって入力された文字列から1
文字が切り出され、その文字の特徴が特徴抽出部2で抽
出される。所定の初期設定ベクトルと抽出された文字の
特徴とのベクトル演算が大分類演算部3によって行なわ
れる。そしてその演算結果に応じて詳細類似度演算実行
判定部4が詳細類似度演算を行なうか否かを判定し、詳
細類似度演算を行なうと判定した文字についてのみ詳細
類似度演算部5において詳細類似度演が演算される。

Description

【発明の詳細な説明】
【0001】
【従来の技術】従来入力装置を用いて入力された文字を
認識するにあたってその文字の大分類を行なう。その
際、入力された文字に対して辞書の各カテゴリ(各文字
ごと)との単純類似度(およその類似度)を求め、その
結果をソートして上位の何個かに対して詳細な類似度の
計算(詳細識別)を行なっていた。
【0002】たとえば、「門」を入力したとすると、従
来においてはその文字の特徴を抽出した後、まず詳細類
似度用辞書の一部を使って単純類似度を計算し、その後
その結果を上位たとえば5個までソーティングする。そ
の結果たとえば「門」、「間」、「聞」、「問」、
「関」が候補になったとするとその後この5つの文字に
ついてだけ詳細類似度演算が行なわれる。詳細類似度演
算を行なう場合、詳細類似度用辞書の全部を使って詳細
類似度を計算する。詳細類似度演算結果についてソーテ
ィングをして結果を出力する。
【0003】
【発明が解決しようとする課題】従来の文字認識装置に
おける大分類においては、次のような理由で大分類自身
の計算量が多いという問題点があった。
【0004】(1) 辞書のすべてのカテゴリに対して
単純類似度を計算する必要があるため、計算量が多い。
【0005】(2) ソートするため、計算量が多い。
【0006】この発明は上記のような問題点を解消する
ためになされたもので、文字認識装置において入力文字
の認識に必要な大分類を高速で行ない、入力文字の認識
を短時間で行なうことを目的とする。
【0007】
【課題を解決するための手段】この発明に係る文字認識
装置は、入力された文字列から一文字を切り出す手段
と、切り出された文字の特徴を抽出する手段と、所定の
初期設定ベクトルと抽出された文字の特徴とのベクトル
演算を行なうことによって入力された文字をおおまかに
分類する手段と、ベクトル演算結果に応じて詳細類似度
演算を行なうか否かを判定する手段と、判定手段が詳細
類似度演算を行なうと判定したときのみ詳細類似度を演
算する演算手段とを含む。
【0008】
【作用】入力された文字を大まかに分類するにあたって
所定の初期設定ベクトルと抽出された文字の特徴とのベ
クトル演算を行ない、それに応じて詳細類似度演算を行
なうか否かが判定され、行なう必要があると判定された
もののみについて詳細類似度計算が行なわれるため入力
文字と認識される確率の高い文字のみについて詳細類似
度演算が行なわれる。予め簡単な計算で詳細識別の要否
を判断するため高速で入力文字の大分類が可能になる。
【0009】
【実施例】以下この発明に実施例を図面を参照して説明
する。図1はこの発明にかかる文字認識装置の要部を示
すブロック図である。図1を参照して、この発明に係る
文字認識装置は図示のないたとえばスキャナのような文
字入力手段によって入力された文字列の中から1文字ご
とに取り出す切り出し部1と、切り出し部1によって切
り出された文字に対してその特徴を抽出する特徴抽出部
2と、所定の初期設定ベクトルとの演算を行なう大分類
演算部3と、大分類演算部の演算結果に応じて詳細類似
度演算を行なうか否かを判定する詳細類似度演算実行判
定部4と、詳細類似度演算実行判定部4が詳細類似度演
算をする必要があると判定したときに詳細類似度演を実
際に演算する詳細類似度演算部5と、詳細類似度演算結
果をソーティングする詳細類似度演算結果ソーティング
部6とを含む。
【0010】次に図2を参照して大分類演算部3の内容
について説明する。大分類演算部3は予め設定された初
期設定ベクトルを格納する初期設定ベクトル格納領域3
2と、各文字の標準パターンと初期設定ベクトルとの内
積を演算する内積演算部31と、その演算結果を格納す
る内積演算結果格納領域33とを含む。なお、このシス
テムでは、文字の標準パターンはすべてK(以下K=6
4とする)次元ベクトル空間上の正規化された(大きさ
を一定にした)ベクトルとして表わされるものとする。
【0011】次に初期設定ベクトル格納領域32および
内積演算結果格納領域33に記憶されるデータについて
説明する。
【0012】予め、V1からVNまでの初期設定ベクト
ルを設定する。以下図3を参照して具体的に説明する。
図3における例では簡単のためにV1だけ(1個だけ)
初期設定ベクトルを設定する。各文字「あ」、「い」、
・・・の各標準パターンの大分類用辞書(図4の42)
には、標準パターンを表わすベクトルとV1との内積結
果を代入する。たとえば、ベクトルV1と文字「あ」の
標準パターンを表わすベクトルとの内積値は+、ベクト
ルV1と文字「い」の標準パターンを表わすベクトルと
の内積値は−、ベクトルV1と文字「お」の標準パター
ンを表わすベクトルとの内積値は0とする。ここで内積
値がプラスということは、そのベクトルがV1と同じ方
向を向いているということを表わし、ベクトルV1との
内積値が0ということはそのベクトルがVと1垂直方向
を向いているということを表わし、ベクトルV1と内積
値がマイナスということは、そのベクトルがV1と反対
方向を向いていることを表わす。
【0013】大分類用辞書42には内積値が+について
はフラグ「01」として、内積値が−についてはフラグ
「10」として、内積値が0についてはフラグ「11」
としてデータが保存される。具体的には「あ」は「0
1」、「い」は「01」、「う」は「11」として記憶
される。
【0014】なお、図3において原点Oを中心として点
線で囲まれた領域がベクトルVと同じ向きを向いている
とする。
【0015】大分類演算部3では、切り出し部1から切
り出された文字について特徴抽出部により、変換された
その文字の特徴量を表すベクトルXとベクトルV1との
内積を内積演算部31で行ない、その結果が内積演算結
果格納領域33に代入される。代入される値は具体的に
は、次のように計算する。
【0016】 ベクトルXとV1との内積値が、正ならば、01 ベクトルXとV1との内積値が、負ならば、10 ベクトルXとV1との内積値が、0ならば、11 図4は詳細類似度演算実行判定部4の内容を示す図であ
る。図4を参照して、詳細類似度演算実行判定部4は、
判別部41と大分類用辞書42と、初期設定ベクトルと
の内積演算結果を格納する内積演算結果格納領域43と
を含む。なお内積演算結果格納領域43は図2に示した
内積演算結果格納領域33と同じものである。
【0017】大分類用辞書42は、各カテゴリについ
て、2ビットのフラグ格納領域のペアをN個用意したも
のである。ここで、分類辞書の設定、すなわち、フラグ
の設定の仕方は、各文字の平均的な文字を特徴抽出部と
同じ方法でK次元ベクトルに変換したもの(標準パター
ン)と、初期設定ベクトルとの内積値による、値(01
or10or11)を定める。
【0018】詳細類似度演算実行判定部4での判定は次
のようにして行なう。内積演算結果格納領域43の2ビ
ットのペアと、分類辞書の2ビットのペアの論理積(A
ND)をとる操作をN個について行なう。このうち1個
でもANDの結果が0になると、詳細識別を行なわない
とする。具体的には次ようにする。
【0019】「あ」については01AND01=01
で、00でないので詳細演算を行なう。
【0020】「い」については10AND01=00
で、00となるので詳細演算を行なわない。
【0021】「う」については、11AND01=01
で、00でないので詳細演算を行なう。
【0022】意味的には、入力文字Xは、初期設定ベク
トルとの演算結果「01」から、ベクトルV1と同じ向
きのベクトルであると判断される。したがってV1と反
対向きのベクトルである「い」とは詳細演算を行なわな
いということになる。
【0023】図5はこの発明に係る文字認識装置の動作
を示すフローチャートである。図5を参照して、切り出
された文字の特徴抽出を行なった後、詳細識別用辞書、
大分類用辞書のカウンタをリセットする(S11,S1
2)。初期設定ベクトルとのN個の内積を求め、(S1
3)、その内積値により、内積演算結果格納領域33に
フラグを設定する(S14)。内積演算結果格納領域3
3の2ビットのペアと、大分類辞書の2ビットのペアの
ANDをとる操作をN個について行なう(S15)。N
個のANDの結果のうち、すべての0でなければ(S1
6でYES)、詳細識別、ソーティングを行ない(S1
7,S18)、それ以外は詳細識別、ソーティングを行
なわない(S16D NO)。
【0024】次に詳細識別用辞書、大分類用辞書42の
カウンタを1増やし(S19)、詳細識別用辞書、大分
類用辞書42が終わりか否かを判定する(S20)。以
上の処理を終了まで繰返し、その結果を出力する(S2
1)。
【0025】
【発明の効果】以上のようにこの発明によれば、所定の
初期設定ベクトルと特徴抽出部により、変換された入力
文字の特徴量を表すK次元ベクトルとのベクトル演算を
行なうことによって入力された文字が大まかに予め分類
され、ベクトル演算結果に応じて詳細類似演算を行なう
か否かが判定されるため、入力文字と認識される確率の
高い文字についてのみ詳細類似度演算が行なわれる。し
たがって、簡単な計算で詳細識別の要否を判断するため
高速で入力文字の分類が可能になる。その結果、文字認
識装置において入力文字の認識が短時間で行なえる。
【図面の簡単な説明】
【図1】この発明に係る文字認識装置の要部を示すブロ
ック図である。
【図2】大分類演算部の内容を示すブロック図である。
【図3】初期設定ベクトルと文字パターンベクトルとの
関係を示す図である。
【図4】詳細類似度演算実行判定部の内容を示すブロッ
ク図である。
【図5】文字認識装置の動作を説明するフローチャート
である。
【符号の説明】
1 切り出し部 2 特徴抽出部 3 大分類演算部 4 詳細類似度演算実行判定部 5 詳細類似度演算部 6 詳細類似度演算結果ソーティング部 7 初期設定データ記憶部

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 入力された文字列から一文字を切り出す
    手段と、 前記切り出された文字の特徴を抽出する手段と、 所定の初期設定ベクトルと前記抽出された文字の特徴と
    のベクトル演算を行なうことによって前記入力された文
    字を大まかに分類する手段と、 前記ベクトル演算結果に応じて詳細類似度演算を行なう
    か否かを判定する手段と、 前記判定手段が前記詳細類似度演算を行なうと判定した
    ときのみ、前記詳細類似度演算をする演算手段とを含
    む、文字認識装置。
JP4172279A 1992-06-30 1992-06-30 文字認識装置 Withdrawn JPH0620097A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4172279A JPH0620097A (ja) 1992-06-30 1992-06-30 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4172279A JPH0620097A (ja) 1992-06-30 1992-06-30 文字認識装置

Publications (1)

Publication Number Publication Date
JPH0620097A true JPH0620097A (ja) 1994-01-28

Family

ID=15938976

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4172279A Withdrawn JPH0620097A (ja) 1992-06-30 1992-06-30 文字認識装置

Country Status (1)

Country Link
JP (1) JPH0620097A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6626549B2 (en) 2000-06-30 2003-09-30 Nippon Seiki Co., Ltd. Pointer instrument

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6626549B2 (en) 2000-06-30 2003-09-30 Nippon Seiki Co., Ltd. Pointer instrument

Similar Documents

Publication Publication Date Title
CN107944480B (zh) 一种企业行业分类方法
WO2020140372A1 (zh) 一种基于识别模型的意图识别方法、识别设备及介质
CN110851598B (zh) 文本分类方法、装置、终端设备及存储介质
CN109902223B (zh) 一种基于多模态信息特征的不良内容过滤方法
US20210264189A1 (en) Text Recognition Method and Apparatus, Electronic Device, and Storage Medium
CN112651296A (zh) 一种无先验知识数据质量问题自动探查方法及系统
JPH05225378A (ja) 文書画像の領域分割システム
CN115758183A (zh) 日志异常检测模型的训练方法及装置
JP3313272B2 (ja) 住所読み取り方法および識別関数重みベクトル生成方法
JPH0620097A (ja) 文字認識装置
CN111400495A (zh) 一种基于模板特征的视频弹幕消费意图识别方法
CN112528021B (zh) 一种模型训练方法、模型训练装置及智能设备
CN115359302A (zh) 硬币识别方法、系统及存储介质
Dhankhar et al. Support Vector Machine Based Handwritten Hindi Character Recognition and Summarization.
JPH0660224A (ja) 光学式文字読取装置
KR20140112869A (ko) 문자 인식 장치 및 방법
Adedayo et al. Real-time automated detection and recognition of Nigerian license plates via deep learning single shot detection and optical character recognition
CN111291726A (zh) 医疗票据分拣方法、装置、设备和介质
JPH0749926A (ja) 文字認識装置
CN113378244B (zh) 基于数据分析的电子签章智能调用系统及方法
US20220067107A1 (en) Multi-section sequential document modeling for multi-page document processing
JPH08287188A (ja) 文字列認識装置
JPH06124349A (ja) パターン学習方法及びパターン学習装置
JP3121401B2 (ja) 認識辞書及び文字認識装置
CN116992329A (zh) 公共网络敏感数据自动分类识别方法及装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 19990831