JP6003492B2 - 文字認識装置及びプログラム - Google Patents

文字認識装置及びプログラム Download PDF

Info

Publication number
JP6003492B2
JP6003492B2 JP2012219462A JP2012219462A JP6003492B2 JP 6003492 B2 JP6003492 B2 JP 6003492B2 JP 2012219462 A JP2012219462 A JP 2012219462A JP 2012219462 A JP2012219462 A JP 2012219462A JP 6003492 B2 JP6003492 B2 JP 6003492B2
Authority
JP
Japan
Prior art keywords
character
character recognition
pattern
character code
code
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012219462A
Other languages
English (en)
Other versions
JP2014071813A (ja
Inventor
英人 織田
英人 織田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2012219462A priority Critical patent/JP6003492B2/ja
Priority to US13/896,679 priority patent/US9135525B2/en
Priority to CN201310286604.2A priority patent/CN103714332B/zh
Publication of JP2014071813A publication Critical patent/JP2014071813A/ja
Application granted granted Critical
Publication of JP6003492B2 publication Critical patent/JP6003492B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/191Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
    • G06V30/1916Validation; Performance evaluation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/217Validation; Performance evaluation; Active pattern learning techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/191Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
    • G06V30/19147Obtaining sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Description

本発明は、文字認識装置及びプログラムに関する。
人が描いた手書き文字の文字コードを認識する文字認識プログラムがある。さらに、特許文献1には、複数の文字認識プログラムの出力結果を比較することで、文字認識の精度を向上させようとしている発明が記載されている。
文字認識プログラムは認識精度の高い文字、認識精度の悪い文字があり、単純に文字認識プログラムの出力結果のみを比較した場合には、こうした観点を考慮に入れることが困難となる。
特開平8−96082号公報
本発明の目的は、複数の異なる文字認識手法を組み合わせた統計的な機械学習を用いることで高い精度の文字認識結果を得ることができる文字認識装置及びプログラムを提供することにある。
請求項1に記載の発明は、それぞれ異なる複数の文字認識プログラムごとに、入力された文字パターンが該文字認識プログラムの認識対象とする複数の文字コードのそれぞれに該当する度合いを示す複数の評価値を出力する評価値出力手段と、前記入力された文字パターンについて前記評価値出力手段により出力された複数の評価値を要素とする特徴情報を生成する生成手段と、予め文字コードが指定された文字パターンについて前記生成手段により生成された特徴情報に基づいて、文字コードごとの特徴情報の分類を学習する学習手段と、文字コードが未知の文字パターンについて前記生成手段により生成された特徴情報が前記学習された文字コードごとの特徴情報の分類のいずれに該当するかに基づいて、該未知の文字パターンの文字コードを決定する決定手段と、を含むことを特徴とする文字認識装置である。
請求項2に記載の発明は、前記複数の文字認識プログラムは、第1の文字認識プログラムと、第2の文字認識プログラムを含み、前記第1の文字認識プログラムが認識対象とする複数の文字コードの少なくとも一部と、前記第2の文字認識プログラムが認識対象とする複数の文字コードの少なくとも一部とが重複することを特徴とする請求項1に記載の文字認識装置である。
請求項3に記載の発明は、予め文字コードが指定された複数の文字パターンのそれぞれについて前記決定手段により決定した文字コードと該文字パターンに指定された文字コードとの比較結果に基づいて、正解率が閾値以下である文字コードを特定する特定手段と、前記特定手段により特定された文字コードを認識対象とする文字認識プログラムを前記評価値出力手段に追加する手段と、をさらに含むことを特徴とする請求項1又は2に記載の文字認識装置である。
請求項4に記載の発明は、それぞれ異なる複数の文字認識プログラムごとに、入力された文字パターンが該文字認識プログラムの認識対象とする複数の文字コードのそれぞれに該当する度合いを示す複数の評価値を出力する評価値出力手段と、前記入力された文字パターンについて前記評価値出力手段により出力された複数の評価値を要素とする特徴情報を生成する生成手段と、予め文字コードが指定された文字パターンについて前記生成手段により生成された特徴情報に基づいて、文字コードごとの特徴情報の分類を学習する学習手段と、文字コードが未知の文字パターンについて前記生成手段により生成された特徴情報が前記学習された文字コードごとの特徴情報の分類のいずれに該当するかに基づいて、該未知の文字パターンの文字コードを決定する決定手段としてコンピュータを機能させるためのプログラムである。
請求項1及び4に記載の発明によれば、本構成を有さない場合と比較して、複数の異なる文字認識手法を組み合わせた統計的な機械学習を用いることで高い精度の文字認識結果を得ることができる。
請求項2に記載の発明によれば、同じ文字コードについて複数の異なる文字認識手法で評価しない場合と比較して、高い精度の文字認識結果を得ることができる。
請求項3に記載の発明によれば、他の文字認識手法が不得意とする文字コードを認識対象とする文字認識手法を追加することで、高い精度の文字認識結果を得ることができる。
本実施形態に係る文字認識装置の機能ブロック図である。 特徴ベクトルの生成処理を説明する図である。 学習処理のフローチャートである。 文字認識処理のフローチャートである。 文字認識エンジンの設定処理のフローチャートである。
以下、本発明を実施するための実施の形態(以下、実施形態という)を、図面を参照しながら説明する。
[機能ブロック]
図1には、本実施形態に係る文字認識装置1の機能ブロック図を示した。図1に示されるように、文字認識装置1は、学習データ取得部11、文字パターン入力部12、文字認識エンジン管理部13、特徴ベクトル生成部14、識別器学習部15、識別器データ保持部16、未知パターン取得部17、文字識別部18、識別結果出力部19を備える。
文字認識装置1に備えられる上記各部の機能は、CPU等の制御手段、メモリ等の記憶手段、外部デバイスとデータを送受信する入出力手段等を備えたコンピュータが、コンピュータ読み取り可能な情報記憶媒体に格納されたプログラムを読み込み実行することで実現されるものとしてよい。なお、プログラムは光ディスク、磁気ディスク、磁気テープ、光磁気ディスク、フラッシュメモリ等の情報記憶媒体によってコンピュータたる文字認識装置1に供給されることとしてもよいし、インターネット等のデータ通信網を介して供給されることとしてもよい。
学習データ取得部11は、文字認識の識別器(識別モデル)を学習するための学習データを取得する。例えば、学習データは、オフライン文字パターンの学習データであれば、文字パターンと、文字パターンの示す文字コードの情報を含み、また、オンライン文字パターンの学習データであれば、文字パターン、文字パターンの書き順データ(ストロークデータ)、文字パターンの示す文字コードの情報を含むこととしてよい。
文字パターン入力部12は、学習データ取得部11、及び、後述する未知パターン取得部17で取得された文字パターンを文字認識エンジン管理部13に入力する。文字パターン入力部12は、オフライン文字パターンに対しては、文字パターン(文字画像)を文字認識エンジン管理部13に入力し、オンライン文字パターンに対しては、文字パターン(文字画像)とその書き順データを文字認識エンジン管理部13に入力する。
文字認識エンジン管理部13は、複数の文字認識エンジン(文字認識プログラム)を含み、各文字認識エンジンへの情報入力と、各文字認識エンジンからの情報出力を管理する。
文字認識エンジン管理部13は、それぞれ異なる文字認識エンジンE1〜EN(Nは2以上の整数)を備える。なお、文字認識エンジンE1〜ENは、オンライン文字認識用の文字認識エンジンとしてもよいし、オンライン文字認識用の文字認識エンジンとしてもよい。ここで、文字認識エンジンEi(iは1〜Nのいずれかの整数)は、Mi個の文字コードを認識対象としており、文字パターン入力部12から入力された文字パターンについて、Mi個のそれぞれの文字コードに該当する評価値(確率値、類似度、距離等)を要素とするMi次元の評価ベクトルWiを生成し、出力する。なお、各文字認識エンジンEiの認識対象とする文字コードは重複していなくともよいが、各文字認識エンジンEiの認識対象とする文字コードの少なくとも一部を重複させるようにしてもよい。
特徴ベクトル生成部14は、文字パターン入力部12により文字認識エンジン管理部13に入力された文字パターンに基づいて、文字認識エンジン管理部13に含まれる複数の文字認識エンジンE1〜ENからそれぞれ出力される評価ベクトルに基づいて、文字パターンの特徴ベクトルを生成する。
図2には、特徴ベクトルの生成処理を説明する図を示した。図2に示されるように、特徴ベクトル生成部14は、文字認識エンジンEi(iは1〜Nの整数)からそれぞれ出力される評価ベクトルWiを順次繋げて、(M1+M2+・・・+MN)次元の特徴ベクトルWを生成する。なお、図2において、文字パターンXが、文字認識エンジンEiにおけるj番目(番号j)の文字コードである確からしさ(確率、距離、類似度等)を、Si(x,Cj)として表している。
識別器学習部15は、学習データ取得部11により取得された学習データの文字パターンについて、特徴ベクトル生成部14で生成された特徴ベクトルと、該文字パターンについて定められた文字コードとに基づいて、識別器の学習を行う。具体的には、識別器には、AdaBoostやSupport Vector Machine等の機械学習モデルを用いることとしてよく、識別器学習部15は、文字コードごとの特徴ベクトルのグループに基づいて各文字コードを識別するパラメータを生成することとしてよい。
識別器データ保持部16は、識別器学習部15により生成されたパラメータを保持する。
未知パターン取得部17は、識別対象の文字パターンを取得する。例えば、未知パターン取得部17は、文字認識装置1に接続された入力装置(例えばタッチパネル等)に入力された手書き文字を未知パターンとして取得することとしてよい。
文字パターン入力部12は、未知パターン取得部17により取得された未知パターンを文字認識エンジン管理部13に入力する。そして、文字認識エンジンE1〜ENは、未知パターンについてそれぞれ評価ベクトルを生成し、特徴ベクトル生成部14は、文字認識エンジンE1〜ENでそれぞれ生成された評価ベクトルに基づいて、未知パターンの特徴ベクトルを生成する。なお、未知パターンについての特徴ベクトルの生成処理は、学習データに含まれる文字パターンについての特徴ベクトルの生成処理と同様である。
文字識別部18は、未知パターンについて特徴ベクトル生成部14により生成された特徴ベクトルと、識別器データ保持部16に保持される各文字コードの識別を学習したパラメータとに基づいて、未知パターンが該当する文字コードを識別する。
識別結果出力部19は、文字識別部18により識別された文字コードを出力する。例えば、識別結果出力部19は、文字識別部18により識別された文字コードを出力する出力情報を生成し、例えば文字認識装置1に接続された表示装置や印刷装置等に出力情報を出力することとしてよい。
[フローチャート]
次に、図3〜5に示したフローチャートを参照しながら、文字認識装置1において行われる処理の詳細について説明する。
[学習処理]
図3には、文字認識装置1において行われる学習処理のフローチャートを示した。学習処理は、学習データ(教師データ)に基づいて、識別器に文字コードの識別を学習させる処理である。
図3に示されるように、文字認識装置1は、変数l(lは1〜Lの整数)の初期値を1に設定して(S101)、学習データDlを選択する(S102)。
次に、文字認識装置1は、変数i(iは1〜Nの整数)の初期値を1に設定して(S103)、文字認識エンジンEiを選択する(S104)。
次に、文字認識装置1は、変数j(jは1〜Miの整数で、Miは文字認識エンジンEiが識別可能な文字数)の初期値を1に設定して(S105)、学習データDlが、文字認識エンジンEiにおけるj番目の文字である確からしさを示すスコアwjを算出し(S106)、算出したwjを特徴ベクトルWlの要素に追加する(S107)。
ここで、文字認識装置1は、文字認識エンジンEiにおけるj番目の文字が最後の文字ではない、すなわち、j=Miでない場合には(S108:N)、jをインクリメントして(S109)、S106に戻る。一方で、文字認識装置1は、文字認識エンジンEiにおけるj番目の文字が最後の文字である、すなわち、j=Miである場合には(S108:Y)、変数iがNに達したか否か(Dlを最後の文字認識エンジンが処理したか否か)を判定する(S110)。
ここで、文字認識装置1は、変数iがNに達していない場合には(S110:N)、iをインクリメントして(S111)、S104に戻り、変数iがNに達している場合には(S110:Y)、変数lがLに達したか否か(最後の学習データを処理したか否か)を判定する(S112)。
ここで、文字認識装置1は、変数lがLに達していない場合には(S112:N)、lをインクリメントして(S113)、S102に戻り、変数lがLに達している場合には(S112:Y)、学習データD1〜DLについてそれぞれ生成した特徴ベクトルW1〜WLに基づいて、識別器における文字コードの識別を学習した学習パラメータを算出し(S114)、算出した学習パラメータを保存して(S115)、処理を終了する。
[文字認識処理]
次に、文字コードの識別を学習した識別器により行われる未知の文字パターンの識別処理(文字認識処理)について説明する。
図4には、文字認識装置1において行われる文字認識処理のフローチャートを示した。図4に示されるように、文字認識装置1は、未知の文字パターンPを取得する(S201)。
次に、文字認識装置1は、変数i(iは1〜Nの整数)の初期値を1に設定して(S202)、文字認識エンジンEiを選択する(S203)。
次に、文字認識装置1は、変数j(jは1〜Miの整数で、Miは文字認識エンジンEiにおいて識別可能な文字数)の初期値を1に設定して(S204)、文字パターンPが、文字認識エンジンEiにおけるj番目の文字である確からしさを示すスコアwjを算出し(S205)、算出したwjを特徴ベクトルWPの要素に追加する(S206)。
ここで、文字認識装置1は、文字認識エンジンEiにおけるj番目の文字が最後の文字ではない、すなわち、j=Miでない場合には(S207:N)、jをインクリメントして(S208)、S205に戻る。一方で、文字認識装置1は、文字認識エンジンEiにおけるj番目の文字が最後の文字である、すなわち、j=Miである場合には(S207:Y)、変数iがNに達したか否か(Pを最後の文字認識エンジンが処理したか否か)を判定する(S209)。
ここで、文字認識装置1は、変数iがNに達していない場合には(S209:N)、iをインクリメントして(S210)、S203に戻り、変数iがNに達している場合には(S209:Y)、未知の文字パターンPについて生成した特徴ベクトルWPと、識別器について学習した学習パラメータとに基づいて、文字パターンPが該当する文字を識別し(S211)、その識別結果を出力して(S212)、処理を終了する。
[文字認識エンジンの設定処理]
次に、学習処理の後に実行される、文字認識エンジンの設定処理について説明する。
図5には、文字認識エンジンの設定処理のフローチャートを示した。文字認識エンジンの設定処理は、文字コードの識別を学習した識別器による文字コードの識別率が十分でない場合に、識別率が十分でない文字コードをカバーする文字認識エンジンを追加する処理である。
図5に示されるように、文字認識装置1は、変数k(kは1〜Kの整数)の初期値を1に設定して(S301)、テストデータTkを選択する(S302)。なお、テストデータとは、学習データと同じく、文字パターンと、文字パターンの文字コードとを含む情報としてよい。
次に、文字認識装置1は、変数i(iは1〜Nの整数)の初期値を1に設定して(S303)、文字認識エンジンEiを選択する(S304)。
次に、文字認識装置1は、変数j(jは1〜Miの整数で、Miは文字認識エンジンEiにおいて識別可能な文字数)の初期値を1に設定して(S305)、テストデータTkが、文字認識エンジンEiにおけるj番目の文字である確からしさを示すスコアwjを算出し(S306)、算出したwjを特徴ベクトルWkの要素に追加する(S307)。
ここで、文字認識装置1は、文字認識エンジンEiにおけるj番目の文字が最後の文字ではない、すなわち、j=Miでない場合には(S308:N)、jをインクリメントして(S309)、S306に戻る。一方で、文字認識装置1は、文字認識エンジンEiにおけるj番目の文字が最後の文字である、すなわち、j=Miである場合には(S308:Y)、変数iがNに達したか否か(Tkを最後の文字認識エンジンが処理したか否か)を判定する(S310)。
ここで、文字認識装置1は、変数iがNに達していない場合には(S310:N)、iをインクリメントして(S311)、S304に戻り、変数iがNに達している場合には(S310:Y)、テストデータTkについて算出した特徴ベクトルWkと、識別器について学習した学習パラメータとに基づいて、テストデータTkの文字パターンが該当する文字コードを識別する(S312)。そして、文字認識装置1は、S312で識別された文字コードと、テストデータの文字パターンについて定められた文字コードとが一致しているか否かを示す正否情報を記録する(S313)。
次に、文字認識装置1は、変数kがKに達したか否か(最後のテストデータを処理したか否か)を判定する(S314)。そして、文字認識装置1は、変数kがKに達していない場合には(S314:N)、kをインクリメントして(S315)、S302に戻り、変数kがKに達している場合には(S314:Y)、S313において記録された文字コードごとの正否情報に基づいて、正解率が閾値以下の文字コードがあるか否かを判定する(S316)。
文字認識装置1は、S316において、正解率が閾値以下の文字コードがない場合には(S316:N)、そのまま処理を終了し、正解率が閾値以下の文字コードがある場合には(S316:Y)、当該正解率が閾値以下の文字コードを認識対象とする文字認識エンジンを、文字認識エンジンE1〜ENに新たに追加して(S317)、文字認識エンジンの設定処理を終了する。
なお、文字認識エンジンの設定処理の終了後には、再び図3に示した学習処理を実行することとしてよい。なお、図3に示した学習処理と、図5に示した文字認識エンジンの設定処理は、図5のフローのS316において、正解率が閾値以下の文字コードが存在しなくなるまで、繰り返し実行することとしてもよい。
以上説明した、文字認識装置1によれば、1つ1つの文字認識エンジンだけでは精度の高い文字、精度の低い文字があっても、複数の文字認識エンジンの文字認識結果を組み合わせた特徴ベクトルを用いて、予め文字コードの分類を機械学習した結果を利用して文字パターンの文字コードを識別することで、1つ1つの文字認識エンジンを単独で、又は、1つ1つの文字認識エンジンの結果を比較して出力結果を得る場合に比べて、文字認識精度が高くなる。
本発明は上記の実施形態に限定されない。なお、上述したフローにおいては、オフライン文字パターンを処理対象としたが、オンライン文字パターンについても同様に適用できるのはもちろんである。
1 文字認識装置、11 学習データ取得部、12 文字パターン入力部、13 文字認識エンジン管理部、14 特徴ベクトル生成部、15 識別器学習部、16 識別器データ保持部、17 未知パターン取得部、18 文字識別部、19 識別結果出力部、E1〜EN 文字認識エンジン。

Claims (3)

  1. それぞれ異なる複数の文字認識プログラムごとに、入力された文字パターンが該文字認識プログラムの認識対象とする複数の文字コードのそれぞれに該当する度合いを示す複数の評価値を出力する評価値出力手段と、
    前記入力された文字パターンについて前記評価値出力手段により出力された複数の評価値を要素とする特徴情報を生成する生成手段と、
    予め文字コードが指定された文字パターンについて前記生成手段により生成された特徴情報に基づいて、文字コードごとの特徴情報の分類を学習する学習手段と、
    文字コードが未知の文字パターンについて前記生成手段により生成された特徴情報が前記学習された文字コードごとの特徴情報の分類のいずれに該当するかに基づいて、該未知の文字パターンの文字コードを決定する決定手段と、
    予め文字コードが指定された複数の文字パターンのそれぞれについて前記決定手段により決定した文字コードと該文字パターンに指定された文字コードとの比較結果に基づいて、正解率が閾値以下である文字コードを特定する特定手段と
    前記特定手段により特定された文字コードを認識対象とする文字認識プログラムを前記評価値出力手段に追加する手段と、を含む
    ことを特徴とする文字認識装置。
  2. 前記複数の文字認識プログラムは、第1の文字認識プログラムと、第2の文字認識プログラムを含み、
    前記第1の文字認識プログラムが認識対象とする複数の文字コードの少なくとも一部と、前記第2の文字認識プログラムが認識対象とする複数の文字コードの少なくとも一部とが重複する
    ことを特徴とする請求項1に記載の文字認識装置。
  3. それぞれ異なる複数の文字認識プログラムごとに、入力された文字パターンが該文字認識プログラムの認識対象とする複数の文字コードのそれぞれに該当する度合いを示す複数の評価値を出力する評価値出力手段、
    前記入力された文字パターンについて前記評価値出力手段により出力された複数の評価値を要素とする特徴情報を生成する生成手段、
    予め文字コードが指定された文字パターンについて前記生成手段により生成された特徴情報に基づいて、文字コードごとの特徴情報の分類を学習する学習手段と、
    文字コードが未知の文字パターンについて前記生成手段により生成された特徴情報が前記学習された文字コードごとの特徴情報の分類のいずれに該当するかに基づいて、該未知の文字パターンの文字コードを決定する決定手段
    予め文字コードが指定された複数の文字パターンのそれぞれについて前記決定手段により決定した文字コードと該文字パターンに指定された文字コードとの比較結果に基づいて、正解率が閾値以下である文字コードを特定する特定手段
    前記特定手段により特定された文字コードを認識対象とする文字認識プログラムを前記評価値出力手段に追加する手段
    としてコンピュータを機能させるためのプログラム。
JP2012219462A 2012-10-01 2012-10-01 文字認識装置及びプログラム Active JP6003492B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2012219462A JP6003492B2 (ja) 2012-10-01 2012-10-01 文字認識装置及びプログラム
US13/896,679 US9135525B2 (en) 2012-10-01 2013-05-17 Character recognition apparatus, character recognition method, and computer-readable medium
CN201310286604.2A CN103714332B (zh) 2012-10-01 2013-07-09 字符识别设备和字符识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012219462A JP6003492B2 (ja) 2012-10-01 2012-10-01 文字認識装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2014071813A JP2014071813A (ja) 2014-04-21
JP6003492B2 true JP6003492B2 (ja) 2016-10-05

Family

ID=50385273

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012219462A Active JP6003492B2 (ja) 2012-10-01 2012-10-01 文字認識装置及びプログラム

Country Status (3)

Country Link
US (1) US9135525B2 (ja)
JP (1) JP6003492B2 (ja)
CN (1) CN103714332B (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9495620B2 (en) 2013-06-09 2016-11-15 Apple Inc. Multi-script handwriting recognition using a universal recognizer
US9898187B2 (en) 2013-06-09 2018-02-20 Apple Inc. Managing real-time handwriting recognition
US20140361983A1 (en) * 2013-06-09 2014-12-11 Apple Inc. Real-time stroke-order and stroke-direction independent handwriting recognition
DK179329B1 (en) 2016-06-12 2018-05-07 Apple Inc Handwriting keyboard for monitors
WO2018134916A1 (ja) * 2017-01-18 2018-07-26 三菱電機株式会社 音声認識装置
US11194467B2 (en) 2019-06-01 2021-12-07 Apple Inc. Keyboard management user interfaces
CN112926334A (zh) * 2019-12-06 2021-06-08 北京三星通信技术研究有限公司 确定词表示向量的方法、装置及电子设备
CN112270325A (zh) * 2020-11-09 2021-01-26 携程旅游网络技术(上海)有限公司 字符验证码识别模型训练方法、识别方法、系统、设备及介质
US11961317B2 (en) * 2021-11-24 2024-04-16 Oracle Financial Services Software Limited Extracting textual information from image documents

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61272887A (ja) * 1985-05-28 1986-12-03 Toshiba Corp 文字認識方式
JP3110552B2 (ja) * 1992-05-07 2000-11-20 三菱電機株式会社 文字認識装置
JP3265701B2 (ja) * 1993-04-20 2002-03-18 富士通株式会社 多判定器によるパターン認識装置
JP2673871B2 (ja) * 1993-08-26 1997-11-05 日本アイ・ビー・エム株式会社 ニューラル・ネットワークによるパターン認識方法及び装置
JPH0896083A (ja) * 1994-09-28 1996-04-12 Sumitomo Metal Ind Ltd 文字認識装置
JPH0896082A (ja) 1994-09-29 1996-04-12 Toshiba Corp 文字認識装置及び文字認識方法
JPH08272907A (ja) * 1995-03-28 1996-10-18 Toshiba Corp 文字認識装置及び方法
US5835633A (en) * 1995-11-20 1998-11-10 International Business Machines Corporation Concurrent two-stage multi-network optical character recognition system
JPH09288717A (ja) 1996-04-24 1997-11-04 Brother Ind Ltd 文字認識装置
JP3595900B2 (ja) 1998-09-28 2004-12-02 富士通株式会社 手書き文字認識装置及び記録媒体
JP2001022883A (ja) 1999-07-12 2001-01-26 Ricoh Co Ltd 文字認識方式及び該文字認識方式の機能を実現させるための記録媒体
US7254269B2 (en) * 2000-08-31 2007-08-07 Hewlett-Packard Development Company, L.P. Character recognition system
JP4674778B2 (ja) * 2000-08-31 2011-04-20 ヒューレット・パッカード・カンパニー 文字認識システム
US7031530B2 (en) * 2001-11-27 2006-04-18 Lockheed Martin Corporation Compound classifier for pattern recognition applications
US20040146200A1 (en) * 2003-01-29 2004-07-29 Lockheed Martin Corporation Segmenting touching characters in an optical character recognition system to provide multiple segmentations
US7369702B2 (en) * 2003-11-07 2008-05-06 Microsoft Corporation Template-based cursive handwriting recognition
US7302099B2 (en) * 2003-11-10 2007-11-27 Microsoft Corporation Stroke segmentation for template-based cursive handwriting recognition
US7848566B2 (en) * 2004-10-22 2010-12-07 Carnegie Mellon University Object recognizer and detector for two-dimensional images using bayesian network based classifier
US7865018B2 (en) * 2005-06-02 2011-01-04 Microsoft Corporation Personalized implicit and explicit character shape adaptation and recognition
US7496547B2 (en) * 2005-06-02 2009-02-24 Microsoft Corporation Handwriting recognition using a comparative neural network
US7817857B2 (en) * 2006-05-31 2010-10-19 Microsoft Corporation Combiner for improving handwriting recognition
JP2011257805A (ja) * 2010-06-04 2011-12-22 Sony Corp 情報処理装置および方法、並びにプログラム
US8548256B2 (en) * 2010-07-01 2013-10-01 Intellectual Ventures Fund 83 Llc Method for fast scene matching
JP2014092817A (ja) * 2012-10-31 2014-05-19 Fuji Xerox Co Ltd 文字認識装置及びプログラム

Also Published As

Publication number Publication date
JP2014071813A (ja) 2014-04-21
CN103714332B (zh) 2018-09-07
US20140093161A1 (en) 2014-04-03
US9135525B2 (en) 2015-09-15
CN103714332A (zh) 2014-04-09

Similar Documents

Publication Publication Date Title
JP6003492B2 (ja) 文字認識装置及びプログラム
JP5588395B2 (ja) 画像をオブジェクト及びそのパーツに関して効率的に解釈するためのシステムと方法
US9600745B2 (en) Image recognition system, image recognition method, and non-transitory computer readable medium storing image recognition program
CN107085585A (zh) 用于图像搜索的准确的标签相关性预测
CN103415825A (zh) 用于手势识别的系统和方法
JP2008257469A (ja) 画像処理装置及び画像検索方法
CN111444346B (zh) 一种用于文本分类的词向量对抗样本生成方法及装置
US20220358658A1 (en) Semi Supervised Training from Coarse Labels of Image Segmentation
CN109685104B (zh) 一种识别模型的确定方法和装置
CN113033271A (zh) 利用人工智能模块学习脸部辨识的处理方法
JP2012194691A (ja) 識別器の再学習方法、再学習のためのプログラム、及び画像認識装置
CN115690514A (zh) 图像识别方法及相关设备
Ozasa et al. Disambiguation in unknown object detection by integrating image and speech recognition confidences
Tobeta et al. E2pose: Fully convolutional networks for end-to-end multi-person pose estimation
US9042641B2 (en) Character recognition apparatus, character recognition method, and computer-readable medium
CN115222047A (zh) 一种模型训练方法、装置、设备及存储介质
CN102308307B (zh) 用于模式发现和识别的方法
JP7061089B2 (ja) 分類装置、分類方法及び分類プログラム
CN110263196B (zh) 图像检索方法、装置、电子设备及存储介质
Kwon et al. An introduction to face-recognition methods and its implementation in software applications
JP5667004B2 (ja) データ分類装置及び方法及びプログラム
Sun et al. A robot for classifying Chinese calligraphic types and styles
Aly et al. Adaptive feature selection and data pruning for 3D facial expression recognition using the Kinect
CN111126617A (zh) 一种选择融合模型权重参数的方法、装置及设备
Wang et al. On-line signature verification using segment-to-segment graph matching

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150306

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20151222

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160126

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160322

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160809

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160822

R150 Certificate of patent or registration of utility model

Ref document number: 6003492

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350