JP2014228953A - 画像処理装置および画像処理方法 - Google Patents
画像処理装置および画像処理方法 Download PDFInfo
- Publication number
- JP2014228953A JP2014228953A JP2013106439A JP2013106439A JP2014228953A JP 2014228953 A JP2014228953 A JP 2014228953A JP 2013106439 A JP2013106439 A JP 2013106439A JP 2013106439 A JP2013106439 A JP 2013106439A JP 2014228953 A JP2014228953 A JP 2014228953A
- Authority
- JP
- Japan
- Prior art keywords
- character
- line
- area
- character area
- starting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/146—Aligning or centring of the image pick-up or image-field
- G06V30/1475—Inclination or skew detection or correction of characters or of image to be recognised
- G06V30/1478—Inclination or skew detection or correction of characters or of image to be recognised of characters or characters lines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T11/00—2D [Two Dimensional] image generation
- G06T11/20—Drawing from basic elements, e.g. lines or circles
- G06T11/203—Drawing of straight lines or curves
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Character Input (AREA)
- Character Discrimination (AREA)
Abstract
【解決手段】行認識手段は、第1の文字領域を起点として行抽出処理を行う場合と、第1の文字領域とは異なる行にある第2の文字領域を起点として行抽出処理を行う場合とで、同じ第3の文字領域が重複して選ばれ得る場合には、第1の文字領域を起点とする行に第3の文字領域を加入した場合と、第2の文字領域を起点とする行に第3の文字領域を加入した場合とを比較することにより、第3の文字領域をいずれの行に加入すべきか決定する。
【選択図】図11
Description
の検査など、様々な場面において幅広く普及している。FA業界では、近年、トレーサビリティ強化の潮流があり、工業製品などに印字された文字を高速かつ正確に読み取る技術のニーズがさらに増している。
・平面でない物体表面上に文字が印字された場合
・文字が印字された物体自体が湾曲する場合(例えばシート状の物体や表面が伸縮する物体に印字したとき)
・文字列が曲線的に配置されたレイアウトデザインの場合
・プリンタの不具合などにより印字が曲がってしまった場合
また、画像処理の問題として、画像上に多数の文字が存在する場合や、ノイズ(汚れなど)を文字と誤認識した場合にも、行の認識を誤ることがある。
なる。
(視覚センサシステム)
図1を参照して、画像処理装置100を含む視覚センサシステム1の全体構成について説明する。
出力される。PLC5は、トリガー信号を受信するとともに、搬送機構6の制御を司る。
図2は、画像処理装置100の概略構成図である。画像処理装置100は、CPU(Ce
ntral Processing Unit)110と、記憶部としてのメインメモリ112およびハードデ
ィスク114と、カメラインターフェイス116と、入力インターフェイス118と、表示コントローラ120と、PLCインターフェイス122と、通信インターフェイス124と、データリーダ/ライタ126とを含む。これらの各部は、バス128を介して、互いにデータ通信可能に接続される。カメラインターフェイス116は、CPU110とカメラ8との間のデータ伝送を仲介する部分であり、カメラ8からの画像データを一時的に蓄積するための画像バッファ116aを有している。入力インターフェイス118は、CPU110とマウス104、キーボード、タッチパネルなどの入力部との間のデータ伝送を仲介する。表示コントローラ120は、ディスプレイ102に接続され、当該ディスプレイ102での表示を制御する。PLCインターフェイス122は、CPU110とPLC5との間のデータ伝送を仲介する。通信インターフェイス124は、CPU110とコンソール(あるいは、パーソナルコンピュータやサーバ装置)などとの間のデータ伝送を仲介する。データリーダ/ライタ126は、CPU110と記憶媒体であるメモリカード106との間のデータ伝送を仲介する。
図3に、第1実施形態に係る文字認識処理を実現するための機能構成を示す。画像処理装置100は、文字認識処理に関わる機能として、画像入力部130、前処理部131、行切り出し部132、文字切り出し部133、文字認識部134、後処理部135、出力部136を含んでいる。これらの機能ブロックは、画像処理装置100のCPU110がコンピュータプログラムを実行することにより実現される。本実施形態においては、行切り出し部132が本発明の文字領域設定手段及び行認識手段に対応する。
図4を参照して、図3に示した各機能ブロックの動作、及び、文字認識処理の全体フローについて説明する。
図5を参照して、図4のステップS102の行切り出し処理の詳細について説明する。行切り出し処理は、(1)文字領域設定、(2)強制分割、(3)左優先ソート、(4)行認識という手順で行われる。ただし、(2)強制分割と(3)左優先ソートは省略可能な処理である。以下、(1)〜(4)の各々の処理について説明する。
行切り出し部132は、前処理によって生成された2値化画像と設定パラメータを受け取り、文字領域設定処理を実行する。設定パラメータとしては、文字幅と文字高さの情報が与えられる。文字幅と文字高さは、例えば「20画素」や「7.5mm」のように単一の値で与えてもよいし、画像中に異なるサイズの文字が含まれ得る場合は、「10画素〜20画素」や「6.0mm〜10mm」のように値域(最小値と最大値)で与えてもよい。
行切り出し部132は、文字領域座標データに基づき各文字領域の高さを調べ、高さが所定の閾値を超える文字領域について、強制分割を実施する。閾値は、設定パラメータで与えられた文字高さを基準にして定めるとよい(例えば、文字高さの130%など)。図7に、強制分割の一例を示す。図7の例のように、文字が他の模様(この例ではバーコードのバー)とつながっていると、ラベリング処理においてそれらが一つの要素として認識されるため、文字領域の高さが閾値を超える。行切り出し部132は、ラベル画像から高さが閾値を超える文字領域の部分を抽出し、横方向に黒画素をカウントした横投影ヒストグラムを作成する。そして、縦方向にヒストグラムの谷をサーチし、谷が検出されたらその高さで文字領域を分割する。強制分割を実施した場合には、分割した文字領域に新たなラベル番号を付与し、文字領域座標データを更新する。なお、図7に示した方法以外にも、強制分割の方法には様々な方法があり、そのいずれを用いてもよい。
行切り出し部132は、文字領域座標データに基づき各文字領域に対し、左優先ソートをかける。具体的には、左上点のX座標(横方向座標)が小さい文字領域から順に、ラベル番号の振り直しを行う。ここでは、ラベル画像自体を修正する必要はなく、文字領域座標データにおけるラベル番号及び記述順を更新するだけでよい。図8は、ソート後のラベル番号を示している。符号Rxは、ラベル番号:xが付された文字領域を表す。
行切り出し部132は、ソート後の文字領域座標データを用いて、行認識(行切り出し)を実施する。本実施形態では、ある文字領域を起点として、所定の隣接条件を満たす文字領域を順に連結していくことで、同じ行に属すると推定される文字領域の組を抽出する行抽出処理(行サーチとも呼ぶ)を、起点とする文字領域を変えて繰り返し実行することで、文字領域座標データに含まれる複数の文字領域を複数の行に切り分ける、という操作を行う。
図11を参照して、(4)行認識の処理における誤判定の修正手順について説明する。図11の画像には、「123」と「ABCD」の2行の文字列が含まれているが、各文字列の湾曲が大きいため、前述した隣接条件に基づく連結処理では、行の判定を誤る可能性が高い。
索を行う。このとき、「R2→R4」と連結された後、文字領域R6がR4に対し隣接条件を満たすと判定される(正しい判定)。すなわち、文字領域R1(第1の文字領域)を起点として行抽出処理を行う場合と、文字領域R2(第2の文字領域)を起点として行抽出処理を行う場合とで、同じ文字領域R6(第3の文字領域)が重複して選ばれる、という状況が発生する。これは、隣接条件を満たすと判定された文字領域R6に既に行番号が付されているかどうかで判断することができる。
以上述べた第1実施形態の構成によれば、例えば図11のようなケースにおいて、文字領域R6が1行目に属する可能性と2行目に属する可能性の両者を考慮・比較して、文字領域R6をいずれの行に加入するのが妥当か決定される。したがって、従来よりも誤判定の少ない、高精度な行認識が可能となる。しかも、文字領域R6の局所的な連結性を評価するだけでよいので、高速かつ簡易な処理を実現できる。また、各行の行抽出処理を繰り返し実行する中で、誤った連結箇所を逐次修正することが可能である。
次に本発明の第2実施形態について説明する。例えば、賞味期限、ロット番号、自動車のナンバープレート、カード番号などのように、行数や各行の形式(文字数や文字種など)が既知の場合は、その情報を事前に知識として与えることで、より誤判定の少ない行認識が可能になると期待できる。そこで第2実施形態では、各行の文字列の形式を定義する「フォーマット文字列」を行認識に利用する。なお、行認識の処理以外の構成は第1実施形態のものと同じであるため、詳しい説明を省略する。
図12に、第2実施形態に係る文字認識処理を実現するための機能構成を示す。画像処理装置100は、文字認識処理に関わる機能として、画像入力部130、前処理部131、行候補切り出し部137、文字切り出し部133、文字認識部134、フォーマット文字列取得部138、フォーマット照合部139、出力部136を含んでいる。これらの機能ブロックは、画像処理装置100のCPU110がコンピュータプログラムを実行することにより実現される。本実施形態においては、行候補切り出し部137が本発明の文字領域設定手段に対応し、行候補切り出し部137及びフォーマット照合部139が本発明の行認識手段に対応し、フォーマット文字列取得部138が本発明のフォーマット文字列取得手段に対応する。
図13を参照して、行候補切り出し部137による行候補切り出し処理について説明する。行候補切り出し処理は、第1実施形態の行切り出し処理と殆ど同じであるが、複数の行に対して連結する可能性がある文字領域が検出された場合に、連結の強さに基づく繋ぎ換えを行うのではなく、考えうる行候補をすべて抽出する点が異なる。
本実施形態で用いるフォーマット文字列は、認識対象の文字別に文字種又は文字を指定するものである。言い換えれば、フォーマット文字列は、認識対象の文字列について、文字数と、文字種又は文字の組み合わせを指定するものである。
各文字「あ」,「い」,…、カタカナの各文字「ア」,「イ」,…)、フォント種の指定、文字サイズ(フォントサイズ)の指定などを含む。さらに、フォーマット文字列を用いて、文字に加えて、シンボルを指定するようにしてもよい。
#:数字(0〜9)
$:英字(A〜Z、a〜z)
@:記号(「’」、「−」、「:」、「¥」など)
ただし、これはあくまで一例であり、フォーマット文字列の書式(表現形式)は任意に取り決めることができる。
文字列「123」 ⇔ フォーマット文字列「###」
文字列「ABCD」 ⇔ フォーマット文字列「$$$$」
図14を参照して、フォーマット照合部139の動作を説明する。
図14に示すように、複数の候補についての文字認識結果が得られたら、フォーマット文字列取得部138により、対応するフォーマット文字列の取得を行う。そして、フォーマット照合部139が、各候補の文字認識結果における文字列の形式(例えば文字数、文字種)と、フォーマット文字列で定義されている文字列の形式との類似度を計算する。類似度としては、例えば、文字種が一致している文字の数や、各行の文字数の一致度合いなどを利用することができる。フォーマット照合部139は、各候補の類似度を比較し、類似度が最も高い候補を採用する。
2:ワーク
4:光電センサ
8:カメラ
100:画像処理装置
130:画像入力部
131:前処理部
132:行切り出し部
133:文字切り出し部
134:文字認識部
135:後処理部
136:出力部
137:行候補切り出し部
138:フォーマット文字列取得部
138:フォーマット照合部
139:フォーマット照合部
Claims (11)
- 複数行の文字列を含む画像から各行の領域を特定する画像処理装置であって、
画像から文字を構成する画素群である文字要素を抽出し、各々が文字要素を内包するように複数の文字領域を設定する文字領域設定手段と、
ある文字領域を起点として、所定の隣接条件を満たす文字領域を順に連結していくことで、同じ行に属すると推定される文字領域の組を抽出する行抽出処理を、起点とする文字領域を変えて繰り返し実行することにより、前記複数の文字領域を複数の行に分ける行認識手段と、
を有しており、
前記行認識手段は、
第1の文字領域を起点として行抽出処理を行う場合と、前記第1の文字領域とは異なる行にある第2の文字領域を起点として行抽出処理を行う場合とで、同じ第3の文字領域が重複して選ばれ得る場合には、
前記第1の文字領域を起点とする行に前記第3の文字領域を加入した場合と、前記第2の文字領域を起点とする行に前記第3の文字領域を加入した場合とを比較することにより、前記第3の文字領域をいずれの行に加入すべきか決定する
ことを特徴とする画像処理装置。 - 複数行の文字列を含む画像から各行の領域を特定する画像処理装置であって、
画像から文字を構成する画素群である文字要素を抽出し、各々が文字要素を内包するように複数の文字領域を設定する文字領域設定手段と、
ある文字領域を起点として、所定の隣接条件を満たす文字領域を順に連結していくことで、同じ行に属すると推定される文字領域の組を抽出する行抽出処理を、起点とする文字領域を変えて繰り返し実行することにより、前記複数の文字領域を複数の行に分ける行認識手段と、
を有しており、
前記行認識手段は、
第1の文字領域を起点として行抽出処理を行う場合と、前記第1の文字領域とは異なる行にある第2の文字領域を起点として行抽出処理を行う場合とで、同じ第3の文字領域が重複して選ばれ得る場合には、
前記第1の文字領域を起点とする行の隣接文字領域に対する前記第3の文字領域の連結の強さと、前記第2の文字領域を起点とする行の隣接文字領域に対する前記第3の文字領域の連結の強さを比較し、連結が強い方の行に前記第3の文字領域を加入する
ことを特徴とする画像処理装置。 - 前記行認識手段は、行の方向に対し直交する方向に関する、前記隣接文字領域と前記第3の文字領域の重なりの度合いが大きいほど、前記隣接文字領域とに対する前記第3の文字領域の連結が強いと評価する
ことを特徴とする請求項2に記載の画像処理装置。 - 前記行認識手段は、前記隣接文字領域と前記第3の文字領域の大きさが類似しているほど、前記隣接文字領域に対する前記第3の文字領域の連結が強いと評価する
ことを特徴とする請求項2又は3に記載の画像処理装置。 - 前記行認識手段は、前記隣接文字領域内の画像と前記第3の文字領域内の画像の色又は輝度の特徴が類似しているほど、前記隣接文字領域に対する前記第3の文字領域の連結が強いと評価する
ことを特徴とする請求項2、3又は4に記載の画像処理装置。 - 複数行の文字列を含む画像から各行の領域を特定する画像処理装置であって、
各行の文字列の形式を定義するフォーマット文字列を取得するフォーマット文字列取得手段と、
画像から文字を構成する画素群である文字要素を抽出し、各々が文字要素を内包するように複数の文字領域を設定する文字領域設定手段と、
ある文字領域を起点として、所定の隣接条件を満たす文字領域を順に連結していくことで、同じ行に属すると推定される文字領域の組を抽出する行抽出処理を、起点とする文字領域を変えて繰り返し実行することにより、前記複数の文字領域を複数の行に分ける行認識手段と、
を有しており、
前記行認識手段は、
第1の文字領域を起点として行抽出処理を行う場合と、前記第1の文字領域とは異なる行にある第2の文字領域を起点として行抽出処理を行う場合とで、同じ第3の文字領域が重複して選ばれ得る場合には、
前記第1の文字領域を起点とする行に前記第3の文字領域を加入した場合に生成される複数の行を第1の候補、前記第2の文字領域を起点とする行に前記第3の文字領域を加入した場合に生成される複数の行を第2の候補とし、
前記第1の候補の各行から認識される文字列の形式と前記フォーマット文字列で定義された各行の文字列の形式との類似度と、前記第2の候補の各行から認識される文字列の形式と前記フォーマット文字列で定義された各行の文字列の形式との類似度とを比較し、類似度が高い方の候補を採用する
ことを特徴とする画像処理装置。 - 前記フォーマット文字列は、文字列を構成する文字の数と、一部又は全部の文字の文字種とを少なくとも定義する情報である
ことを特徴とする請求項6に記載の画像処理装置。 - 複数行の文字列を含む画像から各行の領域を特定する画像処理方法であって、
コンピュータが、画像から文字を構成する画素群である文字要素を抽出し、各々が文字要素を内包するように複数の文字領域を設定する文字領域設定ステップと、
コンピュータが、ある文字領域を起点として、所定の隣接条件を満たす文字領域を順に連結していくことで、同じ行に属すると推定される文字領域の組を抽出する行抽出処理を、起点とする文字領域を変えて繰り返し実行することにより、前記複数の文字領域を複数の行に分ける行認識ステップと、
を有しており、
前記行認識ステップにおいて、
第1の文字領域を起点として行抽出処理を行う場合と、前記第1の文字領域とは異なる行にある第2の文字領域を起点として行抽出処理を行う場合とで、同じ第3の文字領域が重複して選ばれ得る場合には、
前記第1の文字領域を起点とする行に前記第3の文字領域を加入した場合と、前記第2の文字領域を起点とする行に前記第3の文字領域を加入した場合とを比較することにより、前記第3の文字領域をいずれの行に加入すべきか決定する
ことを特徴とする画像処理方法。 - 複数行の文字列を含む画像から各行の領域を特定する画像処理方法であって、
コンピュータが、画像から文字を構成する画素群である文字要素を抽出し、各々が文字要素を内包するように複数の文字領域を設定する文字領域設定ステップと、
コンピュータが、ある文字領域を起点として、所定の隣接条件を満たす文字領域を順に連結していくことで、同じ行に属すると推定される文字領域の組を抽出する行抽出処理を、起点とする文字領域を変えて繰り返し実行することにより、前記複数の文字領域を複数
の行に分ける行認識ステップと、
を有しており、
前記行認識ステップにおいて、
第1の文字領域を起点として行抽出処理を行う場合と、前記第1の文字領域とは異なる行にある第2の文字領域を起点として行抽出処理を行う場合とで、同じ第3の文字領域が重複して選ばれ得る場合には、
前記第1の文字領域を起点とする行の隣接文字領域に対する前記第3の文字領域の連結の強さと、前記第2の文字領域を起点とする行の隣接文字領域に対する前記第3の文字領域の連結の強さを比較し、連結が強い方の行に前記第3の文字領域を加入する
ことを特徴とする画像処理方法。 - 複数行の文字列を含む画像から各行の領域を特定する画像処理方法であって、
コンピュータが、各行の文字列の形式を定義するフォーマット文字列を取得するフォーマット文字列取得ステップと、
コンピュータが、画像から文字を構成する画素群である文字要素を抽出し、各々が文字要素を内包するように複数の文字領域を設定する文字領域設定ステップと、
コンピュータが、ある文字領域を起点として、所定の隣接条件を満たす文字領域を順に連結していくことで、同じ行に属すると推定される文字領域の組を抽出する行抽出処理を、起点とする文字領域を変えて繰り返し実行することにより、前記複数の文字領域を複数の行に分ける行認識ステップと、
を有しており、
前記行認識ステップにおいて、
第1の文字領域を起点として行抽出処理を行う場合と、前記第1の文字領域とは異なる行にある第2の文字領域を起点として行抽出処理を行う場合とで、同じ第3の文字領域が重複して選ばれ得る場合には、
前記第1の文字領域を起点とする行に前記第3の文字領域を加入した場合に生成される複数の行を第1の候補、前記第2の文字領域を起点とする行に前記第3の文字領域を加入した場合に生成される複数の行を第2の候補とし、
前記第1の候補の各行から認識される文字列の形式と前記フォーマット文字列で定義された各行の文字列の形式との類似度と、前記第2の候補の各行から認識される文字列の形式と前記フォーマット文字列で定義された各行の文字列の形式との類似度とを比較し、類似度が高い方の候補を採用する
ことを特徴とする画像処理方法。 - 請求項8、9又は10に記載の画像処理方法の各ステップをコンピュータに実行させることを特徴とするプログラム。
Priority Applications (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013106439A JP6286866B2 (ja) | 2013-05-20 | 2013-05-20 | 画像処理装置および画像処理方法 |
EP14801272.7A EP3001352B1 (en) | 2013-05-20 | 2014-02-27 | Image processing apparatus and image processing method |
CN201480027116.2A CN105229669B (zh) | 2013-05-20 | 2014-02-27 | 图像处理装置及图像处理方法 |
KR1020157032525A KR101747588B1 (ko) | 2013-05-20 | 2014-02-27 | 화상 처리 장치 및 화상 처리 방법 |
PCT/JP2014/054968 WO2014188753A1 (ja) | 2013-05-20 | 2014-02-27 | 画像処理装置および画像処理方法 |
US14/892,368 US9607237B2 (en) | 2013-05-20 | 2014-02-27 | Image processing apparatus and image processing method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013106439A JP6286866B2 (ja) | 2013-05-20 | 2013-05-20 | 画像処理装置および画像処理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014228953A true JP2014228953A (ja) | 2014-12-08 |
JP6286866B2 JP6286866B2 (ja) | 2018-03-07 |
Family
ID=51933319
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013106439A Active JP6286866B2 (ja) | 2013-05-20 | 2013-05-20 | 画像処理装置および画像処理方法 |
Country Status (6)
Country | Link |
---|---|
US (1) | US9607237B2 (ja) |
EP (1) | EP3001352B1 (ja) |
JP (1) | JP6286866B2 (ja) |
KR (1) | KR101747588B1 (ja) |
CN (1) | CN105229669B (ja) |
WO (1) | WO2014188753A1 (ja) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017138989A (ja) * | 2016-02-03 | 2017-08-10 | 株式会社ストラッドビジョン | 画像に含まれるテキストを検出する方法、装置及びコンピュータ読み取り可能な記録媒体 |
JP2018159972A (ja) * | 2017-03-22 | 2018-10-11 | 株式会社東芝 | 情報処理装置、方法及びプログラム |
JP6474504B1 (ja) * | 2018-01-23 | 2019-02-27 | 株式会社野村総合研究所 | 手書文字認識システム |
JP2019046484A (ja) * | 2018-10-16 | 2019-03-22 | 株式会社マーケットヴィジョン | 画像認識システム |
JP2020030857A (ja) * | 2015-04-08 | 2020-02-27 | 東芝テック株式会社 | 画像処理装置及び画像処理方法 |
WO2020080644A1 (ko) * | 2018-10-14 | 2020-04-23 | 김봉근 | 문자 입력 장치 및 방법 |
CN112686264A (zh) * | 2020-12-31 | 2021-04-20 | 中广核研究院有限公司 | 数字式仪表读数方法、装置、计算机设备和存储介质 |
JP2021125213A (ja) * | 2020-01-31 | 2021-08-30 | 株式会社Osk | 情報処理装置,情報処理方法及び情報処理プログラム |
US11908215B2 (en) | 2020-12-11 | 2024-02-20 | Canon Kabushiki Kaisha | Information processing apparatus, information processing method, and storage medium |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9965677B2 (en) * | 2014-12-09 | 2018-05-08 | Conduent Business Services, Llc | Method and system for OCR-free vehicle identification number localization |
JP6487255B2 (ja) * | 2015-03-31 | 2019-03-20 | 日本電産サンキョー株式会社 | 文字切り出し装置、文字認識装置、および文字切り出し方法 |
US10102617B2 (en) * | 2015-06-25 | 2018-10-16 | Gregory J. Gozdowiak | Method and system for automated meter reading |
CN115047997A (zh) * | 2016-02-08 | 2022-09-13 | 三菱电机株式会社 | 输入显示控制装置、输入显示控制方法和输入显示系统 |
KR102375094B1 (ko) * | 2017-04-13 | 2022-03-15 | 엘지전자 주식회사 | 확장 객체를 감지하여 주행하는 방법 및 이를 구현하는 로봇 |
US10356318B1 (en) * | 2017-04-27 | 2019-07-16 | Intuit, Inc. | Long document capture on mobile devices |
WO2019017961A1 (en) * | 2017-07-21 | 2019-01-24 | Hewlett-Packard Development Company, L.P. | OPTICAL RECOGNITION OF CHARACTERS BY CONSENSUS OF DATA SETS |
JP7170051B2 (ja) * | 2018-09-20 | 2022-11-11 | 富士フイルム株式会社 | 画像処理装置、画像処理方法及びプログラム、並びに携帯端末装置 |
KR102149099B1 (ko) * | 2019-04-09 | 2020-08-27 | 김봉근 | 문자 입력 장치 및 방법 |
GB201820569D0 (en) * | 2018-12-18 | 2019-01-30 | Continental Automotive Gmbh | Printed character recognition |
CN109977343B (zh) * | 2019-03-28 | 2023-03-31 | 武汉轻工大学 | 椭球面方程绘制方法、装置、设备及存储介质 |
EP4091097A4 (en) * | 2020-01-17 | 2023-07-26 | Microsoft Technology Licensing, LLC | TEXT LINES DETECTION |
JP2022019446A (ja) * | 2020-07-17 | 2022-01-27 | キヤノン株式会社 | 画像処理システム、装置、方法、プログラム |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01296393A (ja) * | 1988-05-25 | 1989-11-29 | Toshiba Corp | カテゴリ判定装置 |
JP2004038530A (ja) * | 2002-07-03 | 2004-02-05 | Ricoh Co Ltd | 画像処理方法、同方法の実行に用いるプログラム及び画像処理装置 |
JP2006277151A (ja) * | 2005-03-28 | 2006-10-12 | Fuji Xerox Co Ltd | 文字列画像切出装置、文字列画像切出方法およびプログラム |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6274181A (ja) * | 1985-09-27 | 1987-04-04 | Sony Corp | 文字認識装置 |
JPH06274680A (ja) * | 1993-03-17 | 1994-09-30 | Hitachi Ltd | 文書認識方法およびシステム |
EP0981243B1 (en) * | 1993-07-16 | 2010-03-17 | Sharp Kabushiki Kaisha | Image processor |
JP3108979B2 (ja) | 1994-07-28 | 2000-11-13 | セイコーエプソン株式会社 | 画像処理方法および画像処理装置 |
US5642435A (en) * | 1995-01-25 | 1997-06-24 | Xerox Corporation | Structured document processing with lexical classes as context |
JP4170441B2 (ja) | 1997-11-28 | 2008-10-22 | 富士通株式会社 | 文書画像傾き検出装置および文書画像傾き検出プログラムの記憶媒体 |
JP4395188B2 (ja) | 1997-11-28 | 2010-01-06 | 富士通株式会社 | 文書画像認識装置および文書画像認識プログラムの記憶媒体 |
JP4450888B2 (ja) * | 1999-05-28 | 2010-04-14 | 富士通株式会社 | 帳票認識方法 |
JP4047090B2 (ja) * | 2002-07-31 | 2008-02-13 | キヤノン株式会社 | 画像処理方法及び画像処理装置 |
JP5538812B2 (ja) * | 2009-10-23 | 2014-07-02 | キヤノン株式会社 | 画像処理装置、画像処理方法及びプログラム |
JP5724454B2 (ja) * | 2011-02-25 | 2015-05-27 | 村田機械株式会社 | 画像処理装置及び画像処理方法 |
-
2013
- 2013-05-20 JP JP2013106439A patent/JP6286866B2/ja active Active
-
2014
- 2014-02-27 WO PCT/JP2014/054968 patent/WO2014188753A1/ja active Application Filing
- 2014-02-27 KR KR1020157032525A patent/KR101747588B1/ko active IP Right Grant
- 2014-02-27 US US14/892,368 patent/US9607237B2/en active Active
- 2014-02-27 CN CN201480027116.2A patent/CN105229669B/zh active Active
- 2014-02-27 EP EP14801272.7A patent/EP3001352B1/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01296393A (ja) * | 1988-05-25 | 1989-11-29 | Toshiba Corp | カテゴリ判定装置 |
JP2004038530A (ja) * | 2002-07-03 | 2004-02-05 | Ricoh Co Ltd | 画像処理方法、同方法の実行に用いるプログラム及び画像処理装置 |
JP2006277151A (ja) * | 2005-03-28 | 2006-10-12 | Fuji Xerox Co Ltd | 文字列画像切出装置、文字列画像切出方法およびプログラム |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020030857A (ja) * | 2015-04-08 | 2020-02-27 | 東芝テック株式会社 | 画像処理装置及び画像処理方法 |
JP2017138989A (ja) * | 2016-02-03 | 2017-08-10 | 株式会社ストラッドビジョン | 画像に含まれるテキストを検出する方法、装置及びコンピュータ読み取り可能な記録媒体 |
JP2018159972A (ja) * | 2017-03-22 | 2018-10-11 | 株式会社東芝 | 情報処理装置、方法及びプログラム |
US10832100B2 (en) | 2017-03-22 | 2020-11-10 | Kabushiki Kaisha Toshiba | Target recognition device |
JP6474504B1 (ja) * | 2018-01-23 | 2019-02-27 | 株式会社野村総合研究所 | 手書文字認識システム |
JP2019128690A (ja) * | 2018-01-23 | 2019-08-01 | 株式会社野村総合研究所 | 手書文字認識システム |
US11132497B2 (en) | 2018-10-14 | 2021-09-28 | Bonggeun Kim | Device and method for inputting characters |
WO2020080644A1 (ko) * | 2018-10-14 | 2020-04-23 | 김봉근 | 문자 입력 장치 및 방법 |
JP2019046484A (ja) * | 2018-10-16 | 2019-03-22 | 株式会社マーケットヴィジョン | 画像認識システム |
JP2021125213A (ja) * | 2020-01-31 | 2021-08-30 | 株式会社Osk | 情報処理装置,情報処理方法及び情報処理プログラム |
US11908215B2 (en) | 2020-12-11 | 2024-02-20 | Canon Kabushiki Kaisha | Information processing apparatus, information processing method, and storage medium |
CN112686264A (zh) * | 2020-12-31 | 2021-04-20 | 中广核研究院有限公司 | 数字式仪表读数方法、装置、计算机设备和存储介质 |
CN112686264B (zh) * | 2020-12-31 | 2023-10-20 | 中广核研究院有限公司 | 数字式仪表读数方法、装置、计算机设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
WO2014188753A1 (ja) | 2014-11-27 |
EP3001352A1 (en) | 2016-03-30 |
CN105229669B (zh) | 2020-07-14 |
US20160092745A1 (en) | 2016-03-31 |
US9607237B2 (en) | 2017-03-28 |
JP6286866B2 (ja) | 2018-03-07 |
KR101747588B1 (ko) | 2017-06-14 |
EP3001352A4 (en) | 2017-02-15 |
EP3001352B1 (en) | 2022-01-26 |
KR20150143711A (ko) | 2015-12-23 |
CN105229669A (zh) | 2016-01-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6286866B2 (ja) | 画像処理装置および画像処理方法 | |
US9189694B2 (en) | Image processing device and image processing method | |
EP2553626B1 (en) | Segmentation of textual lines in an image that include western characters and hieroglyphic characters | |
US20180089835A1 (en) | Image processing apparatus for identifying region within image, information processing method, and storage medium | |
Kennard et al. | Separating lines of text in free-form handwritten historical documents | |
JP6116531B2 (ja) | 画像処理装置 | |
US11593591B2 (en) | Optical character recognition systems and methods | |
Fateh et al. | Enhancing optical character recognition: Efficient techniques for document layout analysis and text line detection | |
Song et al. | Recognition of merged characters based on forepart prediction, necessity-sufficiency matching, and character-adaptive masking | |
JP5041775B2 (ja) | 文字切出方法及び文字認識装置 | |
Singh et al. | Document layout analysis for Indian newspapers using contour based symbiotic approach | |
Naz et al. | Arabic script based character segmentation: a review | |
JP6118646B2 (ja) | 帳票処理装置、帳票処理方法、帳票処理プログラム | |
Chitrakala et al. | An efficient character segmentation based on VNP algorithm | |
JP2005250786A (ja) | 画像認識方法 | |
JP5039659B2 (ja) | 文字認識方法及び文字認識装置 | |
Ghaleb et al. | Segmentation of overlapped handwritten Arabic sub-words | |
JP5630098B2 (ja) | 情報処理装置およびプログラム | |
CN117475453B (zh) | 一种基于ocr的文书检测方法、装置及电子设备 | |
US10878271B2 (en) | Systems and methods for separating ligature characters in digitized document images | |
Hyuga et al. | Deformed and Touched Characters Recognition | |
JP2000207491A (ja) | 文字列読取方法及び装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160304 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170606 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170724 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180109 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180122 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6286866 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |