JP5939056B2 - 画像におけるテキスト領域を位置決めする方法及び装置 - Google Patents
画像におけるテキスト領域を位置決めする方法及び装置 Download PDFInfo
- Publication number
- JP5939056B2 JP5939056B2 JP2012145538A JP2012145538A JP5939056B2 JP 5939056 B2 JP5939056 B2 JP 5939056B2 JP 2012145538 A JP2012145538 A JP 2012145538A JP 2012145538 A JP2012145538 A JP 2012145538A JP 5939056 B2 JP5939056 B2 JP 5939056B2
- Authority
- JP
- Japan
- Prior art keywords
- area
- text
- stroke
- areas
- difference
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Image Analysis (AREA)
- Character Input (AREA)
- Character Discrimination (AREA)
Description
は、単一の候補筆画領域が真の筆画領域であるか否かについての確信度であり(呈する値がyiの場合によるものである)、E(xi,xj,yi,yj,λbi)は、呈する値がyi,yjの場合の確信度を示し、
ステップS7025により、一つのチェーン構造は二つの新しいチェーン構造になるので、再びS7023に戻し、判断を続ける。
(付記1)
画像におけるテキスト領域を位置決めする方法であって、
入力画像における各画素の周りに存在可能なテキストの大きさを推定するステップと、
前記テキストの大きさ及び領域差異度に基づいて、前記入力画像から候補筆画領域を抽出するステップと、
前記候補筆画領域から真の筆画領域を特定するステップと、
前記真の筆画領域をマージしてテキスト領域を形成するステップと
を含む方法。
(付記2)
前記入力画像における各画素の周りに存在可能なテキストの大きさを推定するステップは、
前記入力画像に基づいて複数の階層のピラミッド画像を生成するステップと、
各階層のピラミッド画像における各画素の周りにテキストの存在する確率を推定するステップと、
前記確率及びピラミッドの階層に対応するテキストの大きさに基づいて前記入力画像における各画素の周りに存在可能なテキストの大きさを算出するステップと
を更に含む、付記1に記載の方法。
(付記3)
前記候補筆画領域を抽出するステップは、
前記入力画像における隣接した領域に対して、領域間の差異度と領域内の差異度を算出するステップと、
推定された入力画像における各画素の周りに存在可能なテキストの大きさに基づいて、領域の周りに存在可能なテキストの大きさを推定し、推定された領域の周りに存在可能なテキストの大きさに基づいて各領域内の差異度を調整するステップと、
隣接した領域の領域間の差異度及び隣接した領域の調整後の領域内の差異度に基づいて、前記隣接した領域をマージすべきか否かを判断するステップと、
前記隣接した領域をマージすべきと判断された場合に、前記隣接した領域をマージし、上述したステップを繰り返すステップと
を更に含み、
現在のすべての隣接した領域をいずれもマージすべきではないと判断された場合は、候補筆画領域を抽出したことを意味する、付記1に記載の方法。
(付記4)
隣接した領域の領域間の差異度が、隣接した領域の調整後の領域内の差異度の最小値よりも小さい場合に、前記隣接した領域をマージする、付記3に記載の方法。
(付記5)
前記の抽出ステップを開始する際の隣接した領域は、隣接した画素であり、前記領域の差異度は色差を含む、付記3又は4に記載の方法。
(付記6)
前記真の筆画領域を特定するステップは、
候補筆画領域のうち互いに相関する候補筆画領域を特定するステップと、
入力画像におけるすべての候補筆画領域のそれぞれが真の筆画領域であるか否かについての多種の仮定組合せを生成するステップと、
各種の仮定組合せに対して、前記仮定組合せ及び各候補筆画領域における画素の特徴に基づいて、各候補筆画領域の第1の確信度を算出し、前記仮定組合せ及び互いに相関する候補筆画領域における画素の特徴に基づいて、第1の確信度に対応する第2の確信度を算出し、その後、前記第1の確信度及び前記第2の確信度に基づいて、当該仮定組合せの場合を表す確信度を算出するステップと、
当該仮定組合せの場合を表す確信度の最も高い場合に対応した仮定組合せを、真の筆画領域を特定する結果とするステップと、
前記互いに相関する候補筆画領域が同一のテキスト行に属した場合に、当該仮定組合せの場合を表す確信度の算出において、その対応する第2の確信度に大きい重み係数を付加するステップと
を更に含む、付記1に記載の方法。
(付記7)
候補筆画領域のサイズ情報及び候補筆画領域間の距離に基づいて、前記候補筆画領域が相関するか否かを判断するステップを更に含む、付記6に記載の方法。
(付記8)
特徴空間において候補筆画領域をフィットし、同一のフィッティング曲線に属する候補筆画領域を、同一のテキスト行に属すると特定するステップと、
回帰誤差に基づいて、前記当該仮定組合せの場合を表す確信度の算出における重み係数を算出するステップと
を更に含む、付記6又は7に記載の方法。
(付記9)
前記真の筆画領域をマージするステップは、
筆画領域間の距離に基づいて筆画領域間の接続関係を特定するステップと、
異なるテキスト行に属する筆画領域間の接続関係を取り除くステップと、
異なる字に属する筆画領域間の接続関係を取り除くステップと
を更に含む、付記1に記載の方法。
(付記10)
画像におけるテキスト領域を位置決めする装置であって、
入力画像における各画素の周りに存在可能なテキストの大きさを推定するための推定ユニットと、
前記テキストの大きさ及び領域の差異度に基づいて、前記入力画像から候補筆画領域を抽出するための抽出ユニットと、
前記候補筆画領域から真の筆画領域を特定するための特定ユニットと、
真の筆画単位をマージしてテキスト領域を形成するためのマージ・ユニットと
を含む装置。
(付記11)
前記推定ユニットは、
前記入力画像に基づいて複数の階層のピラミッド画像を生成するための画像ピラミッド生成ユニットと、
各階層のピラミッド画像における各画素の周りにテキストの存在する確率を推定するための推定サブユニットと、
前記確率及びピラミッド階層に対応するテキストの大きさに基づいて前記入力画像における各画素の周りに存在可能なテキストの大きさを算出するための算出ユニットと
を含む、付記10に記載の装置。
(付記12)
前記抽出ユニットは、
前記入力画像における隣接した領域に対して、領域間の差異度及び領域内の差異度を算出するための差異度算出ユニットと、
推定された入力画像における各画素の周りに存在可能なテキストの大きさに基づいて、領域の周りに存在可能なテキストの大きさを推定し、推定された領域の周りに存在可能なテキストの大きさに基づいて、各領域内の差異度を調整するための調整ユニットと、
隣接した領域の領域間の差異度及び前記隣接した領域の調整後の領域内の差異度に基づいて、前記隣接した領域をマージする隣接領域マージ・ユニットと
を含む、付記10に記載の装置。
(付記13)
前記特定ユニットは、
候補筆画領域のうち互いに相関する候補筆画領域を特定するための相関特定ユニットと、
入力画像におけるすべての候補筆画領域それぞれが真の筆画領域であるか否かについての多種の仮定組合せを生成するための仮定組合せユニットと、
各種の仮定組合せに対して、前記仮定組合せ及び各候補筆画領域における画素の特徴に基づいて、各候補筆画領域の第1の確信度を算出し、前記仮定組合せ及び互いに相関する候補筆画領域における画素の特徴に基づいて、第1の確信度に対応する第2の確信度を算出し、その後、前記第1の確信度及び前記第2の確信度に基づいて、当該仮定組合せにおける場合を表す確信度を算出するための確信度算出ユニットと、
当該仮定組合せにおける場合を表す確信度の最も高い場合に対応した仮定組合せを、真の筆画領域を特定する結果とする特定サブユニットと
を含み、
前記互いに相関する候補筆画領域が同一のテキスト行に属した場合に、当該仮定組合せにおける場合を表す確信度の算出において、その対応する第2の確信度に大きい重み係数を付加する、付記10に記載の装置。
(付記14)
前記相関特定ユニットは、候補筆画領域のサイズ情報及び候補筆画領域間の距離に基づいて、前記候補筆画領域が相関するか否かを判断する、付記13に記載の装置。
(付記15)
前記確信度算出ユニットは、
特徴空間において候補筆画領域をフィットし、同一のフィッティング曲線に属する候補筆画領域を、同一のテキスト行に属すると特定し、回帰誤差に基づいて、当該仮定組合せにおける場合を表す確信度の算出における重み係数を算出する、付記13又は14に記載の装置。
(付記16)
前記マージ・ユニットは、
筆画領域間の距離に基づいて筆画領域間の接続関係を特定するための接続ユニットと、
異なるテキスト行に属する筆画領域間の接続関係を取り除くための行分けユニットと、
異なる字に属する筆画領域間の接続関係を取り除くための字分けユニットと
を含む、付記10に記載の装置。
101 推定ユニット
102 抽出ユニット
103 特定ユニット
104 マージ・ユニット
Claims (8)
- 画像におけるテキスト領域を位置決めする方法であって、
入力画像における各画素の周りに存在可能なテキストの大きさを推定するステップと、
前記テキストの大きさ及び領域差異度に基づいて、前記入力画像から候補筆画領域を抽出するステップと、
前記候補筆画領域から真の筆画領域を特定するステップと、
前記真の筆画領域をマージしてテキスト領域を形成するステップと
を含み、
前記候補筆画領域を抽出するステップは、
前記入力画像における隣接した領域に対して、領域間の差異度と領域内の差異度を算出するステップと、
推定された入力画像における各画素の周りに存在可能なテキストの大きさに基づいて、領域の周りに存在可能なテキストの大きさを推定し、推定された領域の周りに存在可能なテキストの大きさに基づいて各領域内の差異度を調整するステップと、
隣接した領域の領域間の差異度及び隣接した領域の調整後の領域内の差異度に基づいて、前記隣接した領域をマージすべきか否かを判断するステップと、
前記隣接した領域をマージすべきと判断された場合に、前記隣接した領域をマージし、上述したステップを繰り返すステップと
を含み、
現在のすべての隣接した領域をいずれもマージすべきではないと判断された場合は、候補筆画領域を抽出したことを意味する、
方法。 - 隣接した領域の領域間の差異度が、隣接した領域の調整後の領域内の差異度の最小値よりも小さい場合に、前記隣接した領域をマージする、請求項1に記載の方法。
- 前記の抽出ステップを開始する際の隣接した領域は、隣接した画素であり、前記領域の差異度は色差を含む、請求項1又は2に記載の方法。
- 画像におけるテキスト領域を位置決めする方法であって、
入力画像における各画素の周りに存在可能なテキストの大きさを推定するステップと、
前記テキストの大きさ及び領域差異度に基づいて、前記入力画像から候補筆画領域を抽出するステップと、
前記候補筆画領域から真の筆画領域を特定するステップと、
前記真の筆画領域をマージしてテキスト領域を形成するステップと
を含み、
前記真の筆画領域を特定するステップは、
候補筆画領域のうち互いに相関する候補筆画領域を特定するステップと、
入力画像におけるすべての候補筆画領域のそれぞれが真の筆画領域であるか否かについての多種の仮定組合せを生成するステップと、
各種の仮定組合せに対して、前記仮定組合せ及び各候補筆画領域における画素の特徴に基づいて、各候補筆画領域の第1の確信度を算出し、前記仮定組合せ及び互いに相関する候補筆画領域における画素の特徴に基づいて、第1の確信度に対応する第2の確信度を算出し、その後、前記第1の確信度及び前記第2の確信度に基づいて、当該仮定組合せの場合を表す確信度を算出するステップと、
当該仮定組合せの場合を表す確信度の最も高い場合に対応した仮定組合せを、真の筆画領域を特定する結果とするステップと、
前記互いに相関する候補筆画領域が同一のテキスト行に属した場合に、当該仮定組合せの場合を表す確信度の算出において、その対応する第2の確信度に大きい重み係数を付加するステップと
を含む、方法。 - 候補筆画領域のサイズ情報及び候補筆画領域間の距離に基づいて、前記候補筆画領域が相関するか否かを判断するステップを更に含む、請求項4に記載の方法。
- 特徴空間において候補筆画領域をフィットし、同一のフィッティング曲線に属する候補筆画領域を、同一のテキスト行に属すると特定するステップと、
回帰誤差に基づいて、当該仮定組合せの場合を表す確信度の算出における重み係数を算出するステップと
を更に含む、請求項4又は5に記載の方法。 - 画像におけるテキスト領域を位置決めする方法であって、
入力画像における各画素の周りに存在可能なテキストの大きさを推定するステップと、
前記テキストの大きさ及び領域差異度に基づいて、前記入力画像から候補筆画領域を抽出するステップと、
前記候補筆画領域から真の筆画領域を特定するステップと、
前記真の筆画領域をマージしてテキスト領域を形成するステップと
を含み、
前記真の筆画領域をマージするステップは、
筆画領域間の距離に基づいて筆画領域間の接続関係を特定するステップと、
異なるテキスト行に属する筆画領域間の接続関係を取り除くステップと、
異なる字に属する筆画領域間の接続関係を取り除くステップと
を含む、方法。 - 画像におけるテキスト領域を位置決めする装置であって、
入力画像における各画素の周りに存在可能なテキストの大きさを推定するための推定ユニットと、
前記テキストの大きさ及び領域の差異度に基づいて、前記入力画像から候補筆画領域を抽出するための抽出ユニットと、
前記候補筆画領域から真の筆画領域を特定するための特定ユニットと、
真の筆画単位をマージしてテキスト領域を形成するためのマージ・ユニットと
を含み、
前記抽出ユニットは、
前記入力画像における隣接した領域に対して、領域間の差異度と領域内の差異度を算出し、
推定された入力画像における各画素の周りに存在可能なテキストの大きさに基づいて、領域の周りに存在可能なテキストの大きさを推定し、推定された領域の周りに存在可能なテキストの大きさに基づいて各領域内の差異度を調整し、
隣接した領域の領域間の差異度及び隣接した領域の調整後の領域内の差異度に基づいて、前記隣接した領域をマージすべきか否かを判断し、
前記隣接した領域をマージすべきと判断された場合に、前記隣接した領域をマージし、上述したステップを繰り返し、
現在のすべての隣接した領域をいずれもマージすべきではないと判断された場合は、候補筆画領域を抽出したことを意味する、
装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110192175.3 | 2011-06-30 | ||
CN201110192175.3A CN102855478B (zh) | 2011-06-30 | 2011-06-30 | 图像中文本区域定位方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013016168A JP2013016168A (ja) | 2013-01-24 |
JP5939056B2 true JP5939056B2 (ja) | 2016-06-22 |
Family
ID=47402055
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012145538A Expired - Fee Related JP5939056B2 (ja) | 2011-06-30 | 2012-06-28 | 画像におけるテキスト領域を位置決めする方法及び装置 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP5939056B2 (ja) |
CN (1) | CN102855478B (ja) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105117706B (zh) * | 2015-08-28 | 2019-01-18 | 小米科技有限责任公司 | 图像处理方法和装置、字符识别方法和装置 |
CN106570500B (zh) * | 2016-11-11 | 2018-01-23 | 北京三快在线科技有限公司 | 文本行的识别方法及装置、计算设备 |
CN108121988B (zh) * | 2016-11-30 | 2021-09-24 | 富士通株式会社 | 信息处理方法和装置以及信息检测方法和装置 |
CN108717542B (zh) * | 2018-04-23 | 2020-09-15 | 北京小米移动软件有限公司 | 识别文字区域的方法、装置及计算机可读存储介质 |
CN108921167A (zh) * | 2018-06-22 | 2018-11-30 | 四川斐讯信息技术有限公司 | 一种彩色图片自动裁剪方法及系统 |
CN109308476B (zh) * | 2018-09-06 | 2019-08-27 | 邬国锐 | 票据信息处理方法、系统及计算机可读存储介质 |
CN109670532B (zh) * | 2018-11-23 | 2022-12-09 | 腾讯医疗健康(深圳)有限公司 | 生物体器官组织图像的异常识别方法、装置及系统 |
CN110610166B (zh) * | 2019-09-18 | 2022-06-07 | 北京猎户星空科技有限公司 | 文本区域检测模型训练方法、装置、电子设备和存储介质 |
CN112215123B (zh) * | 2020-10-09 | 2022-10-25 | 腾讯科技(深圳)有限公司 | 一种目标检测方法、装置及存储介质 |
CN112419174B (zh) * | 2020-11-04 | 2022-09-20 | 中国科学院自动化研究所 | 基于门循环单元的图像文字去除方法、系统及装置 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0646253A (ja) * | 1992-07-27 | 1994-02-18 | Oki Electric Ind Co Ltd | 文書画像の領域抽出方法 |
JP3476595B2 (ja) * | 1995-06-26 | 2003-12-10 | シャープ株式会社 | 画像領域分割方法、および画像2値化方法 |
JPH09186858A (ja) * | 1996-01-08 | 1997-07-15 | Canon Inc | 画像処理方法及び装置、及びコンピュータ制御装置 |
US6185329B1 (en) * | 1998-10-13 | 2001-02-06 | Hewlett-Packard Company | Automatic caption text detection and processing for digital images |
JP4112968B2 (ja) * | 2002-12-26 | 2008-07-02 | 富士通株式会社 | ビデオテキスト処理装置 |
JP2006318341A (ja) * | 2005-05-16 | 2006-11-24 | Sony Corp | 検知対象画像判定装置、検知対象画像判定方法および検知対象画像判定プログラム |
CN101526944B (zh) * | 2008-12-23 | 2011-10-12 | 广州乐庚信息科技有限公司 | 图像检索比对方法 |
-
2011
- 2011-06-30 CN CN201110192175.3A patent/CN102855478B/zh not_active Expired - Fee Related
-
2012
- 2012-06-28 JP JP2012145538A patent/JP5939056B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN102855478B (zh) | 2015-11-25 |
JP2013016168A (ja) | 2013-01-24 |
CN102855478A (zh) | 2013-01-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5939056B2 (ja) | 画像におけるテキスト領域を位置決めする方法及び装置 | |
US11120556B2 (en) | Iterative method for salient foreground detection and multi-object segmentation | |
JP4545641B2 (ja) | 類似画像検索方法,類似画像検索システム,類似画像検索プログラム及び記録媒体 | |
CN105184763B (zh) | 图像处理方法和装置 | |
JP6075190B2 (ja) | 画像処理方法及び装置 | |
US10748023B2 (en) | Region-of-interest detection apparatus, region-of-interest detection method, and recording medium | |
CN110913243B (zh) | 一种视频审核的方法、装置和设备 | |
CN108629286B (zh) | 一种基于主观感知显著模型的遥感机场目标检测方法 | |
WO2019071976A1 (zh) | 基于区域增长和眼动模型的全景图像显著性检测方法 | |
CN109993753B (zh) | 遥感影像中城市功能区的分割方法及装置 | |
CN111274964B (zh) | 一种基于无人机视觉显著性分析水面污染物的检测方法 | |
CN106157330B (zh) | 一种基于目标联合外观模型的视觉跟踪方法 | |
EP2821935B1 (en) | Vehicle detection method and device | |
CN104077765B (zh) | 图像分割装置、图像分割方法 | |
Shi et al. | Adaptive graph cut based binarization of video text images | |
JP6542230B2 (ja) | 投影ひずみを補正するための方法及びシステム | |
CN114445788A (zh) | 车辆停放检测方法、装置、终端设备和可读存储介质 | |
JP5786838B2 (ja) | 画像領域分割装置、方法、およびプログラム | |
US8891869B2 (en) | System and method for effectively performing an integrated segmentation procedure | |
WO2018223370A1 (zh) | 一种基于时空约束的视频显著性检测方法及系统 | |
CN111476821B (zh) | 基于在线学习的目标跟踪方法 | |
Xu et al. | An edge-oriented framework for saliency detection | |
Song et al. | Unsupervised change detection for remote sensing images based on principal component analysis and differential evolution | |
CN110929572B (zh) | 林火识别方法和系统 | |
US20240153294A1 (en) | Automatic template recommendation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150319 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160119 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160126 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160324 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160419 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160502 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5939056 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |