JP5029412B2 - テロップ文字パターン抽出プログラム、テロップ文字パターン抽出装置、およびテロップ文字パターン抽出方法 - Google Patents
テロップ文字パターン抽出プログラム、テロップ文字パターン抽出装置、およびテロップ文字パターン抽出方法 Download PDFInfo
- Publication number
- JP5029412B2 JP5029412B2 JP2008039407A JP2008039407A JP5029412B2 JP 5029412 B2 JP5029412 B2 JP 5029412B2 JP 2008039407 A JP2008039407 A JP 2008039407A JP 2008039407 A JP2008039407 A JP 2008039407A JP 5029412 B2 JP5029412 B2 JP 5029412B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- pattern
- pixel connection
- color separation
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000605 extraction Methods 0.000 title claims description 101
- 238000000926 separation method Methods 0.000 claims description 183
- 238000000034 method Methods 0.000 claims description 133
- 238000012545 processing Methods 0.000 claims description 106
- 239000002131 composite material Substances 0.000 claims description 61
- 230000010339 dilation Effects 0.000 claims description 17
- 230000002194 synthesizing effect Effects 0.000 claims description 11
- 230000000916 dilatatory effect Effects 0.000 claims description 8
- 238000010586 diagram Methods 0.000 description 26
- 238000011156 evaluation Methods 0.000 description 14
- 230000006870 function Effects 0.000 description 12
- 230000002093 peripheral effect Effects 0.000 description 8
- 238000004364 calculation method Methods 0.000 description 4
- 238000004519 manufacturing process Methods 0.000 description 4
- 230000001174 ascending effect Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 238000012015 optical character recognition Methods 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
Images
Landscapes
- Character Input (AREA)
- Image Analysis (AREA)
Description
本実施の形態のテロップ文字パターン抽出プログラム、テロップ文字パターン抽出装置、およびテロップ文字パターン抽出方法は、
1)文字認識を使用して色分解2値画像から正しい行を抽出する技術と、
2)ノイズを含む行パターンから文字認識を使用してキー文字と呼ばれる代表的な文字パターン候補を求め、そのキー文字を使って生成された文字候補矩形の組み合わせとなる複数の文字列候補矩形列の中から、文字の帰属度や文字間隔情報といった文字パターンの特徴を使用して、正しい文字列矩形を求める技術と、
を用いて、テロップの中から文字パターンを抽出する技術である。
図2は、本実施の形態にかかるテロップ文字パターン抽出装置のハードウェア構成を示すブロック図である。図2において、テロップ文字パターン抽出装置は、CPU(Central Processing Unit)201と、ROM(Read‐Only Memory)202と、RAM(Random Access Memory)203と、HDD(Hard Disk Drive)204と、HD(Hard Disk)205と、FDD(Flexible Disk Drive)206と、着脱可能な記録媒体の一例としてのFD(Flexible Disk)207と、ディスプレイ208と、I/F(Interface)209と、キーボード210と、マウス211と、スキャナ212と、プリンタ213と、を備えている。また、各構成部はバス200によってそれぞれ接続されている。
図3は、本実施の形態にかかるテロップ文字パターン抽出装置の機能的構成を示すブロック図である。図3において、テロップ文字パターン抽出装置300は、取得部301と、色分解画像生成部302と、周辺ノイズ除去処理部303と、エッジMFIノイズ除去処理部304と、行領域抽出部305と、行領域選択部306と、文字間ノイズ除去処理部307と、文字矩形内ノイズ除去処理部308と、を含む構成である。
まず、色分解画像生成部302の詳細な処理内容について図4〜図7を用いて説明する。図4は、平均画像およびエッジ2値画像の生成内容を示す説明図である。図4において、時系列で入力されてくる指定テロップ区間内の一連のフレーム画像401の同一位置の画素値を平均化することで、平均画像410が生成される。
周辺ノイズ除去処理部303の詳細な処理内容について図8を用いて説明する。図8は、画像周囲のノイズ除去処理(ステップS103)により処理された色分解画像を示す説明図である。色分解画像801は、色分解画像701の画像周囲のノイズ除去処理により処理された色分解画像であり、色分解画像802は、色分解画像702の画像周囲のノイズ除去処理により処理された色分解画像であり、色分解画像803は、色分解画像703の画像周囲のノイズ除去処理により処理された色分解画像であり、色分解画像804は、色分解画像704の画像周囲のノイズ除去処理により処理された色分解画像である。
エッジMFIノイズ除去処理部304の詳細な処理内容について、図4、図9〜図11を用いて説明する。図4において、一連のフレーム画像401は、公知のエッジ抽出処理(たとえば、Cannyエッジ)と2値化処理により、一連のエッジ2値画像402に変換され、同一位置の画素値を合計することで、エッジ濃淡画像420が生成される。そして、エッジ濃淡画像420を、固定しきい値で2値化することで、エッジ2値画像430が生成される。
つぎに、行領域抽出部305の詳細な処理内容について説明する。図14は、行領域抽出部305による行領域抽出処理(ステップS105)の詳細な処理手順を示すフローチャートである。図14において、まず、行方向決定処理を実行する(ステップS1401)。具体的には、色分解2値画像の領域形状から行方向を決定する。すなわち、色分解2値画像の領域形状が横長なら横書き、縦長なら縦書きとする。行方向は、色分解2値画像の画素の縦横比で決定することができる。
つぎに、行領域選択部306の詳細な処理内容について説明する。行領域選択部306では、行領域が特定された各色分解2値画像から、文字らしい黒画素連結領域が多く存在する行領域を行ごとに選択する。具体的には、図17を例に挙げると、同一行(1行目)の行領域L11,L21,L31,L41の中から、文字らしい黒画素連結領域が多く存在する行領域を選択する。同様に、同一行(2行目)の行領域L12,L22,L32,L42の中から、文字らしい黒画素連結領域が多く存在する行領域を選択する。選択された各行領域が、同一の色分解2値画像に存在する必要はない。
(A)確信度CがC≧Ctである(たとえば、Ct=0.60)。
(B)外接矩形の各辺の長さが所定画素数(たとえば10画素)以上である。
(C)ノイズ文字と一致しない。
つぎに、文字間ノイズ除去処理部307の詳細な処理内容について説明する。行領域選択部306により得られた合成2値画像から行領域ごとに、文字に相当する黒画素連結領域間のノイズを除去する。
(E)ノイズ文字(図18を参照)と一致しない(一致判断は上記(C)と同様。)。
(F)選択行領域内に収まっている(はみ出していない)こと。
(H)既出でないこと(同一矩形の複数出現防止のため)。
(I)包含されている文字候補矩形の高さが行高さの一定割合(たとえば30%)以下の場合、包含されている文字候補矩形(内部の黒画素連結領域含む)を削除する。ただし、文字候補矩形が中心付近にある行方向に長い矩形である場合は、長音である可能性があるため、削除しない。
{s1,s4}
{s1,s5}
{s1,s3,s5}
{s2,s4}
{s2,s5}
つぎに、文字矩形内ノイズ除去処理部308の詳細な処理内容について説明する。文字矩形内ノイズ除去処理部308は、文字候補矩形から文字パターンに該当しない黒画素連結領域を除去して、文字パターンに該当する黒画素連結領域のみを抽出する。具体的には、たとえば、文字候補矩形内の黒画素連結領域が2画素以上10画素以下の場合、黒画素連結領域を組み合わせて文字パターンを生成する。
テロップを含む一連のフレーム画像の平均画像を取得する取得手段、
前記取得手段によって取得された平均画像を色クラスタリングすることにより、複数の色分解画像を生成する生成手段、
一連のフレーム画像からエッジ抽出したエッジ画像を集積して2値化したエッジ2値画像と、前記生成手段によって生成された色分解画像と、当該色分解画像をダイレーションしたダイレーション画像と、前記平均画像と、に基づいて、前記各色分解画像の中から動きのあるパターンをノイズとして除去するエッジMFIノイズ除去手段、
前記各色分解画像を前記エッジMFIノイズ除去手段によるノイズ除去することにより得られた各色分解2値画像の中から行ごとに選択された行領域を合成することにより、合成2値画像を生成する行領域選択手段、
前記行領域選択手段によって生成された合成2値画像内の各画素連結パターンの組み合わせからなる文字パターンの文字認識結果に基づいて、当該文字パターンの外接矩形の中から前記文字パターンに不要な画素連結パターンをノイズとして除去することにより、文字列パターンを出力する文字矩形内ノイズ除去手段、
として機能させることを特徴とするテロップ文字パターン抽出プログラム。
前記エッジ2値画像において前記平均画像の画素連結パターンに接する画素数と、前記ダイレーション画像から前記色分解画像を引いた差分画像において前記平均画像の画素連結パターンに接する画素数と、に基づいて、前記各色分解画像の中から動きのあるパターンをノイズとして除去することを特徴とする付記1に記載のテロップ文字パターン抽出プログラム。
前記合成2値画像内の画素連結パターンの中から文字列の規則に違反する画素連結パターンを除去する文字間ノイズ除去手段として機能させ、
前記文字矩形内ノイズ除去手段は、
前記文字間ノイズ除去手段によるノイズ除去後の合成2値画像に基づいて、前記文字列パターンを出力することを特徴とする付記1または2に記載のテロップ文字パターン抽出プログラム。
前記合成2値画像内の画素連結パターンの文字認識結果に基づいて、前記合成2値画像の中から文字らしいキー文字パターンを抽出することにより、当該キー文字パターンを包含する矩形に包含される画素連結パターンに外接する文字候補矩形を抽出する文字候補矩形抽出手段と、
前記文字候補矩形抽出手段によって抽出された文字候補矩形ペアが重複関係または包含関係にある場合、文字候補矩形ペアのうち当該重複関係または包含関係に関する規則に違反する文字候補矩形を除去する重複・包含矩形ノイズ除去手段と、を備えることを特徴とする付記3に記載のテロップ文字パターン抽出プログラム。
前記合成2値画像内の画素連結パターンの文字認識結果に基づいて、前記合成2値画像の中から文字らしいキー文字パターンを抽出することにより、当該キー文字パターンを包含する矩形に包含される画素連結パターンに外接する文字候補矩形を抽出する文字候補矩形抽出手段を備え、
前記文字候補矩形抽出手段によって抽出された隣接する文字候補矩形が重複している重複文字候補矩形集合の中から、文字間隔の規則を遵守する文字候補矩形の組み合わせからなる組み合わせ矩形列を抽出することを特徴とする付記3に記載のテロップ文字パターン抽出プログラム。
前記合成2値画像内の画素連結パターンの文字認識結果に基づいて、前記合成2値画像の中から文字らしいキー文字パターンを抽出することにより、当該キー文字パターンを包含する矩形に包含される画素連結パターンに外接する文字候補矩形を抽出する文字候補矩形抽出手段と、
前記文字候補矩形抽出手段によって抽出された文字候補矩形ペアが重複関係または包含関係にある場合、文字候補矩形ペアのうち当該重複関係または包含関係に関する規則に違反する文字候補矩形を除去する重複・包含矩形ノイズ除去手段と、を備え、
前記重複・包含矩形ノイズ除去手段によるノイズ除去結果に基づいて、隣接する文字候補矩形が重複している重複文字候補矩形集合の中から、文字間隔の規則を遵守する文字候補矩形の組み合わせからなる組み合わせ矩形列を抽出することを特徴とする付記3に記載のテロップ文字パターン抽出プログラム。
テロップを含む一連のフレーム画像の平均画像を取得する取得手段、
前記取得手段によって取得された平均画像を色クラスタリングすることにより、複数の色分解画像を生成する生成手段、
前記生成手段によって生成された各色分解画像の中から行ごとに選択された行領域を合成することにより、合成2値画像を生成する行領域選択手段、
前記行領域選択手段によって生成された合成2値画像内の画素連結パターンの中から文字列の規則に違反する画素連結パターンを除去する文字間ノイズ除去手段、
前記文字間ノイズ除去手段によるノイズ除去後の合成2値画像内の各画素連結パターンの組み合わせからなる文字パターンの文字認識結果に基づいて、当該文字パターンの外接矩形の中から前記文字パターンに不要な画素連結パターンをノイズとして除去することにより、文字列パターンを出力する文字矩形内ノイズ除去手段、
として機能させることを特徴とするテロップ文字パターン抽出プログラム。
前記取得手段によって取得された平均画像を色クラスタリングすることにより、複数の色分解画像を生成する生成手段と、
一連のフレーム画像からエッジ抽出したエッジ画像を集積して2値化したエッジ2値画像と、前記色分解画像と、当該色分解画像をダイレーションしたダイレーション画像と、前記平均画像と、に基づいて、前記各色分解画像の中から動きのあるパターンをノイズとして除去するエッジMFIノイズ除去手段と、
前記各色分解画像を前記エッジMFIノイズ除去手段によるノイズ除去することにより得られた各色分解2値画像の中から行ごとに選択された行領域を合成することにより、合成2値画像を生成する行領域選択手段と、
前記行領域選択手段によって生成された合成2値画像内の各画素連結パターンの組み合わせからなる文字パターンの文字認識結果に基づいて、当該文字パターンの外接矩形の中から前記文字パターンに不要な画素連結パターンをノイズとして除去することにより、文字列パターンを出力する文字矩形内ノイズ除去手段と、
を備えることを特徴とするテロップ文字パターン抽出装置。
前記取得手段によって取得された平均画像を色クラスタリングすることにより、複数の色分解画像を生成する生成手段と、
前記生成手段によって生成された各色分解画像の中から行ごとに選択された行領域を合成することにより、合成2値画像を生成する行領域選択手段と、
前記行領域選択手段によって生成された合成2値画像内の画素連結パターンの中から文字列の規則に違反する画素連結パターンを除去する文字間ノイズ除去手段と、
前記文字間ノイズ除去手段によるノイズ除去後の合成2値画像内の各画素連結パターンの組み合わせからなる文字パターンの文字認識結果に基づいて、当該文字パターンの外接矩形の中から前記文字パターンに不要な画素連結パターンをノイズとして除去することにより、文字列パターンを出力する文字矩形内ノイズ除去手段と、
を備えることを特徴とするテロップ文字パターン抽出装置。
前記取得工程によって取得された平均画像を色クラスタリングすることにより、複数の色分解画像を生成する生成工程と、
一連のフレーム画像からエッジ抽出したエッジ画像を集積して2値化したエッジ2値画像と、前記色分解画像と、当該色分解画像をダイレーションしたダイレーション画像と、前記平均画像と、に基づいて、前記各色分解画像の中から動きのあるパターンをノイズとして除去するエッジMFIノイズ除去工程と、
前記各色分解画像を前記エッジMFIノイズ除去工程によるノイズ除去することにより得られた各色分解2値画像の中から行ごとに選択された行領域を合成することにより、合成2値画像を生成する行領域選択工程と、
前記行領域選択工程によって生成された合成2値画像内の各画素連結パターンの組み合わせからなる文字パターンの文字認識結果に基づいて、当該文字パターンの外接矩形の中から前記文字パターンに不要な画素連結パターンをノイズとして除去することにより、文字列パターンを出力する文字矩形内ノイズ除去工程と、
を含んだことを特徴とするテロップ文字パターン抽出方法。
前記取得工程によって取得された平均画像を色クラスタリングすることにより、複数の色分解画像を生成する生成工程と、
前記生成工程によって生成された各色分解画像の中から行ごとに選択された行領域を合成することにより、合成2値画像を生成する行領域選択工程と、
前記行領域選択工程によって生成された合成2値画像内の画素連結パターンの中から文字列の規則に違反する画素連結パターンを除去する文字間ノイズ除去工程と、
前記文字間ノイズ除去工程によるノイズ除去後の合成2値画像内の各画素連結パターンの組み合わせからなる文字パターンの文字認識結果に基づいて、当該文字パターンの外接矩形の中から前記文字パターンに不要な画素連結パターンをノイズとして除去することにより、文字列パターンを出力する文字矩形内ノイズ除去工程と、
を含んだことを特徴とするテロップ文字パターン抽出方法。
301 取得部
302 色分解画像生成部
303 周辺ノイズ除去処理部
304 ノイズ除去処理部
305 行領域抽出部
306 行領域選択部
307 文字間ノイズ除去処理部
308 文字矩形内ノイズ除去処理部
Claims (10)
- コンピュータを、
テロップを含む一連のフレーム画像の平均画像を取得する取得手段、
前記取得手段によって取得された平均画像を色クラスタリングすることにより、複数の色分解画像を生成する生成手段、
一連のフレーム画像からエッジ抽出したエッジ画像を集積して2値化したエッジ2値画像と、前記生成手段によって生成された色分解画像と、当該色分解画像をダイレーションしたダイレーション画像と、前記平均画像と、に基づいて、前記各色分解画像の中から動きのあるパターンをノイズとして除去するエッジMFIノイズ除去手段、
前記各色分解画像を前記エッジMFIノイズ除去手段によってノイズ除去することにより得られた各色分解2値画像の中から画素連結パターンを選択し、選択した前記画素連結パターンを1つの文字パターンとして認識する1文字認識処理を、前記画素連結パターンの特徴量と登録文字の特徴量とに基づく前記画素連結パターンに関する確信度を用いて実行し、前記確信度がしきい値以上となる前記画素連結パターンを1つの文字パターンとして認識し、認識された前記画素連結パターンを行方向に投影したヒストグラムに基づいて、前記色分解2値画像ごとに、文字パターン列が存在する行領域を抽出する行領域抽出手段、
前記行領域抽出手段によって抽出された前記各色分解2値画像の行領域群の中から、各行において文字パターン数が最大の行領域を選択して合成することにより、合成2値画像を生成する行領域選択手段、
前記合成2値画像内の画素連結パターンの中から文字列の規則に違反する画素連結パターンを除去する文字間ノイズ除去手段、
前記文字間ノイズ除去手段によるノイズ除去後の合成2値画像内の各画素連結パターンの組み合わせからなる文字パターンの文字認識結果に基づいて、当該文字パターンの外接矩形の中から前記文字パターンに不要な画素連結パターンをノイズとして除去することにより、文字列パターンを出力する文字矩形内ノイズ除去手段、
として機能させることを特徴とするテロップ文字パターン抽出プログラム。 - 前記エッジMFIノイズ除去手段は、
前記エッジ2値画像において前記平均画像の画素連結パターンに接する画素数と、前記ダイレーション画像から前記色分解画像を引いた差分画像において前記平均画像の画素連結パターンに接する画素数と、に基づいて、前記各色分解画像の中から動きのあるパターンをノイズとして除去することを特徴とする請求項1に記載のテロップ文字パターン抽出プログラム。 - コンピュータを、
テロップを含む一連のフレーム画像の平均画像を取得する取得手段、
前記取得手段によって取得された平均画像を色クラスタリングすることにより、複数の色分解画像を生成する生成手段、
前記各色分解画像を前記生成手段によって生成された各色分解2値画像の中から画素連結パターンを選択し、選択した前記画素連結パターンを1つの文字パターンとして認識する1文字認識処理を、前記画素連結パターンの特徴量と登録文字の特徴量とに基づく前記画素連結パターンに関する確信度を用いて実行し、前記確信度がしきい値以上となる前記画素連結パターンを1つの文字パターンとして認識し、認識された前記画素連結パターンを行方向に投影したヒストグラムに基づいて、前記色分解2値画像ごとに、文字パターン列が存在する行領域を抽出する行領域抽出手段、
前記行領域抽出手段によって抽出された前記各色分解2値画像の行領域群の中から、各行において文字パターン数が最大の行領域を選択して合成することにより、合成2値画像を生成する行領域選択手段、
前記行領域選択手段によって生成された合成2値画像内の画素連結パターンの中から文字列の規則に違反する画素連結パターンを除去する文字間ノイズ除去手段、
前記文字間ノイズ除去手段によるノイズ除去後の合成2値画像内の各画素連結パターンの組み合わせからなる文字パターンの文字認識結果に基づいて、当該文字パターンの外接矩形の中から前記文字パターンに不要な画素連結パターンをノイズとして除去することにより、文字列パターンを出力する文字矩形内ノイズ除去手段、
として機能させることを特徴とするテロップ文字パターン抽出プログラム。 - 前記文字間ノイズ除去手段は、
前記合成2値画像内の画素連結パターンの文字認識結果に基づいて、前記合成2値画像の中から文字らしいキー文字パターンを抽出することにより、当該キー文字パターンを包含する矩形に包含される画素連結パターンに外接する文字候補矩形を抽出する文字候補矩形抽出手段と、
前記文字候補矩形抽出手段によって抽出された文字候補矩形ペアが重複関係にある場合、文字候補矩形ペアのうち大きい方の文字候補矩形が濁点または半濁点文字であるが文字コードが濁点または半濁点文字でない場合、前記文字候補矩形ペアのうち小さい方の文字候補矩形を除去する重複矩形ノイズ除去手段と、を有することを特徴とする請求項1〜3のいずれか一つに記載のテロップ文字パターン抽出プログラム。 - テロップを含む一連のフレーム画像の平均画像を取得する取得手段と、
前記取得手段によって取得された平均画像を色クラスタリングすることにより、複数の色分解画像を生成する生成手段と、
一連のフレーム画像からエッジ抽出したエッジ画像を集積して2値化したエッジ2値画像と、前記色分解画像と、当該色分解画像をダイレーションしたダイレーション画像と、前記平均画像と、に基づいて、前記各色分解画像の中から動きのあるパターンをノイズとして除去するエッジMFIノイズ除去手段と、
前記各色分解画像を前記エッジMFIノイズ除去手段によってノイズ除去することにより得られた各色分解2値画像の中から画素連結パターンを選択し、選択した前記画素連結パターンを1つの文字パターンとして認識する1文字認識処理を、前記画素連結パターンの特徴量と登録文字の特徴量とに基づく前記画素連結パターンに関する確信度を用いて実行し、前記確信度がしきい値以上となる前記画素連結パターンを1つの文字パターンとして認識し、認識された前記画素連結パターンを行方向に投影したヒストグラムに基づいて、前記色分解2値画像ごとに、文字パターン列が存在する行領域を抽出する行領域抽出手段と、
前記行領域抽出手段によって抽出された前記各色分解2値画像の行領域群の中から、各行において文字パターン数が最大の行領域を選択して合成することにより、合成2値画像を生成する行領域選択手段と、
前記合成2値画像内の画素連結パターンの中から文字列の規則に違反する画素連結パターンを除去する文字間ノイズ除去手段と、
前記文字間ノイズ除去手段によるノイズ除去後の合成2値画像内の各画素連結パターンの組み合わせからなる文字パターンの文字認識結果に基づいて、当該文字パターンの外接矩形の中から前記文字パターンに不要な画素連結パターンをノイズとして除去することにより、文字列パターンを出力する文字矩形内ノイズ除去手段と、
を備えることを特徴とするテロップ文字パターン抽出装置。 - テロップを含む一連のフレーム画像の平均画像を取得する取得手段と、
前記取得手段によって取得された平均画像を色クラスタリングすることにより、複数の色分解画像を生成する生成手段と、
前記各色分解画像を前記生成手段によって生成された各色分解2値画像の中から画素連結パターンを選択し、選択した前記画素連結パターンを1つの文字パターンとして認識する1文字認識処理を、前記画素連結パターンの特徴量と登録文字の特徴量とに基づく前記画素連結パターンに関する確信度を用いて実行し、前記確信度がしきい値以上となる前記画素連結パターンを1つの文字パターンとして認識し、認識された前記画素連結パターンを行方向に投影したヒストグラムに基づいて、前記色分解2値画像ごとに、文字パターン列が存在する行領域を抽出する行領域抽出手段と、
前記行領域抽出手段によって抽出された前記各色分解2値画像の行領域群の中から、各行において文字パターン数が最大の行領域を選択して合成することにより、合成2値画像を生成する行領域選択手段と、
前記行領域選択手段によって生成された合成2値画像内の画素連結パターンの中から文字列の規則に違反する画素連結パターンを除去する文字間ノイズ除去手段と、
前記文字間ノイズ除去手段によるノイズ除去後の合成2値画像内の各画素連結パターンの組み合わせからなる文字パターンの文字認識結果に基づいて、当該文字パターンの外接矩形の中から前記文字パターンに不要な画素連結パターンをノイズとして除去することにより、文字列パターンを出力する文字矩形内ノイズ除去手段と、
を備えることを特徴とするテロップ文字パターン抽出装置。 - 前記文字間ノイズ除去手段は、
前記合成2値画像内の画素連結パターンの文字認識結果に基づいて、前記合成2値画像の中から文字らしいキー文字パターンを抽出することにより、当該キー文字パターンを包含する矩形に包含される画素連結パターンに外接する文字候補矩形を抽出する文字候補矩形抽出手段と、
前記文字候補矩形抽出手段によって抽出された文字候補矩形ペアが重複関係にある場合、文字候補矩形ペアのうち大きい方の文字候補矩形が濁点または半濁点文字であるが文字コードが濁点または半濁点文字でない場合、前記文字候補矩形ペアのうち小さい方の文字候補矩形を除去する重複矩形ノイズ除去手段と、を有することを特徴とする請求項5または6に記載のテロップ文字パターン抽出装置。 - テロップを含む一連のフレーム画像の平均画像を取得する取得工程と、
前記取得工程によって取得された平均画像を色クラスタリングすることにより、複数の色分解画像を生成する生成工程と、
一連のフレーム画像からエッジ抽出したエッジ画像を集積して2値化したエッジ2値画像と、前記色分解画像と、当該色分解画像をダイレーションしたダイレーション画像と、前記平均画像と、に基づいて、前記各色分解画像の中から動きのあるパターンをノイズとして除去するエッジMFIノイズ除去工程と、
前記各色分解画像を前記エッジMFIノイズ除去工程によってノイズ除去することにより得られた各色分解2値画像の中から画素連結パターンを選択し、選択した前記画素連結パターンを1つの文字パターンとして認識する1文字認識処理を、前記画素連結パターンの特徴量と登録文字の特徴量とに基づく前記画素連結パターンに関する確信度を用いて実行し、前記確信度がしきい値以上となる前記画素連結パターンを1つの文字パターンとして認識し、認識された前記画素連結パターンを行方向に投影したヒストグラムに基づいて、前記色分解2値画像ごとに、文字パターン列が存在する行領域を抽出する行領域抽出工程と、
前記行領域抽出工程によって抽出された前記各色分解2値画像の行領域群の中から、各行において文字パターン数が最大の行領域を選択して合成することにより、合成2値画像を生成する行領域選択工程と、
前記合成2値画像内の画素連結パターンの中から文字列の規則に違反する画素連結パターンを除去する文字間ノイズ除去工程と、
前記文字間ノイズ除去工程によるノイズ除去後の合成2値画像内の各画素連結パターンの組み合わせからなる文字パターンの文字認識結果に基づいて、当該文字パターンの外接矩形の中から前記文字パターンに不要な画素連結パターンをノイズとして除去することにより、文字列パターンを出力する文字矩形内ノイズ除去工程と、
を含んだことを特徴とするテロップ文字パターン抽出方法。 - テロップを含む一連のフレーム画像の平均画像を取得する取得工程と、
前記取得工程によって取得された平均画像を色クラスタリングすることにより、複数の色分解画像を生成する生成工程と、
前記各色分解画像を前記生成工程によって生成された各色分解2値画像の中から画素連結パターンを選択し、選択した前記画素連結パターンを1つの文字パターンとして認識する1文字認識処理を、前記画素連結パターンの特徴量と登録文字の特徴量とに基づく前記画素連結パターンに関する確信度を用いて実行し、前記確信度がしきい値以上となる前記画素連結パターンを1つの文字パターンとして認識し、認識された前記画素連結パターンを行方向に投影したヒストグラムに基づいて、前記色分解2値画像ごとに、文字パターン列が存在する行領域を抽出する行領域抽出工程と、
前記行領域抽出工程によって抽出された前記各色分解2値画像の行領域群の中から、各行において文字パターン数が最大の行領域を選択して合成することにより、合成2値画像を生成する行領域選択工程と、
前記行領域選択工程によって生成された合成2値画像内の画素連結パターンの中から文字列の規則に違反する画素連結パターンを除去する文字間ノイズ除去工程と、
前記文字間ノイズ除去工程によるノイズ除去後の合成2値画像内の各画素連結パターンの組み合わせからなる文字パターンの文字認識結果に基づいて、当該文字パターンの外接矩形の中から前記文字パターンに不要な画素連結パターンをノイズとして除去することにより、文字列パターンを出力する文字矩形内ノイズ除去工程と、
を含んだことを特徴とするテロップ文字パターン抽出方法。 - 前記文字間ノイズ除去工程は、
前記合成2値画像内の画素連結パターンの文字認識結果に基づいて、前記合成2値画像の中から文字らしいキー文字パターンを抽出することにより、当該キー文字パターンを包含する矩形に包含される画素連結パターンに外接する文字候補矩形を抽出する文字候補矩形抽出工程と、
前記文字候補矩形抽出工程によって抽出された文字候補矩形ペアが重複関係にある場合、文字候補矩形ペアのうち大きい方の文字候補矩形が濁点または半濁点文字であるが文字コードが濁点または半濁点文字でない場合、前記文字候補矩形ペアのうち小さい方の文字候補矩形を除去する重複矩形ノイズ除去工程と、を有することを特徴とする請求項8または9に記載のテロップ文字パターン抽出方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008039407A JP5029412B2 (ja) | 2008-02-20 | 2008-02-20 | テロップ文字パターン抽出プログラム、テロップ文字パターン抽出装置、およびテロップ文字パターン抽出方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008039407A JP5029412B2 (ja) | 2008-02-20 | 2008-02-20 | テロップ文字パターン抽出プログラム、テロップ文字パターン抽出装置、およびテロップ文字パターン抽出方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009199276A JP2009199276A (ja) | 2009-09-03 |
JP5029412B2 true JP5029412B2 (ja) | 2012-09-19 |
Family
ID=41142714
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008039407A Expired - Fee Related JP5029412B2 (ja) | 2008-02-20 | 2008-02-20 | テロップ文字パターン抽出プログラム、テロップ文字パターン抽出装置、およびテロップ文字パターン抽出方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5029412B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5672059B2 (ja) * | 2011-02-24 | 2015-02-18 | 富士通株式会社 | 文字認識処理装置および方法並びに文字認識処理プログラム |
JP5547226B2 (ja) | 2012-03-16 | 2014-07-09 | 株式会社東芝 | 画像処理装置、及び画像処理方法 |
JP6303671B2 (ja) * | 2014-03-20 | 2018-04-04 | 富士ゼロックス株式会社 | 画像処理装置及び画像処理プログラム |
JP6671613B2 (ja) * | 2017-03-15 | 2020-03-25 | ソフネック株式会社 | 文字認識方法及びコンピュータプログラム |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3692018B2 (ja) * | 2000-01-24 | 2005-09-07 | 株式会社東芝 | テロップ情報処理装置 |
JP4396376B2 (ja) * | 2004-04-22 | 2010-01-13 | 日本電気株式会社 | 図形読み取り方法及びその装置並びに主要色抽出方法及びその装置 |
-
2008
- 2008-02-20 JP JP2008039407A patent/JP5029412B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2009199276A (ja) | 2009-09-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110738207B (zh) | 一种融合文字图像中文字区域边缘信息的文字检测方法 | |
US5335290A (en) | Segmentation of text, picture and lines of a document image | |
Wenyin et al. | From raster to vectors: extracting visual information from line drawings | |
EP1598770B1 (en) | Low resolution optical character recognition for camera acquired documents | |
US8351691B2 (en) | Object extraction in colour compound documents | |
US7627176B2 (en) | Apparatus, method, and computer program for analyzing document layout | |
JP2002024836A (ja) | ディジタルイメージから表題を抽出する方法 | |
JPH11288465A (ja) | カラー画像処理装置及びパターン抽出装置 | |
EP1854051A2 (en) | Intelligent importation of information from foreign application user interface using artificial intelligence | |
KR102592551B1 (ko) | Ar장치를 위한 객체 인식 처리 장치 및 방법 | |
CN110766017A (zh) | 基于深度学习的移动终端文字识别方法及系统 | |
JP5029412B2 (ja) | テロップ文字パターン抽出プログラム、テロップ文字パターン抽出装置、およびテロップ文字パターン抽出方法 | |
Al Abodi et al. | An effective approach to offline Arabic handwriting recognition | |
JP4391704B2 (ja) | 多値画像から二値画像を生成する画像処理装置および方法 | |
Feild et al. | Scene text recognition with bilateral regression | |
Nordmark et al. | Window detection in facade imagery: a deep learning approach using mask R-CNN | |
JP3720892B2 (ja) | 画像処理方法および画像処理装置 | |
JP3819236B2 (ja) | パターン認識方法及びパターン認識を行わせるプログラムを記憶したコンピュータ読み取り可能な記憶媒体 | |
Rampurkar et al. | An approach towards text detection from complex images using morphological techniques | |
JP3095069B2 (ja) | 文字認識装置、学習方法および文字認識プログラムを記録した記録媒体 | |
Tran et al. | A deep learning-based system for document layout analysis | |
Robertson | Optical character recognition for classical philology | |
JP4176175B2 (ja) | パターン認識装置 | |
US5940533A (en) | Method for analyzing cursive writing | |
Sridevi et al. | Segmentation of text lines and characters in ancient tamil script documents using computational intelligence techniques |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100917 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20111020 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111108 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120110 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120529 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120611 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5029412 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150706 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |