JP2007164253A - 映像中文字認識装置、映像中文字認識方法、プログラム、及び記録媒体 - Google Patents

映像中文字認識装置、映像中文字認識方法、プログラム、及び記録媒体 Download PDF

Info

Publication number
JP2007164253A
JP2007164253A JP2005356107A JP2005356107A JP2007164253A JP 2007164253 A JP2007164253 A JP 2007164253A JP 2005356107 A JP2005356107 A JP 2005356107A JP 2005356107 A JP2005356107 A JP 2005356107A JP 2007164253 A JP2007164253 A JP 2007164253A
Authority
JP
Japan
Prior art keywords
character
parameter set
video data
character recognition
video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005356107A
Other languages
English (en)
Other versions
JP4839076B2 (ja
Inventor
Hidekatsu Kuwano
秀豪 桑野
Hiroko Konya
裕子 紺家
Tomokazu Yamada
智一 山田
Katsuhiko Kawazoe
雄彦 川添
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2005356107A priority Critical patent/JP4839076B2/ja
Publication of JP2007164253A publication Critical patent/JP2007164253A/ja
Application granted granted Critical
Publication of JP4839076B2 publication Critical patent/JP4839076B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

【課題】映像中の文字に対しての文字認識を実行する際に、短い処理時間で、高い文字認識率をもたらす結果を得るようにする。
【解決手段】文字列が画面上に表示される映像データを読み込む映像データ読み込み部1、読み込まれた映像データ中の個々の文字表示シーンに対し、画像中の個々の文字列矩形を抽出し、矩形領域内の文字らしさ特徴を計算する文字特徴抽出部2、抽出された文字特徴と、文字認識処理のパラメータセットとそれに対応する文字特徴条件の情報が定義されたパラメータセットデータベース3中の文字特徴条件とを比較し、条件に対応するパラメータセットを出力するパラメータセット検索部4、映像データ読み込み部1で読み込まれた映像データ中の個々の文字表示シーンの個々の文字列矩形内の画像領域に対し、パラメータセット検索部4から出力されたパラメータセットを用いて文字認識処理を実行する文字認識処理部5を備える映像中文字認識装置。
【選択図】図3

Description

本発明は映像中に表示される文字パターンを自動的に認識する技術に関するものである。特に、テレビ番組映像など長時間のカラー映像中に様々な文字パターンが表示されるような映像中の文字に対しての文字認識処理を実行する際に用いる各種閾値などのパラメータ情報の設定技術に関するものである。
テレビ番組などでよく使われる番組映像中のテロップ文字表示など、映像中に表示される文字パターンを文字認識処理により自動認識する技術の提案が従来からよく行われている。従来技術の例としては、文字領域判定方法および装置および記録媒体などがある(例えば、特許文献1参照。)。
一般に、映像中の文字パターンの認識処理には、その方式の中に必ず1つ以上の閾値などの処理パラメータが存在するものであり、画像内から文字領域を検出する際や認識する前にカラー画像を二値化する際などに多くのパラメータを設定する必要があるアルゴリズムとなっている。
図1に一般的なカラー画像中の文字認識処理の模式図、及び処理パラメータの例を示す。
図1(a)は映像中からのテロップ文字が表示されるフレーム画像を検出する処理であり、処理内容の例として、フレーム画像中の輝度エッジを検出する処理が用いられることがあるが、その際、画像中の輝度値に関する閾値が設定される。
図1(b)は文字が表示される1枚のカラー画像を2値化し、文字領域を抽出した白黒の二値画像を作成する処理である。この処理の場合にも、画像を二値化する際の画像のカラー値に対しての二値化のための閾値が用いられる。
図1(c)は文字パターンが含まれる白黒の二値画像から文字列を抽出し、文字列から一つ一つの文字パターンを切り出し、最終的に文字を認識する処理である。この場合は、例えば、文字パターンを切り出す際の1つ文字パターンのだいたいの大きさとして文字の高さと幅に関しての閾値を用いることが多い。通常、これら処理パラメータは、画像中に表示される文字の色、大きさ、形などの特徴に合せて、最も認識精度が高くなるような結果が得られるように設定される。
特開2000−187732号公報
一般に、テレビ番組映像などの長時間のカラー映像中に様々な文字パターンが表示されるような映像中の文字に対しての文字認識を実行する際には、事前にどのような色、形、大きさの文字パターンが表示されるか知りうることができないため、全ての文字パターンを高精度に認識できる処理パラメータを設定することは困難である。
そのため、従来技術では、このような場合には、映像中に表示される様々な文字パターンの大きさ、色、形といった文字表示特徴にある程度の前提条件を設けて、それに合わせて、文字認識率が高くなるような1種類の処理パラメータ、あるいは、そのような前提条件が設けにくい場合は、複数の文字表示特徴に対応できるように複数種類の処理パラメータのセットを用意しておき、映像中の1つの文字表示シーンに対して、用意した処理パラメータのセットの数分だけ文字認識処理を実行する処理フローがとられている。
図2に従来技術による文字認識処理パラメータの設定方法の例を示す。
図2(a)は映像中に表示される様々な色、大きさ、形を持った複数のテロップ文字シーンの例を示したものである。映像中に3つのテロップシーン1〜3が含まれている様子を示しており、それぞれのテロップシーンで文字色や文字の形が異なることを示している。
図2(b)は(a)の3つのテロップシーン1〜3に対しての処理パラメータの設定方法の例を示したものである。本来であれば、映像中の1つの文字表示シーンに対して、最も文字認識率が高くなる処理パラメータ1セットを用いた文字認識処理が1回だけ実行されるのが理想的である。
しかしながら、図2(b)のような従来技術の処理パラメータの設定方法によると、複数の処理パラメータを用意する場合、映像中の個々の文字表示シーンに対し、処理の事前には、どの処理パラメータが最も認識率の高い結果を導くものかは分からないため、用意した処理パラメータセットの数だけ毎回文字認識処理が実施される。
図2(b)の場合は、3つのテロップシーンに対して、それぞれパラメータセットA,B,Cが適用された文字認識処理が実施され、計9回の文字認識処理が実施される。1回あたりの文字認識処理が3秒だとすると、合計で27秒の処理時間がかかるものである。
このように、従来技術のパラメータ設定方法によると、最も高い認識精度をもたらす処理パラメータによる実行結果を得るために、認識率の低い他のパラメータセットによる無駄な文字認識処理が実行されることになり、生放送番組などのテロップ文字をリアルタイムで認識する必要があるようなケースにおいては、余分な処理時間を費やすことになり、リアルタイムでの文字認識処理が困難となる場合があるという問題がある。
本発明は、以上の点を考慮してなされたもので、テレビ番組映像などの長時間のカラー映像中に様々な文字パターンが表示されるような映像中の文字に対しての文字認識を実行する際に、1つの文字表示シーンに対し、処理パラメータのセット数分だけ毎回文字認識処理が実行されるような非効率的な処理フローをとってしまう従来技術の問題点を解決することを目的とするものである。
そこで上記課題を解決するために、請求項1に記載の発明は、単数、または複数の文字列が画面上に表示される映像データを読み込む映像データ読み込み部と、前記映像データ読み込み部で読み込まれた映像データ中の個々の文字表示シーンに対し、画像中の個々の文字列矩形を抽出し、矩形領域内の文字らしさ特徴を計算する文字特徴抽出部と、前記文字徴抽出部で抽出された文字特徴と、文字認識処理のパラメータセットとそれに対応する文字特徴条件の情報が単数、または、複数定義されたパラメータセットデータベース中の文字特徴条件と、を比較し、条件と合致する場合、その条件に対応するパラメータセットを出力するパラメータセット検索部と、前記映像データ読み込み部で読み込まれた映像データ中の個々の文字表示シーンの個々の文字列矩形内の画像領域に対し、前記パラメータセット検索部から出力されたパラメータセットを用いて文字認識処理を実行する文字認識処理部と、を備えることを特徴とする。
また、請求項2に記載の発明は、映像データ読み込み部が、単数、または複数の文字列が画面上に表示される映像データを読み込む映像データ読み込みステップと、文字特徴抽出部が、前記映像データ読み込みステップで読み込まれた映像データ中の個々の文字表示シーンに対し、画像中の個々の文字列矩形を抽出し、矩形領域内の文字らしさ特徴を計算する文字特徴抽出ステップと、パラメータセット検索部が、前記文字徴抽出ステップで抽出された文字特徴と、文字認識処理のパラメータセットとそれに対応する文字特徴条件の情報が単数、または、複数定義されたパラメータセットデータベース中の文字特徴条件と、を比較し、条件と合致する場合、その条件に対応するパラメータセットを出力するパラメータセット検索ステップと、文字認識処理部が、前記映像データ読み込みステップで読み込まれた映像データ中の個々の文字表示シーンの個々の文字列矩形内の画像領域に対し、前記パラメータセット検索ステップから出力されたパラメータセットを用いて文字認識処理を実行する文字認識処理ステップと、を有することを特徴とする。
また、請求項3に記載の発明は、上記請求項2に記載の映像中文字認識方法をコンピュータで実行可能に記載したことを特徴とする。
また、請求項4に記載の発明は、
上記請求項2に記載の映像中文字認識方法をコンピュータで実行可能に記載したプログラムを記録したことを特徴とする。
請求項1〜4に記載の発明によれば、映像中の文字に対しての文字認識を実行する際に、短い処理時間で、高い文字認識率をもたらす結果を得ることができる。
以下、実施形態について、図面を参照しながら説明する。
図3は実施形態1の映像中文字認識装置の具体的な装置構成の一例を示したものである。
図3中の映像データ読み込み部1は、単数、又は複数の文字列が画面上に表示される映像データを読み込むものであり、具体的には、VTR機器の出力映像信号を映像キャプチャボードを備えたパーソナルコンピュータで取り込み、ディジタル化し、メモリ領域、あるいはハードディスクに書き込むことで本部は実現可能である。
図3中の文字特徴抽出部2は、映像データ読み込み部1で読み込まれた映像データ中の個々の文字表示シーンに対し、予め決められた方法により画像中の個々の文字列矩形を抽出し、矩形領域内の色分布などの文字らしさ特徴を計算するものである。具体的には、パーソナルコンピュータ上のソフトウェアプログラムとして本部を実現する方式を実装することで実現可能である。
予め決められた方法とは、例えば、「特願平11−253944:文字列情報抽出装置及び方法及びその方法を記録した記録媒体」で提案されている方式が利用可能である。
図4にその実現方法を説明する補足図を示す。入力画像に対し、文字領域抽出処理、及び輝度エッジ情報抽出処理を実施し、得られた文字領域、及び輝度エッジの画像内の分布密度に基づいて、映像・画像データ内の全ての表示文字列の外接矩形の位置、大きさ情報を取得するものである。
図4(a)は文字表示が含まれる入力画像であり、図4(b)は図4(a)に対し、画像の二値化処理により文字領域を抽出した結果である。画像中の白い部分が文字領域である。
図4(c)は図4(a)に対し、輝度エッジを抽出した結果である。
図4(d)は図4(b)、(c)の文字領域と輝度エッジ情報を画像中の水平ライン毎にカウントして、ヒストグラム化した図である。このヒストグラムの山を閾値処理により取り出すことで、文字列矩形の位置、大きさを計算することが可能となる。
本処理部では、抽出した文字列矩形内でさらに、色分布の特徴など文字らしさの特徴情報を抽出する。具体的には、文字領域抽出処理を行い、文字領域の色の値、大きさの値を計算し、この値のセットを文字らしさ特徴の値として利用することで実現可能である。
図3中のパラメータセットデータベース3は文字認識処理のパラメータセットとそれに対応する文字特徴条件の情報が単数、又は、複数定義されたものであり、具体的には、コンピュータ上のハードディスクやメモリに蓄積される情報として実現可能である。なお、パラメータセットデータベース3は映像中文字認識装置の外部に設置して、映像中文字認識装置がアクセス可能にしてもよい。
図5にパラメータセットデータベースの内容の例を示す。図5の表においては、左列にパラメータセットに例を示した。パラメータセットAとして、図1でも示した「輝度エッジ検出のための閾値:120」、「画像二値化のための閾値:60」「文字サイズに関する閾値:40」、「文字間隔に関する閾値:5」が設定されている。
右列には左列のパラメータセットに対応する画像中の文字列矩形の条件がそれぞれ設定されている。パラメータセットAの場合は、対応する入力画像中の文字列矩形の条件として、
・矩形の左上頂点の水平座標:50以上60以下
・矩形の左上頂点の垂直座標:250以上260以下
・矩形の幅:300以上350以下
・矩形の高さ:40以上50以下
・文字領域の色の値:200以上230以下
・文字領域の大きさ:30以上40以下
というのが設定された例を示したものである。
図3中のパラメータセット検索部4は文字特徴抽出部2で抽出された文字特徴とパラメータセットデータベース3中の文字特徴条件を比較し、条件と合致する場合、その条件に対応するパラメータセットを出力するものであり、コンピュータ上のソフトウェアとして本方式を実装することで実現可能である。図6に本処理部の具体的な処理フローの一例を示す。
図6中のステップ21は図3中の文字特徴抽出部2で抽出された文字特徴の情報を入力し、ステップ22に移る。
図6中のステップ22は図3中のパラメータセットデータベース3の中に格納されるパラメータセットを参照する際のカウンタ変数Nに対し、1を設定し、ステップ23に移る。この際、パラメータセットデータベース中に格納される全てのパラメータセットの数をMとする。
図6中のステップ23は、ステップ21で入力された文字特徴の値がパラメータセットデータベース中のN番目のメタデータ項目の文字列矩形条件を満たすかどうか判断するステップであり、満たす場合は、ステップ26に進み、満たさない場合は、ステップ24に進む。本ステップの具体的な処理結果としては、例えば、ステップ21で入力された文字特徴の値として、文字列矩形の左上頂点の水平座標が55、垂直座標が250、幅が320、高さが45、文字領域の色の値が210、文字領域の大きさが35であって、パラメータセットデータベース中の設定内容が図5の場合、前記入力値は、N=1であるパラメータセットAに対応する文字特徴の条件、
・矩形の左上頂点の水平座標:50以上60以下
・矩形の左上頂点の垂直座標:250以上260以下
・矩形の幅:300以上350以下
・矩形の高さ:40以上50以下
・文字領域の色の値:200以上230以下
・文字領域の大きさ:30以上40以下
を満たすことになる。このような場合は、ステップ26に進む。条件を満たさない場合は、ステップ24に進む。
図6中のステップ24は図3中のパラメータセットデータベース3の中に格納されるパラメータセットを参照する際のカウンタ変数Nが全てのパラメータセット数M以下かどうか判断するステップであり、N<=Mの場合は、ステップ25に進み、そうでない場合は、パラメータセットの検索結果は出力せずに本処理部を終了するものである。
図6中のステップ25は図3中のパラメータセットデータベース3の中に格納されるパラメータセットを参照する際のカウンタ変数Nを1だけインクリメントするステップであり、ステップ23に進む。
図6中のステップ26はパラメータセットデータベース中のN番目のパラメータセットを出力するステップであり、例えば、ステップ23の処理例の場合、パラメータセットAが出力されるものである。本ステップの終了とともに、本処理部全体の処理も終了する。
図3中の文字認識処理部5は映像データ読み込み部1で読み込まれた映像データ中の個々の文字表示シーンの個々の文字列矩形内の画像領域に対し、前記パラメータセット検索部から出力されたパラメータセットを用いて文字認識処理を実行するものであり、コンピュータ上のソフトウェアとして実現可能である。本処理部における処理パラメータセットの適用例を図7に示す。図7には「20日(火)」「佐藤記者」「台風15号接近中」という3つの文字列が表示される画像を示した。
本発明によれば、図3の文字特徴抽出部2により、画像中の個々の文字列矩形、及び、矩形内の文字らしさ特徴を抽出し、その結果を利用して、文字列毎に最も文字認識率が高くなるような処理パラメータを図3のパラメータセット検索部4により取得することが可能である。具体例としては、図7の場合、3つの文字列毎に文字列「20日(火)」に対してはパラメータセットA、文字列「台風15号、接近中」に対してはパラメータセットB、文字列「佐藤記者」に対してはパラメータセットCが取得され、それぞれの文字列に対して、それぞれのパラメータセットが適用され文字認識処理が実行される。
これにより、本発明によれば、映像中の文字認識を実施する場合において、複数の処理パラメータセットを事前に用意しておいても、従来技術のように処理パラメータセットの数分の処理を実行する必要なく、各文字表示画像に対して、1回の文字認識処理で最も文字認識率の高い結果を得ることが可能である。
なお、処理パラメータの事前準備方法としては、事前に入力映像中の文字表示と同様の文字表示についての処理を実施しておき、その文字表示について最も認識率が高くなるような処理パラメータセットを調べて用意しておく等の予め決められた方法により実施されるものとする。
以上の説明の通り、本実施形態によれば、テレビ番組映像などの長時間のカラー映像中に様々な文字パターンが表示されるような映像中の文字に対しての文字認識を実行する際に、1つの文字表示シーンに対し、処理パラメータのセット数分だけ毎回文字認識処理が実行されるような非効率的な処理フローをとってしまう従来技術の問題点を解決し、1回だけの文字認識処理という最短の処理時間で、最も高い文字認識率をもたらす結果を得ることができるという効果をもたらす。
具体的には、映像中の文字表示シーンの個々の文字列矩形を抽出し、その矩形内の色分布などの文字特徴を抽出し、パラメータデータベースの中から抽出した文字特徴に対応する処理パラメータを検索し、その処理パラメータを用いて文字列矩形内の文字認識を実施するものである。1枚の画像中の文字列矩形単位にその文字列に対して事前に用意された最も高い認識率をもたらす処理パラメータを用いて文字認識を実施することが可能である。
1枚の画像中の複数の文字列毎にそれぞれに最適な処理パラメータを設定することができることから、1枚の画像全体の中の部分領域に異なる処理パラメータを適用することで、画像1枚に対して1回の文字認識処理が実施されることと実質同じである。すなわち、本発明によれば、文字列矩形を事前に抽出し、それにあった処理パラメータを文字列矩形単位に取得し、画像1枚に対しては1回の文字認識処理で最も認識率の高い文字認識結果を得ることが可能となり、従来技術のように、1画像に対し、処理パラメータの個数分毎回処理する必要がなくなり、従来技術よりも速い処理速度で高精度の文字認識結果を得ることが可能となることから、従来技術の解決すべき課題が解決できる。
例えば、図2の場合であれば、テロップシーン1,2,3に対して、それぞれ処理パラメータは実質1種類で処理可能であることから、処理時間は従来技術の27秒に対して、本発明によれば3分の1の9秒で処理可能となる。
はカラー映像中の文字認識処理のフロー、及び処理パラメータを示す模式図である。 映像中の複数の文字表示シーンに対する従来技術のパラメータ設定方法の例を示した図である。 映像中文字認識装置の装置構成の一例を示す図である。 文字列矩形抽出部の処理イメージを示す図である。 パラメータセットデータベースの内容の一例を示した図である。 パラメータセット検索部の具体的な処理フローの一例を示す図である。 文字認識処理における処理パラメータの適用例を示した図である。
符号の説明
1 映像データ読み込み部
2 文字特徴抽出部
3 パラメータセットデータベース
4 パラメータセット検索部
5 文字認識処理部

Claims (4)

  1. 単数、または複数の文字列が画面上に表示される映像データを読み込む映像データ読み込み部と、
    前記映像データ読み込み部で読み込まれた映像データ中の個々の文字表示シーンに対し、画像中の個々の文字列矩形を抽出し、矩形領域内の文字らしさ特徴を計算する文字特徴抽出部と、
    前記文字徴抽出部で抽出された文字特徴と、文字認識処理のパラメータセットとそれに対応する文字特徴条件の情報が単数、または、複数定義されたパラメータセットデータベース中の文字特徴条件と、を比較し、条件と合致する場合、その条件に対応するパラメータセットを出力するパラメータセット検索部と、
    前記映像データ読み込み部で読み込まれた映像データ中の個々の文字表示シーンの個々の文字列矩形内の画像領域に対し、前記パラメータセット検索部から出力されたパラメータセットを用いて文字認識処理を実行する文字認識処理部と、を備えることを特徴とする映像中文字認識装置。
  2. 映像データ読み込み部が、単数、または複数の文字列が画面上に表示される映像データを読み込む映像データ読み込みステップと、
    文字特徴抽出部が、前記映像データ読み込みステップで読み込まれた映像データ中の個々の文字表示シーンに対し、画像中の個々の文字列矩形を抽出し、矩形領域内の文字らしさ特徴を計算する文字特徴抽出ステップと、
    パラメータセット検索部が、前記文字徴抽出ステップで抽出された文字特徴と、文字認識処理のパラメータセットとそれに対応する文字特徴条件の情報が単数、または、複数定義されたパラメータセットデータベース中の文字特徴条件と、を比較し、条件と合致する場合、その条件に対応するパラメータセットを出力するパラメータセット検索ステップと、
    文字認識処理部が、前記映像データ読み込みステップで読み込まれた映像データ中の個々の文字表示シーンの個々の文字列矩形内の画像領域に対し、前記パラメータセット検索ステップから出力されたパラメータセットを用いて文字認識処理を実行する文字認識処理ステップと、を有することを特徴とする映像中文字認識方法。
  3. 上記請求項2に記載の映像中文字認識方法をコンピュータで実行可能に記載したことを特徴とするプログラム。
  4. 上記請求項2に記載の映像中文字認識方法をコンピュータで実行可能に記載したプログラムを記録したことを特徴とする記録媒体。
JP2005356107A 2005-12-09 2005-12-09 映像中文字認識装置、映像中文字認識方法、プログラム、及び記録媒体 Expired - Fee Related JP4839076B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005356107A JP4839076B2 (ja) 2005-12-09 2005-12-09 映像中文字認識装置、映像中文字認識方法、プログラム、及び記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005356107A JP4839076B2 (ja) 2005-12-09 2005-12-09 映像中文字認識装置、映像中文字認識方法、プログラム、及び記録媒体

Publications (2)

Publication Number Publication Date
JP2007164253A true JP2007164253A (ja) 2007-06-28
JP4839076B2 JP4839076B2 (ja) 2011-12-14

Family

ID=38247103

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005356107A Expired - Fee Related JP4839076B2 (ja) 2005-12-09 2005-12-09 映像中文字認識装置、映像中文字認識方法、プログラム、及び記録媒体

Country Status (1)

Country Link
JP (1) JP4839076B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013045393A (ja) * 2011-08-26 2013-03-04 Fuji Xerox Co Ltd 画像処理装置及び画像処理プログラム
US8503780B2 (en) 2009-12-29 2013-08-06 Samsung Electronics Co., Ltd. Apparatus for detecting text recognition region and method of recognizing text
JP2017211207A (ja) * 2016-05-23 2017-11-30 住友ゴム工業株式会社 物品の汚損検出方法

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04280393A (ja) * 1991-03-08 1992-10-06 Fujitsu Ltd 文字図形認識装置
JPH1069522A (ja) * 1996-08-28 1998-03-10 Matsushita Electric Ind Co Ltd 文字認識装置及び文字認識方法並びに文字認識方法を記録した記録媒体
JP2000182053A (ja) * 1998-12-15 2000-06-30 Toshiba Corp 映像処理方法及び装置並びに映像処理手順を記録した記録媒体
JP2000322515A (ja) * 1999-05-11 2000-11-24 Ntt Data Corp 文字認識パラメータの最適化方法及び方式
JP2001076094A (ja) * 1999-09-08 2001-03-23 Nippon Telegr & Teleph Corp <Ntt> 文字列情報抽出装置及び方法及びその方法を記録した記録媒体
JP2001285716A (ja) * 2000-01-24 2001-10-12 Toshiba Corp テロップ情報処理装置及びテロップ情報表示装置
JP2001283153A (ja) * 2000-01-27 2001-10-12 Fujitsu Ltd カラー画像から文字列パターンを抽出する装置および方法
JP2002259910A (ja) * 2001-03-01 2002-09-13 Hitachi Ltd スクリプトファイルを用いた文字認識方法
JP2003006101A (ja) * 2001-06-18 2003-01-10 Ricoh Co Ltd 画像認識装置および画像認識処理手順を記憶した記憶媒体
JP2005141520A (ja) * 2003-11-07 2005-06-02 Hitachi Ltd 携帯端末における文字認識用パラメータ設定方法および携帯端末

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04280393A (ja) * 1991-03-08 1992-10-06 Fujitsu Ltd 文字図形認識装置
JPH1069522A (ja) * 1996-08-28 1998-03-10 Matsushita Electric Ind Co Ltd 文字認識装置及び文字認識方法並びに文字認識方法を記録した記録媒体
JP2000182053A (ja) * 1998-12-15 2000-06-30 Toshiba Corp 映像処理方法及び装置並びに映像処理手順を記録した記録媒体
JP2000322515A (ja) * 1999-05-11 2000-11-24 Ntt Data Corp 文字認識パラメータの最適化方法及び方式
JP2001076094A (ja) * 1999-09-08 2001-03-23 Nippon Telegr & Teleph Corp <Ntt> 文字列情報抽出装置及び方法及びその方法を記録した記録媒体
JP2001285716A (ja) * 2000-01-24 2001-10-12 Toshiba Corp テロップ情報処理装置及びテロップ情報表示装置
JP2001283153A (ja) * 2000-01-27 2001-10-12 Fujitsu Ltd カラー画像から文字列パターンを抽出する装置および方法
JP2002259910A (ja) * 2001-03-01 2002-09-13 Hitachi Ltd スクリプトファイルを用いた文字認識方法
JP2003006101A (ja) * 2001-06-18 2003-01-10 Ricoh Co Ltd 画像認識装置および画像認識処理手順を記憶した記憶媒体
JP2005141520A (ja) * 2003-11-07 2005-06-02 Hitachi Ltd 携帯端末における文字認識用パラメータ設定方法および携帯端末

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8503780B2 (en) 2009-12-29 2013-08-06 Samsung Electronics Co., Ltd. Apparatus for detecting text recognition region and method of recognizing text
JP2013045393A (ja) * 2011-08-26 2013-03-04 Fuji Xerox Co Ltd 画像処理装置及び画像処理プログラム
JP2017211207A (ja) * 2016-05-23 2017-11-30 住友ゴム工業株式会社 物品の汚損検出方法

Also Published As

Publication number Publication date
JP4839076B2 (ja) 2011-12-14

Similar Documents

Publication Publication Date Title
US20190114486A1 (en) Subtitle extraction method and device, storage medium
US8103107B2 (en) Video-attribute-information output apparatus, video digest forming apparatus, computer program product, and video-attribute-information output method
CN110287949B (zh) 视频片段提取方法、装置、设备及存储介质
JP3361587B2 (ja) 動画像検索装置及び方法
Yang et al. Automatic lecture video indexing using video OCR technology
US20080095442A1 (en) Detection and Modification of Text in a Image
US8971633B2 (en) Content retrieval to facilitate recognizing content details of a moving image
JP2008154200A (ja) 動画像の字幕検出装置およびその方法
CN101553814A (zh) 用于产生视频数据流摘要的方法和设备
JP2004364234A (ja) 放送番組内容メニュー作成装置及び方法
US9129383B2 (en) Character string detection device, image processing device, character string detection method, control program and storage medium
CN110796140A (zh) 一种字幕检测方法和装置
JP4473813B2 (ja) メタデータ自動生成装置、メタデータ自動生成方法、メタデータ自動生成プログラムおよびプログラムを記録した記録媒体
JP4839076B2 (ja) 映像中文字認識装置、映像中文字認識方法、プログラム、及び記録媒体
JP2009251872A (ja) 情報処理装置及び情報処理プログラム
US20080266319A1 (en) Video processing apparatus and method
JP2000182053A (ja) 映像処理方法及び装置並びに映像処理手順を記録した記録媒体
JP3544324B2 (ja) 文字列情報抽出装置及び方法及びその方法を記録した記録媒体
JP4040905B2 (ja) 縮小画像表示装置、方法、プログラムおよびプログラムを記録した記録媒体
JP4238323B2 (ja) 画像処理方法及び画像処理装置
Lee et al. Beginning frame and edge based name text localization in news interview videos
KR20190122178A (ko) 문자 인식을 위한 영상 전처리 장치 및 방법
JP2006331057A (ja) 文字情報抽出装置及び文字情報抽出方法、並びにコンピュータ・プログラム
JP2007329832A (ja) 画像理装置および方法、検出装置および方法、プログラム、並びに記録媒体
Al-Asadi et al. Arabic-text extraction from video images

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080125

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20090603

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20100518

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100610

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100622

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100819

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110412

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110613

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110927

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111003

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141007

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees