JP2000298725A - テキストデータ検出装置およびその方法 - Google Patents

テキストデータ検出装置およびその方法

Info

Publication number
JP2000298725A
JP2000298725A JP11107472A JP10747299A JP2000298725A JP 2000298725 A JP2000298725 A JP 2000298725A JP 11107472 A JP11107472 A JP 11107472A JP 10747299 A JP10747299 A JP 10747299A JP 2000298725 A JP2000298725 A JP 2000298725A
Authority
JP
Japan
Prior art keywords
text data
data
text
pixels
same color
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11107472A
Other languages
English (en)
Inventor
Satomi Shigaki
里美 志柿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP11107472A priority Critical patent/JP2000298725A/ja
Publication of JP2000298725A publication Critical patent/JP2000298725A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)

Abstract

(57)【要約】 【課題】 テキストおよび非テキスト(グラフィック)
が混在するビットマップ形式のデータからテキスト領域
のみを検出するテキストデータ検出装置およびその方法
を提供する。 【解決手段】 テキストデータと非テキストデータとが
混在するビットマップ形式のデータにおいて、ビットマ
ップ形式データの例えば水平方向の一列に連続して存在
する同一色のピクセル数が所定値を越えた場合は、テキ
ストデータであると判定する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、テキストデータ検
出装置およびその方法に関し、特にビットマップ形式で
テキストデータと非テキストデータとが混在するパソコ
ン表示用のビットマップデータから、テキストデータの
みを検出するテキストデータ検出装置およびその方法に
関する。
【0002】
【従来の技術】パソコンなどの表示画面にはテキスト
(文字列,文章)と非テキスト(グラフィック)とが混
在して表示される場合がある。特に、近年のインターネ
ットの普及に伴い、テキストと非テキストの混在表示は
一般的になってきている。
【0003】ところで、非テキストを鮮明に見せる為に
種々のフィルタが施されたりしているが、テキスト画面
と非テキスト画面の同時表示画面に対して、一様にフィ
ルタを施しても鮮明な表示画面を得ることはできない。
テキスト領域に関しては、フィルタ無し、もしくはエッ
ジ強調,テキスト強調等を実施するのが好ましい。
【0004】例えば、従来のテキスト判別方法として、
特開平8−9177号公報の提案がある。この提案は、
図11に示すように、画像データとプリセット値を比較
することにより、デジタルコンパレータ101で高濃度
部を検出し、デジタルコンパレータ102で低濃度部を
検出し、これら何れかのコンパレータで検出された箇所
をテキスト画像とし、それ以外を非テキスト画像と判断
する。
【0005】また、特開平9−139856号公報の提
案は、黒または黒に近い色を構成するカラー信号の組み
合わせに対応する1つの密度の濃い検索空間、および白
色または白に近い色または淡い有色背景を構成するカラ
ー信号に対する別の密度の濃い検索空間が存在すれば、
当該選択された領域はテキスト領域だと判断する提案で
ある。
【0006】
【発明が解決しようとする課題】しかしながら、従来例
のテキスト領域判別方法は、黒色テキスト文字を識別す
る場合に有効であり、インターネット画面等に見られる
自然画の上にテキストが並んでいる場合や、緑の背景に
赤いテキストといった画像には対応出来ないといった問
題がある。
【0007】そこで本発明の課題は、テキストおよび非
テキスト(グラフィック)が混在するビットマップ形式
のデータからテキスト領域のみを検出するテキストデー
タ検出装置およびその方法を提供することである。
【0008】
【課題を解決するための手段】前記課題を解決するため
に本発明は、テキストデータと非テキストデータとが混
在するビットマップ形式のデータから前記テキストデー
タを検出するテキストデータ検出装置であって、ビット
マップ形式データの水平方向または垂直方向の一列に連
続して存在する同一色のピクセル数が所定値を越えた場
合は、テキストデータであるとする閾値を予め格納して
おく一方向閾値格納手段と、前記ビットマップ形式デー
タの水平方向または垂直方向の一列に連続して存在する
同一色のピクセル数をカウントする一方向ピクセル数カ
ウント手段と、該ピクセル数カウント手段がカウントし
た前記ビットマップ形式データの水平方向または垂直方
向の一列に連続して存在する同一色のピクセル数が、前
記閾値を越えた場合に、テキストデータと判断する一方
向判断手段とを備えたことを特徴とする。
【0009】このようにすれば、例えば水平方向に一列
に連続して存在する同一色のピクセル数が所定値を越え
た場合は、テキストデータと判定するので、確実にテキ
ストデータを検出できる(図3参照)。
【0010】
【発明の実施の形態】以下、本発明を図示の実施例に基
づいて説明する。
【0011】[I]第1実施例 本実施例を、(1)概略構成,(2)概略動作,(3)原
理,(4)詳細構成,(5)具体例に分けて説明する。
【0012】(1)概略構成 図1は、本実施例のブロック図である。入力ビデオ信号
1はデジタルデータであり、カラー画像データとして、
画像メモリ6に逐次書き込まれる。「一方向閾値格納手
段,一方向ピクセル数カウント手段,一方向判断手段」で
ある検出回路部2は、画像メモリ6に逐次書き込まれた
カラー画像データが、テキスト領域を構成しているもの
か、或いは非テキスト領域を構成しているものかを判別
する。検出回路部2でテキスト領域と判断された場合は
テキスト領域フラグ8を発生し、該フラグ8を画面表示
部5に出力し、画像メモリ6上のカラー画像データはテ
キストフィルタ部3およびグラフィックフィルタ部4に
出力する。
【0013】各フィルタ部3,4に入力されたカラー画
像データに対しテキストフィルタ,グラフィックフィル
タを施し、画面表示部5に出力する。画像表示部5は、
検出回路部2から出力される前記フラグ信号8に対応し
てテキストフィルタ後のカラー画像データ、もしくはグ
ラフィックフィルタを施したカラー画像データを出力す
る。
【0014】(2)概略動作 次に、図2を用いて本システムの動作フローを説明す
る。先ず、検出回路部2は、入力ビデオ信号1を受け、
カラー画像データの読み取りを行なう(ステップS2
1)。読み取ったカラー画像データをテキストフィルタ
部3とグラフィックフィルタ部4に出力する。
【0015】テキストフィルタ部3では、鮮鋭なテキス
ト画面を得るために、フィルタを施すことなくカラー画
像データをバイパスするか、もしくはテキスト強調,エ
ッジ強調等のテキスト用のフィルタを施す(ステップS
22)。グラフィックフィルタ部4では、滑らかなグラ
フィック画像を得るために、スムージング処理等のグラ
フィック用のフィルタ処理を行なう(ステップS23)。
【0016】ステップS22,S23でフィルタ処理し
たカラー画像データの同期をとり、画面表示部5へ出力
する。前記フィルタ処理(ステップS22,S23)と平
行して、検出回路部2にてカラー画像データを判別し、
テキスト領域の判別処理を行ない、テキスト領域だと判
断されれば、前記フラグ8を出力する(ステップS2
4)。
【0017】表示画面部7は、ステップS22,S23
でフィルタ処理されたカラー画像データとテキスト領域
フラグ8を受け取り、該フラグ8に対応したカラー画像
データを選択し、画面出力処理を行なう(ステップS2
5)。
【0018】(3)原理説明 カラー画像データ中からテキスト領域を検出する1つの
方法として、テキストデータには同一のカラーデータを
もつピクセルの水平方向の連続が見られるといった特性
を利用する。
【0019】図3(A)のビットマップ形式で表示され
たテキスト“Nec日本電気”10は、ゴシック体のア
ルファベット文字と漢字の文字列(テキスト)である。テ
キスト“Nec日本電気”10を拡大した場合を、図3
(B)に符号10Aで示す。
【0020】図3(B)において、ピクセルの連続性に
着目すると、テキストの場合、同一のカラーデータのピ
クセル(例えば、黒色)が水平方向に連続して現れるこ
とがわかる。
【0021】これに対して、図4(A)は、森の風景の
グラフィック画像の一部(例えば、杉の木の枝の部分)
であり、図4(B)は、図4(A)の一部を拡大したも
のである。図4(B)に示すように、一般に、非テキス
ト画像は、同一のカラーデータ(例えば、濃い緑)をも
つピクセルの連続性がテキスト領域と比較して顕著に現
れない。
【0022】よって、テキスト領域は、水平方向に同一
のカラーデータを持つピクセルの連続が現れるといった
特徴を持ち、非テキスト領域は、この特徴を持っていな
いことがわかる。
【0023】一方、カラー画像データは、ビットマップ
形式では表示画面の左上隅部から始めて同期的に逐次送
られる。カラー画像データは、走査線を左から右に横切
って1つのピクセルずつ回路へ送られる。同様に、出力
はピクセル単位で左から右へ、また上から下へ逐次送ら
れる。以上のことから、カラー画像データを走査方向に
従い、水平方向にピクセル単位で調べることにより、テ
キスト領域の場合は、同じカラーデータを持つピクセル
の連続を見出すことができる。
【0024】テキストを検出する為のアルゴリズムは、
同一のカラーデータを持つピクセルの連続が或る閾値以
上みられるか否かにより、テキスト領域の判断を行な
う。即ち、同一カラーピクセルの連続性が、或る閾値を
満たしている場合は、その領域をテキスト領域と判断す
る。
【0025】また、図3(A)のテキスト“Nec日本
電気”10は、垂直方向においても同一カラー画像デー
タを持つピクセルの連続性を見つけることができる。水
平方向のみの同一カラーデータの連続性によりテキスト
領域の判別を行なう方法も考えられるが、テキスト領域
検出の精度を上げるためには水平方向と垂直方向の両方
向で確認したほうがよい。そこで、次に、水平方向,垂
直方向ともに或る同一カラーデータ(例えば、黒)を持
つピクセルの連続性を確認し、テキスト領域の検出を行
なう場合の検出回路のハードウェア構成について説明す
る。
【0026】(4)詳細構成 前記検出回路部2のハードウェア構成は、図5,図6,図
7,図8に示すように、4つの部分からなる。
【0027】即ち、走査線データの一時記憶領域に対す
るライン・ストア・レジスタ30と、MxM(M:整数)
のピクセル・レジスタ・マトリックス40と、ピクセル
データを検査してピクセルの連続状態を確認するルック
アップテーブル50(図8)と、ピクセルを検査した結
果、テキスト領域だと判断されれば、テキストフラグを
立てるフラグ発生器で構成される。
【0028】カラー画像データは、前述の如く表示画像
の左上隅部から始めて同期的に逐次送られ、このデータ
は、走査線を左から右に横切って1つのピクセルずつ回
路へ送られる。同様に、出力もピクセル単位で左から右
へ、また上から下へ逐次送られる。
【0029】図5のライン・ストア・レジスタ30は、
N(N:整数)本の全走査線を記憶することができる記憶
装置からなる。各ライン・ストア・レジスタ30は、最
初のシフト・インされたピクセルが最初のシフト・アウ
トされたピクセルであるように、逐次に画像データをシ
フトすることができる。このライン・ストア・レジスタ
30の目的は、常に調べられる垂直方向の整合を維持す
ることである。即ち、ライン・ストア・レジスタ30の
使用は、或る走査線の最初のピクセルが前または次の走
査線の最初のピクセルのそれぞれ上または下にあること
を保証する。
【0030】図6は、必要な垂直方向の整合の原理を示
す。ライン(n+2)のピクセル1は、更にラインnの
ピクセル1と整合されるライン(n+1)のピクセル1
に渡って垂直方向に整合される。
【0031】図5には、またMxMレジスタマトリック
ス40を示す。このレジスタマトリックス40は、30
AAの出力を30ABの入力に与え、30ABを30A
Cに与え、というように配置されたMxM個のDタイプ
・フリップフロップのマトリクスである。同様に、30
BAを30BBに与え、30BBを30BBに与え、な
どの如くである。
【0032】ライン・ストア・レジスタ30Zの出力を
レジスタマトリックス要素30ZAに与え、最後にMx
Mレジスタマトリックス40を介してライン・ストア・
レジスタ30Yに与える。同様に、ライン・ストア・レ
ジスタ30Yはレジスタマトリックス要素30YAに与
えられ、といった様に繰り替えし実施される。
【0033】最後のライン・ストア・レジスタの場合3
0Aの場合は、出力はレジスタマトリックス要素30A
Aに与えられる。レジスタマトリックス要素30AZの
出力は、別ライン・ストア・レジスタに対する入力では
なく回路の出力となる。
【0034】図8の水平方向のルックアップテーブル5
0にランダム・アクセス・メモリ(RAM)装置を使用
することができる。
【0035】レジスタマトリックス要素30xA〜30
xZ(x=A〜Z)の各々の出力は、水平方向のRAM装
置に対するアドレス・ビットとして使用される。
【0036】図7は、RAM装置を水平方向のルックア
ップテーブルとして使用する構成の詳細を示している。
同様に、他の方向は独立的なRAM装置により処理され
る。水平方向と垂直方向で、予め定められた方向と対応
する2つのRAM装置が一緒にORされて、水平方向、
垂直方向について同一カラーデータをもつピクセルの連
続性を探すことができる。
【0037】ここで、図9を用いて、テキスト領域の判
別アルゴリズムについて説明する。水平方向、垂直方向
のルックアップテーブル50を用いて、ピクセルのカラ
ーデータを検索し、同一のカラーデータを持つピクセル
が連続しているものを探す。先ず、ピクセルの連続性を
確認する(ステップS71)。同一カラーデータを持つ
連続するピクセルの数をカウントし、そのピクセルの連
続数が閾値内であれば(ステップS72)、テキスト領
域のテキスト文字を構成しているピクセルのカラーデー
タ候補と考える(ステップS73)。
【0038】次に、テキスト文字を構成しているカラー
候補となったカラーデータを持つピクセルについて統計
をとる。テキスト文字を構成しているカラーデータ候補
となったカラーデータを持つピクセルの連続性が閾値a
に当てはまるものをカウントする(ステップS74)。
テキスト文字を構成しているカラーデータ候補となった
カラーデータを持つピクセルの連続性が閾値aに当ては
まらないものをカウントする(ステップS75)。
【0039】ステップS74,S75よりテキスト文字
を構成しているカラーデータ候補となったカラーデータ
を持つピクセルの連続性が、閾値aに当てはまる割合を
調べる(ステップS76)。ステップS76で確認し
た、閾値aに当てはまる割合が、閾値bの範囲に当ては
まるようであれば(ステップS77)、そのカラーデー
タをテキスト文字を構成しているピクセルのカラーデー
タだと判断する(ステップS78)。
【0040】テキスト文字を構成しているピクセルのカ
ラーデータが判明すれば、テキスト文字を構成している
カラーデータをもつピクセルの連続性が見られる近傍
は、テキスト領域だと判断する。
【0041】テキストを構成しているピクセルの連続数
の閾値aと、閾値aに当てはまる割合の閾値bを適当な
値に設定することで、テキスト文字を構成しているピク
セルのカラーデータ、およびテキスト領域を判断するこ
とができる。
【0042】(5)具体例 図3(B)を利用して説明する。ソリッドの背景色を構
成している背景カラーピクセル12と、テキスト文字を
構成しているテキスト文字カラーピクセル13の水平方
向の連続性を確認してみる。以下、説明の便宜上、テキ
スト文字カラーピクセル13のピクセルカラーを黒、背
景カラーピクセル12のピクセルカラーは、白と仮定を
する。
【0043】図3(B)の第1水平方向は、背景カラー
ピクセル(白)12の連続性(連続数)が、{23,3,
14}で、テキスト文字カラーピクセル(黒)13の連
続性(連続数)は、{9,1}である。同様に第2水平方向
は、背景カラーピクセル12の連続性は、{27,7,
6}、テキスト文字カラーピクセル13の連続性は、
{1,9}である。
【0044】このようにして、図3(B)のカラーピク
セル12,13の連続性について確認した結果が図10
(A),(B)である。図10(A)は、同一のカラー
データを持つピクセルが水平方向に3つ以上連続してい
る場合の各ピクセル12,13の連続数を表にしたもの
である。図10(B)は、各ピクセル12、13の連続
性が検索された回数を棒グラフにしたものである。
【0045】テキスト文字を構成している黒ピクセル
は、ピクセルの連続長3〜14の範囲に収まっているこ
とがわかる。よって、閾値a=3〜14に設定すれば、
黒ピクセルの検出が可能である。
【0046】また、背景を構成している白ピクセルも黒
ピクセルと同様、閾値aをパスしてしまうピクセルの連
続長を持っているので、白は、テキスト文字を構成して
いるピクセルのカラーデータ候補となるが、カラーデー
タ:白をもつピクセルの連続長が閾値aを満たしている
割合が、本実施例では、78%(閾値aを満たす連続ピ
クセルの検出回数:37、閾値aを満たさない連続ピク
セルの検出回数10)となるため、例えば、閾値b=9
0%以上とすることで、黒をテキスト文字を構成してい
るピクセルのカラーデータとして検出することができ
る。
【0047】また、本アルゴリズムを用い閾値a、bを
適切な値に設定できるシステムにおいてグラフィック上
にテキストが書き込まれている場合も、テキストの検出
が可能である。
【0048】[II]他の実施例 前記第1実施例では、テキスト判別の方法として、パソ
コンの例を挙げているが、これは一つの例であり、プリ
ンタやスキャナ,コピー機等、画像入力と画像出力を行
なう装置で、テキストと非テキストと判別処理を行なう
ことにより、性能向上を図ることができる装置に応用可
能である。
【0049】第1実施例では、入力ビデオ信号1をデジ
タルデータとしているが、アナログデータの場合は、A
D変換を行ない入力ビデオ信号1をデジタルデータとし
て第1実施例と同様に対応可能である。しかしながら、
アナログデータをデジタルデータに変換する場合、誤差
が生じる可能性がある。第1実施例では、同一のカラー
画像データをもつピクセルの連続性に着眼して、テキス
ト領域の判別を行なったが、同様(カラーデータの幅を
持たせる)のカラー画像データを持つピクセルの連続性
に着眼して、テキスト領域の判別を行なうことも可能で
ある。
【0050】また、第1実施例では、画像データをカラ
ーとしているが、モノクロに置き換えることも可能であ
る。
【0051】加えて、第1実施例では、水平方向,垂直
方向ともに、同一カラーデータを持つピクセルの連続性
を検索したが、テキスト判別アルゴリズムの閾値を適切
な値を設定することで、水平方向の同一カラーデータを
持つピクセルの連続性の検出だけでもテキスト領域を判
別可能である。その上、テキスト判別アルゴリズムの閾
値を適切な値を設定できることで、テキストの種類,文
字の大きさに拘らず、テキスト領域を判別可能である。
【0052】
【発明の効果】以上説明したように本発明によれば、以
下の効果を奏することができる。テキスト画面、非テキ
スト(グラフィックス)画面が一緒になった表示画面を一
様にフィルタを掛けるてもより最適な表示画面を得るこ
とはできない。テキスト画面は、非テキスト(グラフィ
ックス)画面と同様のフィルタを掛けるのではなく、フ
ィルタ無しもしくはテキスト強調するようなフィルタを
使用すべきである。また、画面表示の為の処理をリアル
タイムで行なうには演算の簡略化が必須である。
【0053】本発明は、テキストの特徴に着眼し、テキ
スト領域の検出を行ない、テキスト領域,非テキスト領
域毎に適切なフィルタを施すことによって表示画面内に
おけるテキストの明瞭化と平滑化された非テキスト表示
を提供することができる。
【図面の簡単な説明】
【図1】本発明の実施例の概略ブロック図である。
【図2】同実施例の概略フローチャートである。
【図3】本発明の原理説明に使用するテキストデータの
サンプルである。
【図4】本発明の原理説明に使用する非テキストデータ
のサンプルである。
【図5】前記概略ブロック図の一部の詳細ブロック図で
ある。
【図6】前記概略ブロック図の一部の詳細ブロック図で
ある。
【図7】前記概略ブロック図の一部の詳細ブロック図で
ある。
【図8】前記概略ブロック図の一部の詳細ブロック図で
ある。
【図9】前記詳細ブロック図の場合の動作フローチャー
トである。
【図10】図3におけるピクセルの連続数と発生頻度を
示す図である。
【図11】従来のテキストデータ検出器の要部構成を示
すブロック図である。
【符号の説明】
1 入力ビデオ信号 2 検出回路部 3 テキストフィルタ部 4 非テキストフィルタ部 5 画面表示部 6 画像メモリ 7 出力ビデオ信号 8 テキスト領域フラグ

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 テキストデータと非テキストデータとが
    混在するビットマップ形式のデータから前記テキストデ
    ータを検出するテキストデータ検出装置であって、 ビットマップ形式データの水平方向または垂直方向の一
    列に連続して存在する同一色のピクセル数が所定値を越
    えた場合は、テキストデータであるとする閾値を予め格
    納しておく一方向閾値格納手段と、 前記ビットマップ形式データの水平方向または垂直方向
    の一列に連続して存在する同一色のピクセル数をカウン
    トする一方向ピクセル数カウント手段と、 該ピクセル数カウント手段がカウントした前記ビットマ
    ップ形式データの水平方向または垂直方向の一列に連続
    して存在する同一色のピクセル数が、前記閾値を越えた
    場合に、テキストデータと判断する一方向判断手段とを
    備えたことを特徴とするテキストデータ検出装置。
  2. 【請求項2】 テキストデータと非テキストデータとが
    混在するビットマップ形式のデータから前記テキストデ
    ータを検出するデータからのテキストデータ検出方法で
    あって、 ビットマップ形式データの水平方向または垂直方向の一
    列に連続して存在する同一色のピクセル数が所定値を越
    えた場合は、テキストデータであるとする閾値を予め格
    納しておき、 前記ビットマップ形式データの水平方向または垂直方向
    の一列に連続して存在する同一色のピクセル数をカウン
    トし、 該ピクセル数のカウントが前記閾値を越えた場合に、テ
    キストデータと判断することを特徴とするテキストデー
    タ検出方法。
  3. 【請求項3】 テキストデータと非テキストデータとが
    混在するビットマップ形式のデータから前記テキストデ
    ータを検出するテキストデータ検出装置であって、 ビットマップ形式データの水平方向および垂直方向の一
    列に連続して存在する同一色のピクセル数が所定値を越
    えた場合は、テキストデータであるとする閾値を予め格
    納しておく二方向閾値格納手段と、 前記ビットマップ形式データの水平方向および垂直方向
    の一列に連続して存在する同一色のピクセル数をカウン
    トする二方向ピクセル数カウント手段と、 該ピクセル数カウント手段がカウントした前記ビットマ
    ップ形式データの水平方向および垂直方向の一列に連続
    して存在する同一色のピクセル数が、前記閾値を越えた
    場合に、テキストデータと判断する二方向判断手段とを
    備えたことを特徴とするテキストデータ検出装置。
  4. 【請求項4】 テキストデータと非テキストデータとが
    混在するビットマップ形式のデータから前記テキストデ
    ータを検出するテキストデータ検出方法であって、 ビットマップ形式データの水平方向および垂直方向の一
    列に連続して存在する同一色のピクセル数が所定値を越
    えた場合は、テキストデータであるとする閾値を予め格
    納しておき、 前記ビットマップ形式データの水平方向および垂直方向
    の一列に連続して存在する同一色のピクセル数をカウン
    トし、 該ピクセル数のカウントが前記閾値を越えた場合に、テ
    キストデータと判断することを特徴とするテキストデー
    タ検出方法。
  5. 【請求項5】 前記検出したテキストデータと、残され
    た非テキストデータとに、それぞれ別個のフィルタをか
    けることを特徴とする請求項1乃至請求項4記載のテキ
    ストデータ検出装置またはその方法。
  6. 【請求項6】 黒色ピクセルにおける前記閾値を、3〜
    14個に設定することを特徴とする請求項1乃至請求項
    5のいずれかに記載のテキストデータ検出装置またはそ
    の方法。
  7. 【請求項7】 前記ビットマップ形式の信号は、カラー
    画像信号であることを特徴とする請求項1乃至請求項6
    のいずれかに記載のテキストデータ検出装置またはその
    方法。
JP11107472A 1999-04-15 1999-04-15 テキストデータ検出装置およびその方法 Pending JP2000298725A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11107472A JP2000298725A (ja) 1999-04-15 1999-04-15 テキストデータ検出装置およびその方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11107472A JP2000298725A (ja) 1999-04-15 1999-04-15 テキストデータ検出装置およびその方法

Publications (1)

Publication Number Publication Date
JP2000298725A true JP2000298725A (ja) 2000-10-24

Family

ID=14460077

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11107472A Pending JP2000298725A (ja) 1999-04-15 1999-04-15 テキストデータ検出装置およびその方法

Country Status (1)

Country Link
JP (1) JP2000298725A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008004116A (ja) * 2007-08-02 2008-01-10 Hitachi Ltd 映像中の文字検索方法及び装置
US7403657B2 (en) 2001-03-22 2008-07-22 Hitachi, Ltd. Method and apparatus for character string search in image
JP2013257866A (ja) * 2012-06-12 2013-12-26 Xerox Corp 自然風景の中のテキストの発見
JP2017138989A (ja) * 2016-02-03 2017-08-10 株式会社ストラッドビジョン 画像に含まれるテキストを検出する方法、装置及びコンピュータ読み取り可能な記録媒体

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7403657B2 (en) 2001-03-22 2008-07-22 Hitachi, Ltd. Method and apparatus for character string search in image
JP2008004116A (ja) * 2007-08-02 2008-01-10 Hitachi Ltd 映像中の文字検索方法及び装置
JP2013257866A (ja) * 2012-06-12 2013-12-26 Xerox Corp 自然風景の中のテキストの発見
JP2017138989A (ja) * 2016-02-03 2017-08-10 株式会社ストラッドビジョン 画像に含まれるテキストを検出する方法、装置及びコンピュータ読み取り可能な記録媒体

Similar Documents

Publication Publication Date Title
JPH02105978A (ja) 自動文書セグメンテーションのためのシステム及び方法
JP2001109844A (ja) 文字列抽出方法、手書き文字列抽出方法、文字列抽出装置、および画像処理装置
CN109035256A (zh) 用户界面图像切割方法、装置、服务器和存储介质
JP3215768B2 (ja) 画像処理装置
US5687252A (en) Image processing apparatus
JP3427554B2 (ja) 画像処理装置及び方法
EP0657838B1 (en) Image processing apparatus and method
JP2000298725A (ja) テキストデータ検出装置およびその方法
US6289122B1 (en) Intelligent detection of text on a page
JP2004178562A (ja) グラフによる画像分割
JP2001022342A (ja) 画素数変換回路及びこれを用いた画像表示装置
US20050238235A1 (en) Run length based connected components and contour following for enhancing the performance of circled region extraction algorithm
US6356657B1 (en) Image processing method and apparatus for discriminating an input image area or an attribute of image information in the discriminated area
JPS6359272A (ja) 画像処理装置
JPS58106665A (ja) 文字行切出し方法
JPS62212879A (ja) イメ−ジデ−タ検索方式
JPS6331825B2 (ja)
JPH0564396B2 (ja)
JPH05344330A (ja) 画像領域識別装置
JPH02267678A (ja) 画像領域識別装置
JPS6224374A (ja) 画像変換装置
JPH05298443A (ja) カラー画像領域抽出装置
JPH07175927A (ja) 画像処理装置
KR100232308B1 (ko) 칼라 영상 분류 방법 및 장치
TW503377B (en) Image processing method and system with multiple modes

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20031211

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20031211

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20031211

A911 Transfer of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20040224

A912 Removal of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20040319

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20050311