JP2581409B2 - 文字切出装置 - Google Patents
文字切出装置Info
- Publication number
- JP2581409B2 JP2581409B2 JP5248829A JP24882993A JP2581409B2 JP 2581409 B2 JP2581409 B2 JP 2581409B2 JP 5248829 A JP5248829 A JP 5248829A JP 24882993 A JP24882993 A JP 24882993A JP 2581409 B2 JP2581409 B2 JP 2581409B2
- Authority
- JP
- Japan
- Prior art keywords
- characters
- character
- threshold
- extracted
- extracting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Landscapes
- Character Input (AREA)
Description
【0001】
【産業上の利用分野】本発明は文字切出装置に関し、特
に文字認識における前処理として文字切出しを行う文字
切出装置に関する。
に文字認識における前処理として文字切出しを行う文字
切出装置に関する。
【0002】
【従来の技術】一般に、文字認識における前処理として
の文字切出しは、所定の閾値に基づいて媒体上の文字情
報を2値化した後、一文字一文字の切出しが行われてい
た。その場合における閾値は従来、固定値であった。
の文字切出しは、所定の閾値に基づいて媒体上の文字情
報を2値化した後、一文字一文字の切出しが行われてい
た。その場合における閾値は従来、固定値であった。
【0003】
【発明が解決しようとする課題】上述した従来の文字切
出装置では、閾値が固定値であるために、媒体上の文字
切出し対象となる部分の色の濃度が変化した場合には適
応できず、文字を誤って切出してしまうことがあった。
例えば、X線フィルム上の患者文字情報を切出す場合に
は、2値化のための閾値が固定であるために、文字切出
しの対象となる部分の濃度がX線フィルム自体のベース
濃度の違いや、文字焼付け時の光量の条件の違い、現像
液の経時変化に伴う現像条件の違い等により、変化した
場合に、正しく適応できない。この結果、文字が複数個
つながったつぶれの状態になったり、一文字が分割され
るかすれの状態になり、正しく文字を切出せないという
欠点があった。
出装置では、閾値が固定値であるために、媒体上の文字
切出し対象となる部分の色の濃度が変化した場合には適
応できず、文字を誤って切出してしまうことがあった。
例えば、X線フィルム上の患者文字情報を切出す場合に
は、2値化のための閾値が固定であるために、文字切出
しの対象となる部分の濃度がX線フィルム自体のベース
濃度の違いや、文字焼付け時の光量の条件の違い、現像
液の経時変化に伴う現像条件の違い等により、変化した
場合に、正しく適応できない。この結果、文字が複数個
つながったつぶれの状態になったり、一文字が分割され
るかすれの状態になり、正しく文字を切出せないという
欠点があった。
【0004】このつぶれ、かすれについて図2,図3を
参照して説明する。
参照して説明する。
【0005】図2を参照すると、正常に文字切出しが実
行された場合に「0」「1」「2」となるが、つぶれ状
態になると符号20で示されているように「1」と
「2」とがつながった文字として切出される。
行された場合に「0」「1」「2」となるが、つぶれ状
態になると符号20で示されているように「1」と
「2」とがつながった文字として切出される。
【0006】また、図3を参照すると、正常に文字切出
しが実行された場合に図2の場合と同じく「0」「1」
「2」となるが、かすれ状態になると符号30で示され
ているように「0」や「2」の一部分が欠落したものと
して切出される。
しが実行された場合に図2の場合と同じく「0」「1」
「2」となるが、かすれ状態になると符号30で示され
ているように「0」や「2」の一部分が欠落したものと
して切出される。
【0007】以上のように、つぶれやかすれの状態にな
った場合には、文字認識が正しくなされないという欠点
があった。
った場合には、文字認識が正しくなされないという欠点
があった。
【0008】本発明は上述した従来の欠点を解決するた
めになされたものであり、その目的は文字切出しの対象
となる部分の濃度が変化した場合でも正しく文字を切出
すことのできる文字切出装置を提供することである。
めになされたものであり、その目的は文字切出しの対象
となる部分の濃度が変化した場合でも正しく文字を切出
すことのできる文字切出装置を提供することである。
【0009】
【課題を解決するための手段】本発明による文字切出装
置は、媒体上の文字情報を所定の閾値に基づいて2値化
し文字の切出しを行う文字切出し手段を有する文字切出
装置であって、外部入力され媒体上の文字の数を示す文
字数情報により示される文字数と前記文字切出し手段に
よって切出された文字の数とを比較する比較手段と、こ
の比較結果に応じて前記閾値を変化せしめる閾値制御手
段とを有し、前記比較結果により文字数の一致が示され
たとき該文字切出し結果を正しい結果として扱うように
したことを特徴とする。
置は、媒体上の文字情報を所定の閾値に基づいて2値化
し文字の切出しを行う文字切出し手段を有する文字切出
装置であって、外部入力され媒体上の文字の数を示す文
字数情報により示される文字数と前記文字切出し手段に
よって切出された文字の数とを比較する比較手段と、こ
の比較結果に応じて前記閾値を変化せしめる閾値制御手
段とを有し、前記比較結果により文字数の一致が示され
たとき該文字切出し結果を正しい結果として扱うように
したことを特徴とする。
【0010】
【実施例】次に、本発明について図面を参照して説明す
る。
る。
【0011】図1は本発明による文字切出装置の一実施
例における切出処理手順を示すフローチャートである。
以下、文字切出しの2値化処理の閾値Tの初期値をT
0、認識対象となる媒体上の文字数をNTとして説明す
る。
例における切出処理手順を示すフローチャートである。
以下、文字切出しの2値化処理の閾値Tの初期値をT
0、認識対象となる媒体上の文字数をNTとして説明す
る。
【0012】まず最初に、閾値Tの初期値としてT0が
与えられ、また認識対象となる文字数としてNTが外部
から与えられる(ステップ1)。次に、閾値T(現時点
ではT0)で2値化を行い(ステップ2)、1文字ずつ
の領域を切出す(ステップ3)。
与えられ、また認識対象となる文字数としてNTが外部
から与えられる(ステップ1)。次に、閾値T(現時点
ではT0)で2値化を行い(ステップ2)、1文字ずつ
の領域を切出す(ステップ3)。
【0013】ここで、切出された文字数Nと、正しい文
字数NTとを比較する(ステップ4)。比較の結果、文
字数N>NTであれば、かすれが生じたと判断して閾値
TをΔT下げて再度2値化を行う(ステップ4→5→
2)。一方、文字数N<NTであれば、つぶれが生じた
と判断して閾値TをΔT上げて再度2値化を行う(ステ
ップ4→6→2)。
字数NTとを比較する(ステップ4)。比較の結果、文
字数N>NTであれば、かすれが生じたと判断して閾値
TをΔT下げて再度2値化を行う(ステップ4→5→
2)。一方、文字数N<NTであれば、つぶれが生じた
と判断して閾値TをΔT上げて再度2値化を行う(ステ
ップ4→6→2)。
【0014】また、比較の結果、文字数N=NTであれ
ば、正しく文字切出しが実行されたと判断して文字切出
処理を終了する(ステップ4→7→8)。これにより、
以後の文字認識処理へと処理が移行する。
ば、正しく文字切出しが実行されたと判断して文字切出
処理を終了する(ステップ4→7→8)。これにより、
以後の文字認識処理へと処理が移行する。
【0015】要するに、本実施例の装置では、外部入力
された文字数と切出された文字数とを比較し、その比較
結果に応じて2値化するための閾値を変化させているの
で、文字を正しく切出すことができるのである。すなわ
ち、切出された文字数と正しい文字数とが一致するま
で、2値化のための閾値を変化させるので、文字のつぶ
れやかすれを生ずることなく正しい文字を切出すことが
できる。
された文字数と切出された文字数とを比較し、その比較
結果に応じて2値化するための閾値を変化させているの
で、文字を正しく切出すことができるのである。すなわ
ち、切出された文字数と正しい文字数とが一致するま
で、2値化のための閾値を変化させるので、文字のつぶ
れやかすれを生ずることなく正しい文字を切出すことが
できる。
【0016】なお、文字切出の対象となる媒体は、X線
フィルムに限定されないことはいうまでもない。
フィルムに限定されないことはいうまでもない。
【0017】
【発明の効果】以上説明したように本発明は、切出した
文字数が正しい数と一致するまで2値化のための閾値を
調整することにより、つぶれやかすれを生ずることな
く、文字を正しく切出すことができるという効果があ
る。
文字数が正しい数と一致するまで2値化のための閾値を
調整することにより、つぶれやかすれを生ずることな
く、文字を正しく切出すことができるという効果があ
る。
【図1】本発明の実施例による文字切出装置における文
字切出し手順を示すフローチャートである。
字切出し手順を示すフローチャートである。
【図2】文字のつぶれ状態の例を示す図である。
【図3】文字のかすれ状態の例を示す図である。
N 切出された文字数 NT 認識対象の文字数 T 閾値 T0 閾値Tの初期値
Claims (2)
- 【請求項1】 媒体上の文字情報を所定の閾値に基づい
て2値化し文字の切出しを行う文字切出し手段を有する
文字切出装置であって、外部入力され媒体上の文字の数
を示す文字数情報により示される文字数と前記文字切出
し手段によって切出された文字の数とを比較する比較手
段と、この比較結果に応じて前記閾値を変化せしめる閾
値制御手段とを有し、前記比較結果により文字数の一致
が示されたとき該文字切出し結果を正しい結果として扱
うようにしたことを特徴とする文字切出装置。 - 【請求項2】 前記閾値制御手段は、前記文字数情報に
より示される文字数より前記切出した文字の数が大であ
るとき前記閾値を低くし、前記切出した文字の数が小で
あるとき前記閾値を高くすることを特徴とする請求項1
記載の文字切出装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP5248829A JP2581409B2 (ja) | 1993-09-08 | 1993-09-08 | 文字切出装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP5248829A JP2581409B2 (ja) | 1993-09-08 | 1993-09-08 | 文字切出装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH0785219A JPH0785219A (ja) | 1995-03-31 |
JP2581409B2 true JP2581409B2 (ja) | 1997-02-12 |
Family
ID=17184047
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP5248829A Expired - Lifetime JP2581409B2 (ja) | 1993-09-08 | 1993-09-08 | 文字切出装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2581409B2 (ja) |
-
1993
- 1993-09-08 JP JP5248829A patent/JP2581409B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JPH0785219A (ja) | 1995-03-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3062382B2 (ja) | 画像処理装置及び方法 | |
JP4049560B2 (ja) | 網点除去方法及びシステム | |
JP2581409B2 (ja) | 文字切出装置 | |
JPS61141087A (ja) | 画像処理方法及び装置 | |
JPH1125222A (ja) | 文字切り出し方法及び文字切り出し装置 | |
JP7267854B2 (ja) | 帳票認識装置、帳票認識方法、及び帳票認識システム | |
JPH1164236A (ja) | 欠陥検出方法及びその装置並びに欠陥検出制御プログラムを記録した記録媒体 | |
JPH10285399A (ja) | 画像の二値化方法 | |
JP2000090194A (ja) | 画像処理方法および画像処理装置 | |
JP3763954B2 (ja) | 文字認識用の学習データ作成方法および記録媒体 | |
JPH05274422A (ja) | 細胞画像処理方法 | |
JP2004110434A (ja) | 画像処理方法および画像処理装置 | |
JP2957729B2 (ja) | 行方向判定装置 | |
JPH0785221A (ja) | 図面自動認識装置の文字とシンボルの分離・認識方法 | |
JP2001236467A (ja) | パターン認識方法、装置、およびパターン認識プログラムを記録した記録媒体 | |
JP2562067B2 (ja) | 文字画像の単語切出し装置 | |
JP3585143B2 (ja) | 文字列抽出方法および装置 | |
JPH10105647A (ja) | コンテナ番号読取り装置及びコンテナ番号読取り方法 | |
JP4013695B2 (ja) | 画像処理方法及び画像処理装置 | |
JP3157860B2 (ja) | 原稿の図形領域抽出方法 | |
JP3756660B2 (ja) | 画像認識方法、装置および記録媒体 | |
JPH10233930A (ja) | 画像処理装置 | |
JP3734614B2 (ja) | 画像処理方法、装置および記録媒体 | |
JP2004110128A (ja) | 画像処理装置、画像処理方法、および画像処理プログラム並びに記録媒体 | |
JPH0535921A (ja) | 文字照合装置及びそのための方法 |