JPH09223147A - デジタル複写機を用いた訳語出力装置 - Google Patents
デジタル複写機を用いた訳語出力装置Info
- Publication number
- JPH09223147A JPH09223147A JP8050863A JP5086396A JPH09223147A JP H09223147 A JPH09223147 A JP H09223147A JP 8050863 A JP8050863 A JP 8050863A JP 5086396 A JP5086396 A JP 5086396A JP H09223147 A JPH09223147 A JP H09223147A
- Authority
- JP
- Japan
- Prior art keywords
- image signal
- recognized
- image
- line
- character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Facsimile Image Signal Circuits (AREA)
- Character Input (AREA)
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
(57)【要約】
【課題】 認識された文字の検索結果を所定のルールで
判定し、効率的に検索結果を出力することを可能にし
た、精度の高い認識装置を備えたデジタル複写機を用い
た訳語出力装置を得る。 【解決手段】 スキャナ部1により読み取られた原稿画
像データは、認識処理が設定された場合、画像処理部3
を経て認識処理部102に入力され、文字認識が行われ
る。そして、1行中に認識された単語総数中の訳語が存
在した数(ヒット数)を所定数行記憶し、注目行及び前
後の行のヒット数が所定数以下の場合、または認識され
た単語の文字コードが文字以外または同じコードが所定
回連続している等のある設定されたパターンに合致する
か否かを判定し、1行中に認識された単語総数中の1行
中の前記パターン合致数の割合が所定値以上の場合に注
目行を作画することをやめることにより、余分な出力を
抑える。
判定し、効率的に検索結果を出力することを可能にし
た、精度の高い認識装置を備えたデジタル複写機を用い
た訳語出力装置を得る。 【解決手段】 スキャナ部1により読み取られた原稿画
像データは、認識処理が設定された場合、画像処理部3
を経て認識処理部102に入力され、文字認識が行われ
る。そして、1行中に認識された単語総数中の訳語が存
在した数(ヒット数)を所定数行記憶し、注目行及び前
後の行のヒット数が所定数以下の場合、または認識され
た単語の文字コードが文字以外または同じコードが所定
回連続している等のある設定されたパターンに合致する
か否かを判定し、1行中に認識された単語総数中の1行
中の前記パターン合致数の割合が所定値以上の場合に注
目行を作画することをやめることにより、余分な出力を
抑える。
Description
【0001】
【発明の属する技術分野】本発明は、訳語出力装置に関
し、デジタル複写機を利用して、スキャナで読み取った
画像データをプリンタ出力する前に認識処理部に取り込
み、文字と判定された領域の文字を認識し、認識された
文字(第1の言語)の訳語(第2の言語)を検索する手
段を備え、所定の形式で訳語を出力する訳語出力装置に
関する。
し、デジタル複写機を利用して、スキャナで読み取った
画像データをプリンタ出力する前に認識処理部に取り込
み、文字と判定された領域の文字を認識し、認識された
文字(第1の言語)の訳語(第2の言語)を検索する手
段を備え、所定の形式で訳語を出力する訳語出力装置に
関する。
【0002】
【従来の技術】特開平4−77965号公報に開示され
た「デジタル複写装置」では、文字として認識された第
1の言語は全て出力し、1行中に訳語が全くない場合も
認識した第1の言語を表示した。
た「デジタル複写装置」では、文字として認識された第
1の言語は全て出力し、1行中に訳語が全くない場合も
認識した第1の言語を表示した。
【0003】また特許平5−314175号公報に開示
された「対訳画像形成装置」では、認識された第1の言
語の1行中において検索された第2の言語(訳語)が全
くない場合は、その第1の言語を出力することをやめ、
無駄な出力をしないようにした。
された「対訳画像形成装置」では、認識された第1の言
語の1行中において検索された第2の言語(訳語)が全
くない場合は、その第1の言語を出力することをやめ、
無駄な出力をしないようにした。
【0004】
【発明が解決しようとする課題】原稿上に認識対象文字
である第1の言語以外の言語が存在した原稿を処理する
際、第1の言語以外の言語が第1の言語として認識され
る場合が殆どである。この場合認識処理において、第1
の言語の辞書から任意の単語が検索され認識結果とな
る。この時、偶然にも既存の単語もしくは熟語として文
字認識された場合、訳語検索処理において対象となる第
2の言語が検索され出力が行われることになる。
である第1の言語以外の言語が存在した原稿を処理する
際、第1の言語以外の言語が第1の言語として認識され
る場合が殆どである。この場合認識処理において、第1
の言語の辞書から任意の単語が検索され認識結果とな
る。この時、偶然にも既存の単語もしくは熟語として文
字認識された場合、訳語検索処理において対象となる第
2の言語が検索され出力が行われることになる。
【0005】従って本発明は、所定行において各行に存
在する訳語数を記憶し、注目行及びその前後の行の訳語
数が所定数に満たない場合は、注目行を第1の言語によ
って構成された行ではないと判断し出力しないことを目
的とする。
在する訳語数を記憶し、注目行及びその前後の行の訳語
数が所定数に満たない場合は、注目行を第1の言語によ
って構成された行ではないと判断し出力しないことを目
的とする。
【0006】さらに本発明は、認識された第1の言語の
認識結果の文字コードを判別することにより、記号や、
同一コードが連続するなど、訳語を持つ文字として認識
されていない単語が1行中に所定の確率で存在した場
合、注目行を第1の言語によって構成された行ではない
と判断し出力しないことを目的とする。
認識結果の文字コードを判別することにより、記号や、
同一コードが連続するなど、訳語を持つ文字として認識
されていない単語が1行中に所定の確率で存在した場
合、注目行を第1の言語によって構成された行ではない
と判断し出力しないことを目的とする。
【0007】
【課題を解決するための手段】かかる目的を達成するた
めに、図1の概略構成図に示すように、本発明のデジタ
ル複写機を用いた訳語出力装置は、原稿を光学的に読み
取り、光電変換して画像信号を得る原稿読み取り手段
1、2と、前記原稿読み取り手段によって読み取った画
像信号を記憶する画像記憶手段101と、前記画像記憶
手段に記憶された画像情報を用紙上に画像形成して出力
する画像出力手段4、5と、プリンタに出力する画像信
号を切り換えて認識処理部に画像信号を送る手段18
と、前記認識処理部に入力された画像信号の文字、罫線
を認識する手段を備えたデジタル複写機を用いた訳語出
力装置において、前記認識処理部に入力された画像信号
のうち、絵柄部と文字部の領域を識別する手段102−
1と、前記識別された文字領域の文字(第1の言語)を
認識する手段102−2と、前記認識された第1の言語
を第2の言語で検索する手段102−3と、前記認識さ
れた第1の言語及び検索された第2の言語を所定の形式
で画像メモリに記憶する手段102−4と、記憶された
画像記憶手段から画像信号を出力させる手段とを備えた
ことを特徴とする。
めに、図1の概略構成図に示すように、本発明のデジタ
ル複写機を用いた訳語出力装置は、原稿を光学的に読み
取り、光電変換して画像信号を得る原稿読み取り手段
1、2と、前記原稿読み取り手段によって読み取った画
像信号を記憶する画像記憶手段101と、前記画像記憶
手段に記憶された画像情報を用紙上に画像形成して出力
する画像出力手段4、5と、プリンタに出力する画像信
号を切り換えて認識処理部に画像信号を送る手段18
と、前記認識処理部に入力された画像信号の文字、罫線
を認識する手段を備えたデジタル複写機を用いた訳語出
力装置において、前記認識処理部に入力された画像信号
のうち、絵柄部と文字部の領域を識別する手段102−
1と、前記識別された文字領域の文字(第1の言語)を
認識する手段102−2と、前記認識された第1の言語
を第2の言語で検索する手段102−3と、前記認識さ
れた第1の言語及び検索された第2の言語を所定の形式
で画像メモリに記憶する手段102−4と、記憶された
画像記憶手段から画像信号を出力させる手段とを備えた
ことを特徴とする。
【0008】さらに、上記のデジタル複写機を用いた訳
語出力装置は、前記認識処理部に入力された画像信号の
うち、文字が存在する所定の領域を認識し認識精度を記
憶する手段と、前記認識処理の終了が伝達されたことに
より、前記記憶された画像記憶手段から画像信号を出力
させる手段と、前記記憶された画像記憶手段から出力し
た画像信号にγ補正処理を施す手段と、2値化のしきい
値を変更する手段と、前記γ補正処理と2値化によって
処理された画像信号を前記認識処理部に入力させる手段
と、前記認識した所定領域と同一領域の画像信号を認識
し、前記記憶した認識精度と比較する手段とを備えたこ
とを特徴とする。
語出力装置は、前記認識処理部に入力された画像信号の
うち、文字が存在する所定の領域を認識し認識精度を記
憶する手段と、前記認識処理の終了が伝達されたことに
より、前記記憶された画像記憶手段から画像信号を出力
させる手段と、前記記憶された画像記憶手段から出力し
た画像信号にγ補正処理を施す手段と、2値化のしきい
値を変更する手段と、前記γ補正処理と2値化によって
処理された画像信号を前記認識処理部に入力させる手段
と、前記認識した所定領域と同一領域の画像信号を認識
し、前記記憶した認識精度と比較する手段とを備えたこ
とを特徴とする。
【0009】本発明によれば、前記識別された文字領域
の文字の検索結果を所定のルールで判定し、所定のケー
スに合致するか否かを判定することにより、検索結果を
出力することのない、精度の高い認識装置を備えたデジ
タル複写機を用いた訳語出力装置を提供できる。
の文字の検索結果を所定のルールで判定し、所定のケー
スに合致するか否かを判定することにより、検索結果を
出力することのない、精度の高い認識装置を備えたデジ
タル複写機を用いた訳語出力装置を提供できる。
【0010】より詳細には、1行中に認識された単語総
数中の訳語が存在した数(ヒット数)を所定数行記憶
し、注目行及び前後の行のヒット数が所定数以下の場
合、注目行を作画することをやめることにより無駄な出
力を抑えることができる。
数中の訳語が存在した数(ヒット数)を所定数行記憶
し、注目行及び前後の行のヒット数が所定数以下の場
合、注目行を作画することをやめることにより無駄な出
力を抑えることができる。
【0011】さらに、認識された単語の文字コードが文
字以外または同じコードが所定回連続している等のある
設定されたパターンに合致するか否かを判定し、1行中
に認識された単語総数中の1行中の前記パターン合致数
の割合が所定値以上の場合、注目行を作画することをや
めることにより無駄な出力を抑えることができる。
字以外または同じコードが所定回連続している等のある
設定されたパターンに合致するか否かを判定し、1行中
に認識された単語総数中の1行中の前記パターン合致数
の割合が所定値以上の場合、注目行を作画することをや
めることにより無駄な出力を抑えることができる。
【0012】
【発明の実施の形態】次に添付図面を参照して、本発明
によるデジタル複写機を用いた訳語出力装置の実施の形
態を説明する。図1を参照すると本発明のデジタル複写
機を用いた訳語出力装置の一実施形態が示されている。
先ず、認識装置を搭載したデジタル複写機を用いた訳語
出力装置の構成について説明する。
によるデジタル複写機を用いた訳語出力装置の実施の形
態を説明する。図1を参照すると本発明のデジタル複写
機を用いた訳語出力装置の一実施形態が示されている。
先ず、認識装置を搭載したデジタル複写機を用いた訳語
出力装置の構成について説明する。
【0013】図1は原稿を読み取ってLD(レーザダイ
オード)を駆動して画像信号を記録紙に書き込むまでの
概略構成図である。CCDイメージセンサ1によって原
稿画像が読み取られ、2に送られる。2に送られた画像
信号は増幅器で所定の電圧振幅に増幅され、その後A/
D変換回路で1画素あたり2n 乗階調(本実施例では2
56階調)のデジタルデータに変換される。そして、シ
ェーディング補正回路で光源の照度ムラ及びCCDイメ
ージセンサの各素子間の感度ばらつき等が補正され、画
像処理部3に入力される。画像処理部3において画像処
理が施され、LD制御回路4に画像信号が送られる。L
D制御回路4は送られた画像信号に従ってレーザダイオ
ードの点灯信号を生成し、LD5を駆動する。
オード)を駆動して画像信号を記録紙に書き込むまでの
概略構成図である。CCDイメージセンサ1によって原
稿画像が読み取られ、2に送られる。2に送られた画像
信号は増幅器で所定の電圧振幅に増幅され、その後A/
D変換回路で1画素あたり2n 乗階調(本実施例では2
56階調)のデジタルデータに変換される。そして、シ
ェーディング補正回路で光源の照度ムラ及びCCDイメ
ージセンサの各素子間の感度ばらつき等が補正され、画
像処理部3に入力される。画像処理部3において画像処
理が施され、LD制御回路4に画像信号が送られる。L
D制御回路4は送られた画像信号に従ってレーザダイオ
ードの点灯信号を生成し、LD5を駆動する。
【0014】また、本実施例のデジタル複写機は256
階調の画像信号(白黒)の他に2値の所定色(本実施例
では赤とする。)の画像信号を扱う構成になっている。
LED制御回路6に所定の色信号が送られる。LED制
御回路6は送られた画像信号に従ってLEDA(レーザ
エミッタダイオードアレイ)7を駆動する。CPU8は
2、3、4を制御する。CPU周辺IC9はCPU周辺
のデータ、アドレスの入出力を制御する。デジタル複写
機のエンジン部10は、CPU8とシリアル通信を行っ
て動作制御を行う。編集処理部11はデジタル複写機で
様々な画像加工処理を行うことができる。画像メモリ部
101は、画像処理部3に送られてLD制御回路4に送
られる画像信号と同一の画像信号を記憶する。認識処理
部102は画像処理部3に送られた画像信号の文字部を
認識する。
階調の画像信号(白黒)の他に2値の所定色(本実施例
では赤とする。)の画像信号を扱う構成になっている。
LED制御回路6に所定の色信号が送られる。LED制
御回路6は送られた画像信号に従ってLEDA(レーザ
エミッタダイオードアレイ)7を駆動する。CPU8は
2、3、4を制御する。CPU周辺IC9はCPU周辺
のデータ、アドレスの入出力を制御する。デジタル複写
機のエンジン部10は、CPU8とシリアル通信を行っ
て動作制御を行う。編集処理部11はデジタル複写機で
様々な画像加工処理を行うことができる。画像メモリ部
101は、画像処理部3に送られてLD制御回路4に送
られる画像信号と同一の画像信号を記憶する。認識処理
部102は画像処理部3に送られた画像信号の文字部を
認識する。
【0015】図2は図1の画像処理部3を説明する図で
ある。画像処理部は大きく3つのブロックに分けられ
る。画像信号202はスキャナ部においてRGBのデジ
タル信号に変換された256階調の画像信号である。ビ
デオ制御信号200は各回路において画像信号202の
タイミング制御を行う信号である。ブロック1は、画像
信号202から256階調の白黒画像信号BK202と
赤データの有無を表す2階調(1ビット)の赤検出信号
Red203を生成する2色処理回路12を有する。
ある。画像処理部は大きく3つのブロックに分けられ
る。画像信号202はスキャナ部においてRGBのデジ
タル信号に変換された256階調の画像信号である。ビ
デオ制御信号200は各回路において画像信号202の
タイミング制御を行う信号である。ブロック1は、画像
信号202から256階調の白黒画像信号BK202と
赤データの有無を表す2階調(1ビット)の赤検出信号
Red203を生成する2色処理回路12を有する。
【0016】ブロック2は、2次元リアルタイム変倍を
行う変倍回路13及び文字、線字画像等の解像力をあげ
るMTF補正、信号ノイズを除去し写真等の再現性を向
上させる平滑化処理等を行う空間フィルタ回路14を有
する。ブロック3は濃度設定機能に応じたγ補正を行う
γ補正回路15、画質機能設定に応じて中間調処理等を
行う階調処理回路16を有する。画像メモリ101には
256階調の画像信号202が入力される。本実施例で
は、ブロック2を出力した後の信号が入力される。認識
処理が設定された場合は、ブロック3からLD制御回路
4(プリンタ)に送られる画像信号202が切り換えら
れて認識処理部102に入力される。
行う変倍回路13及び文字、線字画像等の解像力をあげ
るMTF補正、信号ノイズを除去し写真等の再現性を向
上させる平滑化処理等を行う空間フィルタ回路14を有
する。ブロック3は濃度設定機能に応じたγ補正を行う
γ補正回路15、画質機能設定に応じて中間調処理等を
行う階調処理回路16を有する。画像メモリ101には
256階調の画像信号202が入力される。本実施例で
は、ブロック2を出力した後の信号が入力される。認識
処理が設定された場合は、ブロック3からLD制御回路
4(プリンタ)に送られる画像信号202が切り換えら
れて認識処理部102に入力される。
【0017】図3は、図2で示した実施例では2色を扱
っているのに対し、モノクロのデータを扱う実施例のブ
ロック図である。モノクロデータを扱う場合には、図1
に示すスキャナ部のCCDがモノクロデータを読み取
る。従って画像信号201には256階調のモノクロデ
ータが入力される。
っているのに対し、モノクロのデータを扱う実施例のブ
ロック図である。モノクロデータを扱う場合には、図1
に示すスキャナ部のCCDがモノクロデータを読み取
る。従って画像信号201には256階調のモノクロデ
ータが入力される。
【0018】本実施例では、モノクロの場合について説
明する。図4のブロック図及び図6のフロー図を用いて
本発明のデジタル複写機を用いた訳語出力装置の訳語出
力の実施例を説明する。まず、操作部入力で無駄な訳語
出力を省くか否かの選択ができるようにする(S60
1)。次に、原稿がマーカ使用のものであれば、マーカ
された原稿のスキャンを行う(S602)。スキャンさ
れた画像データは、図3の画像信号201の256階調
のBkデータとなる。ブロック2から出力された画像信
号201は編集処理部11においてリアルタイムにマー
カペン領域が検知され、マーカペンで囲まれた画像デー
タのみがγ補正回路15に送られる(S603)。
明する。図4のブロック図及び図6のフロー図を用いて
本発明のデジタル複写機を用いた訳語出力装置の訳語出
力の実施例を説明する。まず、操作部入力で無駄な訳語
出力を省くか否かの選択ができるようにする(S60
1)。次に、原稿がマーカ使用のものであれば、マーカ
された原稿のスキャンを行う(S602)。スキャンさ
れた画像データは、図3の画像信号201の256階調
のBkデータとなる。ブロック2から出力された画像信
号201は編集処理部11においてリアルタイムにマー
カペン領域が検知され、マーカペンで囲まれた画像デー
タのみがγ補正回路15に送られる(S603)。
【0019】γ補正回路15では濃度機能設定に応じた
γ補正が行われ、階調処理回路16に送られる。この
際、階調処理回路16において画質機能設定に応じたデ
ィザ処理等の中間調処理を行う。階調処理回路16にお
いて中間調処理を施した画像に対して17において所定
のしきい値で2値化を行う。認識処理を施す設定になっ
ている場合、認識処理部I/F18より、17で2値化
された画像信号が認識処理部102に入力され認識処理
部102における画像メモリに記憶される(S60
4)。
γ補正が行われ、階調処理回路16に送られる。この
際、階調処理回路16において画質機能設定に応じたデ
ィザ処理等の中間調処理を行う。階調処理回路16にお
いて中間調処理を施した画像に対して17において所定
のしきい値で2値化を行う。認識処理を施す設定になっ
ている場合、認識処理部I/F18より、17で2値化
された画像信号が認識処理部102に入力され認識処理
部102における画像メモリに記憶される(S60
4)。
【0020】次に、図4の102−1において領域別処
理を行う(S605)。S605の領域判別で判定され
た領域情報を格納する(S606)。S605において
判定された文字領域データに対してOCR処理部(10
2−2)において文字認識を行い(S607)、結果を
格納する(S608)。S608で認識した言語を所定
の言語データに対訳するために辞書検索を行い(S60
9)、検索結果を格納する(S610)。S608及び
S610の結果を用いて検索結果判定部102−5にお
いて判定を行い(S611)、出力結果を作画し(S6
12)、S612で作画した画像を出力する(S61
3)。
理を行う(S605)。S605の領域判別で判定され
た領域情報を格納する(S606)。S605において
判定された文字領域データに対してOCR処理部(10
2−2)において文字認識を行い(S607)、結果を
格納する(S608)。S608で認識した言語を所定
の言語データに対訳するために辞書検索を行い(S60
9)、検索結果を格納する(S610)。S608及び
S610の結果を用いて検索結果判定部102−5にお
いて判定を行い(S611)、出力結果を作画し(S6
12)、S612で作画した画像を出力する(S61
3)。
【0021】図5は、図4で示した実施例に画像メモリ
を設けた場合のブロック図である。この実施例によれ
ば、画像メモリに記憶された画像データを使用して認識
処理を行うこともできる。
を設けた場合のブロック図である。この実施例によれ
ば、画像メモリに記憶された画像データを使用して認識
処理を行うこともできる。
【0022】図7のフロー図を用いて本発明のデジタル
複写機を用いた訳語出力装置における検索結果判定の一
つの実施例を説明する。図7のフロー図は図6の検索結
果判定S611に相当する。検索結果判定S611は、
S606、S608、S610で格納された認識結果を
用いて実行される。本実施例では一実施例としてメモリ
を設け、そのメモリにより注目行とその前後のラインの
3ラインの結果を記憶する(S608)。
複写機を用いた訳語出力装置における検索結果判定の一
つの実施例を説明する。図7のフロー図は図6の検索結
果判定S611に相当する。検索結果判定S611は、
S606、S608、S610で格納された認識結果を
用いて実行される。本実施例では一実施例としてメモリ
を設け、そのメモリにより注目行とその前後のラインの
3ラインの結果を記憶する(S608)。
【0023】S702において原稿中に段組み等の所定
単位で認識された文字領域総数分のループを行う。S7
03で各領域における領域に存在する総行数を取得し、
S704において総行数分のループを行う。S705に
おいて各行の認識された単語数(k)及びその認識され
た単語の中で訳語が存在した訳語数(m)を取得する。
S706において1行中の訳語数/総単語数の値を求め
る。求めた訳語数/総単語数の値をS708に設けたメ
モリに記憶する。S707において、S708で記憶さ
れた値が3ラインとも所定の割合以下であるか否かを判
定する。所定の割合以上であれば、S709において出
力のための作画を行う(S612)。
単位で認識された文字領域総数分のループを行う。S7
03で各領域における領域に存在する総行数を取得し、
S704において総行数分のループを行う。S705に
おいて各行の認識された単語数(k)及びその認識され
た単語の中で訳語が存在した訳語数(m)を取得する。
S706において1行中の訳語数/総単語数の値を求め
る。求めた訳語数/総単語数の値をS708に設けたメ
モリに記憶する。S707において、S708で記憶さ
れた値が3ラインとも所定の割合以下であるか否かを判
定する。所定の割合以上であれば、S709において出
力のための作画を行う(S612)。
【0024】図8のフロー図を用いて本発明のデジタル
複写機を用いた訳語出力装置における検索結果判定の他
の実施例を説明する。図8のS801〜S805までは
図7のS701〜S705と同じである。S806にお
いて一行中に存在する単語数分のループを行う。S80
7において各単語を構成する文字コードを識別し、S8
08に設けたメモリに記憶する。
複写機を用いた訳語出力装置における検索結果判定の他
の実施例を説明する。図8のS801〜S805までは
図7のS701〜S705と同じである。S806にお
いて一行中に存在する単語数分のループを行う。S80
7において各単語を構成する文字コードを識別し、S8
08に設けたメモリに記憶する。
【0025】S807の動作についてさらに説明する。
図9は英文と日本文が混在した原稿を領域識別した結果
である。図10は、図9中の英文を認識して日本語訳を
出力した対話形式を出力した結果である。図10におい
て、第2領域、第3領域は全て日本語が英文として誤認
識されたものである。第2領域に第1の言語として認識
され出力された「●日本文学専攻●」は、英文OCRさ
れた結果として「@.m*.」となっている。このよう
にOCR結果が英文のa〜z以外の文字コードで全て認
識されている。第3領域に「文学」ということばが第1
の言語の「Add」という、偶然、訳語の存在する文字
として誤認識され出力されている。それ以外の単語の文
字コードをみると数字、記号が混在しているものばかり
である。このような特徴を任意のパターンとして設定し
それに合致するか否かをS807で識別する。
図9は英文と日本文が混在した原稿を領域識別した結果
である。図10は、図9中の英文を認識して日本語訳を
出力した対話形式を出力した結果である。図10におい
て、第2領域、第3領域は全て日本語が英文として誤認
識されたものである。第2領域に第1の言語として認識
され出力された「●日本文学専攻●」は、英文OCRさ
れた結果として「@.m*.」となっている。このよう
にOCR結果が英文のa〜z以外の文字コードで全て認
識されている。第3領域に「文学」ということばが第1
の言語の「Add」という、偶然、訳語の存在する文字
として誤認識され出力されている。それ以外の単語の文
字コードをみると数字、記号が混在しているものばかり
である。このような特徴を任意のパターンとして設定し
それに合致するか否かをS807で識別する。
【0026】
【発明の効果】本発明によれば、認識された文字の検索
結果を所定のルールで判定し、所定のケースに合致する
か否かを判定することにより、検索結果を出力すること
のない精度の高い認識装置を備えたデジタル複写機を用
いた訳語出力装置を提供できる。
結果を所定のルールで判定し、所定のケースに合致する
か否かを判定することにより、検索結果を出力すること
のない精度の高い認識装置を備えたデジタル複写機を用
いた訳語出力装置を提供できる。
【0027】さらに、本発明のデジタル複写機を用いた
訳語出力装置によれば、注目行とその前後の所定ライン
数のヒット率を判定することにより無駄な出力を省き、
さらに、認識された単語の文字コードの特徴を調べるこ
とにより、誤認識された意味のない情報を紙面上に出力
することを回避し、紙の無駄を抑えることができる。
訳語出力装置によれば、注目行とその前後の所定ライン
数のヒット率を判定することにより無駄な出力を省き、
さらに、認識された単語の文字コードの特徴を調べるこ
とにより、誤認識された意味のない情報を紙面上に出力
することを回避し、紙の無駄を抑えることができる。
【図1】本発明の認識装置を備えたデジタル複写機を用
いた訳語出力装置の概略構成図である。
いた訳語出力装置の概略構成図である。
【図2】本発明の実施例に係る画像処理部を説明するブ
ロック図(2色のデータを扱う場合)である。
ロック図(2色のデータを扱う場合)である。
【図3】本発明の実施例に係る画像処理部を説明するブ
ロック図(モノクロのデータを扱う場合)である。
ロック図(モノクロのデータを扱う場合)である。
【図4】本発明の実施例に係る画像処理部の一部及び認
識処理部のブロック図である。
識処理部のブロック図である。
【図5】本発明の実施例に係る画像処理部の一部及び認
識処理部のブロック図(画像メモリを設けた場合)であ
る。
識処理部のブロック図(画像メモリを設けた場合)であ
る。
【図6】本発明の認識装置を備えたデジタル複写機を用
いた訳語出力装置の訳語出力のフロー図である。
いた訳語出力装置の訳語出力のフロー図である。
【図7】図6の検索結果判定の一つの実施例を説明する
フロー図である。
フロー図である。
【図8】図6の検索結果判定のもう一つの実施例を説明
するフロー図である。
するフロー図である。
【図9】領域識別された出力図の一実施例である。
【図10】対訳処理された出力図の一実施例である。
1 スキャナ部(CCD) 2 スキャナ部の増幅器、A/D変換器、シェーディン
グ補正部 3 画像処理部 4 LD制御部 5 LD 6 LED制御部 7 LEAD 8 CPU 9 CPU周辺の集積回路(IC) 10 エンジンユニット 11 編集処理部 12 2色処理部 13 変倍部 14 空間フィルタ部 15 γ補正処理部 16 階調処理部 17 2値化処理部 18 認識処理部I/F 19 タイミング制御部 101 画像メモリ 102 認識処理部 102−1 領域認識処理部 102−2 OCR処理部 102−3 辞書検索部 102−4 作画部 102−5 検索結果判定部 200 ビデオ制御信号 201 デジタルBlack信号 202 デジタルRed、Green、Blue信号
グ補正部 3 画像処理部 4 LD制御部 5 LD 6 LED制御部 7 LEAD 8 CPU 9 CPU周辺の集積回路(IC) 10 エンジンユニット 11 編集処理部 12 2色処理部 13 変倍部 14 空間フィルタ部 15 γ補正処理部 16 階調処理部 17 2値化処理部 18 認識処理部I/F 19 タイミング制御部 101 画像メモリ 102 認識処理部 102−1 領域認識処理部 102−2 OCR処理部 102−3 辞書検索部 102−4 作画部 102−5 検索結果判定部 200 ビデオ制御信号 201 デジタルBlack信号 202 デジタルRed、Green、Blue信号
Claims (5)
- 【請求項1】 原稿を光学的に読み取り、光電変換して
画像信号を得る原稿読み取り手段と、 前記原稿読み取り手段によって読み取った画像信号を記
憶する画像記憶手段と、 前記画像記憶手段に記憶された画像情報を用紙上に画像
形成して出力する画像出力手段と、 プリンタに出力する画像信号を切り換えて認識処理部に
画像信号を送る手段と、 前記認識処理部に入力された画像信号の文字、罫線を認
識する手段を備えたデジタル複写機を用いた訳語出力装
置において、該装置はさらに、 前記認識処理部に入力された画像信号のうち、絵柄部と
文字部の領域を識別する手段と、 前記識別された文字領域の文字(第1の言語)を認識す
る手段と、 前記認識された第1の言語を第2の言語で検索する手段
と、 前記認識された第1の言語及び検索された第2の言語を
所定の形式で画像メモリに記憶する手段と、 記憶された画像記憶手段から画像信号を出力させる手段
とを備えたことを特徴とするデジタル複写機を用いた訳
語出力装置。 - 【請求項2】 前記認識処理部に入力された画像信号の
うち、文字が存在する所定の領域を認識し認識精度を記
憶する手段と、 前記認識処理の終了が伝達されたことにより、前記記憶
された画像記憶手段から画像信号を出力させる手段と、 前記記憶された画像記憶手段から出力した画像信号にγ
補正処理を施す手段と、 2値化のしきい値を変更する手段と、 前記γ補正処理と2値化によって処理された画像信号を
前記認識処理部に入力させる手段と、 前記認識した所定領域と同一領域の画像信号を認識し、
前記記憶した認識精度と比較する手段とを備えたことを
特徴とする請求項1記載のデジタル複写機を用いた訳語
出力装置。 - 【請求項3】前記識別された文字領域の文字の検索結果
を所定のルールで判定し、所定のケースに合致するか否
かを判定することにより、検索結果を出力することのな
いことを特徴とする請求項1または2に記載のデジタル
複写機を用いた訳語出力装置。 - 【請求項4】前記検索結果を判定する手段では、1行中
に認識された単語総数中の訳語が存在した数(ヒット
数)を所定数行記憶し、注目行及び前後の行のヒット数
が所定数以下の場合、注目行を作画することをやめるこ
とを特徴とする請求項3記載のデジタル複写機を用いた
訳語出力装置。 - 【請求項5】前記検索結果を判定する手段では、前記認
識された単語の文字コードが文字以外または同じコード
が所定回連続している等の所定の設定されたパターンに
合致するか否かを判定し、1行中に認識された単語総数
中の1行中の前記パターン合致数の割合が所定値以上の
場合、注目行を作画することをやめることを特徴とする
請求項3記載のデジタル複写機を用いた訳語出力装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP8050863A JPH09223147A (ja) | 1996-02-14 | 1996-02-14 | デジタル複写機を用いた訳語出力装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP8050863A JPH09223147A (ja) | 1996-02-14 | 1996-02-14 | デジタル複写機を用いた訳語出力装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH09223147A true JPH09223147A (ja) | 1997-08-26 |
Family
ID=12870571
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP8050863A Pending JPH09223147A (ja) | 1996-02-14 | 1996-02-14 | デジタル複写機を用いた訳語出力装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH09223147A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8508795B2 (en) | 2009-03-16 | 2013-08-13 | Ricoh Company, Limited | Information processing apparatus, information processing method, and computer program product for inserting information into in image data |
-
1996
- 1996-02-14 JP JP8050863A patent/JPH09223147A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8508795B2 (en) | 2009-03-16 | 2013-08-13 | Ricoh Company, Limited | Information processing apparatus, information processing method, and computer program product for inserting information into in image data |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6005680A (en) | Method for capturing a document image, a scanner using the method and a document image management system using the scanner | |
CN101382944B (zh) | 图像处理装置和方法、图像形成装置、图像读取装置 | |
US8208744B2 (en) | Image processing apparatus capable of accurately and quickly determining character part included in image | |
US7321688B2 (en) | Image processor for character recognition | |
US6661921B2 (en) | Image process apparatus, image process method and storage medium | |
US5982955A (en) | Optical image indexed document filer | |
JPH09223147A (ja) | デジタル複写機を用いた訳語出力装置 | |
US6983077B2 (en) | Image processor | |
US8422785B2 (en) | Image processing apparatus, image processing method, and program | |
JPH06131495A (ja) | 画像情報抽出方式 | |
US6947595B2 (en) | System for processing object areas of an image | |
JP3536165B2 (ja) | 画像処理装置及び画像出力装置 | |
JPH10108012A (ja) | 像域分離装置 | |
JPH05136995A (ja) | 画像データの単純2値化および擬似中間調混用処理方法およびその装置 | |
JPH0997252A (ja) | 訳語出力装置 | |
JPH08274915A (ja) | デジタル複写機 | |
JP4438469B2 (ja) | 画像処理装置および方法 | |
KR930007984B1 (ko) | 국부적인 최대 및 최소 밝기값을 이용한 이치화방법 | |
JP3787371B2 (ja) | 複合画像処理装置および複合画像処理装置の制御方法 | |
JPH0338782A (ja) | 原稿濃度検出装置 | |
JPH06274691A (ja) | 文字認識装置 | |
JPS62219766A (ja) | 画像処理装置 | |
JP2683711B2 (ja) | 文字・記号データの認識・修正方法 | |
JPH09114833A (ja) | 電子辞書装置 | |
JPH0199366A (ja) | 画像入力装置 |