JP2004199483A - 画像出力装置 - Google Patents
画像出力装置 Download PDFInfo
- Publication number
- JP2004199483A JP2004199483A JP2002368528A JP2002368528A JP2004199483A JP 2004199483 A JP2004199483 A JP 2004199483A JP 2002368528 A JP2002368528 A JP 2002368528A JP 2002368528 A JP2002368528 A JP 2002368528A JP 2004199483 A JP2004199483 A JP 2004199483A
- Authority
- JP
- Japan
- Prior art keywords
- image
- unit
- character
- output
- error
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/30—Character recognition based on the type of data
- G06V30/304—Music notations
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Record Information Processing For Printing (AREA)
- Control Or Security For Electrophotography (AREA)
- Character Discrimination (AREA)
Abstract
【課題】画像の印刷出力を行う画像出力装置において、出力すべき画像に含まれる文字等に例えば文法上の誤りがあった場合には、これを検出して出力画像にて識別可能にする。
【解決手段】画像データを取得する画像入力手段11と、取得した画像データから印刷出力すべき画像中に含まれるキャラクタを認識するキャラクタ認識手段12と、その認識結果から得られるキャラクタ列に表現ルール上の誤りがあるか否かを判断する誤り検知手段13と、誤りがあると判断された場合に当該誤りの修正候補を生成し前記印刷出力すべき画像中に付加する出力画像作成手段14と、前記修正候補の付加後の画像を記録紙上に印刷出力する画像出力手段15とを備えるように、画像出力装置1を構成する。
【選択図】 図1
【解決手段】画像データを取得する画像入力手段11と、取得した画像データから印刷出力すべき画像中に含まれるキャラクタを認識するキャラクタ認識手段12と、その認識結果から得られるキャラクタ列に表現ルール上の誤りがあるか否かを判断する誤り検知手段13と、誤りがあると判断された場合に当該誤りの修正候補を生成し前記印刷出力すべき画像中に付加する出力画像作成手段14と、前記修正候補の付加後の画像を記録紙上に印刷出力する画像出力手段15とを備えるように、画像出力装置1を構成する。
【選択図】 図1
Description
【0001】
【発明の属する技術分野】
本発明は、例えばデジタル複写機やプリンタ装置のように、記録紙上に画像を印刷出力する機能を有した画像出力装置に関する。
【0002】
【従来の技術】
一般に、画像出力装置としては、その代表的なものとして原稿から読み取った画像と同じ画像を作成して記録紙上に印刷出力するデジタル複写機が広く知られているが、近年では単に画像の印刷出力を行うだけではなく、付加的な価値を加えたものも多く提案されている。例えば、複写機の中には、文字情報を認識する機能を有し、原稿から読み取った画像中に含まれる単語を認識してその認識結果を他言語に翻訳し、読み取った画像に他言語による訳語を付記して印刷出力するものがある(例えば、特許文献1参照)。また、その他にも、文字情報を認識する機能を利用して、原稿から読み取った画像中に手書き文字が含まれていると、これを予め準備されている文字パターンの書体に置き換え、文字が清書された画像として印刷出力するものもある(例えば、特許文献2参照)。
【0003】
【特許文献1】
特開昭62−154845号公報
【特許文献2】
特開昭63−187870号公報
【0004】
【発明が解決しようとする課題】
ところで、人間が作成したドキュメントには、手書きのものや電子文書に限らず、誤記・誤字・脱字、あるいは文法上の誤り等が含まれることが多くある。これらを自動的に検出して指摘してくれる装置があれば、例えば複写機のユーザにとっては非常に便利である。
【0005】
これを実現するために従来技術を応用することを考えると、例えば特許文献1に記載の従来技術では、単語の対訳を併記するために単語の認識を行うので、単語毎の誤りの検出の機能を取り入れることは可能と思われるが、複数の単語や文節の関連による文法上の誤りの検出までは実現することができない。また、例えば特許文献2に記載の従来技術では、手書きの文書を清書出力するために文字認識を行うが、そのまま出力用の書体の文字への置き換えを行うのに過ぎず、誤字・脱字等があってもそれを指摘するのは困難である。
【0006】
そこで、本発明は、画像の印刷出力を行うのに加えて、その画像に含まれる文字等に例えば文法上の誤りがあった場合にはこれを検出し、それを出力画像に付記して指摘することで、ユーザにとって非常に便利なものとなる画像出力装置を提供することを目的とする。
【0007】
【課題を解決するための手段】
本発明は、上記目的を達成するために案出された画像出力装置で、印刷出力すべき画像についての画像データを取得する画像入力手段と、前記画像入力手段が取得した画像データから前記印刷出力すべき画像中に含まれるキャラクタを認識するキャラクタ認識手段と、予め設定されたキャラクタ列に関する表現ルール情報を基に前記キャラクタ認識手段での認識結果から得られるキャラクタ列に表現ルール上の誤りがあるか否かを判断する誤り検知手段と、前記誤り検知手段で誤りがあると判断された場合に当該誤りの修正候補を前記表現ルール情報に基づいて生成し前記印刷出力すべき画像中に付加する出力画像作成手段と、前記出力画像作成手段による修正候補の付加があると当該付加後の画像を記録紙上に印刷出力する画像出力手段とを備えることを特徴とするものである。
【0008】
上記構成の画像出力装置では、画像入力手段が画像データを取得すると、キャラクタ認識手段がその画像データから印刷出力すべき画像中に含まれるキャラクタを認識する。ここで、キャラクタとは、例えば文字やこれに準ずる記号のように、一定の表現ルールの基に配列され、それによって何らかの意味を表すために用いられるものをいう。そして、印刷出力すべき画像中にキャラクタが含まれていれば、誤り検知手段は、その認識結果から得られるキャラクタ列に表現ルール上の誤りがあるか否かを判断する。表現ルールとしては、例えばキャラクタが文字等である場合には、その文字等を使って何らかの意味を表すための文法が挙げられる。この判断の結果、誤りがある場合には、出力画像作成手段がその修正候補を生成し、画像出力手段がその修正候補が付加された後の画像を記録紙上に印刷出力する。したがって、その印刷出力の結果をみれば、印刷出力すべき画像中のキャラクタに表現ルール上の誤りがあっても、その誤り部分が修正候補とともに示されて識別可能になる。
【0009】
【発明の実施の形態】
以下、図面に基づき本発明に係る画像出力装置について説明する。ここでは、画像出力装置として、デジタル複写機を例に挙げて説明する。
【0010】
図1は、本発明が適用されたデジタル複写機の概略構成例を模式的に示したブロック図である。図例のように、ここで説明するデジタル複写機1は、画像入力部11と、キャラクタ認識部12と、誤り検知部13と、出力画像作成部14と、画像出力部15と、記憶部16と、ユーザインタフェース(以下「UI」と略す)部17とを備えている。
【0011】
画像入力部11は、例えばスキャナからなるもので、原稿に描かれた画像を光学的に読み取ることで、印刷出力すべき画像についての画像データを取得するものである。
【0012】
キャラクタ認識部12は、画像入力部11が取得した画像データから画像出力部15で印刷出力すべき画像中に含まれるキャラクタを認識するものである。キャラクタとは、一定の表現ルールの基に配列され、それによって何らかの意味を表すために用いられるもので、例えば文字(漢字、ひらがな、カタカナ、英数字等)やこれに準ずる記号(句読点その他の記述記号)がこれに相当する。キャラクタの認識は、後述するパターン情報を基に、周知のパターン認識技術を用いて行えばよい。
【0013】
誤り検知部13は、キャラクタ認識部12での認識結果から得られるキャラクタ列について、表現ルール上の誤りがあるか否かを判断するものである。表現ルールとは、キャラクタ列が何らかの意味を表すために予め定められた規則をいい、例えば文字や記号等を用いる際の文法がこれに相当する。また、表現ルール上の誤りとは、その表現ルールに則っていないキャラクタの配列であり、例えば誤記・誤字・脱字や文法に反する表現形態がこれに相当する。この表現ルール上の誤りがあるか否かの判断は、後述する表現ルール情報を基に、その表現ルール情報とキャラクタ認識部12での認識結果から得られたキャラクタ列とを比較検討することによって行えばよい。
【0014】
出力画像作成部14は、画像入力部11が取得した画像データの印刷出力のために必要な処理を行うものである。ただし、出力画像作成部14では、誤り検知部13で誤りがないと判断された場合であれば、画像入力部11が取得した画像データをそのまま出力するように出力画像を作成するが、誤り検知部13で誤りがあると判断された場合には、その誤りの修正候補を生成して、印刷出力すべき画像中に付加するようになっている。修正候補とは、誤り部分を識別可能にするとともに、その誤り部分についての正しい表現形態を示すキャラクタ列の画像のことをいう。修正候補の生成は、例えば予め設定されたフォント情報を用いて行えばよい。
【0015】
これらキャラクタ認識部12、誤り検知部13および出力画像作成部14は、例えば所定プログラムを実行するマイクロプロセッサによって実現することが考えられる。
【0016】
画像出力部15は、例えばプリンタエンジンからなるもので、出力画像作成部14が生成した出力画像、すなわち修正候補の付加があった場合には当該付加後の画像を、コピー用紙やOHP等といった記録紙上に印刷出力するものである。
【0017】
記憶部16は、例えばRAM(Random Access Memory)、ROM(Read Only Memory)乃至HDD(Hard Disk Drive)からなるもので、各種情報の記憶保持を行うものである。さらに詳しくは、記憶部16は、パターン情報保持部161、知識ベース部162および作業用記憶部163としての機能を備えている。
【0018】
パターン情報保持部161は、キャラクタ認識部12でのキャラクタ認識処理に必要となるパターン情報を記憶保持しているものである。パターン情報とは、文字や記号等といったキャラクタの形状に関する情報のことをいう。
【0019】
知識ベース部162は、誤り検知部13での誤り有無判断処理および出力画像作成部14での修正候補生成処理に必要となる表現ルール情報が、知識として蓄えられているものである。表現ルール情報とは、キャラクタの表現ルールに関する情報のことをいう。
【0020】
作業用記憶部163は、各種処理の過程で作業領域として使用されるものである。具体的には、入力された画像の保持、誤り検知時のキャラクタの保持、出力画像の保持等に使用される。
【0021】
UI部17は、例えば操作パネルからなるもので、デジタル複写機1のユーザが操作するためのものである。ただし、このUI部17からは、画像入力部11が取得した画像データを画像出力部15で印刷出力するのにあたって、キャラクタ認識部12、誤り検知部13および出力画像作成部14を機能させるか否かを選択するためのモード設定が行えるようになっているものとする。
【0022】
次に、以上のように構成されたデジタル複写機1における処理動作例について説明する。図2は本発明が適用されたデジタル複写機における処理動作例を示すフローチャートであり、図3はそのデジタル複写機によって処理される画像の一具体例を示す説明図である。
【0023】
図2に示すように、デジタル複写機1では、画像入力部11が画像データを取得すると(ステップ101、以下ステップを「S」と略す)、それを記憶部16の作業用記憶部163内に保存する(S102)。このとき、作業用記憶部163内に保存される画像データは、画像入力部11が画像を光学的に読み取るものであることから、ビットマップ状のもの、すなわち画像出力部15で印刷出力可能な状態のものである。そして、画像出力部15が動作可能であれば、デジタル複写機1では、作業用記憶部163内の画像データについての印刷出力を開始する。ただし、このとき、UI部17にてキャラクタ認識部12、誤り検知部13および出力画像作成部14を機能させるモードが設定されていると、デジタル複写機1では、以下のような処理動作を行う。
【0024】
先ず、キャラクタ認識部12は、作業用記憶部163内の画像データについてページ単位で順に走査して、その画像データによって特定される画像、すなわち印刷出力すべき画像中に含まれるキャラクタの認識を始める(S103,S104)。キャラクタの認識については、キャラクタ認識部12がパターン情報保持部161内のパターン情報を参照しながら、パターン認識技術を用いて行う。なお、パターン認識技術の詳細については、公知であるため、ここではその詳細な説明を省略する。
【0025】
ここで、印刷出力すべき画像中にキャラクタが含まれており、そのキャラクタの認識に成功すれば(S105)、キャラクタ認識部12は、その認識結果についての電子的情報(例えば、認識対象が文字であればその文字コード)を、作業用記憶部163内に記憶保持させる(S106)。ただし、印刷出力すべき画像中に含まれているのがキャラクタではなく図形や写真等のイメージ画像であり、キャラクタの認識に成功しなかった場合には、特に何もしない。そして、処理対象となっているページの最後まで、キャラクタの認識処理を繰り返す。
【0026】
ページの最後まで走査した後は、続いて、キャラクタ認識部12が認識したキャラクタについて、表現ルール上の誤りがあるか否かを、誤り検知部13が判断する。すなわち、誤り検知部13は、キャラクタ認識部12が認識した全てのキャラクタについて、その認識順に、作業用記憶部163内に記憶保持された電子的情報と、知識ベース部162内に記憶保持された表現ルール情報とを照らし合わせながら、キャラクタ列の表現ルール上の誤りを検出する(S107,S108)。
【0027】
例えば、図3(a)に示す「来週、横浜に行きました。」というキャラクタ列を例に挙げて考えると、このキャラクタ列における「来週」という単語は未来のことを表すものであるのに対して、動詞が「行きました」という過去形であるのは文法的に正しくない。誤り検知部13は、このような表現ルール上の誤りを検出する。これにより、印刷出力すべき画像中のキャラクタ列に、例えば主語と述語が対応していない、助詞が適切ではない、単語レベルでの誤字・脱字が存在する、といった表現ルール上の誤りがあっても、これが誤り検知部13によって検出されることになる。
【0028】
そして、図2に示すように、キャラクタ列の誤りを検出した場合には(S109)、誤り検知部13は、知識ベース部162内に記憶保持された表現ルール情報に基づいて、どういう表現形態であれば正解であるかを導き出し、その内容を出力画像作成部14に通知する(S110)。
【0029】
例えば、図3(a)を用いて説明した「行きました」という誤り部分について、誤り検知部13は、図3(b)に示すように、知識ベース部162内の表現ルール情報を参照しながら、「行きます」または「行くつもりです」という表現形態であれば正解であることを導き出す。なお、この誤り検知部13による誤り検出および正解抽出は、公知技術を利用して行えばよいため、ここではその詳細な説明を省略する。
【0030】
この誤り検知部13からの通知を受けて、出力画像作成部14では、図2に示すように、誤りの修正候補を生成して、これを作業用記憶部163内の画像データに付加する。すなわち、修正候補を付加した出力画像を印刷出力するための画像データを生成する(S111)。
【0031】
具体的には、出力画像作成部14では、誤り検知部13からの通知を基に、例えば図3(b)に示すように、「行きます」および「行くつもりです」というキャラクタ列を生成し、これらのキャラクタ列が所定箇所に配置されるような画像データ、すなわち修正候補が付加された出力画像についての画像データを生成する。このとき、キャラクタ列の生成は、予め記憶部16内またはこれに準ずる箇所に設定されたフォント情報を用いて行えばよい。また、キャラクタ列の配置は、キャラクタ認識部12または誤り検知部13での処理によって得られる誤り部分の座標情報と、予め設定された配置フォーマット情報(例えば、誤り部分にアンダーラインを付加する、誤り部分の何mm下方に修正候補のキャラクタ列を配置する等の情報)とに基づいて行えばよい。さらには、画像出力部15がカラー画像の出力に対応していれば、生成するキャラクタ列の表示色(例えば赤色)を、誤り部分の表示色(例えば黒色)と相違させることも考えられる。
【0032】
このようにして修正候補が付加された出力画像についての画像データは、画像出力部15で印刷出力可能なビットマップ状のイメージデータ形式で、作業用記憶部163内に記憶保持される。
【0033】
そして、図2に示すように、誤り検知部13が全てのキャラクタについて調べ終えたら(S107)、画像出力部15は、出力画像作成部14によって作成されて作業用記憶部163に記憶保持されている画像データについて、記録紙上への印刷出力を行う(S112)。これにより、記録紙上には、例えば図3(b)に示すような修正候補が付加された状態の出力画像が印刷出力されることになる。
【0034】
以上のように、本実施形態で説明したデジタル複写機1は、画像入力部11が画像データを取得すると、キャラクタ認識部12がその画像データから印刷出力すべき画像中に含まれるキャラクタを認識し、その認識結果から得られるキャラクタ列について誤り検知部13が表現ルール上の誤りがあるか否かを判断し、誤りがある場合には出力画像作成部14がその修正候補を生成し、その修正候補が付加された後の画像を画像出力部15が記録紙上に印刷出力するようになっている。そのために、その印刷出力の結果をみれば、印刷出力すべき画像中のキャラクタに表現ルール上の誤りがあっても、その誤り部分が修正候補とともに示されて識別可能になる。
【0035】
したがって、本実施形態におけるデジタル複写機1によれば、例えば画像入力部11での読み取り対象となる原稿上のドキュメントに誤記・誤字・脱字、あるいは文法上の誤り等が含まれていても、従来技術では困難であったこれらの検出を自動的に行うことができるとともに、その誤り部分が修正候補とともに示されて識別可能になるため、デジタル複写機1のユーザにとっては非常に便利なものとなる。特に、誤りが生じ易い手書きの原稿について複写する場合には、非常に有効である。
【0036】
また、本実施形態におけるデジタル複写機1では、UI部17にてキャラクタ認識部12、誤り検知部13および出力画像作成部14を機能させるモードが設定されていると、上述したような誤り検出処理および修正候補の付加処理を行うようになっている。すなわち、これらの処理を行うか否かを、デジタル複写機1のユーザがUI部17から任意に設定することが可能である。したがって、誤り検出およびその修正が不要な場合には、これらの処理をキャンセルして、通常の複写処理を同様の処理動作を行うことができ、デジタル複写機1のユーザにとってより一層便利なものとなる。
【0037】
なお、本実施形態では、認識対象となるキャラクタが文字・記号からなり、その誤りを検出するための表現ルールが文法に則ったルールである場合を例に挙げて説明したが、本発明はこれに限定されるものではなく、パターン情報保持部161と知識ベース部162を別のものに置き換えれば、自然言語の訂正指摘以外の用途にも適用可能である。例えば、数式や楽譜等についても、一定の表現ルールに基づいて構成されている構文であると考えられるので、これに応用することもできる。具体的には、楽譜に適用する場合であれば、キャラクタは音符(休符や調音記号等を含む)、表現ルールは楽譜規則に則ったルールからなるので、例えば楽譜の拍子を把握して各々の小節内の拍数を数えて合わない場合にその旨を表記したり、♯や♭等といった記号が付くべきでない音符に対して付いている場合にそれを指摘する、といったことが可能である。
【0038】
また、本実施形態では、本発明をデジタル複写機に適用した場合を例に挙げて説明したが、記録紙上に画像を印刷出力する機能を有した画像出力装置であれば、例えばプリンタ装置であっても全く同様に適用することが考えられる。つまり、画像データを取得する画像入力部11は、原稿上に描かれた画像を光学的に読み取るのではなく、ホストコンピュータ等の外部装置からLAN(Local Area Network)等の通信回線を介して受け取るものであってもよい。この場合、取得する画像データは、上述した実施形態のようなビットマップ状のものである他に、所定の記述言語によるコマンド状(コードデータ状)のものであることが考えられる。これに対応するためには、取得した画像データについて画像展開(デコンポーズ)をした後に作業用記憶部163内に記憶保持させるか、あるいはコマンド状のままキャラクタの認識を行い修正候補を付加する際に画像展開する、といったことを行うようにすればよい。
【0039】
【発明の効果】
以上に説明したように、本発明に係る画像出力装置は、画像の印刷出力を行うのに加えて、その画像に含まれるキャラクタに表現ルール上の誤りがあった場合にはこれを検出し、その修正候補を出力画像に付記して指摘し得るようになっている。したがって、例えば誤りが生じ易い手書きのドキュメントであっても、それについての複写を行えば、その誤り部分が修正候補とともに示されて識別可能になるため、ユーザにとって非常に便利なものとなる。
【図面の簡単な説明】
【図1】本発明が適用されたデジタル複写機の概略構成例を模式的に示したブロック図である。
【図2】本発明が適用されたデジタル複写機における処理動作例を示すフローチャートである。
【図3】本発明が適用されたデジタル複写機によって処理される画像の一具体例を示す説明図であり、(a)は修正候補付加前の状態を示す図、(b)は修正候補付加後の状態を示す図である。
【符号の説明】
1…デジタル複写機、11…画像入力部、12…キャラクタ認識部、13…誤り検知部、14…出力画像作成部、15…画像出力部、16…記憶部、17…UI部、161…パターン情報保持部、162…知識ベース部、163…作業用記憶部
【発明の属する技術分野】
本発明は、例えばデジタル複写機やプリンタ装置のように、記録紙上に画像を印刷出力する機能を有した画像出力装置に関する。
【0002】
【従来の技術】
一般に、画像出力装置としては、その代表的なものとして原稿から読み取った画像と同じ画像を作成して記録紙上に印刷出力するデジタル複写機が広く知られているが、近年では単に画像の印刷出力を行うだけではなく、付加的な価値を加えたものも多く提案されている。例えば、複写機の中には、文字情報を認識する機能を有し、原稿から読み取った画像中に含まれる単語を認識してその認識結果を他言語に翻訳し、読み取った画像に他言語による訳語を付記して印刷出力するものがある(例えば、特許文献1参照)。また、その他にも、文字情報を認識する機能を利用して、原稿から読み取った画像中に手書き文字が含まれていると、これを予め準備されている文字パターンの書体に置き換え、文字が清書された画像として印刷出力するものもある(例えば、特許文献2参照)。
【0003】
【特許文献1】
特開昭62−154845号公報
【特許文献2】
特開昭63−187870号公報
【0004】
【発明が解決しようとする課題】
ところで、人間が作成したドキュメントには、手書きのものや電子文書に限らず、誤記・誤字・脱字、あるいは文法上の誤り等が含まれることが多くある。これらを自動的に検出して指摘してくれる装置があれば、例えば複写機のユーザにとっては非常に便利である。
【0005】
これを実現するために従来技術を応用することを考えると、例えば特許文献1に記載の従来技術では、単語の対訳を併記するために単語の認識を行うので、単語毎の誤りの検出の機能を取り入れることは可能と思われるが、複数の単語や文節の関連による文法上の誤りの検出までは実現することができない。また、例えば特許文献2に記載の従来技術では、手書きの文書を清書出力するために文字認識を行うが、そのまま出力用の書体の文字への置き換えを行うのに過ぎず、誤字・脱字等があってもそれを指摘するのは困難である。
【0006】
そこで、本発明は、画像の印刷出力を行うのに加えて、その画像に含まれる文字等に例えば文法上の誤りがあった場合にはこれを検出し、それを出力画像に付記して指摘することで、ユーザにとって非常に便利なものとなる画像出力装置を提供することを目的とする。
【0007】
【課題を解決するための手段】
本発明は、上記目的を達成するために案出された画像出力装置で、印刷出力すべき画像についての画像データを取得する画像入力手段と、前記画像入力手段が取得した画像データから前記印刷出力すべき画像中に含まれるキャラクタを認識するキャラクタ認識手段と、予め設定されたキャラクタ列に関する表現ルール情報を基に前記キャラクタ認識手段での認識結果から得られるキャラクタ列に表現ルール上の誤りがあるか否かを判断する誤り検知手段と、前記誤り検知手段で誤りがあると判断された場合に当該誤りの修正候補を前記表現ルール情報に基づいて生成し前記印刷出力すべき画像中に付加する出力画像作成手段と、前記出力画像作成手段による修正候補の付加があると当該付加後の画像を記録紙上に印刷出力する画像出力手段とを備えることを特徴とするものである。
【0008】
上記構成の画像出力装置では、画像入力手段が画像データを取得すると、キャラクタ認識手段がその画像データから印刷出力すべき画像中に含まれるキャラクタを認識する。ここで、キャラクタとは、例えば文字やこれに準ずる記号のように、一定の表現ルールの基に配列され、それによって何らかの意味を表すために用いられるものをいう。そして、印刷出力すべき画像中にキャラクタが含まれていれば、誤り検知手段は、その認識結果から得られるキャラクタ列に表現ルール上の誤りがあるか否かを判断する。表現ルールとしては、例えばキャラクタが文字等である場合には、その文字等を使って何らかの意味を表すための文法が挙げられる。この判断の結果、誤りがある場合には、出力画像作成手段がその修正候補を生成し、画像出力手段がその修正候補が付加された後の画像を記録紙上に印刷出力する。したがって、その印刷出力の結果をみれば、印刷出力すべき画像中のキャラクタに表現ルール上の誤りがあっても、その誤り部分が修正候補とともに示されて識別可能になる。
【0009】
【発明の実施の形態】
以下、図面に基づき本発明に係る画像出力装置について説明する。ここでは、画像出力装置として、デジタル複写機を例に挙げて説明する。
【0010】
図1は、本発明が適用されたデジタル複写機の概略構成例を模式的に示したブロック図である。図例のように、ここで説明するデジタル複写機1は、画像入力部11と、キャラクタ認識部12と、誤り検知部13と、出力画像作成部14と、画像出力部15と、記憶部16と、ユーザインタフェース(以下「UI」と略す)部17とを備えている。
【0011】
画像入力部11は、例えばスキャナからなるもので、原稿に描かれた画像を光学的に読み取ることで、印刷出力すべき画像についての画像データを取得するものである。
【0012】
キャラクタ認識部12は、画像入力部11が取得した画像データから画像出力部15で印刷出力すべき画像中に含まれるキャラクタを認識するものである。キャラクタとは、一定の表現ルールの基に配列され、それによって何らかの意味を表すために用いられるもので、例えば文字(漢字、ひらがな、カタカナ、英数字等)やこれに準ずる記号(句読点その他の記述記号)がこれに相当する。キャラクタの認識は、後述するパターン情報を基に、周知のパターン認識技術を用いて行えばよい。
【0013】
誤り検知部13は、キャラクタ認識部12での認識結果から得られるキャラクタ列について、表現ルール上の誤りがあるか否かを判断するものである。表現ルールとは、キャラクタ列が何らかの意味を表すために予め定められた規則をいい、例えば文字や記号等を用いる際の文法がこれに相当する。また、表現ルール上の誤りとは、その表現ルールに則っていないキャラクタの配列であり、例えば誤記・誤字・脱字や文法に反する表現形態がこれに相当する。この表現ルール上の誤りがあるか否かの判断は、後述する表現ルール情報を基に、その表現ルール情報とキャラクタ認識部12での認識結果から得られたキャラクタ列とを比較検討することによって行えばよい。
【0014】
出力画像作成部14は、画像入力部11が取得した画像データの印刷出力のために必要な処理を行うものである。ただし、出力画像作成部14では、誤り検知部13で誤りがないと判断された場合であれば、画像入力部11が取得した画像データをそのまま出力するように出力画像を作成するが、誤り検知部13で誤りがあると判断された場合には、その誤りの修正候補を生成して、印刷出力すべき画像中に付加するようになっている。修正候補とは、誤り部分を識別可能にするとともに、その誤り部分についての正しい表現形態を示すキャラクタ列の画像のことをいう。修正候補の生成は、例えば予め設定されたフォント情報を用いて行えばよい。
【0015】
これらキャラクタ認識部12、誤り検知部13および出力画像作成部14は、例えば所定プログラムを実行するマイクロプロセッサによって実現することが考えられる。
【0016】
画像出力部15は、例えばプリンタエンジンからなるもので、出力画像作成部14が生成した出力画像、すなわち修正候補の付加があった場合には当該付加後の画像を、コピー用紙やOHP等といった記録紙上に印刷出力するものである。
【0017】
記憶部16は、例えばRAM(Random Access Memory)、ROM(Read Only Memory)乃至HDD(Hard Disk Drive)からなるもので、各種情報の記憶保持を行うものである。さらに詳しくは、記憶部16は、パターン情報保持部161、知識ベース部162および作業用記憶部163としての機能を備えている。
【0018】
パターン情報保持部161は、キャラクタ認識部12でのキャラクタ認識処理に必要となるパターン情報を記憶保持しているものである。パターン情報とは、文字や記号等といったキャラクタの形状に関する情報のことをいう。
【0019】
知識ベース部162は、誤り検知部13での誤り有無判断処理および出力画像作成部14での修正候補生成処理に必要となる表現ルール情報が、知識として蓄えられているものである。表現ルール情報とは、キャラクタの表現ルールに関する情報のことをいう。
【0020】
作業用記憶部163は、各種処理の過程で作業領域として使用されるものである。具体的には、入力された画像の保持、誤り検知時のキャラクタの保持、出力画像の保持等に使用される。
【0021】
UI部17は、例えば操作パネルからなるもので、デジタル複写機1のユーザが操作するためのものである。ただし、このUI部17からは、画像入力部11が取得した画像データを画像出力部15で印刷出力するのにあたって、キャラクタ認識部12、誤り検知部13および出力画像作成部14を機能させるか否かを選択するためのモード設定が行えるようになっているものとする。
【0022】
次に、以上のように構成されたデジタル複写機1における処理動作例について説明する。図2は本発明が適用されたデジタル複写機における処理動作例を示すフローチャートであり、図3はそのデジタル複写機によって処理される画像の一具体例を示す説明図である。
【0023】
図2に示すように、デジタル複写機1では、画像入力部11が画像データを取得すると(ステップ101、以下ステップを「S」と略す)、それを記憶部16の作業用記憶部163内に保存する(S102)。このとき、作業用記憶部163内に保存される画像データは、画像入力部11が画像を光学的に読み取るものであることから、ビットマップ状のもの、すなわち画像出力部15で印刷出力可能な状態のものである。そして、画像出力部15が動作可能であれば、デジタル複写機1では、作業用記憶部163内の画像データについての印刷出力を開始する。ただし、このとき、UI部17にてキャラクタ認識部12、誤り検知部13および出力画像作成部14を機能させるモードが設定されていると、デジタル複写機1では、以下のような処理動作を行う。
【0024】
先ず、キャラクタ認識部12は、作業用記憶部163内の画像データについてページ単位で順に走査して、その画像データによって特定される画像、すなわち印刷出力すべき画像中に含まれるキャラクタの認識を始める(S103,S104)。キャラクタの認識については、キャラクタ認識部12がパターン情報保持部161内のパターン情報を参照しながら、パターン認識技術を用いて行う。なお、パターン認識技術の詳細については、公知であるため、ここではその詳細な説明を省略する。
【0025】
ここで、印刷出力すべき画像中にキャラクタが含まれており、そのキャラクタの認識に成功すれば(S105)、キャラクタ認識部12は、その認識結果についての電子的情報(例えば、認識対象が文字であればその文字コード)を、作業用記憶部163内に記憶保持させる(S106)。ただし、印刷出力すべき画像中に含まれているのがキャラクタではなく図形や写真等のイメージ画像であり、キャラクタの認識に成功しなかった場合には、特に何もしない。そして、処理対象となっているページの最後まで、キャラクタの認識処理を繰り返す。
【0026】
ページの最後まで走査した後は、続いて、キャラクタ認識部12が認識したキャラクタについて、表現ルール上の誤りがあるか否かを、誤り検知部13が判断する。すなわち、誤り検知部13は、キャラクタ認識部12が認識した全てのキャラクタについて、その認識順に、作業用記憶部163内に記憶保持された電子的情報と、知識ベース部162内に記憶保持された表現ルール情報とを照らし合わせながら、キャラクタ列の表現ルール上の誤りを検出する(S107,S108)。
【0027】
例えば、図3(a)に示す「来週、横浜に行きました。」というキャラクタ列を例に挙げて考えると、このキャラクタ列における「来週」という単語は未来のことを表すものであるのに対して、動詞が「行きました」という過去形であるのは文法的に正しくない。誤り検知部13は、このような表現ルール上の誤りを検出する。これにより、印刷出力すべき画像中のキャラクタ列に、例えば主語と述語が対応していない、助詞が適切ではない、単語レベルでの誤字・脱字が存在する、といった表現ルール上の誤りがあっても、これが誤り検知部13によって検出されることになる。
【0028】
そして、図2に示すように、キャラクタ列の誤りを検出した場合には(S109)、誤り検知部13は、知識ベース部162内に記憶保持された表現ルール情報に基づいて、どういう表現形態であれば正解であるかを導き出し、その内容を出力画像作成部14に通知する(S110)。
【0029】
例えば、図3(a)を用いて説明した「行きました」という誤り部分について、誤り検知部13は、図3(b)に示すように、知識ベース部162内の表現ルール情報を参照しながら、「行きます」または「行くつもりです」という表現形態であれば正解であることを導き出す。なお、この誤り検知部13による誤り検出および正解抽出は、公知技術を利用して行えばよいため、ここではその詳細な説明を省略する。
【0030】
この誤り検知部13からの通知を受けて、出力画像作成部14では、図2に示すように、誤りの修正候補を生成して、これを作業用記憶部163内の画像データに付加する。すなわち、修正候補を付加した出力画像を印刷出力するための画像データを生成する(S111)。
【0031】
具体的には、出力画像作成部14では、誤り検知部13からの通知を基に、例えば図3(b)に示すように、「行きます」および「行くつもりです」というキャラクタ列を生成し、これらのキャラクタ列が所定箇所に配置されるような画像データ、すなわち修正候補が付加された出力画像についての画像データを生成する。このとき、キャラクタ列の生成は、予め記憶部16内またはこれに準ずる箇所に設定されたフォント情報を用いて行えばよい。また、キャラクタ列の配置は、キャラクタ認識部12または誤り検知部13での処理によって得られる誤り部分の座標情報と、予め設定された配置フォーマット情報(例えば、誤り部分にアンダーラインを付加する、誤り部分の何mm下方に修正候補のキャラクタ列を配置する等の情報)とに基づいて行えばよい。さらには、画像出力部15がカラー画像の出力に対応していれば、生成するキャラクタ列の表示色(例えば赤色)を、誤り部分の表示色(例えば黒色)と相違させることも考えられる。
【0032】
このようにして修正候補が付加された出力画像についての画像データは、画像出力部15で印刷出力可能なビットマップ状のイメージデータ形式で、作業用記憶部163内に記憶保持される。
【0033】
そして、図2に示すように、誤り検知部13が全てのキャラクタについて調べ終えたら(S107)、画像出力部15は、出力画像作成部14によって作成されて作業用記憶部163に記憶保持されている画像データについて、記録紙上への印刷出力を行う(S112)。これにより、記録紙上には、例えば図3(b)に示すような修正候補が付加された状態の出力画像が印刷出力されることになる。
【0034】
以上のように、本実施形態で説明したデジタル複写機1は、画像入力部11が画像データを取得すると、キャラクタ認識部12がその画像データから印刷出力すべき画像中に含まれるキャラクタを認識し、その認識結果から得られるキャラクタ列について誤り検知部13が表現ルール上の誤りがあるか否かを判断し、誤りがある場合には出力画像作成部14がその修正候補を生成し、その修正候補が付加された後の画像を画像出力部15が記録紙上に印刷出力するようになっている。そのために、その印刷出力の結果をみれば、印刷出力すべき画像中のキャラクタに表現ルール上の誤りがあっても、その誤り部分が修正候補とともに示されて識別可能になる。
【0035】
したがって、本実施形態におけるデジタル複写機1によれば、例えば画像入力部11での読み取り対象となる原稿上のドキュメントに誤記・誤字・脱字、あるいは文法上の誤り等が含まれていても、従来技術では困難であったこれらの検出を自動的に行うことができるとともに、その誤り部分が修正候補とともに示されて識別可能になるため、デジタル複写機1のユーザにとっては非常に便利なものとなる。特に、誤りが生じ易い手書きの原稿について複写する場合には、非常に有効である。
【0036】
また、本実施形態におけるデジタル複写機1では、UI部17にてキャラクタ認識部12、誤り検知部13および出力画像作成部14を機能させるモードが設定されていると、上述したような誤り検出処理および修正候補の付加処理を行うようになっている。すなわち、これらの処理を行うか否かを、デジタル複写機1のユーザがUI部17から任意に設定することが可能である。したがって、誤り検出およびその修正が不要な場合には、これらの処理をキャンセルして、通常の複写処理を同様の処理動作を行うことができ、デジタル複写機1のユーザにとってより一層便利なものとなる。
【0037】
なお、本実施形態では、認識対象となるキャラクタが文字・記号からなり、その誤りを検出するための表現ルールが文法に則ったルールである場合を例に挙げて説明したが、本発明はこれに限定されるものではなく、パターン情報保持部161と知識ベース部162を別のものに置き換えれば、自然言語の訂正指摘以外の用途にも適用可能である。例えば、数式や楽譜等についても、一定の表現ルールに基づいて構成されている構文であると考えられるので、これに応用することもできる。具体的には、楽譜に適用する場合であれば、キャラクタは音符(休符や調音記号等を含む)、表現ルールは楽譜規則に則ったルールからなるので、例えば楽譜の拍子を把握して各々の小節内の拍数を数えて合わない場合にその旨を表記したり、♯や♭等といった記号が付くべきでない音符に対して付いている場合にそれを指摘する、といったことが可能である。
【0038】
また、本実施形態では、本発明をデジタル複写機に適用した場合を例に挙げて説明したが、記録紙上に画像を印刷出力する機能を有した画像出力装置であれば、例えばプリンタ装置であっても全く同様に適用することが考えられる。つまり、画像データを取得する画像入力部11は、原稿上に描かれた画像を光学的に読み取るのではなく、ホストコンピュータ等の外部装置からLAN(Local Area Network)等の通信回線を介して受け取るものであってもよい。この場合、取得する画像データは、上述した実施形態のようなビットマップ状のものである他に、所定の記述言語によるコマンド状(コードデータ状)のものであることが考えられる。これに対応するためには、取得した画像データについて画像展開(デコンポーズ)をした後に作業用記憶部163内に記憶保持させるか、あるいはコマンド状のままキャラクタの認識を行い修正候補を付加する際に画像展開する、といったことを行うようにすればよい。
【0039】
【発明の効果】
以上に説明したように、本発明に係る画像出力装置は、画像の印刷出力を行うのに加えて、その画像に含まれるキャラクタに表現ルール上の誤りがあった場合にはこれを検出し、その修正候補を出力画像に付記して指摘し得るようになっている。したがって、例えば誤りが生じ易い手書きのドキュメントであっても、それについての複写を行えば、その誤り部分が修正候補とともに示されて識別可能になるため、ユーザにとって非常に便利なものとなる。
【図面の簡単な説明】
【図1】本発明が適用されたデジタル複写機の概略構成例を模式的に示したブロック図である。
【図2】本発明が適用されたデジタル複写機における処理動作例を示すフローチャートである。
【図3】本発明が適用されたデジタル複写機によって処理される画像の一具体例を示す説明図であり、(a)は修正候補付加前の状態を示す図、(b)は修正候補付加後の状態を示す図である。
【符号の説明】
1…デジタル複写機、11…画像入力部、12…キャラクタ認識部、13…誤り検知部、14…出力画像作成部、15…画像出力部、16…記憶部、17…UI部、161…パターン情報保持部、162…知識ベース部、163…作業用記憶部
Claims (6)
- 印刷出力すべき画像についての画像データを取得する画像入力手段と、
前記画像入力手段が取得した画像データから前記印刷出力すべき画像中に含まれるキャラクタを認識するキャラクタ認識手段と、
予め設定されたキャラクタ列に関する表現ルール情報を基に前記キャラクタ認識手段での認識結果から得られるキャラクタ列に表現ルール上の誤りがあるか否かを判断する誤り検知手段と、
前記誤り検知手段で誤りがあると判断された場合に当該誤りの修正候補を前記表現ルール情報に基づいて生成し前記印刷出力すべき画像中に付加する出力画像作成手段と、
前記出力画像作成手段による修正候補の付加があると当該付加後の画像を記録紙上に印刷出力する画像出力手段と
を備えることを特徴とする画像出力装置。 - 前記画像入力手段が取得した画像データを前記画像出力手段で印刷出力するのにあたって、前記キャラクタ認識手段、前記誤り検知手段および前記出力画像作成手段を機能させるか否かを選択するためのモード設定手段
が設けられていることを特徴とする請求項1記載の画像出力装置。 - 前記キャラクタは文字または記号からなり、前記表現ルールは文法に則ったルールからなる
ことを特徴とする請求項1または2記載の画像出力装置。 - 前記キャラクタは音符からなり、前記表現ルールは楽譜規則に則ったルールからなる
ことを特徴とする請求項1または2記載の画像出力装置。 - 前記画像入力手段は、原稿上に描かれた画像を光学的に読み取って画像データを取得するものである
ことを特徴とする請求項1〜4のいずれか1項に記載の画像出力装置。 - 前記画像入力手段は、外部装置から通信回線を介して受け取ることで画像データを取得するものである
ことを特徴とする請求項1〜4のいずれか1項に記載の画像出力装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002368528A JP2004199483A (ja) | 2002-12-19 | 2002-12-19 | 画像出力装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002368528A JP2004199483A (ja) | 2002-12-19 | 2002-12-19 | 画像出力装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004199483A true JP2004199483A (ja) | 2004-07-15 |
Family
ID=32765068
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002368528A Pending JP2004199483A (ja) | 2002-12-19 | 2002-12-19 | 画像出力装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004199483A (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012073769A (ja) * | 2010-09-28 | 2012-04-12 | Kawai Musical Instr Mfg Co Ltd | 楽譜認識装置及びコンピュータプログラム |
JP2016157375A (ja) * | 2015-02-26 | 2016-09-01 | 京セラドキュメントソリューションズ株式会社 | 文書編集装置 |
US10810383B2 (en) | 2017-12-15 | 2020-10-20 | Kyocera Document Solutions Inc. | Image processing apparatus for comparing documents in different languages |
US10902223B2 (en) | 2017-12-15 | 2021-01-26 | Kyocera Document Solutions Inc. | Image processing apparatus |
-
2002
- 2002-12-19 JP JP2002368528A patent/JP2004199483A/ja active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012073769A (ja) * | 2010-09-28 | 2012-04-12 | Kawai Musical Instr Mfg Co Ltd | 楽譜認識装置及びコンピュータプログラム |
JP2016157375A (ja) * | 2015-02-26 | 2016-09-01 | 京セラドキュメントソリューションズ株式会社 | 文書編集装置 |
US10810383B2 (en) | 2017-12-15 | 2020-10-20 | Kyocera Document Solutions Inc. | Image processing apparatus for comparing documents in different languages |
US10902223B2 (en) | 2017-12-15 | 2021-01-26 | Kyocera Document Solutions Inc. | Image processing apparatus |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100311338B1 (ko) | 보증가능한광학문자인식방법 | |
JP4854491B2 (ja) | 画像処理装置及びその制御方法 | |
JP4742404B2 (ja) | 画像認識装置、画像形成装置、画像認識方法および画像認識プログラムを記憶したコンピュータ読取り可能な記録媒体 | |
JP4311365B2 (ja) | 文書処理装置およびプログラム | |
US20060061790A1 (en) | Image forming method and apparatus | |
US20060285748A1 (en) | Document processing device | |
US20060062473A1 (en) | Image reading apparatus, image processing apparatus and image forming apparatus | |
JP2007141233A (ja) | 改良された光学文字認識 | |
JP2004199483A (ja) | 画像出力装置 | |
JP2006276905A (ja) | 翻訳装置、画像処理装置、画像形成装置、翻訳方法及びプログラム | |
JP2006196976A (ja) | Ocrによる自動清書機能を持つ複写システム | |
JP2006252164A (ja) | 中国語文書処理装置 | |
JP2007052613A (ja) | 翻訳装置、翻訳システムおよび翻訳方法 | |
JP2006350663A (ja) | 文書読取システム | |
JP7315420B2 (ja) | テキストの適合および修正の方法 | |
JP2001052110A (ja) | 文書処理方法、文書処理プログラムを記録した記録媒体及び文書処理装置 | |
JP6205973B2 (ja) | 変更履歴出力装置、プログラム | |
JP2008158643A (ja) | 表示検査方法、表示検査装置および表示検査プログラム | |
JP5387086B2 (ja) | 情報照合支援システム及びプログラム | |
JP2007018158A (ja) | 文字処理装置、文字処理方法及び記録媒体 | |
JP2008021120A (ja) | 筆記情報処理システム、筆記情報処理方法およびプログラム | |
US11765301B2 (en) | Image processing apparatus generating image of review question, control method therefor, and storage medium storing control program therefor | |
JP2007052614A (ja) | 文書管理装置、文書管理システムおよび文書管理方法 | |
EP0692768A2 (en) | Full text storage and retrieval in image at OCR and code speed | |
JP4280939B2 (ja) | 位置面システム画像認識コンピューターソフトウェア |