JP2004199483A

JP2004199483A - 画像出力装置

Info

Publication number: JP2004199483A
Application number: JP2002368528A
Authority: JP
Inventors: Yozo Yamaguchi; 陽三山口
Original assignee: Fuji Xerox Co Ltd
Current assignee: Fujifilm Business Innovation Corp
Priority date: 2002-12-19
Filing date: 2002-12-19
Publication date: 2004-07-15

Abstract

【課題】画像の印刷出力を行う画像出力装置において、出力すべき画像に含まれる文字等に例えば文法上の誤りがあった場合には、これを検出して出力画像にて識別可能にする。
【解決手段】画像データを取得する画像入力手段１１と、取得した画像データから印刷出力すべき画像中に含まれるキャラクタを認識するキャラクタ認識手段１２と、その認識結果から得られるキャラクタ列に表現ルール上の誤りがあるか否かを判断する誤り検知手段１３と、誤りがあると判断された場合に当該誤りの修正候補を生成し前記印刷出力すべき画像中に付加する出力画像作成手段１４と、前記修正候補の付加後の画像を記録紙上に印刷出力する画像出力手段１５とを備えるように、画像出力装置１を構成する。
【選択図】図１

Description

【０００１】
【発明の属する技術分野】
本発明は、例えばデジタル複写機やプリンタ装置のように、記録紙上に画像を印刷出力する機能を有した画像出力装置に関する。
【０００２】
【従来の技術】
一般に、画像出力装置としては、その代表的なものとして原稿から読み取った画像と同じ画像を作成して記録紙上に印刷出力するデジタル複写機が広く知られているが、近年では単に画像の印刷出力を行うだけではなく、付加的な価値を加えたものも多く提案されている。例えば、複写機の中には、文字情報を認識する機能を有し、原稿から読み取った画像中に含まれる単語を認識してその認識結果を他言語に翻訳し、読み取った画像に他言語による訳語を付記して印刷出力するものがある（例えば、特許文献１参照）。また、その他にも、文字情報を認識する機能を利用して、原稿から読み取った画像中に手書き文字が含まれていると、これを予め準備されている文字パターンの書体に置き換え、文字が清書された画像として印刷出力するものもある（例えば、特許文献２参照）。
【０００３】
【特許文献１】
特開昭６２−１５４８４５号公報
【特許文献２】
特開昭６３−１８７８７０号公報
【０００４】
【発明が解決しようとする課題】
ところで、人間が作成したドキュメントには、手書きのものや電子文書に限らず、誤記・誤字・脱字、あるいは文法上の誤り等が含まれることが多くある。これらを自動的に検出して指摘してくれる装置があれば、例えば複写機のユーザにとっては非常に便利である。
【０００５】
これを実現するために従来技術を応用することを考えると、例えば特許文献１に記載の従来技術では、単語の対訳を併記するために単語の認識を行うので、単語毎の誤りの検出の機能を取り入れることは可能と思われるが、複数の単語や文節の関連による文法上の誤りの検出までは実現することができない。また、例えば特許文献２に記載の従来技術では、手書きの文書を清書出力するために文字認識を行うが、そのまま出力用の書体の文字への置き換えを行うのに過ぎず、誤字・脱字等があってもそれを指摘するのは困難である。
【０００６】
そこで、本発明は、画像の印刷出力を行うのに加えて、その画像に含まれる文字等に例えば文法上の誤りがあった場合にはこれを検出し、それを出力画像に付記して指摘することで、ユーザにとって非常に便利なものとなる画像出力装置を提供することを目的とする。
【０００７】
【課題を解決するための手段】
本発明は、上記目的を達成するために案出された画像出力装置で、印刷出力すべき画像についての画像データを取得する画像入力手段と、前記画像入力手段が取得した画像データから前記印刷出力すべき画像中に含まれるキャラクタを認識するキャラクタ認識手段と、予め設定されたキャラクタ列に関する表現ルール情報を基に前記キャラクタ認識手段での認識結果から得られるキャラクタ列に表現ルール上の誤りがあるか否かを判断する誤り検知手段と、前記誤り検知手段で誤りがあると判断された場合に当該誤りの修正候補を前記表現ルール情報に基づいて生成し前記印刷出力すべき画像中に付加する出力画像作成手段と、前記出力画像作成手段による修正候補の付加があると当該付加後の画像を記録紙上に印刷出力する画像出力手段とを備えることを特徴とするものである。
【０００８】
上記構成の画像出力装置では、画像入力手段が画像データを取得すると、キャラクタ認識手段がその画像データから印刷出力すべき画像中に含まれるキャラクタを認識する。ここで、キャラクタとは、例えば文字やこれに準ずる記号のように、一定の表現ルールの基に配列され、それによって何らかの意味を表すために用いられるものをいう。そして、印刷出力すべき画像中にキャラクタが含まれていれば、誤り検知手段は、その認識結果から得られるキャラクタ列に表現ルール上の誤りがあるか否かを判断する。表現ルールとしては、例えばキャラクタが文字等である場合には、その文字等を使って何らかの意味を表すための文法が挙げられる。この判断の結果、誤りがある場合には、出力画像作成手段がその修正候補を生成し、画像出力手段がその修正候補が付加された後の画像を記録紙上に印刷出力する。したがって、その印刷出力の結果をみれば、印刷出力すべき画像中のキャラクタに表現ルール上の誤りがあっても、その誤り部分が修正候補とともに示されて識別可能になる。
【０００９】
【発明の実施の形態】
以下、図面に基づき本発明に係る画像出力装置について説明する。ここでは、画像出力装置として、デジタル複写機を例に挙げて説明する。
【００１０】
図１は、本発明が適用されたデジタル複写機の概略構成例を模式的に示したブロック図である。図例のように、ここで説明するデジタル複写機１は、画像入力部１１と、キャラクタ認識部１２と、誤り検知部１３と、出力画像作成部１４と、画像出力部１５と、記憶部１６と、ユーザインタフェース（以下「ＵＩ」と略す）部１７とを備えている。
【００１１】
画像入力部１１は、例えばスキャナからなるもので、原稿に描かれた画像を光学的に読み取ることで、印刷出力すべき画像についての画像データを取得するものである。
【００１２】
キャラクタ認識部１２は、画像入力部１１が取得した画像データから画像出力部１５で印刷出力すべき画像中に含まれるキャラクタを認識するものである。キャラクタとは、一定の表現ルールの基に配列され、それによって何らかの意味を表すために用いられるもので、例えば文字（漢字、ひらがな、カタカナ、英数字等）やこれに準ずる記号（句読点その他の記述記号）がこれに相当する。キャラクタの認識は、後述するパターン情報を基に、周知のパターン認識技術を用いて行えばよい。
【００１３】
誤り検知部１３は、キャラクタ認識部１２での認識結果から得られるキャラクタ列について、表現ルール上の誤りがあるか否かを判断するものである。表現ルールとは、キャラクタ列が何らかの意味を表すために予め定められた規則をいい、例えば文字や記号等を用いる際の文法がこれに相当する。また、表現ルール上の誤りとは、その表現ルールに則っていないキャラクタの配列であり、例えば誤記・誤字・脱字や文法に反する表現形態がこれに相当する。この表現ルール上の誤りがあるか否かの判断は、後述する表現ルール情報を基に、その表現ルール情報とキャラクタ認識部１２での認識結果から得られたキャラクタ列とを比較検討することによって行えばよい。
【００１４】
出力画像作成部１４は、画像入力部１１が取得した画像データの印刷出力のために必要な処理を行うものである。ただし、出力画像作成部１４では、誤り検知部１３で誤りがないと判断された場合であれば、画像入力部１１が取得した画像データをそのまま出力するように出力画像を作成するが、誤り検知部１３で誤りがあると判断された場合には、その誤りの修正候補を生成して、印刷出力すべき画像中に付加するようになっている。修正候補とは、誤り部分を識別可能にするとともに、その誤り部分についての正しい表現形態を示すキャラクタ列の画像のことをいう。修正候補の生成は、例えば予め設定されたフォント情報を用いて行えばよい。
【００１５】
これらキャラクタ認識部１２、誤り検知部１３および出力画像作成部１４は、例えば所定プログラムを実行するマイクロプロセッサによって実現することが考えられる。
【００１６】
画像出力部１５は、例えばプリンタエンジンからなるもので、出力画像作成部１４が生成した出力画像、すなわち修正候補の付加があった場合には当該付加後の画像を、コピー用紙やＯＨＰ等といった記録紙上に印刷出力するものである。
【００１７】
記憶部１６は、例えばＲＡＭ（Random Access Memory）、ＲＯＭ（Read Only Memory）乃至ＨＤＤ（Hard Disk Drive）からなるもので、各種情報の記憶保持を行うものである。さらに詳しくは、記憶部１６は、パターン情報保持部１６１、知識ベース部１６２および作業用記憶部１６３としての機能を備えている。
【００１８】
パターン情報保持部１６１は、キャラクタ認識部１２でのキャラクタ認識処理に必要となるパターン情報を記憶保持しているものである。パターン情報とは、文字や記号等といったキャラクタの形状に関する情報のことをいう。
【００１９】
知識ベース部１６２は、誤り検知部１３での誤り有無判断処理および出力画像作成部１４での修正候補生成処理に必要となる表現ルール情報が、知識として蓄えられているものである。表現ルール情報とは、キャラクタの表現ルールに関する情報のことをいう。
【００２０】
作業用記憶部１６３は、各種処理の過程で作業領域として使用されるものである。具体的には、入力された画像の保持、誤り検知時のキャラクタの保持、出力画像の保持等に使用される。
【００２１】
ＵＩ部１７は、例えば操作パネルからなるもので、デジタル複写機１のユーザが操作するためのものである。ただし、このＵＩ部１７からは、画像入力部１１が取得した画像データを画像出力部１５で印刷出力するのにあたって、キャラクタ認識部１２、誤り検知部１３および出力画像作成部１４を機能させるか否かを選択するためのモード設定が行えるようになっているものとする。
【００２２】
次に、以上のように構成されたデジタル複写機１における処理動作例について説明する。図２は本発明が適用されたデジタル複写機における処理動作例を示すフローチャートであり、図３はそのデジタル複写機によって処理される画像の一具体例を示す説明図である。
【００２３】
図２に示すように、デジタル複写機１では、画像入力部１１が画像データを取得すると（ステップ１０１、以下ステップを「Ｓ」と略す）、それを記憶部１６の作業用記憶部１６３内に保存する（Ｓ１０２）。このとき、作業用記憶部１６３内に保存される画像データは、画像入力部１１が画像を光学的に読み取るものであることから、ビットマップ状のもの、すなわち画像出力部１５で印刷出力可能な状態のものである。そして、画像出力部１５が動作可能であれば、デジタル複写機１では、作業用記憶部１６３内の画像データについての印刷出力を開始する。ただし、このとき、ＵＩ部１７にてキャラクタ認識部１２、誤り検知部１３および出力画像作成部１４を機能させるモードが設定されていると、デジタル複写機１では、以下のような処理動作を行う。
【００２４】
先ず、キャラクタ認識部１２は、作業用記憶部１６３内の画像データについてページ単位で順に走査して、その画像データによって特定される画像、すなわち印刷出力すべき画像中に含まれるキャラクタの認識を始める（Ｓ１０３，Ｓ１０４）。キャラクタの認識については、キャラクタ認識部１２がパターン情報保持部１６１内のパターン情報を参照しながら、パターン認識技術を用いて行う。なお、パターン認識技術の詳細については、公知であるため、ここではその詳細な説明を省略する。
【００２５】
ここで、印刷出力すべき画像中にキャラクタが含まれており、そのキャラクタの認識に成功すれば（Ｓ１０５）、キャラクタ認識部１２は、その認識結果についての電子的情報（例えば、認識対象が文字であればその文字コード）を、作業用記憶部１６３内に記憶保持させる（Ｓ１０６）。ただし、印刷出力すべき画像中に含まれているのがキャラクタではなく図形や写真等のイメージ画像であり、キャラクタの認識に成功しなかった場合には、特に何もしない。そして、処理対象となっているページの最後まで、キャラクタの認識処理を繰り返す。
【００２６】
ページの最後まで走査した後は、続いて、キャラクタ認識部１２が認識したキャラクタについて、表現ルール上の誤りがあるか否かを、誤り検知部１３が判断する。すなわち、誤り検知部１３は、キャラクタ認識部１２が認識した全てのキャラクタについて、その認識順に、作業用記憶部１６３内に記憶保持された電子的情報と、知識ベース部１６２内に記憶保持された表現ルール情報とを照らし合わせながら、キャラクタ列の表現ルール上の誤りを検出する（Ｓ１０７，Ｓ１０８）。
【００２７】
例えば、図３（ａ）に示す「来週、横浜に行きました。」というキャラクタ列を例に挙げて考えると、このキャラクタ列における「来週」という単語は未来のことを表すものであるのに対して、動詞が「行きました」という過去形であるのは文法的に正しくない。誤り検知部１３は、このような表現ルール上の誤りを検出する。これにより、印刷出力すべき画像中のキャラクタ列に、例えば主語と述語が対応していない、助詞が適切ではない、単語レベルでの誤字・脱字が存在する、といった表現ルール上の誤りがあっても、これが誤り検知部１３によって検出されることになる。
【００２８】
そして、図２に示すように、キャラクタ列の誤りを検出した場合には（Ｓ１０９）、誤り検知部１３は、知識ベース部１６２内に記憶保持された表現ルール情報に基づいて、どういう表現形態であれば正解であるかを導き出し、その内容を出力画像作成部１４に通知する（Ｓ１１０）。
【００２９】
例えば、図３（ａ）を用いて説明した「行きました」という誤り部分について、誤り検知部１３は、図３（ｂ）に示すように、知識ベース部１６２内の表現ルール情報を参照しながら、「行きます」または「行くつもりです」という表現形態であれば正解であることを導き出す。なお、この誤り検知部１３による誤り検出および正解抽出は、公知技術を利用して行えばよいため、ここではその詳細な説明を省略する。
【００３０】
この誤り検知部１３からの通知を受けて、出力画像作成部１４では、図２に示すように、誤りの修正候補を生成して、これを作業用記憶部１６３内の画像データに付加する。すなわち、修正候補を付加した出力画像を印刷出力するための画像データを生成する（Ｓ１１１）。
【００３１】
具体的には、出力画像作成部１４では、誤り検知部１３からの通知を基に、例えば図３（ｂ）に示すように、「行きます」および「行くつもりです」というキャラクタ列を生成し、これらのキャラクタ列が所定箇所に配置されるような画像データ、すなわち修正候補が付加された出力画像についての画像データを生成する。このとき、キャラクタ列の生成は、予め記憶部１６内またはこれに準ずる箇所に設定されたフォント情報を用いて行えばよい。また、キャラクタ列の配置は、キャラクタ認識部１２または誤り検知部１３での処理によって得られる誤り部分の座標情報と、予め設定された配置フォーマット情報（例えば、誤り部分にアンダーラインを付加する、誤り部分の何mm下方に修正候補のキャラクタ列を配置する等の情報）とに基づいて行えばよい。さらには、画像出力部１５がカラー画像の出力に対応していれば、生成するキャラクタ列の表示色（例えば赤色）を、誤り部分の表示色（例えば黒色）と相違させることも考えられる。
【００３２】
このようにして修正候補が付加された出力画像についての画像データは、画像出力部１５で印刷出力可能なビットマップ状のイメージデータ形式で、作業用記憶部１６３内に記憶保持される。
【００３３】
そして、図２に示すように、誤り検知部１３が全てのキャラクタについて調べ終えたら（Ｓ１０７）、画像出力部１５は、出力画像作成部１４によって作成されて作業用記憶部１６３に記憶保持されている画像データについて、記録紙上への印刷出力を行う（Ｓ１１２）。これにより、記録紙上には、例えば図３（ｂ）に示すような修正候補が付加された状態の出力画像が印刷出力されることになる。
【００３４】
以上のように、本実施形態で説明したデジタル複写機１は、画像入力部１１が画像データを取得すると、キャラクタ認識部１２がその画像データから印刷出力すべき画像中に含まれるキャラクタを認識し、その認識結果から得られるキャラクタ列について誤り検知部１３が表現ルール上の誤りがあるか否かを判断し、誤りがある場合には出力画像作成部１４がその修正候補を生成し、その修正候補が付加された後の画像を画像出力部１５が記録紙上に印刷出力するようになっている。そのために、その印刷出力の結果をみれば、印刷出力すべき画像中のキャラクタに表現ルール上の誤りがあっても、その誤り部分が修正候補とともに示されて識別可能になる。
【００３５】
したがって、本実施形態におけるデジタル複写機１によれば、例えば画像入力部１１での読み取り対象となる原稿上のドキュメントに誤記・誤字・脱字、あるいは文法上の誤り等が含まれていても、従来技術では困難であったこれらの検出を自動的に行うことができるとともに、その誤り部分が修正候補とともに示されて識別可能になるため、デジタル複写機１のユーザにとっては非常に便利なものとなる。特に、誤りが生じ易い手書きの原稿について複写する場合には、非常に有効である。
【００３６】
また、本実施形態におけるデジタル複写機１では、ＵＩ部１７にてキャラクタ認識部１２、誤り検知部１３および出力画像作成部１４を機能させるモードが設定されていると、上述したような誤り検出処理および修正候補の付加処理を行うようになっている。すなわち、これらの処理を行うか否かを、デジタル複写機１のユーザがＵＩ部１７から任意に設定することが可能である。したがって、誤り検出およびその修正が不要な場合には、これらの処理をキャンセルして、通常の複写処理を同様の処理動作を行うことができ、デジタル複写機１のユーザにとってより一層便利なものとなる。
【００３７】
なお、本実施形態では、認識対象となるキャラクタが文字・記号からなり、その誤りを検出するための表現ルールが文法に則ったルールである場合を例に挙げて説明したが、本発明はこれに限定されるものではなく、パターン情報保持部１６１と知識ベース部１６２を別のものに置き換えれば、自然言語の訂正指摘以外の用途にも適用可能である。例えば、数式や楽譜等についても、一定の表現ルールに基づいて構成されている構文であると考えられるので、これに応用することもできる。具体的には、楽譜に適用する場合であれば、キャラクタは音符（休符や調音記号等を含む）、表現ルールは楽譜規則に則ったルールからなるので、例えば楽譜の拍子を把握して各々の小節内の拍数を数えて合わない場合にその旨を表記したり、♯や♭等といった記号が付くべきでない音符に対して付いている場合にそれを指摘する、といったことが可能である。
【００３８】
また、本実施形態では、本発明をデジタル複写機に適用した場合を例に挙げて説明したが、記録紙上に画像を印刷出力する機能を有した画像出力装置であれば、例えばプリンタ装置であっても全く同様に適用することが考えられる。つまり、画像データを取得する画像入力部１１は、原稿上に描かれた画像を光学的に読み取るのではなく、ホストコンピュータ等の外部装置からＬＡＮ（Local Area Network）等の通信回線を介して受け取るものであってもよい。この場合、取得する画像データは、上述した実施形態のようなビットマップ状のものである他に、所定の記述言語によるコマンド状（コードデータ状）のものであることが考えられる。これに対応するためには、取得した画像データについて画像展開（デコンポーズ）をした後に作業用記憶部１６３内に記憶保持させるか、あるいはコマンド状のままキャラクタの認識を行い修正候補を付加する際に画像展開する、といったことを行うようにすればよい。
【００３９】
【発明の効果】
以上に説明したように、本発明に係る画像出力装置は、画像の印刷出力を行うのに加えて、その画像に含まれるキャラクタに表現ルール上の誤りがあった場合にはこれを検出し、その修正候補を出力画像に付記して指摘し得るようになっている。したがって、例えば誤りが生じ易い手書きのドキュメントであっても、それについての複写を行えば、その誤り部分が修正候補とともに示されて識別可能になるため、ユーザにとって非常に便利なものとなる。
【図面の簡単な説明】
【図１】本発明が適用されたデジタル複写機の概略構成例を模式的に示したブロック図である。
【図２】本発明が適用されたデジタル複写機における処理動作例を示すフローチャートである。
【図３】本発明が適用されたデジタル複写機によって処理される画像の一具体例を示す説明図であり、（ａ）は修正候補付加前の状態を示す図、（ｂ）は修正候補付加後の状態を示す図である。
【符号の説明】
１…デジタル複写機、１１…画像入力部、１２…キャラクタ認識部、１３…誤り検知部、１４…出力画像作成部、１５…画像出力部、１６…記憶部、１７…ＵＩ部、１６１…パターン情報保持部、１６２…知識ベース部、１６３…作業用記憶部

Claims

印刷出力すべき画像についての画像データを取得する画像入力手段と、
前記画像入力手段が取得した画像データから前記印刷出力すべき画像中に含まれるキャラクタを認識するキャラクタ認識手段と、
予め設定されたキャラクタ列に関する表現ルール情報を基に前記キャラクタ認識手段での認識結果から得られるキャラクタ列に表現ルール上の誤りがあるか否かを判断する誤り検知手段と、
前記誤り検知手段で誤りがあると判断された場合に当該誤りの修正候補を前記表現ルール情報に基づいて生成し前記印刷出力すべき画像中に付加する出力画像作成手段と、
前記出力画像作成手段による修正候補の付加があると当該付加後の画像を記録紙上に印刷出力する画像出力手段と
を備えることを特徴とする画像出力装置。
前記画像入力手段が取得した画像データを前記画像出力手段で印刷出力するのにあたって、前記キャラクタ認識手段、前記誤り検知手段および前記出力画像作成手段を機能させるか否かを選択するためのモード設定手段
が設けられていることを特徴とする請求項１記載の画像出力装置。
前記キャラクタは文字または記号からなり、前記表現ルールは文法に則ったルールからなる
ことを特徴とする請求項１または２記載の画像出力装置。
前記キャラクタは音符からなり、前記表現ルールは楽譜規則に則ったルールからなる
ことを特徴とする請求項１または２記載の画像出力装置。
前記画像入力手段は、原稿上に描かれた画像を光学的に読み取って画像データを取得するものである
ことを特徴とする請求項１〜４のいずれか１項に記載の画像出力装置。
前記画像入力手段は、外部装置から通信回線を介して受け取ることで画像データを取得するものである
ことを特徴とする請求項１〜４のいずれか１項に記載の画像出力装置。