JP2024014051A - 画像形成装置および文字認識方法 - Google Patents

画像形成装置および文字認識方法 Download PDF

Info

Publication number
JP2024014051A
JP2024014051A JP2022116607A JP2022116607A JP2024014051A JP 2024014051 A JP2024014051 A JP 2024014051A JP 2022116607 A JP2022116607 A JP 2022116607A JP 2022116607 A JP2022116607 A JP 2022116607A JP 2024014051 A JP2024014051 A JP 2024014051A
Authority
JP
Japan
Prior art keywords
character recognition
unit
document
character
forming apparatus
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022116607A
Other languages
English (en)
Inventor
賢一郎 今吉
Kenichiro Imayoshi
義典 永田
Yoshinori Nagata
和政 染矢
Kazumasa Someya
知宏 畑
Tomohiro Hata
政夫 佐枝
Masao Saeda
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2022116607A priority Critical patent/JP2024014051A/ja
Publication of JP2024014051A publication Critical patent/JP2024014051A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Facsimiles In General (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

【課題】情報処理機器の操作に習熟しておらず手書き文書が中心のユーザーでも使いやすく、読み易い書体で印刷できる画像形成装置および文字認識方法を提供する。【解決手段】画像形成装置としての複合機100は、読み取るべき手書き文書原稿の種類指定を含むユーザーからの指示を受付ける指示受領部52と、文書原稿の画像を読み取る画像読取部13と、読み取られた画像から1以上の文字領域を抽出し、文字認識用辞書を用いて文字認識を行う文字認識部35と、文字認識の結果を確認のために表示させる表示部51と、文字認識された文字に対応するフォントを用いて文書原稿の印刷を行う印刷部14と、を備える。文字認識部35は、各文字領域に対して文書原稿の種類に応じた文字認識用辞書を用いて文字認識を行う。【選択図】図1

Description

本開示は、手書き文書原稿の画像を読み取る機能と、読み取られた画像の文字認識を行う文字認識機能とを備えた画像形成装置および手書き文書原稿の文字認識方法に関する。
コンビニエンスストア等、公共の場に設置される画像形成装置は幅広いユーザーに使用される。それらのユーザーの中には、加齢等、諸事情で筋力が不十分なために読み易い文字を書くことが難しいユーザーも含まれる。
近年は、年齢や障害の有無にかかわらず操作しやすいように配慮されたパーソナルコンピュータ等の情報処理機器も提案されている。例えば、手書き文字の筆跡データを入力して文字認識する情報処理装置として、筆跡データを入力するタイミングの近辺で、前記手書き文字を直接又は間接的に特定するための音声データを入力するものが提案されている。前記手書き文字の筆跡データを文字認識することにより得られる複数の文字認識候補の出力優先順位を、音声データを参照して決定する。これにより、文字認識率を向上させることが目的である(例えば、特許文献1参照)。
特開平8-221408号公報
情報処理機器の操作が得意なユーザーであれば、手書き文書に代えて情報処理機器を用いた文書作成が可能である。しかし、高齢者の中には情報処理機器の操作に習熟していないユーザーもある。
本開示は、以上のような事情を考慮してなされたものであって、情報処理機器の操作に習熟しておらず手書き文書が中心のユーザーでも使いやすく、読み易い書体で印刷できる手法を提供するものである。
本開示は、読み取るべき手書き文書原稿の種類指定を含むユーザーからの指示を受付ける指示受領部と、前記文書原稿の画像を読み取る画像読取部と、読み取られた画像から1以上の文字領域を抽出し、文字認識用辞書を用いて文字認識を行う文字認識部と、前記文字認識の結果を確認のために表示させる表示部と、文字認識された文字に対応するフォントを用いて前記文書原稿の印刷を行う印刷部とを備え、前記文字認識部は、各文字領域に対して前記文書原稿の種類に応じた文字認識用辞書を用いて前記文字認識を行う画像形成装置を提供する。
また、異なる観点から本開示は、画像形成装置の制御部が、読み取るべき手書き文書原稿の種類指定を含むユーザーからの指示を受付けるステップと、画像読取部を用いて前記文書原稿を読み取るステップと、読み取られた画像から1以上の文字領域を抽出し、文字認識用辞書を用いて文字認識を行う文字認識ステップと、前記文字認識の結果を確認のために表示させるステップと、印刷部を用いて、文字認識された文字に対応するフォントを用いて前記文書原稿の印刷を行うステップとを備え、前記文字認識ステップは、各文字領域に対して前記文書原稿の種類に応じた文字認識用辞書を用いて前記文字認識を行う文書原稿の文字認識方法を提供する。
本開示による画像形成装置は、文字認識部と、文字認識の結果を確認のために表示させる表示部と、文字認識された文字に対応するフォントを用いて文書原稿の印刷を行う印刷部とを備え、文字認識部は、文書原稿の種類に応じた文字認識用辞書を用いて前記文字認識を行うので、情報処理機器の操作に習熟しておらず手書き文書が中心のユーザーでも使いやすく、読み易い書体で印刷できる。
本開示による文字認識方法も同様の作用効果を奏する。
本開示において、画像形成装置の一例として示す複合機の構成を示すブロック図である。 図1に示す複合機における原稿読取部に対応する部分の外観斜視図である。 図1に示す複合機において、手書き文字認識+印刷ジョブを実行する際に表示される第1の操作画面の例を示す説明図である。 図1に示す複合機において、手書き文字認識+印刷ジョブを実行する際に表示される第2の操作画面の例を示す説明図である。 図1に示す複合機において、手書き文字認識+印刷ジョブを実行する際に表示される第3の操作画面の例を示す説明図である。 図1に示す複合機において、手書き文字認識+印刷ジョブを実行する際に表示される第4の操作画面の例を示す説明図である。 図1に示す複合機において、手書き文字認識+印刷ジョブを実行する際に表示される第5の操作画面の例を示す説明図である。 図1に示す複合機において、手書き文字認識+印刷ジョブを実行する際に表示される第6の操作画面の例を示す説明図である。 図1に示す複合機において、手書き文字認識+印刷ジョブを実行する際に表示される第7の操作画面の例を示す説明図である。 図1に示す複合機において、制御部が実行する手書き文字認識+印刷ジョブの処理の例を示す第1のフローチャートである。 図1に示す複合機において、制御部が実行する手書き文字認識+印刷ジョブの処理の例を示す第2のフローチャートである。 図1に示す複合機において、手書き文字認識用書式の印刷を実行する際に表示される第1の操作画面の例を示す説明図である。 図1に示す複合機において、手書き文字認識用書式の印刷を実行する際に表示される第2の操作画面の例を示す説明図である。 図1に示す複合機において、制御部が実行する手書き文字認識用書式の印刷に係る処理の例を示すフローチャートである。 図1に示す複合機において、文字認識の候補を表示する操作画面の例を示す説明図である。
以下、図面を用いて本開示をさらに詳述する。なお、以下の説明は、すべての点で例示であって、本開示を限定するものと解されるべきではない。
(実施の形態1)
まず、本開示における画像形成装置について述べる。図1は、本開示において、画像形成装置の一例として示す複合機の構成を示すブロック図である。図2は、図1に示す複合機の原稿読取部に対応する部分の外観斜視図である。
図1に示すように、複合機100は、制御部12、画像読取部13、印刷部14、操作部15および記憶部18を備える。
制御部12は、ハードウェア資源として、プロセッサおよびメモリを中心に構成され、る。プロセッサに加えて、入出力インターフェース回路、タイマ回路、通信回路等のハードウェア資源で構成される回路である。
プロセッサがメモリに格納された制御プログラムを実行することによって操作の認識、表示の制御に係る処理が実現される。また、原稿の読取りや画像の印刷等に係るジョブ、即ち一連の画像処理に係る処理が実現される。即ち、ソフトウェア資源とハードウェア資源とが協働することによって、複合機100の制御を行う制御部12としての機能が実現される。
本開示による制御部12は、操作制御部21、ファイル制御部22およびジョブ制御部24および画像処理部25を備える。さらに、任意で書式提供部23、音声認識部27および音声合成部28を備える。画像処理部25は、読取制御部33、印刷制御部34および文字認識部35を備え、さらに任意でレイアウト判定部36を備える。
本開示による操作部15は、表示部51および指示受領部52を備える。
また、本開示による記憶部18は、辞書格納部81を備え、さらに任意で書式格納部82を備える。
制御部12が備える操作制御部21は、操作部15と接続されており、操作部15の指示受領部52が受け付けたユーザーの操作を認識し、また、操作部15の表示部51に表示させる表示データを生成する。
図2に示すように、操作部15は、複合機100の手前側に設けられる。操作部15は、操作制御部21が生成した操作画面を表示する表示デバイス(表示部51)を有する。さらに、その操作画面に対するユーザーからの指示を受け付ける操作検出デバイス(指示受領部52)を有する。表示デバイスとしては、例えば液晶表示デバイスやOLED(Organic Light Emitting Display)が適用可能であり、操作検出デバイスとしてはタッチパネルが適用可能である。操作制御部21は、上述の操作検出デバイスと通信して操作検出デバイスによって検出されたユーザーの操作、即ちユーザーからの指示を認識する。また、上述の表示デバイスに表示データを送信して操作画面として表示させる。
制御部12が備えるファイル制御部22は、記憶部18に格納されたデータを管理し、読み書きを制御する。
制御部12が備える画像処理部25は、画像読取部13から出力される読取画像の信号に基づいて原稿の画像データを生成する。生成された原稿の画像データは、スキャンジョブの場合、記憶部18に格納され、あるいは不図示の通信回路を介して外部の機器へ送信される。読取制御部33は、それらの原稿の読み取りに係る処理を制御する。コピージョブの場合、原稿の画像データは、印刷部14へ送られて印刷される。プリントジョブの場合は、前記通信回路を介して外部の機器から受信したジョブデータに基づいて印刷用の画像データを生成し、印刷部14で印刷する。印刷制御部34は、それらの印刷に係る処理を制御する。文字認識部35は、原稿の画像データに含まれる文字を認識する。好ましくは、レイアウト判定部36が、原稿の画像データに含まれる文字領域のレイアウトパターンを判定する。文字認識部35およびレイアウト判定部36については後述する。
制御部12が備えるジョブ制御部24は、操作制御部21が認識したユーザーからの指示、前記通信回路を介して印刷ホストとしての外部機器からの指示がジョブの設定あるいは実行に係る場合、対応する処理を行う。例えば、ジョブの設定に係る指示の場合は対象の設定を更新する。操作画面の更新を伴う場合は、操作制御部21が更新された操作画面の表示データを生成して操作部15の表示デバイスに送る。それによって、操作画面を更新する。ジョブの実行に係る指示を受領した場合、ジョブ制御部24は受領したジョブの種類(例えば、スキャンジョブ、コピージョブ、印刷ジョブ)に応じて画像読取部13、印刷部14および画像処理部25を制御し、画像データの流れを制御して指示されたジョブを実行する。
さらに述べると、ジョブ制御部24は画像読取部13および印刷部14に配置された図示しないセンサーが検出する状態を認識する。そして、画像読取部13および印刷部14に配置された図示しないモータ、アクチュエータ、デバイス等の動作を制御する。また、ジョブ制御部24は、画像処理部25の画像に係る処理を制御する。
記憶部18は、HDD(Hard Disk Drive)やSDD(Solid State Drive)といった不揮発性メモリと画像データを格納するDRAM(Dynamic Random Access Memory)といった揮発性メモリの何れかまたは両方を備える。図1において記憶部18が、制御部12と別のブロックとして示しているが、制御部12に含まれる態様もあり得る。即ち、記憶部18が、制御部12と同じ回路基板上に実装される態様もあり得る。
記憶部18の辞書格納部81は、文字認識部35が文字認識を行う際に用いる、原稿の種類に応じた辞書を格納する。任意の書式格納部82は、予め定められた書式の印刷データを格納する。さらに、画像処理部25がレイアウト判定部36を備える場合、書式格納部82は、種々のレイアウトパターンが登録されたデータベースを格納していてもよい。レイアウト判定部36は、原稿の種類に応じたレイアウトパターンの判定を行う際にそれらのレイアウトパターンが格納されたデータベースを参照してもよい。
画像読取部13は、ジョブ制御部24の制御下で原稿の画像を読取って、RGB(レッド、グリーンおよびブルー)のカラー画像信号(RGBアナログ信号)に変換する。即ち、コピージョブおよびスキャンジョブにおける画像読取の処理を実行する。読み取られる原稿は、原稿送り装置31または原稿台32にユーザーがセットする。原稿送り装置31は、原稿を所定の読取位置へ1枚ずつ搬送する。原稿台32は、平坦で透明なガラス部材からなる。画像読取部13は、イメージセンサ(図1および図2に不図示)を備える。原稿台32に置かれた原稿を走査するための走査機構(図1および図2に不図示)を備える。
画像処理部25は、イメージセンサで読み取られた読取画像の信号に基づいて原稿の画像データを生成する。また、前記通信回路を介して外部の機器から受信する印刷データに基づいて印刷用の画像データを生成する。生成された画像データは、印刷部14へ送られて印刷され、あるいは前記通信回路を介して外部の機器へ送信される。
印刷部14は、印刷シートを収容する給紙トレイ41A、41Bおよび41Cの何れかから印刷シートを一枚ずつ給送してその印刷シートに画像を印刷し、排出トレイに出力する。図2および3に示すように、複合機100は3つの排出トレイ42A、42Bおよび42Cの何れかに印刷済みの印刷シートを出力する。
≪手書き文字認識+印刷ジョブについて≫
続いて、手書き文字認識+印刷ジョブの処理の流れについて述べる。
図3~9は、手書き文字認識+印刷ジョブを実行する際に操作部15に表示される操作画面の例を示す説明図である。また、図10および図11は、制御部12が実行する手書き文字認識+印刷ジョブの処理の例を示すフローチャートである。フローチャートおよび操作画面の図を参照しながら説明する。
複合機100が実行すべきジョブの選択を受け付ける操作画面130(図3参照)を操作部15に表示させて、制御部12は、ユーザーから指示がなされるのを待つ(図10に示すステップS11)。
操作画面130で、[手書き文字認識+印刷]キー131がタッチされたら、その操作に応答して制御部12は、原稿の種類を選択する操作画面140(図3参照)に操作画面を切り替える(図10のステップS13)。
制御部12は、操作画面140に、「原稿の種類を選択してください。」というメッセージ141と共に、複数の原稿種類選択キー142を表示させる。好ましくは、制御部12は、音声合成部28にメッセージ141の内容を音声でもユーザーに提示する。後述する他の操作画面についても、好ましくは表示されるメッセージの内容を音声でもユーザーに提示する。操作画面140に表示される原稿種類は、はがきおよび年賀状である。さらに、操作画面140にない原稿種類の選択を受け付ける場合のために[履歴書、便箋へ]キー143を表示させる(図4参照)。[履歴書、便箋へ]キー143がタッチされたら、その操作に応答して制御部12は、他の原稿種類を選択する操作画面150(図5参照)に操作画面を切り替える。
操作画面150で、制御部12は、「原稿の種類を選択してください。」というメッセージ151と共に、複数の原稿種類選択キー152を表示させる。操作画面150に表示される原稿種類は、便箋および履歴書である。さらに、操作画面140へ戻って原稿種類の選択を受け付ける場合のために[はがき、年賀状へ]キー153を表示させる(図5参照)。
図4または図5の何れかの原稿種類選択キー142または152がタッチされると(図10のステップS15)、その操作に応答して制御部12は、原稿の読み取りを指示する操作画面160(図6参照)に操作画面を切り替える(図10のステップS17)。
操作画面160で、制御部12は、「原稿を置いて『原稿読み取り』を押してください。」というメッセージ161と共に、原稿の置き方をユーザーに示す原稿セットイラスト162を表示させる。さらに、原稿の読み取りを指示する[原稿読み取り]キー163を表示させる(図6参照)。
原稿セットイラスト162に従って手書き文字の原稿がセットされ、[原稿読み取り]キー163がタッチされると(図10のステップS19)、その操作に応答して制御部12は、原稿を画像読取部13に読み取らせる(図10のステップS21)。そして、好ましくは、選択された原稿種類に応じて、書式格納部82に格納されそれぞれの原稿種類でよく用いられるレイアウトパターンが登録されたデータベースを参照し、読み取った手書き文書原稿における文字領域のレイアウトを推定する(同ステップS23)。このようなレイアウトパターンの適用は、縦書きと横書きが混在するような原稿、異なるサイズの文字が混在する原稿、段組が用いられた原稿に対して特に有効である。
制御部12は、選択された原稿種類に応じて、辞書格納部81に格納された文字認識用辞書を参照し、各文字領域の文字認識を行う(同ステップS25)。種類を問わずに同一の文字認識用辞書を適用する場合に比べ、原稿種類に応じた文字認識用辞書を用いることで、選択された原稿種類で多用される語句の優先度を高め、高い精度の文字認識を実現できる。そして、操作画面170(図7参照)に操作画面を切り替える(図10のステップS27)。
制御部12は、操作画面170に、「以下の文章を読み上げてください。」というメッセージ171と共に、読み取った手書き原稿の画像を読取画像プレビュー172として表示させる。好ましくは、レイアウト判定部36が判定した原稿のレイアウトパターンに従って、手書き原稿の中から抽出された1以上の文字領域の単位で、各文字領域の読み上げをユーザーに求める。制御部12は、読み上げを求める文字領域を矩形枠の読み上げフォーカス173で示し、ユーザーがどの個所を読み上げるべきかを示す。さらに、マイクアイコン174を表示し、その色、濃淡あるいはサイズを変化させることでユーザーが行った読み上げを音声認識したことを示す。
制御部12は、すべての文字領域について読み上げを求めてもよいが、文字認識の処理において信頼度(文字認識の確かさ)が所定の閾値に満たない文字領域のみについて読み上げを求めてもよい。信頼度は、例えば原稿の手書き文字と文字認識用辞書との類似の度合いに基づいて決定されてもよい。信頼度が閾値に満たない文字領域のみについて読み上げを求めるようにすることで、全ての文字領域について読み上げを求める場合に比べて読み上げに要する時間を短縮できる。
ここで、文字領域の判定は、単にレイアウトのみで判定するのではなく、各文字領域の文字認識の結果が合理的な意味を持つ語句になっているか否かに基づいて判定してもよい。合理的な意味を持つ語句にならない場合は、隣接する文字領域との境界をずらして文字認識を行い、より意味の通る単位で文字領域を決定することが好ましい。文字認識用辞書は、各文字の形状だけでなく複数の文字からなる語句の形状を参照して文字認識を行うようためのものであってもよい。
また好ましくは、制御部12は、読み上げフォーカス173を移動させながら、各文字領域の読み上げをユーザーに求める。
詳細に述べると、制御部12は、読み上げフォーカス173が示す対象の文字領域がユーザーによって読み上げられると(図11に示すステップS31)、音声認識部27は、その音声を認識する。そして、読み上げ音声に対応する文字起こしの処理を行う(同ステップS33)。そして、読み上げ音声から文字起こしされた結果を文字認識部35が文字認識処理を行って得られた候補と照合する。好ましくは、読み上げフォーカス173が示す対象の文字領域を、文字認識および音声認識の結果決定された文字に置き換える。置き換える際、読み上げフォーカス173が示す文字領域をフォント文字に置き換える。
このようにして、各文字領域を文字認識部35による文字認識と音声認識部27による音声認識に基づく認識結果に置き変える。文字認識部35による文字認識の結果として複数の候補が得られる場合がある。好ましくは、制御部12は、何れの候補を採用するかについて、認識対象の文字や語句と文字認識用辞書との類似の度合いのみに基づいて文字認識の結果を決定しあるいは候補を絞り込むことはしない。音声認識部27による読み上げ音声の認識結果を考慮して文字認識の結果を決定しあるいは候補を絞り込むようにする(同ステップS35)。
一つの文字領域について文字認識の処理が終了すると、制御部12は、読み上げを求める文字領域がまだ残っていないか判定する(同ステップS37)。読み上げを行うべき文字領域が残っている場合(ステップS37のNo)、制御部12は、図7に示す読み上げフォーカスを次の対象に移動させる(ステップS39)。そして、処理を前述のステップS31へ戻し、対象の文字領域の読み上げがなされるのを待つ。
一方、読み上げを行うべき文字領域が残っていない場合(ステップS37のYes)、制御部12は、操作画面180(図8参照)に操作画面を切り替える(図11のステップS41)。このように、好ましくは音声認識を併用することで、情報処理機器の操作が不得手なユーザーであっても使いやすく、より高い精度の文字認識の結果を得ることが可能になる。
また、制御部12が読み上げフォーカス173を移動させながら読み上げを求める態様に代えて、あるいはその態様に加えて、読み上げに係る処理を次のようにしてもよい。ユーザーが修正したいと考える語句を読み上げると、音声認識部27がその読み上げを認識して該当する文字領域を決定し、読み上げを考慮してその文字領域の文字認識を行う。その場合、制御部12は、文字認識の対象であると決定した文字領域に読み上げフォーカス173を移動させたうえで文字認識の結果を表示させてもよい。
制御部12は、操作画面180に、「レイアウトを確認してください。」というメッセージ181と共に、確定した文字認識結果のプレビュー画像を文字認識プレビュー182として表示させる。さらに、[レイアウトを変更する]キー183および[印刷する]キー184を表示させる。
操作画面180で、[印刷する]キー184がタッチされたら(ステップS43のYes)、制御部12は、手書き原稿の手書き文字を文字認識されたフォントに置き換えて印刷を実行し(ステップS51)、ジョブを終了する。
一方、操作画面180で[レイアウトを変更する]キー183がタッチされたら(ステップS43のNoを経てステップS45のYes)、その操作に応答して制御部12は、他のレイアウトを選択する操作画面190(図9参照)に操作画面を切り替える(図11のステップS53)。
制御部12は、操作画面190に、「レイアウトを選択してください。」というメッセージ191と共に、レイアウト選択キー192を表示させる。さらに、操作画面190にないレイアウトの選択を受け付けるための[他のレイアウトへ]キー193を表示させる。何れかのレイアウト選択キー192がタッチされたら、その操作に応答して制御部12は、操作画面を図8に示す操作画面180と同様の画面に切り替える(図11のステップS55のYesを経て同ステップS41へ)。ただし、その場合の文字認識プレビュー182は、選択されたレイアウトに対応するものである。各文字領域の文字認識結果は変えずにレイアウトだけを変更したものである。
以上が、この実施形態において複合機100が手書き文書原稿を読み取り、文字認識を行い、文字認識された文字に対応するフォントを用いて文書原稿の印刷を行う手順である。
(実施の形態2)
実施の形態1では、はがきや便箋など、比較的自由なレイアウトの文書原稿を想定している。それに対して、例えば行政サービスに係る各種の申請書など、決められた書式の書類に文字を手書きするような場合もある。所定の書式が定められているものについては、画像形成装置がその書式を記憶あるいは参照可能とし、書式を印刷したものに手書きしたものを手書き文書原稿として読み取るようにすればよい。そうすれば、実施の形態1のようにレイアウト判定部36が原稿のレイアウトを推定するのではなく、予め記憶されあるいは参照可能な書式に基づいて正確な原稿のレイアウトを決定できる。また、所定の書式の各欄に記入されるべき内容がわかっているので、原稿種類に応じた辞書を参照するだけでなく各欄の内容に応じた辞書を参照して高い精度の文字認識が可能になる。
この実施形態において、書式は、記憶部18の書式格納部82に予め格納されているものとする。しかし、その態様に限らず、例えば複合機100が通信可能な外部のサーバー等に書式が格納されており、必要に応じてその書式を参照あるいはダウンロードしてもよい。
図12および図13は、本開示において手書き文字認識用書式の印刷を実行する際に表示される操作画面の例を示す説明図である。また、図14は、制御部が実行する手書き文字認識用書式の印刷に係る処理の例を示すフローチャートである。フローチャートおよび操作画面の図を参照しながら説明する。
実施の形態1と同様、制御部12は、複合機100が実行すべきジョブの選択を受け付ける操作画面130(図3参照)を操作部15に表示させて、制御部12は、ユーザーから指示がなされるのを待つ(図14に示すステップS61)。
図3に示す操作画面130で、[手書き文字認識用書式の印刷]キー132がタッチされたら、その操作に応答して制御部12は、書式提供部23として以下の一連の処理を行う。
まず、印刷すべき書式を選択する操作画面220(図12参照)に操作画面を切り替える(図14のステップS63)。
そして制御部12は、操作画面220に、「印刷する原稿の書式を選択してください。」というメッセージ221と共に、複数の書式選択キー222を表示させる。操作画面220に表示される書式の種類として、はがきおよび年賀状を示している。さらに、操作画面140にない原稿種類の選択を受け付ける場合のために[履歴書、便箋、その他へ]キー223を表示させる(図12参照)。[履歴書、便箋、その他へ]キー223がタッチされたら、その操作に応答して制御部12は、他の書式を選択する不図示の操作画面に切り替える。その他の書式には、上述した行政サービス等に関する申請書類などが含まれてもよい。その他、民間の銀行や保険会社、郵便、宅配便等の申請書類の書式が含まれてもよい。
何れかの書式選択キー222がタッチされたら(図14のステップS65)、その操作に応答して制御部12は、操作画面230(図13参照)に操作画面を切り替える(図14のステップS67)。
制御部12は、操作画面230に、「印刷する原稿の書式を確認してください。」というメッセージ231と共に、選択された書式のプレビュー画像を書式プレビュー232として表示させる。さらに、[別の書式を選択する]キー233および[印刷する]キー234を表示させる。
操作画面230で、[印刷する]キー234がタッチされたら(ステップS69のYes)、制御部12は、選択された書式の印刷を実行し(ステップS71)、ジョブを終了する。
一方、操作画面230で[別の書式を選択する]キー233がタッチされたら(ステップS69のNoを経てステップS73のYes)、その操作に応答して制御部12は、他の書式を選択する不図示の操作画面に操作画面を切り替える(図14のステップS73を経てステップS63へ)。
以上が、この実施形態において複合機100が手書き文字認識用書式の印刷を行う手順である。
このようにして印刷された書式にユーザーが手書きしたものを、実施の形態1と同様に読み取らせる。なお、手書き文字認識用書式には、印刷された書式であることを示す画像が付されているものとする。ここでは一例として2次元コードとする。その2次元コードを読み取った画像形成装置は、それに対応する書式を参照して、書式の原稿種類および書式の各欄に応じた辞書を参照して文字認識を行う。
なお、文字を手書きする箇所を示す枠等の補助線や注意書きが書式に印刷されている場合、制御部12はその補助線を除き、文字認識された文字だけを印刷するようにしてもよい。
(実施の形態3)
実施の形態1で、文字認識部35は、認識対象の手書き文字と文字認識用辞書との類似の度合いに基づいて、好ましくはさらに読み上げ音声の認識結果をさらに参照して決定しあるいは候補を絞り込む。
この実施形態で、文字認識部35は、認識対象の候補を決定あるいは絞り込むよりも、むしろ同一または類似の意味を有する幅広い範囲の語句をユーザーに候補として提示する。
図15は、この実施形態において、制御部12が文字認識を行って候補を表示する操作画面の例を示す説明図である。実施の形態1の図7に対応するものといえる。
制御部12は、図15に示す操作画面250に、メッセージ251と共に、読み取った手書き原稿の画像を読取画像プレビュー252として表示させ、また読み上げフォーカス253を表示させる。さらに、マイクアイコン254を表示させる。それらは、図7に示す操作画面170、メッセージ171、読取画像プレビュー172、読み上げフォーカス173およびマイクアイコン174にそれぞれ対応するものといえる。
ただし、メッセージ251は図7のメッセージ171と異なり、「枠で囲んだ箇所にふさわしい内容を、右欄の中から選んでください。」という内容である。制御部12は、図7にない文字認識候補255を読取画像プレビュー252の右に表示させる。文字認識候補255は、メッセージ251中の「右欄」に対応する。
文字認識候補255は、固有の番号1~3が付与された3つの候補(候補1~3)を含む。候補1は、読み上げフォーカス253で示される文字領域の手書き文字をその通りに認識したものであって、実施の形態1では文字認識の結果とされるものである。それに対して候補2は、候補1と同じ読みであり同じ意味を持つ語句であるが、一部を漢字、即ち同意の文字で置き換えたものである。候補1と同意の語句ともいえる。候補3は、候補1と類似の意味を持つ語句である。この例に限らず、制御部12は、候補1と同意または類似の文字、同意または類似の語句を候補として表示させる。
候補1~3の何れかをタッチするユーザーの操作に応答して、制御部12は、タッチされた候補を文字認識の結果とし、読み上げフォーカス253の手書き文字を選択された候補のフォント文字で置き換える。候補の選択は、タッチの操作だけでなく、候補に固有の番号1~3の何れかを読み上げるユーザーの音声によってなされてもよい。さらに、候補1~3の何れも意図したものでない場合、ユーザーが意図した内容を読み上げ、制御部12はその読み上げの音声に応答して、文字認識候補255に新たな候補4を追加してもよい。あるいは候補1~3に代えて新たな候補を表示してもよい。
このように、文字認識の結果に加えて、その結果と同意または類似の文字、同意または類似の語句の少なくとも何れかを前記表示部に文字認識の候補として表示させることで、ユーザーに多様な候補を提示して選択を受け付けることが可能になる。
以上の本開示において、辞書は、文字、語、句、文の少なくとも何れかが登録されたデータベースであって、認識すべき対象と照合されるものである。
本開示には、上述した複数の態様のうちの何れかを組み合わせたものも含まれると解されるべきである。
前述した実施の形態の他にも、本開示についての種々の変形例があり得る。それらの変形例は、本開示の範囲に属さないと解されるべきものではない。本開示に係る発明には、請求の範囲と均等の意味および本開示の範囲に属するすべての変形が含まれるべきである。
12:制御部、 13:画像読取部、 14:印刷部、 15:操作部、 18:記憶部、 21:操作制御部、 22:ファイル制御部、 23:書式提供部、 24:ジョブ制御部、 25:画像処理部、 27:音声認識部、 28:音声合成部、 31:原稿送り装置、 32:原稿台、 33:読取制御部、 34:印刷制御部、 35:文字認識部、 36:レイアウト判定部、 41A,41B,41C:給紙トレイ、 42A,42B,42C:排出トレイ、 51:表示部、 52:指示受領部、 81:辞書格納部、 82:書式格納部
100:複合機、 130,140,150,160,170,180,190,220,230,250:操作画面、 131:[手書き文字認識+印刷]キー、 132:[手書き文字認識用書式の印刷]キー、 141,151,161,171,181,191,221,231,251:メッセージ、 142,152:原稿種類選択キー、 143:[履歴書、便箋へ]キー、 153:[はがき、年賀状へ]キー、 162:原稿セットイラスト、 163:[原稿読み取り]キー、 172,252:読取画像プレビュー、 173,253:読み上げフォーカス、 174,254:マイクアイコン、 182:文字認識プレビュー、 183:[レイアウトを変更する]キー、 184:[印刷する]キー、 192:レイアウト選択キー、 193:[他のレイアウトへ]キー、 222:書式選択キー、 223:[履歴書、便箋、その他へ]キー、 232:書式プレビュー、 233:[別の書式を選択する]キー、 234:[印刷する]キー、 255:文字認識候補

Claims (9)

  1. 読み取るべき手書き文書原稿の種類指定を含むユーザーからの指示を受付ける指示受領部と、
    前記文書原稿の画像を読み取る画像読取部と、
    読み取られた画像から1以上の文字領域を抽出し、文字認識用辞書を用いて文字認識を行う文字認識部と、
    前記文字認識の結果を確認のために表示させる表示部と、
    文字認識された文字に対応するフォントを用いて前記文書原稿の印刷を行う印刷部とを備え、
    前記文字認識部は、各文字領域に対して前記文書原稿の種類に応じた文字認識用辞書を用いて前記文字認識を行う画像形成装置。
  2. 読み取られた画像から前記文字領域を抽出し、語句のレイアウトを判定するレイアウト判定部をさらに備え、
    前記文字認識部は、前記文書原稿の種類に応じて前記文字領域のレイアウトを決定し、各語句に対して前記文書原稿の種類に応じた文字認識用辞書を用いて前記文字認識を行う請求項1に記載の画像形成装置。
  3. 手書き文書原稿用の複数のレイアウト書式を予め格納する書式格納部と、
    前記レイアウト書式の何れかを選択するユーザーからの指示を前記指示受領部を介して受付け、選択されたレイアウト書式を前記印刷部に印刷させてユーザーに提供する書式提供部をさらに備え、
    前記レイアウト判定部は、提供されたレイアウト書式に文字が手書きされた原稿が前記画像読取部によって読み取られた場合、そのレイアウト書式に基づいて語句のレイアウトを判定する請求項2に記載の画像形成装置。
  4. 前記表示部に表示された文字認識の結果を文字領域毎に読み上げる音声を認識する音声認識部をさらに備え、
    前記文字認識部は、前記音声認識部による認識の結果をさらに用いて各語句の文字認識を必要に応じて修正する請求項2に記載の画像形成装置。
  5. 前記文字認識部は、前記文字認識用辞書との類似の度合い基づく文字認識の結果の信頼度を各語句について算出し、算出された信頼度が予め定められた基準に満たない語句についてユーザーに語句の読み上げを求める請求項4に記載の画像形成装置。
  6. 前記音声認識部は、表示部に表示された文字認識の結果のうちでユーザーが修正したい語句を読み上げる音声を認識し、
    前記文字認識部は、前記音声認識部による認識の結果をさらに用いて該当する文字領域の文字認識を修正する請求項4に記載の画像形成装置。
  7. 前記音声認識部は、音声認識用辞書を用いて音声を認識し、前記文書原稿の種類に応じた音声認識用辞書を用いる請求項4に記載の画像形成装置。
  8. 前記文字認識部は、前記文字認識用辞書を用いて得られる文字認識の結果に加えて、その結果と同意または類似の文字、同意または類似の語句の少なくとも何れかを前記表示部に文字認識の候補として表示させる請求項2に記載の画像形成装置。
  9. 画像形成装置の制御部が、
    読み取るべき手書き文書原稿の種類指定を含むユーザーからの指示を受付けるステップと、
    画像読取部を用いて前記文書原稿を読み取るステップと、
    読み取られた画像から1以上の文字領域を抽出し、文字認識用辞書を用いて文字認識を行う文字認識ステップと、
    前記文字認識の結果を確認のために表示させるステップと、
    印刷部を用いて、文字認識された文字に対応するフォントを用いて前記文書原稿の印刷を行うステップとを備え、
    前記文字認識ステップは、各文字領域に対して前記文書原稿の種類に応じた文字認識用辞書を用いて前記文字認識を行う文書原稿の文字認識方法。
JP2022116607A 2022-07-21 2022-07-21 画像形成装置および文字認識方法 Pending JP2024014051A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2022116607A JP2024014051A (ja) 2022-07-21 2022-07-21 画像形成装置および文字認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2022116607A JP2024014051A (ja) 2022-07-21 2022-07-21 画像形成装置および文字認識方法

Publications (1)

Publication Number Publication Date
JP2024014051A true JP2024014051A (ja) 2024-02-01

Family

ID=89719134

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022116607A Pending JP2024014051A (ja) 2022-07-21 2022-07-21 画像形成装置および文字認識方法

Country Status (1)

Country Link
JP (1) JP2024014051A (ja)

Similar Documents

Publication Publication Date Title
US8482788B2 (en) Image processing apparatus, terminal, printer apparatus and image processing method, having image restoring function
CN108132762B (zh) 图像处理装置以及图像形成装置
JP2003219147A (ja) 画像形成後の加工のためにページの向きを判定する方法
US6795664B2 (en) Image forming method for handling tab pages
US8134739B2 (en) Information processing device for outputting reduced-size pages
US7586654B2 (en) System and method of adding messages to a scanned image
JP2009104590A (ja) 印刷装置及び印刷システム
US20060062473A1 (en) Image reading apparatus, image processing apparatus and image forming apparatus
JP2006259045A (ja) 画像形成装置及び方法
US8107118B2 (en) Print control apparatus that controls printing device performing printing using print sheet having tab
JP6066108B2 (ja) 電子文書生成システムおよびプログラム
US20220189186A1 (en) Image processing apparatus, image processing method, and non-transitory storage medium
US20040205607A1 (en) Printing method using Nup function, and computer readable recording medium storing computer program for executing the printing method
JP2015167001A (ja) 情報処理プログラム、情報処理装置、情報処理システム、情報処理方法、画像処理装置及び画像処理システム
US20040191731A1 (en) Paper document-based assistive technologies for the visually impaired
JP2024014051A (ja) 画像形成装置および文字認識方法
JP2006262152A (ja) 画像形成方法、画像形成装置およびプログラム
US10120624B2 (en) Printing system and printing device
US20200296233A1 (en) Scoring apparatus and non-transitory computer readable medium
JP2010072850A (ja) 画像処理装置
JP2019091984A (ja) 画像処理装置
JP6187366B2 (ja) 画像処理装置、画像処理方法およびプログラム
JP5115462B2 (ja) 画像読取装置
JP5935376B2 (ja) 複写装置
JP2002077567A (ja) 画像形成装置、画像形成方法および画像形成方法をコンピュータに実行させるためのプログラムを記録した記録媒体