JP2024066597A - 情報処理装置、情報処理装置の制御方法、及びプログラム - Google Patents

情報処理装置、情報処理装置の制御方法、及びプログラム Download PDF

Info

Publication number
JP2024066597A
JP2024066597A JP2022176058A JP2022176058A JP2024066597A JP 2024066597 A JP2024066597 A JP 2024066597A JP 2022176058 A JP2022176058 A JP 2022176058A JP 2022176058 A JP2022176058 A JP 2022176058A JP 2024066597 A JP2024066597 A JP 2024066597A
Authority
JP
Japan
Prior art keywords
area
handwritten
pixel
estimation
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022176058A
Other languages
English (en)
Inventor
亜希子 永原
Akiko Nagahara
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2022176058A priority Critical patent/JP2024066597A/ja
Publication of JP2024066597A publication Critical patent/JP2024066597A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

【課題】画像中の文字が手書き文字か否かの推定に誤りが生じ得る状況下において、当該推定結果の誤りをより好適な態様で修正可能な情報処理装置を提供する。【解決手段】情報処理装置のプログラム229において、手書き文字推定処理部303は、対象となる画像中における手書き文字を推定する。領域選択処理部305は、画像中における領域の指定を受け付ける。領域選択処理部305は、手書き文字推定処理部303による手書き文字の推定結果に基づき、指定された上記領域中の手書き文字に対応する画素と、当該画素との距離が閾値以下となる上記領域外の手書き文字に対応する画素と、を対象画素として特定する。処理種別選択処理部306は、対象画素に対して手書き文字か否かの指示を受け付ける。処理種別選択処理部306は、受け付けた指示に応じて、上記対象画素に対する手書き文字推定処理部303による推定結果を修正する。【選択図】図3

Description

本開示は、情報処理装置、情報処理装置の制御方法、及びプログラムに関する。
画像解析技術の発展に伴い、スキャナ等を利用して文書をスキャンした画像を解析することで、当該文書に記された文字が手書きされた文字(以下、手書き文字とも称する)か否かを推定することが可能となっている。このような技術を応用することで、例えば、文書のスキャン結果に応じた画像を表示する際に、手書き文字に対応する画素の色を変換することで、当該手書き文字に相当する領域を強調表示したり、当該領域を消去したりする(背景と同色とする)ことが可能である。このような制御が適用されることで、目視による手書き文字で記載された項目や活字で記載された項目の確認作業を容易にすることが可能となる。
一方で、画像中の手書き文字が活字と誤って推定されたり、活字が手書き文字と誤って推定されたりするような状況も想定され得る。このような状況を踏まえ、特許文献1には、手書き文字や活字として判定された領域単位で、当該領域が手書き文字や活字であることを示す属性を修正する技術が開示されている。特許文献1に開示された技術は、文字の記入欄が予め設けられている文書等のように、矩形の領域単位で、手書き文字と活字とが明確に分離できる場合に有効である。
特開2001-307020号公報
一方で、手書き文字と活字とが混在している文書等のように、矩形の領域単位で、当該領域が手書き文字と活字とのいずれの領域かを推定することが困難な場合がある。このような状況下では、矩形等のように予め決められた形状の領域単位では、画像中の文字が手書き文字であるか否かの推定結果(換言すると、手書き文字と活字とのいずれであるかの推定結果)を修正することが困難な場合がある。
本発明は上記の問題を鑑み、画像中の文字が手書き文字か否かの推定に誤りが生じ得る状況下において、当該推定結果の誤りをより好適な態様で修正可能とすることを目的とする。
本発明に係る情報処理装置は、対象となる画像中における手書き文字を推定する推定手段と、前記画像中における領域の指定を受け付ける第1の受付手段と、前記推定手段による手書き文字の推定結果に基づき、指定された前記領域中の手書き文字に対応する画素と、当該画素との距離が閾値以下となる前記領域外の手書き文字に対応する画素と、を対象画素として特定する特定手段と、前記対象画素に対して手書き文字か否かの指示を受け付ける第2の受付手段と、前記第2の受付手段が受け付けた指示に応じて、前記対象画素に対する前記推定手段による推定結果を修正する修正手段と、を有することを特徴とする。
本発明によれば、画像中の文字が手書き文字か否かの推定に誤りが生じ得る状況下において、当該推定結果の誤りをより好適な態様で修正することが可能となる。
画像処理システムのシステム構成の一例を示した図である。 画像処理サーバのハードウェア構成の一例を示した図である。 画像処理システムのソフトウェア構成の一例を示した図である。 画像処理サーバの処理の一例を示したフローチャートである。 画像処理サーバの処理の一例を示したフローチャートである。 画像処理サーバの処理の一例を示したフローチャートである。 画像処理サーバの処理の一例を示したフローチャートである。 画像処理サーバの処理の一例を示したフローチャートである。 画像処理サーバの処理の一例を示したフローチャートである。 画像処理サーバの処理の一例を示したフローチャートである。 確認画面の一例を示した図である。 画像処理サーバの処理の一例を示したフローチャートである。 画像処理サーバの処理の一例を示したフローチャートである。 確認画面の一例を示した図である。 確認画面の一例を示した図である。
以下に添付図面を参照しながら、本開示の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。
<システム構成>
図1を参照して、本開示の一実施形態に係る画像処理システムのシステム構成の一例について説明する。画像処理システムは、画像形成装置101と、画像処理サーバ102と、情報処理端末103とを含む。画像形成装置101と、画像処理サーバ102と、情報処理端末103とは、ネットワーク105を介して相互に情報を送受信可能に接続されている。ネットワーク105としては、例えば、インターネットやLAN(Local Area Network)等が適用され得る。もちろん、各装置間を相互に情報の送受信が可能に接続することが可能であれば、ネットワーク105の種別は特に限定はされない。
画像形成装置101は、所謂帳票等の文書を光学的に読み取ることで当該文書の画像データを取得する。また、画像形成装置101は、文書の読み取り結果に応じた画像データを画像処理サーバ102に送信してもよい。なお、本開示の各実施形態では、便宜上、紙文書の帳票を読み取り対象とする場合に着目して構成や処理等の各種説明を行うものとする。また、当該紙文書の帳票としては、例えば、住まいの都道府県を選択する欄や性別を示す欄等のような複数の項目を含む各種の帳票が適用され得る。また、当該帳票には、上記複数の項目のそれぞれに対して手書き文字や活字等が記入され得る。
画像処理サーバ102は、画像データに対して各種処理(例えば、解析処理や画像処理等)を施す機能を有する。例えば、画像処理サーバ102は、画像形成装置101から帳票等の文書の読み取り結果に応じた画像データを取得し、当該画像データが示す画像に対して画像処理を施してもよい。また、画像処理サーバ102は、画像データに対する各種処理の適用結果を情報処理端末103に出力することで、当該情報処理端末103を介して当該処理の結果をユーザに提示してもよい。画像処理サーバ102は、例えば、サーバ装置やパーソナルコンピュータ等のような汎用的な情報処理装置により実現され得る。また、他の一例として、画像処理サーバ102は、クラウドサービスのような所謂ネットワークサービスにより実現されてもよい。
情報処理端末103は、ユーザに各種情報を提示するための出力インタフェースや、ユーザから各種指示を受け付けるための入力インタフェースの役割を担う。例えば、情報処理端末103は、画像処理サーバ102から画像データに対する各種処理の結果を示す情報を取得し、当該情報をディスプレイ等の出力装置を介してユーザに提示してもよい。また、情報処理端末103は、所望の入力装置を介してユーザから各種指示を受け付け、当該指示を示す情報を画像処理サーバ102に送信してもよい。情報処理端末103は、例えば、パーソナルコンピュータ等のような汎用的な情報処理装置により実現され得る。
なお、図1に示す構成はあくまで一例であり、必ずしも本実施形態に係る画像処理システムのシステム構成を限定するものではない。例えば、複数の構成要素が1つの装置により実現されてもよい。具体的な一例として、画像形成装置101が画像処理サーバ102の役割を担ってもよい。また、画像処理サーバ102自体が、ユーザへの各種情報の提示や、ユーザからの各種指示の受け付けを行ってもよい。
<ハードウェア構成>
図2を参照して、本開示の一実施形態に係る画像処理サーバ102のハードウェア構成の一例について説明する。画像処理サーバ102は、制御部220と、通信部225と、記憶部228とを有する。また、画像処理サーバ102は、表示部226と、操作部227とを有していてもよい。
制御部220は、CPU(Central Processing Unit)221と、ROM(Read Only Memory)222と、RAM(Random Access Memory)223と、入出力インタフェース(I/O)224とを含む。
CPU221は、画像処理サーバ102全体の動作を制御する。具体的な一例として、CPU221は、ROM222や記憶部228に記憶されたプログラムを読み出して実行することで、画像処理サーバ102が有する各種機能の実現に係る処理の実行や当該機能の制御等を行う。ROM222は、制御プログラムや各種情報を記憶する記憶領域である。RAM223は、CPU221の主メモリやワークエリア等のような一時的な記憶領域として用いられる。
I/O224には、通信部225、表示部226、操作部227、及び記憶部228が接続されている。これらの構成要素は、I/O224を介してCPU221と相互に情報を送受信可能に接続される。
表示部226は、各種情報を画像として表示することで、当該情報をユーザに提示する出力装置である。表示部226は、例えば、液晶ディスプレイ(LCD:Liquid Crystal Display)や有機EL(Electro Luminescence)ディスプレイ等の表示装置により実現され得る。また、表示部226は、タッチパネルを一体的に有することで、後述する操作部227の役割を担ってもよい。
操作部227は、ユーザから各種指示を受け付ける入力装置である。操作部227は、例えば、マウス等のポインティングデバイスやキーボード等のような入力装置により実現され得る。
通信部225は、画像処理サーバ102を所定のネットワーク(例えば、図1に示すネットワーク105)に接続するための通信インタフェースである。なお、通信部225の構成については、画像処理サーバ102が接続されるネットワークの種別や適用される通信方式に応じて適宜変更されてもよい。
記憶部228は、各種プログラムや各種データを記憶する記憶領域である。記憶部228は、例えば、HDD(Hard Disk Drive)、SSD(Solid State Drive)、及びフラッシュメモリ等により実現され得る。また、図2に示す例では、記憶部228には、本実施形態に係る画像処理サーバ102の機能を実現するための情報処理プログラム229が記憶されている。なお、情報処理プログラム229については詳細を別途後述する。
<第1の実施形態>
本開示の第1の実施形態について以下に説明する。まず、図3を参照して、本実施形態に係る画像処理システムのソフトウェア構成の一例について、特に図2に示した情報処理プログラム229の構成に着目して説明する。情報処理プログラム229は、メイン処理部301と、リクエスト受付部302と、手書き文字推定処理部303と、結果表示部304と、領域選択処理部305と、処理種別選択処理部306とを含む。情報処理プログラム229は、RAM223に展開されたうえで、CPU221により実行される。
メイン処理部301は、情報処理プログラム229により提供される機能の実現に係る全体的な制御を行う。
リクエスト受付部302は、操作部227を介してユーザから指示を受け付け、当該指示が示す処理の実行をメイン処理部301に依頼する。
手書き文字推定処理部303は、対象となる画像に対して画像解析を施すことで、当該画像中における手書き文字の推定を行う。具体的な一例として、手書き文字推定処理部303は、画像中における手書き文字に対応する領域の推定を行い、当該領域に対して手書き文字であることを示す属性情報を対応付ける。
結果表示部304は、表示部226への各種情報の表示に係る制御を行う。例えば、結果表示部304は、対象となる画像と、手書き文字推定処理部303による当該画像を対象とした手書き文字に対応する領域の推定結果を示す情報とを、表示部226に表示させてもよい。
領域選択処理部305は、対象となる画像中の少なくとも一部の領域を処理対象として設定する。例えば、領域選択処理部305は、操作部227を介したユーザから画像中の領域の選択に係る指示を受けて、当該領域を処理対象として設定してもよい。
処理種別選択処理部306は、処理対象として設定された領域に対して適用される処理の処理種別を設定する。例えば、処理種別選択処理部306は、操作部227を介したユーザからの処理種別の選択に係る指示を受けて、対象となる領域に対して適用される処理の処理種別を設定してもよい。
なお、手書き文字推定処理部303、領域選択処理部305、及び処理種別選択処理部306については、詳細を別途後述する。
ここで、図11を参照して、情報処理プログラム229により実現される機能の一例について具体的な例を挙げて説明する。本実施形態に係る画像処理サーバ102は、画像形成装置101による文書(帳票等)の読み取り結果に応じた画像中における手書き文字の推定を行ったうえで、当該手書き文字の推定結果を提示するとともに、当該推定結果を修正可能とする機能を提供する。図11は、同機能の概要を説明するための図である。
図11に示す確認画面1100は、結果表示部304が、通信部225を介して画像形成装置101から取得された画像データが示す画像に対する、手書き文字推定処理部303による手書き文字の推定結果に基づきユーザに提示する画面である。確認画面1100は、例えば、画像処理サーバ102の表示部226や情報処理端末103等を介してユーザに提示される。また、結果表示部304は、確認画面1100の表示に際して、対象となる画像(以下、入力画像とも称する)を当該確認画面1100に表示させるとともに、手書き文字の領域に色を付けることで、当該領域を識別可能にユーザに提示してもよい。
確認画面1100は、画像表示領域1101と、ユーザからの操作を受け付けるための操作ボタン1102~1105とを有する。
画像表示領域1101は、対象となる入力画像が表示される領域である。なお、図11に示す例では、画像表示領域1101には、画像形成装置101による紙の領収書(帳票)の読み取り結果に応じた画像が表示されている。また、当該領収書は、「領収書」及び「様」の文字が活字で記入されており、「株式会社 電帳」の文字が手書き文字として記入されているものとする。また、画像表示領域1101は、ユーザからの指示等に応じて拡大縮小や表示範囲の変更が可能であってもよい。
操作ボタン1102~1105それぞれには個別に処理が割り当てられており、いずれかの操作ボタンが押下されると、操作部227が、当該操作ボタンに割り当てられた処理の実行をリクエスト受付部302に依頼する。各ボタンに割り当てられた処理の詳細については別途後述する。
図11(1)に示す確認画面1100の例では、画像表示領域1101に対して入力画像が表示され、当該入力画像に対して、手書き文字の推定結果を示す情報として、手書き文字と推定された領域を示す情報が重畳表示されている。この際に手書き文字と推定された領域に対して色が付けられることで、他の領域と識別可能となるように制御されている。具体的には、手書き文字推定処理部303により手書き文字と推定された「収書」と「株式会社 電帳」とが、他の文字と識別可能となるように色付けされた結果が、画像表示領域1101に表示されている。
手書き文字推定処理部303は、通信部225を介して取得された画像内に手書きされた文字(手書き文字)に対応する画素を認識する機能を有する。具体的な一例として、手書き文字推定処理部303は、画像内の文字パターンから特徴量を抽出して、認識辞書との比較により手書き文字を認識し、手書き文字か否かを画素ごとに保持してもよい。もちろん、同手法はあくまで一例であり、他の公知の手法を利用して画像中の手書き文字の認識が行われてもよい。結果表示部304は、通信部225を介して取得された画像と、記憶部228に保持される情報処理プログラム229の処理結果とを、表示部226に表示させる。
次いで、手書き文字の推定結果を修正する方法について説明する。ここでは、図11(1)において画像表示領域1101内の「収書」の文字は実際には活字であるが、手書き文字として推定されているため、ユーザからの指示に応じて修正が行われるものとする。図11(2)に示す確認画面1100の画像表示領域1111は、図11(1)に示す確認画面1100の画像表示領域1101の一態様に相当する。具体的には、画像表示領域1111は、手書き文字推定処理結果の修正が行われる場合における画像表示領域の一例を示している。
手書き文字推定処理結果の修正が行われる場合には、画像内における修正対象となる領域と、当該領域に適用する処理の処理種別との指定がなされる。修正対象となる領域の指定がなされる場合には、領域選択処理部305は、新規追加ボタン1102が押下された後に画像表示領域1111内における領域を示す軌跡1112の入力を受け付ける。すなわち、新規追加ボタン1102は、この画像表示領域1111内における領域を示す軌跡1112の入力の受け付けの開始の指示をユーザから受け付けるためのボタンである。また、軌跡1112は、操作部227を介して所謂一筆書きの要領で入力される。なお、領域を示す軌跡が複数入力された場合には、いずれかの軌跡が処理対象として認識されてもよい。具体的な一例として、入力された複数の軌跡のうち、最後に入力された軌跡が処理対象として認識されてもよい。
領域選択処理部305は、軌跡1112の入力を受けて、画像表示領域1111に表示されている画像中における当該軌跡1112に対応する領域1113を作成する。なお、同処理の詳細については別途後述する。
処理種別の指定には、手書き文字推定処理結果の修正に際して、手書き文字として推定された画素(以下、手書き推定画素とも称する)の修正量に応じて、手書きOFFボタン1103と手書きONボタン1105とが使用される。
手書きOFFボタン1103は、領域1113内にある手書き推定画素を手書き文字ではないと確定したうえで、領域1113外にある手書き推定画素を手書き文字として確定する旨の指示をユーザから受け付けるためのボタンである。
手書きONボタン1104は、領域1113内にある手書き推定画素を手書き文字として確定したうえで、領域1113外にある手書き推定画素を手書き文字でないと確定する旨の指示をユーザから受け付けるためのボタンである。
図11(2)に示す例では、領域1113中の文字が手書き文字として推定されているが、手書き文字としての推定対象から除外することとなる。このような場合には、手書きOFFボタン1103が押下されればよい。このように、手書き推定処理結果において活字が誤って手書き文字として推定された部分を修正する場合には、手書きOFFボタン1103が使用される。一方で、手書き推定処理結果のうち、一部分を手書き文字として指定するような場合には、手書きONボタン1104が使用される。
操作部227を介して入力された処理種別の指示は、リクエスト受付部302を介して処理種別選択処理部306に通知される。処理種別選択処理部306は、通知された指示に応じて対象となる領域1113に処理種別を設定し、当該設定の結果を記憶部228に保持する。なお、同処理については詳細を別途後述する。
図11(3)に示す確認画面1100の画像表示領域1121は、図11(1)に示す確認画面1100の画像表示領域1101の一態様に相当する。具体的には、画像表示領域1121は、画像中の領域と当該領域に適用する処理の処理種別との指定に基づき手書き文字の推定結果が修正された結果が表示される画像表示領域の一例を示している。結果表示部304は、手書き文字の推定結果が修正された結果が反映された画像表示領域1121を、表示部226を介して表示された確認画面1100に表示させる。
なお、追加で修正が行われる場合には、上記と同様に画像中の領域と当該領域に対して適用される処理の処理種別との指定がその都度行われる。
そのうえで、確定ボタン1105が押下されると、手書き文字の推定結果の修正に係る一連の処理が終了する。すなわち、確定ボタン1105は、確認画面1100を介した手書き文字の推定結果の修正に係る一連の処理の終了の指示をユーザから受け付けるためのボタンである。
リクエスト受付部302は、メイン処理部301を介して結果表示部304に対して、手書き文字の推定結果に対してなされた修正の結果の記録を依頼する。結果表示部304は、当該依頼を受けて、手書き文字の推定結果に対してなされた修正の結果を記憶部228に保持する。なお、同処理については詳細を別途後述する。
次いで、図4を参照して、本実施形態に係る画像処理サーバ102の処理の一例について、図11を参照して説明したように手書き文字の推定結果の修正がなされる場合の処理に着目して説明する。なお、図4に示す一連の処理と、別途図5~図10それぞれを参照して後述する処理とは、例えば、記憶部228に保持された情報処理プログラム229がRAM223に展開されたうえで、CPU221により実行されることで実現される。
S401において、メイン処理部301は、手書き文字推定処理部303に手書き文字推定処理を依頼する。なお、手書き文字推定処理部303による処理の詳細については、図5を参照して別途後述する。
S402において、メイン処理部301は、結果表示部304に対して表示部226に表示させる画像の作成を依頼する。なお、結果表示部304による処理の詳細については、図6を参照して別途後述する。
S403において、リクエスト受付部302は、操作部227が受け付けた指示が示す処理内容に対応する処理をメイン処理部301に依頼する。この際に、リクエスト受付部302は、発生したイベント、換言すると操作部227が受け付けた指示が示す処理内容に応じて、以降の処理を選択的に切り替える。
リクエスト受付部302は、S403において操作部227を介して図11に示す新規追加ボタン1102が押下された場合、すなわち入力画像への領域の追加が指示された場合には、処理をS404に進める。
一方で、リクエスト受付部302は、S403において操作部227を介して図11に示す手書きOFFボタン1103または手書きONボタン1104が押下された場合、すなわち領域に対する処理内容の指定が指示された場合には、処理をS405に進める。
また、リクエスト受付部302は、S403において操作部227を介して図11に示す確定ボタン1105が押下された場合、すなわち手書き文字の推定結果に対する修正の結果の確定が指示された場合には、処理をS406に進める。
S404において、メイン処理部301は、領域選択処理部305に修正対象とする領域の指定を受け付けるための領域選択処理を依頼する。なお、領域選択処理部305による処理の詳細については、図7及び図8を参照して別途後述する。
S405において、メイン処理部301は、処理種別選択処理部306に領域選択処理にて指定された領域に対して適用する処理の処理種別の指定を受け付けるための処理種別選択処理を依頼する。なお、処理種別選択処理部306による処理の詳細については、図9を参照して別途後述する。
S406において、メイン処理部301は、結果表示部304に対してS404及びS405の処理結果の出力表示を依頼し、図4に示す一連の処理を終了する。なお、結果表示部304による処理の詳細については、図10を参照して別途後述する。
次いで、図5を参照して、画像処理サーバ102の処理の一例について、図4においてS401として示した手書き文字推定処理に着目して説明する。
S501において、手書き文字推定処理部303は、通信部225を介して取得された入力画像を記憶部228に保持する。なお、処理対象となる入力画像は、予め記憶部228で保持されているものでもよい。入力画像の画素ごとの画素情報には、例えば、RGB等のカラー情報、画像内の位置を示す座標情報、手書き文字推定処理結果を示す手書き画素推定フラグ、処理種別選択の処理対象に含めるか否かを示す対象フラグ、及び手書き画素確定フラグ等が含まれる。手書き画素推定フラグは、初期値がFalseであり、TrueまたはFalseの値を持つ。対象フラグは、初期値がFalseであり、TrueまたはFalseの値を持つ。手書き画素確定フラグは、初期値がNoneであり、True、False、またはNoneの値を持つ。また、以降では、入力画像の全ての画素それぞれに対応する画素情報のリストを、画素情報リストとも称する。
S502において、手書き文字推定処理部303は、S501において取得された入力画像に対して手書き文字推定処理を行う。手書き文字推定処理は、画像内に存在する文字が手書きされた文字(手書き文字)か否かを推定する。なお、本実施形態では、手書き文字が含まれる複数のサンプル画像を教師データとして、手書き文字画素の特徴量を学習させた学習済モデルを用いて、画素ごとに手書き文字の領域の画素か否かを推定するものとする。一方で、手書き文字推定処理の実現方法については、上述した学習済モデルを利用した手法に限らず、他の公知の技術を適用することも可能である。
S503において、手書き文字推定処理部303は、S502の処理の結果を画素ごとの画素情報に手書き画素推定フラグとして設定したうえで、当該画素情報を含む画素情報リストを記憶部228に保持する。手書き画素推定フラグは、S502において手書き文字と推定された場合にTrueが設定され、手書き文字でないと推定された場合にはFalseが設定される。
次いで、図6を参照して、画像処理サーバ102の処理の一例について、図4においてS402として示した表示画像作成処理に着目して説明する。
S601において、結果表示部304は、記憶部228に保持された入力画像と画素情報リストとを取得する。
S602において、結果表示部304は、手書き文字と推定された画素を表示するためのレイヤー(以下、推定レイヤーとも称する)を作成する。レイヤーは、背景となる元画像と重ねて合成画像を作成することで、元画像を変更することなく処理後の画像を作成することが可能である。推定レイヤーは、手書き文字と推定された画素を識別可能に表示するために作成される。具体的には、結果表示部304は、画素情報リストのうち手書き画素推定フラグがTrueである画素情報に関して、任意の色を付けてレイヤーを作成し、当該レイヤーを記憶部228に保持する。
S603において、結果表示部304は、手書き文字の推定結果を修正した後の処理結果を表示するために確定レイヤーを作成する。確定レイヤーは、処理種別の指定により手書き文字と推定された画素に対する処理が確定された後の画素を、確定された処理に応じた態様で表示するために作成される。結果表示部304は、画素情報リストのうち手書き画素確定フラグがTrueである画素情報に関して、任意の色を付けてレイヤーを作成し、当該レイヤーを記憶部228に保持する。この際に、結果表示部304は、S602にて作成した推定レイヤーと区別するために、確定レイヤーに対して当該推定レイヤーに指定した色とは異なる色を指定してもよい。
S604において、結果表示部304は、入力画像を背景とし、推定レイヤー、確定レイヤーの順に重ねて合成した合成画像を記憶部228に保持する。
S605において、結果表示部304は、記憶部228に保持されている合成画像を表示部226に表示させたうえで、図6に示す一連の処理を終了する。
次いで、図7を参照して、画像処理サーバ102の処理の一例について、図4においてS404として示した領域選択処理に着目して説明する。
S701において、領域選択処理部305は、操作部227を介して指定された軌跡1112の情報を取得する。領域選択処理部305は、画像表示領域1111に表示された画像における軌跡1112の座標に対応する領域1113を作成し、当該領域1113を記憶部228に保持する。この際に、領域選択処理部305は、軌跡1112上に存在する2点が交わる交点がある場合には、軌跡に存在する1つ以上の単一閉曲線内を領域(単連結領域)とする。また、領域選択処理部305は、軌跡1112上に存在する2点が交わる交点がない場合には、始点と終点を最短距離で接続するように補完して、単一閉曲線内を生成し、当該単一閉曲線内に対応する領域を作成する。なお、本実施形態では軌跡1112から領域が作成される場合の一例について説明したが、ユーザからの指定に基づき画像中に領域を作成することが可能であれば、その方法は特に限定はされない。例えば、ユーザから直接領域の指定がなされることで、指定された当該領域が作成されてもよい。
S702において、領域選択処理部305は、S701にて作成された領域内の画素ごとに画素情報を参照して、当該画素に対して手書き文字としての推定がなされた(手書き画素推定フラグがTrue)か否かを判定する。
領域選択処理部305は、S702において領域内に手書き文字としての推定がなされた画素が存在すると判定した場合には、処理をS703に進める。
一方で、領域選択処理部305は、S702において領域内に手書き文字としての推定がなされた画素が存在しないと判定した場合には、図7に示す一連の処理を終了する。
S703において、領域選択処理部305は、処理対象とする画素を決定し、記憶部228に保持する。処理対象か否かについては、対象フラグにより管理される。対象フラグは、この後に実行されるS405の処理において、処理対象か否かを判断するために使用される情報であり、処理対象の場合にはTrueが設定され、処理対象でない場合にはFalseが設定される。なお、S703の処理については、図8を参照して詳細を別途後述する。
また、図7に示す一連の処理の終了時には、画素情報リストに含まれる画素情報には、少なくとも、カラー情報、座標情報、手書き画素推定フラグ(TrueまたはFalse)、及び対象フラグ(TrueまたはFalse)が保持されることとなる。
次いで、図8を参照して、画像処理サーバ102の処理の一例について、図7においてS703として示した処理対象画素の決定処理に着目して説明する。
S801において、領域選択処理部305は、S702において作成された領域1113内の画素であり、かつ手書き文字と推定された画素を処理対象(対象フラグをTrue)とし、当該画素の画素情報を記憶部228に保持する。
S802において、領域選択処理部305は、S801にて処理対象とされた画素(対象フラグがTrueの画素)と、領域1113の外側にある手書き文字と推定された画素とが、S701にて指定された軌跡1112を境に連続しているか否かを判定する。
領域選択処理部305は、S802において処理対象の画素と領域1113の外側にある手書き文字と推定された画素とが軌跡1112を境に連続していると判定した場合には、処理をS803に進める。
一方で、領域選択処理部305は、S802において処理対象の画素と領域1113の外側にある手書き文字と推定された画素とが軌跡1112を境に連続していないと判定した場合には、図8に示す一連の処理を終了する。
なお、対象となる複数の画素が連続しているか否かの判定については、例えば、連結生成のラベリング(connected component labeling)を用いることで実現可能である。もちろん、同手法はあくまで一例であり、複数の画素が連続しているか否かを判定することが可能であれば、同判定の方法は特に限定はされない。
S803において、領域選択処理部305は、S801にて処理対象(対象フラグがTrue)とされた画素と軌跡1112の外側に連続している手書き文字と推定された画素とを処理対象(対象フラグをTrue)として、画素情報リストに反映する。この際に、領域選択処理部305は、領域1113から連続している手書き文字と推定された画素については、全てを処理対象とする。これにより、領域選択処理において領域1113の選択がなされる際に、ユーザによって詳細に処理対象となる画素が指定されていない場合においても、当該ユーザの意図をくみ取った領域の選択が可能となる。そして、領域選択処理部305は、画素情報リストを記憶部228に保持したうえで、図8に示す一連の処理を終了する。
次いで、図9を参照して、画像処理サーバ102の処理の一例について、図4においてS405として示した処理種別選択処理に着目して説明する。
S901において、処理種別選択処理部306は、ユーザから指定された処理種別が手書きONか否か(換言すると、処理種別の指定に際して手書きONボタン1104が押下されたか否か)を判定する。
処理種別選択処理部306は、S901においてユーザから指定された処理種別が手書きONであると判定した場合には、処理をS902に進める。
一方で、処理種別選択処理部306は、S901においてユーザから指定された処理種別が手書きONでない(すなわち、手書きOFFである)と判定した場合には、処理をS902に進める。なお、処理種別の指定に際して手書きOFFボタン1103が押下された場合に、ユーザから指定された処理種別が手書きONでないと判定され得る。
S902において、処理種別選択処理部306は、画素情報リスト内において対象フラグがTrueの画素情報に対して、手書き画素確定フラグを”手書き”(手書き画素確定フラグをTrue)として記憶部228に保持する。手書き画素確定フラグは、処理種別の指定により確定された処理を表すフラグである。
S903において、処理種別選択処理部306は、画素情報リスト内において対象フラグがTrueの画素情報に対して、手書き画素確定フラグを”手書きでない”(手書き画素確定フラグをFalse)として記憶部228に保持する。
S904において、処理種別選択処理部306は、画素情報リスト内の手書き画素推定フラグを更新する。
手書き画素推定フラグは、手書き画素確定フラグにより処理が確定していない画素情報である。手書き画素推定フラグがTrueに設定された画素情報に対応する画素は、再度、S404として示した領域選択処理において処理対象として選択することが可能である。例えば、2回目以降に同一の処理種別が選択されてS404として示した領域選択処理が実行されることで、独立した複数の領域に対応する処理を適用することが可能である。また、処理確定時に処理種別が複数選択されて処理が終了された場合には、手書きONが指定された処理が優先される。
S406として示した手書き文字推定処理結果の修正が完了した際に、S901において処理種別として手書きONが指定された場合には、手書き画素確定フラグがTrueの画素情報に対応する画素に対して手書き処理の適用が確定される。この際に、手書き画素推定フラグがTrueの画素情報に対応する画素には、手書き処理が適用されない。また、S901において処理種別として手書きOFFが指定された場合には、手書き画素確定フラグがFalseの画素情報に対応する画素に対して手書き処理の不適用が確定される。この際に、手書き画素推定フラグがTrueの画素情報に対応する画素には、手書き処理が適用される。
具体的には、S902において手書き画素確定フラグがNoneからTrueに変更された画素情報は、手書き画素推定フラグがTrueからFalseに変更されたうえで、記憶部228に保持されることとなる。
また、S903において手書き画素確定フラグがNoneからFalseに変更された画素情報は、手書き画素推定フラグがTrueからFalseに変更されたうえで、記憶部228に保持されることとなる。
次いで、図10を参照して、画像処理サーバ102の処理の一例について、図4においてS406として示した結果表示処理に着目して説明する。図10に示す一連の処理では、手書き文字推定処理の結果としてユーザに提示される画像が作成される。
S1001において、結果表示部304は、記憶部228に保持された入力画像と画素情報とを取得する。
S1002において、結果表示部304は、画素情報リスト内において手書き画素確定フラグが”手書き”(手書き画素確定フラグがTrue)となる画素情報が存在するか否かを判定する。そのうえで、結果表示部304は、当該判定の結果に応じて、手書き文字推定処理の修正結果が示された画像を作成するために、ユーザに手書き処理を実行する画素を提示するための出力レイヤーを作成する。
画素情報リスト内において手書き画素確定フラグが”手書き”となる画素情報が存在する場合には、その画素情報は、手書きONボタン1104によって領域1113内にある手書き文字推定された画素が”手書き”として確定された画素情報となる。そのため、手書き文字推定処理の修正結果としてユーザに提示する必要がある手書き文字画素領域は、修正の結果手書き文字の画素となった、手書き画素確定フラグがTrueの画素情報に対応する画素の領域となる。
画素情報リスト内で手書き画素確定フラグが”手書き”となる画素情報が存在しない場合は、手書き画素確定フラグが”手書きでない”(手書き画素確定フラグがFalse)の場合、または初期値のまま(手書き画素確定フラグがNone)の場合に該当する。
手書き画素確定フラグが”手書きでない”の場合には、画像内の手書き文字と推定された画素のうち、手書きOFFボタン1103によって領域1113内にある手書き文字と推定された画素が”手書きでない”として確定される。また、それ以外の手書き文字推定された画素については、”手書き”として処理される画素となる。そのため、手書き文字推定処理の修正結果としてユーザに提示する必要がある手書き文字画素領域は、ユーザが手書き領域のままとした領域、すなわち、手書き画素推定フラグがTrueの画素情報に対応する画素の領域となる。
手書き画素確定フラグが初期値のままの場合には、画像内の手書き文字と推定された画素がユーザによる修正の対象とならなかった場合に該当する。この場合においても、手書き文字推定処理の修正結果としてユーザに提示する必要がある手書き文字画素領域は、ユーザが手書き領域のままとした領域、すなわち、手書き画素推定フラグがTrueの画素情報に対応する画素の領域となる。
結果表示部304は、S1002において手書き画素確定フラグがTrueとなる画素情報が存在すると判定した場合には、処理をS1003に進める。
一方で、結果表示部304は、S1002において手書き画素確定フラグがTrueとなる画素情報が存在しないと判定した場合には、処理をS1004に進める。
S1003において、結果表示部304は、確定された手書き文字の画素から出力レイヤーを作成する。出力レイヤーは、画素情報リストのうち手書き画素確定フラグがTrueである画素情報に対応する画素に対して、任意の色を付けることで作成される。作成された出力レイヤーは、記憶部228に保持される。
一方で、S1004においては、結果表示部304は、推定された手書き文字の画素から出力レイヤーを作成する。出力レイヤーは、画素情報リストのうち手書き画素推定フラグがTrueである画素情報に対応する画素に対して、任意の色を付けることで作成される。作成された出力レイヤーは、記憶部228に保持する。
S1005において、結果表示部304は、入力画像と各レイヤーとを合成することで合成画像を生成し、当該合成画像を記憶部228に保持したうえで、図10に示す一連の処理を終了する。
以上のような制御により、手書き推定処理により手書き文字と推定された一連の画素のうち一部の画素の推定結果に誤りが生じている状況下においても、画像中の領域選択及び処理種別の指定といった簡便な操作により、当該誤りを修正することが可能となる。また、手書き推定処理により手書き文字と推定された一連の画素のうち、一部の画素を手書き文字とする場合においても、画像中の領域選択及び処理種別の指定といった簡便な操作により、当該一部の画素を手書き文字の画素として指定することが可能となる。このように、本実施形態に係る画像処理システムに依れば、画像中の任意の領域の選択と、当該領域に対する処理の処理種別の指定とにより、画素単位で属性(例えば、手書き文字の画素か否かを示す属性)を容易に修正することが可能となる。
<第2の実施形態>
本開示の第2の実施形態について以下に説明する。本実施形態では、領域選択処理においてユーザが画像中の領域を指定する際の当該ユーザの負担をより低減する仕組みの一例について説明する。なお、本実施形態では、主に前述した第1の実施形態と異なる部分に着目して構成や処理の説明を行い、第1の実施形態と実質的に同様の部分については詳細な説明は省略するものとする。
まず、図14を参照して、本実施形態に係る確認画面の一例について説明する。具体的には、図14は、一度の操作で手書き文字の推定結果の修正対象とする領域全体を指定し切れなかった状況を模式的に示している。図4においてS404として示した領域選択処理において、画像表示領域1401に対してユーザにより指定された軌跡1402に基づき領域1403が作成される。このとき、軌跡1402により規定される範囲には、「領収書」の文字列に含まれる「収」の文字の旁に相当する部分(「又」として示される部分)と、「書」の文字とが含まれている。
第1の実施形態における図7に示すS703の処理の場合には、領域選択処理部305は、軌跡1402を境に手書き文字と推定された画素が連続しているか否かを判定し、対象フラグを画素情報に付与する。そのため、図14に示す例の場合には、領収書のうち、収の旁に相当する部分(「又」として示される部分)と、「書」の文字との1.5文字が処理対象となる。そのため、このような状況下では、正しく「収」の文字を選択するために、再度の領域の指定が必要となる場合がある。
このような状況を鑑み、本実施形態では、領域選択処理において、文字単位で処理対象に含まれるように領域を設定する仕組みの一例について説明する。具体的な一例として、「収」の文字は偏と旁との間で画素が連続していないが、偏と旁との間の距離は、「収」の文字の最外側の画素と隣接する「書」の文字の最外側の画素との間の距離よりも短い。このように、一文字を形成している画素間の距離は、隣接する文字間の間隔よりも短い場合が多いため、画素が連続していない場合においても、距離が閾値以内の画素を処理対象とすることで、文字単位で処理対象が指定されるように制御することが可能となる。なお、同閾値については、例えば、互いに隣接する文字間の距離よりも値が小さくなるように設定されればよい。
ここで、図12を参照して、画像処理サーバ102の処理の一例として、図7においてS703として示した処理対象画素の決定処理の他の一例について説明する。なお、S801~S803の処理は、図8に示すS801~S803の処理と実質的に同様であるため、詳細な説明は省略する。
S1201において、領域選択処理部305は、S801及びS803において処理対象(対象フラグがTrue)である画素ごとに、手書き文字と推定された(手書き文字推定フラグがTrue)画素が任意の距離(上記閾値)以内にあるか否かを判定する。なお、当該判定に際して参照される任意の距離については、ユーザにより予め設定されてもよいし、対象フラグがTrueとなる連続する画素の外接矩形の長辺と短辺とを用いて算出されてもよい。
領域選択処理部305は、S1201において手書き文字と推定された画素が任意の距離以内にあると判定した場合には、処理をS1202に進める。
一方で、領域選択処理部305は、S1201において手書き文字と推定された画素が任意の距離以内にないと判定した場合には、図12に示す一連の処理を終了する。
S1202において、領域選択処理部305は、S1201にて任意の距離以内にある手書き文字と推定された画素の画素情報に対して対象フラグとしてTrueを付与し、当該画素情報を記憶部228に保持する。
S1203において、領域選択処理部305は、S1202にて対象フラグとしてTrueが付与された画素と連続する、手書き文字と推定された他の画素(以下、連続画素とも称する)があるか否かを判定する。
領域選択処理部305は、S1203において連続画素があると判定した場合には、処理をS1204に進める。
一方で、領域選択処理部305は、S1203において連続画素がないと判定した場合には、図12に示す一連の処理を終了する。
S1204において、領域選択処理部305は、S1203にて特定した連続画素の画素情報に対して対象フラグとしてTrueを付与し、当該画素情報を記憶部228に保持したうえで、図12に示す一連の処理を終了する。
以上のような制御が適用されることで、領域選択処理において文字単位で処理対象に含まれるように領域を設定することが可能となるため、ユーザが画像中の領域を指定する際の当該ユーザの負担をより低減する効果が期待できる。
<第3の実施形態>
本開示の第3の実施形態について以下に説明する。本実施形態では、領域選択処理において領域の指定が行われた状況下においても、当該領域中において処理対象外とする部分的な領域を指定可能とする仕組みの一例について説明する。なお、本実施形態では、主に前述した第1の実施形態や第2の実施形態と異なる部分に着目して構成や処理の説明を行い、第1の実施形態や第2の実施形態と実質的に同様の部分については詳細な説明は省略するものとする。
図15は、本実施形態に係る確認画面を利用した処理対象とする領域の指定方法の一例について説明するための図であり、画像中の処理対象とする領域の指定が行われた後に、処理対象外とする部分的な領域の指定を受け付ける一連の操作の流れの一例を示している。確認画面1500は、処理対象外とする領域の指定を受け付けるための対象外指定ボタン1502と対象外領域繰り返し処理指示部1503とを有する。
図15(1)に示す確認画面1500は、第1の実施形態において図11を参照して説明した確認画面1100に相当する。図15(1)に示した例では、画像表示領域1501に表示された画像中に、「利用日」、「令和2年3月4日」、「令和2年5月12日」、「令和2年5月20日」といった日付に関連する文字列が表示されている。また、これらの文字列のうち、「利用日」、「年」、「月」、及び「日」は活字で記されており、「令和」及び各数字については手書き文字として記入されている。また、図15(1)に示した例では、図4においてS401として示した手書き文字推定処理により、「令和2年3」、「4」、「令和2」、「5月12」、及び「令和2年5月20」として記された各文字列が手書き文字として認識されている。
このような状況下において、第1の実施形態では、手書き文字の推定結果を修正するためには、図4においてS404及びS405の処理として説明した領域選択や処理種別の指定の操作を複数回行う必要があった。
このような状況を鑑み、本実施形態では、処理対象とする領域の選択に加えて、処理対象外とする部分的な領域の選択を可能とすることで、より複雑な領域の指定をより簡便な操作により実現可能とすることで、操作性の向上を図っている。
図15(2)は、前述した第1の実施形態と同様に処理対象とする領域の指定が行われる状況を模式的に示している。確認画面1510は、図15(1)に示す確認画面1500の一態様に相当する。領域選択処理部305は、新規追加ボタン1102が押下されると、操作部227を介してユーザから軌跡1512の入力を受け付け、画像表示領域1501に表示された画像における軌跡1512の座標に対応する領域1513を作成する。
図15(3)は、領域1513内において処理対象外とする部分的な領域の指定が行われる状況を模式的に示している。確認画面1520は、図15(1)に示す確認画面1500の一態様に相当する。領域選択処理部305は、対象外指定ボタン1502が押下されると、操作部227を介してユーザから軌跡1522の入力を受け付け、画像表示領域1521に表示された画像における軌跡1522の座標に対応する対象外領域1523を作成する。また、領域選択処理部305は、対象外領域繰り返し処理指示部1503が操作された場合には、対象外領域について繰り返し処理の適用が指定されたものと認識する。この場合には、領域選択処理部305は、領域1513内において対象外領域1523を対象としてテンプレートマッチングを行い、類似度が閾値以上の領域(例えば、領域1524及び1525)についても対象外領域として設定する。
図15(4)は、領域選択処理の処理結果が表示された状況を模式的に示している。確認画面1530は、図15(1)に示す確認画面1500の一態様に相当する。また、画像表示領域1531に表示された領域1532は、処理種別の指定対象となる領域である。なお、領域1532は、図15(2)にて指定された領域1513から、図15(3)にて指定された対象外領域1523、1524、及び1525に対応する部分を除外した領域に相当する。
なお、図15(4)に例示した状態から、さらに処理対象外とする領域を追加することも可能である。この場合には、領域選択処理部305は、対象外指定ボタン1502が改めて押下されたことを受けて、対象外領域を指定するための軌跡の入力を受け付ければよい。
次いで、図13を参照して、本実施形態に係る画像処理サーバ102の処理の一例について、図4においてS404として示した領域選択処理に着目して説明する。なお、S701、S702、及びS703の処理については、図7に示すS701、S702、及びS703の処理と実質的に同様のため詳細な説明は省略する。
S1301において、領域選択処理部305は、操作部227を介した対象外指定ボタン1502の操作による対象外領域の指定が指示されたか否かを判定する。
領域選択処理部305は、S1301において対象外領域の指定が指示されたと判定した場合には、処理をS1302に進める。
一方で、領域選択処理部305は、S1301において対象外領域の指定が指示されていないと判定した場合には、処理をS702に進める。
S1302において、領域選択処理部305は、操作部227を介して指定された軌跡1522の情報を取得する。領域選択処理部305は、画像表示領域1501に表示された画像における軌跡1522座標に対応する対象外領域1523を作成し、当該対象外領域1523を記憶部228に保持する。
S1303において、領域選択処理部305は、操作部227を介した対象外領域繰り返し処理指示部1503の操作による対象外領域の指定に係る繰り返し処理が指示されたか否かを判定する。
領域選択処理部305は、S1303において対象外領域の指定に係る繰り返し処理が指示されたと判定した場合には、処理をS1304に進める。
一方で、領域選択処理部305は、S1303において対象外領域の指定に係る繰り返し処理が指示されていないと判定した場合には、処理をS1306に進める。
S1304において、領域選択処理部305は、記憶部228に保持された対象外領域1523の画素分布を取得する。
S1305において、領域選択処理部305は、領域1513内を対象としてS1304にて取得した領域(対象外領域1523)とテンプレートマッチングを行い、類似度が閾値以上の領域を対象外領域に追加し、一連の対象外領域を記憶部228に保持する。なお、領域間の類似度の判定方法については特に限定はされない。例えば、二値化画像のヒストグラム形状を利用することで、領域間の類似度の判定が行われてもよい。また、他の一例として、座標ごとの画素の相関関係により、領域間の類似度の判定が行われてもよい。
S1306において、領域選択処理部305は、S701に指定された領域から、S1302やS1305にて指定された対象外領域に相当する部分を除外した領域を記憶部228に保持する。
なお、以降の処理については、図7に示す例と同様である。
以上のように、本実施形態に係る画像処理システムに依れば、処理対象として設定された領域内に対象外領域を指定することで、処理対象とする領域を細かく指定することが可能となる。
<その他の実施形態>
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
また、本実施形態の開示は、以下の構成、方法、及びプログラムを含む。
(構成1)対象となる画像中における手書き文字を推定する推定手段と、前記画像中における領域の指定を受け付ける第1の受付手段と、前記推定手段による手書き文字の推定結果に基づき、指定された前記領域中の手書き文字に対応する画素と、当該画素との距離が閾値以下となる前記領域外の手書き文字に対応する画素と、を対象画素として特定する特定手段と、前記対象画素に対して手書き文字か否かの指示を受け付ける第2の受付手段と、前記第2の受付手段が受け付けた指示に応じて、前記対象画素に対する前記推定手段による推定結果を修正する修正手段と、を有することを特徴とする、情報処理装置。
(構成2)前記修正手段は、前記第2の受付手段が前記対象画素に対して手書き文字でないことを示す指示を受け付けた場合に、当該対象画素に対する前記推定手段による推定結果を、手書き文字に対応する画素から活字に対応する画素に修正することを特徴とする、構成1に記載の情報処理装置。
(構成3)前記特定手段は、少なくとも、指定された前記領域中の手書き文字に対応する画素と、当該画素に隣接する前記領域外の手書き文字に対応する画素と、を前記対象画素として特定することを特徴とする、構成1または2に記載の情報処理装置。
(構成4)前記特定手段は、指定された前記領域中の手書き文字に対応する画素と隣接していない前記領域外の手書き文字に対応する画素であったとしても、指定された前記領域中の手書き文字に対応する画素との距離が前記閾値以下の場合には、前記対象画素として特定することを特徴とする、構成3に記載の情報処理装置。
(構成5)前記第1の受付手段は、指定された前記領域中において、処理対象から除外する対象外領域の指定を受け付け、前記特定手段は、前記領域から前記対象外領域が除外された領域を対象として前記対象画素を特定することを特徴とする、構成1乃至4のいずれか1項に記載の情報処理装置。
(方法1)情報処理装置の制御方法であって、対象となる画像中における手書き文字を推定する推定ステップと、前記画像中における領域の指定を受け付ける第1の受付ステップと、前記推定手段による手書き文字の推定結果に基づき、指定された前記領域中の手書き文字に対応する画素と、当該画素との距離が閾値以下となる前記領域外の手書き文字に対応する画素と、を対象画素として特定する特定ステップと、前記対象画素に対して手書き文字か否かの指示を受け付ける第2の受付ステップと、前記第2の受付ステップにおいて受け付けられた指示に応じて、前記対象画素に対する前記推定ステップにおける推定結果を修正する修正ステップと、を含むことを特徴とする、情報処理装置の制御方法。
(プログラム1)コンピュータを、対象となる画像中における手書き文字を推定する推定手段と、前記画像中における領域の指定を受け付ける第1の受付手段と、前記推定手段による手書き文字の推定結果に基づき、指定された前記領域中の手書き文字に対応する画素と、当該画素との距離が閾値以下となる前記領域外の手書き文字に対応する画素と、を対象画素として特定する特定手段と、前記対象画素に対して手書き文字か否かの指示を受け付ける第2の受付手段と、前記第2の受付手段が受け付けた指示に応じて、前記対象画素に対する前記推定手段による推定結果を修正する修正手段と、を有することを特徴とする情報処理装置として機能させるためのプログラム。
102 画像処理サーバ
303 文字推定処理部
304 結果表示部
305 領域選択処理部
306 処理種別選択処理部

Claims (7)

  1. 対象となる画像中における手書き文字を推定する推定手段と、
    前記画像中における領域の指定を受け付ける第1の受付手段と、
    前記推定手段による手書き文字の推定結果に基づき、指定された前記領域中の手書き文字に対応する画素と、当該画素との距離が閾値以下となる前記領域外の手書き文字に対応する画素と、を対象画素として特定する特定手段と、
    前記対象画素に対して手書き文字か否かの指示を受け付ける第2の受付手段と、
    前記第2の受付手段が受け付けた指示に応じて、前記対象画素に対する前記推定手段による推定結果を修正する修正手段と、
    を有することを特徴とする、情報処理装置。
  2. 前記修正手段は、前記第2の受付手段が前記対象画素に対して手書き文字でないことを示す指示を受け付けた場合に、当該対象画素に対する前記推定手段による推定結果を、手書き文字に対応する画素から活字に対応する画素に修正することを特徴とする、請求項1に記載の情報処理装置。
  3. 前記特定手段は、少なくとも、指定された前記領域中の手書き文字に対応する画素と、当該画素に隣接する前記領域外の手書き文字に対応する画素と、を前記対象画素として特定することを特徴とする、請求項1に記載の情報処理装置。
  4. 前記特定手段は、指定された前記領域中の手書き文字に対応する画素と隣接していない前記領域外の手書き文字に対応する画素であったとしても、指定された前記領域中の手書き文字に対応する画素との距離が前記閾値以下の場合には、前記対象画素として特定することを特徴とする、請求項3に記載の情報処理装置。
  5. 前記第1の受付手段は、指定された前記領域中において、処理対象から除外する対象外領域の指定を受け付け、
    前記特定手段は、前記領域から前記対象外領域が除外された領域を対象として前記対象画素を特定する
    ことを特徴とする、請求項1に記載の情報処理装置。
  6. 情報処理装置の制御方法であって、
    対象となる画像中における手書き文字を推定する推定ステップと、
    前記画像中における領域の指定を受け付ける第1の受付ステップと、
    前記推定ステップにおける手書き文字の推定結果に基づき、指定された前記領域中の手書き文字に対応する画素と、当該画素との距離が閾値以下となる前記領域外の手書き文字に対応する画素と、を対象画素として特定する特定ステップと、
    前記対象画素に対して手書き文字か否かの指示を受け付ける第2の受付ステップと、
    前記第2の受付ステップにおいて受け付けられた指示に応じて、前記対象画素に対する前記推定ステップにおける推定結果を修正する修正ステップと、
    を含むことを特徴とする、情報処理装置の制御方法。
  7. コンピュータを、
    対象となる画像中における手書き文字を推定する推定手段と、
    前記画像中における領域の指定を受け付ける第1の受付手段と、
    前記推定手段による手書き文字の推定結果に基づき、指定された前記領域中の手書き文字に対応する画素と、当該画素との距離が閾値以下となる前記領域外の手書き文字に対応する画素と、を対象画素として特定する特定手段と、
    前記対象画素に対して手書き文字か否かの指示を受け付ける第2の受付手段と、
    前記第2の受付手段が受け付けた指示に応じて、前記対象画素に対する前記推定手段による推定結果を修正する修正手段と、
    を有することを特徴とする情報処理装置として機能させるためのプログラム。
JP2022176058A 2022-11-02 2022-11-02 情報処理装置、情報処理装置の制御方法、及びプログラム Pending JP2024066597A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2022176058A JP2024066597A (ja) 2022-11-02 2022-11-02 情報処理装置、情報処理装置の制御方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2022176058A JP2024066597A (ja) 2022-11-02 2022-11-02 情報処理装置、情報処理装置の制御方法、及びプログラム

Publications (1)

Publication Number Publication Date
JP2024066597A true JP2024066597A (ja) 2024-05-16

Family

ID=91067536

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022176058A Pending JP2024066597A (ja) 2022-11-02 2022-11-02 情報処理装置、情報処理装置の制御方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP2024066597A (ja)

Similar Documents

Publication Publication Date Title
JP4742132B2 (ja) 入力装置、画像処理プログラムおよびコンピュータ読み取り可能な記録媒体
US10437466B2 (en) Formula inputting method and apparatus
US20160124926A1 (en) Advanced methods and systems for text input error correction
CN107133615B (zh) 信息处理设备和信息处理方法
JPH11110480A (ja) テキストの表示方法およびその装置
JP2007279828A (ja) 帳票処理装置、帳票様式作成装置、帳票、帳票処理用のプログラム、帳票様式作成用のプログラム
US11836442B2 (en) Information processing apparatus, method, and storage medium for associating metadata with image data
CN111724336B (zh) 图像处理装置、图像处理方法及图像处理系统
US11348331B2 (en) Information processing apparatus and non-transitory computer readable medium
JP3292752B2 (ja) ジェスチャー処理装置およびジェスチャー処理方法
US11200450B2 (en) Information processing apparatus and non-transitory computer readable medium for selecting a proper version of a recognition dictionary that is not necessarily a latest version
JP2009151449A (ja) アンドゥー機能付き電子黒板
US11100318B2 (en) Information processing apparatus and non-transitory computer readable medium
WO2020090356A1 (ja) インクデータ生成装置、方法及びプログラム
JP2024066597A (ja) 情報処理装置、情報処理装置の制御方法、及びプログラム
JP6302317B2 (ja) 帳票フォーマット情報登録方法及びシステム並びにプログラム
US11588945B2 (en) Data input support apparatus that displays a window with an item value display area, an overview image display area, and an enlarged image display area
JP2020087112A (ja) 帳票処理装置および帳票処理方法
US11693825B2 (en) Information processing apparatus, control method, and recording medium storing program
US6456739B1 (en) Apparatus for recognizing characters and a method therefor
JP4441966B2 (ja) 手書き文字入力装置及びそれを実現するためのプログラムを記録した記録媒体
JP2013182459A (ja) 情報処理装置、情報処理方法及びプログラム
JP7324305B2 (ja) 電子帳票作成装置、電子帳票作成方法、及びプログラム
JP6244676B2 (ja) 操作支援プログラム及び操作支援方法並びに情報処理装置
US20220311894A1 (en) Information processing apparatus, non-transitory computer readable medium storing program, and information processing method