JP2020088736A - Information processing device, image rotation method of information processing device, and program - Google Patents
Information processing device, image rotation method of information processing device, and program Download PDFInfo
- Publication number
- JP2020088736A JP2020088736A JP2018223801A JP2018223801A JP2020088736A JP 2020088736 A JP2020088736 A JP 2020088736A JP 2018223801 A JP2018223801 A JP 2018223801A JP 2018223801 A JP2018223801 A JP 2018223801A JP 2020088736 A JP2020088736 A JP 2020088736A
- Authority
- JP
- Japan
- Prior art keywords
- image
- orientation
- read image
- character recognition
- read
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Character Input (AREA)
- Image Input (AREA)
- Facsimiles In General (AREA)
- Facsimile Scanning Arrangements (AREA)
- Editing Of Facsimile Originals (AREA)
Abstract
Description
本発明は、原稿から読み取られた読取り画像を回転させる情報処理装置、情報処理装置の画像回転方法、およびプログラムに関するものである。 The present invention relates to an information processing device that rotates a read image read from a document, an image rotation method of the information processing device, and a program.
従来、特許文献1が開示するように、原稿から読み取られた読取り画像に対する文字認識処理を行うことで、読取り画像の向きを特定し、特定された読取り画像の向きに基づいて、読取り画像を回転させる画像読取装置が知られている。 Conventionally, as disclosed in Patent Document 1, by performing character recognition processing on a read image read from a document, the direction of the read image is specified, and the read image is rotated based on the specified direction of the read image. There is known an image reading device.
しかしながら、従来の原稿読取装置により、原稿の両面を読み取り、原稿の第1面の第1読取り画像の向きに基づき第1読取り画像を回転させ、原稿の第2面の第2読取り画像の向きに基づき第1読取り画像を回転させた場合、回転後の第1読取り画像の向きと回転後の第2読取り画像の向きとが違ってしまうことがあった。例えば、第1読取り画像および第2読取り画像の一方については、文字認識処理により正しく向きが特定されたが、第1読取り画像および第2読取り画像の他方については、文字認識処理により誤って向きが特定された場合または第2読取り画像の向きを特定できなかった場合に、回転後の第1読取り画像の向きと回転後の第2読取り画像の向きとを揃えることができなかった。 However, both sides of the original are read by the conventional original reading device, the first read image is rotated based on the direction of the first read image on the first side of the original, and the orientation of the second read image on the second side of the original is changed. When the first read image is rotated on the basis of the rotation, the direction of the first read image after rotation may be different from the direction of the second read image after rotation. For example, for one of the first read image and the second read image, the orientation was correctly specified by the character recognition processing, but for the other of the first read image and the second read image, the orientation was erroneously identified by the character recognition processing. If specified or if the orientation of the second read image could not be identified, the orientation of the first read image after rotation and the orientation of the second read image after rotation could not be aligned.
本発明の情報処理装置は、原稿の第1面を読み取った第1読取り画像と、原稿の第1面とは反対側の第2面を読み取った第2読取り画像と、を取得する取得部と、情報処理部と、を備え、情報処理部は、第1読取り画像に対する文字認識処理により特定された第1読取り画像の向きである第1文字認識画像向き、および第2読取り画像に対する文字認識処理により特定された第2読取り画像の向きである第2文字認識画像向きのうち、いずれかの文字認識画像向きを選択し、情報処理部は、選択した文字認識画像向きに基づいて、第1読取り画像と第2読取り画像とを回転させる。 An information processing apparatus according to the present invention includes an acquisition unit that acquires a first read image obtained by reading a first side of a document and a second read image obtained by reading a second side of the document opposite to the first side. And an information processing section, wherein the information processing section has a first character recognition image orientation that is the orientation of the first read image identified by the character recognition processing for the first read image, and a character recognition processing for the second read image. From the second character recognition image orientation that is the orientation of the second read image specified by, one of the character recognition image orientations is selected, and the information processing unit performs the first reading based on the selected character recognition image orientation. The image and the second read image are rotated.
本発明の情報処理装置の画像回転方法は、原稿の第1面から読み取られた第1読取り画像と、原稿の第1面とは反対側の第2面から読み取られた第2読取り画像と、を取得し、第1読取り画像に対する文字認識処理により特定された第1読取り画像の向きである第1文字認識画像向き、および第2読取り画像に対する文字認識処理により特定された第2読取り画像の向きである第2文字認識画像向きのうち、いずれかの文字認識画像向きを選択し、選択した文字認識画像向きに基づいて、第1読取り画像と第2読取り画像とを回転させる。 An image rotation method of an information processing apparatus according to the present invention includes a first read image read from a first surface of a document and a second read image read from a second surface of the document opposite to the first surface. Of the first read image, which is the direction of the first read image specified by the character recognition process for the first read image, and the direction of the second read image specified by the character recognition process for the second read image. Of the second character recognition image orientations, any one of the character recognition image orientations is selected, and the first read image and the second read image are rotated based on the selected character recognition image orientation.
本発明のプログラムは、コンピューターに、原稿の第1面から読み取られた第1読取り画像と、原稿の第1面とは反対側の第2面から読み取られた第2読取り画像と、を取得するステップと、第1読取り画像に対する文字認識処理により特定された第1読取り画像の向きである第1文字認識画像向き、および第2読取り画像に対する文字認識処理により特定された第2読取り画像の向きである第2文字認識画像向きのうち、いずれかの文字認識画像向きを選択するステップと、選択した文字認識画像向きに基づいて、第1読取り画像と第2読取り画像とを回転させるステップと、を実行させる。 A program of the present invention causes a computer to acquire a first read image read from a first side of a document and a second read image read from a second side opposite to the first side of the document. A first character recognition image orientation that is the orientation of the first read image identified by the character recognition processing for the first read image, and a second read image orientation identified by the character recognition processing for the second read image. A step of selecting any one of the character recognition image orientations from a certain second character recognition image orientation, and a step of rotating the first read image and the second read image based on the selected character recognition image orientation. Let it run.
以下、情報処理装置、情報処理装置の画像回転方法およびプログラムの一実施形態について説明する。なお、画像そのもの、および画像を表示するための画像データは、特に区別せずに、画像と称される。 An embodiment of an information processing device, an image rotation method of the information processing device, and a program will be described below. The image itself and the image data for displaying the image are referred to as an image without any particular distinction.
図1に基づいて、読取りシステムSyについて説明する。読取りシステムSyは、読取り装置1と、情報処理装置101とを備えている。読取り装置1と情報処理装置101とは、通信可能に接続されている。
The reading system Sy will be described with reference to FIG. The reading system Sy includes a reading device 1 and an
読取り装置1は、ADF3(Auto Document Feeder)と、第1読取り部5と、第2読取り部7とを備えている。
The reading device 1 includes an ADF 3 (Auto Document Feeder), a
ADF3は、セット部9にセットされた原稿201を搬送する。ADF3は、セット部9と、供給ローラー11と、複数の搬送ローラー対13と、搬送モーター15と、排出部17とを備えている。セット部9には、原稿201がセットされる。なお、本実施形態では、セット部9にセットされた原稿201の両面のうち、斜め下方を向いた面、すなわちセット部9と向かい合った面、を第1面203といい、斜め上方を向いた面、すなわちセット部9とは反対側を向いた面、を第2面205という。供給ローラー11は、セット部9にセットされた原稿201を、搬送モーター15を駆動源として、排出部17に向けて搬送する。搬送ローラー対13は、供給ローラー11により搬送された原稿201を、搬送モーター15を駆動源として、排出部17に向けてさらに搬送する。排出部17には、搬送ローラー対13により搬送された原稿201が排出される。
The ADF 3 conveys the original 201 set on the setting unit 9. The ADF 3 includes a setting unit 9, a
第1読取り部5は、搬送される原稿201の第1面203と向かい合うように設けられており、原稿201の第1面203を読み取る。第1読取り部5は、図示省略したが、光源と、イメージセンサーとを備えている。第2読取り部7は、搬送される原稿201の第2面205と向かい合うように設けられており、原稿201の第2面205を読み取る。第2読取り部7は、図示省略したが、第1読取り部5と同様に、光源と、イメージセンサーとを備えている。
The
読取り装置1は、第1読取り部5および第2読取り部7を備えたことで、原稿201がセット部9から排出部17まで搬送される間に、原稿201の第1面203と第2面205とを読み取ることができる。第1読取り部5により第1面203から読み取られた第1読取り画像207(図9等参照)と、第2読取り部7により第2面205から読み取られた第2読取り画像209(図9等参照)とは、情報処理装置101に送信される。なお、読取り装置1は、単一の読取り部を備え、ADF3により原稿201を表裏反転させることにより、原稿201の第1面203と第2面205とを読み取る構成でもよい。
Since the reading device 1 includes the
情報処理装置101は、読取り装置1を制御し、読取り装置1から送信された第1読取り画像207および第2読取り画像209を受信する。なお、情報処理装置101としては、例えば、パソコン、スマートフォン、タブレット端末などを用いることができる。
The
図2に基づいて、読取り装置1および情報処理装置101について説明する。読取り装置1は、上記したADF3、第1読取り部5および第2読取り部7のほか、読取り側CPU19(Central Processing Unit)と、読取り側ROM21(Read Only Memory)と、読取り側RAM23(Random Access Memory)と、読取り側操作部25と、読取り側表示部27と、読取り側通信部29とを備えている。
The reading device 1 and the
読取り側CPU19は、読取り側ROM21に記憶されたプログラムを、読取り側RAM23を用いて実行することにより、読取り装置1全体を統括的に制御する。読取り側操作部25は、ユーザーからの操作を受け付ける。読取り側操作部25としては、例えば、操作キーを用いることができる。読取り側表示部27は、ユーザーに対して各種情報を表示する。読取り側表示部27としては、例えば、液晶ディスプレーを用いることができる。なお、タッチパネル式ディスプレーを、読取り側操作部25および読取り側表示部27として機能させてもよい。読取り側通信部29は、後述する処理側通信部115との間で、各種コマンドのほか、第1読取り画像207および第2読取り画像209を送受信する。
The reading-
情報処理装置101は、処理側CPU103と、処理側ROM105と、処理側RAM107と、外部記憶装置109と、処理側操作部111と、処理側表示部113と、処理側通信部115とを備えている。なお、処理側CPU103は、「取得部」および「情報処理部」の一例である。取得部および情報処理部としては、1つに限られず、複数のCPUによって構成するようにしてもよいし、処理側CPU103に代えて、或いは処理側CPU103と協働させて、ASICなどの処理回路を用いた構成としてもよい。また、処理側CPU103は、「コンピューター」の一例である。コンピューターについても、上記と同様に、複数のCPUによって構成してもよいし、処理側CPU103に代えて、或いは処理側CPU103と協働させて、ASICなどの処理回路を用いた構成としてもよい。
The
処理側CPU103は、処理側ROM105または外部記憶装置109に記憶されたプログラムを、処理側RAM107を用いて実行することにより、情報処理装置101全体を統括的に制御する。外部記憶装置109は、各種プログラム、例えば、読取り装置1を制御するための制御プログラムであるスキャナードライバー、を記憶する。また、外部記憶装置109は、バッファーとして機能する処理側RAM107を介して、読取り装置1から送信された第1読取り画像207および第2読取り画像209を記憶する。外部記憶装置109としては、例えば、HDD(Hard Disk Drive)、SSD(Solid State Drive)を用いることができる。
The processing-
処理側操作部111は、ユーザーからの操作を受け付ける。処理側操作部111としては、例えば、キーボード、マウスなどを用いることができる。処理側表示部113は、読取り装置1を操作するための操作画面、読取り装置1から送信された第1読取り画像207および第2読取り画像209、などの各種情報を表示する。処理側表示部113としては、例えば、液晶ディスプレーを用いることができる。なお、タッチパネル式ディスプレーを、処理側操作部111および処理側表示部113として機能させてもよい。処理側通信部115は、読取り側通信部29との間で、各種コマンドのほか、第1読取り画像207および第2読取り画像209を送受信する。
The processing
図3ないし図8に基づいて、セット部9にセットされた第1原稿201a、第2原稿201bおよび第3原稿201cについて説明する。第1原稿201a、第2原稿201bおよび第3原稿201cは、いずれも、縦長且つ長辺綴じ原稿である。すなわち、各原稿201の第1面203における上辺211と、第2面205における上辺211とは、同じ辺である。セット部9には、通常、各原稿201の上辺211がADF3による搬送方向31の先方となるように、原稿201がセットされるが、本実施形態では、各原稿201の上辺211が搬送方向31の後方となるように、原稿201がセットされたものとする。
The first original 201a, the second original 201b, and the third original 201c set in the setting unit 9 will be described with reference to FIGS. The first original 201a, the second original 201b, and the third original 201c are all vertically long and long-edge bound originals. That is, the
図3は、第1原稿201aの第1面203を示し、図4は、第1原稿201aの第2面205を示す。第1原稿201aの第1面203には、複数の文字213が正立した向きで印刷されている。同様に、第1原稿201aの第2面205には、複数の文字213が正立した向きで印刷されている。
3 shows the
図5は、第2原稿201bの第1面203を示し、図6は、第2原稿201bの第2面205を示す。第2原稿201bの第1面203には、複数の文字213が正立した向きで印刷されている。一方、第2原稿201bの第2面205には、例えば「人物」を表すイラスト215が、正立した向きで印刷されている。すなわち、第2原稿201bの第2面205には、文字213が印刷されていない。
5 shows the
図7は、第3原稿201cの第1面203を示し、図8は、第3原稿201cの第2面205を示す。第3原稿201cの第1面203には、イラスト215が正立した向きで印刷されている。同様に、第3原稿201cの第2面205には、イラスト215が正立した向きで印刷されている。すなわち、第3原稿201cの第1面203および第2面205には、文字213が印刷されていない。
7 shows the
図9は、第1原稿201aが読み取られた後、情報処理装置101が後述する個別回転処理および連動回転処理を実行しない場合に、処理側表示部113に表示された第1読取り画像207および第2読取り画像209を示す。図10は、第2原稿201bが読み取られた後、情報処理装置101が個別回転処理および連動回転処理を実行しない場合に、処理側表示部113に表示された第1読取り画像207および第2読取り画像209を示す。図11は、第3原稿201cが読み取られた後、情報処理装置101が個別回転処理および連動回転処理を実行しない場合に、処理側表示部113に表示された第1読取り画像207および第2読取り画像209を示す。
FIG. 9 shows the
セット部9には、上述したように、各原稿201の上辺211が搬送方向31の後方となるように、原稿201がセットされる。そのため、第1原稿201a、第2原稿201bおよび第3原稿201cのいずれについても、第1読取り画像207および第2読取り画像209が、正立した向きから180°回転した向きとなっている。
As described above, the
このように、第1読取り画像207或いは第2読取り画像209が正立した向きから回転していると、第1読取り画像207や第2読取り画像209に含まれる文字213やイラスト215等がユーザーにとって見づらいものとなる。そこで、情報処理装置101は、第1読取り画像207の向きおよび第2読取り画像209の向きを、自動的に補正するようにしている。情報処理装置101には、第1読取り画像207の向きおよび第2読取り画像209の向きを補正するために、個別回転処理と連動回転処理とが用意されている。なお、個別回転処理と連動回転処理とは、処理側表示部113に表示される操作画面において、ユーザーが選択可能となっている。
In this way, when the
図12に基づいて、個別回転処理について説明する。個別回転処理は、処理側CPU103がスキャナードライバーを実行することで、実現される。なお、個別回転処理は、ハードウェアのみで実現されてもよい。
The individual rotation process will be described with reference to FIG. The individual rotation processing is realized by the
ステップS01において、処理側CPU103は、読取り装置1から送信された第1読取り画像207および第2読取り画像209を取得する。
In step S01, the
ステップS02において、処理側CPU103は、第1読取り画像207に対して、文字認識処理を行うことで、第1読取り画像207の向きを特定する。すなわち、処理側CPU103は、第1読取り画像207に含まれる文字213を検出し、検出された個々の文字213を、例えば、0°、90°、180°および270°の反時計回りの回転角度で回転させ、予め登録された辞書とのマッチングを行う。処理側CPU103は、0°、90°、180°および270°のなかから、最も正しく文字認識できた回転角度を、その文字213の向きとして特定し、その回転角度を示す変数に投票する。処理側CPU103は、検出されたすべての文字213に対して投票を行った結果から、最も投票数の多い回転角度を、第1読取り画像207の向きと特定する。
In step S02, the
ステップS03において、処理側CPU103は、第2読取り画像209に対して、文字認識処理を行うことで、第2読取り画像209の向きを特定する。その具体的な手法は、ステップS02と同様である。
In step S03, the
ステップS04において、処理側CPU103は、ステップS02において文字認識処理により特定された第1読取り画像207の向きである第1文字認識画像向きに基づいて、第1読取り画像207を回転させる。ここで、第1文字認識画像向きに基づいて第1読取り画像207を回転させるとは、第1文字認識画像向きをθ1°としたときに、第1読取り画像207を時計回りにθ1°或いは反時計回りに(360−θ1)°回転させることを意味する。例えば、情報処理装置101は、第1文字認識画像向きが90°である場合には、第1読取り画像207を時計回りに90°或いは反時計回りに270°回転させる。これにより、第1読取り画像207の向きが0°となるように、すなわち第1読取り画像207に含まれる文字213が正立した向きとなるように、第1読取り画像207の向きを補正することができる。
In step S04, the
ステップS05において、処理側CPU103は、ステップS03において文字認識処理により特定された第2読取り画像209の向きである第2文字認識画像向きに基づいて、第2読取り画像209を回転させる。ここで、第2文字認識画像向きに基づいて第2読取り画像209を回転させるとは、第1読取り画像207の場合と同様に、第2文字認識画像向きをθ2°としたときに、第2読取り画像209を時計回りにθ2°或いは反時計回りに(360−θ2)°回転させることを意味する。なお、第1読取り画像207の回転方向と、第2読取り画像209の回転方向とは、同じでもよく、反対でもよい。
In step S05, the
ステップS06において、処理側CPU103は、回転後の第1読取り画像207と、回転後の第2読取り画像209とを、処理側表示部113に表示させ、個別回転処理を終了する。
In step S06, the
ここで、より具体的に、ステップS01において、処理側CPU103が、第1原稿201aから読み取られた第1読取り画像207および第2読取り画像209を取得した場合と、第2原稿201bから読み取られた第1読取り画像207および第2読取り画像209を取得した場合と、第3原稿201cから読み取られた第1読取り画像207および第2読取り画像209を取得した場合とについて、説明する。
Here, more specifically, in step S01, the
ステップS01において、処理側CPU103が、第1原稿201aから読み取られた第1読取り画像207および第2読取り画像209(図9参照)を取得した場合には、ステップS02において、処理側CPU103は、文字認識処理により第1読取り画像207の向きを180°と特定する。同様に、ステップS03において、処理側CPU103は、文字認識処理により第2読取り画像209の向きを180°と特定する。
In step S01, when the
ステップS04において、処理側CPU103は、文字認識処理により特定された第1読取り画像207の向きである第1文字認識画像向きが180°であるため、第1読取り画像207を、時計回りに180°或いは反時計回りに180°回転させる。これにより、第1読取り画像207の向きが0°に補正される。
In step S04, the
ステップS05において、処理側CPU103は、文字認識処理により特定された第2読取り画像209の向きである第2文字認識画像向きが180°であるため、第2読取り画像209を、時計回りに180°或いは反時計回りに180°回転させる。これにより、第2読取り画像209の向きが0°に補正される。
In step S05, the
ステップS06において、処理側CPU103は、図13に示したように、回転後の第1読取り画像207、すなわち画像の向きが0°に補正された第1読取り画像207と、回転後の第2読取り画像209、すなわち画像の向きが0°に補正された第2読取り画像209と、を処理側表示部113に表示させる。
In step S06, the
このように、処理側CPU103が個別回転処理を行うことで、第1読取り画像207および第2読取り画像209のいずれについても、文字認識処理により正しく向きが特定された場合には、回転後の第1読取り画像207の向きと回転後の第2読取り画像209の向きとを、所望の向き、すなわち0°に揃えることができる。
In this way, when the processing-
ステップS01において、処理側CPU103が、第2原稿201bから読み取られた第1読取り画像207および第2読取り画像209(図10参照)を取得した場合には、ステップS02において、処理側CPU103は、第1読取り画像207の向きを180°と特定する。
When the processing-
ステップS03において、処理側CPU103は、上述したように、第2原稿201bの第2面205には、文字213ではなく、イラスト215が印刷されていることから、文字認識処理によって第2読取り画像209の向きを正確に特定することができない。ここでは、第2読取り画像209の向きは本来180°であるが、処理側CPU103は、第2読取り画像209の向きを誤って0°と特定したものとする。
In step S03, as described above, the processing-
ステップS04において、処理側CPU103は、文字認識処理により特定された第1読取り画像207の向きである第1文字認識画像向きが180°であるため、第1読取り画像207を、時計回りに180°或いは反時計回りに180°回転させる。これにより、第1読取り画像207の向きが0°に補正される。
In step S04, the
ステップS05において、処理側CPU103は、文字認識処理により特定された第2読取り画像209の向きである第2文字認識画像向きが0°であるため、第2読取り画像209を、時計回りに0°或いは反時計回りに360°回転させる。すなわち、処理側CPU103は、第2読取り画像209を実質的に回転させない。このため、第2読取り画像209の向きは、180°のままとなる。
In step S05, the
ステップS06において、処理側CPU103は、図14に示したように、回転後の第1読取り画像207、すなわち画像の向きが0°に補正された第1読取り画像207と、回転させなかった第2読取り画像209、すなわち画像の向きが180°のままの第2読取り画像209と、を処理側表示部113に表示させる。
In step S06, the
このように、第1読取り画像207および第2読取り画像209の一方については、文字認識処理により正しく向きが特定されたが、第1読取り画像207および第2読取り画像209の他方については、文字認識処理により誤って向きが特定された場合には、処理側CPU103が個別回転処理を行っても、回転後の第1読取り画像207の向きと回転後の第2読取り画像209の向きとを揃えることができない。
As described above, the direction of one of the
ステップS01において、処理側CPU103が、第3原稿201cから読み取られた第1読取り画像207および第2読取り画像209(図11参照)を取得した場合、ステップS02において、処理側CPU103は、上述したように、第3原稿201cの第1面203には、文字213ではなく、イラスト215が印刷されていることから、文字認識処理によって第1読取り画像207の向きを正確に特定することができない。ここでは、第1読取り画像207の向きは本来180°であるが、処理側CPU103は、第1読取り画像207の向きを誤って90°と特定したものとする。
When the
ステップS03において、処理側CPU103は、第3原稿201cの第2面205には、文字213ではなく、イラスト215が印刷されていることから、文字認識処理によって第2読取り画像209の向きを正確に特定することができない。ここでは、第2読取り画像209の向きは本来180°であるが、処理側CPU103は、第2読取り画像209の向きを誤って0°と特定したものとする。
In step S03, since the
ステップS04において、処理側CPU103は、文字認識処理により特定された第1読取り画像207の向きである第1文字認識画像向きが90°であるため、第1読取り画像207を、時計回りに90°或いは反時計回りに270°回転させる。このため、第1読取り画像207の向きは、90°となる。
In step S04, the processing-
ステップS05において、処理側CPU103は、文字認識処理により特定された第2読取り画像209の向きである第2文字認識画像向きが0°であるため、第2読取り画像209を、時計回りに0°或いは反時計回りに360°回転させる。すなわち、処理側CPU103は、第2読取り画像209を実質的に回転させない。このため、第2読取り画像209の向きは、180°のままとなる。
In step S05, the
ステップS06において、処理側CPU103は、図15に示したように、回転後の第1読取り画像207、すなわち画像の向きが90°となった第1読取り画像207と、回転させなかった第2読取り画像209、すなわち画像の向きが180°のままの第2読取り画像209と、を処理側表示部113に表示させる。
In step S06, the processing-
このように、第1読取り画像207および第2読取り画像209のいずれもが、文字認識処理により誤って向きが特定された場合には、処理側CPU103が個別回転処理を行っても、回転後の第1読取り画像207の向きと回転後の第2読取り画像209の向きとを揃えることができない。
As described above, when the orientations of both the
そこで、情報処理装置101は、第1読取り画像207および第2読取り画像209の少なくとも一方について、文字認識処理により誤って向きが特定された場合にも、回転後の第1読取り画像207の向きと回転後の第2読取り画像209の向きとを揃えることができる連動回転処理を備えている。
Therefore, the
図16に基づいて、連動回転処理について説明する。この連動回転処理は、「画像回転方法」の一例である。連動回転処理は、個別回転処理と同様に、処理側CPU103がスキャナードライバーを実行することで、実現される。なお、連動回転処理は、ハードウェアのみで実現されてもよい。
The interlocked rotation process will be described with reference to FIG. This interlocked rotation process is an example of an “image rotation method”. The interlocked rotation process is realized by the
ステップS11において、処理側CPU103は、読取り装置1から送信された第1読取り画像207および第2読取り画像209を取得する。
In step S11, the
ステップS12において、処理側CPU103は、ステップS02と同様に、第1読取り画像207に対して、文字認識処理を行うことで、第1読取り画像207の向きを特定する。さらに、処理側CPU103は、特定された第1読取り画像207の向きに対する信頼度である第1画像向き信頼度を算出する。すなわち、処理側CPU103は、第1読取り画像207に含まれる個々の文字213について、ステップS02と同様に、最も正しく文字認識できた回転角度を示す変数に投票する。さらに、処理側CPU103は、回転角度ごとに文字認識処理の信頼度を保存し、最も得票数の多い回転角度に対応する信頼度の平均値を、第1画像向き信頼度とする。
In step S12, the
ステップS13において、処理側CPU103は、第2読取り画像209に対して、文字認識処理を行うことで、第2読取り画像209の向きを特定する。さらに、処理側CPU103は、特定された第2読取り画像209の向きに対する信頼度である第2画像向き信頼度を算出する。その具体的な手法は、ステップS12と同様である。
In step S13, the
ステップS14において、処理側CPU103は、第1画像向き信頼度および第2画像向き信頼度がいずれも閾値よりも小さいか否かを判断する。閾値は、文字認識処理によって第1読取り画像207の向きや第2読取り画像209の向きを正確に特定することができないときに得られる信頼度よりも大きな値となるように、設定される。なお、閾値は、例えば、スキャナードライバーに予め設定されたものでもよく、処理側操作部111が受け付けたユーザーの選択操作に基づいて設定されたものでもよい。処理側CPU103は、第1画像向き信頼度および第2画像向き信頼度の少なくとも一方が閾値以上である、と判断した場合(S14;No)、ステップS15に進む。
In step S14, the
ステップS15において、処理側CPU103は、第1画像向き信頼度が、第2画像向き信頼度以上であるか否かを判断する。処理側CPU103は、第1画像向き信頼度が、第2画像向き信頼度以上であると判断した場合(S15;Yes)、ステップS16に進む。
In step S15, the
ステップS16において、処理側CPU103は、特定された第1読取り画像207の向きである第1文字認識画像向きに基づいて、第1読取り画像207および第2読取り画像209を回転させる。ここで、第1文字認識画像向きに基づいて第1読取り画像207および第2読取り画像209を回転させるとは、第1文字認識画像向きをθ1°としたときに、第1読取り画像207を時計回りにθ1°或いは反時計回りに(360−θ1)°回転させ、また、第2読取り画像209を時計回りにθ1°或いは反時計回りに(360−θ1)°回転させることを意味する。これにより、回転後の第1読取り画像207の向きと回転後の第2読取り画像209の向きとを揃えることができる。なお、第1読取り画像207の回転方向と、第2読取り画像209の回転方向とは、同じでもよく、反対でもよい。
In step S16, the
一方、ステップS15において、処理側CPU103は、第1画像向き信頼度が、第2画像向き信頼度よりも小さいと判断した場合(S15;No)、ステップS17に進む。
On the other hand, in step S15, when the
ステップS17において、処理側CPU103は、特定された第2読取り画像209の向きである第2文字認識画像向きに基づいて、第1読取り画像207および第2読取り画像209を回転させる。ここで、第2文字認識画像向きに基づいて第1読取り画像207および第2読取り画像209を回転させるとは、第2文字認識画像向きをθ2°としたときに、第1読取り画像207を時計回りにθ2°或いは反時計回りに(360−θ2)°回転させ、また、第2読取り画像209を時計回りにθ2°或いは反時計回りに(360−θ2)°回転させることを意味する。これにより、回転後の第1読取り画像207の向きと回転後の第2読取り画像209の向きとを揃えることができる。なお、第1読取り画像207の回転方向と、第2読取り画像209の回転方向とは、同じでもよく、反対でもよい。
In step S17, the
一方、ステップS14において、処理側CPU103は、第1画像向き信頼度および第2画像向き信頼度がいずれも閾値よりも小さい、と判断した場合(S14;Yes)、ステップS18に進む。
On the other hand, in step S14, when the processing-
ステップS18において、処理側CPU103は、文字認識処理以外の画像解析処理により、第1読取り画像207の向きを特定する。文字認識処理以外の画像解析処理により、第1読取り画像207の向きを特定する方法としては、例えば、第1読取り画像207に含まれる「人物」の特徴部位の位置関係に基づいて画像の向きを特定する方法、第1読取り画像207に含まれる「空」および「地上」の位置関係に基づいて画像の向きを特定する方法、などを用いることができる。
In step S18, the
ステップS19において、処理側CPU103は、文字認識処理以外の画像解析処理により、第2読取り画像209の向きを特定する。その具体的な手法は、ステップS18と同様である。
In step S19, the
ステップS20において、処理側CPU103は、文字認識処理以外の画像解析処理により特定された第1読取り画像207の向きである第1非文字認識画像向きに基づいて、第1読取り画像207を回転させる。ここで、第1非文字認識画像向きに基づいて第1読取り画像207を回転させるとは、第1非文字認識画像向きをα1°としたときに、第1読取り画像207を時計回りにα1°或いは反時計回りに(360−α1)°回転させることを意味する。これにより、第1読取り画像207の向きが0°となるように、すなわち第1読取り画像207に含まれるイラスト215等が正立した向きとなるように、第1読取り画像207の向きを補正することができる。
In step S20, the
ステップS21において、処理側CPU103は、文字認識処理以外の画像解析処理により特定された第2読取り画像209の向きである第2非文字認識画像向きに基づいて、第2読取り画像209を回転させる。ここで、第2非文字認識画像向きに基づいて第2読取り画像209を回転させるとは、第2非文字認識画像向きをα2°としたときに、第2読取り画像209を時計回りにα2°或いは反時計回りに(360−α2)°回転させることを意味する。これにより、第2読取り画像209の向きが0°となるように、すなわち第2読取り画像209に含まれるイラスト215等が正立した向きとなるように、第2読取り画像209の向きを補正することができる。なお、第1読取り画像207の回転方向と、第2読取り画像209の回転方向とは、同じでもよく、反対でもよい。
In step S21, the
ステップS22において、処理側CPU103は、回転後の第1読取り画像207と、回転後の第2読取り画像209とを、処理側表示部113に表示させ、連動回転処理を終了する。
In step S22, the
ここで、より具体的に、ステップS11において、処理側CPU103が、第2原稿201bから読み取られた第1読取り画像207および第2読取り画像209を取得した場合と、第3原稿201cから読み取られた第1読取り画像207および第2読取り画像209を取得した場合とについて、説明する。
Here, more specifically, in step S11, the
ステップS11において、処理側CPU103が、第2原稿201bから読み取られた第1読取り画像207および第2読取り画像209(図10参照)を取得した場合には、ステップS12において、処理側CPU103は、文字認識処理により第1読取り画像207の向きを180°と特定し、第1画像向き信頼度を、R1と算出する。
When the processing-
ステップS13において、処理側CPU103は、上述したように、第2原稿201bの第2面205には、文字213ではなく、イラスト215が印刷されていることから、文字認識処理によって第2読取り画像209の向きを正確に特定することができない。ここでは、第2読取り画像209の向きは本来180°であるが、処理側CPU103は、第2読取り画像209の向きを誤って0°と特定し、第2画像向き信頼度を、R2と算出したものとする。第2読取り画像209には、文字認識可能な文字213が含まれないため、第2画像向き信頼度(R2)は、第1画像向き信頼度(R1)より小さくなる。また、第1画像向き信頼度(R1)は、閾値よりも大きいが、第2画像向き信頼度(R2)は、閾値よりも小さい値である。
In step S13, as described above, the processing-
ステップS14において、処理側CPU103は、第1画像向き信頼度(R1)および第2画像向き信頼度(R2)のうち、第1画像向き信頼度が閾値以上であると判断し(S14;No)、ステップS15に進む。
In step S14, the
ステップS15において、処理側CPU103は、第1画像向き信頼度(R1)が、第2画像向き信頼度(R2)以上であると判断し(S15;Yes)、ステップS16に進む。
In step S15, the
ステップS16において、処理側CPU103は、文字認識処理により特定された第1読取り画像207の向きである第1文字認識画像向きが180°であるため、第1読取り画像207を、時計回りに180°或いは反時計回りに180°回転させ、第2読取り画像209を、時計回りに180°或いは反時計回りに180°回転させる。
In step S16, the
ステップS22において、処理側CPU103は、図17に示したように、回転後の第1読取り画像207、すなわち画像の向きが0°に補正された第1読取り画像207と、回転後の第2読取り画像209、すなわち画像の向きが0°に補正された第2読取り画像209と、を処理側表示部113に表示させる。
In step S22, the processing-
このように、処理側CPU103が連動回転処理を行うことで、第1読取り画像207および第2読取り画像209の一方については、文字認識処理により正しく向きが特定されたが、第1読取り画像207および第2読取り画像209の他方については、文字認識処理により誤って向きが特定された場合にも、回転後の第1読取り画像207の向きと回転後の第2読取り画像209の向きとを、所望の向きに揃えることができる。なお、第2原稿201bの第2面205のように、イラスト215のみが印刷された場合に限らず、文字213が印刷されているが、文字認識可能な文字213が少ない場合にも、本構成は有用である。
In this way, the processing-
ステップS11において、処理側CPU103が、第3原稿201cから読み取られた第1読取り画像207および第2読取り画像209(図11参照)を取得した場合には、ステップS12において、処理側CPU103は、上述したように、第3原稿201cの第1面203には、文字213ではなく、イラスト215が印刷されていることから、文字認識処理によって第1読取り画像207の向きを正確に特定することができない。ここでは、第1読取り画像207の向きは本来180°であるが、処理側CPU103は、第1読取り画像207の向きを誤って90°と特定し、第1画像向き信頼度を、R3と算出したものとする。
When the processing-
ステップS13において、処理側CPU103は、第3原稿201cの第2面205には、文字213ではなく、イラスト215が印刷されていることから、文字認識処理によって第2読取り画像209の向きを正確に特定することができない。ここでは、第2読取り画像209の向きは本来180°であるが、処理側CPU103は、第2読取り画像209の向きを誤って0°と特定し、第2画像向き信頼度を、R4と算出したものとする。第1画像向き信頼度(R3)および第2画像向き信頼度(R4)は、いずれも閾値以下の値である。
In step S13, the processing-
ステップS14において、処理側CPU103は、第1画像向き信頼度(R3)および第2画像向き信頼度(R4)がいずれも閾値以下であると判断し(S14;Yes)、ステップS18に進む。 In step S14, the processing side CPU103 is first image direction reliability (R 3) and a second image orientation reliability (R 4) is determined to either the threshold value or less (S14; Yes), the process proceeds to step S18 ..
ステップS18において、処理側CPU103は、文字認識処理以外の画像解析処理により、第1読取り画像207の向きを180°と特定する。同様に、ステップS19において、処理側CPU103は、文字認識処理以外の画像解析処理により、第2読取り画像209の向きを180°と特定する。
In step S18, the
ステップS20において、処理側CPU103は、文字認識処理以外の画像解析処理により特定された第1読取り画像207の向きである第1非文字認識画像向きが180°であるため、第1読取り画像207を、時計回りに180°或いは反時計回りに180°回転させる。これにより、第1読取り画像207の向きが0°に補正される。
In step S20, the
ステップS21において、処理側CPU103は、文字認識処理以外の画像解析処理により特定された第2読取り画像209の向きである第2非文字認識画像向きが180°であるため、第2読取り画像209を、時計回りに180°或いは反時計回りに180°回転させる。これにより、第2読取り画像209の向きが0°に補正される。
In step S21, the
ステップS22において、処理側CPU103は、図18に示したように、回転後の第1読取り画像207、すなわち画像の向きが0°に補正された第1読取り画像207と、回転後の第2読取り画像209、すなわち画像の向きが0°に補正された第2読取り画像209と、を処理側表示部113に表示させる。
In step S22, the
このように、処理側CPU103が連動回転処理を行うことで、第1読取り画像207および第2読取り画像209のいずれについても、文字認識処理により誤って向きが特定された場合にも、回転後の第1読取り画像207の向きと回転後の第2読取り画像209の向きとを、所望の向きに揃えることができる。なお、第3原稿201cの第1面203或いは第2面205のように、イラスト215のみが印刷された場合に限らず、文字213が印刷されているが、文字認識可能な文字213が少ない場合にも、本構成は有用である。
As described above, the processing-
続いて、個別回転処理や連動回転処理において行われる文字認識処理の変形例について説明する。図19に示すように、原稿201のヘッダー領域217およびフッター領域219には、通常、日付、ファイル名、頁番号等の文字213が含まれ、イラスト215等が含まれることが少ない。一方、原稿201のヘッダー領域217でなくフッター領域219でもない領域には、ヘッダー領域217およびフッター領域219に比べ、イラスト215等が含まれることが多い。そのため、ヘッダー領域217でなくフッター領域219でもない領域に含まれるイラスト215等を、文字認識処理により誤って文字213と認識してしまい、その結果、第1読取り画像207の向きを誤って特定するおそれがある。
Next, a modified example of the character recognition process performed in the individual rotation process or the interlocked rotation process will be described. As shown in FIG. 19, the
そこで、処理側CPU103は、原稿201の第1面203のうち、ヘッダー領域217およびフッター領域219が含まれる第1端部領域221のみに対して文字認識処理を行い、第1端部領域221に含まれる文字213について特定された向きである第1端部文字向きに基づいて、第1読取り画像207の向きを特定してもよい。処理側CPU103は、原稿201の上辺211から第1寸法の範囲にある領域と、原稿201の下辺223から第2寸法の範囲にある領域とを、第1端部領域221とする。なお、第1寸法および第2寸法は、例えば、スキャナードライバーに予め設定されたものでもよく、処理側操作部111が受け付けたユーザーの選択操作に基づいて設定されたものでもよい。また、第1端部領域221には、ヘッダー領域217およびフッター領域219の少なくとも一方が含まれればよい。このように、第1端部領域221のみに対して文字認識を行うことで、ヘッダー領域217でなくフッター領域219でもない領域に含まれるイラスト215等を、文字認識により誤って文字213と認識することを回避することができる。このため、ヘッダー領域217でなくフッター領域219でもない領域にイラスト215等が含まれる場合にも、第1読取り画像207の向きを精度良く特定することができる。
Therefore, the
また、さらなる変形例として、処理側CPU103は、以下のように文字認識処理を行ってもよい。まず、処理側CPU103は、第1端部領域221に対する文字認識処理を行うことで、第1端部領域221に含まれる文字213の向きを特定する。また、処理側CPU103は、第1面203のうちヘッダー領域217でなくフッター領域219でもない領域である第1非端部領域225に対する文字認識処理を行うことで、第1非端部領域225に含まれる文字213の向きを特定する。続いて、処理側CPU103は、第1非端部領域225に含まれる文字213について特定された向きである第1非端部文字向きよりも、第1端部領域221に含まれる文字213について特定された向きである第1端部文字向きに、大きい重みを付けることにより、第1読取り画像207の向きを特定する。すなわち、処理側CPU103は、上述したように、特定された文字213の向きに対して投票を行う際に、第1非端部文字向きよりも第1端部文字向きに大きい重みを付ける。これにより、第1端部領域221に含まれるイラスト215を、文字認識により誤って文字213と認識した場合にも、その影響を低減することができる。このため、第1非端部領域225にイラスト215等が含まれる場合にも、第1読取り画像207の向きを精度良く特定することができる。
Further, as a further modification, the
なお、これらの変形例は、第2面205から読み取られた第2読取り画像209についても、同様に適用可能である。すなわち、処理側CPU103は、原稿201の第2面205のうち、ヘッダー領域217およびフッター領域219の少なくとも一方が含まれる第2端部領域(図示省略)のみに対して文字認識処理を行い、第2端部領域に含まれる文字213について特定された向きである第2端部文字向きに基づいて、第2読取り画像209の向きを特定してもよい。また、処理側CPU103は、第2面205のうちヘッダー領域217でなくフッター領域219でもない領域である第2非端部領域に含まれる文字213について特定された向きである第2非端部文字向きよりも、第2端部領域に含まれる文字213について特定された向きである第2端部文字向きに、大きい重みを付けることにより、第2読取り画像209の向きを特定してもよい。
Note that these modified examples can be similarly applied to the
処理側CPU103は、第1文字認識画像向きおよび第2文字認識画像向きのいずれかを選択する方法として、上記の実施形態とは逆に、信頼度が小さい方を選択してもよい。すなわち、処理側CPU103は、第1画像向き信頼度が第2画像向き信頼度よりも大きいと判断したときに、第2文字認識画像向きを選択し、第1画像向き信頼度が第2画像向き信頼度よりも小さいと判断したときに、第1文字認識画像向きを選択してもよい。また、処理側CPU103は、処理側操作部111が受け付けたユーザーの選択操作に基づいて、第1文字認識画像向きおよび第2文字認識画像向きのいずれかを選択してもよい。
As a method of selecting either the first character recognition image orientation or the second character recognition image orientation, the
処理側CPU103は、第1画像向き信頼度および第2画像向き信頼度がいずれも閾値よりも小さい場合に、文字認識処理以外の画像解析処理により特定された第1読取り画像207の向きに対する信頼度と、文字認識処理以外の画像解析処理により特定された第2読取り画像209の向きに対する信頼度と、を比較し、信頼度が大きい方の画像の向きに基づいて、第1読取り画像207と第2読取り画像209とを回転させてもよい。
When the first image orientation reliability and the second image orientation reliability are both smaller than the threshold value, the
処理側CPU103は、回転後の第1読取り画像207および回転後の第2読取り画像209を、処理側表示部113に表示させる構成に限定されず、例えば、読取り側表示部27に表示させてもよく、情報処理装置101と通信可能に接続された他の装置に出力してもよい。
The processing-
セット部9に複数の原稿201がセットされ、複数の原稿201が連続して読み取られた場合には、1枚目の原稿201について得られた第1文字認識画像向きおよび第2文字認識画像向きのうち、選択された画像向きを、2枚目以降の原稿201に適用してもよい。例えば、1枚目の原稿201について得られた第1文字認識画像向き(270°)および第2文字認識画像向き(90°)のうち、第1文字認識画像向き(270°)が選択されたとする。この場合、1枚目の原稿201から読み取られた第1読取り画像207および第2読取り画像209を、1枚目の原稿201について選択された第1文字認識画像向き(270°)に基づいて回転させると共に、2枚目以降の原稿201から読み取られた第1読取り画像207および第2読取り画像209についても、1枚目の原稿201について選択された第1文字認識画像向き(270°)に基づいて回転させてもよい。これにより、2枚目以降の原稿201について、第1読取り画像207の向きおよび第2読取り画像209の向きを特定する処理と、第1文字認識画像向きおよび第2文字認識画像向きのいずれかを選択する処理とを、省略することができる。
When a plurality of
文字認識処理を、情報処理装置101が行う構成に限定されず、読取り装置1が行う構成でもよい。すなわち、読取り装置1が、文字認識処理により第1読取り画像207の向きおよび第2読取り画像209の向きを特定し、情報処理装置101が、第1文字認識画像向きおよび第2文字認識画像向きを、読取り装置1から取得する構成でもよい。
The character recognition process is not limited to the configuration performed by the
読取り装置1は、上記の実施形態や変形例をそれぞれ組み合わせた構成でもよい。また、読取り装置1は、上記の実施形態および変形例に限定されず、その趣旨を逸脱しない範囲で種々の構成を採用可能であることは言うまでもない。 The reading device 1 may have a configuration in which the above-described embodiments and modifications are combined. Further, it is needless to say that the reading device 1 is not limited to the above-described embodiments and modified examples, and various configurations can be adopted without departing from the spirit of the present invention.
以下、情報処理装置、情報処理装置の画像回転方法およびプログラムについて付記する。
原稿の第1面を読み取った第1読取り画像と、原稿の第1面とは反対側の第2面を読み取った第2読取り画像と、を取得する取得部と、情報処理部と、を備え、情報処理部は、第1読取り画像に対する文字認識処理により特定された第1読取り画像の向きである第1文字認識画像向き、および第2読取り画像に対する文字認識処理により特定された第2読取り画像の向きである第2文字認識画像向きのうち、いずれかの文字認識画像向きを選択し、情報処理部は、選択した文字認識画像向きに基づいて、第1読取り画像と第2読取り画像とを回転させる。
Hereinafter, the information processing apparatus, the image rotation method of the information processing apparatus, and the program will be additionally described.
An acquisition unit for acquiring a first read image obtained by reading the first surface of the document and a second read image obtained by reading the second surface of the document opposite to the first surface, and an information processing unit. And an information processing unit configured to detect the first read image, which is the direction of the first read image specified by the character recognition process for the first read image, and the second read image specified by the character recognition process for the second read image. Of the second character recognition image orientations, the information processing unit selects the first read image and the second read image based on the selected character recognition image orientation. Rotate.
この構成によれば、第1文字認識画像向きおよび第2文字認識画像向きのいずれか一方に基づいて、第1読取り画像と第2読取り画像とを回転させる。したがって、第1読取り画像および第2読取り画像の一方については、文字認識処理により正しく向きが特定されたが、第1読取り画像および第2読取り画像の他方については、文字認識処理により誤って向きが特定された場合にも、回転後の第1読取り画像の向きと回転後の第2読取り画像の向きとを、揃えることができる。 According to this configuration, the first read image and the second read image are rotated based on either the first character recognition image orientation or the second character recognition image orientation. Therefore, for one of the first read image and the second read image, the direction is correctly specified by the character recognition process, but for the other of the first read image and the second read image, the direction is erroneously specified by the character recognition process. Even when specified, the orientation of the first read image after rotation and the orientation of the second read image after rotation can be aligned.
この場合、情報処理部は、第1文字認識画像向きに対する信頼度である第1画像向き信頼度が、第2文字認識画像向きに対する信頼度である第2画像向き信頼度よりも大きいか否かを判断し、情報処理部は、第1画像向き信頼度が第2画像向き信頼度よりも大きいと判断したときには、第1文字認識画像向きおよび第2文字認識画像向きのうち、第1文字認識画像向きを選択し、第1画像向き信頼度が第2画像向き信頼度よりも小さいと判断したときには、第1文字認識画像向きおよび第2文字認識画像向きのうち、第2文字認識画像向きを選択することが好ましい。 In this case, the information processing unit determines whether the first image orientation reliability, which is the reliability for the first character recognition image orientation, is greater than the second image orientation reliability, which is the reliability for the second character recognition image orientation. And the information processing unit determines that the first image orientation reliability is higher than the second image orientation reliability, the first character recognition image orientation of the first character recognition image orientation and the second character recognition image orientation is determined. When the image orientation is selected and it is determined that the first image orientation reliability is lower than the second image orientation reliability, the second character recognition image orientation is selected from the first character recognition image orientation and the second character recognition image orientation. It is preferable to select.
この構成によれば、第1文字認識画像向きおよび第2文字認識画像向きのうち、信頼度が大きい方に基づいて、第1読取り画像と第2読取り画像とを回転させる。したがって、第1読取り画像および第2読取り画像の一方については、文字認識処理により正しく向きが特定されたが、第1読取り画像および第2読取り画像の他方については、文字認識処理により誤って向きが特定された場合にも、回転後の第1読取り画像の向きと回転後の第2読取り画像の向きとを、所望の向きに揃えることができる。 According to this configuration, the first read image and the second read image are rotated based on whichever of the first character recognition image orientation and the second character recognition image orientation has the higher reliability. Therefore, for one of the first read image and the second read image, the direction is correctly specified by the character recognition process, but for the other of the first read image and the second read image, the direction is erroneously specified by the character recognition process. Even when specified, the orientation of the first read image after rotation and the orientation of the second read image after rotation can be aligned in the desired orientation.
この場合、情報処理部は、第1画像向き信頼度および第2画像向き信頼度が閾値よりも小さいか否かを判断し、情報処理部は、第1画像向き信頼度および第2画像向き信頼度が閾値よりも小さいと判断したときに、第1読取り画像に対して文字認識処理以外の画像解析処理を行うことで、第1読取り画像の向きを特定し、第2読取り画像に対して文字認識処理以外の画像解析処理を行うことで、第2読取り画像の向きを特定し、情報処理部は、第1読取り画像に対する文字認識処理以外の画像解析処理により特定された第1読取り画像の向きである第1非文字認識画像向きに基づいて、第1読取り画像を回転させ、第2読取り画像に対する文字認識処理以外の画像解析処理により特定された第2読取り画像の向きである第2非文字認識画像向きに基づいて、第2読取り画像を回転させることが好ましい。 In this case, the information processing unit determines whether the first image orientation reliability and the second image orientation reliability are smaller than the threshold value, and the information processing unit determines the first image orientation reliability and the second image orientation reliability. When it is determined that the degree is smaller than the threshold value, the direction of the first read image is specified by performing an image analysis process other than the character recognition process on the first read image, and the character is detected on the second read image. By performing an image analysis process other than the recognition process, the orientation of the second read image is identified, and the information processing unit causes the orientation of the first read image identified by the image analysis process other than the character recognition process for the first read image. The second non-character which is the orientation of the second read image specified by the image analysis processing other than the character recognition processing for the second read image by rotating the first read image based on the first non-character recognized image orientation It is preferable to rotate the second read image based on the orientation of the recognized image.
この構成によれば、第1画像向き信頼度および第2画像向き信頼度が閾値よりも小さいときに、第1非文字認識画像向きに基づいて、第1読取り画像を回転させ、第2非文字認識画像向きに基づいて、第2読取り画像を回転させる。したがって、第1読取り画像および第2読取り画像のいずれについても、文字認識処理により誤って向きが特定された場合にも、回転後の第1読取り画像の向きと回転後の第2読取り画像の向きとを、所望の向きに揃えることができる。 According to this configuration, when the first image orientation reliability and the second image orientation reliability are smaller than the threshold value, the first read image is rotated based on the first non-character recognized image orientation, and the second non-character recognition image is rotated. The second read image is rotated based on the orientation of the recognized image. Therefore, for both the first read image and the second read image, even if the orientation is erroneously specified by the character recognition processing, the orientation of the first read image after rotation and the orientation of the second read image after rotation And can be aligned in a desired direction.
この場合、情報処理部は、第1面のヘッダー領域およびフッター領域の少なくとも一方を含む第1端部領域に対する文字認識処理を行うことで、第1端部領域に含まれる文字の向きを特定し、第1端部領域に含まれる文字について特定された向きである第1端部文字向きに基づいて、第1読取り画像の向きを特定し、情報処理部は、第2面のヘッダー領域およびフッター領域の少なくとも一方を含む第2端部領域に対する文字認識処理を行うことで、第2端部領域に含まれる文字の向きを特定し、第2端部領域に含まれる文字について特定された向きである第2端部文字向きに基づいて、第2読取り画像の向きを特定することが好ましい。 In this case, the information processing unit specifies the orientation of the characters included in the first end area by performing character recognition processing on the first end area including at least one of the header area and the footer area on the first surface. , The orientation of the first read image is identified based on the orientation of the first edge character, which is the orientation identified for the characters included in the first edge area, and the information processing unit causes the information processing unit to identify the header area and the footer of the second surface. By performing character recognition processing on the second edge area including at least one of the areas, the orientation of the character included in the second edge area is specified, and the orientation of the character included in the second edge area is specified. It is preferable to specify the direction of the second read image based on a certain second edge character direction.
この構成によれば、第1面のうちヘッダー領域でなくフッター領域でもない領域に含まれるイラスト等を、文字認識により誤って文字と認識することを回避できる。このため、ヘッダー領域でなくフッター領域でもない領域にイラスト等が含まれる場合にも、第1読取り画像の向きを、精度良く特定することができる。同様に、第2面のうちヘッダー領域でなくフッター領域でもない領域に含まれるイラスト等を、文字認識により誤って文字と認識することを回避できる。このため、ヘッダー領域でなくフッター領域でもない領域にイラスト等が含まれる場合にも、第2読取り画像の向きを、精度良く特定することができる。 With this configuration, it is possible to avoid erroneously recognizing an illustration or the like included in the area of the first surface that is neither the header area nor the footer area as a character by character recognition. Therefore, even when an illustration or the like is included in a region that is neither the header region nor the footer region, the orientation of the first read image can be accurately specified. Similarly, it is possible to avoid erroneously recognizing an illustration or the like included in the area of the second surface which is neither the header area nor the footer area as a character by character recognition. Therefore, even when an illustration or the like is included in a region that is neither the header region nor the footer region, the orientation of the second read image can be accurately specified.
この場合、情報処理部は、第1面のうちヘッダー領域でなくフッター領域でもない第1非端部領域に対する文字認識処理を行うことで、第1非端部領域に含まれる文字の向きを特定し、第1非端部領域に含まれる文字について特定された向きである第1非端部文字向きよりも、第1端部文字向きに大きい重みを付けることにより、第1読取り画像の向きを特定し、情報処理部は、第2面のうちヘッダー領域でなくフッター領域でもない第2非端部領域に対する文字認識処理を行うことで、第2非端部領域に含まれる文字の向きを特定し、第2非端部領域に含まれる文字について特定された向きである第2非端部文字向きよりも、第2端部文字向きに大きい重みを付けることにより、第2読取り画像の向きを特定することが好ましい。 In this case, the information processing unit identifies the orientation of the character included in the first non-edge region by performing the character recognition process on the first non-edge region that is neither the header region nor the footer region of the first surface. However, by giving a greater weight to the first end character direction than to the first non-end character direction that is the direction specified for the characters included in the first non-end region, the direction of the first read image is changed. The information processing unit identifies the orientation of the character included in the second non-edge region by performing character recognition processing on the second non-edge region that is neither the header region nor the footer region of the second surface. However, by giving a greater weight to the second end character direction than to the second non-end character direction that is the direction specified for the characters included in the second non-end region, the direction of the second read image is changed. It is preferable to specify.
この構成によれば、第1非端部領域に含まれるイラスト等を、文字認識により誤って文字と認識した場合にも、その影響を低減することができる。このため、第1非端部領域にイラスト等が含まれる場合にも、第1読取り画像の向きを、精度良く特定することができる。同様に、第2非端部領域に含まれるイラスト等を、文字認識により誤って文字と認識した場合にも、その影響を低減することができる。このため、第2非端部領域にイラスト等が含まれる場合にも、第2読取り画像の向きを、精度良く特定することができる。 According to this configuration, even when the illustration or the like included in the first non-edge portion area is erroneously recognized as a character by character recognition, the influence thereof can be reduced. Therefore, even when an illustration or the like is included in the first non-edge portion area, the orientation of the first read image can be accurately specified. Similarly, even when an illustration or the like included in the second non-edge portion area is erroneously recognized as a character by character recognition, the influence can be reduced. Therefore, even when an illustration or the like is included in the second non-edge portion area, the orientation of the second read image can be accurately specified.
情報処理装置の画像回転方法は、原稿の第1面から読み取られた第1読取り画像と、原稿の第1面とは反対側の第2面から読み取られた第2読取り画像と、を取得し、第1読取り画像に対する文字認識処理により特定された第1読取り画像の向きである第1文字認識画像向き、および第2読取り画像に対する文字認識処理により特定された第2読取り画像の向きである第2文字認識画像向きのうち、いずれかの文字認識画像向きを選択し、選択した文字認識画像向きに基づいて、第1読取り画像と第2読取り画像とを回転させる。 An image rotation method of an information processing apparatus obtains a first read image read from a first side of a document and a second read image read from a second side opposite to the first side of the document. , A first character recognition image orientation that is the orientation of the first read image identified by the character recognition processing for the first read image, and a second orientation of the second read image that is identified by the character recognition processing for the second read image One of the two character recognition image orientations is selected, and the first read image and the second read image are rotated based on the selected character recognition image orientation.
この構成によれば、第1文字認識画像向きおよび第2文字認識画像向きのいずれか一方に基づいて、第1読取り画像と第2読取り画像とを回転させる。したがって、第1読取り画像および第2読取り画像の一方については、文字認識処理により正しく向きが特定されたが、第1読取り画像および第2読取り画像の他方については、文字認識処理により誤って向きが特定された場合にも、回転後の第1読取り画像の向きと回転後の第2読取り画像の向きとを、揃えることができる。 According to this configuration, the first read image and the second read image are rotated based on either the first character recognition image orientation or the second character recognition image orientation. Therefore, for one of the first read image and the second read image, the direction is correctly specified by the character recognition process, but for the other of the first read image and the second read image, the direction is erroneously specified by the character recognition process. Even when specified, the orientation of the first read image after rotation and the orientation of the second read image after rotation can be aligned.
プログラムは、コンピューターに、原稿の第1面から読み取られた第1読取り画像と、原稿の第1面とは反対側の第2面から読み取られた第2読取り画像と、を取得するステップと、第1読取り画像に対する文字認識処理により特定された第1読取り画像の向きである第1文字認識画像向き、および第2読取り画像に対する文字認識処理により特定された第2読取り画像の向きである第2文字認識画像向きのうち、いずれかの文字認識画像向きを選択するステップと、選択した文字認識画像向きに基づいて、第1読取り画像と第2読取り画像とを回転させるステップと、を実行させる。 The program causes the computer to obtain a first read image read from the first side of the document and a second read image read from the second side opposite to the first side of the document. A first character recognition image orientation that is the orientation of the first read image identified by the character recognition processing for the first read image, and a second orientation that is the orientation of the second read image identified by the character recognition processing for the second read image A step of selecting any one of the character recognition image orientations and a step of rotating the first read image and the second read image based on the selected character recognition image orientation are executed.
この構成によれば、第1文字認識画像向きおよび第2文字認識画像向きのいずれか一方に基づいて、第1読取り画像と第2読取り画像とを回転させる。したがって、第1読取り画像および第2読取り画像の一方については、文字認識処理により正しく向きが特定されたが、第1読取り画像および第2読取り画像の他方については、文字認識処理により誤って向きが特定された場合にも、回転後の第1読取り画像の向きと回転後の第2読取り画像の向きとを、揃えることができる。 According to this configuration, the first read image and the second read image are rotated based on either the first character recognition image orientation or the second character recognition image orientation. Therefore, for one of the first read image and the second read image, the direction is correctly specified by the character recognition process, but for the other of the first read image and the second read image, the direction is erroneously specified by the character recognition process. Even when specified, the orientation of the first read image after rotation and the orientation of the second read image after rotation can be aligned.
101…情報処理装置、103…処理側CPU、201…原稿、203…第1面、205…第2面、207…第1読取り画像、209…第2読取り画像、217…ヘッダー領域、219…フッター領域、221…第1端部領域、225…第1非端部領域。
Claims (7)
情報処理部と、を備え、
前記情報処理部は、前記第1読取り画像に対する文字認識処理により特定された前記第1読取り画像の向きである第1文字認識画像向き、および前記第2読取り画像に対する文字認識処理により特定された前記第2読取り画像の向きである第2文字認識画像向きのうち、いずれかの文字認識画像向きを選択し、
前記情報処理部は、選択した前記文字認識画像向きに基づいて、前記第1読取り画像と前記第2読取り画像とを回転させることを特徴とする情報処理装置。 An acquisition unit for acquiring a first read image obtained by reading the first surface of the document and a second read image obtained by reading the second surface of the document opposite to the first surface;
An information processing unit,
The information processing unit includes a first character recognition image orientation that is the orientation of the first read image identified by the character recognition processing for the first read image, and the character identification processing identified for the second read image. Select one of the character recognition image orientations from the second character recognition image orientation that is the orientation of the second read image,
The information processing unit, wherein the information processing unit rotates the first read image and the second read image based on the selected orientation of the character recognition image.
前記情報処理部は、前記第1画像向き信頼度が前記第2画像向き信頼度よりも大きいと判断したときには、前記第1文字認識画像向きおよび前記第2文字認識画像向きのうち、前記第1文字認識画像向きを選択し、前記第1画像向き信頼度が前記第2画像向き信頼度よりも小さいと判断したときには、前記第1文字認識画像向きおよび前記第2文字認識画像向きのうち、前記第2文字認識画像向きを選択することを特徴とする請求項1に記載の情報処理装置。 The information processing unit determines whether the first image orientation reliability, which is the reliability for the first character recognition image orientation, is greater than the second image orientation reliability, which is the reliability for the second character recognition image orientation. Judge,
When the information processing unit determines that the first image orientation reliability is higher than the second image orientation reliability, the first information recognition direction among the first character recognition image orientation and the second character recognition image orientation is the first character recognition image orientation. When a character recognition image orientation is selected and it is determined that the first image orientation reliability is lower than the second image orientation reliability, the one of the first character recognition image orientation and the second character recognition image orientation is The information processing apparatus according to claim 1, wherein the orientation of the second character recognition image is selected.
前記情報処理部は、前記第1画像向き信頼度および前記第2画像向き信頼度が前記閾値よりも小さいと判断したときに、前記第1読取り画像に対して文字認識処理以外の画像解析処理を行うことで、前記第1読取り画像の向きを特定し、前記第2読取り画像に対して文字認識処理以外の画像解析処理を行うことで、前記第2読取り画像の向きを特定し、
前記情報処理部は、前記第1読取り画像に対する文字認識処理以外の画像解析処理により特定された前記第1読取り画像の向きである第1非文字認識画像向きに基づいて、前記第1読取り画像を回転させ、前記第2読取り画像に対する文字認識処理以外の画像解析処理により特定された前記第2読取り画像の向きである第2非文字認識画像向きに基づいて、前記第2読取り画像を回転させることを特徴とする請求項2に記載の情報処理装置。 The information processing unit determines whether the first image orientation reliability and the second image orientation reliability are smaller than a threshold value,
When determining that the first image orientation reliability and the second image orientation reliability are smaller than the threshold value, the information processing unit performs image analysis processing other than character recognition processing on the first read image. By doing so, the direction of the first read image is specified, and by performing image analysis processing other than character recognition processing on the second read image, the direction of the second read image is specified,
The information processing unit determines the first read image based on a first non-character-recognized image orientation, which is the orientation of the first read image identified by an image analysis process other than the character recognition process on the first read image. Rotating the second read image based on a second non-character-recognized image orientation that is the orientation of the second read image identified by image analysis processing other than the character recognition processing for the second read image. The information processing apparatus according to claim 2, wherein:
前記情報処理部は、前記第2面のヘッダー領域およびフッター領域の少なくとも一方を含む第2端部領域に対する文字認識処理を行うことで、前記第2端部領域に含まれる文字の向きを特定し、前記第2端部領域に含まれる文字について特定された向きである第2端部文字向きに基づいて、前記第2読取り画像の向きを特定することを特徴とする請求項1ないし3のいずれか一項に記載の情報処理装置。 The information processing unit specifies a direction of a character included in the first end area by performing character recognition processing on a first end area including at least one of a header area and a footer area on the first surface. The orientation of the first read image is identified based on the orientation of the first edge character, which is the orientation identified for the characters included in the first edge area,
The information processing unit specifies a direction of a character included in the second end area by performing character recognition processing on a second end area including at least one of a header area and a footer area on the second surface. 4. The orientation of the second read image is identified based on the second edge character orientation that is the orientation identified for the character included in the second edge area. The information processing device according to claim 1.
前記情報処理部は、前記第2面のうち前記ヘッダー領域でなく前記フッター領域でもない第2非端部領域に対する文字認識処理を行うことで、前記第2非端部領域に含まれる文字の向きを特定し、前記第2非端部領域に含まれる文字について特定された向きである第2非端部文字向きよりも、前記第2端部文字向きに大きい重みを付けることにより、前記第2読取り画像の向きを特定することを特徴とする請求項4に記載の情報処理装置。 The information processing unit performs character recognition processing on a first non-edge portion of the first surface that is neither the header region nor the footer region, so that the orientation of characters included in the first non-edge region And assigning a greater weight to the first end character direction than to the first non-end character direction, which is the direction specified for the characters included in the first non-end region, Specify the orientation of the scanned image,
The information processing unit performs a character recognition process on a second non-edge portion of the second surface that is neither the header region nor the footer region, so that the orientation of the characters included in the second non-edge region is increased. And assigning a greater weight to the second end character direction than to the second non-end character direction, which is the direction specified for the characters included in the second non-end region, The information processing apparatus according to claim 4, wherein the direction of the read image is specified.
前記第1読取り画像に対する文字認識処理により特定された前記第1読取り画像の向きである第1文字認識画像向き、および前記第2読取り画像に対する文字認識処理により特定された前記第2読取り画像の向きである第2文字認識画像向きのうち、いずれかの文字認識画像向きを選択し、
選択した前記文字認識画像向きに基づいて、前記第1読取り画像と前記第2読取り画像とを回転させる
ことを特徴とする情報処理装置の画像回転方法。 Acquiring a first read image read from the first side of the original and a second read image read from the second side of the original opposite to the first side,
A first character recognition image orientation that is the orientation of the first read image identified by the character recognition processing for the first read image, and a orientation of the second read image identified by the character recognition processing for the second read image Select one of the character recognition image orientations from the second character recognition image orientation
An image rotation method for an information processing apparatus, comprising rotating the first read image and the second read image based on the selected orientation of the character recognition image.
原稿の第1面から読み取られた第1読取り画像と、前記原稿の前記第1面とは反対側の第2面から読み取られた第2読取り画像と、を取得するステップと、
前記第1読取り画像に対する文字認識処理により特定された前記第1読取り画像の向きである第1文字認識画像向き、および前記第2読取り画像に対する文字認識処理により特定された前記第2読取り画像の向きである第2文字認識画像向きのうち、いずれかの文字認識画像向きを選択するステップと、
選択した前記文字認識画像向きに基づいて、前記第1読取り画像と前記第2読取り画像とを回転させるステップと、
を実行させることを特徴とするプログラム。 On the computer,
Acquiring a first read image read from the first side of the original document and a second read image read from the second side of the original opposite to the first side;
A first character recognition image orientation that is the orientation of the first read image identified by the character recognition processing for the first read image, and a orientation of the second read image identified by the character recognition processing for the second read image Selecting one of the character recognition image orientations among the second character recognition image orientations
Rotating the first read image and the second read image based on the selected orientation of the character recognition image;
A program characterized by causing to execute.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018223801A JP7192441B2 (en) | 2018-11-29 | 2018-11-29 | Information processing device, image rotation method for information processing device, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018223801A JP7192441B2 (en) | 2018-11-29 | 2018-11-29 | Information processing device, image rotation method for information processing device, and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020088736A true JP2020088736A (en) | 2020-06-04 |
JP7192441B2 JP7192441B2 (en) | 2022-12-20 |
Family
ID=70909149
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018223801A Active JP7192441B2 (en) | 2018-11-29 | 2018-11-29 | Information processing device, image rotation method for information processing device, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7192441B2 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112749694A (en) * | 2021-01-20 | 2021-05-04 | 中科云谷科技有限公司 | Method and device for identifying image direction and nameplate characters |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05110814A (en) * | 1991-10-17 | 1993-04-30 | Ricoh Co Ltd | Copying picture recorder |
JPH10191018A (en) * | 1996-12-20 | 1998-07-21 | Canon Inc | Image processing method and device |
JP2015015566A (en) * | 2013-07-04 | 2015-01-22 | 京セラドキュメントソリューションズ株式会社 | Image processing apparatus |
-
2018
- 2018-11-29 JP JP2018223801A patent/JP7192441B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05110814A (en) * | 1991-10-17 | 1993-04-30 | Ricoh Co Ltd | Copying picture recorder |
JPH10191018A (en) * | 1996-12-20 | 1998-07-21 | Canon Inc | Image processing method and device |
JP2015015566A (en) * | 2013-07-04 | 2015-01-22 | 京セラドキュメントソリューションズ株式会社 | Image processing apparatus |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112749694A (en) * | 2021-01-20 | 2021-05-04 | 中科云谷科技有限公司 | Method and device for identifying image direction and nameplate characters |
CN112749694B (en) * | 2021-01-20 | 2024-05-21 | 中科云谷科技有限公司 | Method and device for recognizing image direction and nameplate characters |
Also Published As
Publication number | Publication date |
---|---|
JP7192441B2 (en) | 2022-12-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11538235B2 (en) | Methods and apparatus to determine the dimensions of a region of interest of a target object from an image using target object landmarks | |
JP4963809B2 (en) | Outlier detection during scanning | |
US10694098B2 (en) | Apparatus displaying guide for imaging document, storage medium, and information processing method | |
US10706581B2 (en) | Image processing apparatus for clipping and sorting images from read image according to cards and control method therefor | |
JPH1139428A (en) | Direction correcting method for document video | |
US10452943B2 (en) | Information processing apparatus, control method of information processing apparatus, and storage medium | |
US20190191078A1 (en) | Information processing apparatus, a non-transitory computer readable storage medium and information processing method | |
US10997406B2 (en) | Image processing apparatus for determining proper reading order of documents | |
US10375269B2 (en) | Image processing device, image reading device, and image forming apparatus | |
JP7192441B2 (en) | Information processing device, image rotation method for information processing device, and program | |
JP6592873B2 (en) | Image reading apparatus, image forming apparatus, image reading method, and image reading program | |
US11436733B2 (en) | Image processing apparatus, image processing method and storage medium | |
US9110926B1 (en) | Skew detection for vertical text | |
US20160286065A1 (en) | Document reading device and document reading method | |
US10706337B2 (en) | Character recognition device, character recognition method, and recording medium | |
US10657309B2 (en) | Information processing apparatus capable of correcting a written object on the basis of a detected reference direction | |
JP6598080B2 (en) | Image reading apparatus, image reading method, image forming apparatus, and image reading program | |
US10623603B1 (en) | Image processing apparatus, non-transitory computer readable recording medium that records an image processing program, and image processing method | |
WO2020183628A1 (en) | Image processing device, image reading device, image processing method, and program | |
JP2017120455A (en) | Information processing device, program and control method | |
US20220335738A1 (en) | Image processing system, image processing method, and storage medium | |
US11853844B2 (en) | Information processing apparatus, image orientation determination method, and medium | |
JP6604320B2 (en) | Image forming apparatus | |
US9247089B2 (en) | Scanning apparatus | |
US11722615B2 (en) | Image processing including adjusting image orientation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20211105 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220729 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220816 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221006 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20221108 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20221121 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7192441 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |