JP2017157994A - Information processing apparatus and program - Google Patents
Information processing apparatus and program Download PDFInfo
- Publication number
- JP2017157994A JP2017157994A JP2016038684A JP2016038684A JP2017157994A JP 2017157994 A JP2017157994 A JP 2017157994A JP 2016038684 A JP2016038684 A JP 2016038684A JP 2016038684 A JP2016038684 A JP 2016038684A JP 2017157994 A JP2017157994 A JP 2017157994A
- Authority
- JP
- Japan
- Prior art keywords
- marking
- character string
- character
- unit
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 27
- 239000000284 extract Substances 0.000 claims abstract description 26
- 238000000605 extraction Methods 0.000 claims abstract description 25
- 239000000203 mixture Substances 0.000 claims description 10
- 238000012545 processing Methods 0.000 claims description 10
- 230000006870 function Effects 0.000 claims description 9
- 239000002131 composite material Substances 0.000 claims description 7
- 238000012015 optical character recognition Methods 0.000 claims description 7
- 230000002194 synthesizing effect Effects 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 5
- 238000000034 method Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000003708 edge detection Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000003705 background correction Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
Images
Landscapes
- Character Input (AREA)
- Editing Of Facsimile Originals (AREA)
Abstract
Description
本発明は、文字列に重畳されたマーキングを含む原稿画像から、マーキングされた文字列を解答とする穴埋め問題を作成することが可能な情報処理装置及びプログラムに関する。 The present invention relates to an information processing apparatus and program capable of creating a hole-filling problem using a marked character string as an answer from a document image including markings superimposed on the character string.
問題の解答となる文字列を手書きのマーキングで指定した原稿の画像を読み取り、読み取った原稿の画像データの中からマーキングの画像を抽出し、マーキングの位置で文字列を抽出し、マーキングの位置で文字列を消去し、文字列の消去部分に解答欄を設定する、穴埋め問題を作成する技術が知られている(特許文献1、要約書)。一具体例として、2以上の虫食い箇所を1つの虫食いグループとして設定し、その虫食いグループについて1つの虫食い問題を作成する技術も知られている(特許文献2、要約書)。 Read the image of the manuscript with the character string that is the answer to the problem specified by handwritten marking, extract the marking image from the image data of the read manuscript, extract the character string at the marking position, and at the marking position A technique for creating a hole filling problem in which a character string is erased and an answer column is set in the erased portion of the character string is known (Patent Document 1, Abstract). As a specific example, a technique for setting two or more worm-eater portions as one worm-eater group and creating one worm-eaten problem for the worm-eater group is also known (Patent Document 2, Abstract).
穴埋め問題を作成することが可能な情報処理装置においては、問題作成者及び回答者の双方について益々ユーザーフレンドリーであることが望まれる。 In an information processing apparatus capable of creating a hole filling problem, it is desired that both the problem creator and the respondent are more user-friendly.
以上のような事情に鑑み、本発明の目的は、文字列に重畳されたマーキングを含む原稿画像から、マーキングされた文字列を解答とする穴埋め問題を作成することが可能な情報処理装置及びプログラムにおいて、ユーザーの利便性を向上することにある。 In view of the circumstances as described above, an object of the present invention is to provide an information processing apparatus and program capable of creating a hole-filling problem using a marked character string as an answer from a document image including a marking superimposed on the character string. Therefore, it is to improve user convenience.
上記目的を達成するため、本発明の一形態に係る情報処理装置は、
文字列に重畳されたマーキングを含む原稿画像から、前記マーキングを抽出するマーキング抽出部と、
前記マーキングが重畳された文字列と同一のマーキングが重畳されていない文字列を、前記原稿画像から抽出する文字列比較部と
を具備する。
In order to achieve the above object, an information processing apparatus according to an aspect of the present invention provides:
A marking extraction unit for extracting the marking from the original image including the marking superimposed on the character string;
A character string comparison unit that extracts, from the document image, a character string that does not have the same marking as the character string on which the marking is superimposed.
情報処理装置は、
前記マーキングが重畳された文字列及び前記抽出した文字列にそれぞれ重畳する複数の空欄画像を作成する空欄作成部と、
前記原稿画像と、前記複数の空欄画像とを合成した合成画像を作成する画像合成部と
をさらに具備する。
Information processing device
A blank creation unit for creating a plurality of blank images to be superimposed on the character string on which the marking is superimposed and the extracted character string;
And an image composition unit for creating a composite image by combining the document image and the plurality of blank images.
本形態によれば、マーキングが重畳された文字列と同一のマーキングが重畳されていない文字列を原稿画像から抽出し、マーキングが重畳された文字列及び抽出した文字列にそれぞれ重畳する複数の空欄画像を作成する。これにより、解答となる同一の文字列を、確実に全て空欄にすることができる。したがって、解答となる文字列が文章中に表示されたままヒントになる事態がなくなり、また、問題作成者が、解答となる同一の文字列全てを手作業で抽出する手間がなくなる。 According to this embodiment, a character string that does not have the same marking as the character string on which the marking is superimposed is extracted from the document image, and the character string on which the marking is superimposed and a plurality of blank spaces that are respectively superimposed on the extracted character string Create an image. As a result, the same character string as an answer can be surely left blank. Therefore, there is no situation where the answer character string is displayed as a hint in the sentence, and the problem creator does not have to manually extract all the same character strings as the answer.
情報処理装置は、
前記原稿画像から、複数の文字を抽出する文字抽出部と、
前記文字抽出部が抽出した複数の文字を識別し、前記識別した複数の文字のうち前記マーキングが重畳された文字列を識別する文字識別部と
をさらに具備し、
前記文字列比較部は、前記文字識別部が識別した前記マーキングが重畳された文字列と同一の前記マーキングが重畳されていない文字列を、前記文字識別部が識別した複数の文字から抽出する。
Information processing device
A character extraction unit for extracting a plurality of characters from the document image;
A character identifying unit that identifies a plurality of characters extracted by the character extracting unit, and that identifies a character string on which the marking is superimposed among the plurality of identified characters;
The character string comparison unit extracts, from a plurality of characters identified by the character identification unit, a character string that does not have the same marking as the character string superimposed with the marking identified by the character identification unit.
情報処理装置は、
前記マーキング抽出部が抽出した前記マーキングの前記原稿画像内での位置及び形状を判定するマーキング判定部をさらに具備し、
前記文字識別部は、前記マーキングの位置及び形状及び形状をもとに、前記マーキングが重畳された文字列を識別する。
Information processing device
A marking determination unit that determines the position and shape of the marking extracted by the marking extraction unit in the document image;
The character identification unit identifies a character string on which the marking is superimposed based on the position, shape, and shape of the marking.
前記文字識別部は、光学文字認識(Optical Character Recognition)により、前記文字抽出部が抽出した複数の文字を識別する。 The character identification unit identifies a plurality of characters extracted by the character extraction unit by optical character recognition.
前記文字列比較部は、前記マーキングが重畳された文字列と、前記同一のマーキングが重畳されていない文字列とに、同一の符号を割り当てる。 The character string comparison unit assigns the same code to the character string on which the marking is superimposed and the character string on which the same marking is not superimposed.
これにより、同一の文字列を解答すべき複数の空欄に異なる符号を割り当てた故、回答者が、異なる語句を回答すべきであると誤解するおそれがなくなる。 As a result, since different codes are assigned to a plurality of blanks in which the same character string is to be answered, there is no possibility that the respondent will misunderstand that different words should be answered.
前記画像合成部は、前記原稿画像と、前記複数の空欄画像と、前記割り当てた符号の画像である符号画像とを合成した合成画像を作成する。 The image composition unit creates a composite image by combining the document image, the plurality of blank images, and a code image that is an image of the assigned code.
これにより、問題作成者が、同一の文字列を解答すべき複数の空欄に同一の符号を手作業で割り当てる手間がなくなり、また、誤った符号を割り当ててしまうおそれもなくなる。 As a result, the problem creator does not have to manually assign the same code to a plurality of blanks to which the same character string should be answered, and there is no possibility of assigning an incorrect code.
上記目的を達成するため、本発明の一形態に係るプログラムは、
情報処理装置を、
文字列に重畳されたマーキングを含む原稿画像から、前記マーキングを抽出するマーキング抽出部と、
前記マーキングが重畳された文字列と同一のマーキングが重畳されていない文字列を、前記原稿画像から抽出する文字列比較部
として機能させる。
In order to achieve the above object, a program according to an aspect of the present invention is provided.
Information processing device
A marking extraction unit for extracting the marking from the original image including the marking superimposed on the character string;
A character string that does not have the same marking as the character string on which the marking is superimposed is caused to function as a character string comparison unit that extracts from the document image.
本発明によれば、文字列に重畳されたマーキングを含む原稿画像から、マーキングされた文字列を解答とする穴埋め問題を作成することが可能な情報処理装置及びプログラムにおいて、ユーザーの利便性が向上する。 Advantageous Effects of Invention According to the present invention, in an information processing apparatus and program capable of creating a hole-filling problem using a marked character string as an answer from a manuscript image including markings superimposed on the character string, user convenience is improved. To do.
以下、図面を参照しながら、本発明の実施形態を説明する。 Hereinafter, embodiments of the present invention will be described with reference to the drawings.
(1.画像形成装置のハードウェア構成)
図1は、本発明の一実施形態に係る画像形成装置のハードウェア構成を示すブロック図である。
(1. Hardware configuration of image forming apparatus)
FIG. 1 is a block diagram showing a hardware configuration of an image forming apparatus according to an embodiment of the present invention.
本発明の各実施形態に係る情報処理装置は、画像形成装置(例えば、MFP、Multifunction Peripheral)であり、以下MFPと称する。 An information processing apparatus according to each embodiment of the present invention is an image forming apparatus (for example, MFP, Multifunction Peripheral), and is hereinafter referred to as an MFP.
MFP1は、制御部11を備える。制御部11は、CPU(Central Processing Unit)、RAM(Random Access Memory)、ROM(Read Only Memory)及び専用のハードウェア回路等から構成され、MFP1の全体的な動作制御を司る。MFP1を各機能部(後述)として機能させるコンピュータプログラムは、ROM等の非一過性の記憶媒体に記憶される。
The MFP 1 includes a
制御部11は、画像読取部12、画像処理部14、画像メモリー15、画像形成部16、操作部17、記憶部18、ネットワーク通信部13等と接続されている。制御部11は、接続されている上記各部の動作制御や、各部との間での信号又はデータの送受信を行う。
The
制御部11は、ユーザーから、操作部17またはネッワーク接続されたパーソナルコンピュータ(図示せず)等を通じて入力されるジョブの実行指示に従って、スキャナ機能、印刷機能及びコピー機能機能などの各機能についての動作制御を実行するために必要な機構の駆動及び処理を制御する。
The
画像読取部12は、原稿から画像を読み取る。
The
画像処理部14は、画像読取部12で読み取られた画像の画像データを必要に応じて画像処理する。例えば、画像処理部14は、画像読取部12により読み取られた画像が画像形成された後の品質を向上させるために、シェーディング補正等の画像処理を行う。
The
画像メモリー15は、画像読取部12による読み取りで得られた原稿画像のデータを一時的に記憶したり、画像形成部16での印刷対象となるデータを一時的に記憶したりする領域を有する。
The
画像形成部16は、画像読取部12で読み取られた画像データ等の画像形成を行う。
The
操作部17は、MFP1が実行可能な各種動作及び処理についてユーザーからの指示を受け付けるタッチパネル部および操作キー部を備える。タッチパネル部は、タッチパネルが設けられたLCD(Liquid Crystal Display)等の表示部17aを備えている。
The
ネットワーク通信部13は、ネットワークに接続するためのインタフェースである。
The
記憶部18は、画像読取部12によって読み取られた原稿画像等を記憶する、HDD(Hard Disk Drive)などの大容量の記憶装置である。
The
(2.画像形成装置の機能的構成)
図2は、画像形成装置の機能的構成を示すブロック図である。
(2. Functional configuration of image forming apparatus)
FIG. 2 is a block diagram illustrating a functional configuration of the image forming apparatus.
MFP1は、情報処理プログラムを実行することで、マーキング抽出部101、マーキング判定部102、文字抽出部103、文字識別部111、文字列比較部113、空欄作成部105及び画像合成部106として機能する。
The MFP 1 functions as a
マーキング抽出部101は、画像読取部12が読み取った原稿画像から、文字列に重畳されたマーキングを抽出する。
The
マーキング判定部102は、マーキング抽出部101が抽出したマーキングの、原稿画像内での位置及び形状を判定する。
The
文字抽出部103は、画像読取部12が読み取った原稿画像から、複数の文字を抽出する。
The
文字識別部111は、OCR用データベース112を参照し、文字抽出部103が抽出した複数の文字それぞれを識別する。文字識別部111は、マーキング判定部102が判定したマーキングの位置及び形状をもとに、マーキングが重畳された文字列を、文字コードの組み合わせにより識別する。
The
文字列比較部113は、文字識別部111が識別したマーキングが重畳された文字列と同一のマーキングが重畳されていない文字列を、文字識別部111が識別した複数の文字から抽出する。
The character
空欄作成部105は、文字列比較部113が抽出したマーキングが重畳されていない文字列と、マーキングが重畳された文字列とのそれぞれに重畳する空欄画像を作成する。
The
画像合成部106は、画像読取部12が読み取った原稿画像と、空欄作成部105が作成した空欄画像とを合成した合成画像を作成する。
The
(3.画像形成装置の動作)
図3は、画像形成装置の動作を示すフローチャートである。図4は、画像形成装置の動作を説明するための図である。
(3. Operation of image forming apparatus)
FIG. 3 is a flowchart showing the operation of the image forming apparatus. FIG. 4 is a diagram for explaining the operation of the image forming apparatus.
前提として、原稿(典型的には、紙)には、テキストデータとしての文字列が印字されている。あるいは、原稿には、画像データとしての文字列の画像が形成されている(文字列が印字された原稿がコピーされている)。そして、文字列全体のうち複数の一部の文字列(熟語、文節、数値等)が、ユーザーである問題作成者により、蛍光マーカーペン等を用いて手書きでマーキングされている。マーキングされた文字列は、穴埋め問題において、解答となる文字列である。 As a premise, a character string as text data is printed on an original (typically, paper). Alternatively, a character string image as image data is formed on the document (a document on which the character string is printed is copied). A plurality of partial character strings (jukugo, phrases, numerical values, etc.) of the entire character string are marked by hand using a fluorescent marker pen or the like by a problem creator as a user. The marked character string is a character string that becomes an answer in the hole filling problem.
画像読取部12は、原稿を光学的にスキャンし、原稿画像を読み取る(ステップS101、図4参照)。「原稿画像」は、全体的に見れば多数の文字列を含む文書原稿の画像データであり、複数の文字列に重畳された複数のマーキング(図4に示すハッチング部分)を含む。「文字列」は、語句(単語、文節、文章等)、数値等であり、厳密には、その画像である。
The
マーキング抽出部101は、画像読取部12が読み取った原稿画像から、文字列に重畳されたマーキングを抽出する(ステップS102)。具体的には、マーキング抽出部101は、背景(白色等)と明度及び/又は彩度等が異なり、特定の形状及びサイズ(特定の幅の帯状の長方形等)の領域を、マーキングとして抽出する。
The marking
マーキング判定部102は、マーキング抽出部101が抽出したマーキングの、原稿画像内での位置及び形状を判定する(ステップS103)。具体的には、マーキング判定部102は、原稿画像全体を座標系全体として、マーキングの位置及び形状を座標として算出する。
The marking
一方、ステップS102及びS103と並行して、文字抽出部103は、画像読取部12が読み取った原稿画像から、複数の文字を抽出する(ステップS104)。具体的には、文字抽出部103は、原稿画像に含まれる全ての文字を、エッジ検出により抽出する。言い換えれば、文字抽出部103は、原稿画像を、エッジ検出により1文字1文字の文字に分解する。すなわち「文字」は、原稿画像に含まれるに含まれる1文字1文字(言語によっては、1語1語としてもよい。)であり、厳密には、その画像である。
On the other hand, in parallel with steps S102 and S103, the
文字識別部111は、OCR用データベース112を参照し、文字抽出部103が抽出した複数の文字それぞれを識別する(ステップS105)。具体的には、OCR用データベース112には、文字の画像パターンと文字コードとが対応付けられて1文字ずつ登録されている。文字識別部111は、文字抽出部103が抽出した文字を示す画像パターンをOCR用データベース112から検索し、検索により得られた画像パターンが対応付けられた文字コードを取得する。文字識別部111は、原稿画像に含まれる全ての文字について、文字コードを取得する。
The
文字識別部111は、マーキング判定部102が判定したマーキングの位置及び形状をもとに、マーキングが重畳された文字列を識別する。文字識別部111は、マーキングが重畳された文字列に含まれる全ての文字それぞれの文字コードを組み合わせることで、マーキングが重畳された文字列を、この組み合わせた文字コードにより識別する(ステップS106)。
The
文字列比較部113は、文字識別部111が識別したマーキングが重畳された文字列と同一のマーキングが重畳されていない文字列を、文字識別部111が識別した複数の文字から抽出する(ステップS107、図4参照)。具体的には、文字列比較部113は、マーキングが重畳された文字列の文字コードの組み合わせと、マーキングが重畳されていない文字の文字コードとを比較する。そして、文字列比較部113は、マーキングが重畳された文字列の文字コードの組み合わせと同一の、原稿画像に含まれる全てのマーキングが重畳されていない文字のうち連続する文字コードの組み合わせを抽出する。図4に示す例では、文字列「DEF」及び「YZ」が抽出されている。
The character
文字列比較部113が、マーキングが重畳された文字列と同一のマーキングが重畳されていない文字列を抽出すると(ステップS108、YES)、空欄作成部105は、文字列比較部113が抽出したマーキングが重畳されていない文字列と(ステップS109)、マーキングが重畳された文字列とのそれぞれに重畳する空欄画像を作成する(ステップS110、図4参照)。一方、文字列比較部113が、マーキングが重畳された文字列と同一のマーキングが重畳されていない文字列を抽出しなければ(ステップS108、NO)、空欄作成部105は、マーキングが重畳された文字列に重畳する空欄画像を作成する(ステップS110)。具体的には、空欄作成部105は、文字抽出部103がエッジ検出により抽出した文字(ステップS104)と、マーキングが重畳されている場合には、この文字からはみ出たマーキングの縁部分とを消し込むような形状及び位置(座標)の空欄画像を作成する。空欄画像は、単なるブランクでも良いし、予め決められたスタイル(下線、矩形枠、括弧等)を含んでも良い。図4に示す例では、空欄画像は下線を含んでいる。
When the character
画像合成部106は、画像読取部12が読み取った原稿画像(ステップS101)と、空欄作成部105が作成した空欄画像(ステップS109、S110)とを合成した合成画像を作成する(ステップS111、図4参照)。具体的には、画像合成部106は、原稿画像の座標系に、形状及び位置が座標により定義される空欄画像を配置する。図4に示す例では、原稿画像と、下線を含む空欄画像とが合成されている。
The
画像形成部16は、画像合成部106が作成した合成画像を、用紙に形成(プリントアウト)する(ステップS112)。
The
(4.変形例)
実施形態では、空欄画像は単なるブランク等としたが、空欄画像に符号(数字、文字、記号等)を割り当ててもよい。
(4. Modifications)
In the embodiment, the blank image is simply blank or the like, but a code (number, character, symbol, etc.) may be assigned to the blank image.
すなわち、一変形例において、文字列比較部113は、マーキングが重畳された文字列と、これと同一のマーキングが重畳されていない文字列とに、同一の符号(数字、文字、記号等)を割り当てる。
That is, in one modification, the character
画像合成部106は、画像読取部12が読み取った原稿画像と、空欄作成部105が作成した空欄画像と、文字列比較部113が割り当てた符号の画像である符号画像とを合成した合成画像を作成する。具体的には、画像合成部106は、原稿画像に配置された空欄画像の予め定められた位置(中央、左端等)に、予め定められたスタイル(フォント、サイズ等)の符号を配置することで、合成画像を作成する。
The
実施形態では、画像読取部12が原稿画像を読み取った(ステップS101)。これに替えて、MFP1は、ネットワーク通信部13を通じて、ネットワークに接続された情報処理装置(図示せず)から原稿画像を受信しても良い。
In the embodiment, the
(5.まとめ)
元原稿を利用して穴埋め問題を作成する場合、1つの文章中に、解答となる文字列が何度も出現することがある。この場合、解答となる文字列が文章中に表示されたままだとヒントになってしまうため、解答となる同一の文字列は、全て空欄にする必要がある。しかし、問題作成者が、解答となる同一の文字列全てを手作業で抽出することは、手間となる上、確実に同一の文字列全てを抽出することは困難である。
(5. Summary)
When creating a hole-filling problem using an original manuscript, a character string as an answer may appear many times in one sentence. In this case, if the character string that becomes the answer is displayed as a hint in the sentence, it is necessary to leave all the same character strings that become the answer blank. However, it is troublesome for the problem creator to manually extract all the same character strings that are the answers, and it is difficult to reliably extract all the same character strings.
これに対して、実施形態によれば、MFP1は、マーキングが重畳された文字列と同一のマーキングが重畳されていない文字列を原稿画像から抽出し(ステップS107)、マーキングが重畳された文字列及び抽出した文字列にそれぞれ重畳する複数の空欄画像を作成する(ステップS109、S110)。これにより、解答となる同一の文字列を、確実に全て空欄にすることができる。したがって、解答となる文字列が文章中に表示されたままヒントになる事態がなくなり、また、問題作成者が、解答となる同一の文字列全てを手作業で抽出する手間がなくなる。 On the other hand, according to the embodiment, the MFP 1 extracts, from the document image, a character string that does not have the same marking as the character string on which the marking is superimposed (step S107), and the character string on which the marking is superimposed. A plurality of blank images to be superimposed on the extracted character strings are created (steps S109 and S110). As a result, the same character string as an answer can be surely left blank. Therefore, there is no situation where the answer character string is displayed as a hint in the sentence, and the problem creator does not have to manually extract all the same character strings as the answer.
また、同一の文字列を解答すべき複数の空欄に異なる符号を割り当てると、回答者が、異なる語句を回答すべきであると誤解するおそれがある。この事態を防ぐため、問題作成者が、同一の文字列を解答すべき複数の空欄に同一の符号を手作業で割り当てることは、手間となる。特に、空欄の総数が多い場合や、同一の文字列の組が複数組ある場合等には、問題作成者が手作業で符号を割り当てるとなると、誤った符号を割り当ててしまうおそれもある。 Moreover, if different codes are assigned to a plurality of blanks in which the same character string is to be answered, the respondent may misunderstand that different words / phrases should be answered. In order to prevent this situation, it is troublesome for the problem creator to manually assign the same code to a plurality of blanks to which the same character string should be answered. In particular, when the total number of blanks is large or when there are a plurality of sets of the same character string, if the problem creator manually assigns a code, there is a possibility that an incorrect code is assigned.
これに対して、変形例によれば、MFP1は、マーキングが重畳された文字列と、これと同一のマーキングが重畳されていない文字列とに、同一の符号を割り当てる。これにより、同一の文字列を解答すべき複数の空欄に異なる符号を割り当てた故、回答者が、異なる語句を回答すべきであると誤解するおそれがなくなる。また、問題作成者が、同一の文字列を解答すべき複数の空欄に同一の符号を手作業で割り当てる手間がなくなり、また、誤った符号を割り当ててしまうおそれもなくなる。 On the other hand, according to the modification, the MFP 1 assigns the same code to the character string on which the marking is superimposed and the character string on which the same marking is not superimposed. As a result, since different codes are assigned to a plurality of blanks in which the same character string is to be answered, there is no possibility that the respondent will misunderstand that different words should be answered. In addition, there is no need for the problem creator to manually assign the same code to a plurality of blanks in which the same character string should be answered, and there is no possibility of assigning an incorrect code.
なお、各実施形態では、複数の文字を有する文字列がマーキングされた場合の処理を説明したが、1文字からなる文字列がマーキングされた場合も図3に準じて処理を行うことも可能である。この場合、図3に示すステップS106において、文字列識別部111は、文字列に含まれる全ての文字それぞれの文字コードを組み合わせる必要はなく、マーキングが重畳された1文字の文字コードにより文字を識別すればよい。加えて、図3に示すステップS107において、文字列識別部111は、マーキングが重畳された1文字の文字コードと、マーキングが重畳されていない文字の文字コードを比較し、マーキングが重畳された1文字の文字コードと同一の、原稿画像に含まれる全てのマーキングが重畳されていない文字を抽出すればよい。
In each embodiment, the processing when a character string having a plurality of characters is marked has been described. However, even when a character string consisting of one character is marked, the processing can be performed according to FIG. is there. In this case, in step S106 shown in FIG. 3, the character
また、1文字(言語によっては、1単語)がマーキングされた場合、図3に示す処理の実行を回避してもよい。一般的に、同じ原稿の中で同じ1文字がそれぞれ異なる使われ方をしていることがある。このような場合に、ユーザーの意図しない1文字が空欄になるのを防ぐことができる。 Further, when one character (one word depending on the language) is marked, the execution of the process shown in FIG. 3 may be avoided. In general, the same character may be used differently in the same document. In such a case, it is possible to prevent one character unintended by the user from being left blank.
1…MFP
12…画像読取部
16…画像形成部
101…マーキング抽出部
102…マーキング判定部
103…文字抽出部
105…空欄作成部
106…画像合成部
111…文字識別部
112…OCR用データベース
113…文字列比較部
1 ... MFP
DESCRIPTION OF
Claims (8)
前記マーキングが重畳された文字列と同一のマーキングが重畳されていない文字列を、前記原稿画像から抽出する文字列比較部と
を具備する情報処理装置。 A marking extraction unit for extracting the marking from the original image including the marking superimposed on the character string;
An information processing apparatus comprising: a character string comparison unit that extracts, from the document image, a character string that does not have the same marking as the character string on which the marking is superimposed.
前記マーキングが重畳された文字列及び前記抽出した文字列にそれぞれ重畳する複数の空欄画像を作成する空欄作成部と、
前記原稿画像と、前記複数の空欄画像とを合成した合成画像を作成する画像合成部と
をさらに具備する情報処理装置。 The information processing apparatus according to claim 1,
A blank creation unit for creating a plurality of blank images to be superimposed on the character string on which the marking is superimposed and the extracted character string;
An information processing apparatus further comprising: an image composition unit that creates a composite image by combining the document image and the plurality of blank images.
前記原稿画像から、複数の文字を抽出する文字抽出部と、
前記文字抽出部が抽出した複数の文字を識別し、前記識別した複数の文字のうち前記マーキングが重畳された文字列を識別する文字識別部と
をさらに具備し、
前記文字列比較部は、前記文字識別部が識別した前記マーキングが重畳された文字列と同一の前記マーキングが重畳されていない文字列を、前記文字識別部が識別した複数の文字から抽出する
情報処理装置。 The information processing apparatus according to claim 1 or 2,
A character extraction unit for extracting a plurality of characters from the document image;
A character identifying unit that identifies a plurality of characters extracted by the character extracting unit, and that identifies a character string on which the marking is superimposed among the plurality of identified characters;
The character string comparison unit extracts, from a plurality of characters identified by the character identification unit, a character string that is not superimposed with the same marking as the character string superimposed with the marking identified by the character identification unit. Processing equipment.
前記マーキング抽出部が抽出した前記マーキングの前記原稿画像内での位置及び形状を判定するマーキング判定部をさらに具備し、
前記文字識別部は、前記マーキングの位置及び形状及び形状をもとに、前記マーキングが重畳された文字列を識別する
情報処理装置。 The information processing apparatus according to claim 3,
A marking determination unit that determines the position and shape of the marking extracted by the marking extraction unit in the document image;
The said character identification part identifies the character string with which the said marking was superimposed based on the position of the said marking, a shape, and a shape. Information processing apparatus.
前記文字識別部は、光学文字認識(Optical Character Recognition)により、前記文字抽出部が抽出した複数の文字を識別する
情報処理装置。 An information processing apparatus according to claim 3 or 4,
The information processing apparatus, wherein the character identification unit identifies a plurality of characters extracted by the character extraction unit by optical character recognition.
前記文字列比較部は、前記マーキングが重畳された文字列と、前記同一のマーキングが重畳されていない文字列とに、同一の符号を割り当てる
情報処理装置。 An information processing apparatus according to any one of claims 1 to 5,
The information processing apparatus, wherein the character string comparison unit assigns the same code to a character string on which the marking is superimposed and a character string on which the same marking is not superimposed.
前記画像合成部は、前記原稿画像と、前記複数の空欄画像と、前記割り当てた符号の画像である符号画像とを合成した合成画像を作成する
情報処理装置。 An information processing apparatus according to any one of claims 2 to 6,
The image synthesizing unit creates a synthesized image by synthesizing the document image, the plurality of blank images, and a code image that is an image of the assigned code.
文字列に重畳されたマーキングを含む原稿画像から、前記マーキングを抽出するマーキング抽出部と、
前記マーキングが重畳された文字列と同一のマーキングが重畳されていない文字列を、前記原稿画像から抽出する文字列比較部
として機能させるプログラム。 Information processing device
A marking extraction unit for extracting the marking from the original image including the marking superimposed on the character string;
A program that functions as a character string comparison unit that extracts a character string that does not have the same marking as the character string on which the marking is superimposed from the document image.
Priority Applications (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016038684A JP6561876B2 (en) | 2016-03-01 | 2016-03-01 | Information processing apparatus and program |
CN201910828875.3A CN110636181A (en) | 2016-03-01 | 2017-02-09 | Information processing apparatus |
CN201910829510.2A CN110740221B (en) | 2016-03-01 | 2017-02-09 | Information processing apparatus |
CN201710070630.XA CN107147820B (en) | 2016-03-01 | 2017-02-09 | Information processing unit |
US15/438,331 US10425556B2 (en) | 2016-03-01 | 2017-02-21 | Information processing apparatus |
US16/524,364 US10681245B2 (en) | 2016-03-01 | 2019-07-29 | Information processing apparatus |
US16/524,424 US10715699B2 (en) | 2016-03-01 | 2019-07-29 | Information processing apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016038684A JP6561876B2 (en) | 2016-03-01 | 2016-03-01 | Information processing apparatus and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017157994A true JP2017157994A (en) | 2017-09-07 |
JP6561876B2 JP6561876B2 (en) | 2019-08-21 |
Family
ID=59810822
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016038684A Expired - Fee Related JP6561876B2 (en) | 2016-03-01 | 2016-03-01 | Information processing apparatus and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6561876B2 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102018119497A1 (en) | 2017-08-18 | 2019-02-21 | Shimano Inc. | BICYCLE COMPONENTS |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0695583A (en) * | 1992-09-09 | 1994-04-08 | Brother Ind Ltd | Learning support device |
JP2005070939A (en) * | 2003-08-21 | 2005-03-17 | Sharp Corp | Character string processor, character string processing method, program, and recording medium |
US20060289625A1 (en) * | 2005-06-24 | 2006-12-28 | Fuji Xerox Co., Ltd. | Question paper forming apparatus and question paper forming method |
US20070206883A1 (en) * | 2006-03-06 | 2007-09-06 | Fuji Xerox Co., Ltd. | Image processing apparatus and recording medium recording image processing program |
JP2009017041A (en) * | 2007-07-02 | 2009-01-22 | Ricoh Co Ltd | Image processing multifunction device |
JP2013073310A (en) * | 2011-09-27 | 2013-04-22 | Dainippon Printing Co Ltd | Computer device and program |
-
2016
- 2016-03-01 JP JP2016038684A patent/JP6561876B2/en not_active Expired - Fee Related
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0695583A (en) * | 1992-09-09 | 1994-04-08 | Brother Ind Ltd | Learning support device |
JP2005070939A (en) * | 2003-08-21 | 2005-03-17 | Sharp Corp | Character string processor, character string processing method, program, and recording medium |
US20060289625A1 (en) * | 2005-06-24 | 2006-12-28 | Fuji Xerox Co., Ltd. | Question paper forming apparatus and question paper forming method |
JP2007004523A (en) * | 2005-06-24 | 2007-01-11 | Fuji Xerox Co Ltd | Apparatus and method for preparing question sheet |
US20070206883A1 (en) * | 2006-03-06 | 2007-09-06 | Fuji Xerox Co., Ltd. | Image processing apparatus and recording medium recording image processing program |
JP2009017041A (en) * | 2007-07-02 | 2009-01-22 | Ricoh Co Ltd | Image processing multifunction device |
JP2013073310A (en) * | 2011-09-27 | 2013-04-22 | Dainippon Printing Co Ltd | Computer device and program |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102018119497A1 (en) | 2017-08-18 | 2019-02-21 | Shimano Inc. | BICYCLE COMPONENTS |
Also Published As
Publication number | Publication date |
---|---|
JP6561876B2 (en) | 2019-08-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2008192032A (en) | Document processing device, document processing method, and program | |
US9558433B2 (en) | Image processing apparatus generating partially erased image data and supplementary data supplementing partially erased image data | |
JP7337612B2 (en) | Image processing device, image processing system, image processing method, and program | |
US10715699B2 (en) | Information processing apparatus | |
JP7039882B2 (en) | Image analysis device and image analysis program | |
JP2008276677A (en) | Support device for character recognition, character recognition device and program | |
JP6561876B2 (en) | Information processing apparatus and program | |
US9860398B2 (en) | Information processing apparatus that creates other documents from read document | |
JP2018055256A (en) | Information processing apparatus, information processing method, and program | |
JP2008282094A (en) | Character recognition processing apparatus | |
JP4807618B2 (en) | Image processing apparatus and image processing program | |
JP6489041B2 (en) | Information processing apparatus and program | |
JP6729486B2 (en) | Information processing apparatus, information processing program, and information processing method | |
JP2006276905A (en) | Translation device, image processing device, image forming device, and translation method and program | |
JP6565740B2 (en) | Information processing apparatus and program | |
JP2013182459A (en) | Information processing apparatus, information processing method, and program | |
JP2020099031A (en) | Information processing apparatus and information processing method | |
JP2020053891A (en) | Information processing apparatus, information processing method, and program | |
JP6520761B2 (en) | Information processing apparatus and program | |
JP2020099030A (en) | Information processing apparatus and information processing method | |
US20210303843A1 (en) | Information processing apparatus | |
WO2022097408A1 (en) | Image processing device and image forming device | |
US10659654B2 (en) | Information processing apparatus for generating an image surrounded by a marking on a document, and non-transitory computer readable recording medium that records an information processing program for generating an image surrounded by a marking on a document | |
JP2021157627A (en) | Information processing device | |
JP2010146143A (en) | Document processing apparatus and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20171227 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190118 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190205 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190329 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190625 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190708 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6561876 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |