JP2017157994A - Information processing apparatus and program - Google Patents

Information processing apparatus and program Download PDF

Info

Publication number
JP2017157994A
JP2017157994A JP2016038684A JP2016038684A JP2017157994A JP 2017157994 A JP2017157994 A JP 2017157994A JP 2016038684 A JP2016038684 A JP 2016038684A JP 2016038684 A JP2016038684 A JP 2016038684A JP 2017157994 A JP2017157994 A JP 2017157994A
Authority
JP
Japan
Prior art keywords
marking
character string
character
unit
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016038684A
Other languages
Japanese (ja)
Other versions
JP6561876B2 (en
Inventor
友博 三浦
Tomohiro Miura
友博 三浦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kyocera Document Solutions Inc
Original Assignee
Kyocera Document Solutions Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kyocera Document Solutions Inc filed Critical Kyocera Document Solutions Inc
Priority to JP2016038684A priority Critical patent/JP6561876B2/en
Priority to CN201710070630.XA priority patent/CN107147820B/en
Priority to CN201910828875.3A priority patent/CN110636181A/en
Priority to CN201910829510.2A priority patent/CN110740221B/en
Priority to US15/438,331 priority patent/US10425556B2/en
Publication of JP2017157994A publication Critical patent/JP2017157994A/en
Priority to US16/524,364 priority patent/US10681245B2/en
Priority to US16/524,424 priority patent/US10715699B2/en
Application granted granted Critical
Publication of JP6561876B2 publication Critical patent/JP6561876B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Input (AREA)
  • Editing Of Facsimile Originals (AREA)

Abstract

PROBLEM TO BE SOLVED: To improve convenience for a user in an information processing apparatus and program that can create, from a document image including markings overlapped on character strings, a fill-in-the-blank question with the marked character strings as answers.SOLUTION: An information processing apparatus comprises: a marking extraction part that extracts, from a document image including markings overlapped on character strings, the markings; and a character string comparison part that extracts, from the document image, character strings not overlapped with the same markings as in the character strings overlapped with the markings.SELECTED DRAWING: Figure 3

Description

本発明は、文字列に重畳されたマーキングを含む原稿画像から、マーキングされた文字列を解答とする穴埋め問題を作成することが可能な情報処理装置及びプログラムに関する。   The present invention relates to an information processing apparatus and program capable of creating a hole-filling problem using a marked character string as an answer from a document image including markings superimposed on the character string.

問題の解答となる文字列を手書きのマーキングで指定した原稿の画像を読み取り、読み取った原稿の画像データの中からマーキングの画像を抽出し、マーキングの位置で文字列を抽出し、マーキングの位置で文字列を消去し、文字列の消去部分に解答欄を設定する、穴埋め問題を作成する技術が知られている(特許文献1、要約書)。一具体例として、2以上の虫食い箇所を1つの虫食いグループとして設定し、その虫食いグループについて1つの虫食い問題を作成する技術も知られている(特許文献2、要約書)。   Read the image of the manuscript with the character string that is the answer to the problem specified by handwritten marking, extract the marking image from the image data of the read manuscript, extract the character string at the marking position, and at the marking position A technique for creating a hole filling problem in which a character string is erased and an answer column is set in the erased portion of the character string is known (Patent Document 1, Abstract). As a specific example, a technique for setting two or more worm-eater portions as one worm-eater group and creating one worm-eaten problem for the worm-eater group is also known (Patent Document 2, Abstract).

特開2007−4523号公報JP 2007-4523 A 特開2010−101970号公報JP 2010-101970 A

穴埋め問題を作成することが可能な情報処理装置においては、問題作成者及び回答者の双方について益々ユーザーフレンドリーであることが望まれる。   In an information processing apparatus capable of creating a hole filling problem, it is desired that both the problem creator and the respondent are more user-friendly.

以上のような事情に鑑み、本発明の目的は、文字列に重畳されたマーキングを含む原稿画像から、マーキングされた文字列を解答とする穴埋め問題を作成することが可能な情報処理装置及びプログラムにおいて、ユーザーの利便性を向上することにある。   In view of the circumstances as described above, an object of the present invention is to provide an information processing apparatus and program capable of creating a hole-filling problem using a marked character string as an answer from a document image including a marking superimposed on the character string. Therefore, it is to improve user convenience.

上記目的を達成するため、本発明の一形態に係る情報処理装置は、
文字列に重畳されたマーキングを含む原稿画像から、前記マーキングを抽出するマーキング抽出部と、
前記マーキングが重畳された文字列と同一のマーキングが重畳されていない文字列を、前記原稿画像から抽出する文字列比較部と
を具備する。
In order to achieve the above object, an information processing apparatus according to an aspect of the present invention provides:
A marking extraction unit for extracting the marking from the original image including the marking superimposed on the character string;
A character string comparison unit that extracts, from the document image, a character string that does not have the same marking as the character string on which the marking is superimposed.

情報処理装置は、
前記マーキングが重畳された文字列及び前記抽出した文字列にそれぞれ重畳する複数の空欄画像を作成する空欄作成部と、
前記原稿画像と、前記複数の空欄画像とを合成した合成画像を作成する画像合成部と
をさらに具備する。
Information processing device
A blank creation unit for creating a plurality of blank images to be superimposed on the character string on which the marking is superimposed and the extracted character string;
And an image composition unit for creating a composite image by combining the document image and the plurality of blank images.

本形態によれば、マーキングが重畳された文字列と同一のマーキングが重畳されていない文字列を原稿画像から抽出し、マーキングが重畳された文字列及び抽出した文字列にそれぞれ重畳する複数の空欄画像を作成する。これにより、解答となる同一の文字列を、確実に全て空欄にすることができる。したがって、解答となる文字列が文章中に表示されたままヒントになる事態がなくなり、また、問題作成者が、解答となる同一の文字列全てを手作業で抽出する手間がなくなる。   According to this embodiment, a character string that does not have the same marking as the character string on which the marking is superimposed is extracted from the document image, and the character string on which the marking is superimposed and a plurality of blank spaces that are respectively superimposed on the extracted character string Create an image. As a result, the same character string as an answer can be surely left blank. Therefore, there is no situation where the answer character string is displayed as a hint in the sentence, and the problem creator does not have to manually extract all the same character strings as the answer.

情報処理装置は、
前記原稿画像から、複数の文字を抽出する文字抽出部と、
前記文字抽出部が抽出した複数の文字を識別し、前記識別した複数の文字のうち前記マーキングが重畳された文字列を識別する文字識別部と
をさらに具備し、
前記文字列比較部は、前記文字識別部が識別した前記マーキングが重畳された文字列と同一の前記マーキングが重畳されていない文字列を、前記文字識別部が識別した複数の文字から抽出する。
Information processing device
A character extraction unit for extracting a plurality of characters from the document image;
A character identifying unit that identifies a plurality of characters extracted by the character extracting unit, and that identifies a character string on which the marking is superimposed among the plurality of identified characters;
The character string comparison unit extracts, from a plurality of characters identified by the character identification unit, a character string that does not have the same marking as the character string superimposed with the marking identified by the character identification unit.

情報処理装置は、
前記マーキング抽出部が抽出した前記マーキングの前記原稿画像内での位置及び形状を判定するマーキング判定部をさらに具備し、
前記文字識別部は、前記マーキングの位置及び形状及び形状をもとに、前記マーキングが重畳された文字列を識別する。
Information processing device
A marking determination unit that determines the position and shape of the marking extracted by the marking extraction unit in the document image;
The character identification unit identifies a character string on which the marking is superimposed based on the position, shape, and shape of the marking.

前記文字識別部は、光学文字認識(Optical Character Recognition)により、前記文字抽出部が抽出した複数の文字を識別する。   The character identification unit identifies a plurality of characters extracted by the character extraction unit by optical character recognition.

前記文字列比較部は、前記マーキングが重畳された文字列と、前記同一のマーキングが重畳されていない文字列とに、同一の符号を割り当てる。   The character string comparison unit assigns the same code to the character string on which the marking is superimposed and the character string on which the same marking is not superimposed.

これにより、同一の文字列を解答すべき複数の空欄に異なる符号を割り当てた故、回答者が、異なる語句を回答すべきであると誤解するおそれがなくなる。   As a result, since different codes are assigned to a plurality of blanks in which the same character string is to be answered, there is no possibility that the respondent will misunderstand that different words should be answered.

前記画像合成部は、前記原稿画像と、前記複数の空欄画像と、前記割り当てた符号の画像である符号画像とを合成した合成画像を作成する。   The image composition unit creates a composite image by combining the document image, the plurality of blank images, and a code image that is an image of the assigned code.

これにより、問題作成者が、同一の文字列を解答すべき複数の空欄に同一の符号を手作業で割り当てる手間がなくなり、また、誤った符号を割り当ててしまうおそれもなくなる。   As a result, the problem creator does not have to manually assign the same code to a plurality of blanks to which the same character string should be answered, and there is no possibility of assigning an incorrect code.

上記目的を達成するため、本発明の一形態に係るプログラムは、
情報処理装置を、
文字列に重畳されたマーキングを含む原稿画像から、前記マーキングを抽出するマーキング抽出部と、
前記マーキングが重畳された文字列と同一のマーキングが重畳されていない文字列を、前記原稿画像から抽出する文字列比較部
として機能させる。
In order to achieve the above object, a program according to an aspect of the present invention is provided.
Information processing device
A marking extraction unit for extracting the marking from the original image including the marking superimposed on the character string;
A character string that does not have the same marking as the character string on which the marking is superimposed is caused to function as a character string comparison unit that extracts from the document image.

本発明によれば、文字列に重畳されたマーキングを含む原稿画像から、マーキングされた文字列を解答とする穴埋め問題を作成することが可能な情報処理装置及びプログラムにおいて、ユーザーの利便性が向上する。   Advantageous Effects of Invention According to the present invention, in an information processing apparatus and program capable of creating a hole-filling problem using a marked character string as an answer from a manuscript image including markings superimposed on the character string, user convenience is improved. To do.

画像形成装置のハードウェア構成を示すブロック図である。2 is a block diagram illustrating a hardware configuration of the image forming apparatus. FIG. 画像形成装置の機能的構成を示すブロック図である。2 is a block diagram illustrating a functional configuration of the image forming apparatus. FIG. 画像形成装置の動作を示すフローチャートである。3 is a flowchart illustrating an operation of the image forming apparatus. 画像形成装置の動作を説明するための図である。It is a figure for demonstrating operation | movement of an image forming apparatus.

以下、図面を参照しながら、本発明の実施形態を説明する。   Hereinafter, embodiments of the present invention will be described with reference to the drawings.

(1.画像形成装置のハードウェア構成)
図1は、本発明の一実施形態に係る画像形成装置のハードウェア構成を示すブロック図である。
(1. Hardware configuration of image forming apparatus)
FIG. 1 is a block diagram showing a hardware configuration of an image forming apparatus according to an embodiment of the present invention.

本発明の各実施形態に係る情報処理装置は、画像形成装置(例えば、MFP、Multifunction Peripheral)であり、以下MFPと称する。   An information processing apparatus according to each embodiment of the present invention is an image forming apparatus (for example, MFP, Multifunction Peripheral), and is hereinafter referred to as an MFP.

MFP1は、制御部11を備える。制御部11は、CPU(Central Processing Unit)、RAM(Random Access Memory)、ROM(Read Only Memory)及び専用のハードウェア回路等から構成され、MFP1の全体的な動作制御を司る。MFP1を各機能部(後述)として機能させるコンピュータプログラムは、ROM等の非一過性の記憶媒体に記憶される。   The MFP 1 includes a control unit 11. The control unit 11 includes a CPU (Central Processing Unit), a RAM (Random Access Memory), a ROM (Read Only Memory), a dedicated hardware circuit, and the like, and controls overall operation of the MFP 1. A computer program that causes the MFP 1 to function as each functional unit (described later) is stored in a non-transitory storage medium such as a ROM.

制御部11は、画像読取部12、画像処理部14、画像メモリー15、画像形成部16、操作部17、記憶部18、ネットワーク通信部13等と接続されている。制御部11は、接続されている上記各部の動作制御や、各部との間での信号又はデータの送受信を行う。   The control unit 11 is connected to an image reading unit 12, an image processing unit 14, an image memory 15, an image forming unit 16, an operation unit 17, a storage unit 18, a network communication unit 13, and the like. The control unit 11 performs operation control of each of the above connected units and transmission / reception of signals or data to / from each unit.

制御部11は、ユーザーから、操作部17またはネッワーク接続されたパーソナルコンピュータ(図示せず)等を通じて入力されるジョブの実行指示に従って、スキャナ機能、印刷機能及びコピー機能機能などの各機能についての動作制御を実行するために必要な機構の駆動及び処理を制御する。   The control unit 11 operates for each function such as a scanner function, a print function, and a copy function function in accordance with a job execution instruction input from the user through the operation unit 17 or a personal computer (not shown) connected via a network. Controls the drive and processing of the mechanisms necessary to perform the control.

画像読取部12は、原稿から画像を読み取る。   The image reading unit 12 reads an image from a document.

画像処理部14は、画像読取部12で読み取られた画像の画像データを必要に応じて画像処理する。例えば、画像処理部14は、画像読取部12により読み取られた画像が画像形成された後の品質を向上させるために、シェーディング補正等の画像処理を行う。   The image processing unit 14 performs image processing on the image data of the image read by the image reading unit 12 as necessary. For example, the image processing unit 14 performs image processing such as shading correction in order to improve the quality after the image read by the image reading unit 12 is formed.

画像メモリー15は、画像読取部12による読み取りで得られた原稿画像のデータを一時的に記憶したり、画像形成部16での印刷対象となるデータを一時的に記憶したりする領域を有する。   The image memory 15 has an area for temporarily storing document image data obtained by reading by the image reading unit 12 and temporarily storing data to be printed by the image forming unit 16.

画像形成部16は、画像読取部12で読み取られた画像データ等の画像形成を行う。   The image forming unit 16 forms an image of the image data read by the image reading unit 12.

操作部17は、MFP1が実行可能な各種動作及び処理についてユーザーからの指示を受け付けるタッチパネル部および操作キー部を備える。タッチパネル部は、タッチパネルが設けられたLCD(Liquid Crystal Display)等の表示部17aを備えている。   The operation unit 17 includes a touch panel unit and operation key units that receive instructions from the user regarding various operations and processes that can be executed by the MFP 1. The touch panel unit includes a display unit 17a such as an LCD (Liquid Crystal Display) provided with a touch panel.

ネットワーク通信部13は、ネットワークに接続するためのインタフェースである。   The network communication unit 13 is an interface for connecting to a network.

記憶部18は、画像読取部12によって読み取られた原稿画像等を記憶する、HDD(Hard Disk Drive)などの大容量の記憶装置である。   The storage unit 18 is a large-capacity storage device such as an HDD (Hard Disk Drive) that stores a document image read by the image reading unit 12.

(2.画像形成装置の機能的構成)
図2は、画像形成装置の機能的構成を示すブロック図である。
(2. Functional configuration of image forming apparatus)
FIG. 2 is a block diagram illustrating a functional configuration of the image forming apparatus.

MFP1は、情報処理プログラムを実行することで、マーキング抽出部101、マーキング判定部102、文字抽出部103、文字識別部111、文字列比較部113、空欄作成部105及び画像合成部106として機能する。   The MFP 1 functions as a marking extraction unit 101, a marking determination unit 102, a character extraction unit 103, a character identification unit 111, a character string comparison unit 113, a blank creation unit 105, and an image composition unit 106 by executing an information processing program. .

マーキング抽出部101は、画像読取部12が読み取った原稿画像から、文字列に重畳されたマーキングを抽出する。   The marking extraction unit 101 extracts the marking superimposed on the character string from the document image read by the image reading unit 12.

マーキング判定部102は、マーキング抽出部101が抽出したマーキングの、原稿画像内での位置及び形状を判定する。   The marking determination unit 102 determines the position and shape of the marking extracted by the marking extraction unit 101 in the document image.

文字抽出部103は、画像読取部12が読み取った原稿画像から、複数の文字を抽出する。   The character extraction unit 103 extracts a plurality of characters from the document image read by the image reading unit 12.

文字識別部111は、OCR用データベース112を参照し、文字抽出部103が抽出した複数の文字それぞれを識別する。文字識別部111は、マーキング判定部102が判定したマーキングの位置及び形状をもとに、マーキングが重畳された文字列を、文字コードの組み合わせにより識別する。   The character identifying unit 111 refers to the OCR database 112 and identifies each of the plurality of characters extracted by the character extracting unit 103. Based on the marking position and shape determined by the marking determination unit 102, the character identification unit 111 identifies a character string on which the marking is superimposed by a combination of character codes.

文字列比較部113は、文字識別部111が識別したマーキングが重畳された文字列と同一のマーキングが重畳されていない文字列を、文字識別部111が識別した複数の文字から抽出する。   The character string comparison unit 113 extracts, from a plurality of characters identified by the character identification unit 111, a character string that does not have the same marking as the character string superimposed with the marking identified by the character identification unit 111.

空欄作成部105は、文字列比較部113が抽出したマーキングが重畳されていない文字列と、マーキングが重畳された文字列とのそれぞれに重畳する空欄画像を作成する。   The blank creation unit 105 creates a blank image to be superimposed on each of the character string on which the marking extracted by the character string comparison unit 113 is not superimposed and the character string on which the marking is superimposed.

画像合成部106は、画像読取部12が読み取った原稿画像と、空欄作成部105が作成した空欄画像とを合成した合成画像を作成する。   The image composition unit 106 creates a composite image by combining the document image read by the image reading unit 12 and the blank image created by the blank creation unit 105.

(3.画像形成装置の動作)
図3は、画像形成装置の動作を示すフローチャートである。図4は、画像形成装置の動作を説明するための図である。
(3. Operation of image forming apparatus)
FIG. 3 is a flowchart showing the operation of the image forming apparatus. FIG. 4 is a diagram for explaining the operation of the image forming apparatus.

前提として、原稿(典型的には、紙)には、テキストデータとしての文字列が印字されている。あるいは、原稿には、画像データとしての文字列の画像が形成されている(文字列が印字された原稿がコピーされている)。そして、文字列全体のうち複数の一部の文字列(熟語、文節、数値等)が、ユーザーである問題作成者により、蛍光マーカーペン等を用いて手書きでマーキングされている。マーキングされた文字列は、穴埋め問題において、解答となる文字列である。   As a premise, a character string as text data is printed on an original (typically, paper). Alternatively, a character string image as image data is formed on the document (a document on which the character string is printed is copied). A plurality of partial character strings (jukugo, phrases, numerical values, etc.) of the entire character string are marked by hand using a fluorescent marker pen or the like by a problem creator as a user. The marked character string is a character string that becomes an answer in the hole filling problem.

画像読取部12は、原稿を光学的にスキャンし、原稿画像を読み取る(ステップS101、図4参照)。「原稿画像」は、全体的に見れば多数の文字列を含む文書原稿の画像データであり、複数の文字列に重畳された複数のマーキング(図4に示すハッチング部分)を含む。「文字列」は、語句(単語、文節、文章等)、数値等であり、厳密には、その画像である。   The image reading unit 12 optically scans the original and reads the original image (step S101, see FIG. 4). The “document image” is image data of a document document including a large number of character strings as a whole, and includes a plurality of markings (hatched portions shown in FIG. 4) superimposed on a plurality of character strings. The “character string” is a phrase (word, phrase, sentence, etc.), a numerical value, and the like, strictly speaking, an image thereof.

マーキング抽出部101は、画像読取部12が読み取った原稿画像から、文字列に重畳されたマーキングを抽出する(ステップS102)。具体的には、マーキング抽出部101は、背景(白色等)と明度及び/又は彩度等が異なり、特定の形状及びサイズ(特定の幅の帯状の長方形等)の領域を、マーキングとして抽出する。   The marking extraction unit 101 extracts the marking superimposed on the character string from the document image read by the image reading unit 12 (step S102). Specifically, the marking extraction unit 101 extracts a region having a specific shape and size (such as a strip-shaped rectangle having a specific width) that is different from the background (white or the like) in brightness and / or saturation and the like as a marking. .

マーキング判定部102は、マーキング抽出部101が抽出したマーキングの、原稿画像内での位置及び形状を判定する(ステップS103)。具体的には、マーキング判定部102は、原稿画像全体を座標系全体として、マーキングの位置及び形状を座標として算出する。   The marking determination unit 102 determines the position and shape of the marking extracted by the marking extraction unit 101 in the document image (step S103). Specifically, the marking determination unit 102 calculates the entire document image as the entire coordinate system and the marking position and shape as coordinates.

一方、ステップS102及びS103と並行して、文字抽出部103は、画像読取部12が読み取った原稿画像から、複数の文字を抽出する(ステップS104)。具体的には、文字抽出部103は、原稿画像に含まれる全ての文字を、エッジ検出により抽出する。言い換えれば、文字抽出部103は、原稿画像を、エッジ検出により1文字1文字の文字に分解する。すなわち「文字」は、原稿画像に含まれるに含まれる1文字1文字(言語によっては、1語1語としてもよい。)であり、厳密には、その画像である。   On the other hand, in parallel with steps S102 and S103, the character extraction unit 103 extracts a plurality of characters from the document image read by the image reading unit 12 (step S104). Specifically, the character extraction unit 103 extracts all characters included in the document image by edge detection. In other words, the character extraction unit 103 decomposes the document image into one character per character by edge detection. That is, the “character” is one character per character included in the original image (may be one word per word depending on the language), and strictly speaking, the image.

文字識別部111は、OCR用データベース112を参照し、文字抽出部103が抽出した複数の文字それぞれを識別する(ステップS105)。具体的には、OCR用データベース112には、文字の画像パターンと文字コードとが対応付けられて1文字ずつ登録されている。文字識別部111は、文字抽出部103が抽出した文字を示す画像パターンをOCR用データベース112から検索し、検索により得られた画像パターンが対応付けられた文字コードを取得する。文字識別部111は、原稿画像に含まれる全ての文字について、文字コードを取得する。   The character identifying unit 111 refers to the OCR database 112 and identifies each of the plurality of characters extracted by the character extracting unit 103 (step S105). Specifically, in the OCR database 112, character image patterns and character codes are associated and registered one by one. The character identifying unit 111 searches the OCR database 112 for an image pattern indicating the character extracted by the character extracting unit 103, and acquires a character code associated with the image pattern obtained by the search. The character identification unit 111 acquires character codes for all characters included in the document image.

文字識別部111は、マーキング判定部102が判定したマーキングの位置及び形状をもとに、マーキングが重畳された文字列を識別する。文字識別部111は、マーキングが重畳された文字列に含まれる全ての文字それぞれの文字コードを組み合わせることで、マーキングが重畳された文字列を、この組み合わせた文字コードにより識別する(ステップS106)。   The character identifying unit 111 identifies the character string on which the marking is superimposed based on the marking position and shape determined by the marking determining unit 102. The character identifying unit 111 identifies the character string on which the marking is superimposed by combining the character codes of all the characters included in the character string on which the marking is superimposed (Step S106).

文字列比較部113は、文字識別部111が識別したマーキングが重畳された文字列と同一のマーキングが重畳されていない文字列を、文字識別部111が識別した複数の文字から抽出する(ステップS107、図4参照)。具体的には、文字列比較部113は、マーキングが重畳された文字列の文字コードの組み合わせと、マーキングが重畳されていない文字の文字コードとを比較する。そして、文字列比較部113は、マーキングが重畳された文字列の文字コードの組み合わせと同一の、原稿画像に含まれる全てのマーキングが重畳されていない文字のうち連続する文字コードの組み合わせを抽出する。図4に示す例では、文字列「DEF」及び「YZ」が抽出されている。   The character string comparison unit 113 extracts, from the plurality of characters identified by the character identification unit 111, a character string that does not have the same marking as the character string superimposed with the marking identified by the character identification unit 111 (step S107). FIG. 4). Specifically, the character string comparison unit 113 compares the character code combination of the character string with the marking superimposed thereon with the character code of the character with no marking superimposed thereon. Then, the character string comparison unit 113 extracts a combination of consecutive character codes out of all the characters included in the document image on which the marking is not superimposed, which is the same as the character code combination of the character string on which the marking is superimposed. . In the example shown in FIG. 4, character strings “DEF” and “YZ” are extracted.

文字列比較部113が、マーキングが重畳された文字列と同一のマーキングが重畳されていない文字列を抽出すると(ステップS108、YES)、空欄作成部105は、文字列比較部113が抽出したマーキングが重畳されていない文字列と(ステップS109)、マーキングが重畳された文字列とのそれぞれに重畳する空欄画像を作成する(ステップS110、図4参照)。一方、文字列比較部113が、マーキングが重畳された文字列と同一のマーキングが重畳されていない文字列を抽出しなければ(ステップS108、NO)、空欄作成部105は、マーキングが重畳された文字列に重畳する空欄画像を作成する(ステップS110)。具体的には、空欄作成部105は、文字抽出部103がエッジ検出により抽出した文字(ステップS104)と、マーキングが重畳されている場合には、この文字からはみ出たマーキングの縁部分とを消し込むような形状及び位置(座標)の空欄画像を作成する。空欄画像は、単なるブランクでも良いし、予め決められたスタイル(下線、矩形枠、括弧等)を含んでも良い。図4に示す例では、空欄画像は下線を含んでいる。   When the character string comparison unit 113 extracts a character string that does not have the same marking as the character string with the marking superimposed (step S108, YES), the blank space creation unit 105 performs the marking extracted by the character string comparison unit 113. A blank image is created to be superimposed on each of the character string that is not superimposed (step S109) and the character string on which the marking is superimposed (step S110, see FIG. 4). On the other hand, if the character string comparison unit 113 does not extract a character string that does not have the same marking as the character string on which the marking is superimposed (step S108, NO), the blank creation unit 105 displays the marking superimposed. A blank image to be superimposed on the character string is created (step S110). Specifically, the blank creation unit 105 erases the character (step S104) extracted by the edge detection by the character extraction unit 103 and the marking edge that protrudes from the character when the marking is superimposed. A blank image having a shape and position (coordinates) to be embedded is created. The blank image may be a simple blank or may include a predetermined style (underline, rectangular frame, parentheses, etc.). In the example shown in FIG. 4, the blank image includes an underline.

画像合成部106は、画像読取部12が読み取った原稿画像(ステップS101)と、空欄作成部105が作成した空欄画像(ステップS109、S110)とを合成した合成画像を作成する(ステップS111、図4参照)。具体的には、画像合成部106は、原稿画像の座標系に、形状及び位置が座標により定義される空欄画像を配置する。図4に示す例では、原稿画像と、下線を含む空欄画像とが合成されている。   The image synthesizing unit 106 creates a synthesized image obtained by synthesizing the original image read by the image reading unit 12 (step S101) and the blank images created by the blank creating unit 105 (steps S109 and S110) (step S111, FIG. 4). Specifically, the image composition unit 106 arranges a blank image whose shape and position are defined by coordinates in the coordinate system of the document image. In the example shown in FIG. 4, the original image and the blank image including the underline are combined.

画像形成部16は、画像合成部106が作成した合成画像を、用紙に形成(プリントアウト)する(ステップS112)。   The image forming unit 16 forms (prints out) the composite image created by the image composition unit 106 on a sheet (step S112).

(4.変形例)
実施形態では、空欄画像は単なるブランク等としたが、空欄画像に符号(数字、文字、記号等)を割り当ててもよい。
(4. Modifications)
In the embodiment, the blank image is simply blank or the like, but a code (number, character, symbol, etc.) may be assigned to the blank image.

すなわち、一変形例において、文字列比較部113は、マーキングが重畳された文字列と、これと同一のマーキングが重畳されていない文字列とに、同一の符号(数字、文字、記号等)を割り当てる。   That is, in one modification, the character string comparison unit 113 assigns the same code (number, character, symbol, etc.) to the character string on which the marking is superimposed and the character string on which the same marking is not superimposed. assign.

画像合成部106は、画像読取部12が読み取った原稿画像と、空欄作成部105が作成した空欄画像と、文字列比較部113が割り当てた符号の画像である符号画像とを合成した合成画像を作成する。具体的には、画像合成部106は、原稿画像に配置された空欄画像の予め定められた位置(中央、左端等)に、予め定められたスタイル(フォント、サイズ等)の符号を配置することで、合成画像を作成する。   The image composition unit 106 synthesizes a composite image obtained by combining the document image read by the image reading unit 12, the blank image created by the blank creation unit 105, and the code image that is the code image assigned by the character string comparison unit 113. create. Specifically, the image composition unit 106 arranges a code of a predetermined style (font, size, etc.) at a predetermined position (center, left end, etc.) of a blank image arranged in the document image. A composite image is created.

実施形態では、画像読取部12が原稿画像を読み取った(ステップS101)。これに替えて、MFP1は、ネットワーク通信部13を通じて、ネットワークに接続された情報処理装置(図示せず)から原稿画像を受信しても良い。   In the embodiment, the image reading unit 12 reads a document image (step S101). Instead, the MFP 1 may receive a document image from an information processing apparatus (not shown) connected to the network through the network communication unit 13.

(5.まとめ)
元原稿を利用して穴埋め問題を作成する場合、1つの文章中に、解答となる文字列が何度も出現することがある。この場合、解答となる文字列が文章中に表示されたままだとヒントになってしまうため、解答となる同一の文字列は、全て空欄にする必要がある。しかし、問題作成者が、解答となる同一の文字列全てを手作業で抽出することは、手間となる上、確実に同一の文字列全てを抽出することは困難である。
(5. Summary)
When creating a hole-filling problem using an original manuscript, a character string as an answer may appear many times in one sentence. In this case, if the character string that becomes the answer is displayed as a hint in the sentence, it is necessary to leave all the same character strings that become the answer blank. However, it is troublesome for the problem creator to manually extract all the same character strings that are the answers, and it is difficult to reliably extract all the same character strings.

これに対して、実施形態によれば、MFP1は、マーキングが重畳された文字列と同一のマーキングが重畳されていない文字列を原稿画像から抽出し(ステップS107)、マーキングが重畳された文字列及び抽出した文字列にそれぞれ重畳する複数の空欄画像を作成する(ステップS109、S110)。これにより、解答となる同一の文字列を、確実に全て空欄にすることができる。したがって、解答となる文字列が文章中に表示されたままヒントになる事態がなくなり、また、問題作成者が、解答となる同一の文字列全てを手作業で抽出する手間がなくなる。   On the other hand, according to the embodiment, the MFP 1 extracts, from the document image, a character string that does not have the same marking as the character string on which the marking is superimposed (step S107), and the character string on which the marking is superimposed. A plurality of blank images to be superimposed on the extracted character strings are created (steps S109 and S110). As a result, the same character string as an answer can be surely left blank. Therefore, there is no situation where the answer character string is displayed as a hint in the sentence, and the problem creator does not have to manually extract all the same character strings as the answer.

また、同一の文字列を解答すべき複数の空欄に異なる符号を割り当てると、回答者が、異なる語句を回答すべきであると誤解するおそれがある。この事態を防ぐため、問題作成者が、同一の文字列を解答すべき複数の空欄に同一の符号を手作業で割り当てることは、手間となる。特に、空欄の総数が多い場合や、同一の文字列の組が複数組ある場合等には、問題作成者が手作業で符号を割り当てるとなると、誤った符号を割り当ててしまうおそれもある。   Moreover, if different codes are assigned to a plurality of blanks in which the same character string is to be answered, the respondent may misunderstand that different words / phrases should be answered. In order to prevent this situation, it is troublesome for the problem creator to manually assign the same code to a plurality of blanks to which the same character string should be answered. In particular, when the total number of blanks is large or when there are a plurality of sets of the same character string, if the problem creator manually assigns a code, there is a possibility that an incorrect code is assigned.

これに対して、変形例によれば、MFP1は、マーキングが重畳された文字列と、これと同一のマーキングが重畳されていない文字列とに、同一の符号を割り当てる。これにより、同一の文字列を解答すべき複数の空欄に異なる符号を割り当てた故、回答者が、異なる語句を回答すべきであると誤解するおそれがなくなる。また、問題作成者が、同一の文字列を解答すべき複数の空欄に同一の符号を手作業で割り当てる手間がなくなり、また、誤った符号を割り当ててしまうおそれもなくなる。   On the other hand, according to the modification, the MFP 1 assigns the same code to the character string on which the marking is superimposed and the character string on which the same marking is not superimposed. As a result, since different codes are assigned to a plurality of blanks in which the same character string is to be answered, there is no possibility that the respondent will misunderstand that different words should be answered. In addition, there is no need for the problem creator to manually assign the same code to a plurality of blanks in which the same character string should be answered, and there is no possibility of assigning an incorrect code.

なお、各実施形態では、複数の文字を有する文字列がマーキングされた場合の処理を説明したが、1文字からなる文字列がマーキングされた場合も図3に準じて処理を行うことも可能である。この場合、図3に示すステップS106において、文字列識別部111は、文字列に含まれる全ての文字それぞれの文字コードを組み合わせる必要はなく、マーキングが重畳された1文字の文字コードにより文字を識別すればよい。加えて、図3に示すステップS107において、文字列識別部111は、マーキングが重畳された1文字の文字コードと、マーキングが重畳されていない文字の文字コードを比較し、マーキングが重畳された1文字の文字コードと同一の、原稿画像に含まれる全てのマーキングが重畳されていない文字を抽出すればよい。   In each embodiment, the processing when a character string having a plurality of characters is marked has been described. However, even when a character string consisting of one character is marked, the processing can be performed according to FIG. is there. In this case, in step S106 shown in FIG. 3, the character string identifying unit 111 does not need to combine the character codes of all the characters included in the character string, and identifies the character by one character code on which the marking is superimposed. do it. In addition, in step S107 shown in FIG. 3, the character string identification unit 111 compares the character code of one character on which the marking is superimposed with the character code of the character on which the marking is not superimposed. What is necessary is just to extract the character which is the same as the character code of a character, and in which all the markings contained in a manuscript image are not superimposed.

また、1文字(言語によっては、1単語)がマーキングされた場合、図3に示す処理の実行を回避してもよい。一般的に、同じ原稿の中で同じ1文字がそれぞれ異なる使われ方をしていることがある。このような場合に、ユーザーの意図しない1文字が空欄になるのを防ぐことができる。   Further, when one character (one word depending on the language) is marked, the execution of the process shown in FIG. 3 may be avoided. In general, the same character may be used differently in the same document. In such a case, it is possible to prevent one character unintended by the user from being left blank.

1…MFP
12…画像読取部
16…画像形成部
101…マーキング抽出部
102…マーキング判定部
103…文字抽出部
105…空欄作成部
106…画像合成部
111…文字識別部
112…OCR用データベース
113…文字列比較部
1 ... MFP
DESCRIPTION OF SYMBOLS 12 ... Image reading part 16 ... Image formation part 101 ... Marking extraction part 102 ... Marking determination part 103 ... Character extraction part 105 ... Blank creation part 106 ... Image composition part 111 ... Character identification part 112 ... OCR database 113 ... Character string comparison Part

Claims (8)

文字列に重畳されたマーキングを含む原稿画像から、前記マーキングを抽出するマーキング抽出部と、
前記マーキングが重畳された文字列と同一のマーキングが重畳されていない文字列を、前記原稿画像から抽出する文字列比較部と
を具備する情報処理装置。
A marking extraction unit for extracting the marking from the original image including the marking superimposed on the character string;
An information processing apparatus comprising: a character string comparison unit that extracts, from the document image, a character string that does not have the same marking as the character string on which the marking is superimposed.
請求項1に記載の情報処理装置であって、
前記マーキングが重畳された文字列及び前記抽出した文字列にそれぞれ重畳する複数の空欄画像を作成する空欄作成部と、
前記原稿画像と、前記複数の空欄画像とを合成した合成画像を作成する画像合成部と
をさらに具備する情報処理装置。
The information processing apparatus according to claim 1,
A blank creation unit for creating a plurality of blank images to be superimposed on the character string on which the marking is superimposed and the extracted character string;
An information processing apparatus further comprising: an image composition unit that creates a composite image by combining the document image and the plurality of blank images.
請求項1又は2に記載の情報処理装置であって、
前記原稿画像から、複数の文字を抽出する文字抽出部と、
前記文字抽出部が抽出した複数の文字を識別し、前記識別した複数の文字のうち前記マーキングが重畳された文字列を識別する文字識別部と
をさらに具備し、
前記文字列比較部は、前記文字識別部が識別した前記マーキングが重畳された文字列と同一の前記マーキングが重畳されていない文字列を、前記文字識別部が識別した複数の文字から抽出する
情報処理装置。
The information processing apparatus according to claim 1 or 2,
A character extraction unit for extracting a plurality of characters from the document image;
A character identifying unit that identifies a plurality of characters extracted by the character extracting unit, and that identifies a character string on which the marking is superimposed among the plurality of identified characters;
The character string comparison unit extracts, from a plurality of characters identified by the character identification unit, a character string that is not superimposed with the same marking as the character string superimposed with the marking identified by the character identification unit. Processing equipment.
請求項3に記載の情報処理装置であって、
前記マーキング抽出部が抽出した前記マーキングの前記原稿画像内での位置及び形状を判定するマーキング判定部をさらに具備し、
前記文字識別部は、前記マーキングの位置及び形状及び形状をもとに、前記マーキングが重畳された文字列を識別する
情報処理装置。
The information processing apparatus according to claim 3,
A marking determination unit that determines the position and shape of the marking extracted by the marking extraction unit in the document image;
The said character identification part identifies the character string with which the said marking was superimposed based on the position of the said marking, a shape, and a shape. Information processing apparatus.
請求項3又は4に記載の情報処理装置であって、
前記文字識別部は、光学文字認識(Optical Character Recognition)により、前記文字抽出部が抽出した複数の文字を識別する
情報処理装置。
An information processing apparatus according to claim 3 or 4,
The information processing apparatus, wherein the character identification unit identifies a plurality of characters extracted by the character extraction unit by optical character recognition.
請求項1乃至5の何れか一項に記載の情報処理装置であって、
前記文字列比較部は、前記マーキングが重畳された文字列と、前記同一のマーキングが重畳されていない文字列とに、同一の符号を割り当てる
情報処理装置。
An information processing apparatus according to any one of claims 1 to 5,
The information processing apparatus, wherein the character string comparison unit assigns the same code to a character string on which the marking is superimposed and a character string on which the same marking is not superimposed.
請求項2乃至6の何れか一項に記載の情報処理装置であって、
前記画像合成部は、前記原稿画像と、前記複数の空欄画像と、前記割り当てた符号の画像である符号画像とを合成した合成画像を作成する
情報処理装置。
An information processing apparatus according to any one of claims 2 to 6,
The image synthesizing unit creates a synthesized image by synthesizing the document image, the plurality of blank images, and a code image that is an image of the assigned code.
情報処理装置を、
文字列に重畳されたマーキングを含む原稿画像から、前記マーキングを抽出するマーキング抽出部と、
前記マーキングが重畳された文字列と同一のマーキングが重畳されていない文字列を、前記原稿画像から抽出する文字列比較部
として機能させるプログラム。
Information processing device
A marking extraction unit for extracting the marking from the original image including the marking superimposed on the character string;
A program that functions as a character string comparison unit that extracts a character string that does not have the same marking as the character string on which the marking is superimposed from the document image.
JP2016038684A 2016-03-01 2016-03-01 Information processing apparatus and program Expired - Fee Related JP6561876B2 (en)

Priority Applications (7)

Application Number Priority Date Filing Date Title
JP2016038684A JP6561876B2 (en) 2016-03-01 2016-03-01 Information processing apparatus and program
CN201910828875.3A CN110636181A (en) 2016-03-01 2017-02-09 Information processing apparatus
CN201910829510.2A CN110740221B (en) 2016-03-01 2017-02-09 Information processing apparatus
CN201710070630.XA CN107147820B (en) 2016-03-01 2017-02-09 Information processing unit
US15/438,331 US10425556B2 (en) 2016-03-01 2017-02-21 Information processing apparatus
US16/524,364 US10681245B2 (en) 2016-03-01 2019-07-29 Information processing apparatus
US16/524,424 US10715699B2 (en) 2016-03-01 2019-07-29 Information processing apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016038684A JP6561876B2 (en) 2016-03-01 2016-03-01 Information processing apparatus and program

Publications (2)

Publication Number Publication Date
JP2017157994A true JP2017157994A (en) 2017-09-07
JP6561876B2 JP6561876B2 (en) 2019-08-21

Family

ID=59810822

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016038684A Expired - Fee Related JP6561876B2 (en) 2016-03-01 2016-03-01 Information processing apparatus and program

Country Status (1)

Country Link
JP (1) JP6561876B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102018119497A1 (en) 2017-08-18 2019-02-21 Shimano Inc. BICYCLE COMPONENTS

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0695583A (en) * 1992-09-09 1994-04-08 Brother Ind Ltd Learning support device
JP2005070939A (en) * 2003-08-21 2005-03-17 Sharp Corp Character string processor, character string processing method, program, and recording medium
US20060289625A1 (en) * 2005-06-24 2006-12-28 Fuji Xerox Co., Ltd. Question paper forming apparatus and question paper forming method
US20070206883A1 (en) * 2006-03-06 2007-09-06 Fuji Xerox Co., Ltd. Image processing apparatus and recording medium recording image processing program
JP2009017041A (en) * 2007-07-02 2009-01-22 Ricoh Co Ltd Image processing multifunction device
JP2013073310A (en) * 2011-09-27 2013-04-22 Dainippon Printing Co Ltd Computer device and program

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0695583A (en) * 1992-09-09 1994-04-08 Brother Ind Ltd Learning support device
JP2005070939A (en) * 2003-08-21 2005-03-17 Sharp Corp Character string processor, character string processing method, program, and recording medium
US20060289625A1 (en) * 2005-06-24 2006-12-28 Fuji Xerox Co., Ltd. Question paper forming apparatus and question paper forming method
JP2007004523A (en) * 2005-06-24 2007-01-11 Fuji Xerox Co Ltd Apparatus and method for preparing question sheet
US20070206883A1 (en) * 2006-03-06 2007-09-06 Fuji Xerox Co., Ltd. Image processing apparatus and recording medium recording image processing program
JP2009017041A (en) * 2007-07-02 2009-01-22 Ricoh Co Ltd Image processing multifunction device
JP2013073310A (en) * 2011-09-27 2013-04-22 Dainippon Printing Co Ltd Computer device and program

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102018119497A1 (en) 2017-08-18 2019-02-21 Shimano Inc. BICYCLE COMPONENTS

Also Published As

Publication number Publication date
JP6561876B2 (en) 2019-08-21

Similar Documents

Publication Publication Date Title
JP2008192032A (en) Document processing device, document processing method, and program
US9558433B2 (en) Image processing apparatus generating partially erased image data and supplementary data supplementing partially erased image data
JP7337612B2 (en) Image processing device, image processing system, image processing method, and program
US10715699B2 (en) Information processing apparatus
JP7039882B2 (en) Image analysis device and image analysis program
JP2008276677A (en) Support device for character recognition, character recognition device and program
JP6561876B2 (en) Information processing apparatus and program
US9860398B2 (en) Information processing apparatus that creates other documents from read document
JP2018055256A (en) Information processing apparatus, information processing method, and program
JP2008282094A (en) Character recognition processing apparatus
JP4807618B2 (en) Image processing apparatus and image processing program
JP6489041B2 (en) Information processing apparatus and program
JP6729486B2 (en) Information processing apparatus, information processing program, and information processing method
JP2006276905A (en) Translation device, image processing device, image forming device, and translation method and program
JP6565740B2 (en) Information processing apparatus and program
JP2013182459A (en) Information processing apparatus, information processing method, and program
JP2020099031A (en) Information processing apparatus and information processing method
JP2020053891A (en) Information processing apparatus, information processing method, and program
JP6520761B2 (en) Information processing apparatus and program
JP2020099030A (en) Information processing apparatus and information processing method
US20210303843A1 (en) Information processing apparatus
WO2022097408A1 (en) Image processing device and image forming device
US10659654B2 (en) Information processing apparatus for generating an image surrounded by a marking on a document, and non-transitory computer readable recording medium that records an information processing program for generating an image surrounded by a marking on a document
JP2021157627A (en) Information processing device
JP2010146143A (en) Document processing apparatus and program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20171227

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190118

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190205

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190329

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190625

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190708

R150 Certificate of patent or registration of utility model

Ref document number: 6561876

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees