JP6702198B2 - 情報処理装置及びプログラム - Google Patents
情報処理装置及びプログラム Download PDFInfo
- Publication number
- JP6702198B2 JP6702198B2 JP2017002505A JP2017002505A JP6702198B2 JP 6702198 B2 JP6702198 B2 JP 6702198B2 JP 2017002505 A JP2017002505 A JP 2017002505A JP 2017002505 A JP2017002505 A JP 2017002505A JP 6702198 B2 JP6702198 B2 JP 6702198B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- attribute
- area
- character string
- marking
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/416—Extracting the logical structure, e.g. chapters, sections or page numbers; Identifying elements of the document, e.g. authors
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/387—Composing, repositioning or otherwise geometrically modifying originals
- H04N1/3876—Recombination of partial images to recreate the original image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/22—Character recognition characterised by the type of writing
- G06V30/224—Character recognition characterised by the type of writing of printed characters having additional code marks or containing code marks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/387—Composing, repositioning or otherwise geometrically modifying originals
- H04N1/3871—Composing, repositioning or otherwise geometrically modifying originals the composed originals being of different kinds, e.g. low- and high-resolution originals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/387—Composing, repositioning or otherwise geometrically modifying originals
- H04N1/3872—Repositioning or masking
- H04N1/3873—Repositioning or masking defined only by a limited number of coordinate points or parameters, e.g. corners, centre; for trimming
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/40—Picture signal circuits
- H04N1/40062—Discrimination between different image types, e.g. two-tone, continuous tone
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N2201/00—Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
- H04N2201/0077—Types of the still picture apparatus
- H04N2201/0094—Multifunctional device, i.e. a device capable of all of reading, reproducing, copying, facsimile transception, file transception
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- Editing Of Facsimile Originals (AREA)
- Character Input (AREA)
- Image Analysis (AREA)
- Processing Or Creating Images (AREA)
Description
原稿画像から、属性情報を示す画像である属性画像を含み得るエリアである属性エリアを検出する属性エリア検出部と、
前記属性エリアに含まれる属性画像を検出する属性画像検出部と、
前記属性画像が示す属性情報を抽出する属性情報抽出部と、
前記原稿画像のうち前記属性エリアを除くエリアである記事エリアから、マーキング画像を検出するマーキング検出部と、
前記原稿画像から、前記マーキング画像により囲まれた画像であるマーキングエリア画像を生成するマーキングエリア画像生成部と、
前記マーキングエリア画像と前記属性情報を示す文字列とを合成して、合成画像を生成する合成画像生成部と
を具備する。
前記マーキングエリア画像と、前記属性情報を示す文字列とを、互いに関連付けて記録する画像記録部
をさらに具備する。
前記合成画像生成部は、さらに、
前記画像記録部に記録された複数組の前記マーキングエリア画像と前記属性情報を示す文字列のうち、
同じ前記属性情報を示す文字列に関連付けられた複数の前記マーキングエリア画像と、前記同じ属性情報を示す文字列とを合成して、合成画像を生成する。
前記属性画像検出部は、光学文字認識(Optical Character Recognition)により、前記属性画像に含まれる前記文字列を識別し、
前記属性情報抽出部は、前記文字列を、前記属性情報を記憶するデータベースと照合することにより、前記属性画像が示す属性情報を抽出する。
前記合成画像を印刷する画像形成部
をさらに具備する。
原稿から前記原稿画像を読み取る画像読取部
をさらに具備する。
情報処理装置を、
原稿画像から、属性情報を示す画像である属性画像を含み得るエリアである属性エリアを検出する属性エリア検出部と、
前記属性エリアに含まれる属性画像を検出する属性画像検出部と、
前記属性画像が示す属性情報を抽出する属性情報抽出部と、
前記原稿画像のうち前記属性エリアを除くエリアである記事エリアから、マーキング画像を検出するマーキング検出部と、
前記原稿画像から、前記マーキング画像により囲まれた画像であるマーキングエリア画像を生成するマーキングエリア画像生成部と、
前記マーキングエリア画像と前記属性情報を示す文字列とを合成して、合成画像を生成する合成画像生成部と
して機能させる。
図1は、本開示の一実施形態に係る画像形成装置のハードウェア構成を示す。
図2は、画像形成装置の機能的構成を示す。
図3は、画像形成装置の動作フローを示す。
図4に示すように、罫線201は原稿画像200の上部にあり、罫線201と原稿画像200のエッジ202との間に、文字列「43 General 星印 14th Edition [3rd class mail] [Monthly 4509 yen (including tax 334 yen) Morning 160 yen, Evening 70 yen] THE ABCDE TIMES 25 December 2015 (Friday)」が記載されている。属性エリア203は、罫線201とエッジ202との間のエリアから後述する方法で検出される。属性画像204は、属性情報を示す文字列の画像であって、属性エリア203に含まれる。記事エリア205は、属性エリア203以外のエリアである。マーキング画像206は、記事エリア205の一部(例えば、記事エリア205に含まれる一部の記事)を囲む線の画像であって、図4では太線で示されている。本実施形態では、ユーザーが蛍光ペンや赤ペン等のマーカーを用いて、記事エリア205の一部をマーキングすることを想定している。マーキングエリア画像207は、マーキング画像206によって囲まれているエリアの画像である。
合成画像生成部107は、互いに関連付けて記憶部18に記録された、マーキングエリア画像生成部105が生成したマーキングエリア画像207と、属性情報抽出部103が抽出した属性情報を示す文字列301(テキスト)とを合成して、合成画像300を生成する(ステップS110)。合成画像生成部107は、生成した合成画像300を画像形成部16に出力し、印刷させる(ステップS111)。
本実施形態では、合成画像生成部107は、マーキングエリア画像207と属性情報を示す文字列(テキスト)とを合成して、合成画像300を生成した。これに替えて、合成画像生成部107は、マーキングエリア画像207と、属性画像検出部102が検出した属性画像204とを合成して、合成画像(図示せず)を生成してもよい。
本実施形態によれば、ユーザーが記入したマーキングに囲まれたマーキングエリア画像を切り出すとともに、マーキングエリア外に存在する属性画像から属性情報を抽出する。
101…属性エリア検出部
102…属性画像検出部
103…属性情報抽出部
104…マーキング検出部
105…マーキングエリア画像生成部
106…画像記録部
107…合成画像生成部
111…OCR用データベース
112…属性データベース
Claims (7)
- 原稿画像から、属性情報を示す画像である属性画像を含み得るエリアである属性エリアを検出する属性エリア検出部であって、前記原稿画像のエッジからの距離が閾値未満であって特定の長さの罫線と、前記原稿画像の前記エッジとの間が空白となるエリアのうち最も離れた2つの空白のエリアに挟まれたエリアを、前記属性エリアとして検出する属性エリア検出部と、
前記属性エリアに含まれる属性画像を検出する属性画像検出部と、
前記属性画像が示す属性情報を抽出する属性情報抽出部と、
前記原稿画像のうち前記属性エリアを除くエリアである記事エリアから、マーキング画像を検出するマーキング検出部と、
前記原稿画像から、前記マーキング画像により囲まれた画像であるマーキングエリア画像を生成するマーキングエリア画像生成部と、
前記マーキングエリア画像と前記属性情報を示す文字列とを合成して、合成画像を生成する合成画像生成部と
を具備する情報処理装置。 - 請求項1に記載の情報処理装置であって、
前記マーキングエリア画像と、前記属性情報を示す文字列とを、互いに関連付けて記録する画像記録部
をさらに具備する情報処理装置。 - 請求項2に記載の情報処理装置であって、
前記画像記録部は、複数組の前記マーキングエリア画像と前記属性情報を示す文字列とを記録し、
前記合成画像生成部は、さらに、
前記画像記録部に記録された複数組の前記マーキングエリア画像と前記属性情報を示す文字列のうち、
同じ前記属性情報を示す文字列に関連付けられた複数の前記マーキングエリア画像と、前記同じ属性情報を示す文字列とを合成して、合成画像を生成する
情報処理装置。 - 請求項1乃至3の何れか一項に記載の情報処理装置であって、
前記属性画像は、固有名詞を示す文字列を含み、
前記属性画像検出部は、光学文字認識(Optical Character Recognition)により、前記属性画像に含まれる前記固有名詞を示す文字列を識別し、
前記属性情報抽出部は、前記固有名詞を示す文字列を、前記固有名詞に含まれる汎用的な語を示す文字列を少なくとも記憶するデータベースと照合することにより、前記固有名詞を示す文字列が前記データベースに記録されていない新規な文字列であるとき、前記新規な文字列が前記汎用的な語を示す文字列を含む場合、前記新規な文字列が前記固有名詞を示すと判断し、前記新規な文字列を前記属性画像が示す属性情報として抽出し、前記データベースに前記新規な文字列を蓄積する
情報処理装置。 - 請求項1乃至4の何れか一項に記載の情報処理装置であって、
前記合成画像を印刷する画像形成部
をさらに具備する情報処理装置。 - 請求項1乃至5の何れか一項に記載の情報処理装置であって、
原稿から前記原稿画像を読み取る画像読取部
をさらに具備する情報処理装置。 - 情報処理装置を、
原稿画像から、属性情報を示す画像である属性画像を含み得るエリアである属性エリアを検出する属性エリア検出部であって、前記原稿画像のエッジからの距離が閾値未満であって特定の長さの罫線と、前記原稿画像の前記エッジとの間が空白となるエリアのうち最も離れた2つの空白のエリアに挟まれたエリアを、前記属性エリアとして検出する属性エリア検出部と、
前記属性エリアに含まれる属性画像を検出する属性画像検出部と、
前記属性画像が示す属性情報を抽出する属性情報抽出部と、
前記原稿画像のうち前記属性エリアを除くエリアである記事エリアから、マーキング画像を検出するマーキング検出部と、
前記原稿画像から、前記マーキング画像により囲まれた画像であるマーキングエリア画像を生成するマーキングエリア画像生成部と、
前記マーキングエリア画像と前記属性情報を示す文字列とを合成して、合成画像を生成する合成画像生成部と
して機能させるプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017002505A JP6702198B2 (ja) | 2017-01-11 | 2017-01-11 | 情報処理装置及びプログラム |
US15/864,897 US10659654B2 (en) | 2017-01-11 | 2018-01-08 | Information processing apparatus for generating an image surrounded by a marking on a document, and non-transitory computer readable recording medium that records an information processing program for generating an image surrounded by a marking on a document |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017002505A JP6702198B2 (ja) | 2017-01-11 | 2017-01-11 | 情報処理装置及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018113567A JP2018113567A (ja) | 2018-07-19 |
JP6702198B2 true JP6702198B2 (ja) | 2020-05-27 |
Family
ID=62783827
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017002505A Active JP6702198B2 (ja) | 2017-01-11 | 2017-01-11 | 情報処理装置及びプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US10659654B2 (ja) |
JP (1) | JP6702198B2 (ja) |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH063608B2 (ja) * | 1984-06-30 | 1994-01-12 | 株式会社東芝 | 文書画像編集装置 |
JP3255676B2 (ja) | 1991-11-30 | 2002-02-12 | 株式会社リコー | デジタル複写機 |
US5701500A (en) * | 1992-06-02 | 1997-12-23 | Fuji Xerox Co., Ltd. | Document processor |
JPH09204511A (ja) * | 1996-01-24 | 1997-08-05 | Sharp Corp | ファイリング装置 |
JP3725635B2 (ja) * | 1996-10-24 | 2005-12-14 | 株式会社リコー | 文字認識方法及び装置 |
JP3821267B2 (ja) * | 1999-01-18 | 2006-09-13 | 富士通株式会社 | 文書画像結合装置、文書画像結合方法及び文書画像結合プログラムを記録した記録媒体 |
JP2002150306A (ja) * | 2000-09-04 | 2002-05-24 | Minolta Co Ltd | 画像処理装置、画像処理方法、画像処理プログラムおよび画像処理プログラムを記録したコンピュータ読取可能な記録媒体 |
US6704467B2 (en) * | 2000-12-21 | 2004-03-09 | Canon Kabushiki Kaisha | Image editing with block selection |
US8857770B2 (en) * | 2004-01-02 | 2014-10-14 | David J. Ruskauff | Railway dark territory switch automation |
US20060285746A1 (en) * | 2005-06-17 | 2006-12-21 | Sherif Yacoub | Computer assisted document analysis |
JP2008052709A (ja) * | 2006-07-26 | 2008-03-06 | Canon Inc | 画像処理装置、画像処理装置の制御方法およびプログラム |
JP4996940B2 (ja) * | 2007-02-21 | 2012-08-08 | 日立コンピュータ機器株式会社 | 帳票認識装置およびそのプログラム |
JP5036430B2 (ja) * | 2007-07-10 | 2012-09-26 | キヤノン株式会社 | 画像処理装置及びその制御方法 |
KR20110091296A (ko) * | 2010-02-05 | 2011-08-11 | 삼성전자주식회사 | 문서 작성 장치 및 방법 |
JP6368997B2 (ja) | 2013-08-28 | 2018-08-08 | 沖電気工業株式会社 | 画像切り出し装置、および画像切り出しプログラム |
JP2016051191A (ja) * | 2014-08-28 | 2016-04-11 | 富士通株式会社 | 画像処理方法 |
CN110636181A (zh) * | 2016-03-01 | 2019-12-31 | 京瓷办公信息系统株式会社 | 信息处理装置 |
-
2017
- 2017-01-11 JP JP2017002505A patent/JP6702198B2/ja active Active
-
2018
- 2018-01-08 US US15/864,897 patent/US10659654B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US20180198950A1 (en) | 2018-07-12 |
US10659654B2 (en) | 2020-05-19 |
JP2018113567A (ja) | 2018-07-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6400845B1 (en) | System and method for data extraction from digital images | |
US8508756B2 (en) | Image forming apparatus having capability for recognition and extraction of annotations and additionally written portions | |
US9454696B2 (en) | Dynamically generating table of contents for printable or scanned content | |
US8345300B2 (en) | Computer readable medium, document processing apparatus, document processing system, and document processing method for managing electronic documents | |
US9641705B2 (en) | Image forming apparatus for reading indicia on a sheet and inserting images on a subsequent printed sheet at a location corresponding to the location of the read indicia | |
EP2890100B1 (en) | Image processing apparatus | |
JP2008146605A (ja) | 画像処理装置及びその制御方法 | |
US11418658B2 (en) | Image processing apparatus, image processing system, image processing method, and storage medium | |
JP2013196479A (ja) | 情報処理システム、情報処理プログラム、情報処理方法 | |
US20150169510A1 (en) | Method and system of extracting structured data from a document | |
JP2007005950A (ja) | 画像処理装置及びネットワークシステム | |
JP2006155439A (ja) | 文書管理装置及びその方法 | |
JP6702198B2 (ja) | 情報処理装置及びプログラム | |
US7844138B2 (en) | History control apparatus | |
CN103034842A (zh) | 一种方便电子化的专业笔记本及其电子缩略图显示方法 | |
JP2008282094A (ja) | 文字認識処理装置 | |
JP4807618B2 (ja) | 画像処理装置及び画像処理プログラム | |
US9152885B2 (en) | Image processing apparatus that groups objects within image | |
JP4518212B2 (ja) | 画像処理装置及びプログラム | |
US20090019347A1 (en) | Document processing system, document input-ouput device, recording medium storing document input-output program, and document processing method | |
JP4517822B2 (ja) | 画像処理装置及びプログラム | |
JP2010170525A (ja) | 付加画像処理システム、画像形成装置及び付加画像追加方法 | |
US20110135162A1 (en) | Image processing apparatus, image processing method and recording medium | |
JP7246610B2 (ja) | 画像処理装置、画像処理プログラム及び画像処理方法 | |
JP7287097B2 (ja) | 画像処理装置、画像処理プログラム及び画像処理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20181122 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190913 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190924 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20191118 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200407 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200420 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6702198 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |