JP6797869B2 - 書物電子化装置および書物電子化方法 - Google Patents
書物電子化装置および書物電子化方法 Download PDFInfo
- Publication number
- JP6797869B2 JP6797869B2 JP2018149765A JP2018149765A JP6797869B2 JP 6797869 B2 JP6797869 B2 JP 6797869B2 JP 2018149765 A JP2018149765 A JP 2018149765A JP 2018149765 A JP2018149765 A JP 2018149765A JP 6797869 B2 JP6797869 B2 JP 6797869B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- area
- book
- dimensional
- points
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 20
- 230000035755 proliferation Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 8
- 238000012545 processing Methods 0.000 description 8
- 238000001514 detection method Methods 0.000 description 4
- 238000003384 imaging method Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000003325 tomography Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/06—Topological mapping of higher dimensional structures onto lower dimensional surfaces
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/00795—Reading arrangements
- H04N1/00827—Arrangements for reading an image from an unusual original, e.g. 3-dimensional objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T11/00—2D [Two Dimensional] image generation
- G06T11/003—Reconstruction from projections, e.g. tomography
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T19/00—Manipulating 3D models or images for computer graphics
- G06T19/20—Editing of 3D images, e.g. changing shapes or colours, aligning objects or positioning parts
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/06—Topological mapping of higher dimensional structures onto lower dimensional surfaces
- G06T3/067—Reshaping or unfolding 3D tree structures onto 2D planes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/40—Analysis of texture
- G06T7/49—Analysis of texture based on structural texture description, e.g. using primitives or placement rules
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/22—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2219/00—Indexing scheme for manipulating 3D models or images for computer graphics
- G06T2219/20—Indexing scheme for editing of 3D models
- G06T2219/2008—Assembling, disassembling
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N2201/00—Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
- H04N2201/04—Scanning arrangements
- H04N2201/0402—Arrangements not specific to a particular one of the scanning methods covered by groups H04N1/04 - H04N1/207
- H04N2201/0434—Arrangements not specific to a particular one of the scanning methods covered by groups H04N1/04 - H04N1/207 specially adapted for scanning pages of a book
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computer Graphics (AREA)
- Architecture (AREA)
- Computer Hardware Design (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Character Discrimination (AREA)
- Image Input (AREA)
- Image Processing (AREA)
- Image Analysis (AREA)
- Character Input (AREA)
Description
以下、本発明の一実施形態について、詳細に説明する。
図1は、本実施形態における書物電子化装置1Aの要部構成を示すブロック図である。図1に示すように、書物電子化装置1Aは、三次元データ生成部10と、二次元ページデータ生成部20と、文字認識部30Aとを備えている。
図2は、書物電子化装置1Aの処理(書物電子化方法)の流れの一例を示すフローチャートである。図2に示すように、書物電子化装置1Aにおける処理では、まず、三次元データ生成部10が書物を撮像し、当該書物の三次元データを生成する(S1、三次元データ生成工程)。具体的には、X線照射装置11により書物にX線を照射し、検出器12により当該X線を検出する。X線照射装置11は、閉じたままの書物に対してX線を照射する。X線照射装置11から照射されたX線の一部は、書物中のインクによって吸収される。
本発明の他の実施形態について、以下に説明する。なお、説明の便宜上、上記実施形態にて説明した部材と同じ機能を有する部材については、同じ符号を付記し、その説明を繰り返さない。
書物電子化装置1A・1Bの制御ブロック(特に三次元データ生成部10、二次元ページデータ生成部20および文字認識部30A・30B)は、集積回路(ICチップ)等に形成された論理回路(ハードウェア)によって実現してもよいし、ソフトウェアによって実現してもよい。
本発明の態様1に係る書物電子化装置1A・1Bは、書物を撮像し、前記書物の三次元データを生成する三次元データ生成部10と、前記三次元データにおける前記書物のページに対応し、インクに対応する点である第1点および背景に対応する値である第2点を有する二次元ページデータを生成する二次元ページデータ生成部20と、前記二次元ページデータを用いて前記ページに記載されている文字を認識する文字認識部30A・30Bと、を備えており、前記文字認識部は、前記ページにおける1つの前記文字が記載されている領域に相当する前記二次元ページデータの領域である文字領域のうちの一部の領域において、前記第1点の1つを初期点として前記第1点を繋げることにより生成される前記文字の一部の形状に基づいて前記文字を認識する。
10 三次元データ生成部
20 二次元ページデータ生成部
30A,30B 文字認識部
32 文字領域サイズ決定部
Claims (6)
- 書物を撮像し、前記書物の三次元データを生成する三次元データ生成部と、
前記三次元データにおける前記書物のページに対応し、インクに対応する点である第1点および背景に対応する値である第2点を有する二次元ページデータを生成する二次元ページデータ生成部と、
前記二次元ページデータを用いて前記ページに記載されている文字を認識する文字認識部と、を備えており、
前記文字認識部は、前記ページにおける1つの前記文字が記載されている領域に相当する前記二次元ページデータの領域である文字領域のうちの一部の領域において、前記第1点の1つを初期点として前記第1点を繋げることにより生成される前記文字の一部の形状に基づいて前記文字を認識することを特徴とする書物電子化装置。 - 前記文字認識部は、
前記一部の領域としての所定の領域において、前記第1点の1つを初期点として前記第1点を繋げることにより前記文字の一部の形状を生成し、
生成した前記文字の一部の形状に基づいて前記文字として複数の候補文字が得られた場合に、前記候補文字の特有点が、前記文字領域のうち前記所定の領域以外の領域に存在したときに、前記文字を当該候補文字であると認識することを特徴とする請求項1に記載の書物電子化装置。 - 前記文字認識部は、
前記一部の領域としての所定の領域において、前記第1点の1つを初期点として前記第1点を繋げることにより前記文字の一部の形状を生成し、
生成した前記文字の一部の形状から前記文字を特定できない場合に、前記文字領域のうち前記所定の領域以外の領域においてさらに前記第1点を繋げることを特徴とする請求項1に記載の書物電子化装置。 - 前記文字領域のサイズを決定する文字領域サイズ決定部をさらに備えることを特徴とする請求項1〜3のいずれか1項に記載の書物電子化装置。
- 前記文字の種類に応じて、前記第1点を繋げる方向を異ならせることを特徴とする請求項1〜4のいずれか1項に記載の書物電子化装置。
- 書物を撮像し、前記書物の三次元データを生成する三次元データ生成工程と、
前記三次元データにおける前記書物のページに対応し、インクに対応する点である第1点および背景に対応する値である第2点を有する二次元ページデータを生成する二次元ページデータ生成工程と、
前記二次元ページデータを用いて前記ページに記載されている文字を認識する文字認識工程と、を含み、
前記文字認識工程では、前記ページにおける1つの前記文字が記載されている領域に相当する前記二次元ページデータの領域である文字領域のうちの一部の領域において、前記第1点の1つを初期点として前記第1点を繋げることにより生成される前記文字の一部の形状に基づいて前記文字を認識することを特徴とする書物電子化方法。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018149765A JP6797869B2 (ja) | 2018-08-08 | 2018-08-08 | 書物電子化装置および書物電子化方法 |
US16/527,778 US20200053242A1 (en) | 2018-08-08 | 2019-07-31 | Book electronization apparatus and book electronization method |
CN201910722684.9A CN110827192B (zh) | 2018-08-08 | 2019-08-06 | 书籍电子化装置以及书籍电子化方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018149765A JP6797869B2 (ja) | 2018-08-08 | 2018-08-08 | 書物電子化装置および書物電子化方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020024640A JP2020024640A (ja) | 2020-02-13 |
JP6797869B2 true JP6797869B2 (ja) | 2020-12-09 |
Family
ID=69406784
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018149765A Expired - Fee Related JP6797869B2 (ja) | 2018-08-08 | 2018-08-08 | 書物電子化装置および書物電子化方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20200053242A1 (ja) |
JP (1) | JP6797869B2 (ja) |
CN (1) | CN110827192B (ja) |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0830766A (ja) * | 1994-07-15 | 1996-02-02 | Sumitomo Electric Ind Ltd | 書籍読取装置 |
JP3400151B2 (ja) * | 1994-12-08 | 2003-04-28 | 株式会社東芝 | 文字列領域抽出装置および方法 |
JP3419251B2 (ja) * | 1997-06-05 | 2003-06-23 | 三菱電機株式会社 | 文字認識装置及び文字認識方法 |
JP3411796B2 (ja) * | 1997-10-01 | 2003-06-03 | 三菱重工業株式会社 | 文字認識装置 |
JP3974359B2 (ja) * | 2000-10-31 | 2007-09-12 | 株式会社東芝 | オンライン文字認識装置及び方法並びにコンピュータ読み取り可能な記憶媒体及びオンライン文字認識プログラム |
JP4228592B2 (ja) * | 2002-05-29 | 2009-02-25 | 三菱電機株式会社 | 文字認識装置 |
JP2004070688A (ja) * | 2002-08-07 | 2004-03-04 | Nippon Telegr & Teleph Corp <Ntt> | 情報入力装置、方法、プログラム、及びそのプログラムを記録した記録媒体 |
JP2006031506A (ja) * | 2004-07-20 | 2006-02-02 | Brother Ind Ltd | 画像入出力装置 |
US20100033772A1 (en) * | 2008-08-08 | 2010-02-11 | Craig Steven Borison | Multi-page Scanner/Copier and technique/method to simultaneously scan without separating pages or uncoupling documents or books |
CN102455911B (zh) * | 2011-09-29 | 2014-10-22 | 北京壹人壹本信息科技有限公司 | 手写输入显示装置及控制方法 |
CN108496204B (zh) * | 2016-01-28 | 2020-03-10 | 夏普株式会社 | 书籍电子化方法及书籍电子化装置 |
-
2018
- 2018-08-08 JP JP2018149765A patent/JP6797869B2/ja not_active Expired - Fee Related
-
2019
- 2019-07-31 US US16/527,778 patent/US20200053242A1/en not_active Abandoned
- 2019-08-06 CN CN201910722684.9A patent/CN110827192B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
JP2020024640A (ja) | 2020-02-13 |
US20200053242A1 (en) | 2020-02-13 |
CN110827192B (zh) | 2024-07-26 |
CN110827192A (zh) | 2020-02-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3869385B1 (en) | Method for extracting structural data from image, apparatus and device | |
JP4745830B2 (ja) | 画像処理装置、画像処理方法、コンピュータプログラム | |
JP3400151B2 (ja) | 文字列領域抽出装置および方法 | |
US10496904B2 (en) | Book electronization method and book electronization device | |
US20170200247A1 (en) | Systems and methods for authentication of physical features on identification documents | |
CN106991422A (zh) | 字符切割方法、装置及计算机可读存储介质和电子设备 | |
CN111310912A (zh) | 机器学习系统、域变换装置、及机器学习方法 | |
JP6817251B2 (ja) | 文字認識装置および文字認識方法 | |
JP6797869B2 (ja) | 書物電子化装置および書物電子化方法 | |
EP3798906A1 (en) | System and method for masking text within images | |
CN110348022A (zh) | 一种相似度分析的方法、装置、存储介质及电子设备 | |
WO2018168515A1 (ja) | 画像処理装置、画像処理方法及び記録媒体 | |
JP6760589B2 (ja) | 画像処理装置および画像処理方法 | |
JP6201838B2 (ja) | 情報処理装置及び情報処理プログラム | |
US10885402B2 (en) | Book electronization apparatus and book electronization method | |
CN108664872A (zh) | 基于点阵识别的信息验证系统 | |
JP6746634B2 (ja) | 書物電子化装置および書物電子化方法 | |
JP2020064438A (ja) | 学習データ生成装置および学習データ生成方法 | |
JP2022053987A (ja) | 手書き文字認識用正解データ生成装置、方法、およびプログラム | |
JP2022053983A (ja) | 印刷文字認識用正解データ生成装置、方法、およびプログラム | |
CN112765646A (zh) | 一种艺术测评中书画录入及匿名阅卷方法及系统 | |
JP2008172519A (ja) | 情報埋め込み装置、埋め込み情報取得装置 | |
CN107908774A (zh) | 一种文件分类方法、存储介质及设备 | |
JP2011160307A (ja) | 画像処理装置及び画像処理プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190801 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200917 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20201020 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20201118 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6797869 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |