JP2020024640A - 書物電子化装置および書物電子化方法 - Google Patents

書物電子化装置および書物電子化方法 Download PDF

Info

Publication number
JP2020024640A
JP2020024640A JP2018149765A JP2018149765A JP2020024640A JP 2020024640 A JP2020024640 A JP 2020024640A JP 2018149765 A JP2018149765 A JP 2018149765A JP 2018149765 A JP2018149765 A JP 2018149765A JP 2020024640 A JP2020024640 A JP 2020024640A
Authority
JP
Japan
Prior art keywords
character
area
book
dimensional
point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018149765A
Other languages
English (en)
Other versions
JP6797869B2 (ja
Inventor
中西 徹
Toru Nakanishi
徹 中西
全健 金
Zenken Kin
全健 金
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2018149765A priority Critical patent/JP6797869B2/ja
Priority to US16/527,778 priority patent/US20200053242A1/en
Priority to CN201910722684.9A priority patent/CN110827192B/zh
Publication of JP2020024640A publication Critical patent/JP2020024640A/ja
Application granted granted Critical
Publication of JP6797869B2 publication Critical patent/JP6797869B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/06Topological mapping of higher dimensional structures onto lower dimensional surfaces
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00795Reading arrangements
    • H04N1/00827Arrangements for reading an image from an unusual original, e.g. 3-dimensional objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/003Reconstruction from projections, e.g. tomography
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T19/00Manipulating 3D models or images for computer graphics
    • G06T19/20Editing of 3D images, e.g. changing shapes or colours, aligning objects or positioning parts
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/06Topological mapping of higher dimensional structures onto lower dimensional surfaces
    • G06T3/067Reshaping or unfolding 3D tree structures onto 2D planes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/40Analysis of texture
    • G06T7/49Analysis of texture based on structural texture description, e.g. using primitives or placement rules
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2219/00Indexing scheme for manipulating 3D models or images for computer graphics
    • G06T2219/20Indexing scheme for editing of 3D models
    • G06T2219/2008Assembling, disassembling
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/04Scanning arrangements
    • H04N2201/0402Arrangements not specific to a particular one of the scanning methods covered by groups H04N1/04 - H04N1/207
    • H04N2201/0434Arrangements not specific to a particular one of the scanning methods covered by groups H04N1/04 - H04N1/207 specially adapted for scanning pages of a book

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computer Graphics (AREA)
  • Architecture (AREA)
  • Computer Hardware Design (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Character Discrimination (AREA)
  • Image Input (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)

Abstract

【課題】二次元ページデータから文字を効率的に認識する。【解決手段】書物電子化装置(1A)は、三次元データを生成する三次元データ生成部(10)と、インクに対応する点である第1点および背景に対応する値である第2点を有する二次元ページデータを生成する二次元ページデータ生成部(20)と、二次元ページデータを用いて文字を認識する文字認識部(30A)と、を備えている。文字認識部(30A)は、文字領域のうちの一部の領域において、第1点の1つを初期点として第1点を繋げることにより生成される文字の一部の形状に基づいて文字を認識する。【選択図】図1

Description

本発明は、書物に記載されている文字を電子化する書物電子化装置などに関する。
読むために書物を開くことにより、書物が傷むことがある。特に、古い書物は、開くと傷んだり破損したりする可能性がある。例えば、イタリアで発見された、古代ローマ時代に噴火によって焦げてしまった巻物状の古文献がある。この古文献は、全体が黒ずんでいるため肉眼による判読が難しく、かつ、脆いので開くことができない。そこで、このような書物に対してX線位相コントラスト断層撮影を行うことにより、書物を傷ませることなく、書物の三次元データを取得する。
また、上記のような三次元データから、書物の各ページに相当する二次元ページデータを生成する書物電子化装置が知られている。特許文献1に開示されている書物電子化装置は、書物の三次元データを用いて、書物のページに対応するページ領域を特定し、ページ領域における文字を2次元平面にマッピングすることにより、書物に記された文字を含む二次元ページデータを生成する。なお、ここにおける文字は、認識前の複数の点のことを意味し、当該複数の点から文字が認識される。
国際公開2017/131184号公報
上述の書物電子化装置による二次元ページデータ生成工程の次の工程として、書物に記載された文字を認識する工程がある。当該工程では、二次元ページデータが含む、インクに対応する値を有する複数の点(NODE、ノード)のうちの1つの点を初期点として、インクに対応する値を有する複数の点を繋げることにより文字を認識する。このとき、1つの文字について、すべての点を繋げているため、文字を認識するまでに時間を有するという問題がある。
本発明の一態様は、上記問題点に鑑みてなされたものであり、その目的は、二次元ページデータから文字を効率的に認識することができる書物電子化装置および書物電子化方法を実現することを目的とする。
上記の課題を解決するために、本発明の一態様に係る書物電子化装置は、書物を撮像し、前記書物の三次元データを生成する三次元データ生成部と、前記三次元データにおける前記書物のページに対応し、インクに対応する点である第1点および背景に対応する値である第2点を有する二次元ページデータを生成する二次元ページデータ生成部と、前記二次元ページデータを用いて前記ページに記載されている文字を認識する文字認識部と、を備えており、前記文字認識部は、前記ページにおける1つの前記文字が記載されている領域に相当する前記二次元ページデータの領域である文字領域のうちの一部の領域において、前記第1点の1つを初期点として前記第1点を繋げることにより生成される前記文字の一部の形状に基づいて前記文字を認識する。
上記の課題を解決するために、本発明の一態様に係る書物電子化方法は、書物を撮像し、前記書物の三次元データを生成する三次元データ生成工程と、前記三次元データにおける前記書物のページに対応し、インクに対応する点である第1点および背景に対応する値である第2点を有する二次元ページデータを生成する二次元ページデータ生成工程と、前記二次元ページデータを用いて前記ページに記載されている文字を認識する文字認識工程と、を含み、前記文字認識工程では、前記ページにおける1つの前記文字が記載されている領域に相当する前記二次元ページデータの領域である文字領域のうちの一部の領域において、前記第1点の1つを初期点として前記第1点を繋げることにより生成される前記文字の一部の形状に基づいて前記文字を認識する。
本発明の一態様によれば、二次元ページデータから文字を効率的に認識することができる。
本発明の実施形態1に係る書物電子化装置の要部構成を示すブロック図である。 上記書物電子化装置の処理の流れの一例を示すフローチャートである。 上記書物電子化装置が備えるノード増殖部によるノードの増殖を説明するものであり、(a)は、上記書物電子化装置の認識対象となる文字列を示す図であり、(b)は、上記ノード増殖部によるノードの増殖を示す図である。 上記書物電子化装置が備える文字決定部による文字決定方法の一例を説明するための図である。 本発明の実施形態2に係る書物電子化装置の要部構成を示すブロック図である。
〔実施形態1〕
以下、本発明の一実施形態について、詳細に説明する。
(書物電子化装置1Aの構成)
図1は、本実施形態における書物電子化装置1Aの要部構成を示すブロック図である。図1に示すように、書物電子化装置1Aは、三次元データ生成部10と、二次元ページデータ生成部20と、文字認識部30Aとを備えている。
三次元データ生成部10は、書物を撮像し、当該書物の三次元データを生成する。三次元データ生成部10は、図1に示すように、X線照射装置11と、検出器12とを備えている。
X線照射装置11は、書物にX線を照射する。X線照射装置11は、例えば、X線照射の出力(波長)を調整可能に構成されており、所望の波長のX線を書物へ照射することが可能である。
検出器12は、書物に照射されたX線を検出する。検出器12は、X線の検出位置とその位置でのX線の強度とを含む検出値を取得するように構成されている。検出器12は、取得した検出値を三次元データとして二次元ページデータ生成部20(より詳細には、位置指定部21)に出力する。
二次元ページデータ生成部20は、三次元データ生成部10によって生成された三次元データから、インクに対応する値を有する複数の点(以降では、第1点と称する場合がある)および背景に対応する値を有する複数の点(第2点)の情報を含む二次元ページデータを生成する。当該二次元ページデータは、書物のページに対応する。二次元ページデータ生成部20は、図1に示すように、位置指定部21と、面特定部22と、データ生成部23とを備えている。
位置指定部21は、検出器12から出力された三次元データのデータ値に基づき、ページ領域を特定するための初期点を指定する。ページ領域とは、三次元データのうちの、書物の各ページに対応する部分であり、当該各ページに対応するある面上に存在するノードの集合である。位置指定部21は、初期点の情報を面特定部22に出力する。
面特定部22は、位置指定部21によって指定された初期点に繋がるページ領域を特定する。面特定部22は、ページ領域に対応する点の集合、および各点のデータ値をデータ生成部23に出力する。
データ生成部23は、面特定部22によって特定されたページ領域のデータを二次元の(平面の)ページデータ(以降では、二次元ページデータと称する)に変換する。二次元ページデータは、インクに対応する値または背景に対応する値を有する複数の点の情報を含み、書物のページ内における複数の文字または図形の位置関係(文字などの配置)の情報を含んでいる。データ生成部23は、生成した二次元ページデータを文字認識部30A(より詳細には、文字領域サイズ決定部32およびノード増殖部33)に出力する。
文字認識部30Aは、二次元ページデータ生成部20によって生成された二次元ページデータに含まれるインクに対応する値を有する複数の点から文字を特定(認識)する。文字認識部30Aは、格納部31と、文字領域サイズ決定部32と、ノード増殖部33と、文字決定部34Aとを備えている。
格納部31は、文字の特有点を格納している。換言すれば、格納部31には、文字(例えば、ひらがな、カタカナ、漢字、アルファベット、数字など)の特有点が記憶されている。本明細書における「特有点」とは、文字を構成するのに必須となる点である。1つの文字に対する特有点の数は、とくに制限されることなく、文字によって異なっていてもよい。
文字領域サイズ決定部32は、データ生成部23が生成した二次元ページデータから1つの文字の領域のサイズを決定する。詳しくは、後述する。
ノード増殖部33は、文字領域サイズ決定部32が決定した1つの文字の領域において、インクに対応する値を有する複数の点(第1点)の1つを初期点として第1点同士を繋げる(本明細書では、「増殖させる」と呼称する場合がある)ことにより、文字の一部の形状を生成する。ノード増殖部33は、文字領域サイズ決定部32が決定した1つの文字の領域のうち一部の領域(例えば、領域の50%)においてノードを増殖させる。
文字決定部34Aは、ノード増殖部33が生成した文字の一部の形状に基づいて、文字領域サイズ決定部32が決定した1つの文字の領域に記載されている文字を決定する。詳しくは、後述する。
(書物電子化装置1Aの処理の一例)
図2は、書物電子化装置1Aの処理(書物電子化方法)の流れの一例を示すフローチャートである。図2に示すように、書物電子化装置1Aにおける処理では、まず、三次元データ生成部10が書物を撮像し、当該書物の三次元データを生成する(S1、三次元データ生成工程)。具体的には、X線照射装置11により書物にX線を照射し、検出器12により当該X線を検出する。X線照射装置11は、閉じたままの書物に対してX線を照射する。X線照射装置11から照射されたX線の一部は、書物中のインクによって吸収される。
検出器12は、書物を通過したX線の、特定の位置と強度とを含む検出値を検出し、検出した検出値を三次元データとして二次元ページデータ生成部20(より詳細には、位置指定部21)に出力する。書物中のインクが存在する領域を通過したX線は、書物の媒体(紙)を通過したX線よりも弱い強度のX線として検出器12に検出される、上記検出値の集合は、このような弱い強度のX線が検出された点を含む三次元データを構成する。当該三次元データは、インクや紙面(背景)の位置情報と、当該位置におけるX線の強度の情報とを含むデータである。このように、X線で書物を撮像することによって、書物中のインクの三次元データが取得される。
次に、二次元ページデータ生成部20が、三次元データ生成部10によって生成された三次元データから、インクに対応する値または背景に対応する値を有する複数の点(ノード)の情報を含む二次元ページデータを生成する(S2、二次元ページデータ生成工程)。具体的には、まず、位置指定部21が、三次元データにおいて、重なっている媒体の少なくとも一枚(書物が冊子であれば1頁)と交差するように、線状の経路を指定する。当該経路は、例えば、書物が冊子の場合では、書物の表紙と裏表紙とを貫通し、書物のすべてのページと交差する直線である。
そして、位置指定部21は、上記経路上における、シートのデータ値と隙間のデータ値とを分ける閾値に対応する点をページ領域の初期点として指定する。位置指定部21は、例えば、複数のページ領域に対応する複数の初期点を指定する。位置指定部21は、初期点の情報を面特定部22に出力する。
次に、面特定部22が、上記初期点から決まるページ領域の位置を特定する。ページ領域は、例えば、三次元データの直交座標中に、当該直交座標を構成する単位セルを横切るように配置されている。面特定部22は、例えば、ページ領域が横断する単位セルの辺において上記閾値以上である点を上記ページ領域に対応する点とし、上記ページ領域を特定する。
次に、データ生成部23が、面特定部22が特定したページ領域の各点のデータ値を二次元平面上にマッピングすることによって二次元ページデータを生成する。二次元ページデータの各点のデータ値は、概ねシート(背景)およびインクのいずれかに対応する。マッピングの方法には、公知の方法(例えば、鞍点特徴を利用した三次元メッシュ展開など)を用いることができる。
次に、文字認識部30Aが、データ生成部23が生成した二次元ページデータに含まれる文字を認識する(文字認識工程)。
具体的には、まず、文字領域サイズ決定部32が、データ生成部23が生成した二次元ページデータから1つの文字の領域(または領域のサイズ)を決定する(S3)。例えば、すでに書物に記載されている文字の大きさ、および、互いに隣接する文字の間の距離が既知の場合、文字領域は、当該文字の大きさ、および、互いに隣接する文字の間の距離に基づいて、1つの文字の領域を決定する。一方、書物に記載されている文字の大きさ、および、互いに隣接する文字の間の距離が既知の場合、例えば、ノード増殖部33が、書物に記載されている文字列のうちの任意の1行について、上記第1点の任意の点を初期点として、すべての第1点を繋げることにより、1つの文字を生成する。この処理を上記任意の1行に記載されている文字に対して実行する。これにより、文字領域サイズ決定部32は、書物に記載されている文字の大きさ、および、互いに隣接する文字の間の距離を取得することができるので、1つの文字の領域を決定することができる。
次に、ノード増殖部33が、文字領域サイズ決定部32が決定した1つの文字の領域(以降では、文字領域とも称する)において、上記第1点の1つを初期点として、文字領域のうちの一部の領域にいて第1点同士を繋げる(S4)。
図3は、ノード増殖部33によるノードの増殖を説明するものであり、(a)は、書物電子化装置1Aの認識対象となる文字列を示す図であり、(b)は、ノード増殖部33によるノードの増殖を示す図である。
ここでは、図3の(a)に示すように、「A」〜「F」が記載されている1行について、書物電子化装置1Aが文字を認識する場合について説明する。
ノード増殖部33は、まず、上記文字領域における中央に存在する任意の第1点を初期点とする。次に、ノード増殖部33は、上記文字領域の中央から上半分の領域において、第1点を繋げる。これにより、図3の(b)に示すように、上記文字領域の中央から上半分の領域において、文字の形状が生成される。すなわち、ノード増殖部33は、文字領域のうちの一部の領域(所定の領域)において、第1点の1つを初期点として第1点を繋げることにより前記文字の一部の形状を生成する。
次に、文字決定部34Aが、ノード増殖部33が生成した文字の一部の形状に基づいて、文字領域サイズ決定部32が決定した1つの文字の領域に記載されている文字を決定する(S5)。なお、文字の形状に関する情報は、格納部31に格納されている。文字決定部34Aは、格納部31に格納されている文字の形状に関する情報を参照して、ノード増殖部33が生成した文字の一部の形状から文字を特定する。
例えば、文字決定部34Aは、文字「A」については、図3の(b)に示すように、文字領域の中央から上半分の文字の形状から文字「A」であると特定することができる。
これに対して、その他の文字については、文字領域の中央から上半分の文字の形状から特定することができない。例えば、文字「B」については、文字「B」または文字「P」である可能性がある。また、文字「E」および文字「F」については、文字「E」および文字「F」のいずれであるか特定することができない。すなわち、文字「E」および文字「F」については、複数の候補文字が存在する。
この場合、文字決定部34Aは、上記候補文字の特有点が、上記文字領域のうちノードを増殖させた領域以外の領域に存在したときに、文字を当該候補文字であると認識する。これについて、図4を参照しながら、文字「E」および文字「F」を例にして、具体的に説明する。
図4は、文字決定部34Aによる文字決定方法の一例を説明するための図である。図4に示すように、文字決定部34Aは、文字「E」の特有点であるノードN1がインクに対応する値を有する点(第1点)であるかどうかを判別する。ノードN1が第1点である場合、文字決定部34Aは、当該文字を「E」であると特定する。一方、ノードN1が第1点でない場合(すなわち、背景に対応する値を有する点(第2点)である場合)、文字決定部34Aは、当該文字を「F」であると特定する。
次に、文字認識部30Aは、二次元ページデータにおいて、まだ文字が決定されていない領域があるかどうかを判定する(S6)。まだ文字が決定されていない領域が存在する場合(S6でNO)、文字認識部30Aは、次の領域について、ステップS4およびステップS5を行う。一方、すべての領域について文字を決定した場合、書物電子化装置1Aは、処理を終了する。
以上のように、書物電子化装置1Aでは、文字認識部30Aが、三次元データにおける書物のページにおける1つの文字が記載されている領域に相当する二次元ページデータの領域である文字領域のうちの一部の領域(すなわち、上半分)において、第1点の1つを初期点として第1点を繋げることにより生成される文字の一部の形状に基づいて文字を認識(特定)する。
従来では、文字領域のすべての領域において、第1点を繋げており、そのため、処理時間が長くなってしまうという問題があった。これに対して、上記の構成によれば、文字領域のうちの一部の領域(すなわち、上半分)において、第1点の1つを初期点として第1点を繋げることにより文字の一部の形状を生成する。そして、文字決定部34Aは、生成した文字の形状に基づいて文字を認識する。そのため、第1点を繋げる処理を削減することができるため、文字を特定するための処理時間を少なくすることができる。すなわち、書物電子化装置1Aは、二次元ページデータから文字を効率的に認識することができる。
なお、本実施形態では、文字領域のうちの上半分の領域において、第1点の1つを初期点として第1点を繋げる構成であったが、本発明の書物電子化装置はこれに限られない。本発明の一態様の書物電子化装置では、例えば、文字領域のうちの上側の3分の1の領域において、第1点の1つを初期点として第1点を繋げる構成であってもよい。また、本発明の一態様の書物電子化装置では、例えば、文字領域のうちの上側の3分の2の領域において、第1点の1つを初期点として第1点を繋げる構成であってもよい。また、第1点を繋げる領域は、文字領域のうちの上側の一部の領域に限定されるものではなく、例えば、文字領域のうちの下側の一部の領域であってもよいし、文字領域のうちの左側の一部の領域であってもよいし、文字領域のうちの→側の一部の領域であってもよい。また、第1点を繋げる領域は、文字領域のうちの上側の一部の領域と下側の一部の領域とであってもよい。
なお、文字の種類(例えば、数字、アルファベット、ひらがな、カタカナ、ハングル文字)によって、特定しやすい領域が存在する場合がある。そこで、文字の種類によって第1点を繋げる領域を適宜設定することが好ましい。
また、文字の種類に応じて第1点を繋げる方向を異ならせることが好ましい。これにより、第1点を繋げる領域を小さくすることができるので、第1点を繋げる処理をさらに削減することができる。
〔実施形態2〕
本発明の他の実施形態について、以下に説明する。なお、説明の便宜上、上記実施形態にて説明した部材と同じ機能を有する部材については、同じ符号を付記し、その説明を繰り返さない。
図5は、本実施形態における書物電子化装置1Bの要部構成を示すブロック図である。図5に示すように、書物電子化装置1Bは、実施形態1における文字認識部30Aに代えて文字認識部30Bを備えている。文字認識部30Bは、実施形態1における文字決定部34Aに代えて文字決定部34Bを備えている。
文字決定部34Bは、ノード増殖部33が生成した文字の一部の形状に基づいて、文字領域サイズ決定部32が決定した1つの文字の領域に記載されている文字を決定する点については、実施形態1における文字決定部34Aと同じであるが、その処理の方法が異なっている。すなわち、書物電子化装置1Bでは、図2におけるステップS5の処理が、実施形態1とは異なっている。
書物電子化装置1BにおけるステップS5の処理では、文字領域のうちの上半分の領域において、第1点の1つを初期点として第1点を繋げることにより、文字が特定できるかどうかを判別する。当該処理については、実施形態1にて説明したとおりである。
書物電子化装置1BにおけるステップS5の処理では、上記の文字が特定できない場合には、ノード増殖部33が上記文字領域のうち上半分以外の領域においてさらに第1点を繋げる。これにより、文字の形状をさらに生成する。そして、文字決定部34Bは、さらに生成された文字の形状に基づいて文字を特定する。なお、さらに第1点を繋げる範囲は、上記文字領域の下半分の全ての領域ではなく、上記文字領域の下半分の一部の領域である。なお、下半分の一部の領域は、文字が特定できる範囲で適宜設定することができる。
上記の構成によれば、文字領域のうちの一部の領域(すなわち、上半分の領域および下半分の一部の領域)において、第1点の1つを初期点として第1点を繋げることにより文字の一部の形状を生成する。そして、文字決定部34Bは、生成した文字の形状に基づいて文字を認識する。そのため、従来に比べて第1点を繋げる処理を削減することができるため、文字を特定するための処理時間を少なくすることができる。すなわち、書物電子化装置1Bは、二次元ページデータから文字を効率的に認識することができる。
〔ソフトウェアによる実現例〕
書物電子化装置1A・1Bの制御ブロック(特に三次元データ生成部10、二次元ページデータ生成部20および文字認識部30A・30B)は、集積回路(ICチップ)等に形成された論理回路(ハードウェア)によって実現してもよいし、ソフトウェアによって実現してもよい。
後者の場合、書物電子化装置1A・1Bは、各機能を実現するソフトウェアであるプログラムの命令を実行するコンピュータを備えている。このコンピュータは、例えば少なくとも1つのプロセッサ(制御装置)を備えていると共に、上記プログラムを記憶したコンピュータ読み取り可能な少なくとも1つの記録媒体を備えている。そして、上記コンピュータにおいて、上記プロセッサが上記プログラムを上記記録媒体から読み取って実行することにより、本発明の目的が達成される。上記プロセッサとしては、例えばCPU(Central Processing Unit)を用いることができる。上記記録媒体としては、「一時的でない有形の媒体」、例えば、ROM(Read Only Memory)等の他、テープ、ディスク、カード、半導体メモリ、プログラマブルな論理回路などを用いることができる。また、上記プログラムを展開するRAM(Random Access Memory)などをさらに備えていてもよい。また、上記プログラムは、該プログラムを伝送可能な任意の伝送媒体(通信ネットワークや放送波等)を介して上記コンピュータに供給されてもよい。なお、本発明の一態様は、上記プログラムが電子的な伝送によって具現化された、搬送波に埋め込まれたデータ信号の形態でも実現され得る。
〔まとめ〕
本発明の態様1に係る書物電子化装置1A・1Bは、書物を撮像し、前記書物の三次元データを生成する三次元データ生成部10と、前記三次元データにおける前記書物のページに対応し、インクに対応する点である第1点および背景に対応する値である第2点を有する二次元ページデータを生成する二次元ページデータ生成部20と、前記二次元ページデータを用いて前記ページに記載されている文字を認識する文字認識部30A・30Bと、を備えており、前記文字認識部は、前記ページにおける1つの前記文字が記載されている領域に相当する前記二次元ページデータの領域である文字領域のうちの一部の領域において、前記第1点の1つを初期点として前記第1点を繋げることにより生成される前記文字の一部の形状に基づいて前記文字を認識する。
本発明の態様2に係る書物電子化装置は、上記態様1において、前記文字認識部は、前記一部の領域としての所定の領域において、前記第1点の1つを初期点として前記第1点を繋げることにより前記文字の一部の形状を生成し、生成した前記文字の一部の形状に基づいて前記文字として複数の候補文字が得られた場合に、前記候補文字の特有点が、前記文字領域のうち前記所定の領域以外の領域に存在したときに、前記文字を当該候補文字であると認識する構成であってもよい。
本発明の態様3に係る書物電子化装置は、上記態様1において、前記文字認識部は、前記一部の領域としての所定の領域において、前記第1点の1つを初期点として前記第1点を繋げることにより前記文字の一部の形状を生成し、生成した前記文字の一部の形状から前記文字を特定できない場合に、前記文字領域のうち前記所定の領域以外の領域においてさらに前記第1点を繋げる構成であってもよい。
本発明の態様4に係る書物電子化装置は、上記態様1〜3のいずれかにおいて、前記文字領域のサイズを決定する文字領域サイズ決定部32をさらに備える。
本発明の態様5に係る書物電子化装置は、上記態様1〜4のいずれかにおいて、前記文字の種類に応じて、前記第1点を繋げる方向を異ならせる構成であってもよい。
本発明の態様6に係る書物電子化方法は、書物を撮像し、前記書物の三次元データを生成する三次元データ生成工程と、前記三次元データにおける前記書物のページに対応し、インクに対応する点である第1点および背景に対応する値である第2点を有する二次元ページデータを生成する二次元ページデータ生成工程と、前記二次元ページデータを用いて前記ページに記載されている文字を認識する文字認識工程と、を含み、前記文字認識工程では、前記ページにおける1つの前記文字が記載されている領域に相当する前記二次元ページデータの領域である文字領域のうちの一部の領域において、前記第1点の1つを初期点として前記第1点を繋げることにより生成される前記文字の一部の形状に基づいて前記文字を認識する。
本発明の各態様に係る書物電子化装置は、コンピュータによって実現してもよく、この場合には、コンピュータを上記書物電子化装置が備える各部(ソフトウェア要素)として動作させることにより上記書物電子化装置をコンピュータにて実現させる書物電子化装置の制御プログラム、およびそれを記録したコンピュータ読み取り可能な記録媒体も、本発明の範疇に入る。
本発明は上述した各実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。さらに、各実施形態にそれぞれ開示された技術的手段を組み合わせることにより、新しい技術的特徴を形成することができる。
1A、1B 書物電子化装置
10 三次元データ生成部
20 二次元ページデータ生成部
30A,30B 文字認識部
32 文字領域サイズ決定部

Claims (6)

  1. 書物を撮像し、前記書物の三次元データを生成する三次元データ生成部と、
    前記三次元データにおける前記書物のページに対応し、インクに対応する点である第1点および背景に対応する値である第2点を有する二次元ページデータを生成する二次元ページデータ生成部と、
    前記二次元ページデータを用いて前記ページに記載されている文字を認識する文字認識部と、を備えており、
    前記文字認識部は、前記ページにおける1つの前記文字が記載されている領域に相当する前記二次元ページデータの領域である文字領域のうちの一部の領域において、前記第1点の1つを初期点として前記第1点を繋げることにより生成される前記文字の一部の形状に基づいて前記文字を認識することを特徴とする書物電子化装置。
  2. 前記文字認識部は、
    前記一部の領域としての所定の領域において、前記第1点の1つを初期点として前記第1点を繋げることにより前記文字の一部の形状を生成し、
    生成した前記文字の一部の形状に基づいて前記文字として複数の候補文字が得られた場合に、前記候補文字の特有点が、前記文字領域のうち前記所定の領域以外の領域に存在したときに、前記文字を当該候補文字であると認識することを特徴とする請求項1に記載の書物電子化装置。
  3. 前記文字認識部は、
    前記一部の領域としての所定の領域において、前記第1点の1つを初期点として前記第1点を繋げることにより前記文字の一部の形状を生成し、
    生成した前記文字の一部の形状から前記文字を特定できない場合に、前記文字領域のうち前記所定の領域以外の領域においてさらに前記第1点を繋げることを特徴とする請求項1に記載の書物電子化装置。
  4. 前記文字領域のサイズを決定する文字領域サイズ決定部をさらに備えることを特徴とする請求項1〜3のいずれか1項に記載の書物電子化装置。
  5. 前記文字の種類に応じて、前記第1点を繋げる方向を異ならせることを特徴とする請求項1〜4のいずれか1項に記載の書物電子化装置。
  6. 書物を撮像し、前記書物の三次元データを生成する三次元データ生成工程と、
    前記三次元データにおける前記書物のページに対応し、インクに対応する点である第1点および背景に対応する値である第2点を有する二次元ページデータを生成する二次元ページデータ生成工程と、
    前記二次元ページデータを用いて前記ページに記載されている文字を認識する文字認識工程と、を含み、
    前記文字認識工程では、前記ページにおける1つの前記文字が記載されている領域に相当する前記二次元ページデータの領域である文字領域のうちの一部の領域において、前記第1点の1つを初期点として前記第1点を繋げることにより生成される前記文字の一部の形状に基づいて前記文字を認識することを特徴とする書物電子化方法。
JP2018149765A 2018-08-08 2018-08-08 書物電子化装置および書物電子化方法 Active JP6797869B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2018149765A JP6797869B2 (ja) 2018-08-08 2018-08-08 書物電子化装置および書物電子化方法
US16/527,778 US20200053242A1 (en) 2018-08-08 2019-07-31 Book electronization apparatus and book electronization method
CN201910722684.9A CN110827192B (zh) 2018-08-08 2019-08-06 书籍电子化装置以及书籍电子化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018149765A JP6797869B2 (ja) 2018-08-08 2018-08-08 書物電子化装置および書物電子化方法

Publications (2)

Publication Number Publication Date
JP2020024640A true JP2020024640A (ja) 2020-02-13
JP6797869B2 JP6797869B2 (ja) 2020-12-09

Family

ID=69406784

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018149765A Active JP6797869B2 (ja) 2018-08-08 2018-08-08 書物電子化装置および書物電子化方法

Country Status (2)

Country Link
US (1) US20200053242A1 (ja)
JP (1) JP6797869B2 (ja)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0830766A (ja) * 1994-07-15 1996-02-02 Sumitomo Electric Ind Ltd 書籍読取装置
JPH11110486A (ja) * 1997-10-01 1999-04-23 Mitsubishi Heavy Ind Ltd 文字認識装置
JP2003346081A (ja) * 2002-05-29 2003-12-05 Mitsubishi Electric Corp 文字認識装置
JP2004070688A (ja) * 2002-08-07 2004-03-04 Nippon Telegr & Teleph Corp <Ntt> 情報入力装置、方法、プログラム、及びそのプログラムを記録した記録媒体
JP2006031506A (ja) * 2004-07-20 2006-02-02 Brother Ind Ltd 画像入出力装置
US20100033772A1 (en) * 2008-08-08 2010-02-11 Craig Steven Borison Multi-page Scanner/Copier and technique/method to simultaneously scan without separating pages or uncoupling documents or books
WO2017131184A1 (ja) * 2016-01-28 2017-08-03 シャープ株式会社 書物電子化方法および書物電子化装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0830766A (ja) * 1994-07-15 1996-02-02 Sumitomo Electric Ind Ltd 書籍読取装置
JPH11110486A (ja) * 1997-10-01 1999-04-23 Mitsubishi Heavy Ind Ltd 文字認識装置
JP2003346081A (ja) * 2002-05-29 2003-12-05 Mitsubishi Electric Corp 文字認識装置
JP2004070688A (ja) * 2002-08-07 2004-03-04 Nippon Telegr & Teleph Corp <Ntt> 情報入力装置、方法、プログラム、及びそのプログラムを記録した記録媒体
JP2006031506A (ja) * 2004-07-20 2006-02-02 Brother Ind Ltd 画像入出力装置
US20100033772A1 (en) * 2008-08-08 2010-02-11 Craig Steven Borison Multi-page Scanner/Copier and technique/method to simultaneously scan without separating pages or uncoupling documents or books
WO2017131184A1 (ja) * 2016-01-28 2017-08-03 シャープ株式会社 書物電子化方法および書物電子化装置

Also Published As

Publication number Publication date
JP6797869B2 (ja) 2020-12-09
US20200053242A1 (en) 2020-02-13
CN110827192A (zh) 2020-02-21

Similar Documents

Publication Publication Date Title
EP3869385B1 (en) Method for extracting structural data from image, apparatus and device
JP4745830B2 (ja) 画像処理装置、画像処理方法、コンピュータプログラム
CN107908745A (zh) 批量文档扫描整理装置、方法、介质及设备
US10496904B2 (en) Book electronization method and book electronization device
US20170200247A1 (en) Systems and methods for authentication of physical features on identification documents
CN106991422A (zh) 字符切割方法、装置及计算机可读存储介质和电子设备
JP6817251B2 (ja) 文字認識装置および文字認識方法
KR20150028631A (ko) 영상에 포함된 표의 구조를 생성하는 방법 및 이를 위한 장치
JP2020024640A (ja) 書物電子化装置および書物電子化方法
CN113032202A (zh) 芯片验证方法、系统、装置、计算机设备及存储介质
CN110827192B (zh) 书籍电子化装置以及书籍电子化方法
JP2020003879A (ja) 情報処理装置、情報処理方法、透かし検出装置、透かし検出方法、及びプログラム
JP6058042B2 (ja) 画像処理装置
CN104933021B (zh) 印前校验传版方法和设备
JP2017084299A (ja) 画像処理装置および画像処理方法
Dey et al. A comparative study of margin noise removal algorithms on marnr: A margin noise dataset of document images
US20190258906A1 (en) Book electronization apparatus and book electronization method
KR101868548B1 (ko) 역공학을 방지하기 위한 위장 게이트에 기반한 칩, 칩에 대한 설계 방법 및 칩 설계 장치
CN110633618B (zh) 书籍电子化装置以及书籍电子化方法
JP6303742B2 (ja) 画像処理装置、画像処理方法、および画像処理プログラム
KR20150047060A (ko) 명함 이미지 여부를 판별하는 장치 및 방법
Abhijith et al. Neuromorphic High Dimensional Computing Architecture for Classification Applications
JP2022053983A (ja) 印刷文字認識用正解データ生成装置、方法、およびプログラム
JP2008176716A (ja) 画像処理装置および方法、プログラム
JP2007142766A (ja) 領域分割装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190801

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200917

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20201020

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20201118

R150 Certificate of patent or registration of utility model

Ref document number: 6797869

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150