JP4780169B2 - データ生成装置、スキャナ、及びコンピュータプログラム - Google Patents

データ生成装置、スキャナ、及びコンピュータプログラム Download PDF

Info

Publication number
JP4780169B2
JP4780169B2 JP2008252479A JP2008252479A JP4780169B2 JP 4780169 B2 JP4780169 B2 JP 4780169B2 JP 2008252479 A JP2008252479 A JP 2008252479A JP 2008252479 A JP2008252479 A JP 2008252479A JP 4780169 B2 JP4780169 B2 JP 4780169B2
Authority
JP
Japan
Prior art keywords
page
data
numbers
specified
contents
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008252479A
Other languages
English (en)
Other versions
JP2010086151A (ja
Inventor
博幸 佐々木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Brother Industries Ltd
Original Assignee
Brother Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Brother Industries Ltd filed Critical Brother Industries Ltd
Priority to JP2008252479A priority Critical patent/JP4780169B2/ja
Priority to US12/569,100 priority patent/US8456688B2/en
Publication of JP2010086151A publication Critical patent/JP2010086151A/ja
Application granted granted Critical
Publication of JP4780169B2 publication Critical patent/JP4780169B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00127Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
    • H04N1/00204Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a digital computer or a digital computer system, e.g. an internet server
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems
    • G06F16/94Hypermedia
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/134Hyperlinking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/258Heading extraction; Automatic titling; Numbering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/0077Types of the still picture apparatus
    • H04N2201/0081Image reader

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • General Business, Economics & Management (AREA)
  • Computing Systems (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Document Processing Apparatus (AREA)
  • Facsimiles In General (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、目次及び/又は索引ページのデータと、それぞれがページ番号を含む複数の通常ページのデータとを含むデータ群からハイパーリンク構造のデータを生成する技術に関する。
例えば、本や雑誌等の複数のページを有する文書がページ毎にスキャンされて、ページ単位でデータが生成されることがある(例えば特許文献1)。生成された複数ページのデータが、データ群として保存されることがある。
特開2006‐197270号公報
ユーザは、データ群の中から、所望の内容が記載されているページのデータを探し出す場合、データ群に含まれるデータを1つずつ確認しなければならない。また、近年、携帯電話、ノート型パソコンを含む携帯型情報端末の普及に伴って、紙ベースで利用してきた書籍、業務文書等がスキャンされてデータ化されることが多い。ユーザは、スキャンによって生成された書籍、業務文書等のデータ群を、携帯型情報端末を利用して閲覧する機会も増えている。この様な利用において、データ化された文書を効率よく閲覧可能とする手段の提供が求められている。
本明細書では、ユーザが、所望のページに対応するデータを容易に見ることが可能となる技術を提供する。
本明細書によって開示される1つの技術は、目次及び/又は索引ページのデータと、それぞれがページ番号を含む複数の通常ページのデータとを含むデータ群からハイパーリンク構造のデータを生成するデータ生成装置であって、前記データ群は、文書をスキャンして得られた画像データであり、前記データ生成装置は、前記データ群から目次及び/又は索引ページのデータを特定するデータ特定手段と、データ特定手段で特定された目次及び/又は索引ページのデータに含まれている数字と、その数字が配置されているデータ上の位置とを特定する目次・索引情報抽出処理実行手段であって、前記目次及び/又は索引ページのデータと予め決められている所定の数字との照合を実行することによって、前記目次及び/又は索引ページのデータから、ページ番号に相当する数字を特定する前記目次・索引情報抽出処理実行手段と、前記複数の通常ページのデータと予め決められている所定の数字との照合を実行することによって、前記複数の通常ページのデータのそれぞれからページ番号に相当する数字を特定するページ番号抽出処理実行手段と、前記複数の通常ページのデータのそれぞれについて、当該通常ページのデータと、当該通常ページのデータから前記ページ番号抽出処理実行手段で特定された数字とを対応づけて記憶する記憶手段と、前記目次・索引情報抽出処理実行手段で特定されたページ番号に相当する数字の位置に対応する位置に、当該数字と同じ数字に対応づけて記憶手段に記憶されている通常ページのデータにリンクするためのハイパーリンクを生成するハイパーリンク手段と、を備える。前記目次・索引情報抽出処理実行手段は、以下の(1)から(3)の条件、即ち、(1)2個以上の数字を含む数字列において、その数字列の前後の第1間隔以下に非数字文字が存在せず、(2)前記2個以上の数字を含む数字列に含まれる各数字間に、カンマ以外の非数字文字が含まれておらず、かつ、(3)前記2個以上の数字を含む数字列にカンマが含まれていないこと、を満たす場合に、(I)前記2個以上の数字を含む数字列において各数字間の間隔が予め決められている第3間隔以下である場合に、当該数字列をページ番号に相当する数字として特定し、(II)目次ページのデータがデータ特定手段によって特定された場合であって、前記2個以上の数字を含む数字列において数字間の1個以上の間隔のいずれかが前記第3間隔より大きい第4間隔である場合に、当該数字列をページ番号に相当する数字として特定せず、(III)索引ページのデータがデータ特定手段によって特定された場合であって、前記2個以上の数字を含む数字列において数字間の1個以上の間隔のいずれかが前記第4間隔である場合に、前記第4間隔で隔てられた複数個の数字群のそれぞれを、ページ番号に相当する数字として特定する。ページ番号抽出処理実行手段は、上記の(1)から(3)の条件を満たす場合に、(IV)前記2個以上の数字を含む数字列において各数字間の間隔が前記第3間隔以下である場合に、当該数字列をページ番号に相当する数字として特定し、(V)前記2個以上の数字を含む数字列において数字間の1個以上の間隔のいずれかが前記第4間隔である場合に、当該数字列をページ番号に相当する数字として特定しない。
本明細書によって開示される他の技術は、目次及び/又は索引ページのデータと、それぞれがページ番号を含む複数の通常ページのデータとを含むデータ群からハイパーリンク構造のデータを生成するデータ生成装置である。なお、上記のデータ群は、文書をスキャンすることによって得られた画像データであってもよいし、ワープロソフト等によって作成されたテキスト形式のデータであってもよい。目次及び/又は索引ページとは、目次及び/又は索引の内容を含むページであり、目次及び/又は索引以外の内容が含まれているページも含む概念である。通常ページとは、目次及び/又は索引の内容を含まないページである。データ生成装置は、データ特定手段と数字特定手段とハイパーリンク手段を備える。データ特定手段は、データ群から目次及び/又は索引ページのデータを特定する。データ特定手段は、例えば、目次及び/又は索引ページのデータをユーザが指定することを許容するものであってもよい。この場合、ユーザによって指定されたデータを特定することが「目次及び/又は索引ページのデータを特定する」ことに相当する。あるいは、ページのデータが画像データである場合には、データに含まれる「目次」、「もくじ」、「索引」、「index」等の文字を認識することによって、目次及び/又は索引ページのデータを特定してもよい。数字特定手段は、データ特定手段で特定された目次及び/又は索引ページのデータに含まれている数字と、その数字が配置されているデータ上の位置とを特定する。データ上の位置とは、数字が配置されているデータ上の座標であってもよく、数字が配置されているデータ上の領域であってもよい。ハイパーリンク手段は、数字特定手段で特定された数字の位置に対応する位置に、当該数字と同じページ番号を含む通常ページのデータにリンクするためのハイパーリンクを生成する。数字特定手段で特定された数字の位置に対応する位置とは、数字特定手段で特定された数字の位置であってもよく、数字特定手段で特定された数字に対応する文字列(例えば、特定された数字に対応する目次ページの見出し、索引ページの索引の対象となる単語等)の位置、又は、数字特定手段で特定された数字の位置とその数字に対応する文字列の位置とを含む領域(例えば、目次又は索引ページが横書きである場合には数字列と同一の行の領域、目次又は索引ページが縦書きである場合には数字列と同一の列の領域)であってもよい。また、特定された数字の位置が含まれていてもよいし、含まれていなくてもよい。なお、上記のハイパーリンクは、「目次及び/又は索引ページが表示されている状態において、そのページ上の数字に対して所定の操作(例えばクリック)が実行された場合に、その数字と同じページ番号の通常ページのデータを表示することをコンピュータに指示する命令(情報)」と言い換えることができる。
上記したデータ生成装置では、目次及び/又は索引ページの数字の位置に、当該数字と同じページ番号を含む通常ページのデータにリンクするためのハイパーリンクを生成する。ハイパーリンク化されたデータを利用すると、ユーザは、目次及び/又は索引ページから所望の内容が記載されているページのデータを容易に見ることができる。即ち、ユーザは、目次及び/又は索引ページが表示されている状態において、所望の内容が記載されているページ番号に相当する数字に対して所定の操作を実行することができる。この場合、ハイパーリンクが機能し、操作が実行された数字と同じページ番号の通常ページが表示される。ユーザは、所望のページのデータを容易に見ることができる。
上記したデータ生成装置では、複数の通常ページのデータのそれぞれのページ番号に相当する数字を、ユーザが指定することを許容する手段を備えていてもよい。ハイパーリンク手段は、数字特定手段で特定された数字の位置に、当該数字と同じ数字がユーザによって指定された通常ページのデータにリンクするためのハイパーリンクを生成してもよい。
一方において、上記したデータ生成装置は、ページ番号特定手段と記憶手段をさらに備えていてもよい。ページ番号特定手段は、複数の通常ページのデータのそれぞれからページ番号に相当する数字を特定してもよい。記憶手段は、複数の通常ページのデータのそれぞれについて、当該通常ページのデータと、当該通常ページのデータからページ番号特定手段で特定された数字とを対応づけて記憶してもよい。ハイパーリンク手段は、数字特定手段で特定された数字の位置に、当該数字と同じ数字に対応づけて記憶手段に記憶されている通常ページのデータにリンクするためのハイパーリンクを生成してもよい。
前者の手法では、ユーザは、複数の通常ページのデータのそれぞれのページ番号に相当する数字を指定しなければならない。一方、後者の手法では、ページ番号特定手段が、複数の通常ページのデータのそれぞれからページ番号に相当する数字を特定する。後者の手法によれば、ユーザがページ番号に相当する数字を指定する手間を省くことができる。
上記したデータ群は、文書をスキャンして得られた画像データであってもよい。この場合、上記したデータ生成装置の数字特定手段とページ番号特定手段は、画像データと予め決められている所定の数字との照合を実行することによって、画像データから数字を特定してもよい。
この構成によると、数字特定手段とページ番号特定手段が数字を特定することができる。なお、照合を実行するための利用される文字は、上記の所定の数字のみに限られない。数字に加えて他の文字を用いて照合を実行してもよい。例えば、ハイフンやカンマを用いて照合を実行してもよい。なお、照合を実行するために利用される文字の数は、できるだけ少ない方がよい。照合を短時間で実行することができるからである。例えば、照合を実行するために利用される文字は、数字と予め決められている記号のみであってもよい。例えば、0から9までの数字と、「,」(カンマ)、「−」(ハイフン)等の記号のみであってもよい。即ち、アルファベット、ひらがな、片仮名、漢字等を利用しなくてもよい。
このデータ生成装置では、ページ番号特定手段は、複数の通常ページのデータのそれぞれについて、当該通常ページの予め決められている領域内のデータと所定の数字との照合を実行することによって、ページ番号に相当する数字を特定してもよい。
通常ページでは、ページ番号は、文書の種類を問わず、当該ページの外周付近に記載されていることがほとんどである。ページ番号特定手段が照合すべきデータを限定することによって、ページ番号に相当する数字を特定する時間を短縮することができる。
上記したデータ生成装置では、ページ番号特定手段は、ページ番号に相当する数字を特定することができなかった通常ページのデータが存在する場合に、当該通常ページのデータに含まれるページ番号に相当する数字を、他の通常ページのデータから特定されたページ番号に相当する数字に基づいて決定してもよい。
ページ番号特定手段がページ番号に相当する数字を特定することができない場合がある。文書をスキャンして画像データを生成する場合、例えば、通常ページのページ番号が記載されている箇所が破損していたり、汚れていることによって、ページ番号に対応する数字のデータが画像データに含まれていないページのデータが存在する場合がある。この場合、ページ番号特定手段は、画像データに含まれている数字を認識しても、ページ番号に相当する数字を特定することができない。例えば、1ページから8ページの通常ページのデータからページ番号に対応する数字が特定されており、10ページ以降の通常ページのデータからページ番号に対応する数字が特定されており、1ページ分の通常ページのデータのページ番号に対応する数字が特定できなかった場合、ページ番号特定手段は、当該ページ番号が特定できなかった通常ページのデータを9ページのデータであると決定することができる。これにより、認識手段によってページ番号が特定できなかった通常ページのデータに相当するページ番号を決定することができる。
上記したデータ群では、複数の通常ページのデータが順に配列されていてもよい。この場合、ページ番号特定手段は、ページ番号に相当する数字を特定することができなかった通常ページのデータが存在する場合に、当該通常ページのデータの前後に配列されている通常ページのデータから特定された2個のページ番号に相当する数字の間の整数を、当該通常ページのデータに含まれるページ番号に相当する数字と決定してもよい。
この構成によれば、認識手段によってページ番号が特定できなかった通常ページのデータに相当するページ番号を決定することができる。
ページのデータには、ページ番号に相当する数字以外にも、数字が含まれていることがある。数字特定手段とページ番号特定手段が、認識手段によって画像データから数字を認識する場合、ページ番号に相当する数字以外の数字を特定する可能性がある。このことから、数字特定手段とページ番号特定手段が数字を特定するための規則が決められていてもよい。
数字特定手段とページ番号特定手段は、2以上の数字を含む数字列において各数字間の間隔が予め決められている第1間隔以下であることを条件として、当該数字列をページ番号に相当する数字として特定してもよい。
例えば、索引ページにおいて、キーワード「ZZZ」が複数のページ(例えば、13ページ目と24ページ目)に記載されている場合、索引ページには、「ZZZ」に対応するページ番号として、「13 24」のように、ページ番号に相当する数字が並べて記載されていることが多い。この数字特定手段では、2以上の数字を含む数字列において各数字間の間隔が予め決められている第1間隔以下である場合に、1ページ分のページ番号に相当する数字であると特定している。この数字特定手段によれば、「13 24」と記載されている数字に対して、「13」と「24」をそれぞれ別のページを表す数字列であると特定することができる。
上記した数字特定手段とページ番号特定手段は、1以上の第1数字と、1以上の第2数字と、第1数字と第2数字の間に配置されているカンマとを含む数字列において、第1数字の各数字間の間隔が前記第1間隔以下であり、第2数字の各数字間の間隔が前記した第1間隔以下であり、カンマとその前後に配置されている数字との間の間隔が予め決められている第2間隔以下であることを条件として、当該数字列を1ページ分のページ番号に相当する数字として特定してもよい。第2間隔は、第1間隔と異なっていてもよく、同一であってもよい。
例えば、ページ番号が1000以上の場合、「1,000」と記載されている場合がある。この数字特定手段では、カンマの前後の数字列のそれぞれが第1間隔以下であり、カンマとその前後の数字との間隔が第2間隔以下である場合、1ページ分のページ番号に相当する数字であると特定する。これにより、「1,000」等の千桁を越える数字をページ番号に相当する数字であると特定することができる。
上記した数字特定手段は、2以上の数字を含む数字列において各数字間の間隔が前記した第1間隔以下であっても、数字列の前及び/又は後の予め決められている第3間隔内に他の文字が存在することを条件として、当該数字列をページ番号に相当する数字として特定しなくてもよい。
ページ番号に相当する数字以外の数字が含まれている場合、数字列の前後に他の文字が存在する場合が多い。この数字特定手段によれば、数字列の前後に他の文字が存在する場合、ページ番号に相当する数字として特定しない。これにより、より正確にページ番号に相当する数字を特定することができる。
上記したページ番号特定手段は、2以上の数字を含む数字列において各数字間の間隔が前記した第1間隔以下であり、数字列の前及び/又は後の予め決められている第4間隔内に他の文字が存在する場合に、以下の規則に従って、ページ番号に相当する数字として特定してもよい。即ち、(1)他の文字がハイフンであり、当該ハイフンが数字列の前及び後に存在することを条件として、当該数字列をページ番号に相当する数字として特定し、(2)他の文字がハイフン以外の非数字文字であること、又は、他の文字がハイフンであり、当該ハイフンが数字列の前又は後のみに存在することを条件として、当該数字列をページ番号に相当する数字として特定しなくてもよい。
通常ページのページ番号に相当する数字列の前後には、非数字文字が含まれている場合がある。例えば、ページ番号が「-123-」のように、数字列のハイフンが含まれている場合がある。一方において、通常ページには、ページ番号以外の数字が含まれている可能性がある。このページ番号特定手段によれば、前記した事象において、ページ番号に相当する数字を的確に特定することができる。
上記した数字特定手段とページ番号特定手段は、2以上の数字の間にカンマ以外の非数字文字を含む数字列をページ番号に相当する数字として特定しなくてもよい。
この構成によれば、より正確にページ番号に相当する数字を特定することができる。
上記したデータ生成装置を備えるスキャナも新規で有用である。即ち、スキャナは、スキャン手段と上記したいずれかのデータ生成装置を備えている。スキャン手段は、文書をスキャンしてデータ群を作成する。データ生成装置は、スキャン手段で作成されたデータ群からハイパーリンク構造のデータを生成する。
このスキャナによれば、スキャンして生成したデータ群から、ハイパーリンク構造のデータを生成することができる。
目次及び/又は索引ページのデータと、それぞれがページ番号を含む複数の通常ページのデータとを含むデータ群からハイパーリンク構造のデータを生成するデータ生成装置のためのコンピュータプログラムも有用である。データ群は、文書をスキャンして得られた画像データである。このコンピュータプログラムは、データ生成装置に搭載されたコンピュータに、前記データ群から目次及び/又は索引ページのデータを特定するデータ特定処理と、データ特定処理で特定された目次及び/又は索引ページのデータに含まれている数字と、その数字が配置されているデータ上の位置とを特定する目次・索引情報抽出処理であって、前記目次及び/又は索引ページのデータと予め決められている所定の数字との照合を実行することによって、前記目次及び/又は索引ページのデータから、ページ番号に相当する数字を特定する前記目次・索引情報抽出処理と、前記複数の通常ページのデータと予め決められている所定の数字との照合を実行することによって、前記複数の通常ページのデータのそれぞれからページ番号に相当する数字を特定するページ番号抽出処理と、前記複数の通常ページのデータのそれぞれについて、当該通常ページのデータと、当該通常ページのデータから前記ページ番号抽出処理で特定された数字とを対応づけて記憶手段に記憶させる記憶制御処理と、前記目次・索引情報抽出処理で特定されたページ番号に相当する数字の位置に対応する位置に、当該数字と同じ数字に対応づけて記憶手段に記憶されている通常ページのデータにリンクするためのハイパーリンクを生成するハイパーリンク処理と、実行させる。前記目次・索引情報抽出処理は、以下の(1)から(3)の条件、即ち、(1)2個以上の数字を含む数字列において、その数字列の前後の第1間隔以下に非数字文字が存在せず、(2)前記2個以上の数字を含む数字列に含まれる各数字間に、カンマ以外の非数字文字が含まれておらず、かつ、(3)前記2個以上の数字を含む数字列にカンマが含まれていないこと、を満たす場合に、(I)前記2個以上の数字を含む数字列において各数字間の間隔が予め決められている第3間隔以下である場合に、当該数字列をページ番号に相当する数字として特定し、(II)目次ページのデータがデータ特定処理によって特定された場合であって、前記2個以上の数字を含む数字列において数字間の1個以上の間隔のいずれかが前記第3間隔より大きい第4間隔である場合に、当該数字列をページ番号に相当する数字として特定せず、(III)索引ページのデータがデータ特定処理によって特定された場合であって、前記2個以上の数字を含む数字列において数字間の1個以上の間隔のいずれかが前記第4間隔である場合に、前記第4間隔で隔てられた複数個の数字群のそれぞれを、ページ番号に相当する数字として特定する。前記ページ番号抽出処理は、上記の(1)から(3)の条件を満たす場合に、(IV)前記2個以上の数字を含む数字列において各数字間の間隔が前記第1間隔以下である場合に、当該数字列をページ番号に相当する数字として特定し、(V)前記2個以上の数字を含む数字列において数字間の1個以上の間隔のいずれかが前記第4間隔である場合に、当該数字列をページ番号に相当する数字として特定しない。
上記のデータ生成装置のための他のコンピュータプログラムも有用である。このコンピュータプログラムは、データ群から目次及び/又は索引ページのデータを特定するデータ特定処理と、データ特定処理で特定された目次及び/又は索引ページのデータに含まれている数字と、その数字が配置されているデータ上の位置とを特定する数字特定処理と、数字特定処理で特定された数字の位置に対応する位置に、当該数字と同じページ番号を含む通常ページのデータにリンクするためのハイパーリンクを生成するハイパーリンク処理をコンピュータに実行させる。
このコンピュータプログラムを用いると、上記のデータ生成装置を実現することができる。
ここでは、本明細書に記載の技術における実施形態の一部を列挙する。
(形態1)データ生成装置は、例えば、データ管理テーブルを記憶するテーブル記憶手段をさらに備えていてもよい。データ管理テーブルには、データ群におけるデータ毎の通し番号とデータ名とデータのページ属性とデータのページ番号とが対応付けて記録可能であってもよい。ページ属性とは、目次ページ、索引ページ又は通常ページのいずれかであってもよい。
(形態2)データ生成装置は、リンク情報テーブルを記憶することが可能であってもよい。リンク情報テーブルには、各目次及び/又は索引ページのデータ毎に、当該ページに含まれている数字とその数字の位置が対応付けて記録可能であってもよい。
(スキャナの構成)
図面を参照して実施例を説明する。図1は、スキャナ10の構成を示すブロック図である。スキャナ10は、制御部14と表示部16と操作部18とスキャナ部20とネットワークインターフェイス(図1及び以下では、ネットワークI/Fと呼ぶ)24とホストデバイスインターフェイス(図1及び以下では、ホストデバイスI/Fと呼ぶ)26とメモリカードインターフェイス(図1及び以下では、メモリカードI/Fと呼ぶ)28を備える。スキャナ10の各部は、バス12によって接続されている。
表示部16は、様々な情報を表示することができる。表示部16は、例えば、液晶の表示パネルであってもよい。操作部18は、ユーザによって操作される複数のキー(テンキー、スタートキー、キャンセルキー等)を有する。ユーザは、操作部18を操作することによって、様々な情報や指示をスキャナ10に入力することができる。スキャナ部20は、スキャナ部20にセットされた書類を読み取って、画像データを作成する。スキャナ部20は、スキャナ部20にセットされた文書(本、雑誌、レジュメ等)のページを自動的にめくることができる。スキャナ10は、ネットワークI/F24とホストデバイスI/F26を介して、外部のPCや電子書籍閲覧端末等に接続され得る。また、スキャナ10は、メモリカードI/F28を介してメモリカードに接続され得る。
図2は、制御部14の構成を示すブロック図である。制御部14は、CPU30とROM32とRAM34とNVRAM36を備える。CPU30は、ROM32に予め記憶されているプログラムに従って様々な処理を実行し、スキャン10の動作を統括的に制御する。図3は、ROM32の記憶内容を示すブロック図である。ROM32は、スキャナ基本機能プログラム38と文字認識プログラム40と目次情報抽出プログラム42とページ情報抽出プログラム44とリンク作成プログラム46を記憶している。CPU30がROM32に記憶されている各プログラムに従って実行する処理は、後で詳しく説明する。
CPU30は、処理の実行中に生成したデータ等をRAM34に記憶させる。図4は、RAM34が有する記憶領域を示すブロック図である。RAM34は、スキャナ基本機能ワーク領域48とページ情報一時記憶領域50とリンク情報作成一時記憶領域52を有する。RAM34の各領域が記憶する内容は、後で詳しく説明する。図5は、NVRAM36が有する記憶領域を示すブロック図である。NVRAM36は、スキャナ基本機能パラメータ記憶領域54を有する。スキャナ基本機能パラメータ記憶領域54は、スキャナ部20の解像度、スキャナ部20のカラー(モノクロ又はカラー)等のスキャナ10の基本機能のパラメータを記憶している。ユーザは、操作部18を操作することによって、スキャナ基本機能パラメータ記憶領域54に記憶されている各種のパラメータを変更することができる。
(CPUの処理)
ユーザは、操作部18を操作することによって、スキャナ10に書類をスキャンすることを指示することができる。CPU30は、ROM32に記憶されているスキャナ基本機能プログラム38に従って、「通常モード」と「文書モード」のいずれかをユーザが選択可能となるように、表示部16に表示させる。ユーザは、操作部18を操作することによって、「通常モード」と「文書モード」のいずれかを選択することができる。ユーザによって「通常モード」が選択されると、CPU30は、ROM32に記憶されているスキャナ基本機能プログラム38に従って、スキャナ部20にセットされた書類をスキャナ部20に読み取らせ、画像データを作成する。CPU30は、作成した画像データをネットワークI/F24又はホストデバイスI/F26を介して、外部のPC等に送信する。あるいはメモリカードI/F28を介して接続されているメモリカードに記憶させる。
一方において、ユーザによって「文書モード」が選択された場合について、以下に説明する。図6は、「文書モード」が選択された場合に、CPU30が実行する処理の手順を示すフローチャートである。CPU30は、ROM32に記憶されているスキャナ基本機能プログラム38に従って、1ページ分のスキャン及び保存処理を実行する(S12)。図7は、1ページ分のスキャン及び保存処理におけるCPU30が実行する処理の手順を示すフローチャートである。
1ページ分のスキャン及び保存処理では、CPU30は、ページ属性をユーザに選択させるために、「目次」、「索引」、「通常」のページ属性選択ボタンを表示部16に表示させる(S40)。ユーザは、表示部16に表示された各ボタンから、スキャンしようとするページの属性に対応するページ属性選択ボタンを選択する。CPU30は、ユーザによって、ページ属性選択ボタンのいずれかが選択されることを監視している(S42)。ユーザによって、ページ属性選択ボタンのいずれかが選択されると(S42でYES)、CPU30は、スキャナ部20にセットされている1ページ分の文書をスキャンさせる(S44)。CPU30は、スキャナ部20でスキャンされた結果、生成された1ページ分の画像データを、RAM34のページ情報一時記憶領域50に保存させる(S46)。CPU30は、ページ情報一時記憶領域50に生成した画像データに関する情報を登録する(S48)。ページ情報一時記憶領域50は、画像データ管理テーブル60を記憶することができる。
図8は、画像データ管理デーブル60の一例を示す。画像データ管理テーブル60は、スキャン番号62と画像データ名64と属性66とページ番号68を対応付けて記録することができる。スキャン番号62には、「文書モード」が選択されてから、スキャナ部20によって生成された画像データの順番が記録される。スキャン番号は、「0」、「1」・・・の順に並んでいる。画像データ名64には、例えば、画像データが生成された時刻が記録される。属性66には、図7のS42でユーザによって選択されたページ属性が記録される。ページ番号68には、ページ属性が「通常」の画像データに対応するページ番号が記録される。図7のS48では、CPU30は、スキャン番号62、画像データ名64、属性66を登録する。ページ番号68は、後で実行される処理(図6のS20等)で登録される。
CPU30は、表示部16に、「次のページ有り」、「次のページ無し」の選択ボタンを表示させる(S50)。ユーザは、表示部16に表示された「次のページ有り」、「次のページ無し」のいずれかの選択ボタンを選択することができる。CPU30は、ユーザによって、選択ボタンが選択されることを監視している(S52)。ユーザによって選択ボタンのいずれかが選択されると(S52でYES)、CPU30は、1ページ分のスキャン及び保存処理を終了し、図6のS14に進む。
図6のS14では、CPU30は、次のページがあるか否かを確認する。S14でYESの場合、CPU30は、次のページの文書に対して、1ページ分のスキャン及び保存処理を実行する。一方において、S14でNOの場合、CPU30は、スキャン番号i=0とする(S16)。スキャン番号「i」とは、CPU30が実行するS18からS24までの処理の処理対象となる画像データを示す。例えば、スキャン番号i=0の場合、画像データ管理テーブル60のスキャン番号「0」に対応する画像データが処理対象となる。
CPU30は、画像データ管理テーブル60に基づいて、スキャン番号「i」に対応する属性66が「通常」であるか否かを確認する(S18)。S18でYESの場合、CPU30は、ページ番号抽出処理(S20)を実行する。一方において、S18でNOの場合、CPU30は、目次・索引情報抽出処理(S22)を実行する。
図9は、CPU30が実行するページ番号抽出処理の処理手順を示すフローチャートである。CPU30は、ROM32の文字認識プログラム40とページ情報抽出プログラム44に記憶されているプログラムに従って、ページ番号抽出処理を実行する。CPU30は、スキャン番号「i」に対応する画像データのノイズ除去及び2値化処理をする(S60)。CPU30は、画像データの予め設定されているページ番号検索領域内に含まれる文字列を文字毎に分離する文字分離処理を実行する(S62)。図10は、1ページ分の画像データにおける予め設定されているページ番号検索領域の一例を示す。通常ページ70では、図10の破線で区切られた複数の領域72の1つにページ番号に相当する数字が含まれていることが多い。CPU30は、図10の複数の領域72のみから、ページ番号に相当する数字を検索する。これにより、1ページ分の画像データの全領域を検索対象とする場合に比べて、ページ番号に相当する数字の検索時間を短縮することができる。また、ページ番号以外の数字を検出する頻度も抑えることが可能になり、ページ番号に相当する数字を検索する精度を向上させることも可能になる。図10に示すように、文字分離処理では、CPU30は、領域72内に含まれている文字列の各文字の領域74を特定する。
CPU30は、文字分離処理で分離した各文字の中から、数字及び特定の非数字文字を識別する文字識別処理を実行する(S64)。文字識別処理では、CPU30は、領域72内の各文字とROM32の文字認識プログラム40に記憶されている文字形状データとの照合を実行することによって、数字及び特定の非数字文字を識別する。文字形状データには、アラビア数字等の通常ページ番号を表す数字として用いられる数字が複数種類のフォントで示されている。特定の非数字文字には、「,」、「−」、「.」等が含まれている。従って、文字認識の対象となる文字形状データは、数字と予め決められている記号のみを含んでおり、アルファベット、ひらがな、片仮名、漢字等を含んでいない。また、文字形状データに含まれている数字は、「0」から「9」までの10個の数字だけであってもよい。CPU30は、ページ番号に相当する数字を識別するページ番号識別処理を実行する(S66)。ページ番号識別処理では、CPU30は、ROM32のページ情報抽出プログラム44に記憶されているページ番号を示す数字の識別規則(図16)に従ってページ番号を識別する。ページ番号を示す数字の識別規則は、後で詳しく説明する。
CPU30は、S66の処理によって、ページ番号に相当する数字を識別できたか否かを確認する(S68)。S68でYESの場合、CPU30は、画像データ管理テーブル60のページ番号68に、識別した数字を記録して(S70)、ページ番号抽出処理を終了する。一方において、S68でNOの場合、CPU30は、画像データ管理テーブル60のページ番号68に、「−1」を記録して(S72)、ページ番号抽出処理を終了する。
図11は、CPU30が実行する目次・索引情報抽出処理の処理手順を示すフローチャートである。CPU30は、ROM32の文字認識プログラム40と目次情報抽出プログラム42に記憶されているプログラムに従って、目次・索引情報抽出処理を実行する。CPU30は、S80の処理を実行する。S80の処理は、図9のS60と同一の処理である。CPU30は、1ページ分の画像データの全領域に含まれる文字を分離する文字分離処理を実行する(S82)。図12と図13には、目次ページの一例を示す。図14には、索引ページの一例を示す。図12から図14に示すように、目次ページ及び索引ページでは、ページ番号に相当する数字が1ページ分の画像データの特定に位置に配置されているとは限らない。そのため、CPU30は、1ページ分の画像データの全領域について、文字分離処理を実行する。CPU30は、S84の処理を実行する。S84の処理は、図9のS64のそれぞれと同一の処理である。
CPU30は、ページ番号に相当する数字を識別するページ番号識別処理を実行する(S86)。ページ番号識別処理では、CPU30は、ROM32のページ情報抽出プログラム44に記憶されているページ番号を示す数字の識別規則(図16)に従ってページ番号を識別する。ページ番号を示す数字の識別規則は、後で詳しく説明する。S86では、CPU30は、ページ番号に相当する数字の画像データにおける座標又は領域を特定する。ページ番号に相当する数字を識別することができた各画像データに関する情報をRAM34のリンク情報作成一時記憶領域52に記録する(S88)。
RAM34のリンク情報作成一時記憶領域52は、リンク情報テーブル90を記憶することができる。図15は、リンク情報テーブル90の一例を示す。リンク情報テーブル90は、スキャン番号92とページ番号94と位置情報96を記録することができる。スキャン番号92には、目次・索引情報抽出処理が実行された画像データに対応付けて画像データ管理テーブル60に記憶されているスキャン番号が記録される。ページ番号94の列には、図11のS86で特定された数字が記録される。位置情報96の列には、図11のS86で特定された数字の位置情報(例えば数字の座標や領域)がページ番号94に対応付けて記録される。CPU30は、図11のS88において、ページ番号に相当する数字を識別することができた各画像データに関して、ページ番号に相当する数字とその数字の位置情報をリンク情報テーブル90に登録して、目次・索引情報抽出処理を終了する。
ここで、図9のS66と図11のS86でCPU30が実行するページ番号識別処理において、CPU30が従うページ番号を示す数字の識別規則について説明する。図16は、ページ番号を示す数字の識別規則102と適用例104が記載された識別表100を示す。CPU30は、識別表100に記載された規則に従って、各属性のページに対応する画像データに含まれる数字をページ番号に相当する数字であると識別する。識別表100内では、特別の説明がない限り、数字列は、1個又は2個以上の連続した数字を意味する。識別規則(1)は、数字列の前及び/又は後の予め決められている第1間隔以下に非数字文字が存在する場合の規則である。識別規則(1)に従うと、CPU30は、当該数字列が目次ページ又は索引ページに該当する画像データに含まれている場合、ページ番号として当該数字列を特定しない。例えば、図12、13に記載されている「第1章」等に含まれている数字列はページ番号に相当する数字列として特定されない。一方、当該数字列が通常ページに該当する画像データに含まれている場合、CPU30は、非数字文字が「−」(ハイフン)以外の場合、ページ番号として当該数字列を特定せず、非数字文字が「−」であって、「−」が数字列の前後両側にある場合、識別規則(2)から(4)に従う。例えば、図10に記載されている「第2章」に含まれている「2」は、ページ番号に相当する数字列として特定されない。
識別規則(2)は、2以上の数字の間に「,」(カンマ)以外の非数字文字が含まれている場合の規則である。識別規則(2)に従うと、CPU30は、当該数字がいずれのページ属性の画像データであっても、当該数字列をページ番号として当該数字列を特定しない。例えば、図12に記載されている「1.1」等に含まれている数字列はページ番号に相当する数字列として特定されない。
識別規則(3)は、数字列が識別規則(1)、(2)でページ番号として特定しないと識別されず、かつ、第1数字と第2数字との間に「,」を含んでいる場合の規則である。識別規則(3)に従うと、CPU30は、「,」の前後の数字のそれぞれと「,」との間隔が予め決められている第2間隔以下であり、第1数字に含まれる数字が複数の場合に第1数字に含まれる数字間の間隔が予め決められている第3間隔以下であり、かつ、第2数字に含まれる数字が複数の場合に第2数字に含まれる数字間の間隔が予め決められている第3間隔以下である場合に、当該数字がいずれのページ属性の画像データであっても、当該数字列をページ番号として当該数字列を特定する。一方において、CPU30は、「,」の前又は後の数字と「,」との間隔が予め決められている第2間隔以上であり、第1数字に含まれる数字が複数の場合に第1数字に含まれる数字間の間隔が予め決められている第3間隔以下であり、かつ、第2数字に含まれる数字が複数の場合に第2数字に含まれる数字間の間隔が予め決められている第3間隔以下である場合に、当該数字列が目次ページ又は通常ページに該当する画像データに含まれている場合、当該数字列をページ番号として当該数字列を特定せず、当該数字列が索引ページに該当する画像データに含まれている場合、当該数字列の第1数字と第2数字をそれぞれページ番号に相当する数字として特定する。例えば、図14に記載されている「23, 33, 70」等の数字列では、ページ番号に相当する数字として「23」、「33」、「70」が特定される。
識別規則(4)は、数字列が識別規則(1)、(2)でページ番号として特定しないと識別されず、かつ、数字列に「,」を含まない場合の規則である。識別規則(4)に従うと、CPU30は、数字間の間隔が前記した第3間隔以下である場合に、当該数字がいずれのページ属性の画像データであっても、当該数字列をページ番号として当該数字列を特定する。一方において、CPU30は、各数字間の間隔のいずれかが前記した第3間隔以上の第4間隔であり、かつ、第4間隔で隔たれた各数字の間隔が前記した第3間隔以下である場合に、当該数字列が目次ページ又は通常ページに該当する画像データに含まれている場合、当該数字列をページ番号として当該数字列を特定せず、当該数字列が索引ページに該当する画像データに含まれている場合、第4間隔で隔たれた各数字のそれぞれをページ番号に相当する数字として特定する。
上記した識別規則(1)から(4)に従うことによって、CPU30は、ページ番号に相当しない数字列をページ番号に相当する数字列として特定する可能性を低くすることができる。
図6において、S20のページ番号抽出処理又はS22の目次・索引情報抽出処理が終了すると、CPU30は、スキャン番号「i」に1を加算する(S24)。CPU30は、スキャン番号「i」と画像データ管理テーブル60のスキャン番号62とを比較して、全てのスキャン済みページに対して、ページ番号抽出処理又は目次・索引情報抽出処理が実行されたか否かを確認する(S26)。S26でNOの場合、S18に進む。一方において、S26でYESの場合、CPU30は、ページ情報補正処理を実行する(S28)。
図17は、ROM32のページ情報抽出プログラム44に記憶されているプログラムに従って、CPU30が実行するページ番号補正処理の処理手順を示すフローチャートである。CPU30は、スキャン番号「i」=「0」とする(S92)。CPU30は、画像データ管理テーブル60を確認し、スキャン番号「i」に対応する画像データの属性66が「通常」であるか否かを確認する(S94)。S94でNOの場合、S104に進む。一方において、S94でYESの場合、スキャン番号「i」に対応するページ番号68が「−1」であるか否かを確認する(S96)。S96でNOの場合、S104に進む。一方において、S96でYESの場合、CPU30は、スキャン番号「i」の前及び/又は後に画像データ管理テーブル60に登録されている画像データのページ番号68から、当該画像データのページ番号に相当する数字を特定する(S98)。
本実施例では、ユーザは、文書をページ番号順にスキャンさせている。CPU30は、スキャン番号「i」の前後、即ち、スキャン番号「i−1」とスキャン番号「i+1」のページ番号68が特定されている場合、当該2個のページ番号68に記録されている数字の間の整数をスキャン番号「i」の画像データのページ番号に相当する数字と決定する。あるいは、スキャン番号「i」の前の複数の連続するスキャン番号に対応するページ番号が、例えば、「11,12,13,14」と連続している場合、スキャン番号「i」の画像データのページ番号に相当する数字を、「15」と決定する。また、スキャン番号iの後の複数の連続するスキャン番号に対応するページ番号が、例えば、「11,12,13,14」と連続している場合、スキャン番号「i」の画像データのページ番号に相当する数字を、「10」と決定する。
CPU30は、S98において、ページ番号が決定できたか否かを確認する(S100)。S100でNOの場合、S104に進む。一方において、S100でYESの場合、CPU30は、決定したページ番号に相当する数字を、画像データ管理テーブル60のページ番号68に記録して(S102)、S104に進む。S104では、CPU30は、スキャン番号「i」に1を加算する。CPU30は、スキャン番号「i」と画像データ管理テーブル60のスキャン番号62を比較して、全てのスキャン済みページに対して、ページ番号抽出処理又は目次・索引情報抽出処理が実行されたか否かを確認する(S106)。S106でNOの場合、S94に進む。一方において、S106でYESの場合、ページ情報補正処理を終了する。
図6に戻って、S28のページ情報補正処理が終了すると、CPU30は、ハイパーリンク処理を実行する(S30)。図18は、ハイパーリンク処理によって、CPU30が生成するハイパーリンク構造のファイル80の一例を示す。CPU30は、RAM34のリンク情報作成一時記憶領域52にファイル80を生成する。図18では、ページ数が「n」ページの文書について、ハイパーリンク構造のファイル80が生成された場合について示す。ファイル80は、例えば、PDF、MHTML(MIME Encapsulation of Aggregate HTML)等のハイパーリンク構造を有するファイル形式で生成されている。
ファイル80は、ヘッダ82と複数のページ情報84と複数の画像データ86を有している。ファイル80には、各ページ(ページ0からページn−1まで)のページ情報が記述されている。ページ情報84と画像データ86は、一対一で対応している。図19は、画像pが通常ページの場合のページ情報84の内容を示す。画像pが通常ページの場合、ページ情報84には、画像pへのリンク情報84aが記述されている。図20は、画像pが目次又は索引ページの場合のページ情報の内容を示す。画像pが目次又は索引ページの場合、ページ情報84には、画像pへのリンク情報84aと、所定のページ情報84へのリンク情報84bが記述されている。図21は、リンク情報84bの内容を示す。リンク情報84bは、ページ番号に相当する数字列の位置情報84cとページ情報へのリンク情報84dとが対応づけられたものである。
ページ番号に相当する数字列の位置情報84cには、図11のS88でリンク情報テーブル90に記録された各数字列とその数字列の位置情報が記述されている。即ち、リンク情報テーブル90に10個の数字列が記録された場合、10個の位置情報84cを含むリンク情報84bが作成される。個々の位置情報84cにリンク先のページ情報84dが対応づけられている。ページ情報へのリンク情報84dは、それに対応づけられている位置情報84cに記述されている数字列と同じページ番号のページ情報にリンクするための情報である。
次に、CPU30がファイル80を生成する方法について説明する。CPU30は、ファイル80に図7のS46で保存された画像データ86を書き込む。CPU30は、各画像データ86に、当該画像データ86に対応付けて画像データ管理テーブル60に記録されているスキャン番号62と同一の番号を付与する。ここでは、付与された番号が「p」(即ち、画像p)であるとして説明する。
CPU30は、各画像データ86について、ページ情報84を作成する。CPU30は、画像データ86に付与されている番号「p」と同一のスキャン番号62に対応付けて画像データ管理テーブル60に記録されている属性66を確認する。属性66が「通常」の場合、CPU30は、画像pへのリンク情報84aをページ情報84に書き込むことによってページ情報を作成する。一方において、属性が「目次」又は「索引」の場合、CPU30は、画像pへのリンク情報84aをページ情報84に書き込む。また、CPU30は、スキャン番号92が「p」であるリンク情報テーブル90から、ページ番号94と位置情報96を、ページ番号94毎に位置情報84cに書き込む。
次に、CPU30は、位置情報84cに記述されているページ番号94と同一のページ番号68を画像データ管理テーブル60から検索し、そのページ番号68に対応付けて画像データ管理テーブル60に記録されているスキャン番号62(スキャン番号「p」)を特定する。CPU30は、特定したスキャン番号「p」のページ情報84へのリンク情報84dを、位置情報84cに対応付けて書き込む。CPU30は、リンク情報84dの書き込み処理を全ての位置情報48cに対して実行することにより、ページ情報84を作成する。CPU30は、上記した処理を、全ての画像データ86に対して実行することによって、ファイル80を生成する。
図6に戻ってS30のハイパーリンク処理が終了し、ファイル80が生成されると、CPU30は、ファイル80をネットワークI/F24等を介してPC等の外部端末に送信する(S32)。CPU30は、生成したファイル80を、RAM34に記憶させてもよい。CPU30は、ファイル80を生成するために、RAM34に一時保存した各種のデータを削除して(S34)、処理を終了する。
ユーザは、スキャナ10からPCに送信されたファイル80の中から、目次ページに相当する画像データをPCに表示させる。PCの表示部には、図12又は図13に示す画像が表示される。ユーザは、目次を確認して、第2章に相当する画像データをPCの表示部に表示させたいとする。このとき、ユーザは、目次ページの第2章のページ番号に相当する数字「6」をクリックする。PCは、ファイル80のページ情報84に含まれる位置情報84cとリンク先のページ情報84dに基づいて、数字「6」にハイパーリンクされたページ情報84をファイル80から検索する。PCは、検索にヒットしたページ情報84に対応する画像を表示部に表示させることができる。これにより、ユーザは、複数の通常ページの画像データを一つずつ表示部に表示させて、所望の内容が記載されているページに対応する画像データを探さなくてもよい。
また、上記したスキャナ10では、CPU30は、画像データに含まれるページ番号に相当する数字列を特定するために、数字及び特定の非数字文字のみを認識している。この構成では、CPU30は、画像データに含まれている全ての文字を認識しなくても、ファイル80を生成することができる。これにより、高精度な文字認識手段を用いることなく、ハイパーリンク構造のファイル80を生成することができる。
(変形例)
上記した実施例では、スキャナ10は、1ページ分のページをスキャナ部20にスキャンさせるときに、当該ページの属性「目次」、「索引」、「通常」をユーザに選択させている。しかしながら、1つの文書の全てのページをスキャナ部20にスキャンさせてからページの属性をユーザに選択させてもよい。あるいは、スキャナ10は、生成した画像データの全領域又は特定の領域に対して文字認識することによって、当該ページの属性「目次」、「索引」、「通常」を特定してもよい。
また、上記した実施例では、CPU30は、目次又は索引ページのページ番号に相当する数字を特定する場合、識別規則(1)から(4)に従って、特定している。しかしながら、CPU30は、目次又は索引ページに含まれる数字列のうち、数字列が1個の数字の場合、又は、数字列が2個以上の数字を含んでおり、かつ、各数字間の間隔が第3間隔以下である場合、当該数字列をページ番号に相当する数字列として特定してもよい。これにより、CPU30が実行する目次・索引情報抽出処理の時間を短縮することができる。ユーザは、目次又は索引ページをPCの表示部に表示させて、所望のページ番号を選択する(クリックする)場合に、ページ番号に相当しない数字列を選択することはほとんどなく、ページ番号に相当しない数字列の位置に、当該数字列に対応するページ番号の通常ページがハイパーリンクされていても、ユーザが混乱することはない。
また、目次又は索引ページでは、ページ番号として検出された数字列と同じ並びにある領域(目次又は索引ページが横書きである場合(例えば図12、14)には数字列と同一の行の領域、目次又は索引ページが縦書きである場合(例えば図13)には数字列と同一の列の領域)に対しても、ハイパーリンクを作成してもよい。
また、上記した実施例では、スキャナ10のCPU30により、ハイパーリンク構造のファイル80を生成している。しかしながら、スキャナ10に接続されたPC等の外部装置のCPUによって、ファイル80を生成してもよい。この場合、PCには、上記した文字認識プログラム40、目次情報抽出プログラム42、ページ情報抽出プログラム44、リンク作成プログラム46が記憶されていてもよい。PCは、これらのプログラムを実行することで、スキャナ10により読み取られ、PCにて受信した画像データに対して、ハイパーリンクを生成することができる。
また、上記した実施例では、ファイル80は、1個のファイルである。しかしながら、ファイル80は、複数個のファイル群であってもよい。例えば、目次及び/索引ページのデータと各画像データのそれぞれとを別々のファイル(例えば、従来のHTML形式のファイルと画像データのファイル)としてもよい。
以上、本発明の具体例を詳細に説明したが、これらは例示にすぎず、特許請求の範囲を限定するものではない。特許請求の範囲に記載の技術には、以上に例示した具体例を様々に変形、変更したものが含まれる。
また、本明細書または図面に説明した技術要素は、単独であるいは各種の組合せによって技術的有用性を発揮するものであり、出願時請求項記載の組合せに限定されるものではない。また、本明細書または図面に例示した技術は複数目的を同時に達成するものであり、そのうちの一つの目的を達成すること自体で技術的有用性を持つものである。
スキャナの構成を示す。 制御部の構成を示す。 ROMの構成を示す。 RAMの構成を示す。 NVRAMの構成を示す。 ユーザによって「文書モード」が選択された場合のCPUが実行する処理を示すフローチャートを示す。 CPUが実行する1ページ分のスキャン及び保存処理を示すフローチャートを示す。 画像データ管理デーブル60の一例を示す。 CPU30が実行するページ番号抽出処理を示すフローチャートを示す。 1ページ分の画像データにおける予め設定されているページ番号検索領域の一例を示す。 CPU30が実行する目次・索引情報抽出処理の処理手順を示すフローチャートを示す。 目次ページの一例を示す。 目次ページの一例を示す。 索引ページの一例を示す。 リンク情報テーブルの一例を示す。 CPUが従う識別規則の一例を示す。 CPUが実行するページ番号補正処理の処理手順を示すフローチャートを示す。 CPUが生成するハイパーリンク構造のファイル80の一例を示す。 通常ページの場合のページ情報の内容を示す。 目次又は索引ページの場合のページ情報の内容を示す。 リンク情報の内容を示す。
符号の説明
10:スキャナ、14:制御部、16:表示部、18:操作部、20:スキャナ部、22:表示部、30:CPU、32:ROM、34:RAM、36:NVRAM、60:画像データ管理テーブル、80:リンク構造のファイル、90:リンク情報テーブル

Claims (11)

  1. 目次及び/又は索引ページのデータと、それぞれがページ番号を含む複数の通常ページのデータとを含むデータ群からハイパーリンク構造のデータを生成するデータ生成装置であって、
    前記データ群は、文書をスキャンして得られた画像データであり、
    前記データ生成装置は、
    前記データ群から目次及び/又は索引ページのデータを特定するデータ特定手段と、
    データ特定手段で特定された目次及び/又は索引ページのデータに含まれている数字と、その数字が配置されているデータ上の位置とを特定する目次・索引情報抽出処理実行手段であって、前記目次及び/又は索引ページのデータと予め決められている所定の数字との照合を実行することによって、前記目次及び/又は索引ページのデータから、ページ番号に相当する数字を特定する前記目次・索引情報抽出処理実行手段と、
    前記複数の通常ページのデータと予め決められている所定の数字との照合を実行することによって、前記複数の通常ページのデータのそれぞれからページ番号に相当する数字を特定するページ番号抽出処理実行手段と、
    前記複数の通常ページのデータのそれぞれについて、当該通常ページのデータと、当該通常ページのデータから前記ページ番号抽出処理実行手段で特定された数字とを対応づけて記憶する記憶手段と、
    前記目次・索引情報抽出処理実行手段で特定されたページ番号に相当する数字の位置に対応する位置に、当該数字と同じ数字に対応づけて記憶手段に記憶されている通常ページのデータにリンクするためのハイパーリンクを生成するハイパーリンク手段と、を備え、
    前記目次・索引情報抽出処理実行手段は、
    以下の(1)から(3)の条件、即ち、
    (1)2個以上の数字を含む数字列において、その数字列の前後の第1間隔以下に非数字文字が存在せず、
    (2)前記2個以上の数字を含む数字列に含まれる各数字間に、カンマ以外の非数字文字が含まれておらず、かつ、
    (3)前記2個以上の数字を含む数字列にカンマが含まれていないこと、
    を満たす場合に、
    (I)前記2個以上の数字を含む数字列において各数字間の間隔が予め決められている第間隔以下である場合に、当該数字列をページ番号に相当する数字として特定し、
    (II)目次ページのデータがデータ特定手段によって特定された場合であって、前記2個以上の数字を含む数字列において数字間の1個以上の間隔のいずれかが前記第間隔より大きい第4間隔である場合に、当該数字列をページ番号に相当する数字として特定せず、
    (III)索引ページのデータがデータ特定手段によって特定された場合であって、前記2個以上の数字を含む数字列において数字間の1個以上の間隔のいずれかが前記第4間隔である場合に、前記第4間隔で隔てられた複数個の数字群のそれぞれを、ページ番号に相当する数字として特定し、
    ページ番号抽出処理実行手段は、
    上記の(1)から(3)の条件を満たす場合に、
    (IV)前記2個以上の数字を含む数字列において各数字間の間隔が前記第間隔以下である場合に、当該数字列をページ番号に相当する数字として特定し、
    (V)前記2個以上の数字を含む数字列において数字間の1個以上の間隔のいずれかが前記第4間隔である場合に、当該数字列をページ番号に相当する数字として特定しない、データ生成装置。
  2. 前記ページ番号抽出処理実行手段は、前記複数の通常ページのデータのそれぞれについて、当該通常ページの予め決められている領域内のデータと前記所定の数字との照合を実行することによって、ページ番号に相当する数字を特定する
    ことを特徴とする請求項1に記載のデータ生成装置。
  3. 前記ページ番号抽出処理実行手段は、ページ情報補正処理実行手段を備え、
    前記ページ情報補正処理実行手段は、ページ番号に相当する数字を特定することができなかった通常ページのデータが存在する場合に、当該通常ページのデータに含まれるページ番号に相当する数字を、他の通常ページのデータから特定されたページ番号に相当する数字に基づいて決定する
    ことを特徴とする請求項1又は2に記載のデータ生成装置。
  4. 前記データ群では、前記複数の通常ページのデータが順に配列されており、
    前記ページ情報補正処理実行手段は、ページ番号特定手段は、ページ番号に相当する数字を特定することができなかった通常ページのデータが存在する場合に、当該通常ページのデータの前後に配列されている通常ページのデータから特定された2個のページ番号に相当する数字の間の整数を、当該通常ページのデータに含まれるページ番号に相当する数字と決定する
    ことを特徴とする請求項3に記載のデータ生成装置。
  5. 前記目次・索引情報抽出処理実行手段と前記ページ番号抽出処理実行手段とは、
    上記の(1)と(2)との条件を満たし、かつ、
    1個以上の第1数字と、1個以上の第2数字と、第1数字と第2数字の間に配置されているカンマとを含む数字列において、第1数字の各数字間の間隔が前記第間隔以下であり、第2数字の各数字間の間隔が前記第間隔以下であり、カンマとその前後に配置されている数字との間の間隔が予め決められている第2間隔以下であることを条件として、当該数字列をページ番号に相当する数字として特定する
    ことを特徴とする請求項1から4のいずれか一項に記載のデータ生成装置。
  6. 前記目次・索引情報抽出処理実行手段は、数字列の前及び/又は後の予め決められている前記間隔内に他の文字が存在することを条件として、当該数字列をページ番号に相当する数字として特定しない
    ことを特徴とする請求項1から5のいずれか一項に記載のデータ生成装置。
  7. 前記ページ番号抽出処理実行手段は、数字列の前及び/又は後の予め決められている第間隔内に他の文字が存在する場合に、
    前記他の文字がハイフン以外の非数字文字であること、又は、前記他の文字がハイフンであり、当該ハイフンが数字列の前又は後のみに存在することを条件として、当該数字列をページ番号に相当する数字として特定しない
    ことを特徴とする請求項1から6のいずれか一項に記載のデータ生成装置。
  8. 前記目次・索引情報抽出処理実行手段と前記ページ番号抽出処理実行手段とは、2個以上の数字の間にカンマ以外の非数字文字を含む数字列をページ番号に相当する数字として特定しない
    ことを特徴とする請求項1から7のいずれか一項に記載のデータ生成装置。
  9. 前記目次・索引情報抽出処理実行手段と前記ページ番号抽出処理実行手段とは、前記画像データの中から、数字及び予め決められている記号のみを識別し、識別された数字及び予め決められた記号の中から、ページ番号に相当する数字を特定する請求項1から8のいずれか一項に記載のデータ生成装置。
  10. 文書をスキャンして前記データ群を作成するスキャン手段と、
    スキャン手段で作成された前記データ群からハイパーリンク構造のデータを生成する請求項1から9のいずれか一項に記載のデータ生成装置と、
    を備えるスキャナ。
  11. 目次及び/又は索引ページのデータと、それぞれがページ番号を含む複数の通常ページのデータとを含むデータ群からハイパーリンク構造のデータを生成するデータ生成装置のためのコンピュータプログラムであって、
    前記データ群は、文書をスキャンして得られた画像データであり、
    コンピュータプログラムは、データ生成装置に搭載されたコンピュータに、
    前記データ群から目次及び/又は索引ページのデータを特定するデータ特定処理と、
    データ特定処理で特定された目次及び/又は索引ページのデータに含まれている数字と、その数字が配置されているデータ上の位置とを特定する目次・索引情報抽出処理であって、前記目次及び/又は索引ページのデータと予め決められている所定の数字との照合を実行することによって、前記目次及び/又は索引ページのデータから、ページ番号に相当する数字を特定する前記目次・索引情報抽出処理と、
    前記複数の通常ページのデータと予め決められている所定の数字との照合を実行することによって、前記複数の通常ページのデータのそれぞれからページ番号に相当する数字を特定するページ番号抽出処理と
    前記複数の通常ページのデータのそれぞれについて、当該通常ページのデータと、当該通常ページのデータから前記ページ番号抽出処理で特定された数字とを対応づけて記憶手段に記憶させる記憶制御処理と、
    前記目次・索引情報抽出処理で特定されたページ番号に相当する数字の位置に対応する位置に、当該数字と同じ数字に対応づけて記憶手段に記憶されている通常ページのデータにリンクするためのハイパーリンクを生成するハイパーリンク処理と、実行させ、
    前記目次・索引情報抽出処理は、
    以下の(1)から(3)の条件、即ち、
    (1)2個以上の数字を含む数字列において、その数字列の前後の第1間隔以下に非数字文字が存在せず、
    (2)前記2個以上の数字を含む数字列に含まれる各数字間に、カンマ以外の非数字文字が含まれておらず、かつ、
    (3)前記2個以上の数字を含む数字列にカンマが含まれていないこと、
    を満たす場合に、
    (I)前記2個以上の数字を含む数字列において各数字間の間隔が予め決められている第間隔以下である場合に、当該数字列をページ番号に相当する数字として特定し、
    (II)目次ページのデータがデータ特定処理によって特定された場合であって、前記2個以上の数字を含む数字列において数字間の1個以上の間隔のいずれかが前記第間隔より大きい第4間隔である場合に、当該数字列をページ番号に相当する数字として特定せず、
    (III)索引ページのデータがデータ特定処理によって特定された場合であって、前記2個以上の数字を含む数字列において数字間の1個以上の間隔のいずれかが前記第4間隔である場合に、前記第4間隔で隔てられた複数個の数字群のそれぞれを、ページ番号に相当する数字として特定し、
    前記ページ番号抽出処理は、
    上記の(1)から(3)の条件を満たす場合に、
    (IV)前記2個以上の数字を含む数字列において各数字間の間隔が前記第1間隔以下である場合に、当該数字列をページ番号に相当する数字として特定し、
    (V)前記2個以上の数字を含む数字列において数字間の1個以上の間隔のいずれかが前記第4間隔である場合に、当該数字列をページ番号に相当する数字として特定しない、コンピュータプログラム。
JP2008252479A 2008-09-30 2008-09-30 データ生成装置、スキャナ、及びコンピュータプログラム Expired - Fee Related JP4780169B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2008252479A JP4780169B2 (ja) 2008-09-30 2008-09-30 データ生成装置、スキャナ、及びコンピュータプログラム
US12/569,100 US8456688B2 (en) 2008-09-30 2009-09-29 Data generating device, scanner and non-transitory computer readable medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008252479A JP4780169B2 (ja) 2008-09-30 2008-09-30 データ生成装置、スキャナ、及びコンピュータプログラム

Publications (2)

Publication Number Publication Date
JP2010086151A JP2010086151A (ja) 2010-04-15
JP4780169B2 true JP4780169B2 (ja) 2011-09-28

Family

ID=42058852

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008252479A Expired - Fee Related JP4780169B2 (ja) 2008-09-30 2008-09-30 データ生成装置、スキャナ、及びコンピュータプログラム

Country Status (2)

Country Link
US (1) US8456688B2 (ja)
JP (1) JP4780169B2 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120084640A1 (en) * 2010-09-30 2012-04-05 Konica Minolta Systems Laboratory Inc. Resolving page references in layout dependent documents
JP2013025456A (ja) 2011-07-19 2013-02-04 Sony Corp 情報処理装置、情報処理方法、並びにプログラム
JP5753828B2 (ja) 2012-09-27 2015-07-22 京セラドキュメントソリューションズ株式会社 画像処理装置及び画像処理プログラム
JP5938425B2 (ja) 2014-01-28 2016-06-22 富士フイルム株式会社 データ処理装置、方法及びプログラム
JP6394069B2 (ja) * 2014-05-26 2018-09-26 京セラドキュメントソリューションズ株式会社 文書処理装置及び文書処理プログラム
JP5723472B1 (ja) * 2014-08-07 2015-05-27 廣幸 田中 データリンク生成装置、データリンク生成方法、データリンク構造および電子ファイル
WO2016190446A1 (en) * 2015-05-26 2016-12-01 Hiroyuki Tanaka Electronic file structure, non-transitory computer-readable storage medium, electronic file generation apparatus, electronic file generation method, and electronic file
US10445615B2 (en) * 2017-05-24 2019-10-15 Wipro Limited Method and device for extracting images from portable document format (PDF) documents
US10635743B2 (en) * 2018-03-12 2020-04-28 Microsoft Technology Licensing, Llc Automatic extraction of document page numbers from PDF
US11701914B2 (en) * 2020-06-15 2023-07-18 Edward Riley Using indexing targets to index textual and/or graphical visual content manually created in a book

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07262207A (ja) 1994-03-25 1995-10-13 Kengo Konishi イメージデータファイリング方法,イメージデータ登録方法,イメージデータ検索方法及びその装置
JP3608965B2 (ja) * 1998-12-18 2005-01-12 シャープ株式会社 自動オーサリング装置および記録媒体
US6940491B2 (en) * 2000-10-27 2005-09-06 International Business Machines Corporation Method and system for generating hyperlinked physical copies of hyperlinked electronic documents
JP4006953B2 (ja) 2001-03-28 2007-11-14 コニカミノルタビジネステクノロジーズ株式会社 データ送信装置、データ送信方法、データ送信プログラムおよびデータ送信プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2005311766A (ja) * 2004-04-22 2005-11-04 Fuji Xerox Co Ltd 画像読み取り装置
JP4434968B2 (ja) 2005-01-14 2010-03-17 株式会社Pfu 書籍対応型スキャナ
US7797622B2 (en) 2006-11-15 2010-09-14 Xerox Corporation Versatile page number detector
US20090172002A1 (en) * 2007-12-26 2009-07-02 Mohamed Nooman Ahmed System and Method for Generating Hyperlinks

Also Published As

Publication number Publication date
US8456688B2 (en) 2013-06-04
JP2010086151A (ja) 2010-04-15
US20100082937A1 (en) 2010-04-01

Similar Documents

Publication Publication Date Title
JP4780169B2 (ja) データ生成装置、スキャナ、及びコンピュータプログラム
US8107727B2 (en) Document processing apparatus, document processing method, and computer program product
JP3535624B2 (ja) 検索装置及び方法
US20080150910A1 (en) Handwritten charater input device
JP5141560B2 (ja) 情報検索プログラム、該プログラムを記録した記録媒体、情報検索装置、および情報検索方法
US9310971B2 (en) Document viewing device for display document data
JP5661549B2 (ja) 帳票上の文字を認識する文字認識装置、マスク処理方法、および、マスク処理プログラム
US9881001B2 (en) Image processing device, image processing method and non-transitory computer readable recording medium
EP2884425A1 (en) Method and system of extracting structured data from a document
JP2006221569A (ja) 文書処理システム、文書処理方法、プログラムおよび記憶媒体
JP2005182460A (ja) 情報処理装置、注釈処理方法、情報処理プログラムおよび情報処理プログラムを格納した記録媒体
US20150261735A1 (en) Document processing system, document processing apparatus, and document processing method
US9208143B2 (en) Electronic device and dictionary data display method
JP2000322417A (ja) 画像ファイリング装置及び方法及び記憶媒体
JP4136282B2 (ja) 画像処理装置及び画像処理方法並びに記憶媒体
JP2009223556A (ja) 文字認識プログラム、文字認識電子部品、文字認識装置、文字認識方法、およびデータ構造
JP7035474B2 (ja) 文書処理装置およびプログラム
JP3979288B2 (ja) 文書検索装置および文書検索プログラム
JP4487614B2 (ja) 情報表示制御装置、及びプログラム
JP2021140831A (ja) 帳票画像処理システム、帳票画像処理方法、および帳票画像処理プログラム
JP2022019445A (ja) 画像処理装置、方法、プログラム
JP5310206B2 (ja) 文書処理装置、文書処理方法および文書処理プログラム
JP2020123233A (ja) 情報処理装置及びプログラム
US20140223274A1 (en) Information processing device and information processing method
JP2881891B2 (ja) 階層形式をもつ電子化マニユアルの処理装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100325

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100708

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100720

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100921

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110315

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110513

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110607

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110620

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140715

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4780169

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees