JP2000181931A - 自動オーサリング装置および記録媒体 - Google Patents

自動オーサリング装置および記録媒体

Info

Publication number
JP2000181931A
JP2000181931A JP10360332A JP36033298A JP2000181931A JP 2000181931 A JP2000181931 A JP 2000181931A JP 10360332 A JP10360332 A JP 10360332A JP 36033298 A JP36033298 A JP 36033298A JP 2000181931 A JP2000181931 A JP 2000181931A
Authority
JP
Japan
Prior art keywords
page
character
character string
book
distance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP10360332A
Other languages
English (en)
Other versions
JP3608965B2 (ja
Inventor
Hideaki Tanaka
秀明 田中
Kazuyuki Nako
和行 名古
Katsuhiko Sato
克彦 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP36033298A priority Critical patent/JP3608965B2/ja
Publication of JP2000181931A publication Critical patent/JP2000181931A/ja
Application granted granted Critical
Publication of JP3608965B2 publication Critical patent/JP3608965B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 画像ベース電子書籍に対して自動的にリンク
編集を行う。 【解決手段】 書籍構造抽出部24は、クラスタリング
部23によるクラスタリング結果に基づいて代表タイト
ル文字列と先頭ページ番号とを求める。リンク先クラス
タ判定部25は目次ページの「項目文字列」との距離が最
小の代表タイトル文字列と先頭ページ番号とを求める。
目次ページリンク決定部26は、目次ページの「ページ
番号」が「先頭ページ番号」に合致するかを最も誤認識さ
れ易い数字に変換しつつ文字列間距離を用いて判定し、
リンク先ページ番号を決定する。索引ページリンク決定
部27は、索引ページの「ページ番号」のページの文字認
識結果中に「項目文字列」が存在するかを上述と同様にし
て判定し、リンク先ページ番号を決定する。こうして、
クラスタリングや文字列間距離や最も誤認識され易い数
字への変換を行なうことによって誤認識を吸収する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、画像ベース電子
書籍の目次や索引から参照ページへのリンク編集等を自
動的に実行できる自動オーサリング装置に関する。
【0002】
【従来の技術】近年、(株)ソニーの「電子ブック」や、
ボイジャー(Voyager)社の「電子書籍(ExpandBook)」
等で代表されるような電子書籍の提案が活発化してい
る。しかしながら、上記電子書籍はテキストベースの電
子書籍であるために、(1)電子化されていない既存の紙
書籍のコンテンツ化にはOCR(光学式文字読み取り装
置)等を用いてテキストデータに変換しなければなら
ず、コンテンツ化には長時間を要する。(2)漫画や写真
雑誌等のテキスト以外のデータが大部分を占める書籍は
コンテンツし難く、コンテンツの種類が一般的な読み物
系よりも辞書系(参照系)へ偏り勝ちである。
【0003】したがって、既存のテキストベース電子書
籍のタイトル数は、数百オーダーと少なく、且つ、内容
が辞書系に偏っており、その普及率は紙書籍の数%にも
達していないのが現状である。
【0004】ところが、最近では、上述のようなテキス
トベース電子書籍の欠点を無くすものとして画像ベース
の電子書籍が出現している。この例としては、(株)小学
館の「漫画ROM(リード・オンリ・メモリ)」等が上げら
れる。
【0005】上記画像ベース電子書籍は、 基本的に
は既存の紙書籍をスキャニングするだけの単純作業でコ
ンテンツ作業が行え、短期間に大量のコンテンツ供給が
可能となる。 テキストベースの書籍では不可能であ
った漫画や写真雑誌等のコンテンツ供給が可能となる。
外字や異体字や古文書等のように、文字コード体系
に合っていない文字が存在しても容易に取り込める。
言語(文字コード)に依存しないため海外普及が容易で
ある。等の利点を有し、次世代の電子書籍の形態として
非常に有望なものと考えられている。
【0006】また、上述のような電子化コンテンツを利
用する技術として、ハイパーテキストに代表されるリン
ク機能(情報と情報とを結合して関連情報間で経路を作
成する機能)がある。このリンク機能の概念を図24に
示す。図24においては、文字列や図形や画像等でなる
オブジェクトから他のオブジェクトへのリンクは破線矢
印で示している。また、上記オブジェクトからページへ
のリンクは実線矢印で示されている(但し、コンテンツ
にはページの概念はない)。尚、上記ページは各番号で
示されている。
【0007】図24においては、ページ1における第1
行目に存在するオブジェクト(文字列)からは、ページ2
にリンクされている。また、ページ1における第4行目
に存在するオブジェクトからは、ページ5における第5
行目に存在するオブジェクトにリンクされている。ま
た、ページ1における最終行に存在するオブジェクトか
らは、ページ4にリンクされている。そして、上記リン
ク機能とは、ビューア等において、ページ1におけるリ
ンクが張られているオブジェクトをマウス等によって指
定することによって、リンク先のページやオブジェクト
へジャンプする機能である。
【0008】このようなリンク機能は、既存の紙メディ
アでは不可能な機能であり、電子化コンテンツの大きな
魅力である。その反面、リンク情報を付加する編集(リ
ンク編集)を含む電子書籍の編集(以下、オーサリングと
言う)の際に、上記リンク編集作業を行う必要がある。
したがって、このようなリンク編集を効率的に行えるこ
とが、オーサリング装置には重要な要素となる。
【0009】従来より、上記リンク編集を自動的に行う
ものとして、特開平6−223065号公報「電子ドキ
ュメントにおける自動リンク情報作成方法」がある。こ
の自動リンク情報作成方法においては、テキストベース
の電子ドキュメントからリンク対象となるキーワードを
抽出し、文書構成を判定して、これらを基に目次と本文
とのリンク付けを自動的に行うものである。
【0010】以上のことにより、種々の利点を有して次
世代の電子書籍の形態として非常に有望な上記画像ベー
ス電子書籍に、特開平6−223065号公報に開示さ
れた自動リンク情報作成方法を適用することによって、
漫画や写真雑誌等のテキスト以外の電子コンテンツのハ
イパーテキスト化が可能になるのである。
【0011】
【発明が解決しようとする課題】しかしながら、上記従
来の特開平6−223065号公報に開示された自動リ
ンク情報作成方法は、テキスト(文字コードデータ)を対
象としているために、画像ベース電子書籍に適用する場
合には以下のような問題がある。
【0012】上述のように、上記従来の自動リンク情報
作成方法はテキストを対象としている。そこで、画像ベ
ース電子書籍に適用する場合には、OCRを利用して画
像をテキストに変換する手法が考えられる。ところが、
現状のOCRでは、100%の正解結果を得ることは困
難であり、認識結果には誤認識文字(OCRが読み取り
間違えた文字)が含まれる。現状の高性能日本語OCR
でも認識正解率は98%程度であり、認識結果に誤認識
文字が2%程度は含まれる。したがって、OCRを利用
して画像をテキストに変換した画像ベース電子書籍に上
記従来の自動リンク情報作成方法を適用する場合には、
上記誤認識によって、総ての文字が正しい「完全テキス
ト」を前提とした上記従来の自動リンク情報作成方法で
は誤動作が発生するという問題がある。以下、この誤動
作に付いて詳細に説明する。
【0013】上記特開平6−223065号公報によれ
ば、上記従来の自動リンク情報作成方法では、文字列
「CONTENTS」の有無によって目次ページを判定し、例え
ばキー文字列「SYSTEM OUTLINE」によって目次ページと
本文ページとのリンク付けを行っている。したがって、
上記OCRによってテキストに変換する際に、上記文字
列「CONTENTS」の文字「O(オー)」が「0(ゼロ)」と誤認識
された場合には、目次ページを判定できないことにな
る。同様に、目次ページに在るキー文字列「SYSTEMOUTL
INE」と本文ページに在るキー文字列「SYSTEM OUTLIN
E」との何れか一方でも誤認識されれば、リンク付けが
できないことになる。ページ数「1」を英小文字エル「l」
と誤認識した場合も同様である。
【0014】尚、上述のような誤動作を解決する方法と
して、上記OCRの認識結果をオペレータが修正して上
記完全テキストを得る方法も考えられる。ところが、そ
の場合には、本来は不用である上記完全テキストを作成
する処理が必要となる。したがって、上記解決方法は、
上記オーサリング作業の軽減化のために行う自動リンク
編集を行うことを考えると、本末転倒な解決方法である
といえる。
【0015】そこで、この発明の目的は、画像ベース電
子書籍に対して自動的にリンク編集を行うことができる
自動オーサリング装置を提供することにある。
【0016】
【課題を解決するための手段】上記目的を達成するた
め、請求項1に係る発明は、画像ベース電子書籍を自動
的にオーサリングする自動オーサリング装置であって、
書籍の各ページの画像を入力する画像入力手段と、文字
認識時の誤認識傾向を距離値に変換して予め作成した距
離テーブルと、上記距離テーブルを用いた動的計画法マ
ッチングによって,文字認識時の誤認識傾向を考慮した
2文字列間の距離を計算する距離計算手段と、上記画像
入力手段から取り込まれた画像データに対して領域分割
を行って,文字領域,写真領域,図形領域を含む領域を抽
出する領域分割手段と、上記領域分割手段によって抽出
された文字領域の画像データに基づいて,文字認識を行
う文字認識手段と、文字列の集合に対して,上記距離計
算手段による2文字列間の距離の算出結果を用いてクラ
スタリングを行って複数のクラスタに分割すると共に,
各クラスタを代表する代表文字列を抽出するクラスタリ
ング手段と、上記書籍全ページのヘッダまたはフッター
の何れか一方の文字列の集合に対する上記クラスタリン
グ手段によるクラスタリング結果を用いて,各クラスタ
に属する文字列に係るページの境界を当該書籍の区切り
とすると共に,各クラスタの代表文字列を上記区切り間
の代表タイトル文字列として書籍構造を抽出する書籍構
造抽出手段を備えて、上記画像入力手段から取り込まれ
た書籍の画像データに基づいて、当該書籍の章または節
等の書籍構造を自動的に抽出することを特徴としてい
る。
【0017】上記構成によれば、書籍構造抽出手段によ
って、「書籍の「章」や「節」の代表タイトル文字列は該当
する「章」や「節」における「ヘッダ」あるいは「フッター」に
記載されていることが多い」ことを利用して、書籍全ペ
ージのヘッダあるいはフッターの何れか一方の文字列の
集合に対してクラスタリング手段によるクラスタリング
が行われて、当該書籍の章や節等の区切りと上記区切り
間の代表タイトル文字列とでなる書籍構造が自動的に抽
出される。その際に、上記文字列の分類にクラスタリン
グを用いることによって、上記ヘッダあるいはフッター
の文字認識結果における誤認識が吸収される。
【0018】また、請求項2にかかる発明は、画像ベー
ス電子書籍を自動的にオーサリングする自動オーサリン
グ装置であって、書籍の各ページの画像を入力する画像
入力手段と、文字認識時の誤認識傾向を距離値に変換し
て予め作成した距離テーブルと、上記距離テーブルを用
いた動的計画法マッチングによって,文字認識時の誤認
識傾向を考慮した2文字列間の距離を計算する距離計算
手段と、上記画像入力手段から取り込まれた画像データ
に対して領域分割を行って,文字領域・写真領域・図形領
域を含む領域を抽出する領域分割手段と、上記領域分割
手段によって抽出された文字領域の画像データに基づい
て,文字認識を行う文字認識手段と、文字列の集合に対
して,上記距離計算手段による2文字列間の距離の算出
結果を用いてクラスタリングを行って複数のクラスタに
分割すると共に,各クラスタを代表する代表文字列を抽
出するクラスタリング手段と、上記書籍全ページのヘッ
ダあるいはフッターの何れか一方の文字列の集合に対す
る上記クラスタリング手段によるクラスタリング結果を
用いて,各クラスタに属する文字列に係るページの境界
を当該書籍の区切りとすると共に,各クラスタの代表文
字列を上記区切り間の代表タイトル文字列として書籍構
造を抽出する書籍構造抽出手段と、上記各ページ毎の文
字認識結果に基づいて,上記距離計算手段による文字列
間距離およびキーワードを用いて,予め設定されたルー
ルに従って,目次ページまたは索引ページの判定を行う
リンク元ページ判定手段と、上記目次ページまたは索引
ページの文字認識結果に基づいて,予め設定されたルー
ルに従って,リンク元オブジェクトを項目文字列部とこ
の項目文字列が記載されているページのページ番号文字
列部とに分けて抽出するリンク元オブジェクト抽出手段
と、上記目次ページにおける上記各リンク元オブジェク
トの項目文字列と上記書籍の区切り間の代表タイトル文
字列とに関する上記距離算出手段による距離算出結果に
基づいて,上記リンク元オブジェクトに対応する上記書
籍の区切りを判定するリンク先クラスタ判定手段と、上
記各リンク元オブジェクトのページ番号文字列およびこ
のページ番号文字列が上記距離テーブルを参照して置換
された誤認識し易い数字と,当該リンク元オブジェクト
に対応する上記書籍の区切りの開始ページ番号との比較
結果に基づいて,目次ページに対するリンク付けを行う
目次ページリンク決定手段を備えて、上記画像入力手段
から取り込まれた書籍の画像データに基づいて、各目次
の項目から参照ページへのリンク付けを自動的に行うこ
とを特徴としている。
【0019】上記構成によれば、リンク先クラスタ判定
手段によってリンク元オブジェクトに対応する上記書籍
の区切りが判定される。その際に、上記リンク元オブジ
ェクトの項目文字列と上記書籍の区切り間の代表タイト
ル文字列との距離を用いることによって、上記項目文字
列の誤認識が吸収される。さらに、目次ページリンク決
定手段によって、上記各リンク元オブジェクトのページ
番号文字列と上記対応する書籍の区切りの開始ページ番
号との比較結果に基づいて上記目次ページに対するリン
ク付けが自動的に行われる。その際に、上記ページ番号
文字列と開始ページ番号とが一致しない場合には上記ペ
ージ番号文字列を誤認識し易い数字に置換して上記比較
を繰り返すことによって、上記ページ番号文字列の誤認
識が吸収される。
【0020】また、請求項3にかかる発明は、画像ベー
ス電子書籍を自動的にオーサリングする自動オーサリン
グ装置であって、書籍の各ページの画像を入力する画像
入力手段と、文字認識時の誤認識傾向を距離値に変換し
て予め作成した距離テーブルと、上記距離テーブルを用
いた動的計画法マッチングによって,文字認識時の誤認
識傾向を考慮した2文字列間の距離を計算する距離計算
手段と、上記画像入力手段から取り込まれた画像データ
に対して領域分割を行って,文字領域,写真領域,図形領
域を含む領域を抽出する領域分割手段と、上記領域分割
手段によって抽出された文字領域の画像データに基づい
て,文字認識を行う文字認識手段と、上記各ページ毎の
文字認識結果に基づいて,上記距離計算手段による文字
列間距離およびキーワードを用いて,予め設定されたル
ールに従って,目次ページまたは索引ページの判定を行
うリンク元ページ判定手段と、上記目次ページまたは索
引ページの文字認識結果に基づいて,予め設定されたル
ールに従って,リンク元オブジェクトを項目文字列部と
この項目文字列が記載されているページのページ番号文
字列部とに分けて抽出するリンク元オブジェクト抽出手
段と、上記索引ページにおける上記各リンク元オブジェ
クトの項目文字列を検索元文字列とし,上記項目文字列
に対応するページ番号文字列およびこのページ番号文字
列が上記距離テーブルを参照して置換された誤認識し易
い数字をリンク先の注目ページ番号とし,上記注目ペー
ジ番号のページの文字認識結果から上記検索元文字列と
同じ文字数の文字列を順次切り出して検索先文字列と
し,上記検索元文字列と検索先文字列との距離を上記距
離計算手段によって算出し,この算出結果に基づいて索
引ページに対するリンク付けを行う索引ページリンク決
定手段を備えて、上記画像入力手段から取り込まれた書
籍の画像データに基づいて、索引の各項目から参照ペー
ジへのリンク付けを自動的に行うことを特徴としてい
る。
【0021】上記構成によれば、索引ページリンク決定
手段によって、上記各リンク元オブジェクトの項目文字
列をこの項目文字列に対応するページ番号のページの文
字認識結果中から検索し、この検索結果に基づいて索引
ページに対するリンク付けが自動的に行われる。その際
に、上記文字認識結果から切り出した文字列と項目文字
列との距離を用いることによって、上記項目文字列の誤
認識が吸収される。さらに、上記項目文字列が検索され
ない場合には上記ページ番号文字列を誤認識し易い数字
に置換して上記検索を繰り返すことによって、上記ペー
ジ番号文字列の誤認識が吸収される。
【0022】また、請求項4に係る発明は、請求項2に
係る発明の自動オーサリング装置において、上記リンク
元オブジェクト抽出手段によって抽出された上記索引ペ
ージにおける上記各リンク元オブジェクトの項目文字列
を検索元文字列とし,上記項目文字列に対応するページ
番号文字列およびこのページ番号文字列が上記距離テー
ブルを参照して置換された誤認識し易い数字をリンク先
の注目ページ番号とし,上記注目ページ番号のページの
文字認識結果から上記検索元文字列と同じ文字数の文字
列を順次切り出して検索先文字列とし,上記検索元文字
列と検索先文字列との距離を上記距離計算手段によって
算出し,この算出結果に基づいて索引ページに対するリ
ンク付けを行う索引ページリンク決定手段を備えて、上
記画像入力手段から取り込まれた書籍の画像データに基
づいて、目次あるいは索引の各項目から参照ページへの
リンク付けを自動的に行うことを特徴としている。
【0023】上記構成によれば、請求項2に係る発明の
場合と同様に、リンク先クラスタ判定手段によって上記
リンク元オブジェクトに対応する上記書籍の区切りが判
定される際に、上記項目文字列と上記代表タイトル文字
列との距離を用いることによって、上記項目文字列の誤
認識が吸収される。また、目次ページリンク決定手段に
よって目次ページに対するリンク付けが自動的に行われ
る際に、上記ページ番号文字列を誤認識し易い数字に置
換することによって、上記ページ番号文字列の誤認識が
吸収される。
【0024】さらに、索引ページリンク決定手段によっ
て索引ページに対するリンク付けが自動的に行われる際
に、上記文字認識結果から切り出された文字列と上記項
目文字列との距離を用いることによって、上記項目文字
列の誤認識が吸収される。また、上記ページ番号文字列
を誤認識し易い数字に置換することによって、上記ペー
ジ番号文字列の誤認識が吸収される。
【0025】また、請求項5に係る発明は、請求項2乃
至請求項4の何れか一つに係る発明の自動オーサリング
装置において、上記リンク元オブジェクト抽出手段は、
上記リンク元ページ判定手段によって目次ページまたは
索引ページであると判定されたページの文字認識結果に
基づいて,各リンク元オブジェクト毎に,上記リンク元オ
ブジェクトを構成する項目文字列の配列方向に直交する
方向への文字長さのヒストグラムを作成するヒストグラ
ム作成手段と、上記ヒストグラムに対して判別分析によ
って二値化閾値を計算する二値化閾値算出手段と、上記
二値化閾値以下の長さを有する文字の連なりを上記リン
ク元オブジェクトにおける項目文字列とページ番号文字
列とを分離するセパレータの候補として抽出し,この抽
出されたセパレータ候補中から上記方向への文字長さの
分散が最小となる連続区間を上記セパレータとして抽出
するセパレータ抽出手段と、上記リンク元オブジェクト
における上記抽出されたセパレータの一側を上記項目文
字列とする一方,他側を上記ページ番号文字列として分
離して抽出するオブジェクト抽出手段を有していること
を特徴としている。
【0026】上記構成によれば、上記リンク元オブジェ
クト抽出手段によって、「目次や索引では「項目文字列」
と「その項目が記載されているページ番号」とが「…」,
「−」あるいは「空白」等のセパレータを介して同じ列や行
を構成している」ことを利用して、目次ページまたは索
引ページにおける上記項目文字列の配列方向に直交する
方向への文字長さのヒストグラムと二値化閾値とに基づ
いて上記セパレータが抽出される。そして、このセパレ
ータに基づいて、上記項目文字列とページ番号文字列と
が自動的に分離されて抽出される。
【0027】また、請求項6に係る発明の記録媒体は、
請求項4における上記画像入力手段,距離計算手段,領域
分割手段,文字認識手段,クラスタリング手段,書籍構造
抽出手段,リンク元ページ判定手段,リンク元オブジェク
ト抽出手段,リンク先クラスタ判定手段,目次ページリン
ク決定手段及び索引ページリンク決定手段として、コン
ピュータを機能させて、書籍の画像データに基づいて目
次あるいは索引の各項目から参照ページへのリンク付け
を自動的に行う自動オーサリングプログラムが記録され
ていることを特徴としている。
【0028】上記構成によれば、請求項4に係る発明の
場合と同様に、上記ヘッダやフッターの文字列,リンク
元オブジェクトの項目文字列およびページ番号文字列の
誤認識を吸収した目次ページあるいは索引ページに対す
るリンク付けが自動的に行われる。
【0029】
【発明の実施の形態】以下、この発明を図示の実施の形
態により詳細に説明する。図1は、本実施の形態の自動
オーサリング装置におけるブロック図である。主制御部
1は、本自動オーサリング装置の動作を制御し、後に詳
述するような自動オーサリング処理動作を実行する。
【0030】入力制御部2は、キーボード3やマウス4
から操作者によって入力された入力信号をデータバス5
のデータ形式に変換し、データバス5を介して主制御部
1に送出する。画像入力部6は、スキャナ7で読み取ら
れた画像データをデータバス5のデータ形式に変換し、
データバス5を介してメモリ8のページ画像部28に送
出する。また、外部記憶装置制御部9は、外部記憶装置
10の書籍画像ファイル11に格納されている書籍の画
像データをデータバス5のデータ形式に変換して、デー
タバス5を介してメモリ8のページ画像部28に送出す
る。尚、書籍コンテンツファイル12には、自動リンク
付けされた際のリンク情報が格納されている。CRT
(陰極線管)制御部13は、ビデオRAM(ランダム・アク
セス・メモリ)15に格納されている表示データをデータ
バス5を介して読み出し、CRTのデータ形式に変換し
てCRT14に表示させる。
【0031】距離テーブル16は、文字認識の誤認識傾
向を距離値に変換して予め作成された参照専用のテーブ
ルであり、参照データはデータバス5を介して距離計算
部17等へ送出される。尚、距離テーブル16について
は、後に詳細に説明する。距離計算部17は、2つの文
字列間の距離(類似度)を、距離テーブル16からの参照
データを用いて動的計画法(DP)マッチングによって演
算し、演算結果を内部メモリ等に格納する。尚、距離計
算部17についても、後に詳細に説明する。
【0032】領域分割部18は、上記メモリ8のページ
画像部28に格納された画像データを参照して、文字領
域(縦書き,横書き,ヘッダ,フッター領域)、写真画像領
域、図形画像領域、及び、線分領域を抽出し、メモリ8
の領域分割結果部29に格納する。尚、上記領域分割
は、例えば特開平4−105486号公報や特開平4−
114560号公報等に開示された周知の方法によって
行う。
【0033】図2は、上記メモリ8のページ画像部28
に格納された目次ページの画像に対して、上記領域分割
部18によって領域分割を行った結果の概念を示す。領
域41a,41bは、ヘッダ横書き文字領域として抽出さ
れている。また、領域42,43は、横書き文字領域と
して抽出されている。また、領域44,45は、縦書き
文字領域として抽出されている。また、領域46は、フ
ッター横書き文字領域として抽出されている。尚、実際
には、領域41a,41bの上側に存在する横線部や領域
45の下部に存在する電話機マーク等も、夫々線分領域
や図形領域として抽出されるのであるが、本実施の形態
は文字領域のみをリンク付けの対象とするのでこれらの
抽出結果は省略している。
【0034】図3は、上記メモリ8のページ画像部28
に格納された索引ページの画像に対して、領域分割部1
8によって領域分割を行った結果の概念を示す。領域5
1はヘッダ横書き文字領域として、領域52,53は横
書き文字領域として、領域54はフッター横書き文字領
域として抽出されている。
【0035】文字認識部19は、上記メモリ8の領域分
割結果部29に格納された文字領域情報を用いてページ
画像部28に格納された画像データに対して、認識辞書
20を参照して文字認識を行う。そして、得られた認識
結果をメモリ8の認識結果部30に格納する。尚、上記
文字認識は、例えば「確立モデルによる音声認識」(中川
聖一著、電子情報通信学会、コロナ社、初版昭和63
年)に記載されているような「部分空間法」や「複合類似
度」等によって行う。その際には、認識辞書20には主
成分分析によって求められた固有べクトル等が格納され
る。
【0036】リンク元ページ判定部21は、上記メモリ
8の認識結果部30に格納された認識結果と、距離計算
部17によって演算された文字列間距離とに基づいて、
予め設定されたキーワードおよびルールに従って、注目
ページが目次や索引等のリンク元ページであるか否かを
判断する。そして、判断結果を主制御部1に返す。リン
ク元オブジェクト抽出部22は、上記メモリ8の書籍構
造結果部31に格納された書籍構造を参照して得られる
リンク元ページを注目ページとし、メモリ8の認識結果
部30に格納された注目ページに対応する認識結果を参
照して、注目ページの各行の認識結果をオブジェクト文
字列部とページ番号文字列部とに分けてリンク元オブジ
ェクトとして抽出する。そして、抽出結果をメモリ8の
オブジェクト部32に格納する。尚、ヒストグラムバッ
ファ部34には、リンク元オブジェクト抽出中に作成さ
れた文字高さ(幅)のヒストグラムが格納される。
【0037】クラスタリング部23は、上記メモリ8の
クラスタリングメモリ部33に格納されている文字列集
合に対して、距離計算部17に指令して、例えば上記
「確立モデルによる音声認識」(中川聖一著、電子情報通
信学会、コロナ社、初版昭和63年)に記載されている
ような「KBGアルゴリズム(基本的にはk−平均法と同
じ)」等によってクラスタリングを行わせる。そして、各
文字列に対するクラスタリング結果と各クラスタの代表
文字列とをクラスタリングメモリ部33に格納する。
【0038】書籍構造抽出部24は、上記メモリ8の領
域分割結果部29および認識結果部30の内容を参照し
ながら、書籍全体における各ページのヘッダまたはフッ
ターを抽出してクラスタリングを行う。そして、クラス
タリングメモリ部33に格納された上記クラスタリング
の結果に基づいて章や節等の書籍構造を抽出し、抽出結
果を書籍構造結果部31に格納する。
【0039】リンク先クラスタ判定部25は、上記距離
計算部17に指令して、メモリ8のオブジェクト部32
に格納されている各リンク元オブジェクトのオブジェク
ト文字列と、書籍構造結果部31に格納された各書籍構
造の情報(章や節等)を代表する代表タイトル文字列との
距離を算出させる。そして、リンク元のオブジェクト文
字に対応するリンク先構造情報の先頭アドレスを求めて
主制御部1に返す。
【0040】目次ページリンク決定部26は、上記メモ
リ8のオブジェクト部32に格納されている当該リンク
元オブジェクトのページ番号文字列の数字と、リンク先
クラスタ判定部25によって求められた当該リンク元の
オブジェクトに対応するリンク先の章や節の開始ページ
番号との比較を、上記ページ番号文字列の数字を上記距
離テーブル16に格納された数字の距離値を参照して誤
認識し易い数字に置換しながら一致するまで行い、その
比較結果に基づいて目次ページのリンク付けを自動的に
行う。そして、リンク付け結果のリンク先ページ番号を
メモリ8のオブジェクト部32に格納する。
【0041】図4は、こうして目次ページのリンク元オ
ブジェクト(図2に示す目次ページにおける文字列56
「文字を入力する」)に自動的にリンク付けされた、リン
ク先ページの画像例である。
【0042】索引ページリンク決定部27は、上記メモ
リ8のオブジェクト部32に格納されている当該リンク
元オブジェクトのオブジェクト文字列を、検索元文字列
とする。また、オブジェクト部32に格納されている当
該リンク元オブジェクトのページ番号文字列を注目ペー
ジ番号とする。また、メモリ8の認識結果部30に格納
されている上記注目ページ番号のページに関する認識結
果から、順次上記検索元文字列と同じ文字数の文字列を
切り出して検索先文字列とする。そして、上記ページ番
号を上述のようにして誤認識し易い数字に置換しながら
距離計算部17に指令して上記検索元文字列と検索先文
字列との間の距離を算出させ、この距離が閾値以内であ
れば上記注目ページに検索先文字列が存在すると判定し
て、索引ページとのリンク付けを自動的に行う。そし
て、上記注目ページ番号をリンク先ページ番号としてメ
モリ8のオブジェクト部32に格納する。
【0043】図5は、こうして索引ページのリンク元オ
ブジェクト(図3に示す索引ページにおける文字列57
「カタカナ」)に自動的にリンク付けされた、リンク先ペ
ージの画像例である。
【0044】図6は、上記距離テーブル16の概念図で
ある。この距離テーブル16は、上述したように、文字
認識の誤認識傾向を基に予め作成しておく参照専用テー
ブルであり、その縦横のサイズが認識対象文字数(本実
施の形態における認識対象文字数は4000であるとす
る)の二次元テーブルである。各行および各列は認識対
象の各文字に対応しており、行及び列で決まる2文字間
の距離値が要素値として格納されている。この距離値の
データサイズは1バイトであり、距離値は0〜255ま
での整数値を取る。図6(b)に、図6(a)における数字
「0」行の数字「0」列から文字「R」列までの距離値の具体
例を示す。図6(b)に関してのみ言えば、数字「0」に最
も距離が近い文字は「O(距離=1)」であり、最も距離が
遠い文字は「1(距離=255)」である。その他の文字の
列についても夫々距離値が設定してあり、距離値が小さ
い文字ほど数字「0」に形状が類似しており、誤認識し易
いことを示す。尚、この距離テーブル16は、予め、大
量の認識評価実験の結果に基づいて作成しておく。
【0045】図7は、上記距離計算部17の詳細なブロ
ック図である。距離計算制御部61は、データバス5を
介して送出されてくる第1文字列データを第1文字列バ
ッファ62に格納する。同様に、第2文字列データを第
2文字列バッファ63に格納する。そして、データバス
5を介して主制御部1,クラスタリング部23,リンク先
クラスタ判定部25あるいは索引ページリンク決定部2
7から送出されてくる距離計算命令に従って、DPマッ
チング部65に対して距離計算命令を送る。
【0046】そうすると、上記DPマッチング部65
は、上記第1文字列バッファ62および第2文字列バッ
ファ63と、距離テーブル16(図1参照)とを参照し、
下記の式(1)によって距離計算を行う。そして、得られ
た計算結果は距離バッファ64に格納される。
【数1】
【0047】尚、上記DPマッチングとは、要素数が異
なる2つのデータ間(本実施の形態の場合は2つの文字
列間)の最適経路による距離を求める演算方式で、古く
から音声認識やオンライン手書き文字認識に採用されて
おり、例えば上記「確立モデルによる音声認識」(中川
聖一著、電子情報通信学会、コロナ社、初版昭和63
年)に記載されている。こうして、距離バッファ64に
格納された計算結果は、データバス5および距離計算制
御部61を介して、データバス5に接続された他のブロ
ックから参照することができるのである。
【0048】図8は、上記メモリ8のページ画像部28
の詳細な構成概念図である。このページ画像部28は、
ヘッダ部66と画像データ部67とで構成される。ヘッ
ダ部66には、横画素数部68,縦画素数部69,データ
長部(1画素当たり)70およびモノクロ/カラー部71
が設けられている。そして、画像入力部6から又は外部
記憶装置制御部9から画像データを書き込む場合には、
1ページ当たりの画像のサイズやデータ長等の画像情報
がヘッダ部66に格納される一方、画像データが画像デ
ータ部67に格納される。こうして、ページ画像部28
に格納された画像情報および画像データは、データバス
5に接続された他のブロックから参照することができる
のである。
【0049】図9は、上記メモリ8の領域分割結果部2
9の詳細な構成概念図である。この領域分割結果部29
は、書籍1冊毎に複数の領域結果部74に分割されてお
り、各領域結果部74には、先頭から順に一領域の分割
結果が格納される。また、上記一つの領域結果部74
は、その領域がどのような種類の領域であるかを示す領
域フラグ部75と、ページ番号が格納されるページ番号
部76と、当該ページ内での領域番号が格納される領域
番号部77と、当該領域の矩形領域に間する開始X座標
が格納される開始X座標部78と、上記矩形領域の開始
Y座標が格納される開始Y座標部79と、上記矩形領域
の終了X座標が格納される終了X座標部80と、上記矩
形領域の終了Y座標が格納される終了Y座標部81で構
成されている。尚、領域フラグ部75〜終了Y座標部8
1には、何れもバイナリデータが格納される。
【0050】上記領域フラグ部75に格納されるバイナ
リデータの各ビットは夫々以下のような意味を有してい
る。すなわち、下位ビットから順に、文字領域ビット
(1:文字領域)、写真領域ビット(1:写真領域)、図形
領域ビット(1:図形領域)、線分領域ビット(1:線分
領域)、縦/横ビット(1:横、0:縦)、ヘッダ−フッタ
ービット(1:ヘッダ、0:フッター)の順で構成されて
いる。ここで、上記縦/横ビットは、当該領域が文字領
域あるいは線分領域である場合にセットされ、文字領域
である場合には縦書きか横書きかを示し、線分領域であ
る場合には縦線か横線かを示す。
【0051】こうして、上記領域分割結果部29に格納
された領域分割結果は、データバス5に接続された他の
ブロックから参照することができるのである。
【0052】図10は、上記メモリ8の認識結果部30
の詳細な構成概念図である。この認識結果部30は、領
域分割部18によって分割された1領域毎に、ヘッダ部
85と認識結果部86で構成されている。ヘッダ部85
は固定長であり、図10(a)に示すように、領域分割結
果部29へのポインタ87と文字数部88とに分けられ
る。ここで、ポインタ87には、当該認識結果に係る認
識領域を示す領域分割結果部29へのポインタであり、
図9における複数の領域結果部74のうち該当する領域
結果部74の先頭アドレスが上記ポインタとして格納さ
れる。このポインタによって、認識対象領域に関する図
9に示す各種情報と認識結果とが対応付けられるのであ
る。尚、文字数部88には、認識結果の文字数が格納さ
れる。
【0053】また、上記認識結果部86には該当する領
域の認識結果が格納され、そのサイズは可変長である。
ここで、この認識結果のサイズは、ヘッダ部85の文字
数部88を参照することによって分かる。認識結果部8
6は、図10(b)に示すように、ヘッダ部85の文字数
部88に格納された文字数(図10(b)では「N」)分の文
字認識結果が格納される結果部89を有する。1文字分
の結果部89は、コード部91と、類似度部92と、開
始X座標部93と、開始Y座標部94と、終了X座標部
95と、終了Y座標部96で構成されている。そして、
コード部91には、該当文字の認識結果コードが格納さ
れる。また、類似度部92には、上述した部分空間法や
複合類似度法によって計算された類似度が格納される。
また、開始X座標部93〜終了Y座標部96には、切り
出し座標が格納される。尚、コード部91には、認識処
理での行切り出し結果や空白抽出結果に基づいて、行末
を示す改行コードや空白を示すスペースコードも格納さ
れる。そして、コード部91に上記改行コードやスペー
スコードが格納された場合には、類似度部92〜終了Y
座標部96のデータは「0」クリアされる。
【0054】図11は、上記メモリ8の書籍構造結果部
31の詳細な構成概念図である。この書籍構造結果部3
1は、書籍1冊分が複数の構造情報部100に分割され
ており、各構造情報部100には先頭から順に構造情報
が格納される。ここで、各構造情報部100のサイズは
固定長である。また、一つの構造情報部100は、代表
タイトル文字列部101と、文字数部102と、開始ペ
ージ番号部103と、終了ページ番号部104で構成さ
れている。そして、代表タイトル文字列部101には、
各ページのヘッダ文字列またはフッター文字列をクラス
タリングすることによって求められた各クラスタの代表
タイトルの文字列が格納される。また、文字数部102
には、上記代表タイトル文字列の文字数が格納される。
また、開始ページ番号部103には、上記何れかのクラ
スタで表される該当構造の開始ページ番号が格納され
る。また、終了ページ番号部104には、該当構造の終
了ページ番号が格納される。
【0055】図12は、上記メモリ8のオブジェクト部
32の詳細な構成概念図である。このオブジェクト部3
2は、書籍1冊分が複数のオブジェクト格納部105に
分割されており、各オブジェクト格納部105には、先
頭から順にオブジェクト情報が格納される。ここで、各
オブジェクト格納部105のサイズは固定長である。ま
た、一つのオブジェクト格納部105は、オブジェクト
文字列部106と、ページ番号文字列部107と、オブ
ジェクト文字列文字数部108と、ページ番号文字列文
字数部109と、リンク元ページ番号部110と、開始
X座標部111と、開始Y座標部112と、終了X座標
部113と、終了Y座標部114と、目次・索引フラグ
部115と、リンク先ページ番号部116で構成されて
いる。そして、オブジェクト文字列部106およびペー
ジ番号文字列部107には、リンク元オブジェクト抽出
部22で抽出されたオブジェクト文字列とページ番号文
字列とが格納される。また、オブジェクト文字列文字数
部108およびページ番号文字列文字数部109には、
上記オブジェクト文字列およびページ番号文字列の文字
数が格納される。また、リンク元ページ番号部110に
は、該当オブジェクトが存在したページ番号(リンク元
ページ番号)が格納される。また、開始X座標部111
〜終了Y座標部114には、該当オブジェクト文字列の
外接矩形座標が格納される。また、目次・索引フラグ部
115には、該当オブジェクトが存在するページは目次
ページであるか索引ページであるかが格納される。具体
的には、目次ページである場合には「0(0x00)」が格
納され、索引ページである場合には「1(0x01)」が格
納される。また、リンク先ページ番号部116には、リ
ンク元オブジェクト抽出部22によって各オブジェクト
が抽出された段階では、初期値(0xff)が格納されて
いる。そして、目次ページリンク決定部26や索引ペー
ジリンク決定部27によってリンク先ページ番号が決定
された時点で、この決定されたリンク先ページ番号が格
納される。
【0056】図13は、上記メモリ8のクラスタリング
メモリ部33の詳細な構成概念図である。このクラスタ
リングメモリ部33は、書籍1冊分が複数のデータ部1
21に分割されており、各データ部121には先頭から
順にデータ(ヘッダ情報またはフッダー情報)が格納され
る。一つのデータ部121は、文字列部122と、文字
列文字数部123と、ページ番号部124と、クラスタ
番号部125と、クラスタ代表フラグ部126で構成さ
れている。ここで、文字列部122〜ページ番号部12
4の値は書籍構造抽出部24によって設定され、クラス
タ番号部125およびクラスタ代表フラグ部126には
クラスタリング部23でクラスタリングされた結果が格
納される。
【0057】上記構成の自動オーサリング装置は、以下
のように動作する。図14は、上記主制御部1の制御の
下に行われる自動オーサリング処理動作のフローチャー
トである。
【0058】ステップS1で、書籍1冊分の画像データ
が入力されてメモリ8のページ画像部28に格納され
る。ここで、上記書籍が紙書籍である場合には、画像入
力部6が制御されて、スキャナ7で読み取られた紙書籍
の画像データがデータバス5を介してメモリ8のページ
画像部28に送出されて格納される。また、上記書籍の
画像データが外部記憶装置10に蓄積されている場合に
は、外部記憶装置制御部9が制御されて、外部記憶装置
10の書籍画像ファイル11から読み出された所望の画
像データがデータバス5を介してメモリ8のページ画像
部28に送出されて格納される。
【0059】ステップS2で、上記領域分割部18が制
御されて、上記ステップS1においてページ画像部28
に格納された画像データに対して領域分割処理が行われ
る。そして、図2や図3のように得られた領域分割結果
の情報が、図9に示すようなフォーマットでメモリ8の
領域分割結果部29に格納される。
【0060】ステップS3で、上記文字認識部19が制
御されて、上記ステップS2において領域分割されて領
域分割結果部29に格納された領域分割結果を用いて文
字認識処理が行われる。その場合の文字認識処理は、次
のように行われる。すなわち、図9に示す領域分割結果
部29の第1領域結果部74から順に領域フラグ部75
を参照して文字領域の領域結果部74を探す。そして、
文字領域の領域結果部74における開始X座標部78〜
終了Y座標部81から領域座標を求め、この領域座標に
該当する画像データをページ画像部28から読み出し、
この文字領域の画像データに対して文字認識処理を行う
のである。こうして得られた認識結果は、メモリ8の認
識結果部30に格納される。
【0061】以上のステップS1〜ステップS3までの処
理は、以降の自動リンク付けを行うための前処理であ
り、1冊の書籍分総ての画像データに対して、各ページ
画像毎に順次実行される。したがって、上記ステップS
3が終了した時点では、メモリ8の領域分割結果部29
および認識結果部30には、1冊の書籍分のデータが保
持されることになる。
【0062】ステップS4で、上記書籍構造抽出部24,
クラスタリング部23および距離計算部17が制御され
て、上記領域分割結果および文字認識結果に基づいて書
籍構造が次のようにして抽出される。すなわち、メモリ
8の領域分割結果部29および認識結果部30から、当
該書籍1冊分の全ヘッダ領域または全フッター領域の認
識結果文字列が抽出されて、クラスタリングメモリ部3
3に格納される。そして、この格納された全文字列を母
集団としたクラスタリングが行われて、「章」や「節」等の
単位に上記文字列を分類することによって書籍構造が抽
出されるのである。こうして抽出された書籍構造の代表
タイトル文字列や領域座標等の情報は、メモリ8の書籍
構造結果部31に格納される。
【0063】ステップS5で、上記リンク元ページ判定
部21が制御されて、次のようにしてリンク元ページ判
定が行われる。すなわち、メモリ8の認識結果部30に
格納されているページ画像毎の認識結果を入力データと
し、予め設定されたキーワードとルールとに基づいて、
注目ページが、目次ページ,索引ページおよびそれ以外
のページの何れに属するかが判定されるのである。
【0064】ステップS6で、上記リンク元オブジェク
ト抽出部22が制御されて、上記注目ページが目次ペー
ジあるいは索引ページである場合(つまりリンク元ペー
ジである場合)には、次のようにしてリンク元オブジェ
クト抽出処理が行われる。すなわち、メモリ8の認識結
果部30から注目ページの認識結果が読み出される。そ
して、各行毎に「項目(オブジェクト文字列)」と「ページ
番号」とに分離して上記「項目」の切り出し座標およびリ
ンク元のページ番号文字列等と共に抽出され、メモリ8
のオブジェクト部32に格納される。
【0065】ステップS7で、上記目次ページリンク決
定部26,索引ページリンク決定部27,リンク先クラス
タ判定部25および距離計算部17が制御されて、次の
ようにして上記ステップS6において抽出されたオブジ
ェクトとリンク先ページとのリンク付けが行われる。す
なわち、注目オブジェクトが上記目次ページに在る場合
には、書籍構造結果部31の各代表タイトル文字列とオ
ブジェクト部32における注目オブジェクトのオブジェ
クト文字列との距離計算が行われ、計算結果に基づいて
リンク先の「章」や「節」の構造情報(リンク先構造情報)が
得られる。そして、オブジェクト部32における注目オ
ブジェクトのページ番号文字列部107と、距離テーブ
ル16と、書籍構造結果部31のリンク先の構造情報部
100における開始ページ番号部103とに基づいて、
後に詳述するようにして、リンク元ページやリンク先ペ
ージのオブジェクトの誤認識を吸収した自動リンク付け
が行われる。
【0066】これに対して、注目オブジェクトが上記索
引ページに在る場合には、オブジェクト部32における
注目オブジェクトのページ番号文字列部107からペー
ジ番号を読み出して注目ページとし、オブジェクト部3
2における注目ページの認識結果中に注目オブジェクト
が存在するか否かを、認識結果部30および領域分割結
果部29の内容と距離計算部17の計算結果とに基づい
て誤認識を吸収して判定する。そして、存在する場合に
は索引ページ注目オブジェクトと上記注目ページである
リンク先ページとがリンク付けされる。
【0067】こうして上記目次ページまたは索引ページ
の注目オブジェクトにリンク付けられたリンク先ページ
のページ番号が、オブジェクト部32のリンク先ページ
番号部116に格納される。
【0068】ステップS8で、上記外部記憶装置制御部
9が制御されて、メモリ8のオブジェクト部32に格納
されているリンク情報(リンク元ページ番号やオブジェ
クト切り出し座標やリンク先ページ番号等)が読み出さ
れ、書籍コンテンツファイル12のリンク情報形式に変
換されて書籍コンテンツファイル12に格納される。こ
うして結果出力が行われた後、自動オーサリング処理動
作を終了する。
【0069】以下、この発明の特徴である書籍構造抽
出,リンク元ページ判定,リン元オブジェクト抽出および
目次ページまたは索引ページの自動リンクに付いて、さ
らに詳細に説明する。
【0070】図15は、図14に示す自動オーサリング
処理動作のフローチャート中の上記ステップS4におい
て実行される書籍構造抽出サブルーチンのフローチャー
トを示す。図14における上記ステップS3において1
冊の書籍分総ての画像データに対する文字認識処理が終
了すると書籍構造抽出サブルーチンがスタートする。
【0071】ここで、上記書籍構造抽出処理動作の説明
に先立って、クラスタリングによる書籍の構造抽出の概
念について説明する。図16は、ある書籍の全ページの
ヘッダ部における正解文字列とこの正解文字列の文字認
識結果と誤認識結果との一例を示す。
【0072】現在の文字認識技術では、認識手法や言語
処理方式の発展に伴って以前に比べてその認識率も速度
も飛躍的に向上しているものの、図16に示すように誤
認識は発生する。特に、形態が類似している類似文字に
おいて誤認識が著しい。尚、図16に示す例の場合に
は、正解文字列と文字認識結果との文字数に違いは生じ
ていないが、実際に大量の文字の文字認識を行うと、幾
つかの個所では正解文字列と文字認識結果とに文字数の
違いが生ずる。これは、認識対象文字画像データに含ま
れる接触文字や分離文字に対する切り出し処理のエラー
に起因する。そこで、本実施の形態においては、上述の
誤認識は今後も発生し続ける−文字認識では100%の
認識率はありえない−と想定し、これらの誤認識を吸収
しつつ自動リンク付けを行うのである。
【0073】本実施の形態において用いるDPマッチン
グは、上述したように、要素数の異なる2つのデータ間
(文字数の異なる2つの文字列間)の距離を演算するもの
である。そして、本実施の形態において用いる2文字間
の距離テーブル16は、採用する認識手法から見た誤認
識のし易さ(特徴空間での文字の類似性)を反映したテー
ブルである。したがって、上記式(1)によって求められ
る2文字列間距離は、当該2文字列間における文字列長
の差異を吸収した最適な2文字列間の距離となるのであ
る。そして、2文字列間の距離が算出できれば、パター
ン認識の分野でよく行われているクラスタリング手法
(例えば、LBGアルゴリズム,k−平均法あるいはWard
方等)が適用可能となるのである。
【0074】図17は、図16の文字認識結果に対する
クラスタリング結果を二次元平面130上に示した図で
ある。クラスタ131は文字列「文字を入力する」を代表
文字列とするクラスタであり、クラスタ132は文字列
「データを移動・複写する」を代表文字列とするクラスタ
であり、クラスタ133は文字列「電話帳を作る」を代表
文字列とするクラスタであり、クラスタ134は文字列
「電話帳から探す」を代表文字列とするクラスタである。
ここで、上記文字認識結果の文字列は、上記2文字列間
距離に基づいて各クラスタ毎に「章」や「節」の単位として
分類される。
【0075】以上が、上記書籍構造抽出処理の概念の説
明である。つまり、上記書籍構造抽出処理によれば、不
完全なテキストをDPマッチングと誤認識度合いを反映
した距離テーブル16とに基づいてクラスタリングを行
なうことによって、各クラスタを構成する文字列が掲載
されたページの集合が、書籍を構成する「章」や「節」の単
位として抽出されるのである。
【0076】以下、図15に従って、上記書籍構造抽出
処理動作について説明する。書籍構造抽出処理は、上述
したように、書籍1冊の全ページ画像に対する領域分割
および文字認識が終了すると開始される。
【0077】ステップS11で、上記ヘッダあるいはフッ
ターの何れかが処理対象文字列として選択される。これ
は、メモリ8の認識結果部30の総ての認識結果におけ
るポインタ87(図10参照)で示される領域分割部29
の該当する領域結果部74を求め、この領域結果部74
の領域フラグ部75における最下位から6ビット目のバ
イナリデータを参照することによってヘッダあるいはフ
ッターに該当する認識結果を識別する。そして、ヘッダ
あるいはフッターに該当する認識結果の文字列長をメモ
リ8の認識結果部30の該当する文字数部88から読み
出し、ヘッダに該当する認識結果の文字列長の総和と、
フッターに該当する認識結果の文字列長の総和とを算出
する。その結果、ヘッダおよびフッターのうち文字列長
の総和が大きい方(つまり、情報量の多い方)を、書籍構
造抽出処理の対象文字列とする。以下の説明において
は、便宜上ヘッダーが対象文字列となった場合を想定す
る。
【0078】ステップS12で、各ページのヘッダあるい
はフッターの文字列が抽出されて、メモリ8のクラスタ
リングメモリ部33に格納される。これは、メモリ8の
認識結果部30のポインタ87で示される領域分割部2
9の該当する領域結果部74の領域フラグ部75を参照
してヘッダ(対象文字列はヘッダと仮定している)の認識
結果を探し、認識結果部30におけるヘッダの認識結果
に該当する文字数部88で示される文字数だけコード部
91からコード情報を読み出す。そして、メモリ8のク
ラスタリングメモリ部33における文字列部122にコ
ード情報(文字列)を格納し、文字列文字数部123に上
記文字数を格納し、ページ番号部124には領域分割結
果部29の該当文字列の領域結果部74におけるページ
番号部76の内容を格納することによって行われる。
【0079】ステップS13で、上記ステップS12に示す
ようにしてメモリ8のクラスタリングメモリ部33に格
納された全ヘッダ(または全フッター)の文字列を母集団
として、LBGアルゴリズムによってクラスタリングが
行われる。その際における2文字列間の距離は、距離計
算部17によって距離テーブル16を参照することによ
って求められる。そして、クラスタリングの結果とし
て、各ヘッダ(各フッター)文字列毎に、その文字列が属
するクラスタリング番号がクラスタリングメモリ部33
のクラスタ番号部125に格納される。さらに、その文
字列がそのクラスタの代表文字列である場合には、クラ
スタリングメモリ部33のクラスタ代表フラグ部126
に「1」が格納される。
【0080】ステップS14で、上記ステップS13におい
て、メモリ8のクラスタリングメモリ部33に格納され
たクラスタリング結果から書籍構造が抽出され、メモリ
8の書籍構造結果部31に出力される。すなわち、各ク
ラスタの代表文字列が代表タイトル文字列部101に格
納される。また、代表文字列の文字数が文字数部102
に格納される。また、各クラスタを構成するヘッダ文字
列(またはフッター文字列)のページ番号を検索して得ら
れた最小値が開始ページ番号部103に格納される一
方、最大値が終了ページ番号104に格納されるのであ
る。そうした後に、書籍構造抽出処理を終了して図14
に示す自動オーサリング処理動作のフローチャートにリ
ターンする。
【0081】上記書籍構造の抽出結果を、図16および
図17を例に具体的に述べれば次の様になる。すなわ
ち、書籍構造結果部31の第1構造情報部100には、
代表タイトル文字列「文字を入力する」、開始ページ番号
「1」、終了ページ番号「9」が格納される。また、第2構
造情報部100には、代表タイトル文字列「データを移
動・複写する」、開始ページ番号「10」、終了ページ番号
「17」が格納される。第3構造情報部100には、代表
タイトル文字列「電話帳を作る」、開始ページ番号「1
8」、終了ページ番号「22」が格納される。また、第4
構造情報部100には、代表タイトル文字列「電話帳か
ら探す」、開始ページ番号「23」、終了ページ番号「2
8」が格納されるのである。
【0082】上述のようにして得られた書籍構造結果
は、後述する目次ページからの自動リンク付け処理時に
おいて、目次ページの誤認識を吸収するために用いられ
る。
【0083】このように、各ヘッダ(フッター)の文字列
に対してクラスタリングを行って代表文字列を求めるこ
とによって、図16及び図17に示すように、各クラス
タのメンバ文字列中に存在する誤認識結果を吸収して上
記書籍構造を抽出することができるのである。
【0084】図18は、図14に示す自動オーサリング
処理動作のフローチャート中の上記ステップS5におい
て実行されるリンク元ページ判定サブルーチンのフロー
チャートである。図14における上記ステップS4にお
いて書籍構造抽出処理が終了するとリンク元ページ判定
サブルーチンがスタートする。
【0085】ここで、上記リンク元ページ判定部21に
対する入力データは注目ページ番号であり、上記注目ペ
ージは「目次ページ」,「索引ページ」または「その他のペー
ジ」の何れであるかが出力データである。この入出力デ
ータは、データバス5を介して主制御部1とリンク元ペ
ージ判定部21との間で通信される。尚、上述したよう
に、上記リンク元ページ判定処理はルールに基づいて行
われるのであるが、その場合のルールは、 ・目次ページや索引ページの行末はリンク先ページ数を
表す数字が多い ・目次ページや索引ページ中の認識結果には目次や索引
を表すキーワードが存在する である。但し、キーワード検索は完全一致検索ではな
く、距離計算部17によって求めたキーワードと検索文
字列間の距離が閾値以下である場合にはキーワードは存
在すると判定する。これは、文字認識部19による目次
ページや索引ページの文字列に対する誤認識を吸収する
ためである。
【0086】ステップS21で、上記主制御部1から送出
されてくる「注目ページ」に関する認識結果が走査され
る。これは、メモリ8の領域分割結果部29と認識結果
部30とを参照することによって行う。そして、この走
査結果から以下の情報が求められる。(1)全行数に対す
る末尾文字が数字である行数の比率の算出。(2)目次キ
ーワード「目次」,「もくじ」,「Contents」,「コンテンツ」に
対する最小距離文字列の検索とその最小距離の算出。
(3)索引キーワード「索引」,「さくいん」,「Index」,「イ
ンデックス」に対する最小距離文字列の検索とその最小
距離の算出。
【0087】ここで、上記3つの情報の算出は次の様に
して行う。(1)は、上記注目ページの全行数と末尾文字
が数字である行数とを算出する。そして、末尾文字が数
字である行数の全行数に対する百分率(以下、行末数字
比率と言う)を算出する。(2)は、注目ページに関する
認識結果の各文字を先頭文字として固定して、順次目次
キーワード「目次」,「もくじ」,「Contents」,「コンテンツ」
と同じ文字数となる文字列を切り出す。そして、目次キ
ーワードと切り出し文字列との距離を距離計算部17に
よって行い、最小距離を求める。(3)は、索引キーワー
ド「索引」,「さくいん」,「Index」,「インデックス」に関して
上記(2)と同じ処理を行って、索引キーワードと切り出
し文字列との最小距離を求める。
【0088】ステップS22で、上記ステップS21におけ
る(1)で算出された行末数字比率が80%以上であるか
否かが判別される。その結果、80%以上であればステ
ップS23に進み、そうでなければステップS27に進む。
ステップS23で、目次キーワードの存在が判定される。
これは、上記ステップS21における(2)で算出された目
次キーワードと切り出し文字列との最小距離が閾値(例
えば「50」)以下であるか否かによって行われる。そし
て、上記最小距離が閾値以下であれば目次キーワードは
存在すると判定されてステップS24に進む。一方、上記
閾値より大きければステップS25に進む。ステップS24
で、注目ページは目次ページであることを表す値「0(0
x00)」が出力される。そうした後に、リンク元ページ
判定処理を終了して図14に示す自動オーサリング処理
動作のフローチャートにリターンする。
【0089】ステップS25で、上記索引キーワードの存
在が判定される。これは、上記ステップS21における
(3)で算出された索引キーワードと切り出し文字列との
最小距離が閾値(例えば「50」)以下であるか否かによっ
て行われる。そして、上記最小距離が閾値以下であれば
索引キーワードは存在すると判定されてステップS26に
進む。一方、上記閾値より大きければステップS27に進
む。ステップS26で、注目ページは索引ページであるこ
とを表す値「1(0x01)」が出力される。そうした後、
リンク元ページ判定処理を終了して図14に示す自動オ
ーサリング処理動作のフローチャートにリターンする。
【0090】ステップS27で、注目ページはその他のペ
ージであることを表す値「0xff」が出力される。そう
した後、リンク元ページ判定処理を終了して図14に示
す自動オーサリング処理動作のフローチャートにリター
ンする。
【0091】図19は、図14に示す自動オーサリング
処理動作のフローチャート中の上記ステップS6におい
て実行されるリンク元オブジェクト抽出サブルーチンの
フローチャートである。図14における上記ステップS
5においてリンク元ページ判定処理が終了するとリンク
元オブジェクト抽出サブルーチンがスタートする。
【0092】図20は、図3に示す索引ページの画像に
おける上から3行目までを抽出した索引の一例を示す。
索引は、項目とページ番号とが何某かのセパレータで分
離されている構成されているのが普通である。図20
(a)に示す例では、項目とページ番号とがセパレータ
「…」で分離されている。また、図20(b)に示す例で
は、項目とページ番号とがセパレータ「―」で分離されて
いる。また、図20(c)に示す例では、項目とページ番
号とがセパレータ「空白」で分離されている。目次ページ
の場合には縦書きが多いが、基本的には索引ページと同
様にセパレートされている。
【0093】このように、目次ページの場合も索引ペー
ジの場合も、項目文字列方向に直交する方向への幅が項
目文字幅に比べて非常に小さい記号文字または空白の連
続がセパレータとなっているものが殆どである。そこ
で、本実施の形態においては、この特徴を利用して目次
ページあるいは索引ページからのオブジェクト切り出し
を行うのである。尚、以下の説明では、リンク元ページ
は横書きであり、項目および数字は行方向に配列されて
いるものとする。
【0094】ステップS31で、上記リンク元ページ判定
処理によってリンク元ページと判定されたページの認識
結果から、各行単位に、文字高さ(縦書きの場合には文
字幅)のヒストグラムが作成される。このヒストグラム
の作成は、認識結果部30の開始X座標部93〜終了Y
座標部96の内容を入力データとして各文字の高さ(幅)
を求め、その頻度を算出することによって作成する。こ
うして作成されたヒストグラムは、メモリ8のヒストグ
ラムバッファ部34に格納される。
【0095】ステップS32で、上記ステップS31におい
て作成されたヒストグラムに対して判別分析による二値
化閾値が計算される。尚、上記判別分析アルゴリズム
は、電子情報通信学会論文誌80/4 Vol. J63-D No.「判
別および最小2乗基準に基づく自しきい値選定法」に記
載されている計算方法を用いる。この判別分析法の利点
は、パラメータが不要で且つ最適な閾値を計算できる点
である。
【0096】図21は、上記文字高さのヒストグラムお
よび二値化閾値の例を示す。図21において横軸はサイ
ズ(文字高さを表す画素数)を示し、縦軸は頻度を示す。
図中○印141で囲まれた部分は高さが小さい記号文字
(列方向で言えば「…」や「−」)の高頻度部を表し、○印1
42で囲まれた部分は高さが通常の文字の高頻度部を表
している。そして、高さが小さい記号文字の山と高さが
通常の文字の山との間に、判別分析で求められた二値化
閾値Aが存在する。そこで、二値化閾値Aより小さいサ
イズの文字をセパレータ候補であると判定するのであ
る。
【0097】ところで、文字の大小関係は原稿フォント
によって変動する。そこで、本実施の形態においては、
文字の高さ(幅)のヒストグラムに対して判別分析を行っ
て二値化閾値Aを算出することによって、文字の大小判
定を動的に行うのである。
【0098】ステップS33で、注目行において、上記セ
パレータ候補は「空白」であるか否かが判別される。その
結果、「空白」であればステップS36に進み、そうでなけ
ればステップS34に進む。ここで、「空白」の判定は以下
のような判定条件に基づいて行う。すなわち、 (1) 行(列)の中心付近にその行(列)における最大空白
(文字間隔)が存在し、その空白長が行(列)長の20%以
上である。 (2) 判別分析で求めた二値化閾値A以下の文字高さ
(幅)の平均が、行の高さ(列の幅)の50%よりも大きい
(小さい記号が存在しない)。 である。そして、上記2つの判定条件のうち何れか1つ
でも満たす場合には、上記セパレータは「空白」であると
判定するのである。
【0099】ステップS34で、上記セパレータは「空白」
ではないので、以下のような仮区間の設定が行われる。
これは、上記ステップS32において求められた二値化閾
値A以下の高さ(幅)を有する全文字(記号)を注目行から
抽出し、二値化閾値A以下の高さ(幅)の文字(記号)が連
続する最大区間を抽出し、この最大区間の両端を仮のセ
パレータ開始文字とセパレータ終了文字として設定する
ことによって行う。
【0100】ステップS35で、上記セパレータを抽出す
るセパレータ抽出が行われる。殆どの場合には、上記ス
テップS34における仮区間の設定によってセパレータ区
間が抽出される。ところが、切り出すべきオブジェクト
文字列の終了が小文字(ぁ,っ,ゃ,ュ,ョ等)であった場合
にその小文字がセパレータ文字と判定される場合があ
る。そのようなエラーを修正するために本セパレータ抽
出が行われる。これは、上記仮区間の左右両端の文字を
順次1つずつ消去しながら文字高さ(文字幅)の分散を求
め、その分散が最小となり且つ文字列の長さが最大とな
る区間を上記セパレータとして抽出するのである。そし
て、注目行における上記抽出されたセパレータによって
分離された左側(縦書きの場合には上側)の認識結果がオ
ブジェクト文字列(項目文字列)となり、右側(下側)の認
識結果がページ番号文字列となるのである。
【0101】ステップS36で、空白切り出しが行われ
る。これは、上記セパレータは「空白」であるので、注目
行の中心付近で最大長の「空白」列を上記セパレータとす
ることによって行う。そして、上記セパレータによって
分離された左側(上側)の認識結果がオブジェクト文字列
(項目文字列)となり、右側(下側)の認識結果がページ番
号文字列となる。
【0102】ステップS37で、上記ステップS35におい
て抽出されたセパレータおよび上記ステップS36におい
て切り出されたセパレータの情報に基づいて、上記セパ
レータより左右(上下)の認識結果がリンク元オブジェク
トとして抽出される。ステップS38で、上記ステップS
37において、上述のようにして各行の認識結果から抽出
されたリンク元オブジェクトの情報が、順次出力され
て、メモリ8のオブジェクト部32における該当するオ
ブジェクト格納部105に格納される。そうした後、リ
ンク元オブジェクト抽出処理を終了して図14に示す自
動オーサリング処理動作のフローチャートにリターンす
る。
【0103】上記リンク元オブジェクト抽出結果を、図
20における文字列「カタカナ」を例に具体的に述べれば
次の様になる。すなわち、オブジェクト部32の該当オ
ブジェクト格納部105におけるオブジェクト文字列部
106には抽出オブジェクト「カタカナ」(誤認識文字は
そのまま含んで)が格納される。また、ページ番号文字
列部107には抽出オブジェクト「30」(誤認識文字は
そのまま含んで)が格納される。また、オブジェクト文
字列文字数部108には抽出オブジェクト“カタカナ”
の文字数「4」が格納される。また、ページ番号文字列文
字数部109には抽出オブジェクト“30”の文字数
「2」が格納される。また、リンク元ページ番号部110
には当該リンク元ページの番号「352」(図3の領域5
4を参照)が格納される。また、開始X座標部111〜
終了Y座標部114には抽出オブジェクト“カタカナ”
の外接矩形座標が格納される。また、目次・索引フラグ
部115には当該リンク元ページは索引ページであるこ
とを示す「1(目次の場合には0)」(図3の領域51を
参照)が格納される。また、上記リンク先ページ番号部
116には、リンクが張られていないことを表す初期値
「0xff」が格納されるのである。
【0104】上述したように、上記領域分割処理、文字
認識処理、書籍構造抽出処理、リンク元ページ判定処
理、リンク元オブジェクト抽出処理が順次行われて、目
次ページや索引ページに存在する総てのオブジェクトが
抽出されると、本実施の形態における最も特徴的な自動
リンクサブルーチンが行われるのである。
【0105】図22は、図14に示す自動オーサリング
処理動作のフローチャート中の上記ステップS7におい
て実行される自動リンクサブルーチンのフローチャート
である。図14における上記ステップS6においてリン
ク元オブジェクト抽出処理が終了すると自動リンクサブ
ルーチンがスタートする。
【0106】ステップS41で、上記抽出された全リンク
元オブジェクトが順に走査されて、注目オブジェクトが
目次ページのオブジェクトであるか索引ページのオブジ
ェクトであるかが判別される。これは、リンク元ページ
判定部21の判定結果に基づいて、リンク元オブジェク
ト抽出部22によってオブジェクト部32に格納された
目次・索引フラグ部115の内容を参照し、「0」であれ
ば注目オブジェクトは目次ページのオブジェクトである
と判別する一方、「1」であれば索引ページのオブジェク
トであると判別することで行う。そして、目次ページの
オブジェクトであると判別された場合にはステップS42
に進む一方、索引ページのオブジェクトであると判別さ
れた場合にはステップS46に進む。
【0107】ステップS42で、注目オブジェクトに対す
るリンク先構造情報の決定が行われる。これは、リンク
先クラスタ判定部25によって、注目オブジェクトの文
字列(オブジェクト部32のオブジェクト文字列部10
6に格納されている)と、書籍構造結果部31における
全構造情報部100の代表タイトル文字列部101に格
納された代表タイトル文字列との距離を、距離計算部1
7によって算出する。そして、最小距離を呈する代表タ
イトル文字列に関する書籍構造情報をリンク先構造情報
として決定することによって行う。
【0108】上述のようにリンク先の決定にリンク元オ
ブジェクト文字列と代表タイトル文字列との距離を用い
ることによって、リンク元オブジェクト文字列あるいは
代表タイトル文字列に対する誤認識を吸収することがで
きる。例えば、図16に示すヘッダ情報を有する書籍に
おける目次ページの認識結果および誤認識結果の例を図
23に示す。このように、文字列の認識には誤認識が付
きまとうため(また、ヘッダ部分の文字列も正確に認識
されるとは限らず)、常に誤認識を考慮した処理が必要
となるのである。
【0109】具体的に説明すれば、図16に示すヘッダ
情報に対するクラスタリング処理結果から得られた代表
タイトル文字列を「文字を入力する」,「データを移動・複
写する」,「電話帳を作る」および「電話帳から探す」(図1
7)とし、同じ書籍における目次ページの認識結果を図
23とした場合、上記リンク先構造情報の決定処理は、
例えば注目オブジェクトの文字列を「文字を入カする
(「入力」の漢字「力」が片仮名「カ」に誤認識されている)」
と、各代表タイトル文字列を「文字を入力する」,「データ
を移動・複写する」,「電話帳を作る」及び「電話帳から探
す」との距離を計算し、最も距離が近い代表タイトル文
字列「文字を入力する」をリンク先構造情報として決定す
るのである。したがって、注目オブジェクトの文字列に
誤認識文字が含まれていても正しいリンク先構造情報が
得ることができるのである。
【0110】ステップS43で、リンク付け可能か否かの
判定が行われる。これは、オブジェクト部32における
注目オブジェクトのオブジェクト格納部105における
ページ番号文字列部107の内容を数値に変換し、この
数値が、書籍構造結果部31における上記決定されたリ
ンク先構造情報(書籍構造)の開始ページ番号部103の
内容(数値)と合致するか否かが判別することによって行
われる。そして、合致する場合(つまり、リンク付け可
能な場合)にはステップS50に進み、そうでなければス
テップS44に進む。
【0111】ステップS44で、ページ番号文字列の置き
換えが行われる。これは、注目オブジェクトのオブジェ
クト格納部105におけるページ番号文字列部107の
内容を、距離テーブル16における例えば行がページ番
号文字列部107の内容であり例えば列が数字である部
分から要素値(距離)が閾値(例えば「50」)以内で且つ最
小値を呈する列の数字に置き換えることによって行われ
る。
【0112】ステップS45で、上記ステップS44におけ
るページ番号文字列の置き換えは可能であったか否かが
判別される。これは、要素値(距離)が上記閾値以内であ
る数字が距離テーブル16に存在したか否かを判別する
ことによって行われる。そして、置き換えが可能であっ
た場合には、上記ステップS43に戻って置換された数字
に関してリンク付け可能か否かの判定が行われる。一
方、置き換えが不可能であった場合にはステップS50に
進む。
【0113】ステップS46で、注目ページにおける注目
オブジェクトの検索が行われる。これは、オブジェクト
部32の注目オブジェクトに係るオブジェクト格納部1
05におけるページ番号文字列部107の内容を数値に
変換して注目ページ番号とする。そして、この注目ペー
ジ番号のページ(注目ページ)に関する認識結果中に注目
オブジェクトの文字列(オブジェクト部32のオブジェ
クト文字列部106の内容)が存在するか否かを判別す
ることによって行われる。この場合の検索は、上記リン
ク元ページ判定処理時における目次キーワードあるいは
索引キーワードの検索時と同様に、距離計算部17によ
って計算された2文字列の間の距離が閾値以下である文
字列を検索する方式によって行う。こうして、上記注目
ページに関する認識結果や注目オブジェクトの文字列に
含まれる誤認識を吸収するのである。
【0114】ステップS47で、上記ステップS46におけ
る検索結果に基づいて、リンク付け可能か否かの判定が
行われる。これは、上記注目オブジェクトの文字列が上
記注目ページの認識結果内に存在する(正確には、ある
閾値以内の類似度を有する認識結果が存在する)かを判
定することによって行う。そして、リンク付け可能な場
合にはステップS50に進み、そうでなければステップS
48に進む。
【0115】ステップS48で、注目オブジェクトのペー
ジ番号文字列に誤認識が在ったとして上記ページ番号文
字列の置き換えが行われる。これは、注目オブジェクト
が目次ページのオブジェクトである場合における上記ス
テップS44と同じ処理によって行う。
【0116】ステップS49で、注目オブジェクトが目次
ページのオブジェクトである場合における上記ステップ
S45と同じ処理によって、上記ステップS48におけるペ
ージ番号文字列の置き換えは可能であったか否かが判別
される。そして、置き換えが可能であった場合には、上
記ステップS46に戻って次の注目ページにおける注目オ
ブジェクトの検索が行われる。一方、置き換えが不可能
であった場合にはステップS50に進む。
【0117】ステップS50で、リンク先ページ番号がオ
ブジェクト部32における注目オブジェクトのリンク先
ページ番号部116に出力される。これは、上記ステッ
プS43においてリンク付け可能と判別された場合には、
上記ステップS42において決定されたリンク先構造情報
の開始ページ番号を上記リンク先ページ番号とする。ま
た、上記ステップS47においてリンク付け可能と判別さ
れた場合には、上記ステップS46において得られた注目
ページ番号を上記リンク先ページ番号とする。さらに、
上記ステップS45あるいはステップS49において置き換え
不可能と判定された場合には、エラー値「0xff(=初
期値)」を上記リンク先ページ番号とすることによって行
われる。そうした後、自動リンク処理を終了して図14
に示す自動オーサリング処理動作のフローチャートにリ
ターンする。
【0118】以上のように、本実施の形態においては、
画像入力部6あるいは外部記憶装置制御部9によって書
籍1冊分の画像データをメモリ8のページ画像部28に
取り込み、領域分割部18によって上記画像データに対
して領域分割処理を行い、文字認識部19によって上記
分割された領域に対して文字認識処理を行う。そうした
後に、1冊の書籍分総てに関する上記領域分割処理およ
び文字認識処理に基づいて以下のようなリンク編集を行
う。その場合のリンク編集は、次の様な書籍が有する特
徴を利用して行う。 (a) 目次や索引では「項目文字列」と「その項目が記載さ
れているページ番号」とが、「…」,「−」あるいは「空白」等
のセパレータを介して同じ列や行を構成している。 (b) 目次ページの「項目」は、その書籍の「章」や「節」の
代表タイトル文字列であることが多い。 (c) 書籍の「章」や「節」の代表タイトル文字列は、該当
する「章」や「節」における「ヘッダ」あるいは「フッター」
に記載されている。 (d) 索引ページの「項目文字列」は、対応付けられたペ
ージ番号のページの文字認識結果中に存在する。
【0119】すなわち、先ず、書籍構造抽出部24で、
特徴(c)を利用して、ヘッダあるいはフッターから文字
列を抽出し、クラスタリング部23によるクラスタリン
グ結果に基づいて代表タイトル文字列とその代表タイト
ル文字列のクラスタに属する先頭ページ番号とを求め
る。次に、リンク元ページ判定部で、特徴(a)とルール
とを利用して目次ページおよび索引ページを判定する。
次に、リンク元オブジェクト抽出部22で、特徴(a)を
利用して目次ページおよび索引ページの各行から「項目
文字列」と「ページ番号」とを分離して抽出する。
【0120】そして、上記目次ページの場合には、リン
ク先クラスタ判定部25で、上記特徴(b),(c)を利用
して、目次ページの「項目文字列」との距離が最小の代表
タイトル文字列とその代表タイトル文字列のクラスタに
属する先頭ページ番号とを求める。次に、目次ページリ
ンク決定部26で、目次ページにおいて「項目文字列」と
対を成す「ページ番号」が上記得られた「該当クラスタの
先頭ページ番号」に合致するかを調べ、合致しない場合
には距離テーブル16を利用して上記「ページ番号」を最
も誤認識され易い数字に変換して上記合致の判定を行
う。そして、合致する場合に上記「該当クラスタの先頭
ページ番号」をリンク先ページ番号とする。
【0121】また、上記索引ページの場合には、上記索
引ページリンク決定部27で、上記特徴(d)を利用し
て、索引ページの「項目文字列」と対を成す「ページ番号」
のページの文字認識結果中に「項目文字列」が存在するか
を調べ、存在しない場合には距離テーブル16を利用し
て上記「ページ番号」を最も誤認識され易い数字に変換し
て上記存在の判定を行う。そして、存在する場合に上記
「ページ番号」をリンク先ページ番号とする。
【0122】そうした後、上記目次ページリンク決定部
26および索引ページリンク決定部27で、上記得られ
たリンク先ページ番号とリンク元ページ番号やリンク元
オブジェクトの切り出し座標等を、外部記憶装置10の
書籍コンテンツファイル12に格納するようにしてい
る。
【0123】すなわち、本実施の形態によれば、書籍1
冊分の画像データの文字認識結果に基づいて上記書籍構
造抽出部24で書籍構造を抽出する際に、クラスタリン
グ部23によってヘッダあるいはフッターの文字列の認
識結果に対してクラスタリングを行うので、ヘッダある
いはフッターの文字列の誤認識を吸収できる。また、目
次ページの「項目文字列」に該当する「代表タイトル文字
列」の検索や索引ページの「項目文字列」に一致する注目
ページ中の認識結果の検索を、完全一致ではなく最小距
離を利用して行うので、「項目文字列」,「代表タイトル文
字列」および「注目ページ中の認識結果」の誤認識を吸収
できる。また、リンク付け可能の判定の際に上記「ペー
ジ番号」を最も誤認識され易い数字に変換しながら上記
判定を行うので、リンク元ページ番号の誤認識を吸収で
きる。したがって、漫画や写真雑誌等の画像ベース電子
書籍に対する自動リンク編集を可能にするのである。
【0124】上記自動オーサリング装置においては、自
動オーサリング処理のプログラムを以下の何れかの方法
によって、ROM(リード・オンリ・メモリ)またはRAM
(何れも図示せず)に記憶している。 (a) 予め上記ROMに記憶しておく。 (b) 上記自動オーサリング処理のプログラムの一部ま
たは全部をフロッピーディスクやハードディスク装置等
の記録媒体に格納しておき、必要に応じて上記プログラ
ムを上記RAMにインストールする。 (c) コンピュータネットワークから上記自動オーサリ
ング処理のプログラムを上記RAMにインストールす
る。
【0125】
【発明の効果】以上より明らかなように、請求項1に係
る発明の自動オーサリング装置は、画像入力手段,距離
テーブル,距離計算手段,領域分割手段,文字認識手段,ク
ラスタリング手段および書籍構造抽出手段を備えて、上
記領域分割手段および文字認識手段で得られた書籍全ペ
ージのヘッダあるいはフッターの何れか一方の文字列の
集合に対して、上記クラスタリング手段によってクラス
タリングを行い、上記書籍構造抽出手段によって、上記
各クラスタに属する文字列に係るページの境界を当該書
籍の章や節等の区切りとすると共に、各クラスタの代表
文字列を上記区切り間の代表タイトル文字列として書籍
構造を抽出するので、画像ベース電子書籍の章や節等の
書籍構造を自動的に抽出できる。したがって、この抽出
された書籍構造を利用して画像ベース電子書籍のハイパ
ーテキスト化が可能になる。
【0126】その際に、上記文字列の分類にクラスタリ
ングを用いることによって、上記ヘッダあるいはフッタ
ーの文字認識結果における誤認識を吸収することができ
る。したがって、現在の文字認識精度であっても高い精
度で書籍構造を抽出できる。
【0127】また、請求項2に係る発明の自動オーサリ
ング装置は、画像入力手段,距離テーブル,距離計算手
段,領域分割手段,文字認識手段,クラスタリング手段,書
籍構造抽出手段,リンク元ページ判定手段,リンク元オブ
ジェクト抽出手段,リンク先クラスタ判定手段および目
次ページリンク決定手段を備えて、上記リンク元ページ
判定手段によって各ページ毎に目次ページあるいは索引
ページの判定を行い、上記リンク元オブジェクト抽出手
段によって目次ページまたは索引ページからリンク元オ
ブジェクトを項目文字列部とページ番号文字列部とに分
けて抽出し、上記リンク先クラスタ判定手段によって目
次ページにおける各リンク元オブジェクトの項目文字列
に対応する上記書籍の区切りを判定し、上記目次ページ
リンク決定手段によって上記各リンク元オブジェクトの
ページ番号文字列と上記書籍の区切りの開始ページ番号
との比較結果に基づいて目次ページに対するリンク付け
を行うので、画像ベース電子書籍における各目次の項目
から参照ページへのリンク付けを自動的に行うことがで
きる。
【0128】その際に、上記書籍構造抽出にクラスタリ
ングを用いることによって、上記ヘッダまたはフッター
の文字認識結果における誤認識を吸収することができ
る。さらに、上記リンク元オブジェクトに対応する上記
書籍の区切りの判定に、上記リンク元オブジェクトの項
目文字列と上記書籍の区切り間の代表タイトル文字列と
の距離を用いることによって、上記項目文字列の誤認識
を吸収できる。さらに、上記各リンク元オブジェクトの
ページ番号文字列と上記書籍の区切りの開始ページ番号
との比較の際に、上記ページ番号文字列と開始ページ番
号とが一致しない場合には上記ページ番号文字列を誤認
識し易い数字に置換して上記比較を繰り返すことによっ
て、上記ページ番号文字列の誤認識を吸収できるのであ
る。
【0129】したがって、画像ベース電子書籍をテキス
トベース電子書籍に変換する際における文字認識精度が
現状の98%程度であっても、目次ページと本文ページ
とのリンク付けを正しく行うことができる。
【0130】また、請求項3に係る発明の自動オーサリ
ング装置は、画像入力手段,距離テーブル,距離計算手
段,領域分割手段,文字認識手段,リンク元ページ判定手
段,リンク元オブジェクト抽出手段および索引ページリ
ンク決定手段を備えて、上記索引ページリンク決定手段
によって、上記各リンク元オブジェクトにおけるページ
番号のページの文字認識結果中からの上記項目文字列の
検索結果に基づいて索引ページに対するリンク付けを行
うので、画像ベース電子書籍における各索引の項目から
参照ページへのリンク付けを自動的に行うことができ
る。
【0131】その際に、上記書籍構造抽出にクラスタリ
ングを用いることによって、上記ヘッダあるいはフッタ
ーの文字認識結果における誤認識を吸収することができ
る。さらに、上記ページ番号に係る文字認識結果中から
の上記項目文字列の検索に、上記文字認識結果から切り
出した文字列と上記項目文字列との距離を用いることに
よって、上記項目文字列の誤認識を吸収することができ
る。さらに、上記検索の際に上記項目文字列が検索され
ない場合には上記ページ番号文字列を誤認識し易い数字
に置換して上記検索を繰り返すことによって、上記ペー
ジ番号文字列の誤認識を吸収することができるのであ
る。
【0132】したがって、画像ベース電子書籍をテキス
トベース電子書籍に変換する際における文字認識精度が
現状の98%程度であっても、索引ページと本文ページ
とのリンク付けを正しく行うことができる。
【0133】また、請求項4に係る発明の自動オーサリ
ング装置は、請求項2に係る発明の自動オーサリング装
置に、請求項3に係る発明における索引ページリンク決
定手段を付加したので、画像ベース電子書籍における各
目次あるいは索引の項目から参照ページへのリンク付け
を自動的に行うことができる。
【0134】その際に、請求項2および請求項3に係る
発明の場合と同様に、上記ヘッダあるいはフッターの文
字認識結果における誤認識を吸収し、上記項目文字列に
おける誤認識を吸収し、上記ページ番号文字列の誤認識
を吸収することができるのである。
【0135】また、請求項5に係る発明の自動オーサリ
ング装置における上記リンク元オブジェクト抽出手段
は、各リンク元オブジェクト毎に項目文字列の配列方向
に直交する方向への文字長さのヒストグラムを作成する
ヒストグラム作成手段と、上記ヒストグラムに対して判
別分析によって二値化閾値を計算する二値化閾値算出手
段と、上記二値化閾値以下の長さを有する文字の連なり
でなるセパレータ候補中から上記方向への文字長さの分
散が最小となる連続区間を上記セパレータとして抽出す
るセパレータ抽出手段と、上記リンク元オブジェクトに
おける上記抽出されたセパレータの一側を上記項目文字
列とし他側を上記ページ番号文字列として抽出するオブ
ジェクト抽出手段を有しているので、「…」,「−」あるい
は「空白」等のセパレータの特徴を利用して、上記項目文
字列とページ番号文字列とを自動的に分離して抽出でき
る。
【0136】また、請求項6に係る発明の記録媒体に
は、請求項4における上記画像入力手段,距離計算手段,
領域分割手段,文字認識手段,クラスタリング手段,書籍
構造抽出手段,リンク元ページ判定手段,リンク元オブジ
ェクト抽出手段,リンク先クラスタ判定手段,目次ページ
リンク決定手段および索引ページリンク決定手段とし
て、コンピュータを機能させて、書籍の画像データに基
づいて目次あるいは索引の各項目から参照ページへのリ
ンク付けを自動的に行う自動オーサリングプログラムが
記録されているので、請求項4に係る発明の場合と同様
に、上記ヘッダあるいはフッターの文字列や上記リンク
元オブジェクトの項目文字列およびページ番号文字列の
誤認識を吸収した目次ページあるいは索引ページに対す
るリンク付けを自動的に行うことができる。
【図面の簡単な説明】
【図1】 この発明の自動オーサリング装置におけるブ
ロック図である。
【図2】 図1における領域分割部による目次ページに
対する領域分割結果の概念図である。
【図3】 図1における領域分割部による索引ページに
対する領域分割結果の概念図である。
【図4】 図2に示す目次ページに対するリンク先ペー
ジの画像例を示す図である。
【図5】 図3に示す索引ページに対するリンク先ペー
ジの画像例を示す図である。
【図6】 図1における距離テーブルの概念図である。
【図7】 図1における距離計算部の詳細なブロック図
である。
【図8】 図1におけるページ画像部の詳細な構成概念
図である。
【図9】 図1における領域分割結果部の詳細な構成概
念図である。
【図10】 図1における認識結果部の詳細な構成概念
図である。
【図11】 図1における書籍構造結果部の詳細な構成
概念図である。
【図12】 図1におけるオブジェクト部の詳細な構成
概念図である。
【図13】 図1におけるクラスタリングメモリ部の詳
細な構成概念図である。
【図14】 図1における制御部の制御の下に行われる
自動オーサリング処理動作のフローチャートである。
【図15】 図14に示す自動オーサリング処理動作中
において実行される書籍構造抽出サブルーチンのフロー
チャートである。
【図16】 ある書籍の全ページのヘッダ部における正
解文字列と文字認識結果と誤認識結果の一例を示す図で
ある。
【図17】 図16に示す文字認識結果に対するクラス
タリング結果を示す図である。
【図18】 図14に示す自動オーサリング処理動作中
において実行されるリンク元ページ判定サブルーチンの
フローチャートである。
【図19】 図14に示す自動オーサリング処理動作中
において実行されるリンク元オブジェクト抽出サブルー
チンのフローチャートである。
【図20】 図3に示す索引ページから抽出した索引の
例を示す図である。
【図21】 文字高さのヒストグラム及び二値化閾値の
例を示す図である。
【図22】 図14に示す自動オーサリング処理動作中
において実行される自動リンクサブルーチンのフローチ
ャートである。
【図23】 目次ページの認識結果および誤認識結果の
例を示す図である。
【図24】 リンク機能の概念を示す図である。
【符号の説明】
1…主制御部、 5…データバス、6…画像入力部、
8…メモリ、9…外部記憶装置制
御部、 10…外部記憶装置、11…書籍画像
ファイル、 12…書籍コンテンツファイ
ル、16…距離テーブル、 17…距離
計算部、18…領域分割部、 19…
文字認識部、21…リンク元ページ判定部、 2
2…リンク元オブジェクト抽出部、23…クラスタリン
グ部、 24…書籍構造抽出部、25…リン
ク先クラスタ判定部、 26…目次ページリンク決
定部、27…索引ページリンク決定部、 28…ペ
ージ画像部、29…領域分割結果部、 3
0…認識結果部、31…書籍構造結果部、
32…オブジェクト部、33…クラスタリングメモリ
部、 34…ヒストグラムバッファ部。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 佐藤 克彦 大阪府大阪市阿倍野区長池町22番22号 シ ャープ株式会社内 Fターム(参考) 5B050 BA10 BA16 DA06 EA04 EA08 EA18 GA08 5B064 AA01 AA07 BA01 CA03 CA08 5B075 ND07 NK02 NK37 NK44 NR03 NR06 NR12 NR20 UU11

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 画像ベース電子書籍を自動的にオーサリ
    ングする自動オーサリング装置であって、 書籍の各ページの画像を入力する画像入力手段と、 文字認識時の誤認識傾向を距離値に変換して予め作成し
    た距離テーブルと、 上記距離テーブルを用いた動的計画法マッチングによっ
    て、文字認識時の誤認識傾向を考慮した2文字列間の距
    離を計算する距離計算手段と、 上記画像入力手段から取り込まれた画像データに対して
    領域分割を行って、文字領域,写真領域,図形領域を含む
    領域を抽出する領域分割手段と、 上記領域分割手段によって抽出された文字領域の画像デ
    ータに基づいて、文字認識を行う文字認識手段と、 文字列の集合に対して、上記距離計算手段による2文字
    列間の距離の算出結果を用いてクラスタリングを行って
    複数のクラスタに分割すると共に、各クラスタを代表す
    る代表文字列を抽出するクラスタリング手段と、 上記書籍全ページのヘッダまたはフッターの何れか一方
    の文字列の集合に対する上記クラスタリング手段による
    クラスタリング結果を用いて、各クラスタに属する文字
    列に係るページの境界を当該書籍の区切りとすると共
    に、各クラスタの代表文字列を上記区切り間の代表タイ
    トル文字列として書籍構造を抽出する書籍構造抽出手段
    を備えて、 上記画像入力手段から取り込まれた書籍の画像データに
    基づいて、当該書籍の章あるいは節等の書籍構造を自動
    的に抽出することを特徴とする自動オーサリング装置。
  2. 【請求項2】 画像ベース電子書籍を自動的にオーサリ
    ングする自動オーサリング装置であって、 書籍の各ページの画像を入力する画像入力手段と、 文字認識時の誤認識傾向を距離値に変換して予め作成し
    た距離テーブルと、 上記距離テーブルを用いた動的計画法マッチングによっ
    て、文字認識時の誤認識傾向を考慮した2文字列間の距
    離を計算する距離計算手段と、 上記画像入力手段から取り込まれた画像データに対して
    領域分割を行って、文字領域,写真領域,図形領域を含む
    領域を抽出する領域分割手段と、 上記領域分割手段によって抽出された文字領域の画像デ
    ータに基づいて、文字認識を行う文字認識手段と、 文字列の集合に対して、上記距離計算手段による2文字
    列間の距離の算出結果を用いてクラスタリングを行って
    複数のクラスタに分割すると共に、各クラスタを代表す
    る代表文字列を抽出するクラスタリング手段と、 上記書籍全ページのヘッダあるいはフッターの何れか一
    方の文字列の集合に対する上記クラスタリング手段によ
    るクラスタリング結果を用いて、各クラスタに属する文
    字列に係るページの境界を当該書籍の区切りとすると共
    に、各クラスタの代表文字列を上記区切り間の代表タイ
    トル文字列として書籍構造を抽出する書籍構造抽出手段
    と、 上記各ページ毎の文字認識結果に基づいて、上記距離計
    算手段による文字列間距離およびキーワードを用いて、
    予め設定されたルールに従って、目次ページまたは索引
    ページの判定を行うリンク元ページ判定手段と、 上記目次ページまたは索引ページの文字認識結果に基づ
    いて、予め設定されたルールに従って、リンク元オブジ
    ェクトを項目文字列部とこの項目文字列が記載されてい
    るページのページ番号文字列部とに分けて抽出するリン
    ク元オブジェクト抽出手段と、 上記目次ページにおける上記各リンク元オブジェクトの
    項目文字列と上記書籍の区切り間の代表タイトル文字列
    とに間する上記距離算出手段による距離算出結果に基づ
    いて、上記リンク元オブジェクトに対応する上記書籍の
    区切りを判定するリンク先クラスタ判定手段と、 上記各リンク元オブジェクトのページ番号文字列および
    このページ番号文字列が上記距離テーブルを参照して置
    換された誤認識し易い数字と、当該リンク元オブジェク
    トに対応する上記書籍の区切りの開始ページ番号との比
    較結果に基づいて、目次ページに対するリンク付けを行
    う目次ページリンク決定手段を備えて、 上記画像入力手段から取り込まれた書籍の画像データに
    基づいて、各目次の項目から参照ページへのリンク付け
    を自動的に行うことを特徴とする自動オーサリング装
    置。
  3. 【請求項3】 画像ベース電子書籍を自動的にオーサリ
    ングする自動オーサリング装置であって、 書籍の各ページの画像を入力する画像入力手段と、 文字認識時の誤認識傾向を距離値に変換して予め作成し
    た距離テーブルと、 上記距離テーブルを用いた動的計画法マッチングによっ
    て、文字認識時の誤認識傾向を考慮した2文字列間の距
    離を計算する距離計算手段と、 上記画像入力手段から取り込まれた画像データに対して
    領域分割を行って、文字領域,写真領域,図形領域を含む
    領域を抽出する領域分割手段と、 上記領域分割手段によって抽出された文字領域の画像デ
    ータに基づいて、文字認識を行う文字認識手段と、 上記各ページ毎の文字認識結果に基づいて、上記距離計
    算手段による文字列間距離およびキーワードを用いて、
    予め設定されたルールに従って、目次ページまたは索引
    ページの判定を行うリンク元ページ判定手段と、 上記目次ページまたは索引ページの文字認識結果に基づ
    いて、予め設定されたルールに従って、リンク元オブジ
    ェクトを項目文字列部とこの項目文字列が記載されてい
    るページのページ番号文字列部とに分けて抽出するリン
    ク元オブジェクト抽出手段と、 上記索引ページにおける上記各リンク元オブジェクトの
    項目文字列を検索元文字列とし、上記項目文字列に対応
    するページ番号文字列およびこのページ番号文字列が上
    記距離テーブルを参照して置換された誤認識し易い数字
    をリンク先の注目ページ番号とし、上記注目ページ番号
    のページの文字認識結果から上記検索元文字列と同じ文
    字数の文字列を順次切り出して検索先文字列とし、上記
    検索元文字列と検索先文字列との距離を上記距離計算手
    段によって算出し、この算出結果に基づいて索引ページ
    に対するリンク付けを行う索引ページリンク決定手段を
    備えて、 上記画像入力手段から取り込まれた書籍の画像データに
    基づいて、索引の各項目から参照ページへのリンク付け
    を自動的に行うことを特徴とする自動オーサリング装
    置。
  4. 【請求項4】 請求項2に記載の自動オーサリング装置
    において、 上記リンク元オブジェクト抽出手段によって抽出された
    上記索引ページにおける上記各リンク元オブジェクトの
    項目文字列を検索元文字列とし、上記項目文字列に対応
    するページ番号文字列およびこのページ番号文字列が上
    記距離テーブルを参照して置換された誤認識し易い数字
    をリンク先の注目ページ番号とし、上記注目ページ番号
    のページの文字認識結果から上記検索元文字列と同じ文
    字数の文字列を順次切り出して検索先文字列とし、上記
    検索元文字列と検索先文字列との距離を上記距離計算手
    段によって算出し、この算出結果に基づいて索引ページ
    に対するリンク付けを行う索引ページリンク決定手段を
    備えて、 上記画像入力手段から取り込まれた書籍の画像データに
    基づいて、目次あるいは索引の各項目から参照ページへ
    のリンク付けを自動的に行うことを特徴とする自動オー
    サリング装置。
  5. 【請求項5】 請求項2乃至請求項4の何れか一つに記
    載の自動オーサリング装置において、 上記リンク元オブジェクト抽出手段は、 上記リンク元ページ判定手段によって目次ページまたは
    索引ページであると判定されたページの文字認識結果に
    基づいて、各リンク元オブジェクト毎に、上記リンク元
    オブジェクトを構成する項目文字列の配列方向に直交す
    る方向への文字長さのヒストグラムを作成するヒストグ
    ラム作成手段と、 上記ヒストグラムに対して判別分析によって二値化閾値
    を計算する二値化閾値算出手段と、 上記二値化閾値以下の長さを有する文字連なりを上記リ
    ンク元オブジェクトにおける項目文字列とページ番号文
    字列とを分離するセパレータの候補として抽出し、この
    抽出されたセパレータ候補中から上記方向への文字長さ
    の分散が最小となる連続区間を上記セパレータとして抽
    出するセパレータ抽出手段と、 上記リンク元オブジェクトにおける上記抽出されたセパ
    レータの一側を上記項目文字列とする一方、他側を上記
    ページ番号文字列として分離して抽出するオブジェクト
    抽出手段を有していることを特徴とする自動オーサリン
    グ装置。
  6. 【請求項6】 請求項4における上記画像入力手段,距
    離計算手段,領域分割手段,文字認識手段,クラスタリン
    グ手段,書籍構造抽出手段,リンク元ページ判定手段,リ
    ンク元オブジェクト抽出手段,リンク先クラスタ判定手
    段,目次ページリンク決定手段および索引ページリンク
    決定手段として、 コンピュータを機能させて、書籍の画像データに基づい
    て目次あるいは索引の各項目から参照ページへのリンク
    付けを自動的に行う自動オーサリングプログラムが記録
    されていることを特徴とする記録媒体。
JP36033298A 1998-12-18 1998-12-18 自動オーサリング装置および記録媒体 Expired - Fee Related JP3608965B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP36033298A JP3608965B2 (ja) 1998-12-18 1998-12-18 自動オーサリング装置および記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP36033298A JP3608965B2 (ja) 1998-12-18 1998-12-18 自動オーサリング装置および記録媒体

Publications (2)

Publication Number Publication Date
JP2000181931A true JP2000181931A (ja) 2000-06-30
JP3608965B2 JP3608965B2 (ja) 2005-01-12

Family

ID=18468946

Family Applications (1)

Application Number Title Priority Date Filing Date
JP36033298A Expired - Fee Related JP3608965B2 (ja) 1998-12-18 1998-12-18 自動オーサリング装置および記録媒体

Country Status (1)

Country Link
JP (1) JP3608965B2 (ja)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001095199A1 (en) * 2000-04-26 2001-12-13 Kim Nam Chul Self editing personalized electronic book
JP2007213568A (ja) * 2006-01-13 2007-08-23 Brother Ind Ltd データ構造
JP2010503075A (ja) * 2006-08-30 2010-01-28 アマゾン テクノロジーズ,インク. ドキュメントページの自動分類
JP2010086151A (ja) * 2008-09-30 2010-04-15 Brother Ind Ltd データ生成装置、スキャナ、及びコンピュータプログラム
JP2011128924A (ja) * 2009-12-18 2011-06-30 Kddi Corp マンガ画像からテキストを抽出するマンガ画像解析装置、プログラム、検索装置及び方法
JP2011204245A (ja) * 2000-08-17 2011-10-13 E Media Ltd 電子化出版物の表示方法
WO2012169380A1 (ja) * 2011-06-09 2012-12-13 Shindo Tatsuya 文書共有システム
WO2013011896A1 (ja) 2011-07-19 2013-01-24 ソニー株式会社 情報処理装置、情報処理方法、並びにプログラム
CN103714101A (zh) * 2012-10-04 2014-04-09 富士施乐株式会社 信息处理设备及信息处理方法
WO2017009910A1 (ja) * 2015-07-10 2017-01-19 楽天株式会社 電子書籍表示装置、電子書籍表示方法、及びプログラム
JP2020201435A (ja) * 2019-06-12 2020-12-17 株式会社ポニーキャニオン 情報処理端末及び情報処理方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0887528A (ja) * 1995-09-11 1996-04-02 Hitachi Ltd 文書ファイリングシステム
JPH08147314A (ja) * 1994-11-17 1996-06-07 Canon Inc 認識型文書ファイリング装置及びその制御方法
JPH09223240A (ja) * 1996-02-14 1997-08-26 Oki Electric Ind Co Ltd 文書電子化装置
JPH10187751A (ja) * 1996-12-24 1998-07-21 Casio Comput Co Ltd 認識データ処理装置およびそのプログラム記録媒体
JPH10240901A (ja) * 1997-02-21 1998-09-11 Mitsubishi Electric Corp 文書ファイリング装置及び文書ファイリング方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08147314A (ja) * 1994-11-17 1996-06-07 Canon Inc 認識型文書ファイリング装置及びその制御方法
JPH0887528A (ja) * 1995-09-11 1996-04-02 Hitachi Ltd 文書ファイリングシステム
JPH09223240A (ja) * 1996-02-14 1997-08-26 Oki Electric Ind Co Ltd 文書電子化装置
JPH10187751A (ja) * 1996-12-24 1998-07-21 Casio Comput Co Ltd 認識データ処理装置およびそのプログラム記録媒体
JPH10240901A (ja) * 1997-02-21 1998-09-11 Mitsubishi Electric Corp 文書ファイリング装置及び文書ファイリング方法

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001095199A1 (en) * 2000-04-26 2001-12-13 Kim Nam Chul Self editing personalized electronic book
JP2011204245A (ja) * 2000-08-17 2011-10-13 E Media Ltd 電子化出版物の表示方法
JP2007213568A (ja) * 2006-01-13 2007-08-23 Brother Ind Ltd データ構造
JP2013093040A (ja) * 2006-08-30 2013-05-16 Amazon Technologies Inc ドキュメントページの自動分類
JP2010503075A (ja) * 2006-08-30 2010-01-28 アマゾン テクノロジーズ,インク. ドキュメントページの自動分類
JP2010086151A (ja) * 2008-09-30 2010-04-15 Brother Ind Ltd データ生成装置、スキャナ、及びコンピュータプログラム
US8456688B2 (en) 2008-09-30 2013-06-04 Brother Kogyo Kabushiki Kaisha Data generating device, scanner and non-transitory computer readable medium
JP2011128924A (ja) * 2009-12-18 2011-06-30 Kddi Corp マンガ画像からテキストを抽出するマンガ画像解析装置、プログラム、検索装置及び方法
WO2012169380A1 (ja) * 2011-06-09 2012-12-13 Shindo Tatsuya 文書共有システム
JPWO2012169380A1 (ja) * 2011-06-09 2015-02-23 達也 進藤 文書共有システム
WO2013011896A1 (ja) 2011-07-19 2013-01-24 ソニー株式会社 情報処理装置、情報処理方法、並びにプログラム
CN103714101A (zh) * 2012-10-04 2014-04-09 富士施乐株式会社 信息处理设备及信息处理方法
JP2014075029A (ja) * 2012-10-04 2014-04-24 Fuji Xerox Co Ltd 情報処理装置及び情報処理プログラム
US9465986B2 (en) 2012-10-04 2016-10-11 Fuji Xerox Co., Ltd. Information processing apparatus, method, and non-transitory computer readable medium for creating electronic bookmarked information
WO2017009910A1 (ja) * 2015-07-10 2017-01-19 楽天株式会社 電子書籍表示装置、電子書籍表示方法、及びプログラム
JPWO2017009910A1 (ja) * 2015-07-10 2017-07-13 楽天株式会社 電子書籍表示装置、電子書籍表示方法、及びプログラム
US10572759B2 (en) 2015-07-10 2020-02-25 Rakuten, Inc. Image processing device, image processing method, and program
JP2020201435A (ja) * 2019-06-12 2020-12-17 株式会社ポニーキャニオン 情報処理端末及び情報処理方法

Also Published As

Publication number Publication date
JP3608965B2 (ja) 2005-01-12

Similar Documents

Publication Publication Date Title
Giotis et al. A survey of document image word spotting techniques
EP0844583B1 (en) Method and apparatus for character recognition
Chaudhuri et al. A complete printed Bangla OCR system
US7899249B2 (en) Media material analysis of continuing article portions
JP2973944B2 (ja) 文書処理装置および文書処理方法
US6721463B2 (en) Apparatus and method for extracting management information from image
CN102782702B (zh) 在光学字符识别(ocr)过程中的段落识别
KR100412317B1 (ko) 문자인식/수정방법및장치
KR100578188B1 (ko) 문자인식 장치 및 방법
US20090144277A1 (en) Electronic table of contents entry classification and labeling scheme
US10956731B1 (en) Heading identification and classification for a digital document
CN110287784B (zh) 一种年报文本结构识别方法
JP4991407B2 (ja) 情報処理装置、その制御プログラムおよび該制御プログラムを記録したコンピュータ読み取り可能な記録媒体、ならびに制御方法
Clausner et al. ICDAR2019 competition on recognition of early Indian printed documents–REID2019
Ataer et al. Matching ottoman words: an image retrieval approach to historical document indexing
JP3608965B2 (ja) 自動オーサリング装置および記録媒体
JP2007122403A (ja) 文書タイトルおよび関連情報の自動抽出装置、抽出方法および抽出プログラム
CN111276149A (zh) 语音识别方法、装置、设备及可读存储介质
Ghosh et al. R-PHOC: segmentation-free word spotting using CNN
JP3917349B2 (ja) 文字認識結果を利用して情報を検索する検索装置および方法
US20010043742A1 (en) Communication document detector
CN116822634A (zh) 一种基于布局感知提示的文档视觉语言推理方法
JP3787377B2 (ja) 文書方向判定方法及び装置及び文字認識方法及び装置
WO1999041681A1 (fr) Procede d'analyse de structure d'image de document
Kassis et al. Automatic synthesis of historical arabic text for word-spotting

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20041005

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20041012

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071022

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081022

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081022

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091022

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091022

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101022

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111022

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121022

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees