JP6731011B2 - 電子図書の表示用データの作成装置 - Google Patents

電子図書の表示用データの作成装置 Download PDF

Info

Publication number
JP6731011B2
JP6731011B2 JP2018031282A JP2018031282A JP6731011B2 JP 6731011 B2 JP6731011 B2 JP 6731011B2 JP 2018031282 A JP2018031282 A JP 2018031282A JP 2018031282 A JP2018031282 A JP 2018031282A JP 6731011 B2 JP6731011 B2 JP 6731011B2
Authority
JP
Japan
Prior art keywords
data
line number
area
character
page
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018031282A
Other languages
English (en)
Other versions
JP2019145038A (ja
Inventor
恭子 古澤
恭子 古澤
友紀 小平
友紀 小平
佑介 田代
佑介 田代
龍 飛田
龍 飛田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shinano Kenshi Co Ltd
Original Assignee
Shinano Kenshi Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shinano Kenshi Co Ltd filed Critical Shinano Kenshi Co Ltd
Priority to JP2018031282A priority Critical patent/JP6731011B2/ja
Publication of JP2019145038A publication Critical patent/JP2019145038A/ja
Application granted granted Critical
Publication of JP6731011B2 publication Critical patent/JP6731011B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)
  • Processing Or Creating Images (AREA)

Description

本発明は電子図書の表示用データの作成装置に関し、より詳細には、オリジナル文書データである紙媒体の図書(以下、紙図書という)や文書の電子データを電子図書データ化する際において生成される電子図書の表示用データに自動的にページ番号と行番号を付与することが可能な電子図書の表示用データの作成装置に関する。
電子データとして予め記憶されている電子図書を音声として再生する装置が従来から知られている(例えば、特許文献1(特開2000−57752号公報)参照)。この特許文献1に開示されている装置は、DAISY(Digital Accessible Information SYstem)規格によるデジタル録音図書を再生する装置であり、特に視覚に障害がある人たちが読書を楽しむことが出来るように、本に記載されている文章情報を音声として読み上げることができる装置である。
また、音声再生できる装置に表示部を設け、表示部にはテキストを表示させる装置も従来から知られている(例えば、特許文献2(特開2004−170444号公報)参照)。この特許文献2に開示されている装置は、特に英会話の練習用に用いられる装置であって、表示部には英文のテキストデータが表示され、スピーカからは表示部に表示されている英文の音声データが再生される。特許文献2に開示されている装置では、再生する音声データと表示部に表示させているテキストデータとを同期させ、現在再生中の音声データに該当するテキスト位置を対応付けすることが可能になる。
特開2000−57752号公報 特開2004−170444号公報
特許文献1,2における電子図書の表示再生装置で用いられる電子図書は、フォントの大きさを可変したり、予め設定された位置情報を利用して特定の位置に移動したり再生を開始することができるため、紙の文字の読みに困難を持つ児童生徒への情報保障としても有効性が認められている。一方で、電子図書のフォントサイズを変更すると、オリジナルデータである紙図書や電子図書で使用可能なデータ形式にする前の元々の文書の電子データでの見た目(レイアウト)と電子図書の表示再生装置上での見た目が異なる場合がある。そのため、紙図書や元々の文書の電子データにおける文字位置と表示再生装置での文字位置が簡単に把握できるように、電子図書の表示用データにはページや行番号等の位置情報を含ませることが重要となる。
しかしながら、現状の電子図書の表示用データにおけるページ番号や行番号等の位置情報の設定は、紙図書から本文文字データを抽出した後、手作業で本文文字データ内に追加設定されている。このため、電子図書の表示用データの製作者に多大な作業負荷を負わせてしまうといった課題がある。
そこで本発明は、オリジナル文書データである紙図書や文書の電子データを電子図書の表示用データに変換する際において、ページ番号や行番号を自動的に付与することが可能な電子図書の表示用データの作成装置の提供を目的としている。
すなわち本発明は、オリジナル文書データの特定ページを電子図書装置に表示するための電子図書の表示用データ作成装置であって、前記オリジナル文書データの前記特定ページを電子データ化したオリジナル文書特定ページ電子化データにおけるレイアウトから、本文領域とページ番号領域とをそれぞれ抽出する領域抽出手段と、前記領域抽出手段により抽出された各領域における文字データを抽出すると共に、前記オリジナル文書特定ページ電子化データ内における各文字データの平面座標データを抽出する文字データ抽出手段と、前記文字データ抽出手段により前記ページ番号領域から抽出された文字データをページ番号データとし、前記文字データ抽出手段により前記本文領域から抽出された本文文字データの所定位置に前記ページ番号データを付与するページ番号データ付与手段と、前記平面座標データの一方の座標値が所定の範囲内にある前記本文文字データを同一行番号グループとし、前記同一行番号グループの各々に対し前記本文領域の始点側から順番に行番号データを付与する行番号データ付与手段と、前記本文文字データをフレーズ毎に分割し分割フレーズを生成するフレーズ分割手段と、を具備し、前記行番号データ付与手段は、前記同一行番号グループの先頭位置に前記分割フレーズの始点位置または終点位置が存在しない場合には、前記同一行番号グループの先頭位置の直近位置における前記分割フレーズの前記始点位置または前記終点位置に前記行番号データを付与することを特徴とする電子図書の表示用データ作成装置である。
これにより、オリジナル文書データである紙図書や文書の電子データの特定ページを電子図書装置に表示するための電子図書の表示用データに変換する際において、本文文字データにページ番号と行番号を自動的に付与することが可能になる。また、電子図書の表示用データを用いて特定の行番号にジャンプさせた際は必ずフレーズの区切れ位置を指定することができる。よって、電子図書装置において行番号を指定してジャンプさせた際には、文章の意味が把握し易く、読み出し位置が分かり易い電子図書の表示用データを提供することができる。
また、前記領域抽出手段は、前記オリジナル文書特定ページ電子化データ内における前記平面座標データおよび前記オリジナル文書特定ページ電子化データ内における前記文字データの大きさの少なくとも一方の情報に基づいて、前記本文領域と前記ページ番号領域との識別を行っていることが好ましい。
これにより、オリジナル文書特定ページ電子化データ内から本文文字データとページ番号データとを混合させることなく適切に抽出することが可能になる。
また、オリジナル文書データの特定ページを電子図書装置に表示するための電子図書の表示用データ作成装置であって、前記オリジナル文書データの前記特定ページを電子データ化したオリジナル文書特定ページ電子化データにおけるレイアウトから、本文領域とページ番号領域と行番号領域とをそれぞれ抽出する領域抽出手段と、前記領域抽出手段により抽出された各領域における文字データを抽出すると共に、前記オリジナル文書特定ページ電子化データ内における各文字データの平面座標データを抽出する文字データ抽出手段と、前記文字データ抽出手段により前記ページ番号領域から抽出された文字データをページ番号データとし、前記文字データ抽出手段により前記本文領域から抽出された本文文字データの所定位置に前記ページ番号データを付与するページ番号データ付与手段と、前記文字データ抽出手段により前記行番号領域から抽出された文字データを行番号データとし、前記行番号データの前記平面座標データと前記本文文字データの前記平面座標データが所定条件を満たす場合、前記本文文字データに、前記行番号データを対応させて付与する行番号データ付与手段と、を具備することを特徴とする電子図書の表示用データ作成装置とすることもできる。
これにより、オリジナル文書データである紙図書や文書の電子データの特定ページを電子図書装置に表示するための電子図書の表示用データに変換する際において、本文文字データにページ番号と行番号を自動的に付与することが可能になる。
また、前記領域抽出手段は、前記オリジナル文書特定ページ電子化データ内における前記平面座標データおよび前記オリジナル文書特定ページ電子化データ内における前記文字データの大きさの少なくとも一方の情報に基づいて、前記本文領域と前記ページ番号領域と前記行番号領域の識別を行っていることが好ましい。
これにより、オリジナル文書特定ページ電子化データ内から本文文字データとページ番号データと行番号データを混合させることなく適切に抽出することが可能になる。
また、前記本文文字データをフレーズ毎に分割し分割フレーズを生成するフレーズ分割手段をさらに備え、前記行番号データ付与手段は、前記行番号データの前記平面座標データと前記本文文字データの前記平面座標データとが所定条件を満たす位置の先頭位置に前記分割フレーズの始点位置または終点位置が存在しない場合には、前記行番号データの前記平面座標データと前記本文文字データの前記平面座標データとが所定条件を満たす位置の先頭位置の直近位置における前記分割フレーズの前記始点位置または前記終点位置に前記行番号データを付与することが好ましい。
これにより、電子図書の表示用データを用いて特定の行番号にジャンプさせた際は必ずフレーズの区切れ位置を指定することができる。よって、電子図書装置において行番号を指定してジャンプさせた際には、文章の意味が把握し易く、読み出し位置が分かり易い電子図書の表示用データを提供することができる。
本発明における電子図書の表示用データ作成装置の構成によれば、オリジナル文書データである紙図書や文書の電子データを電子図書の表示用データに変換する際において、本文文字データにページ番号と行番号を自動的に付与することが可能になる。これにより電子図書の表示用データの作成者における作業負荷を大幅に軽減することができ、使い勝手が良好な電子図書の表示用データを安価に提供することができる。
オリジナル文書データである紙図書の特定ページを電子データ化したオリジナル文書特定ページ電子化データの一例である。 本実施形態における電子図書の表示用データ作成装置の概略構成図である。 本実施形態における電子図書の表示用データ作成方法の概略処理フロー図である。 本実施形態で得られた電子図書の表示用データの一例である。 図4の本文文字データをフレーズ毎に分割した状態を示す説明図である。 分割フレーズの配置状態に応じて行番号位置の一部に変更が生じた状態を示す説明図である。 オリジナル文書データである紙図書の特定ページを電子データ化したオリジナル文書特定ページ電子化データの変形例である。
本発明における電子図書の表示用データ作成装置について実施形態に基づいて説明する。本発明は、図1に示すようなオリジナル文書特定ページ電子化データOTDを用いてオリジナル文書データである紙図書や文書の電子データにおける表示内容を電子図書の表示用データに変換する際において、本文文字データにページ番号や行番号を自動的に付与することを可能にするものである。
(第1実施形態)
本実施形態で用いられる電子図書の表示用データ作成装置100は、図2に示すように、領域抽出手段10と、文字データ抽出手段20と、ページ番号データ付与手段30と、行番号データ付与手段40と、フレーズ分割手段50とを具備している。このような電子図書の表示用データ作成装置100は、データ入力手段60とデータ出力手段62と記憶部70と動作制御部80とを有するパーソナルコンピュータ90において、記憶部70に動作制御プログラムPGMを実装させることにより実現できる。
領域抽出手段10は、図1に示すようなオリジナル文書データとしての紙図書の特定ページを電子データ化したオリジナル文書特定ページ電子化データOTDにおけるOCR(Optical Character Recognition/Reader)機能によるレイアウト解析を実行し、本文領域HRとページ番号領域PRとをそれぞれ抽出するものである。図1に示すように本実施形態におけるオリジナル文書特定ページ電子化データOTDには行番号が記載されていない。なお、本実施形態におけるオリジナル文書特定ページ電子化データOTDには紙図書の特定ページをスキャンして得たPDFデータを用いた。
領域抽出手段10は、データ出力手段62としてのモニタに出力させた紙図書の特定ページのPDFデータに含まれている文字サイズデータや文字の配置位置データに基づき、予め設定されている識別条件と比較することにより本文領域HRとページ番号領域PRとを識別(区別)して抽出している。ここでは識別条件として、文字サイズデータおよび各文字データのPDFデータ内における平面座標データ(PDFデータ内における文字データの位置データ)を用いているが、いずれか一方のみを識別条件として用いるようにしてもよい。なお、本実施形態においては、オリジナル文書特定ページ電子化データOTDとしてのPDFデータにおける横方向(データ出力手段62であるモニタにデフォルト状態で表示した状態における横方向)をx軸方向としPDFデータにおける縦方向をy軸方向として、それぞれの座標値をPDFデータ内における平面座標データとして用いている。
本実施形態における領域抽出手段10は、PDFデータのレイアウト解析を行った際において、文字サイズデータが含まれず、PDFデータ内における平面座標データのみを含むデータ領域を画像領域GRとして抽出している。
また、電子図書の表示用データ作成者がデータ入力手段60としてのマウスおよびキーボードを用いて手動操作により特定領域を本文領域HR、ページ番号領域PR、画像領域GRとして個別に指定することもできる。この場合、領域抽出手段10はデータ入力手段60により実現されていることになる。このように領域抽出手段10は自動抽出処理と手動抽出処理のいずれの抽出処理も行うことができるのである。
文字データ抽出手段20は、領域抽出手段10により抽出された本文領域HRおよびページ番号領域PRにおける文字データの抽出を行うものである。本文領域HRおよびページ番号領域PRからの文字データの抽出処理はOCR機能による文字認識処理を用いることができる。文字データ抽出手段20により本文領域HRおよびページ番号領域PRから文字データの抽出を行う際には、オリジナル文書特定ページ電子化データOTD内としてのPDFデータにおける平面座標データ(以下、単にPDFデータ内における平面座標データという)も同時に抽出されることになる。このように文字データ抽出手段20により抽出された文字データはテキストデータと平面座標データを有することになる。
文字データ抽出手段20は、本文領域HRから抽出した文字データを本文文字データHMDとして記憶部70に記憶させる。文字データ抽出手段20は、画像領域GR内に文字データが含まれている場合においては、画像領域GR内から抽出した文字データを各文字データのPDFデータ内における平面座標データと共に画像内文字データGMDとして画像データGDに紐付けした状態で記憶部70に記憶させることもできる。なお、画像データGDの抽出は、画像データ抽出手段としての動作制御部80が画像領域GRから抽出することができる。抽出された画像データGDは、PDFデータ内における平面座標データが紐付けられた状態で記憶部70に記憶される。
ページ番号データ付与手段30は、文字データ抽出手段20によりページ番号領域PRから抽出された文字データをページ番号データPBDとし、本文文字データHMDの所定位置にページ番号データPBDを付与する。ここでは、本文文字データHMDの先頭位置にページ番号データPBDを付与しているが、本文文字データHMDの末尾位置にページ番号データPBDを付与してもよい。
行番号データ付与手段40は、本文文字データHMDにおけるPDFデータ内における平面座標データの一方の座標値(x座標値またはy座標値)が同値またはその値を中心とする所定の範囲内にある単数または複数の本文文字データHMDを同一行番号グループGBGとし、同一行番号グループGBGの各々に対し本文領域HRの始点側から順番に行番号データGBDを付与する。ここでは行番号データGBDは同一行番号グループGBGの先頭位置に配置した。
行番号データ付与手段40はOCR機能における行の切り出し処理により同一行番号グループGBGを設定し、本文領域HRから切り出した行の配列状態から行番号データGBDを付与する処理を実行させてもよい。本実施形態における行番号データ付与手段40は、行番号データを5の倍数としているが、1からの自然数でそれぞれの同一行番号グループGBGに行番号データGBDを付与するようにすることもできる。
フレーズ分割手段50は、本文文字データHMDをフレーズ毎に分割し、分割フレーズBFを生成するものである。ここでフレーズとは、文あるいは節を統語論的に分析した際の単位を指すものである。具体的には、接置詞句、名詞句、動詞句、形容詞句(連体詞句)、副詞句を示すことができる。
フレーズ分割手段50により分割フレーズBFが生成された場合、行番号データ付与手段40は、同一行番号グループGBGの先頭位置に分割フレーズBFの始点位置または終点位置が存在しない場合には、同一行番号グループGBGの先頭位置の直近位置における分割フレーズBFの始点位置または終点位置に行番号データGBDを付与するようにしてもよい。このような形態により、オリジナル文書特定ページ電子化データOTDにおけるレイアウトに対して行番号やページ番号のレイアウトが相違する場合があるが、ページ番号データPBDまたは行番号データGBDへジャンプ(ランダムアクセス)した場合において、文の意味が把握し易くなる。また、音読する際においても読み易くすることができる点において好都合である
以上に説明した領域抽出手段10、文字データ抽出手段20、ページ番号データ付与手段30、行番号データ付与手段40、フレーズ分割手段50は、記憶部70に予め記憶されている動作制御プログラムPGMに基づいて動作制御部80(例えばパーソナルコンピュータ90のCPU)によってそれぞれ実現することもできる。
次に、第1実施形態における電子図書の表示用データ作成装置100を用いた電子図書の表示用データ作成方法について図3に基づきながら説明する。
まず、電子図書の表示用データ作成装置100が実装されているパーソナルコンピュータ90において動作制御部80が、オリジナル文書特定ページ電子化データOTDであるPDFデータをデータ出力手段62であるモニタに出力させる。次に、領域抽出手段10としての動作制御部80が、モニタに出力されたPDFデータにOCR機能のレイアウト解析処理を実行し、本文領域HRおよびページ番号領域PRと画像領域GRを抽出する(領域抽出工程)。このような本文領域HRおよびページ番号領域PRと画像領域GRを抽出する処理工程は、電子図書の表示用データの作成者がデータ入力手段60であるマウスおよびキーボードを操作し、作成者がPDFデータ内から手動操作によって本文領域HRおよびページ番号領域PRと画像領域GRを直接抽出するようにしてもよい。
次に、文字データ抽出手段20としての動作制御部80が、領域抽出手段10により抽出された本文領域HRおよびページ番号領域PRから文字データを抽出すると共に、抽出した文字データにおけるPDFデータ内における平面座標データを抽出する(文字データ抽出工程)。このような文字データ抽出工程は、OCR機能により実現することができるため、ここでの詳細な説明は省略する。抽出された文字データは、文字サイズデータとPDFデータ内における平面座標データが紐付けされた状態で記憶部70に記憶される。このとき、本文領域HRから抽出された文字データは本文文字データHMDとして、ページ番号領域PRから抽出された文字データはページ番号データとして記憶部70に記憶される(文字データ抽出工程)。
なお、領域抽出工程において画像領域GRが抽出された場合には、動作制御部80が画像領域GRから画像データGDを抽出し、PDFデータ内における平面座標データと紐付けした状態で記憶部70に記憶させる画像抽出工程を追加すればよい。そして、画像抽出工程が行われた場合には、文字データ抽出手段20としての動作制御部80が、画像データGD内の文字データの有無を判断させると共に文字データが含まれている場合には、画像内文字データGMDとして抽出すると共に、画像データGDおよび画像データGDの平面座標データと紐付けした状態で記憶部70に記憶させる画像内文字データ抽出工程をさらに追加することもできる。
動作制御部80は記憶部70に記憶された文字データのうち、紐付けされている文字サイズが他の文字データに紐付けされている文字サイズよりも小さいものをページ番号データPBDとして記憶部70に記憶させてもよい。また、文字データに紐付けされているPDFデータ内における平面座標データのx座標値またはy座標値と、他の文字データに紐付けされているPDFデータ内における平面座標データのx座標値またはy座標値との差が予め設定されている値以上になった場合、文字データに紐付けされているPDFデータ内における平面座標データのx座標値がPDFデータ内における右端位置およびその付近、中央位置およびその付近、左端位置及びその付近の値である場合、文字データに紐付けされているPDFデータ内における平面座標データのx座標値の範囲が予め設定されている範囲内である場合のいずれかに該当したとき、その文字データをページ番号データPBDとして記憶部70に記憶させるようにしてもよい。ここで、『その付近』とは、基準となる値に対して予め設定された値の範囲内となる位置を意味するものである(以下同様)。
さらには、これらの識別処理を組み合わせてページ番号データPBDとして記憶部70に記憶させるようにしてもよい。このとき、画像内文字データGMDについては文字サイズや文字データに紐付けされているPDFデータ内における平面座標データの比較対象から外すこともできる。以上のような文字データ抽出工程を採用することにより、領域抽出工程において本文領域HRとページ番号領域PRとを区別する処理を省略することも可能である。
次にページ番号データ付与手段30としての動作制御部80が、文字データ抽出工程において記憶部70に記憶されたページ番号データPBDをPDFデータ内における本文文字データHMDの所定位置に付与する(ページ番号データ付与工程)。ここでは、PDFデータ内における本文文字データHMDのヘッダー位置にページ番号データPBDを付与した。
次に行番号データ付与手段40としての動作制御部80が、記憶部70に記憶されている本文文字データHMDのPDFデータ内における平面座標データのうちx座標値またはy座標値が同値またはその値を中心とする所定の範囲内にある本文文字データHMDを同一行番号グループGBGとして記憶部70に記憶させる。PDFデータ内において行の切り出し処理により切り出された行がx方向に伸びる(横書き)ものであればx座標値を比較し、切り出された行がy方向に伸びる(縦書き)ものであればy座標値を比較すればよい。このようにしてPDFデータ内における平面座標データに基づいて判断された同一行番号グループGBGの各々に対しては、本文領域HRの始点側から順番に行番号データGBDが付与される(行番号データ付与工程)。
また、動作制御部80は、記憶部70に記憶されている画像データGDを画像データGDに紐付けされている平面座標データと共に読み出し、本文文字データHMDの所定位置に埋め込む画像埋め込み工程を追加することもできる。
以上の手順を実行することにより、オリジナルデータであるPDFデータ(オリジナル文書特定ページ電子化データOTD)のレイアウトが忠実に維持され、行番号データGBDが付与された図4に示すような電子図書の表示用データDHDを得ることができる。このようにして得られた電子図書の表示用データDHDは、HTML形式またはXML形式に則ったテキストデータとして記憶部70に記憶される。
なお、フレーズ分割手段50としての動作制御部80は、記憶部70に記憶されているそれぞれの本文文字データHMDをフレーズ毎に分割して分割フレーズBFを生成する処理(フレーズ分割工程)をページ番号付与工程と行番号データ付与工程との間に実行することもできる。図5は図4に示した電子図書の表示用データDHDの本文文字データHMDを分割フレーズBF毎に区切った状態を示す説明図である。なお、図5中における分割フレーズBFのそれぞれに付されている番号は、このPDFデータ(オリジナル文書特定ページ電子化データOTD)内における本文文字データHMDにおける分割フレーズBFの先頭側からの通し番号である。
本文文字データHMDが分割フレーズBFに分割された場合の行番号データ付与工程は、同一行番号グループGBGの先頭位置における分割フレーズBFの始点位置または終点位置が存在しないとき、同一行番号グループGBGの先頭位置の直近位置における分割フレーズBFの始点位置または終点位置に行番号データGBDを付与する処理を実行する。
このようなフレーズ分割処理工程を経た後に行番号データ付与工程を実行して得られた電子図書の表示用データDHDを図6に示す。図6に示されている電子図書の表示用データDHDは、オリジナルデータであるPDFデータのレイアウトとはわずかに異なる(図5のレイアウトに対して行番号データGBDの5と15の位置における分割フレーズBFの位置が異なる)ことがある。しかしながら、この電子図書の表示用データDHDを適用した電子図書の表示装置において行番号を指定してジャンプをした場合、文章の意味合いの把握や文章の読みを行う際に区切れの良い(読み易い)位置にすることができる点で好都合である。
動作制御部80は、記憶部70に記憶された図4または図6に示すテキストデータに基づいて最終的な電子図書の表示用データDHDであるDAISY図書データを生成して、紙図書の特定ページにおける電子図書の表示用データDHDの生成処理を終了する。
(第2実施形態)
本実施形態における電子図書の表示用データ作成装置100の基本構成は第1実施形態と同様である。本実施形態の電子図書の表示用データ作成装置100においては、領域抽出手段10と行番号データ付与手段40によるデータの取り扱い内容(データ処理内容)が異なるが、他の構成については第1実施形態におけるデータの取り扱い内容と同様であるため、ここでの詳細な説明は省略する。
本実施形態における領域抽出手段10は、図7に示すように本文領域HRおよびページ番号領域PRと画像領域GRに加えて行番号領域LRも自動抽出する点で第1実施形態と構成を異にしている。このような構成は、図7に示すような紙図書の特定ページを電子データ化したオリジナル文書特定ページ電子化データOTDに行番号が付与されている場合において好都合である。なお、本実施形態においても、オリジナル文書特定ページ電子化データOTDとしてPDFデータを用いた形態に基づいて説明をおこなうものとする。
領域抽出手段10は、オリジナルデータであるPDFデータのレイアウト解析をすることにより、本文領域HRおよびページ番号領域PRと画像領域GRと行番号領域LRをそれぞれ抽出することができる。本文領域HRの抽出は、領域の範囲(平面座標データの最大値と最小値の差)が大きく文字サイズも大きい領域を検索することにより抽出することができる。ページ番号領域PRは、文字サイズが小さく、PDFデータ内における平面座標データの範囲が小さく(予め設定した平面座標データの範囲内に含まれ)、かつ、平面座標データの全範囲の角部分(x座標値とy座標値が最大値付近、x座標値が最大値付近かつy座標値が最小値付近、x座標値が最小値付近かつy座標値が最大値付近、x座標値とy座標値が最小値付近のいずれか)または上下の中央部分(x座標値が全x座標値の平均値またはその付近でy座標値が最大値付近または最小値付近)のみにある領域を検索することにより抽出することができる(本文領域HRが横書きレイアウトである場合)。
行番号領域LRの抽出は、文字サイズが小さく、PDFデータにおける平面座標データのうちx座標値が同値またはその値を中心とする所定の範囲内にあって、y座標値が一定間隔になっている複数の領域を検索することにより自動抽出をすることができる。または、第1実施形態と同様に、表示用データの作成者がマウスやキーボードを用いて本文領域HRおよびページ番号領域PRと行番号領域LRを各々指定することも可能である。
本実施形態における行番号データ付与手段40は、行番号領域LRから抽出した文字データ(数字)を行番号データGBDとして用いる点で第1実施形態とデータの取り扱い内容が異なる。本実施形態における行番号データ付与手段40は、行番号データGBDにおける平面座標データのy座標値と同値またはその値を中心とする所定の範囲内のy座標値を有する(行番号データGBDの平面座標データと本文文字データHMDの平面座標データとが所定条件を満たす)本文文字データHMDに対して行番号データGBDを付与するものである。
行番号データ付与手段40は、連続している複数の本文文字データHMDを分断し、行番号データGBDの付与対象となる本文文字データHMDの先頭位置(平面座標データのy座標値が同値またはその値を中心とする所定の範囲内にある本文文字データHMDのうち平面座標データのx座標値が最も小さい本文文字データHMD)の直前位置に行番号データGBDを埋め込む処理を実行する。
また、本実施形態における行番号データ付与手段40は、第1実施形態と同様にしてOCR機能における行の切り出し処理により同一行番号グループGBGを設定し、同一行番号グループGBGのy座標値と同値またはその値を中心とする所定の範囲内のy座標値を有する同一行番号グループGBGに、行番号領域LRから抽出した行番号データGBDを付与する処理を行ってもよい。
また行番号データ付与手段40は、同じくOCR機能における行の切り出し処理により同一行番号グループGBGを設定し、本文領域HRから切り出した行の配列状態から行番号データGBDを追加付与する処理を実行させてもよい。これにより、行番号領域LRから抽出された行番号データGBDが5の倍数のみである場合等においても、電子図書の表示用データDHDには1からの自然数で行番号データGBDを付与することもできる。
次に、第2実施形態における電子図書の表示用データ作成装置100を用いた電子図書の表示用データ作成方法について説明する。
まず、第1実施形態と同様に、電子図書の表示用データ作成装置100が実装されているパーソナルコンピュータ90において動作制御部80が、オリジナル文書特定ページ電子化データOTDであるPDFデータをデータ出力手段62であるモニタに出力させる。次に、領域抽出手段10としての動作制御部80が、モニタに出力されたPDFデータにOCR機能のレイアウト解析処理を実行し、本文領域HRおよびページ番号領域PRと画像領域GRと行番号領域LRをそれぞれ抽出する(領域抽出工程)。このような本文領域HRおよびページ番号領域PRと画像領域GRと行番号領域LRを抽出する処理工程は、電子図書の表示用データの作成者がデータ入力手段60であるマウスおよびキーボードを操作し、作成者がPDFデータ内から手動操作によって本文領域HRおよびページ番号領域PRと行番号領域LRを直接抽出するようにしてもよい。
次に、文字データ抽出手段20としての動作制御部80が、領域抽出手段10により抽出された本文領域HRおよびページ番号領域PRと画像領域GRと行番号領域LRから文字データを抽出すると共に、抽出した文字データにおけるPDFデータ内における平面座標データを抽出する(文字データ抽出工程)。このような文字データ抽出工程は、OCR機能により実現することができるため、ここでの詳細な説明は省略する。ここでのPDFデータ内における平面座標データの構成は第1実施形態と同様である。抽出された文字データは、文字サイズデータとPDFデータ内における平面座標データが紐付けされた状態で記憶部70に記憶される。このとき、本文領域HRから抽出された文字データは本文文字データHMDとして、ページ番号領域PRから抽出された文字データはページ番号データPBDとして、画像領域GRから抽出された文字データは画像内文字データGMDとして、行番号領域LRから抽出された文字データは行番号データGBDとしてそれぞれ記憶部70に記憶される(文字データ抽出工程)。
本文領域HRと行番号領域LRとの位置が近接している場合、動作制御部80は、本文文字データHMDと行番号データGBDとの文字サイズデータおよび平面座標データのうちの少なくとも一方に基づいて両者のデータを識別することができる。
具体的には、本文領域HRは、平面座標データの範囲(平面座標データの最大値と最小値の差)が大きく文字サイズも大きい領域とすることができる。また、ページ番号領域PRは、文字サイズが小さく、PDFデータ内における平面座標データの範囲が小さく(予め設定した範囲内に含まれ)、かつ、平面座標データの全範囲の角部分(x座標値とy座標値が最大値付近、x座標値が最大値付近かつy座標値が最小値付近、z座標値が最小値付近かつy座標値が最大値付近、x座標値とy座標値が最小値付近のいずれか)のみにある領域とすることができる。そして、行番号領域LRは、文字サイズが小さく、PDFデータにおける平面座標データのうちx座標値が同値またはその値を中心とする所定の範囲内にあって、y座標値が一定間隔になっている複数の領域(横書きレイアウトの場合)とすることができる。このような識別方法は、特に本文文字データHMDにおけるルビと行番号データGBDのデータ混合を防止することができる点において好都合である。
次にページ番号データ付与手段30としての動作制御部80が、文字データ抽出工程において記憶部70に記憶されたページ番号データPBDをPDFデータ内における本文文字データHMDの所定位置に付与する(ページ番号データ付与工程)。ここでは、PDFデータ内における本文文字データHMDのヘッダー位置にページ番号データPBDを付与した。
また、動作制御部80は、記憶部70に記憶されている画像データGDを画像データGDに紐付けされている平面座標データと共に読み出し、本文文字データHMDの所定位置に埋め込む画像埋め込み工程を追加することもできる。
次に行番号データ付与手段40としての動作制御部80が、記憶部70に記憶されている本文文字データHMDのPDFデータ内における平面座標データのうちx座標値またはy座標値が同値またはその値を中心とする所定の範囲内にある本文文字データHMDを同一行番号グループGBGとして記憶部70に記憶させる。PDFデータ内において行の切り出し処理により切り出された行がx方向に伸びる(横書き)ものであればx座標値を比較し、切り出された行がy方向に伸びる(縦書き)ものであればy座標値を比較すればよい。このようにしてPDFデータ内における平面座標データに基づいて判断された同一行番号グループGBGの各々に対しては、記憶部70に記憶されている行番号データGBDのy座標値との比較を行い、両者のy座標値が同値またはその値を中心とする所定の範囲内となった同一行番号グループGBGの先頭位置に対して行番号データGBDが付与される(行番号データ付与工程)。
以上により、オリジナルデータであるPDFデータ(オリジナル文書特定ページ電子化データ)のレイアウトが忠実に維持された図4に示すような電子図書の表示用データDHDを得ることができる。このようにして得られた電子図書の表示用データDHDは記憶部70に記憶される。なお、必要に応じて第1実施形態と同様に、ページ番号付与工程の後にフレーズ分割工程を経てから行番号データ付与工程を実行し、図6に示すような電子図書の表示用データDHDを得てもよい。
以上の実施形態における電子図書の表示用データ作成装置100および電子図書の表示用データ作成方法においては、紙図書の特定ページを電子データ化したオリジナル文書特定ページ電子化データOTDとしてPDFデータを用いているが、この形態に限定されるものではない。例えば、いわゆる紙データをスキャンして得たものではなく、当初からのPDFデータ等に代表されるような、文字情報と位置情報が含まれる文書データである電子データを用いることも可能である。
また以上の実施形態においては、オリジナル文書特定ページ電子化データOTDが横書きレイアウトである形態について説明しているが、縦書きレイアウトや、横書きレイアウトと縦書きレイアウトの混合レイアウトについても同様に対応することができる。縦書きレイアウトに対する平面座標データの取り扱いは、本実施形態における横書きレイアウトに対するデータ処理の説明部分におけるx座標値の比較をy座標値の比較に入れ替えると共に、y座標値の比較をx座標値の比較に入れ替えてPDFデータ内における平面座標データとの比較をすればよい。
また、第2実施形態における行番号データ付与手段40は、フレーズ分割手段50を有する場合において、連続している複数の本文文字データHMDを分断し、行番号データGBDの付与対象となる本文文字データHMDの先頭位置(平面座標データのy座標値が同値またはその値を中心とする所定の範囲内にある本文文字データHMDのうち平面座標データのx座標値が最も小さい本文文字データHMD)の直前位置に行番号データGBDを埋め込んでいるが、直後位置に行番号データGBDを埋め込むようにしてもよい。要は、同一行番号グループGBGの先頭位置に分割フレーズBFの始点位置または終点位置が存在しない場合には、同一行番号グループGBGの先頭位置の直近位置における分割フレーズBFの始点位置または終点位置に行番号データGBDを付与すればよいのである。
さらには、以上の実施形態における構成に対し、明細書中に記載されている変形例や、他の公知の構成を適宜組み合わせた形態を採用することもできる。
10 領域抽出手段
20 文字データ抽出手段
30 ページ番号データ付与手段
40 行番号データ付与手段
50 フレーズ分割手段
60 データ入力手段
62 データ出力手段
70 記憶部
80 動作制御部
90 パーソナルコンピュータ
100 電子図書の表示用データ作成装置
OTD オリジナル文書特定ページ電子化データ
PGM 動作制御プログラム
HR 本文領域
PR ページ番号領域
GR 画像領域
HMD 本文文字データ
GMD 画像内文字データ
PBD ページ番号データ
GBG 同一行番号グループ
GBD 行番号データ
BF 分割フレーズ
GD 画像データ
DHD 電子図書の表示用データ
LR 行番号領域

Claims (5)

  1. オリジナル文書データの特定ページを電子図書装置に表示するための電子図書の表示用データ作成装置であって、
    前記オリジナル文書データの前記特定ページを電子データ化したオリジナル文書特定ページ電子化データにおけるレイアウトから、本文領域とページ番号領域とをそれぞれ抽出する領域抽出手段と、
    前記領域抽出手段により抽出された各領域における文字データを抽出すると共に、前記オリジナル文書特定ページ電子化データ内における各文字データの平面座標データを抽出する文字データ抽出手段と、
    前記文字データ抽出手段により前記ページ番号領域から抽出された文字データをページ番号データとし、前記文字データ抽出手段により前記本文領域から抽出された本文文字データの所定位置に前記ページ番号データを付与するページ番号データ付与手段と、
    前記平面座標データの一方の座標値が所定の範囲内にある前記本文文字データを同一行番号グループとし、前記同一行番号グループの各々に対し前記本文領域の始点側から順番に行番号データを付与する行番号データ付与手段と、
    前記本文文字データをフレーズ毎に分割し分割フレーズを生成するフレーズ分割手段と、
    を具備し、
    前記行番号データ付与手段は、
    前記同一行番号グループの先頭位置に前記分割フレーズの始点位置または終点位置が存在しない場合には、前記同一行番号グループの先頭位置の直近位置における前記分割フレーズの前記始点位置または前記終点位置に前記行番号データを付与することを特徴とする電子図書の表示用データ作成装置。
  2. 前記領域抽出手段は、
    前記オリジナル文書特定ページ電子化データ内における前記平面座標データおよび前記オリジナル文書特定ページ電子化データ内における前記文字データの大きさの少なくとも一方の情報に基づいて、前記本文領域と前記ページ番号領域との識別を行っていることを特徴とする請求項1記載の電子図書の表示用データ作成装置。
  3. オリジナル文書データの特定ページを電子図書装置に表示するための電子図書の表示用データ作成装置であって、
    前記オリジナル文書データの前記特定ページを電子データ化したオリジナル文書特定ページ電子化データにおけるレイアウトから、本文領域とページ番号領域と行番号領域とをそれぞれ抽出する領域抽出手段と、
    前記領域抽出手段により抽出された各領域における文字データを抽出すると共に、前記オリジナル文書特定ページ電子化データ内における各文字データの平面座標データを抽出する文字データ抽出手段と、
    前記文字データ抽出手段により前記ページ番号領域から抽出された文字データをページ番号データとし、前記文字データ抽出手段により前記本文領域から抽出された本文文字データの所定位置に前記ページ番号データを付与するページ番号データ付与手段と、
    前記文字データ抽出手段により前記行番号領域から抽出された文字データを行番号データとし、前記行番号データの前記平面座標データと前記本文文字データの前記平面座標データが所定条件を満たす場合、前記本文文字データに、前記行番号データを対応させて付与する行番号データ付与手段と、
    を具備することを特徴とする電子図書の表示用データ作成装置。
  4. 前記領域抽出手段は、
    前記オリジナル文書特定ページ電子化データ内における前記平面座標データおよび前記オリジナル文書特定ページ電子化データ内における前記文字データの大きさの少なくとも一方の情報に基づいて、前記本文領域と前記ページ番号領域と前記行番号領域の識別を行っていることを特徴とする請求項記載の電子図書の表示用データ作成装置。
  5. 前記本文文字データをフレーズ毎に分割し分割フレーズを生成するフレーズ分割手段をさらに備え、
    前記行番号データ付与手段は、
    前記行番号データの前記平面座標データと前記本文文字データの前記平面座標データとが所定条件を満たす位置の先頭位置に前記分割フレーズの始点位置または終点位置が存在しない場合には、前記行番号データの前記平面座標データと前記本文文字データの前記平面座標データとが所定条件を満たす位置の先頭位置の直近位置における前記分割フレーズの前記始点位置または前記終点位置に前記行番号データを付与することを特徴とする請求項3または4記載の電子図書の表示用データ作成装置。
JP2018031282A 2018-02-23 2018-02-23 電子図書の表示用データの作成装置 Active JP6731011B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018031282A JP6731011B2 (ja) 2018-02-23 2018-02-23 電子図書の表示用データの作成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018031282A JP6731011B2 (ja) 2018-02-23 2018-02-23 電子図書の表示用データの作成装置

Publications (2)

Publication Number Publication Date
JP2019145038A JP2019145038A (ja) 2019-08-29
JP6731011B2 true JP6731011B2 (ja) 2020-07-29

Family

ID=67772494

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018031282A Active JP6731011B2 (ja) 2018-02-23 2018-02-23 電子図書の表示用データの作成装置

Country Status (1)

Country Link
JP (1) JP6731011B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7351358B2 (ja) * 2020-02-13 2023-09-27 日本電気株式会社 画像処理システム、画像処理方法および画像処理プログラム
JP6818923B1 (ja) * 2020-04-02 2021-01-27 株式会社スカイコム 情報処理装置、データ連携システム、方法およびプログラム

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004070523A (ja) * 2002-08-02 2004-03-04 Canon Inc 情報処理装置およびその方法
JP5663866B2 (ja) * 2009-08-20 2015-02-04 富士ゼロックス株式会社 情報処理装置及び情報処理プログラム
JP6559415B2 (ja) * 2014-11-20 2019-08-14 シャープ株式会社 文書画像処理装置、それを備えた情報処理装置、プログラム、及び記録媒体

Also Published As

Publication number Publication date
JP2019145038A (ja) 2019-08-29

Similar Documents

Publication Publication Date Title
US6199042B1 (en) Reading system
US20130282376A1 (en) File format, server, viewer device for digital comic, digital comic generation device
JP4855500B2 (ja) テキスト・プロセッサ
US6446041B1 (en) Method and system for providing audio playback of a multi-source document
KR100359265B1 (ko) 텍스트 프로세서
US8952985B2 (en) Digital comic editor, method and non-transitory computer-readable medium
CN110770735B (zh) 具有嵌入式数学表达式的文档的编码转换
US11443646B2 (en) E-Reader interface system with audio and highlighting synchronization for digital books
US20130326341A1 (en) Digital comic editor, method and non-transitorycomputer-readable medium
US8930814B2 (en) Digital comic editor, method and non-transitory computer-readable medium
JP2012133662A (ja) 電子コミックのビューワ装置、電子コミックの閲覧システム、ビューワプログラムならびに該ビューワプログラムが記録された記録媒体
US7613731B1 (en) Method of analysis, abstraction, and delivery of electronic information
WO2012086359A1 (ja) ビューワ装置、閲覧システム、ビューワプログラム及び記録媒体
JP6731011B2 (ja) 電子図書の表示用データの作成装置
JP5674451B2 (ja) ビューワ装置、閲覧システム、ビューワプログラム及び記録媒体
JP2018142286A (ja) 電子図書製作用プログラム
JP5950700B2 (ja) 画像処理装置、画像処理方法及びプログラム
KR20090048211A (ko) 음원 재생이 가능한 문서 변환 및 실행 방법, 이를수행하는 기록 매체 및 이를 수행하는 프로그램
JPH08272388A (ja) 音声合成装置及びその方法
JPH09244869A (ja) 文章読み上げ方式
JP4444141B2 (ja) 情報処理装置、情報処理方法、情報処理プログラム及びこれを記録したコンピュータ読み取り可能な記録媒体
JP6168422B2 (ja) 情報処理装置、情報処理方法、およびプログラム
KR102500730B1 (ko) 문장의 스타일 정보를 유지하는 번역 기능을 제공하는 전자 장치 및 그 동작 방법
KR102403077B1 (ko) 영어 문장 학습을 위한 이미지 구조화 시스템
Kouroupetroglou Accessibility of documents

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20181105

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20191203

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200121

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200309

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200609

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200703

R150 Certificate of patent or registration of utility model

Ref document number: 6731011

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250