JP5991704B1 - 電子書籍表示装置、電子書籍表示方法、及びプログラム - Google Patents

電子書籍表示装置、電子書籍表示方法、及びプログラム Download PDF

Info

Publication number
JP5991704B1
JP5991704B1 JP2016509174A JP2016509174A JP5991704B1 JP 5991704 B1 JP5991704 B1 JP 5991704B1 JP 2016509174 A JP2016509174 A JP 2016509174A JP 2016509174 A JP2016509174 A JP 2016509174A JP 5991704 B1 JP5991704 B1 JP 5991704B1
Authority
JP
Japan
Prior art keywords
page
character
electronic book
related data
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016509174A
Other languages
English (en)
Other versions
JPWO2017009908A1 (ja
Inventor
栄 劉
栄 劉
淳一 原田
淳一 原田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Rakuten Group Inc
Original Assignee
Rakuten Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Rakuten Inc filed Critical Rakuten Inc
Application granted granted Critical
Publication of JP5991704B1 publication Critical patent/JP5991704B1/ja
Publication of JPWO2017009908A1 publication Critical patent/JPWO2017009908A1/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G5/00Control arrangements or circuits for visual indicators common to cathode-ray tube indicators and other visual indicators
    • G09G5/02Control arrangements or circuits for visual indicators common to cathode-ray tube indicators and other visual indicators characterised by the way in which colour is displayed
    • G09G5/022Control arrangements or circuits for visual indicators common to cathode-ray tube indicators and other visual indicators characterised by the way in which colour is displayed using memory planes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0481Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
    • G06F3/0483Interaction with page-structured environments, e.g. book metaphor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/14Digital output to display device ; Cooperation and interconnection of the display device with other functional units
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/114Pagination

Abstract

メモリ使用量を抑えつつ、ページ関連データを利用可能にする。電子書籍表示装置(1)のデータ取得手段(101)は、複数のページからなる電子書籍データを記憶する手段(100)に記憶された電子書籍データを取得する。表示制御手段(103)は、データ取得手段(101)により取得された電子書籍データに基づいて、複数のページのうち指定された1又は複数のページを表示手段(14)に表示させる。ページ関連データ生成手段(104)は、表示手段(14)に表示された1又は複数のページよりも前及び後の少なくとも一方のページが表示手段(14)に表示される前に、少なくとも一方のページに基づいてページ関連データを生成して記憶手段(100)に記録する。

Description

本発明は、電子書籍表示装置、電子書籍表示方法、及びプログラムに関する。
従来、複数ページからなる電子書籍データに基づいて、各ページに関するページ関連データを生成する技術が知られている。例えば、特許文献1には、複数ページからなる漫画の電子書籍データを販売する前に、各ページ内のコマの位置及び順序、吹き出しの位置及び順序等のページ関連データを予め抽出しておき、漫画の画像データとともにページ関連データを販売してユーザの端末のメモリに記憶させる技術が記載されている。
特許第4818415号公報
特許文献1の技術では、例えば、電子書籍の画像データだけでなく、ページ関連データもダウンロードしてユーザの端末のメモリに記憶させる必要があるので、メモリの使用量が大きくなってしまう。
本発明は上記課題に鑑みてなされたものであって、その目的は、メモリ使用量を抑えつつ、ページ関連データを利用可能にすることである。
上記課題を解決するために、本発明に係る電子書籍表示装置は、複数のページからなる電子書籍データを記憶する手段に記憶された前記電子書籍データを取得するデータ取得手段と、前記データ取得手段により取得された電子書籍データに基づいて、前記複数のページのうち指定された1又は複数のページを表示手段に表示させる表示制御手段と、前記表示手段に表示された前記1又は複数のページよりも前及び後の少なくとも一方のページが前記表示手段に表示される前に、前記少なくとも一方のページに基づいてページ関連データを生成して記憶手段に記録するページ関連データ生成手段と、を含むことを特徴とする。
本発明に係る電子書籍表示方法は、複数のページからなる電子書籍データを記憶する手段に記憶された前記電子書籍データを取得するデータ取得ステップと、前記データ取得ステップにより取得された電子書籍データに基づいて、前記複数のページのうち指定された1又は複数のページを表示手段に表示させる表示制御ステップと、前記表示手段に表示された前記1又は複数のページよりも前及び後の少なくとも一方のページが前記表示手段に表示される前に、前記少なくとも一方のページに基づいてページ関連データを生成して記憶手段に記録するページ関連データ生成ステップと、を含むことを特徴とする。
本発明に係るプログラムは、複数のページからなる電子書籍データを記憶する手段に記憶された前記電子書籍データを取得するデータ取得手段、前記データ取得手段により取得された電子書籍データに基づいて、前記複数のページのうち指定された1又は複数のページを表示手段に表示させる表示制御手段、前記表示手段に表示された前記1又は複数のページよりも前及び後の少なくとも一方のページが前記表示手段に表示される前に、前記少なくとも一方のページに基づいてページ関連データを生成して記憶手段に記録するページ関連データ生成手段、としてコンピュータを機能させる。
本発明に係る情報記憶媒体は、上記記載のプログラムが記憶されたコンピュータ読み取り可能な情報記憶媒体である。
また、本発明の一態様によれば、前記ページ関連データ生成手段は、前記少なくとも一方のページが前記表示手段に表示される前に、前記少なくとも一方のページ内の文字領域候補を抽出して前記ページ関連データとして生成して記録し、前記電子書籍表示装置は、前記少なくとも一方のページが前記表示手段に表示された場合に、前記文字領域候補の指定操作を受け付ける受付手段と、前記受付手段により前記指定操作が受け付けられた後に、前記指定操作により指定された文字領域候補に文字が含まれるか否かを判定する操作後文字判定手段と、を更に含み、前記表示制御手段は、前記操作後文字判定手段により文字が含まれると判定された文字領域候補内を拡大して前記表示手段に表示させる、ことを特徴とする。
また、本発明の一態様によれば、前記電子書籍表示装置は、前記受付手段により前記指定操作が受け付けられる前に、前記文字領域候補に対して第1の文字判定処理を実行する操作前文字判定手段を更に含み、前記操作後文字判定手段は、前記操作前文字判定手段により文字が含まれると判定された文字領域候補が前記指定操作により指定された場合に、前記第1の文字判定処理よりも精度の高い第2の文字判定処理を実行する、ことを特徴とする。
また、本発明の一態様によれば、前記ページ関連データ生成手段は、前記少なくとも一方のページ内の前記文字領域候補の数が基準未満である場合、前記少なくとも一方のページの次のページの文字領域候補を更に抽出してページ関連データとして生成して記録する、ことを特徴とする。
また、本発明の一態様によれば、前記電子書籍表示装置は、前記文字領域候補の輪郭又は前記文字領域候補自身の大きさが基準以上であるか否かを判定する大きさ判定手段を更に含み、前記操作後文字判定手段は、前記大きさ判定手段により基準未満の大きさと判定された前記文字領域候補は判定対象とせず、前記大きさ判定手段により基準以上の大きさと判定された前記文字領域候補に文字が含まれるか否かを判定する、ことを特徴とする。
また、本発明の一態様によれば、前記ページ関連データ生成手段は、前記少なくとも一方のページの下部領域は文字領域候補を抽出せずに上部領域内の文字領域候補を抽出する手段と、前記少なくとも一方のページ内の各文字領域の読み順に、基準数になるまで文字領域候補を抽出する手段と、の少なくとも一方を含むことを特徴とする。
また、本発明の一態様によれば、前記ページ関連データ生成手段は、前記少なくとも一方のページが前記表示手段に表示される前に、前記少なくとも一方のページ内の文字領域を抽出して前記ページ関連データとして生成して記録し、前記電子書籍表示装置は、前記少なくとも一方のページが前記表示手段に表示された場合に、前記文字領域の指定操作を受け付ける受付手段を更に含み、前記表示制御手段は、前記受付手段により前記指定操作が受け付けられた場合に、前記指定操作により指定された文字領域内を拡大して前記表示手段に表示させる、ことを特徴とする。
また、本発明の一態様によれば、前記ページ関連データ生成手段は、前記少なくとも一方のページが前記表示手段に表示される前に、前記少なくとも一方のページ内の文字領域候補を抽出する手段を含み、当該文字領域候補に文字が含まれるか否かを判定することによって、前記文字領域を抽出する、ことを特徴とする。
また、本発明の一態様によれば、前記ページ関連データ生成手段は、前記少なくとも一方のページが前記表示手段に表示される前に、前記文字領域候補に対して第1の文字判定処理を実行し、当該第1の文字判定処理により文字が含まれると判定された文字領域候補に対して、前記第1の文字判定処理よりも精度の高い第2の文字判定処理を実行することによって、前記文字領域を抽出する、ことを特徴とする。
また、本発明の一態様によれば、前記ページ関連データ生成手段は、前記文字領域候補の輪郭又は前記文字領域候補自身の大きさが基準以上であるか否かを判定する大きさ判定手段を含み、前記大きさ判定手段により基準未満の大きさと判定された前記文字領域候補は判定対象とせず、前記大きさ判定手段により基準以上の大きさと判定された前記文字領域候補に文字が含まれるか否かを判定することによって、前記文字領域を抽出する、ことを特徴とする。
また、本発明の一態様によれば、前記ページ関連データ生成手段は、前記少なくとも一方のページ内の前記文字領域の数が基準未満である場合、前記少なくとも一方のページの次のページ内の文字領域を更に抽出してページ関連データとして生成して記録する、ことを特徴とする。
また、本発明の一態様によれば、前記ページ関連データ生成手段は、前記少なくとも一方のページの下部領域は文字領域を抽出せずに上部領域内の文字領域を抽出する手段と、
前記少なくとも一方のページ内の各文字領域の読み順に、基準数になるまで文字領域を抽出する手段と、の少なくとも一方を含むことを特徴とする。
また、本発明の一態様によれば、前記電子書籍表示装置は、当該電子書籍表示装置のユーザによる前記指定操作の履歴に関する履歴データを記憶する手段に記憶された前記履歴データを取得する手段を更に含み、前記ページ関連データ生成手段は、前記履歴データに基づいて、前記ユーザによる前記指定操作の頻度が基準以上であるか否かを判定する頻度判定手段を含み、前記頻度判定手段により基準以上であると判定された場合に前記ページ関連データを生成して記録する、ことを特徴とする。
また、本発明の一態様によれば、前記電子書籍表示装置は、当該電子書籍表示装置のユーザにより前記指定操作が行われたページに関するページデータを記憶する手段に記憶された前記ページデータを取得する手段を更に含み、前記ページ関連データ生成手段は、前記ページデータに基づいて、前記ユーザにより前記少なくとも一方のページに対して過去に前記指定操作が行われたか否かを判定する過去判定手段を含み、前記過去判定手段により前記指定操作が行われたと判定された場合に前記ページ関連データを生成して記録する、ことを特徴とする。
また、本発明の一態様によれば、前記電子書籍表示装置は、当該電子書籍表示装置のユーザ以外の他のユーザにより前記指定操作が行われたページに関するページデータを記憶する手段に記憶された前記ページデータを取得する手段を更に含み、前記ページ関連データ生成手段は、前記ページデータに基づいて、前記他のユーザにより前記少なくとも一方のページに対して過去に前記指定操作が行われたか否かを判定する過去判定手段を含み、前記過去判定手段により前記指定操作が行われたと判定された場合に前記ページ関連データを生成して記録する、ことを特徴とする。
また、本発明の一態様によれば、前記電子書籍表示装置は、当該電子書籍表示装置のユーザの年齢に関する年齢情報を取得する手段を更に含み、前記ページ関連データ生成手段は、前記年齢情報に基づいて、前記ユーザの年齢が基準以上であるか否かを判定する年齢判定手段を含み、前記年齢判定手段により基準以上であると判定された場合に前記ページ関連データを生成して記録する、ことを特徴とする。
また、本発明の一態様によれば、前記電子書籍表示装置は、前記表示手段の画面サイズに関するサイズ情報を取得する手段を更に含み、前記ページ関連データ生成手段は、前記サイズ情報に基づいて、前記表示手段の画面サイズが基準未満であるか否かを判定するサイズ判定手段を含み、前記サイズ判定手段により基準未満であると判定された場合に前記ページ関連データを生成して記録する、ことを特徴とする。
本発明によれば、メモリ使用量を抑えつつ、ページ関連データを利用可能にすることが可能になる。
本実施形態における電子書籍表示装置のハードウェア構成を示す図である。 電子書籍表示装置で実現される機能の一例を示す機能ブロック図である。 電子書籍データの一例を示す図である。 ページの一例を示す図である。 輪郭と領域の大きさの説明図である。 2値化され反転されたページを示す図である。 図6に示すページから抽出された輪郭線を示す図である。 基準以上の大きさの輪郭線を拡大した後の各輪郭線の状態を示す図である。 拡大した輪郭線が重畳されたページを示す図である。 拡張部の処理内容の説明図である。 拡張部の処理内容の説明図である。 拡張部により領域が拡張された後の状態を示す図である。 輪郭の大きさが基準未満である領域が背景色で塗りつぶされた後の状態を示す図である。 文字領域候補の一例を示す図である。 学習データを用いた文字判定処理の説明図である。 文字群が拡大表示される様子を示す図である。 電子書籍表示装置において実行される処理の一例を示すフロー図である。 ページ関連データ生成処理の説明図である。 実施形態2の機能ブロック図である。 光学文字認識の結果を示す図である。 実施形態2のフロー図である。 実施形態2のページ関連データ生成処理の説明図である。 変形例(1)の機能ブロック図である。 ページの上部領域及び下部領域の説明図である。 ページにおける読み順の説明図である。 変形例(2)の機能ブロック図である。 変形例(3)の機能ブロック図である。
[1.実施形態1]
以下、本発明に係る実施形態を図面に基づき詳細に説明する。
[1−1.電子書籍表示装置のハードウェア構成]
図1は、本実施形態における電子書籍表示装置のハードウェア構成を示す図である。電子書籍表示装置1は、ユーザが操作するコンピュータであり、例えば、携帯電話機(スマートフォンを含む)、携帯情報端末(タブレット型コンピュータを含む)、電子書籍リーダー端末、又はパーソナルコンピュータ等である。図1に示すように、電子書籍表示装置1は、制御部10、記憶部11、通信部12、操作部13、表示部14、及び入出力部15を含む。
制御部10は、例えば、一又は複数のマイクロプロセッサを含む。制御部10は、記憶部11に記憶されたプログラムやデータに従って処理を実行する。記憶部11は、主記憶部及び補助記憶部を含む。例えば、主記憶部はRAMであり、補助記憶部は、ハードディスク又はソリッドステートドライブ等である。通信部12は、ネットワークカード等の通信インタフェースである。
操作部13は、一般的な入力デバイスであり、例えば、タッチパネルやマウス等のポインティングデバイスである。操作部13は、ユーザの操作内容を制御部10に伝達する。表示部14は、例えば、液晶表示部又は有機EL表示部等である。表示部14は、制御部10の指示に従って画面を表示する。入出力部15は、外部機器とのデータの入出力を行う入出力インタフェースである。例えば、入出力部15は、コンピュータ読み取り可能な情報記憶媒体(例えば、光ディスクやメモリカード等)からデータやプログラムを読み取る。
なお、記憶部11に記憶されるものとして説明するプログラム及びデータは、ネットワークに接続されたサーバコンピュータから、通信部12を介して記憶部11に供給されるようにしてもよいし、情報記憶媒体から、入出力部15を介して記憶部11に供給されるようにしてもよい。また、電子書籍表示装置1のハードウェア構成は、上記の例に限られず、種々のコンピュータのハードウェアを適用可能である。
[1−2.電子書籍表示装置において実現される機能]
図2は、電子書籍表示装置1で実現される機能の一例を示す機能ブロック図である。図2に示すように、電子書籍表示装置1では、データ記憶部100、データ取得部101、ページ送り操作受付部102、表示制御部103、ページ関連データ生成部104、指定操作受付部105、及び操作後文字判定部106が実現される。データ記憶部100は、記憶部11を主として実現され、他の各機能は、制御部10を主として実現される。
[1−2−1.データ記憶部]
データ記憶部100は、複数のページからなる電子書籍データを記憶する。図3は、電子書籍データの一例を示す図である。図3に示すように、本実施形態では、電子書籍の各ページに「P」のように符号を付して説明する。「P」の「N」は、自然数であり、ページ数を示す。図3に示す電子書籍は50ページから構成されているので、Nは、1〜50の数値をとる。例えば、ページP20と記載した場合は、第20ページのことを示し、ページP21と記載した場合は、第21ページのことを示す。
電子書籍は、表示部14に電子的に表示される書籍であればよく、例えば、漫画、絵本、又は雑誌である。電子書籍は、少なくとも文字を含む。電子書籍は、文字以外に、絵・写真・図形等を含むようにしてよい。なお、ここでの絵とは、人が手で描画した絵をスキャナで読み込んで電子化したものに限らず、人がコンピュータを使って描画したCGを含む意味である。電子書籍データのデータ形式は、一般的に電子書籍で用いられているデータ形式を用いればよい。
電子書籍データは、各ページPの画像データを含む。ページPごとに画像データが存在してもよいし、全てのページPをひとまとめにした1つの画像データのみが存在してもよい。また、電子書籍は、カラーであってもよいし、モノクロ又はグレースケールであってもよい。なお、電子書籍データは、画像データに付帯する付帯データを含んでもよい。付帯データは、各ページのページ数や発行年月日等である。本実施形態では、複数ページから構成されるグレースケールの漫画を、電子書籍の一例として説明する。
なお、データ記憶部100は、電子書籍データ以外のデータを記憶していてもよい。例えば、データ記憶部100は、電子書籍リーダーのアプリケーション(ビューワアプリケーション)を記憶してもよい。また例えば、データ記憶部100は、後述する文字判定のための学習データを記憶してもよい。
[1−2−2.データ取得部]
データ取得部101は、複数のページPからなる電子書籍データを記憶するデータ記憶部100に記憶された電子書籍データを取得する。先述のように、電子書籍データは、画像データを含んでいるが、データ取得部101は、全てのページPの画像データを一度に取得してもよいし、一部のページPの画像データのみを取得してもよい。データ取得部101が一部のページPの画像データのみを取得する場合、データ取得部101は、表示対象のページPの画像データのみを取得してもよいし、表示対象のページPとその前後のページPの画像データを取得してもよい。なお、表示対象となるのは、1つのページPだけであってもよいし、見開き等のように複数のページPであってもよい。更に、本実施形態のように電子書籍が漫画の場合、1つのページPの中の1コマのみが表示対象となってもよい。本実施形態では、複数のページPのうちの何れか1つのページPが表示対象になる場合を例に挙げて説明する。
[1−2−3.ページ送り操作受付部]
ページ送り操作受付部102は、ページ送り操作を受け付ける。ページ送り操作は、表示部14に表示させるページPを指定するための操作である。別の言い方をすれば、ページ送り操作は、表示部14に表示されたページPを切り替えるための操作である。ページ送り操作は、所定の操作であればよく、例えば、表示部14に表示されたアイコンを選択する操作であってもよいし、操作部13がタッチパネルであればフリック操作であってもよい。本実施形態では、表示対象となるのが1つのページPなので、ページ送り操作は、何れか1つのページPを指定するための操作と言える。
[1−2−4.表示制御部]
本実施形態では、表示制御部103は、データ取得部101により取得された電子書籍データに基づいて、複数のページPのうち指定されたページPを表示部14に表示させる。表示制御部103は、ページ送り操作により指定されたページPを表示部14に表示させることになる。例えば、表示制御部103は、ページ送り操作受付部102によりページ送り操作が受け付けられた場合、表示中のページPの1つ後のページPN+1又は1つ前のページPN−1を表示部14に表示させる。
なお、ページ送り操作により表示対象のページ数そのものを指定できるようにしてもよい。例えば、表示部14にページP20が表示された状態において、ページP21〜P29を飛ばして、ページ送り操作でページP30を指定できるようにしてよい。また、本実施形態のように表示対象となるのが1つのページPの場合、表示制御部103は、そのページPの全体を表示させてもよいし、ページP内の一部のみを表示させてもよい。ページP内の一部のみを表示させる場合、表示制御部103は、ユーザが操作部13を用いて指示した部分を表示させることになる。
[1−2−5.ページ関連データ生成部]
本実施形態では、ページ関連データ生成部104は、表示部14に表示されたページPよりも前及び後の少なくとも一方のページPN−K,N+K(Kは自然数)が表示部14に表示される前に、少なくとも一方のページPN−K,N+Kに基づいてページ関連データを生成してデータ記憶部100に記録する。なお、ページPN−Kは、ページPのKページだけ前であり、ページPN+Kは、ページPのKページだけ後である。
ページ関連データは、各ページPに画像処理を施すことで得られるデータである。本実施形態では、文字領域候補を示すデータが、ページ関連データに相当する場合を説明する。文字領域候補は、文字判定の対象となる領域である。別の言い方をすれば、文字領域候補は、文字が含まれている可能性のある領域である。このため、本実施形態では、ページ関連データ生成部104は、少なくとも一方のページPN−K,N+Kが表示部14に表示される前に、少なくとも一方のページPN−K,N+K内の文字領域候補を抽出してページ関連データとして生成して記録することになる。
ページ関連データ生成部104は、あるページPよりも前のページPN−Kだけページ関連データを生成してもよいし、後のページPN+Kだけページ関連データを生成してもよいし、これらの両方についてページ関連データを生成してもよい。本実施形態では、ページ関連データ生成部104が、表示中のページPの次のページPN+1のページ関連データを生成する場合を説明する。
例えば、電子書籍リーダーのアプリケーションが起動すると、表示制御部103は1ページ目のページPを表示部14に表示させることになるが、ページ関連データ生成部104は、ページPが表示部14に表示される前に、ページPのページ関連データを生成して記録する。そして、表示制御部103がページPを表示部14に表示させると、ページ関連データ生成部104は、次のページPが表示部14に表示される前に、ページPのページ関連データを予め生成して記録しておく。そして、ページ送り操作が行われて表示制御部103がページPを表示させる場合、ページ関連データ生成部104は、次のページPが表示部14に表示される前に、ページPのページ関連データを予め生成して記録することになる。以降同様にして、ページP〜P50のページ関連データが生成されることになる。
なお、本実施形態では、電子書籍リーダーのアプリケーションを終了するまで、ページ関連データ生成部104が生成したページ関連データがデータ記憶部100に保持される場合を説明するが、アプリケーションの終了前に、所定のタイミングでページ関連データが破棄されるようにしてもよい。例えば、表示中のページPからページ数が離れたページ関連データについては、破棄するようにしてもよい。
次に、ページ関連データを生成する処理の詳細を説明するが、ここでは、表示制御部103がページP20を表示部14に表示させた場合に、次のページP21が表示部14に表示される前に、ページ関連データ生成部104がページP21のページ関連データを生成する場合を例に挙げて説明する。
図4は、ページP21の一例を示す図である。本実施形態では、漫画を電子書籍の一例として説明するので、図4に示すように、ページP21は、1又は複数のコマ21を含む。コマ21は、ページ内で絵や文字が描画される区画である。図4の例では、ページP21は、2つのコマ21(これらをコマ21A,21Bとも記載する)を含む。図4の例では、各コマ21は、枠で囲われているが、枠で囲われていなくてもよい。
各コマ21は、絵、吹き出し線、文字等の物体を含む。吹き出し線は、漫画のキャラクタの台詞を表す。キャラクタは、漫画の登場人物であり、人間以外にも動物・ロボット・架空の生物であってもよい。吹き出し線の内側には、キャラクタの台詞を表す1又は複数の文字が含まれている。以降、複数の文字のまとまりのことを文字群という。図3の例では、コマ21Aには、キャラクタ22A、吹き出し線23A、文字群24A、及び太陽25Aが描かれており、コマ21Bには、キャラクタ22B,22C、吹き出し線23B、文字群24B、及び食器25Bが描かれている。なお、キャラクタ22A〜22C、太陽25A、及び食器25Bは、上記説明した絵の一例である。吹き出し線23Aは、キャラクタ22Aの台詞を示し、吹き出し線23Bは、キャラクタ22Cの台詞を示す。
本実施形態では、ページ関連データ生成部104は、結合制限部104A、拡張部104B、及び判定制限部104Cを含み、下記に説明するように、図4に示すページP21内の文字群24A,24Bを文字のかたまりとして検出することによって、文字領域候補を示すページ関連データを生成している。
[結合制限部]
結合制限部104Aは、領域の輪郭又は当該領域自身の大きさが基準以上である場合、当該領域と、後述する拡張部104Bにより拡張した領域と、が結合することを制限する。例えば、文字群24Aが拡張して吹き出し線23Aに結合すると、文字群24Aを文字のかたまりとして検出できなくなってしまう。このため、結合制限部104Aは、下記に説明するようにして、これらの結合を制限することで、文字群24Aの検出の精度を高めるようにしている。
領域とは、ページP21のうち物体が描かれている部分(画素)であり、背景色(例えば、白)以外の色(例えば、黒又はグレー)の部分である。例えば、キャラクタ22A〜22C、吹き出し線23A,23B、文字群24A,24B、太陽25A、及び食器25B等の物体が描かれている部分が、本実施形態でいう領域に相当する。なお、物体は、ページP21の背景以外の部分に表れている描画物といえる。
輪郭は、領域を縁取ったものであり、本実施形態では、電子書籍表示装置1が線として表現したものを輪郭線と記載する。領域は、輪郭の内部、又は、輪郭と輪郭で挟まれた部分ということもできる。例えば、文字群24Aであれば、「L」の文字は、輪郭の内部が領域であり、「O」の文字は、外周の輪郭と内周の輪郭とに挟まれた部分が領域である。
輪郭の大きさは、例えば、輪郭の幅、輪郭線の長さ、輪郭の内側の面積等であってよいが、本実施形態では、輪郭の外接矩形の大きさを、輪郭の大きさとして用いる。領域の大きさは、例えば、領域の幅であってよいが、本実施形態では、領域の外接矩形の大きさを、領域の大きさとして用いる。
図5は、輪郭と領域の大きさの説明図である。図5のXs軸及びYs軸は、スクリーン座標系の座標軸である。ここでは、領域の一例として吹き出し線23Aを挙げて、吹き出し線23Aの輪郭の大きさと、吹き出し線23A自身の大きさと、について説明する。図5では、吹き出し線23Aの外周輪郭線と内周輪郭線を破線で描き、吹き出し線23A自身を実線で描いている。なお、図5では、説明の都合上、実線と破線の間に間隔を設けているが、実際には、これらに間隔はない。
例えば、輪郭線の外接矩形は、輪郭線のうち、Xs座標の最小値と及び最大値の間であり、かつ、Ys座標の最小値と最大値の間の領域である。図5に示す例では、外周輪郭線の外接矩形は、点Q1A〜Q4Aを頂点とする長方形なので、この長方形の大きさが外周輪郭線の大きさに相当する。一方、内周輪郭線の外接矩形は、点Q1B〜Q4Bを頂点とする長方形なので、この長方形の大きさが内周輪郭線の大きさに相当する。
また例えば、吹き出し線23Aの外接矩形は、吹き出し線23Aが占める画素のうち、Xs座標の最小値と最大値の間であり、かつ、Ys座標の最小値と最大値の間の領域である。吹き出し線23Aの外接矩形は、点Q1C〜Q4Cを頂点とする長方形なので、この長方形の大きさが吹き出し線23A自身の大きさに相当する。
結合制限部104Aは、輪郭の大きさと領域自身の大きさの何れを用いてもよいが、本実施形態では、輪郭の大きさを用いる場合を説明する。結合制限部104Aは、ページP21内の各領域の輪郭の外接矩形を抽出し、外接矩形の大きさが基準以上であるか否かを判定する。なお、大きさを示す数値としては、外接矩形の縦幅及び横幅の少なくとも一方が用いられてもよいし、外接矩形の面積が用いられてもよい。他にも例えば、外接矩形の対角線の長さが、大きさを示す数値として用いられてもよい。本実施形態では、大きさを示す数値として、外接矩形の縦幅と横幅の両方が用いられる場合を例に挙げて説明する。
大きさの基準を示す閾値Tは、固定値であってもよいし、可変値であってもよい。閾値Tが固定値である場合には、データ記憶部100にその値が記憶されており、閾値Tが可変値である場合には、データ記憶部100に記憶された数値をもとに計算されることになる。本実施形態では、閾値Tが固定値である場合を説明する。例えば、結合制限部104Aは、外接矩形の縦幅と横幅がそれぞれ閾値T以上であるか否かを判定することによって、各輪郭の大きさが基準以上であるか否かを判定する。
本実施形態では、結合制限部104Aは、領域の輪郭の大きさが基準以上である場合、当該領域を背景色で塗りつぶすことによって、後述する拡張部104Bにより拡張した領域と結合することを制限する場合を説明する。背景色は、画像に対して指定された所定の色であり、例えば、画像内で占める割合が最も多い色である。例えば、背景色は、白又は黒である。なお、本実施形態における結合とは、ある領域が他の領域と接触又は重畳して1つの領域となることである。
例えば、吹き出し線23Aの輪郭は比較的大きいので、結合制限部104Aは、吹き出し線23Aの輪郭を基準以上の大きさであると判定し、吹き出し線23Aを背景色で塗りつぶすことになる。その結果、吹き出し線23Aと、後述する拡張部104Bにより拡張された文字群24Aと、が結合することを防止することができるようになっている。具体的には、本実施形態では、結合制限部104Aは、下記のように、(1)2値化反転処理、(2)輪郭抽出処理、(3)輪郭線拡大処理、(4)拡大輪郭線重畳処理を実行することによって、吹き出し線23A等を塗りつぶすことになる。
[2値化反転処理]
まず、結合制限部104Aは、ページP21に対して2値化処理と反転処理を実行する。図6は、2値化され反転されたページP21を示す図である。結合制限部104Aは、図3に示すページP21の各画素の画素値と閾値に基づいて2値化処理を実行し、各画素を白又は黒に設定する。2値化処理自体は、公知の種々のアルゴリズムを適用可能であり、例えば、Pタイル法やモード法によって閾値を定めてもよい。結合制限部104Aは、2値化した各画素の画素値を反転させ、白の画素を黒にして黒の画素を白にすることによって、図5に示すページP21を、図6に示す状態にする。反転処理自体も、公知の種々の手法を適用可能であり、例えば、各色の画素値の最大値(8ビットグレースケールなら255)から画素値の現在値を引くことで反転後の画素値を計算してもよい。
[輪郭抽出処理]
結合制限部104Aは、2値化して反転させたページP21(図6)に対して輪郭抽出処理を実行し、閉領域の輪郭を抽出する。図7は、図6に示すページP21から抽出された輪郭線を示す図である。図7では、結合制限部104Aが抽出した輪郭線を破線で示している。輪郭線は、所定の太さの線(例えば、1ピクセル)であればよい。また、輪郭線の色は、予め定められた色であればよいが、ここでは黒とする。これは、2値化して反転させたページP21(図6)内の吹き出し線23A,23Bが白で描かれているため、これを背景色である黒で塗りつぶすためである。
なお、輪郭抽出処理自体は、公知の種々の輪郭抽出アルゴリズムを適用可能であり、例えば、微分フィルタ、Prewittフィルタ、又はSobelフィルタ等を用いて画像内のエッジを検出することによって、各領域の輪郭を抽出するようにしてよい。また、図6に示すページP21では、キャラクタ22Aの左側頭部と左肩がコマ21Aの輪郭に触れているので、図7に示すように、キャラクタ22Aとコマ21Aの輪郭線は一連のものになっている。
[輪郭線拡大処理]
結合制限部104Aは、輪郭抽出処理によって抽出した輪郭線のうち、基準以上の大きさの輪郭線を拡大する。結合制限部104Aは、各輪郭線の外接矩形を抽出して、その大きさが閾値T以上であるか否かを判定することになる。先述したように、本実施形態では、外接矩形の縦幅と横幅を大きさとして用いるので、結合制限部104Aは、外接矩形の縦幅と横幅がそれぞれ閾値T以上であるか否かを判定することによって、各輪郭線の大きさが基準以上であるか否かを判定する。
結合制限部104Aは、基準以上の大きさの輪郭線を拡大する。輪郭線を拡大するとは、輪郭線を太くすることである。輪郭線の拡大の程度(線を太らせるピクセル数)は、固定値であってもよいし、可変値であってもよい。固定値である場合には、データ記憶部100にその値が記憶されており、可変値である場合には、データ記憶部100に記憶された数値をもとに計算されることになる。例えば、結合制限部104Aは、輪郭線の位置や輪郭線の大きさに基づいて、当該輪郭線の拡大の程度を計算してもよい。この場合、輪郭線が画像の中央付近にあるほど、その輪郭線が吹き出し線23A,23Bのものである蓋然性が高いので、輪郭線の拡大の程度を大きくして、より確実に塗りつぶせるようにしてもよい。また例えば、輪郭線が大きいほど、その輪郭線が吹き出し線23A,23Bのものである蓋然性が高いので、輪郭線の拡大の程度を大きくして、より確実に塗りつぶせるようにしてもよい。本実施形態では、拡大の程度が固定値であり、所定ピクセル分だけ線を太らせる場合を説明する。
図8は、基準以上の大きさの輪郭線を拡大した後の各輪郭線の状態を示す図である。図8に示す例では、コマ21A,21Bの輪郭線、キャラクタ22A〜22Cの一部の輪郭線、吹き出し線23A,23Bの輪郭線、及び太陽25Aの一部の輪郭線が所定ピクセル分だけ太くなっている。図8に示すように、結合制限部104Aが輪郭線を拡大させると、近くにある輪郭線同士が結合して1つの太い輪郭線になることがある。例えば、図8に示す例では、吹き出し線23A,23Bの外周の輪郭線と内周の輪郭線がそれぞれ拡大し、これらが互いに結合して1つの太い輪郭線となっている。
[拡大輪郭線重畳処理]
結合制限部104Aは、2値化して反転させたページP21(図6)に、拡大した輪郭線(図8)を重畳させる。図9は、拡大した輪郭線が重畳されたページP21を示す図である。図9に示すように、拡大して太い1本になった輪郭線で吹き出し線23A,23Bを重畳したことによって、吹き出し線23A,23Bが黒く塗りつぶされている。このため、後述する処理によって、拡張部104Bが文字群24A,24Bを拡張したとしても、吹き出し線23A,23Bに結合しないことになる。
上記のようにして、吹き出し線23A,23Bを背景色で塗りつぶすことができる。なお、吹き出し線23A,23Bを背景色で塗りつぶす方法は、上記説明した方法に限られない。例えば、結合制限部104Aは、基準以上の大きさの輪郭線で挟まれた領域(例えば、吹き出し線23A,23B)を選択して、その選択範囲についてのみ、もう一度色の反転処理をしてもよい。このようにすれば、例えば、図6に示す吹き出し線23A,23Bの色が白から黒に戻るので、吹き出し線23A,23Bを黒く塗りつぶすことができる。他にも例えば、結合制限部104Aは、基準以上の大きさの輪郭線で挟まれた領域であり、かつ、当該輪郭線の間隔が一定距離未満である領域を、背景色で塗りつぶすようにしてもよい。更に、例えば、結合制限部104Aは、輪郭線で挟まれた領域が一定距離以上続いている区間を、背景色で塗りつぶすようにしてもよい。結合制限部104Aの処理対象となる領域に、このような条件を追加することによって、当該条件によって特定される領域が、吹き出し線23A,23Bのような線が描かれた部分である蓋然性が高まる。このため、より確実に、吹き出し線23A,23Bのような線の部分を塗りつぶし、文字群24A,24Bと結合することを防止することができる。
また例えば、吹き出し線23A,23Bと、文字群24A,24Bと、を結合させないようにする方法は、吹き出し線23A,23Bを背景色で塗りつぶす方法に限られない。例えば、結合制限部104Aは、基準以上の大きさの領域の位置(領域を構成する画素の位置)をデータ記憶部100に記録しておき、後述する拡張部104Bにより拡張された領域が当該画素に含まれても、その画素は同じ領域とみなさないようにしてもよい。同じ領域とみなさないためには、例えば、同一領域を抽出するラベリング処理において、同じ番号を振らないようにすればよい。他にも例えば、結合制限部104Aは、基準以上の大きさの輪郭線の方向には、拡張部104Bが領域を拡張しないように制限をするようにしてもよい。このようにすることでも、例えば、文字群24A,24Bが吹き出し線23A,23Bの方向には拡張しないので、吹き出し線23A,23Bと、文字群24A,24Bと、が結合することを防止することができる。
[拡張部]
拡張部104Bは、ページP21内の複数の領域の各々を拡張する。なお、拡張部104Bは、図9に示すページP21内の全ての領域を拡張してもよいし、結合制限部104Aが抽出した輪郭の大きさが基準以上の領域は拡張せず、輪郭の大きさが基準未満の領域を拡張するようにしてもよい。即ち、例えば、拡張部104Bは、キャラクタ22A,22B,22Cの目・鼻・口等、文字群24A,24Bの各文字、太陽25Aの一部、食器25Bのように、輪郭の大きさが基準未満のもののみを拡張してもよい。
なお、領域を拡張するとは、領域を太らせることであり、領域が占める面積を大きくすることである。領域の拡張の程度は、固定値であってもよいし、可変値であってもよい。固定値である場合には、データ記憶部100にその値が記憶されており、可変値である場合には、データ記憶部100に記憶された数値をもとに計算されることになる。例えば、拡張部104Bは、画像における領域の位置や大きさに基づいて、当該領域の拡張の程度を計算してもよい。この場合、領域が画像の中央付近にあるほど、その領域が文字である蓋然性が高いので、領域の拡張の程度を大きくして、より確実に他の文字と結合させるようにしてもよい。また、他の領域との距離が近いほど、その領域が文字群の1文字である蓋然性が高いので、領域の拡張の程度を大きくして、より確実に他の文字と結合させるようにしてもよい。また例えば、領域の大きさが一定範囲(文字と推測される程度の広さ)におさまっていれば、その領域が文字である蓋然性が高いので、領域の拡張の程度を大きくして、より確実に他の文字と結合させるようにしてもよい。本実施形態では、拡張の程度が固定値であり、所定ピクセル分だけ領域を太らせる場合を説明する。
図10及び図11は、拡張部104Bの処理内容の説明図である。ここでは、拡張部104Bが、文字群24Aの各文字を拡張する場合を例に挙げて説明する。例えば、図10に示すように、拡張部104Bは、「H」を所定ピクセル分だけ拡張する。別の言い方をすれば、拡張部104Bは、「H」から所定距離以内にある画素(即ち、「H」の周囲の画素)を白で塗りつぶす。拡張部104Bは、文字群24Aの「HELLO! HOW ARE YOU?」の「H」以外の文字も、「H」と同様に所定ピクセル分だけ拡張する。拡張部104Bが文字群24Aの各文字を拡張させると、図11に示すように、文字群24Aの各文字が結合して、文字群24Aを1つの領域とすることができる。
図12は、拡張部104Bにより領域が拡張された後の状態を示す図である。図12に示すように、ここでは、文字群24A,24Bに含まれる各文字の領域が拡張して互いに結合し、1つの領域になっている。他にも例えば、食器25Bの各領域やキャラクタ22Cの左目・鼻・口も拡張して互いに結合している。他の領域については、拡張はされたものの、付近に別の領域が無かったため結合していない。
[判定制限部]
判定制限部104Cは、拡張部104Bにより拡張した領域(図12)の輪郭又は当該領域自身の大きさが基準未満である場合、当該領域が操作後文字判定部106の判定対象となることを制限する。なお、判定制限部104Cの説明でも、結合制限部104Aと同様、輪郭の大きさが用いられる場合を説明する。
上記の基準を示す閾値Tは、閾値Tよりも小さくてよい。なお、閾値Tが固定値であってもよいし、可変値であってもよい点については、閾値Tと同様である。本実施形態では、外接矩形の縦幅と横幅を大きさとして用いるので、判定制限部104Cは、外接矩形の縦幅と横幅がそれぞれ閾値T以上であるか否かを判定することによって、拡張部104Bにより拡張した領域の輪郭が基準未満であるか否かを判定する。
本実施形態では、判定制限部104Cは、拡張部104Bにより拡張した領域の輪郭の大きさが基準未満である場合、当該領域を背景色で塗りつぶすことによって、操作後文字判定部106の判定対象となることを制限する場合を説明する。図13は、輪郭の大きさが基準未満である領域が背景色で塗りつぶされた後の状態を示す図である。例えば、キャラクタ22A,22Cの目・鼻・口等、太陽25Aの一部の輪郭が基準未満の大きさであるため、図13に示すように、判定制限部104Cは、これらを黒で塗りつぶしている。
なお、基準未満の大きさの領域を背景色で塗りつぶす以外の方法で、操作後文字判定部106の文字判定の対象外とするようにしてもよい。例えば、判定制限部104Cは、基準未満の大きさの領域の位置をデータ記憶部100に記録しておき、ユーザがその領域を指定しても操作後文字判定部106による判定処理を実行しないようにしてもよい。
ページ関連データ生成部104は、上記のように画像処理を施したページP21に基づいて、文字領域候補を示すページ関連データをデータ記憶部100に記録する。本実施形態では、判定制限部104Cによる処理が実行された後のページP21(図13)内の白画素の閉領域が、文字領域候補となる。
図14は、文字領域候補の一例を示す図である。ページ関連データ生成部104は、図13に示すページP21に対して輪郭抽出処理を実行して、白画素の領域の輪郭(図14に破線で示す)を抽出する。輪郭抽出処理自体は、結合制限部104Aによる処理と同様であってよい。ここでは、ページ関連データ生成部104は、閉領域の輪郭を抽出するので、図13に示すキャラクタ22Aについては輪郭を抽出しないことになる。ページ関連データ生成部104は、抽出した輪郭線の位置を示すデータを、ページ関連データとしてデータ記憶部100に記録する。
なお、ここでは文字領域候補を識別するデータとして、輪郭線の位置を示すデータを例に挙げるが、文字領域候補を識別可能なデータであればよい。例えば、ページ関連データ生成部104は、図13に示すページP21に対してラベリング処理を実行し、白画素が連続する画素に同じ番号を付与することによって、文字領域候補を識別するデータを記録するようにしてもよい。
[1−2−6.指定操作受付部]
指定操作受付部105は、ページP21が表示部14に表示された場合に、文字領域候補の指定操作を受け付ける。指定操作は、ページP21内の領域を指定するための操作であればよく、例えば、ページP21内の位置を指定する操作である。本実施形態では、操作部13により表示部14の表示画面内の位置を指定する操作が指定操作に相当する。操作部13により指定された位置を含む領域が、指定操作により指定されたことになる。本実施形態では、指定操作は、文字領域候補のうちの何れかを指定する操作といえる。
[1−2−7.操作後文字判定部]
操作後文字判定部106は、指定操作受付部105により指定操作が受け付けられた後に、指定操作により指定された文字領域候補に文字が含まれるか否かを判定する。なお、本実施形態では、操作後文字判定部106は、図4に示す状態のページP21を用いて判定処理を実行する場合を説明するが、使用する画像の状態に応じて文字判定の方法を変えるようにすれば、図6や図9に示す状態のページP21を用いてもよい。
例えば、文字パターンの学習データをデータ記憶部100に記憶させておき、操作後文字判定部106は、文字領域候補と、学習データが示す文字パターンと、を比較することによって、文字領域候補内に文字が含まれるか否かを判定する。学習データには、複数の判定項目が定義されており、例えば、下記のような判定項目によって文字判定が行われる。
図15は、学習データを用いた文字判定処理の説明図である。まず、第1の判定項目として、操作後文字判定部106は、文字領域候補の全体の大きさが基準以上であるか否かを判定する。文字領域候補の大きさは、外接矩形の大きさを用いてもよいし、文字領域候補のピクセル数をカウントしてもよい。ここでは、外接矩形を用いる場合を説明する。この基準を示す閾値Tは、閾値T,Tと同じであってもよいし、異なっていてもよい。また、閾値Tは、閾値T,Tと同様、固定値であってもよいし、可変値であってもよい。操作後文字判定部106は、外接矩形の大きさが基準以上である場合、文字領域と判定する。
図15に示すように、操作後文字判定部106は、外接矩形をnマス×mマス(n,mは、ともに2以上の整数。ここでは、n=m=10とする。)の矩形領域に区切る。そして、矩形領域の垂直ライン(図15では1列目〜10列目の各ライン)及び水平ライン(図15では1行目〜10行目の各ライン)のそれぞれについて、第2の判定項目〜第5の判定項目について判定する。なお、全てのマスについて判定処理を行ってもよいし、一部のマス(例えば、外周の一部のマスを除いたマス)についてのみ判定処理を行ってもよい。
第2の判定項目として、操作後文字判定部106は、各ラインの白ピクセルの数が基準数以上であるか否かを判定する。この基準数は、固定値であってもよいし、可変値であってもよい。操作後文字判定部106は、白ピクセルの数が基準数以上である場合、文字領域と判定する。第3の判定項目として、操作後文字判定部106は、各ラインの画素を端から走査し、白画素と黒画素とが反転した数をカウントし、当該カウント数が基準数以上であるか否かを判定する。この基準数も、固定値であってもよいし、可変値であってもよい。操作後文字判定部106は、カウント数が基準数以上である場合、文字領域と判定する。
第4の判定項目として、操作後文字判定部106は、各ラインの画素を端から走査し、最初に白の画素を発見した位置が所定の位置であるか否かを判定する。例えば、操作後文字判定部106は、最初に白の画素を発見した位置が端から基準距離以内であれば、文字領域と判定する。第5の判定項目として、操作後文字判定部106は、各ラインの画素を端から走査し、最後に白の画素を発見した位置が所定の位置であるか否かを判定する。例えば、操作後文字判定部106は、最後に白の画素を発見した位置が端から基準距離以内であれば、文字領域と判定する。
操作後文字判定部106は、学習パターンに定義された第1の判定項目〜第5の判定項目の全てについて文字領域であると判定された場合に、文字領域候補が文字領域であると判定するようにしてもよいし、所定数以上(例えば、3つ以上)の判定項目について文字領域であると判定された場合に、文字領域候補が文字領域であると判定するようにしてもよい。
なお、文字領域候補に文字が含まれるか否かを判定する方法は、上記説明した方法に限られず、公知の種々の手法を適用可能である。例えば、操作後文字判定部106は、文字の形状のパターンと文字領域候補とを比較して、互いの類似度を計算することによって、文字領域候補に文字が含まれるか否かを判定してもよい。他にも例えば、教師ありの機械学習手法(SVM:Support Vector Machine)を用いて、文字領域候補に文字が含まれるか否かを判定してもよい。この手法では、学習データを用意しておき、複数の項目をパラメータとして判定アルゴリズムに入力すると、判定アルゴリズムは、入力されたパラメータと学習データとを用いて、文字領域候補が文字領域であるか否かの出力を得ることができるようになっている。このような手法を用いることで、例えば、種々の形状の文字や絵が含まれる漫画のような画像であっても、より確実に文字領域を特定することができる。
本実施形態では、表示制御部103は、操作後文字判定部106により文字が含まれると判定された文字領域候補内を拡大して表示部14に表示させる。図16は、文字群24Aが拡大表示される様子を示す図である。図16に示すように、ユーザが文字群24Aに対応する文字領域候補を指定すると、操作後文字判定部106により文字判定処理が行われて文字と判定されるので、表示制御部103は、文字領域候補内を切り出した拡大画像26を表示させる。図16の例では、表示制御部103は、図9に示すページP21の文字領域候補内を切り出して拡大させて表示させるので、拡大画像26は、色が反転した状態で文字が表示されている。
なお、表示制御部103は、図3に示すページP21の文字領域候補内を切り出して拡大させて表示させてもよい。この場合、拡大画像26における文字の色は反転しないことになる。また、拡大画像26に切り出す範囲は、図16のような長方形に限られず、楕円形等の任意の形状であってよい。また、拡大画像26の表示位置は、ランダムに決定されてもよいし、ユーザが指定した位置に基づいて定まってもよい。また、拡大画像26における文字の拡大率は、文字領域候補の大きさに基づいて決まってもよいし、所定の拡大率であってもよい。
[1−3.電子書籍表示装置において実行される処理]
図17は、電子書籍表示装置1において実行される処理の一例を示すフロー図である。図17に示す処理は、制御部10が、記憶部11に記憶されたプログラムに従って動作することによって実行される。本実施形態では、下記に説明する処理が実行されることにより、図2に示す機能ブロックが実現される。例えば、ユーザが操作部13を用いて、プログラムの起動を指示した場合に、下記の処理が実行される。
図17に示すように、制御部10は、記憶部11に記憶されたプログラムを起動し(S1)、操作部13からの入力に基づいて、ユーザが指定した電子書籍を特定する(S2)。例えば、S1において起動するプログラムは、電子書籍リーダーのアプリケーションである。S1においては、制御部10は、記憶部11に画像データが記憶された電子書籍の一覧を表示部14に表示させ、S2において、制御部10は、一覧の中からユーザにより指定された電子書籍を特定することになる。
制御部10は、記憶部11を参照して、ユーザが指定した電子書籍データを取得する(S3)。なお、記憶部11には、ユーザが保有する電子書籍の識別情報と、電子書籍データと、が関連付けられて記憶されているものとする。
制御部10は、S3で取得した電子書籍データに基づいて、電子書籍の最初のページPのページ関連データを生成する処理を実行する(S4)。図18は、ページ関連データ生成処理の説明図である。図18に示すように、制御部10は、ページ関連データの生成対象となるページPに対して2値化処理と反転処理を実行する(S40)。S40においては、制御部10は、2値化して反転したページP(図6)のデータを生成して記憶部11に記録する。
制御部10は、S40で生成したページP内に対して、輪郭抽出処理を実行する(S41)。S41においては、制御部10は、ページP内の輪郭線(図7)を示すデータを生成して記憶部11に記録する。
制御部10は、S41で抽出した輪郭線のうち、基準以上の大きさの輪郭線を拡大させる(S42)。S42においては、制御部10は、拡大した輪郭線(図7)を示すデータを生成して記憶部11に記録する。なお、制御部10は、このデータを新たに生成するのではなく、S41で記憶部11に記録した輪郭線のデータを更新するようにしてもよい。
制御部10は、S40で生成したページPに、S42で拡大した輪郭線を重畳させる(S43)。S43においては、制御部10は、重畳後のページP(図9)を示すデータを生成して記憶部11に記録する。なお、制御部10は、このデータを新たに生成するのではなく、S41で記憶部11に記録したページPのデータを更新するようにしてもよい。
制御部10は、S43で輪郭線を重畳させたページP内の領域を拡張させる(S44)。S44においては、制御部10は、拡張後のページP(図12)を示すデータを生成して記憶部11に記録する。なお、制御部10は、このデータを新たに生成するのではなく、S41又はS43で記憶部11に記録したページPのデータを更新するようにしてもよい。
制御部10は、S44で拡張したページPの領域のうち、基準未満の大きさの領域を除去する(S45)。S45においては、制御部10は、基準未満の大きさの領域を除去した後のページP(図13)を示すデータを記憶部11に記録する。なお、制御部10は、このデータを新たに生成するのではなく、S41、S43、又はS44で記憶部11に記録したページPのデータを更新するようにしてもよい。
制御部10は、S45で領域が除去されたページPに対して、輪郭抽出処理を実行する(S46)。S46の処理内容は、S41と同様であり、S46で抽出される輪郭は、文字領域候補の輪郭である。S46においては、制御部10は、S45で領域が除去されたページP内の輪郭線(図14)を示すデータを生成して、ページPのページ関連データとして記憶部11に記録する。
S4においては、電子書籍の最初のページPに対して上記の処理が実行されて、ページPのページ関連データが生成される。制御部10は、最初のページPを表示部14に表示させ(S5)、表示部14に表示されたページPの次のページPのページ関連データを生成する(S6)。S6においては、制御部10は、ページPに対して図18に示すS40〜S46の処理を実行して、ページPのページ関連データを生成して記憶部11に記録することになる。
制御部10は、操作部13からの入力を受け付ける(S7)。ここでは、ユーザは、文字領域候補の指定操作、ページ送り操作、又は終了操作の何れかをすることができるものとする。ユーザが文字領域候補の指定操作をしたと判定された場合(S7;指定操作)、制御部10は、指定された文字領域候補内に文字が含まれるか否かを判定する(S8)。S8においては、制御部10は、学習データと文字領域候補内の画素値とに基づいて、文字領域候補内に文字が含まれるか否かを判定する。
文字領域候補内に文字が含まれると判定された場合(S8;Y)、制御部10は、指定操作により指定された文字領域候補内を拡大表示させる(S9)。S9においては、制御部10は、表示中のページPから文字領域候補の内部を切り出して、表示部14に拡大して表示させる。
一方、ユーザがページ送り操作をしたと判定された場合(S7;ページ送り操作)、制御部10は、次のページPN+1を表示部14に表示させ(S10)、S6に戻る。なお、表示中のページPを示す情報は、記憶部11に記憶されているものとする。S6に戻った後は、S10で表示部14に表示されるのはページPN+1になるので、制御部10は、その次のページPN+2に対してページ関連データの生成処理を実行することになる。
一方、ユーザが終了操作をしたと判定された場合(S7;終了操作)、本処理は終了する。なお、記憶部11に記録されたページ関連データ等の各種データは、本処理の終了時に破棄してもよいし、表示部14から該当するページが表示されなくなったときに破棄してもよい。他にも例えば、表示部14に表示されているページとのページ差が基準以上になった場合に破棄してもよい。
以上説明した電子書籍表示装置1によれば、電子書籍データとは別に予めページ関連データを記憶部11に保持しておくのではなく、電子書籍リーダーのアプリケーションが起動してページPが表示部14に表示される場合に次のページPについてページ関連データを生成するので、ページ関連データを常に保持しておく必要がなくなり、記憶部11のメモリ使用量を抑えつつ、ページ関連データを利用可能にすることができる。
また、ページ関連データ生成部104が文字領域候補をページ関連データとして生成して記録するので、文字判定まで実行するわけではなく、文字領域候補の抽出まで実行すればよいので、電子書籍表示装置1の処理負荷を軽減しつつ、ページ関連データの生成及び文字判定の実行をすることができる。また、文字判定結果を利用して拡大表示をすることで、文字と判定された領域を見やすくすることができる。
[2.実施形態2]
次に、本発明の別実施形態について説明する。実施形態1では、あるページPが表示部14に表示される前に、文字領域候補を予め抽出してページ関連データとして生成し、当該ページPが表示部14に表示された後に、ユーザが指定した文字領域候補に対して文字判定を実行する場合を説明した。実施形態2では、ページPが表示部14に表示される前に、文字領域候補ではなく、当該ページPの各領域に対して文字判定まで予め完了する。即ち、実施形態2では、ページPが表示部14に表示される前に、文字と判定した領域である文字領域の抽出まで完了し、ページ関連データとして生成する場合を説明する。
なお、実施形態2の電子書籍表示装置1のハードウェア構成は、実施形態1と同様なので、説明を省略する。以降、実施形態1と同様の箇所については説明を省略し、実施形態1と異なる部分について説明する。
[2−1.実施形態2において実現される機能]
図19は、実施形態2の機能ブロック図である。実施形態2では、ページPの表示前に文字判定を完了するので、図19に示すように、電子書籍表示装置1は、操作後文字判定部106を含まない。なお、実施形態1の機能ブロックの説明時と同様、ここでは、表示制御部103がページP20を表示部14に表示させた場合に、次のページP21が表示部14に表示される前に、ページ関連データ生成部104がページP21のページ関連データを生成する場合を例に挙げて説明する。
実施形態2のページ関連データ生成部104は、ページP21が表示部14に表示される前に、ページP21内の文字領域を抽出してページ関連データとして生成して記録する。文字領域は、画像内のうち文字判定処理によって文字と判定された部分である。文字領域の抽出方法自体は、公知の種々の手法を適用可能であり、実施形態1と同様の方法を用いてもよいが、ここでは、光学文字認識(OCR:Optical Character Recognition)を用いて、ページP内の文字を1文字ずつ抽出する場合を説明する。
実施形態2のデータ記憶部100は、光学文字認識で用いるテンプレートデータを記憶する。テンプレートデータには、文字コードで表現可能な文字の基本形状が定義されている。ページ関連データ生成部104は、ページP21の各領域とテンプレートデータとを比較することによって、ページP21から文字領域を抽出する。
例えば、ページ関連データ生成部104は、ページP21の各領域とテンプレートデータに定義された基本形状とのパターンマッチングを行う。ページ関連データ生成部104は、ページP21の各領域の輪郭又は当該領域自身の形状と、テンプレートデータに定義された各文字の輪郭又は文字自身の形状と、の類似度を計算する。ページ関連データ生成部104は、類似度が基準以上である領域を文字であると判定する。
図20は、光学文字認識の結果を示す図である。図20に示す例は、図4に示すページP21を光学文字認識した結果を表している。ページ関連データ生成部104は、光学文字認識により、文字群24Aの「H」「E」「L」「L」「O」「!」「H」「O」「W」「A」「R」「E」「Y」「O」「U」「?」をそれぞれ文字として判定する。同様に、ページ関連データ生成部104は、文字群24Bの「F」「I」「N」「E」「!」「T」「H」「A」「N」「K」「Y」「O」「U」「!」をそれぞれ文字として判定する。ページ関連データ生成部104は、これら各文字を別個の文字領域として抽出してもよいが(即ち、1文字につき1つの文字領域として抽出してもよいが)、実施形態2では、距離が近い文字同士をグルーピングして1つの文字領域として抽出する場合を説明する。
ページ関連データ生成部104は、文字と特定した各領域同士の距離(スクリーン座標系における距離)を計算し、基準距離L以内の文字同士を同じグループとする。例えば、ページ関連データ生成部104は、文字群24Aの一部である「HELLO!」の「H」と「E」の距離を計算し、互いの距離が基準距離L以内であるか否かを判定する。ここでは、基準距離L以内であるので、「H」と「E」を同じグループと判定し、「H」と「E」のそれぞれにグループ番号「1番」を付与する。各文字に対して同様の処理が実行されると、「H」「E」「L」「L」「O」「!」「H」「O」「W」「A」「R」「E」「Y」「O」「U」「?」の各々に対して「1番」のグループ番号が付与され、「F」「I」「N」「E」「!」「T」「H」「A」「N」「K」「Y」「O」「U」「!」の各々に対して、「2番」のグループ番号が付与される。これにより、ページ関連データ生成部104は、文字群24Aの「HELLO! HOW ARE YOU?」をひとかたまりの文字領域として抽出し、文字群24Bの「FINE! THANK YOU!」をひとかたまりの文字領域として抽出することができる。
ページ関連データ生成部104は、上記のように抽出した文字領域を示すページ関連データをデータ記憶部100に記録することになる。ここでは、ページ関連データには、グループ番号と、当該グループ番号に属する領域の位置(スクリーン座標系における画素の座標)と、が関連付けられている。
なお、実施形態1の指定操作受付部105は、文字領域候補の指定操作を受け付けたが、実施形態2の指定操作受付部105は、ページP21が表示部14に表示された場合に、文字領域の指定操作を受け付ける。例えば、操作部13により指定された位置を含む文字領域が、指定操作により指定されることになる。
また、実施形態2の表示制御部103は、指定操作受付部105により指定操作が受け付けられた場合に、指定操作により指定された文字領域内を拡大して表示部14に表示させることになる。例えば、表示制御部103は、指定操作により指定された文字領域のグループ番号が付与された各文字を切り出して、拡大画像26として表示させる。拡大画像26が表示される様子は、実施形態1で説明した図16と同様である。拡大画像26の各文字の色を反転してもよいし、反転せずにそのままの色で表示させてもよい点も、実施形態1と同様である。
[2−2.実施形態2において実行される処理]
図21は、実施形態2のフロー図である。図21に示すように、S21〜S23は、S1〜3と同様である。S24は、最初のページPのページ関連データを生成する点はS4と同様であるが、ページ関連データは、実施形態1では文字領域候補を示し、実施形態2では文字領域を示すので、S24の処理内容は、S4と異なる。
図22は、実施形態2のページ関連データ生成処理の説明図である。図22に示すように、まず、制御部10は、ページPに対して輪郭抽出処理を実行する(S240)。輪郭抽出処理自体は、S41と同様である。制御部10は、ページP内の輪郭線を示すデータを生成して記憶部11に記録する。なお、S240における輪郭抽出処理は、ページP内の領域を抽出するためのものであり、輪郭抽出以外の方法で領域を抽出してもよい。
制御部10は、S240で輪郭を抽出した各領域と、記憶部11に記憶されたテンプレートと、に基づいて、当該領域が文字であるか否かを判定する(S241)。S241においては、制御部10は、互いの類似度を計算して基準以上であるか否かを判定することになる。制御部10は、基準以上の類似度となる領域を示すデータを記憶部11に記録する。
制御部10は、S241で文字と判定した各領域の距離を計算して、領域同士のグルーピングをする(S242)。S242においては、制御部10は、S241で記録した各領域のスクリーン座標系での距離を計算し、基準距離L以内となる領域に同じグループ番号を付与する。
制御部10は、S242でグルーピングした領域に基づいて、文字領域を抽出する(S243)。S243においては、制御部10は、グループ番号と、当該グループ番号が付与された領域と、を示すデータを生成して、ページ関連データとして記憶部11に記録する。
図17に戻り、S25〜S27は、それぞれS5,S24,S7と同様である。S26においては、ページPに対してS240〜S243の処理が実行されて、ページPの文字領域が抽出されることになる。なお、実施形態2の指定操作は、実施形態1のように文字領域候補を指定する操作ではなく、文字領域を指定する操作である。なお、実施形態2では、既に文字判定が完了しているので、実施形態1とは異なり、S8の処理は実行されない。
ユーザが文字領域の指定操作をしたと判定された場合(S27;指定操作)、制御部10は、指定操作により指定された文字領域を拡大表示させる(S28)。S28においては、制御部10は、表示中のページPから文字領域を切り出して、表示部14に拡大して表示させる。なお、S29は、S10と同様であり、制御部10は、ページ送り操作に応じて次のページPN+1を表示部14に表示させて、S26に戻る。この場合、S26においては、表示部14にはページPN+1が表示されているので、その次のページPN+2に対してS240〜S243の処理が実行されて、ページPN+2の文字領域が抽出されることになる。
以上説明した実施形態2によれば、電子書籍データとは別に予めページ関連データを記憶部11に保持しておくのではなく、電子書籍リーダーのアプリケーションが起動してページPが表示部14に表示される場合に次のページPについてページ関連データを生成するので、ページ関連データを常に保持する必要がなくなり、記憶部11のメモリ使用量を抑えつつ、ページ関連データを利用可能にすることができる。更に、実施形態1のように指定操作をしてから文字判定を行うわけではなく、予め文字領域の抽出まで完了するため、指定操作が行われてから拡大表示するまでの時間を短縮することができる。
[3.変形例]
なお、本発明は、以上に説明した実施の形態に限定されるものではない。本発明の趣旨を逸脱しない範囲で、適宜変更可能である。
(1)まず、実施形態1に関連する変形例を説明する。図23は、変形例(1)の機能ブロック図である。図23に示すように、実施形態1の機能に加えて、操作前文字判定部107と大きさ判定部108が実現される。これらの機能は、制御部10を主として実現される。なお、ここでは、実施形態1と同様、ページ関連データ生成部104がページP21のページ関連データを生成する場合を例に挙げて説明する。
(1−1)例えば、ページP21に対して指定操作が行われる前に、ページP21内の文字領域候補に対して簡易的な文字判定処理を実行しておき、簡易的な文字判定処理によって文字が含まれないと判定された文字領域候補に対しては詳細な文字判定処理を実行せず、簡易的な文字判定処理によって文字が含まれると判定された文字領域候補に対して詳細な文字判定処理を実行するようにしてもよい。
変形例(1−1)では、操作前文字判定部107が実現される。操作前文字判定部107は、指定操作受付部105により指定操作が受け付けられる前に、文字領域候補に対して第1の文字判定処理を実行する。第1の文字判定処理としては、種々の文字判定処理を適用可能であるが、後述する第2の文字判定処理よりも精度が低いものである。ここでの精度が低いとは、文字を検出する精度のことである。
第1の文字判定処理は、第2の文字判定処理よりも簡易であり、処理を完了するまでの時間が第2の文字判定処理よりも短い。第1の文字判定処理における判定項目は、第2の文字判定処理よりも少ない。例えば、第1の文字判定処理では、輪郭の形状のみを判定し、第2の文字判定処理では、形状とそれ以外の要素(例えば、周囲の領域との位置関係や白画素と黒画素のパターン)について判定するようにしてもよい。
ここでは、第2の文字判定処理は、実施形態1で説明した第1の判定項目〜第5の判定項目の全てを実行し、第1の文字判定処理は、第1の判定項目だけを行うものとする。なお、第1の文字判定処理は、第1の判定項目ではなく、第2の判定項目〜第5の判定項目の何れかだけを行ってもよいし、第1の判定項目〜第5の判定項目のうちの何れか2つ以上4つ以下の判定項目について判定処理を実行してもよい。
図14の例の場合、文字領域候補としては、文字群24A,24B以外にも、キャラクタ22B、太陽25A、食器25Bが抽出されているが、操作前文字判定部107は、事前に第1の文字判定処理を実行することによって、比較的小さい太陽25A、食器25Bには文字が含まれていないと判定する。このため、ページP21が表示部14に表示される前に、第2の文字判定処理の対象となりうる文字領域候補が、文字群24A,24Bと、キャラクタ22Bに絞り込まれている。
操作後文字判定部106は、操作前文字判定部107により文字が含まれると判定された文字領域候補が指定操作により指定された場合に、第1の文字判定処理よりも精度の高い第2の文字判定処理を実行する。第2の文字判定処理は、実施形態1で説明したものと同様であってよい。操作後文字判定部106は、操作前文字判定部107により文字が含まれないと判定された文字領域候補が指定操作により指定されたとしても、当該文字領域候補に対しては第2の文字判定処理を実行しないことになる。
なお、操作前文字判定部107により文字が含まれないと判定された文字領域候補が操作後文字判定部106の判定対象とならないようにすればよく、指定操作受付部105が、当該文字領域候補の指定操作を受け付けないように制限してもよいし、当該文字領域候補の指定操作の受け付けは制限しないが、操作後文字判定部106が第2の文字判定処理を単に実行しないようにしてもよい。
変形例(1−1)によれば、比較的簡易な第1の文字判定処理を事前にすることで、文字領域候補を予め絞り込むことができる。例えば、第1の文字判定処理により文字を含まないと判定された文字領域候補を示すページ関連データを破棄すれば、メモリ容量を有効活用することができる。また、文字領域候補を絞り込むことにより、第1の文字判定処理により文字ではないと判定された文字領域候補に対しては詳細な第2の文字判定処理を実行しなくてよくなるので、電子書籍表示装置1の処理負荷を軽減することができる。
(1−2)また例えば、ページP21内の文字領域候補が少ない場合は絵が多く文字が少ないので、ページP21が表示部14に表示されたとしても、ユーザがページP21をすぐに読んで次のページP22へのページ送り操作を行う蓋然性が高い。ページP21の表示時間が短い場合、ページP22が表示されるまでに、ページP22の文字領域候補の抽出が間に合わない可能性がある。このため、ページP21内の文字領域候補が少ない場合は、ページP21が表示される前であっても、次のページP22の文字領域候補の抽出をするようにしてもよい。
ページ関連データ生成部104は、ページP21内の文字領域候補の数が基準未満である場合、ページP21の次のページP22の文字領域候補を更に抽出してページ関連データとして生成して記録するようにしてもよい。この基準を示す閾値Tは、固定値であってもよいし、可変値であってもよい。
ページ関連データ生成部104は、ページP21に対して抽出した文字領域候補の数をカウントし、閾値T以上であるか否かを判定する。ページ関連データ生成部104は、ページP21の文字領域候補の数が閾値T以上であると判定した場合、ページP20が表示部14に表示されている間は、ページP22の文字領域候補はまだ抽出しない。この場合、ページP22の文字領域候補は、ページP21が表示部14に表示された場合に抽出されることになる。
一方、ページ関連データ生成部104は、ページP21の文字領域候補の数が閾値T未満であると判定した場合、ページP20が表示部14に表示されている状態であっても(ページP21が表示部14に表示される前であっても)、ページP22の文字領域候補を抽出する。文字領域候補の抽出方法自体は、実施形態1で説明した方法と同じである。
変形例(1−2)によれば、ページP21の文字領域候補の数が少ない場合には、次のページP22に対してもページ関連データを生成するので、ユーザがページP21をわずかな時間で読んでページP22を表示させたとしても、ページP22が表示部14に表示されるときにはページ関連データの生成を終えることができる。その結果、ユーザがページP22に対して指定操作をしても、ページ関連データの生成が終了しておらず、拡大表示が間に合わないようなことを防止することができる。
(1−3)また例えば、実施形態1では、判定制限部104Cにより、小さい領域を予め除去しておき、操作後文字判定部106による文字判定の対象外となるようにしたが、判定制限部104Cを省略して、ページ関連データ生成部104が、小さい領域であっても文字領域候補として抽出するようにしてもよい。この場合、ページ関連データ生成部104は、文字領域候補の大きさを判定して、文字領域候補が小さければ、操作後文字判定部106による文字判定の対象外とするようにしてもよい。
変形例(1−3)では、大きさ判定部108が実現される。大きさ判定部108は、文字領域候補の輪郭又は文字領域候補自身の大きさが基準以上であるか否かを判定する。この基準は、実施形態1の判定制限部104Cが使用した閾値Tと同じであってよい。大きさ判定部108の判定方法は、実施形態1の判定制限部104Cによる判定方法と同じである。
操作後文字判定部106は、大きさ判定部108により基準未満の大きさと判定された文字領域候補は判定対象とせず、大きさ判定部108により基準以上の大きさと判定された文字領域候補に文字が含まれるか否かを判定する。即ち、操作後文字判定部106は、基準未満の大きさと判定された文字領域候補は、文字判定の対象となることを制限する。この制限方法は、実施形態1で説明した判定制限部104Cと同じであってよい。即ち、操作後文字判定部106は、文字領域候補の輪郭の大きさが基準未満である場合、当該文字領域候補を背景色で塗りつぶすようにしてよい。
変形例(1−3)によれば、基準未満の大きさの文字領域候補については文字判定の対象とはしないので、文字領域である蓋然性が低い領域に対して文字判定が行われることを防止することができ、電子書籍表示装置1の処理負荷を軽減することができる。例えば、基準未満の大きさの文字領域候補を示すページ関連データを破棄すれば、メモリ容量を有効活用することができる。
(1−4)また例えば、ユーザは、ページP21を上の方から下に向けて順番に読むため、ページP21が表示部14に表示される前に、ページP21の全体ではなく、ページP21の上の方のみ(即ち、ユーザが先に読む部分のみ)、文字領域候補を抽出するようにしてもよい。
本変形例のページ関連データ生成部104は、第1抽出部104Dと第2抽出部104Eの少なくとも一方を含む。第1抽出部104Dは、ページP21の下部領域は文字領域候補を抽出せずに上部領域内の文字領域候補を抽出する。
図24は、ページP21の上部領域及び下部領域の説明図である。図24に示す例では、ページP21のキャラクタ22A等を省略している。例えば、ページP21の左上をスクリーン座標系の原点Oとすると、上部領域P21Uは、ページP21の上端(Y=0)から所定距離D以内の部分である。下部領域P21Uは、ページP21の下端(Y=YMAX)から所定距離D以内の部分であり、ここでは、上部領域P21U以外の部分である。第1抽出部104Dは、ページP21の全体ではなく、上部領域P21Uについてのみ、文字領域候補を抽出する。文字領域候補の抽出方法は、実施形態1と同様であってよい。
第2抽出部104Eは、ページP21内の各文字領域の読み順に、基準数になるまで文字領域候補を抽出する。文字領域の読み順とは、ページP21内に複数の文字領域が散らばっている場合の各文字領域の読み順である。例えば、文字が横書きであれば、左上に近い方が早い順番になり、文字が縦書きであれば、右上に近い方が早い順番になる。
図25は、ページP21における読み順の説明図である。図25の例では、ページP21は、3つのコマ21A〜21Cを含む。コマ21Aは、キャラクタ22A,22Bと、吹き出し線23A,23Bと、文字群24A,24Bと、を含む。コマ21Bは、キャラクタ22Cと、吹き出し線23Cと、文字群24Cと、を含む。コマ21Cは、キャラクタ22Dと、吹き出し線23Dと、文字群24Dと、を含む。ここでは、4つの文字群24A〜24Dがあるが、ここでは文字が横書きなので、これらの読み順は、ページP21の左上である原点Oに近い順となり、文字群24A・24B・24C・24Dとなる。ここで、基準数を2つとすると、第2抽出部104Eは、ページP21内の各文字領域の読み順に、文字群24A・24Bに対応する文字領域候補まで抽出することになる。第2抽出部104Eは、それ以降の文字領域候補は所定のタイミングが到来するまで抽出しない。
変形例(1−4)によれば、ページP21が表示部14に表示された場合にユーザが先に読む蓋然性が高い上部領域P21Uや読み順が先の部分に対して優先的にページ関連データを生成するので、ユーザがページP22に対して指定操作をしても、ページ関連データの生成が終了しておらず、拡大表示が間に合わないようなことを防止することができる。
(2)次に、実施形態2に関連する変形例を説明する。図26は、変形例(2)の機能ブロック図である。図26に示すように、実施形態2の機能に加えて、文字領域候補抽出部104Fと大きさ判定部104Gが実現される。なお、変形例2では、実施形態2と同様、ページ関連データ生成部104がページP21のページ関連データを生成する場合を例に挙げて説明する。
(2−1)例えば、実施形態2では、ページ関連データ生成部104が光学文字認識を利用して文字領域を抽出する場合を説明したが、実施形態1と同様の方法で文字領域を抽出してもよい。変形例(2−1)では、文字領域候補抽出部104Fが実現される。文字領域候補抽出部104Fは、ページP21が表示部14に表示される前に、ページP21内の文字領域候補を抽出する。
文字領域候補抽出部104Fは、実施形態1で説明したページ関連データ生成部104と同様の機能である。文字領域候補抽出部104Fは、図4に示す状態のページP21から図14に示す文字領域候補を抽出することになる。
ページ関連データ生成部104は、文字領域候補に文字が含まれるか否かを判定することによって、文字領域を抽出することになる。この判定方法は、実施形態1で説明した操作後文字判定部106と同じであってよい。
変形例(2−1)によれば、文字領域候補に対して文字判定を実行すればよくなるので、画像全体に対して文字判定を行う場合よりも効率よく文字判定をすることができる。
(2−2)また例えば、実施形態2でも、変形例(1−1)と同様に、簡易的な文字判定処理と、詳細な文字判定処理と、の2段階の文字判定を実行してもよい。ページ関連データ生成部104は、ページP21が表示部14に表示される前に、文字領域候補に対して第1の文字判定処理を実行する。第1の文字判定処理は、変形例(1−1)と同様である。
ページ関連データ生成部104は、当該第1の文字判定処理により文字が含まれると判定された文字領域候補に対して、第1の文字判定処理よりも精度の高い第2の文字判定処理を実行することによって、文字領域を抽出する。第2の文字判定処理は、変形例(1−1)と同様である。
変形例(2−2)によれば、比較的簡易な第1の文字判定処理を事前にすることで、文字領域候補を予め絞り込むことができる。例えば、第1の文字判定処理により文字を含まないと判定された文字領域候補を示すページ関連データを破棄すれば、メモリ容量を有効活用することができる。また、文字領域候補を絞り込むことにより、第1の文字判定処理により文字ではないと判定された文字領域候補に対しては詳細な第2の文字判定処理を実行しなくてよくなるので、電子書籍表示装置1の処理負荷を軽減することができる。
(2−3)また例えば、実施形態2でも、変形例(1−3)と同様に、文字領域候補が小さければ、操作後文字判定部106による文字判定の対象外とするようにしてもよい。変形例(2−3)では、大きさ判定部104Gが実現される。大きさ判定部104Gの機能は、変形例(1−3)の大きさ判定部108と同じである。
ページ関連データ生成部104は、大きさ判定部104Gにより基準未満の大きさと判定された文字領域候補は判定対象とせず、大きさ判定部104Gにより基準以上の大きさと判定された文字領域候補に文字が含まれるか否かを判定することによって、文字領域を抽出することになる。この処理内容自体は、変形例(1−3)の操作後文字判定部106や実施形態1の判定制限部104Cと同じであってよい。
変形例(2−3)によれば、基準未満の大きさの文字領域候補については文字判定の対象とはしないので、文字領域である蓋然性が低い領域に対して文字判定が行われることを防止することができ、電子書籍表示装置1の処理負荷を軽減することができる。例えば、基準未満の大きさの文字領域候補を示すページ関連データを破棄すれば、メモリ容量を有効活用することができる。
(2−4)また例えば、実施形態2でも、変形例(1−2)と同様に、ページP21のから抽出された文字領域の数が少なければ、ページP21が表示部14に表示されたとしても、ユーザがページP21をすぐに読んで次のページP22へのページ送り操作を行う蓋然性が高い。このため、ページ関連データ生成部104は、ページP21内の文字領域の数が基準未満である場合、ページP21の次のページP22内の文字領域を更に抽出してページ関連データとして生成して記録するようにしてもよい。変形例(1−2)ではページP22の文字領域候補が抽出され、変形例(2−4)ではページP22の文字領域が抽出される点ではことなるが、他の点は変形例(1−2)と同じである。
変形例(2−4)によれば、ページP21の文字領域の数が少ない場合には、次のページP22に対してもページ関連データを生成するので、ユーザがページP21をわずかな時間で読んでページP22を表示させたとしても、ページP22が表示部14に表示されるときにはページ関連データの生成を終えることができる。その結果、ユーザがページP22に対して指定操作をしても、ページ関連データの生成が終了しておらず、拡大表示が間に合わないようなことを防止することができる。
(2−5)また例えば、実施形態2でも、変形例(1−4)と同様に、ページP21の上部領域のみ文字領域を抽出するようにしてもよい。変形例(2−5)のページ関連データ生成部104は、第1抽出部104Dと第2抽出部104Eの少なくとも一方を含む。
第1抽出部104Dは、ページP21の下部領域P21Dは文字領域を抽出せずに上部領域P21U内の文字領域を抽出する。第1抽出部104Dは、上部領域P21Uのみを文字領域の抽出対象とする。上部領域P21Uや下部部域P21Dの意味は、変形例(1−4)で説明した通りである。第2抽出部104Eは、ページP21内の各文字領域の読み順に、基準数になるまで文字領域を抽出する。読み順の意味は、変形例(1−4)で説明した通りである。ここで、基準数を2つとすると、第2抽出部104Eは、ページP21内の各文字領域の読み順に、文字群24A・24Bに対応する文字領域まで抽出することになる。第2抽出部104Eは、それ以降の文字領域は所定のタイミングが到来するまで抽出しない。
変形例(2−5)によれば、ページP21が表示部14に表示された場合にユーザが先に読む蓋然性が高い上部領域P21Uや読み順が先の部分に対して優先的にページ関連データを生成するので、ユーザがページP22に対して指定操作をしても、ページ関連データの生成が終了しておらず、拡大表示が間に合わないようなことを防止することができる。
(3)以降、実施形態1,2の両方に関連する変形例について説明する。ここでは、変形例(3)の各構成を実施形態1に適用した場合を説明するが、変形例(3)の構成は、実施形態2にも適用可能である。
図27は、変形例(3)の機能ブロック図である。図27に示すように、実施形態1の機能に加えて、履歴データ取得部109、ページデータ取得部110、年齢取得部111、及びサイズ取得部112の少なくとも1つが実現される。これらの機能は、制御部10を主として実現される。なお、変形例(3)では、実施形態1と同様、ページ関連データ生成部104がページP21のページ関連データを生成する場合を例に挙げて説明する。
(3−1)例えば、ユーザによっては指定操作をあまり行わず、拡大表示の必要性が低いこともある。このため、ユーザによる過去の指定操作の履歴を記録しておき、拡大表示を必要とするユーザについてのみ、ページ関連データの生成を行うようにしてもよい。
変形例(3−1)では、履歴データ取得部109が実現される。履歴データ取得部109は、当該電子書籍表示装置1のユーザによる指定操作の履歴に関する履歴データを記憶するデータ記憶部100に記憶された履歴データを取得する。履歴データは、過去の全期間における指定操作の回数を示してもよいし、一定期間における指定操作の回数を示してもよい。更に、履歴データは、指定操作が行われたページ数を示してもよい。例えば、指定操作受付部105は指定操作を受け付けると履歴データを更新する。
本変形例のページ関連データ生成部104は、頻度判定部104Hを含む。頻度判定部104Hは、履歴データに基づいて、ユーザによる指定操作の頻度が基準以上であるか否かを判定する。例えば、頻度判定部104Hは、過去の全期間における指定操作の回数が基準以上であるか否かを判定してもよいし、一定期間における指定操作の回数が基準以上であるか否かを判定してもよい。他にも例えば、頻度判定部104Hは、現在表示中のページ数と、ユーザが指定操作をした直近のページ数と、の差が基準数以上であるか否か(即ち、基準ページ数以上連続して指定操作をしていないか否か)を判定してもよい。
ページ関連データ生成部104は、頻度判定部104Hにより基準以上であると判定された場合にページ関連データを生成して記録する。即ち、ページ関連データ生成部104は、頻度判定部104Hにより基準未満であると判定された場合にはページ関連データを生成しない。
変形例(3−1)によれば、ユーザによる指定操作の頻度を参照してページ関連データの生成の要否を決定するので、ユーザの傾向に応じた処理を行うことができる。即ち、拡大表示をする必要性が低いユーザに対しては、ページ関連データを予め生成しなくてもよいので、このようなユーザの場合はページ関連データを生成しないことで、メモリ容量を有効活用し、かつ、電子書籍表示装置1の処理負荷も軽減することができる。
(3−2)また例えば、ユーザが繰り返し電子書籍を読む場合、前回の読書時に拡大表示をしたページは、今回も表示をする蓋然性が高い。このため、ユーザが拡大表示をさせたページを記録しておいて、そのページについてはページ関連データを生成し、他のページについてはページ関連データを生成しないようにしてもよい。
変形例(3−2)では、ページデータ取得部110が実現される。ページデータ取得部110は、当該電子書籍表示装置1のユーザにより指定操作が行われたページに関するページデータを記憶するデータ記憶部100に記憶されたページデータを取得する。ページデータは、ユーザが指定操作を行ったページ数が格納される。例えば、指定操作受付部105は指定操作を受け付けるとページデータを更新する。
ページ関連データ生成部104は、過去判定部104Iを含む。過去判定部104Iは、ページデータに基づいて、ユーザによりページP21に対して過去に指定操作が行われたか否かを判定する。過去判定部104Iは、ページデータを参照して、現在表示部14に表示されたページP20の次のページP21に対して過去に指定操作が行われたか否かを判定することになる。
ページ関連データ生成部104は、過去判定部104Iにより指定操作が行われたと判定された場合にページ関連データを生成して記録する。即ち、ページ関連データ生成部104は、過去判定部104Iにより指定操作が行われたと判定されない場合にはページ関連データを生成しない。
変形例(3−2)によれば、ユーザによる各ページに対する指定操作の有無を参照してページ関連データの生成の要否を決定するので、ユーザの傾向に応じた処理を行うことができる。即ち、拡大表示をする必要性が低いページに対しては、ページ関連データを予め生成しなくてもよいので、このようなページに対してはページ関連データを生成しないことで、メモリ容量を有効活用し、かつ、電子書籍表示装置1の処理負荷も軽減することができる。
(3−3)また例えば、ユーザは、同じ電子書籍を読んだ他のユーザが拡大表示したページは拡大表示する蓋然性が高い。このため、他のユーザが拡大表示をさせたページを記録しておいて、そのページについてはページ関連データを生成し、他のページについてはページ関連データを生成しないようにしてもよい。
変形例(3−3)では、ページデータ取得部110が実現される。ページデータ取得部110は、当該電子書籍表示装置1のユーザ以外の他のユーザにより指定操作が行われたページに関するページデータを記憶するサーバコンピュータに記憶されたページデータを取得する。ページデータ取得部110は、ネットワークを介してページデータを取得する。なお、サーバコンピュータは、電子書籍を管理しており、電子書籍をダウンロードしたユーザが指定操作を行うと、当該ユーザの電子書籍表示装置1からサーバコンピュータに対して、指定操作をしたページPを示すデータが送信される。サーバコンピュータは、当該データを受信すると、データベースに格納されたページデータを更新する。
過去判定部104Iは、ページデータに基づいて、他のユーザにより少なくとも一方のページに対して過去に指定操作が行われたか否かを判定する。この判定方法は、変形例(3−2)と同じである。ページ関連データ生成部104は、過去判定部104Iにより指定操作が行われたと判定された場合にページ関連データを生成して記録する。即ち、ページ関連データ生成部104は、過去判定部104Iにより指定操作が行われたと判定されない場合にはページ関連データを生成しない。
変形例(3−3)によれば、他のユーザによる各ページに対する指定操作の有無を参照してページ関連データの生成の要否を決定するので、一般的なユーザの傾向を考慮して処理を行うことができる。即ち、他のユーザが拡大表示をする必要性が低いと感じているページに対しては、電子書籍表示装置1のユーザも指定操作をする蓋然性は低く、ページ関連データを予め生成しなくてもよいので、このようなページに対してはページ関連データを生成しないことで、メモリ容量を有効活用し、かつ、電子書籍表示装置1の処理負荷も軽減することができる。
(3−4)また例えば、年齢の高いユーザは、拡大表示をする蓋然性が高い。このため、年齢の高いユーザについてのみページ関連データを生成するようにしてもよい。変形例(3−4)では、年齢取得部111が実現される。年齢取得部111は、電子書籍表示装置1のユーザの年齢に関する年齢情報を取得する。例えば、データ記憶部100に、年齢情報が記憶されていてもよい。この場合、年齢取得部111は、データ記憶部100から年齢情報を取得する。年齢情報は、ユーザの年齢を特定可能な情報であればよく、例えば、ユーザの年齢を示す数値や生年月日を示す数値である。なお、年齢取得部111は、ユーザの年齢を計算により求めてもよい。例えば、電子書籍の発行年数や電子書籍のレビューを記載したユーザプロフィールの平均年齢をサーバコンピュータから取得して年齢を推測してもよい。
ページ関連データ生成部104は、年齢判定部104Jを含む。年齢判定部104Jは、年齢情報に基づいて、ユーザの年齢が基準以上であるか否かを判定する。この基準の年齢は、データ記憶部100に記憶されているものとする。基準の年齢は、固定値であってもよいし、可変値であってもよい。
ページ関連データ生成部104は、年齢判定部104Jにより基準以上であると判定された場合にページ関連データを生成して記録する。即ち、ページ関連データ生成部104は、年齢判定部104Jにより基準未満であると判定された場合にはページ関連データを生成しない。
変形例(3−4)によれば、ユーザの年齢を参照してページ関連データの生成の要否を決定するので、ユーザの傾向に応じた処理を行うことができる。即ち、比較的若いユーザで拡大表示をする必要性が低いユーザに対しては、ページ関連データを予め生成しなくてもよいので、このようなユーザの場合はページ関連データを生成しないことで、メモリ容量を有効活用し、かつ、電子書籍表示装置1の処理負荷も軽減することができる。
(3−5)また例えば、表示部14の画面サイズが小さければ、拡大表示をする蓋然性が高い。このため、画面サイズが小さい場合にのみページ関連データを生成するようにして、画面サイズが大きい場合にはページ関連データを生成しないようにしてもよい。
変形例(3−5)では、サイズ取得部112が実現される。サイズ取得部112は、表示部14の画面サイズに関するサイズ情報を取得する。例えば、データ記憶部100に、サイズ情報が記憶されていてもよい。サイズ情報は、例えば、表示部14のインチ数を示す。
ページ関連データ生成部104は、サイズ判定部104Kを含む。サイズ判定部104Kは、サイズ情報に基づいて、表示部14の画面サイズが基準未満であるか否かを判定する。この基準のサイズは、データ記憶部100に記憶されているものとする。基準のサイズは、固定値であってもよいし、可変値であってもよい。
ページ関連データ生成部104は、サイズ判定部104Kにより基準未満であると判定された場合にページ関連データを生成して記録する。即ち、ページ関連データ生成部104は、サイズ判定部104Kにより基準以上であると判定された場合にはページ関連データを生成しない。
変形例(3−5)によれば、表示部14の画面サイズを参照してページ関連データの生成の要否を決定するので、表示部14に応じた処理を行うことができる。即ち、画面サイズが大きく拡大表示をする必要性が低い表示部14の場合は、ページ関連データを予め生成しなくてもよいので、このような表示部14の場合はページ関連データを生成しないことで、メモリ容量を有効活用し、かつ、電子書籍表示装置1の処理負荷も軽減することができる。
(4)上記説明した変形例(1)〜(3)以外にも、下記のようにしてもよい。
例えば、文字領域候補を抽出する方法自体は、文字領域の可能性があるものを抽出できればよく、公知の種々の手法を適用可能である。実施形態1等で説明した方法以外にも、領域の大きさが一定範囲のものを文字領域候補として抽出するようにしてもよい。同様に、文字判定方法自体も、公知の種々の手法を適用可能である。
また例えば、上記では、表示部14に表示されるページPの次のページPN+1に対してページ関連データが生成される場合を説明したが、ページ関連データ生成部104は、2ページ後のページPN+2に対してもページ関連データを生成してもよく、ページ関連データを生成するページ数の範囲は、これに限られない。同様に、表示部14に表示されるページPの前のページPN−1に対してページ関連データを生成してもよい。前のページPN−1に対してページ関連データを生成するか、次のページPN+1に対してページ関連データを生成するか、はページ送り操作によって、ページが戻ったか否かに応じて決めてもよい。即ち、ページ送りの方向に基づいて、前のページPN−1のページ関連データを生成するか、後のページPN+1のページ関連データを生成するか、を決定するようにしてもよい。
また例えば、ページ関連データを生成するページ数は、電子書籍表示装置1のメモリ容量又はメモリ残量に応じて決まってもよい。例えば、電子書籍表示装置1のメモリ容量又はメモリ残量が大きいほど、多くのページに対してページ関連データを生成するようにしてもよい。他にも例えば、ページ関連データを生成するページ数は、ページ送りの速度に応じて決まってもよい。例えば、ページ送りの速度が速いほど、多くのページに対してページ関連データを生成するようにしてもよい。なお、ページ送りの速度は、ユーザによるページ送り操作が行われる時間間隔に基づいて計算すればよい。また、各ページPの読書時間を計算し、当該計算した読書時間に応じてページ関連データを生成するページ数が決まってもよい。例えば、読書時間が短いほど、多くのページに対してページ関連データを生成するようにしてもよい。読書時間は、輪郭の数や領域の面積等によって計算すればよい。
また例えば、ユーザの操作を要することなくページを切り替える自動ページ送り機能があってもよい。この場合、表示制御部103は、あるページを一定時間だけ表示部14に表示させると、次のページに切り替えることになる。
また例えば、各コマ21に描かれる文字は、キャラクタが発する言葉だけでなく、キャラクタの心情や漫画の効果音を表すものであってもよい。このような文字であっても、拡張部104Bが領域を拡張することで、文字をかたまりとして認識可能である。また、実施形態では、漫画の台詞が英語で記述されている場合を例に挙げたが、電子書籍表示装置1で文字認識が可能な言語であればよく、他の言語であってよい。更に、キャラクタの台詞が横書きで記述される場合を説明するが、縦書きであってもよい。この場合、横書き用の学習パターンと、縦書き用の学習パターンと、の2つをデータ記憶部100に用意しておき、操作後文字判定部106は、横書き用と縦書き用の学習パターンの何れかで文字領域と判定されれば、文字領域候補を文字領域と判定すればよい。
また例えば、結合制限部104Aが行う2値化反転処理は省略してもよい。また、実施形態では、文字が吹き出し線に囲われている場合を説明したが、文字は、吹き出し線に囲われていなくてもよい。この場合、結合制限部104Aの処理は省略してよい。また、文字は、所定のフォントであってもよいし、手書きであってもよい。手書きの文字であっても、拡張部104Bの処理により文字をかたまりとして認識可能である。更に、吹き出し・コマ・ページによって、文字のフォントや大きさ・色彩・輝度が異なってもよい。フォントや大きさ・色彩・輝度が異なっていたとしても、拡張部104Bが画像内の領域を拡張させることで、文字をかたまりとして認識可能である。
また例えば、操作後文字判定部106により文字を含むと判定された文字領域候補を拡大表示する場合を説明したが、文字を含むと判定された文字領域候補に対する処理内容は、拡大表示に限られない。他にも、電子書籍表示装置1は、文字を含むと判定された文字領域候補内の文字を翻訳するようにしてもよいし、機械音声を出力するようにしてもよい。更に、電子書籍表示装置1は、文字を含むと判定された文字領域候補内をOCRにより文字抽出を行い、当該抽出した文字のデータを記憶部11に記録して、電子書籍における文字検索を可能なようにしてもよい。更に、表示制御部103は、文字領域と判定された文字領域候補内を切り出して拡大表示するのではなく、OCRにより検出した文字のデータに基づいて拡大表示してもよい。
また例えば、実施形態では、電子書籍の一例として漫画を説明したが、文字を含む電子書籍であれば、本発明は適用可能である。例えば、文字の周りに一定のスペースが存在する絵本や雑誌等に対しても、実施形態と同様の文字領域の抽出が可能なため、絵本や雑誌等に適用してもよい。

Claims (22)

  1. 複数のページからなる電子書籍データを記憶する手段に記憶された前記電子書籍データを取得するデータ取得手段と、
    前記データ取得手段により取得された電子書籍データに基づいて、前記複数のページのうち指定された1又は複数のページを表示手段に表示させる表示制御手段と、
    ページ関連データが生成されていないページが前記表示手段に表示される前に、当該ページ内の文字領域候補を抽出して前記ページ関連データとして生成して記憶手段に記録するページ関連データ生成手段と、
    前記ページ関連データが生成されたページが前記表示手段に表示された場合に、前記文字領域候補の指定操作を受け付ける受付手段と、
    前記受付手段により前記指定操作が受け付けられた後に、前記指定操作により指定された文字領域候補に文字が含まれるか否かを判定する操作後文字判定手段と、
    を含み、
    前記表示制御手段は、前記操作後文字判定手段により文字が含まれると判定された文字領域候補内を拡大して前記表示手段に表示させる、
    ことを特徴とする電子書籍表示装置。
  2. 前記電子書籍表示装置は、前記受付手段により前記指定操作が受け付けられる前に、前記文字領域候補に対して第1の文字判定処理を実行する操作前文字判定手段を更に含み、
    前記操作後文字判定手段は、前記操作前文字判定手段により文字が含まれると判定された文字領域候補が前記指定操作により指定された場合に、前記第1の文字判定処理よりも精度の高い第2の文字判定処理を実行する、
    ことを特徴とする請求項1に記載の電子書籍表示装置。
  3. 前記ページ関連データ生成手段は、前記ページ関連データが生成されたページ内の前記文字領域候補の数が基準未満である場合、当該ページの次のページの文字領域候補を更に抽出してページ関連データとして生成して記録する、
    ことを特徴とする請求項1又は2に記載の電子書籍表示装置。
  4. 前記電子書籍表示装置は、前記文字領域候補の輪郭又は前記文字領域候補自身の大きさが基準以上であるか否かを判定する大きさ判定手段を更に含み、
    前記操作後文字判定手段は、前記大きさ判定手段により基準未満の大きさと判定された前記文字領域候補は判定対象とせず、前記大きさ判定手段により基準以上の大きさと判定された前記文字領域候補に文字が含まれるか否かを判定する、
    ことを特徴とする請求項1〜3の何れかに記載の電子書籍表示装置。
  5. 前記ページ関連データ生成手段は、
    前記ページ関連データが生成されていないページの下部領域は文字領域候補を抽出せずに上部領域内の文字領域候補を抽出する手段と、
    前記ページ関連データが生成されていないページ内の各文字領域の読み順に、基準数になるまで文字領域候補を抽出する手段と、
    の少なくとも一方を含むことを特徴とする請求項1〜4の何れかに記載の電子書籍表示装置。
  6. 複数のページからなる電子書籍データを記憶する手段に記憶された前記電子書籍データを取得するデータ取得手段と、
    前記データ取得手段により取得された電子書籍データに基づいて、前記複数のページのうち指定された1又は複数のページを表示手段に表示させる表示制御手段と、
    ページ関連データが生成されていないページが前記表示手段に表示される前に、当該ページ内の文字領域を抽出してページ関連データとして生成して記憶手段に記録するページ関連データ生成手段と、
    前記ページ関連データが生成されたページが前記表示手段に表示された場合に、前記文字領域の指定操作を受け付ける受付手段と、
    を含み、
    前記表示制御手段は、前記受付手段により前記指定操作が受け付けられた場合に、前記指定操作により指定された文字領域内を拡大して前記表示手段に表示させる、
    ことを特徴とする電子書籍表示装置。
  7. 前記ページ関連データ生成手段は、前記ページ関連データが生成されていないページが前記表示手段に表示される前に、当該ページ内の文字領域候補を抽出する手段を含み、当該文字領域候補に文字が含まれるか否かを判定することによって、前記文字領域を抽出する、
    ことを特徴とする請求項6に記載の電子書籍表示装置。
  8. 前記ページ関連データ生成手段は、前記ページ関連データが生成されていないページが前記表示手段に表示される前に、前記文字領域候補に対して第1の文字判定処理を実行し、当該第1の文字判定処理により文字が含まれると判定された文字領域候補に対して、前記第1の文字判定処理よりも精度の高い第2の文字判定処理を実行することによって、前記文字領域を抽出する、
    ことを特徴とする請求項7に記載の電子書籍表示装置。
  9. 前記ページ関連データ生成手段は、前記文字領域候補の輪郭又は前記文字領域候補自身の大きさが基準以上であるか否かを判定する大きさ判定手段を含み、前記大きさ判定手段により基準未満の大きさと判定された前記文字領域候補は判定対象とせず、前記大きさ判定手段により基準以上の大きさと判定された前記文字領域候補に文字が含まれるか否かを判定することによって、前記文字領域を抽出する、
    ことを特徴とする請求項7又は8に記載の電子書籍表示装置。
  10. 前記ページ関連データ生成手段は、前記ページ関連データを生成したページ内の前記文字領域の数が基準未満である場合、当該ページの次のページ内の文字領域を更に抽出してページ関連データとして生成して記録する、
    ことを特徴とする請求項6〜9の何れかに記載の電子書籍表示装置。
  11. 前記ページ関連データ生成手段は、
    前記ページ関連データが生成されていないページの下部領域は文字領域を抽出せずに上部領域内の文字領域を抽出する手段と、
    前記ページ関連データが生成されていないページ内の各文字領域の読み順に、基準数になるまで文字領域を抽出する手段と、
    の少なくとも一方を含むことを特徴とする請求項6〜10の何れかに記載の電子書籍表示装置。
  12. 前記ページ関連データ生成手段は、前記電子書籍データの全ページのうちの一部のページの前記ページ関連データを生成する、
    ことを特徴とする請求項1〜11の何れかに記載の電子書籍表示装置。
  13. 前記表示制御手段は、電子書籍アプリケーションが起動した場合に、前記1又は複数のページを前記表示手段に表示させ、
    前記電子書籍表示装置は、前記電子書籍アプリケーションが終了する場合、又は、前記電子書籍アプリケーションの終了前の所定タイミングにおいて、前記記憶手段に記録された前記ページ関連データを破棄する破棄手段を更に含む、
    ことを特徴とする請求項1〜12の何れかに記載の電子書籍表示装置。
  14. 前記電子書籍表示装置は、当該電子書籍表示装置のユーザによる前記指定操作の履歴に関する履歴データを記憶する手段に記憶された前記履歴データを取得する手段を更に含み、
    前記ページ関連データ生成手段は、前記履歴データに基づいて、前記ユーザによる前記指定操作の頻度が基準以上であるか否かを判定する頻度判定手段を含み、前記頻度判定手段により基準以上であると判定された場合に前記ページ関連データを生成して記録する、
    ことを特徴とする請求項1〜13の何れかに記載の電子書籍表示装置。
  15. 前記電子書籍表示装置は、当該電子書籍表示装置のユーザにより前記指定操作が行われたページに関するページデータを記憶する手段に記憶された前記ページデータを取得する手段を更に含み、
    前記ページ関連データ生成手段は、前記ページデータに基づいて、前記ユーザにより前記ページ関連データが生成されていないページに対して過去に前記指定操作が行われたか否かを判定する過去判定手段を含み、前記過去判定手段により前記指定操作が行われたと判定された場合に前記ページ関連データを生成して記録する、
    ことを特徴とする請求項1〜14の何れかに記載の電子書籍表示装置。
  16. 前記電子書籍表示装置は、当該電子書籍表示装置のユーザ以外の他のユーザにより前記指定操作が行われたページに関するページデータを記憶する手段に記憶された前記ページデータを取得する手段を更に含み、
    前記ページ関連データ生成手段は、前記ページデータに基づいて、前記他のユーザにより前記ページ関連データが生成されていないページに対して過去に前記指定操作が行われたか否かを判定する過去判定手段を含み、前記過去判定手段により前記指定操作が行われたと判定された場合に前記ページ関連データを生成して記録する、
    ことを特徴とする請求項1〜14の何れかに記載の電子書籍表示装置。
  17. 前記電子書籍表示装置は、当該電子書籍表示装置のユーザの年齢に関する年齢情報を取得する手段を更に含み、
    前記ページ関連データ生成手段は、前記年齢情報に基づいて、前記ユーザの年齢が基準以上であるか否かを判定する年齢判定手段を含み、前記年齢判定手段により基準以上であると判定された場合に前記ページ関連データを生成して記録する、
    ことを特徴とする請求項1〜16の何れかに記載の電子書籍表示装置。
  18. 前記電子書籍表示装置は、前記表示手段の画面サイズに関するサイズ情報を取得する手段を更に含み、
    前記ページ関連データ生成手段は、前記サイズ情報に基づいて、前記表示手段の画面サイズが基準未満であるか否かを判定するサイズ判定手段を含み、前記サイズ判定手段により基準未満であると判定された場合に前記ページ関連データを生成して記録する、
    ことを特徴とする請求項1〜17の何れかに記載の電子書籍表示装置。
  19. 複数のページからなる電子書籍データを記憶する手段に記憶された前記電子書籍データを取得するデータ取得ステップと、
    前記データ取得ステップにより取得された電子書籍データに基づいて、前記複数のページのうち指定された1又は複数のページを表示手段に表示させる表示制御ステップと、
    ページ関連データが生成されていないページが前記表示手段に表示される前に、当該ページ内の文字領域候補を抽出して前記ページ関連データとして生成して記憶手段に記録するページ関連データ生成ステップと、
    前記ページ関連データが生成されたページが前記表示手段に表示された場合に、前記文字領域候補の指定操作を受け付ける受付ステップと、
    前記受付ステップにより前記指定操作が受け付けられた後に、前記指定操作により指定された文字領域候補に文字が含まれるか否かを判定する操作後文字判定ステップと、
    を含み、
    前記表示制御ステップでは、前記操作後文字判定ステップにより文字が含まれると判定された文字領域候補内を拡大して前記表示手段に表示させる、
    を含むことを特徴とする電子書籍表示方法。
  20. 複数のページからなる電子書籍データを記憶する手段に記憶された前記電子書籍データを取得するデータ取得ステップと、
    前記データ取得ステップにより取得された電子書籍データに基づいて、前記複数のページのうち指定された1又は複数のページを表示手段に表示させる表示制御ステップと、
    ページ関連データが生成されていないページが前記表示手段に表示される前に、当該ページ内の文字領域を抽出して前記ページ関連データとして生成して記憶手段に記録するページ関連データ生成ステップと、
    前記ページ関連データが生成されたページが前記表示手段に表示された場合に、前記文字領域の指定操作を受け付ける受付ステップと、
    を含み、
    前記表示制御ステップでは、前記受付ステップにより前記指定操作が受け付けられた場合に、前記指定操作により指定された文字領域内を拡大して前記表示手段に表示させる、
    ことを特徴とする電子書籍表示方法。
  21. 複数のページからなる電子書籍データを記憶する手段に記憶された前記電子書籍データを取得するデータ取得手段、
    前記データ取得手段により取得された電子書籍データに基づいて、前記複数のページのうち指定された1又は複数のページを表示手段に表示させる表示制御手段、
    ページ関連データが生成されていないページが前記表示手段に表示される前に、当該ページ内の文字領域候補を抽出して前記ページ関連データとして生成して記憶手段に記録するページ関連データ生成手段、
    前記ページ関連データが生成されたページが前記表示手段に表示された場合に、前記文字領域候補の指定操作を受け付ける受付手段、
    前記受付手段により前記指定操作が受け付けられた後に、前記指定操作により指定された文字領域候補に文字が含まれるか否かを判定する操作後文字判定手段、
    としてコンピュータを機能させ、
    前記表示制御手段は、前記操作後文字判定手段により文字が含まれると判定された文字領域候補内を拡大して前記表示手段に表示させる、
    ことを特徴とするプログラム。
  22. 複数のページからなる電子書籍データを記憶する手段に記憶された前記電子書籍データを取得するデータ取得手段、
    前記データ取得手段により取得された電子書籍データに基づいて、前記複数のページのうち指定された1又は複数のページを表示手段に表示させる表示制御手段、
    ページ関連データが生成されていないページが前記表示手段に表示される前に、当該ページ内の文字領域を抽出して前記ページ関連データとして生成して記憶手段に記録するページ関連データ生成手段、
    前記ページ関連データが生成されたページが前記表示手段に表示された場合に、前記文字領域の指定操作を受け付ける受付手段、
    としてコンピュータを機能させ、
    前記表示制御手段は、前記受付手段により前記指定操作が受け付けられた場合に、前記指定操作により指定された文字領域内を拡大して前記表示手段に表示させる、
    ことを特徴とするプログラム。
JP2016509174A 2015-07-10 2015-07-10 電子書籍表示装置、電子書籍表示方法、及びプログラム Active JP5991704B1 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2015/069951 WO2017009908A1 (ja) 2015-07-10 2015-07-10 電子書籍表示装置、電子書籍表示方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP5991704B1 true JP5991704B1 (ja) 2016-09-14
JPWO2017009908A1 JPWO2017009908A1 (ja) 2017-07-13

Family

ID=56921066

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016509174A Active JP5991704B1 (ja) 2015-07-10 2015-07-10 電子書籍表示装置、電子書籍表示方法、及びプログラム

Country Status (5)

Country Link
US (1) US11132496B2 (ja)
JP (1) JP5991704B1 (ja)
CA (1) CA2991100C (ja)
TW (1) TWI592859B (ja)
WO (1) WO2017009908A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11474781B2 (en) * 2020-06-10 2022-10-18 Asianlink Technology Incorporation Electronic book system using electromagnetic energy to detect page numbers

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005202062A (ja) * 2004-01-14 2005-07-28 Sony Computer Entertainment Inc まんが表示装置、まんが表示方法、まんが編集装置およびまんが編集方法
JP2007241942A (ja) * 2006-03-13 2007-09-20 Sharp Corp コンテンツ再生装置、コンテンツ再生方法、コンテンツ再生プログラム、および記録媒体
JP2007323369A (ja) * 2006-05-31 2007-12-13 Yappa Corp 電子新聞表示装置及び電子新聞表示システム
JP2012133661A (ja) * 2010-12-22 2012-07-12 Fujifilm Corp ビューワ装置、閲覧システム、ビューワプログラム及び記録媒体
JP2012221316A (ja) * 2011-04-11 2012-11-12 Nippon Telegr & Teleph Corp <Ntt> 文書トピック抽出装置及び方法及びプログラム
JP2013089197A (ja) * 2011-10-21 2013-05-13 Fujifilm Corp 電子コミック編集装置、方法及びプログラム
JP2014120132A (ja) * 2012-12-19 2014-06-30 Konica Minolta Inc 画像処理端末、画像処理システム、および画像処理端末の制御プログラム
JP2014186463A (ja) * 2013-03-22 2014-10-02 Yahoo Japan Corp 関連情報抽出装置、関連情報抽出方法および関連情報抽出プログラム

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040080541A1 (en) * 1998-03-20 2004-04-29 Hisashi Saiga Data displaying device
US7667719B2 (en) * 2006-09-29 2010-02-23 Amazon Technologies, Inc. Image-based document display
JP2008152700A (ja) * 2006-12-20 2008-07-03 Toshiba Corp 電子漫画配信サーバ
US20090041352A1 (en) * 2007-08-10 2009-02-12 Naoki Okamoto Image formation device, image formation method, and computer-readable recording medium recording image formation program
JP4818415B2 (ja) 2009-09-17 2011-11-16 シャープ株式会社 電子漫画製造装置及び電子漫画製造方法
JP2012137929A (ja) * 2010-12-27 2012-07-19 Sony Corp 表示装置、表示方法、プログラム
KR101874853B1 (ko) 2011-12-29 2018-07-05 주식회사 알티캐스트 모바일 장치와 디스플레이 장치 간의 동기화 방법 및 장치, 모바일 장치, 디스플레이 장치
KR101893928B1 (ko) 2012-01-19 2018-08-31 삼성전자 주식회사 단말기의 페이지 표시 방법 및 장치
JP5390669B1 (ja) 2012-06-29 2014-01-15 楽天株式会社 投稿表示システム、投稿表示方法、及び投稿表示プログラム
JP2014197341A (ja) * 2013-03-29 2014-10-16 富士フイルム株式会社 電子書籍制作装置、電子書籍システム、電子書籍制作方法及びプログラム
JP5564635B1 (ja) * 2013-08-26 2014-07-30 楽天株式会社 電子書籍システム、電子書籍システムの動作方法、記録媒体、及び、プログラム

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005202062A (ja) * 2004-01-14 2005-07-28 Sony Computer Entertainment Inc まんが表示装置、まんが表示方法、まんが編集装置およびまんが編集方法
JP2007241942A (ja) * 2006-03-13 2007-09-20 Sharp Corp コンテンツ再生装置、コンテンツ再生方法、コンテンツ再生プログラム、および記録媒体
JP2007323369A (ja) * 2006-05-31 2007-12-13 Yappa Corp 電子新聞表示装置及び電子新聞表示システム
JP2012133661A (ja) * 2010-12-22 2012-07-12 Fujifilm Corp ビューワ装置、閲覧システム、ビューワプログラム及び記録媒体
JP2012221316A (ja) * 2011-04-11 2012-11-12 Nippon Telegr & Teleph Corp <Ntt> 文書トピック抽出装置及び方法及びプログラム
JP2013089197A (ja) * 2011-10-21 2013-05-13 Fujifilm Corp 電子コミック編集装置、方法及びプログラム
JP2014120132A (ja) * 2012-12-19 2014-06-30 Konica Minolta Inc 画像処理端末、画像処理システム、および画像処理端末の制御プログラム
JP2014186463A (ja) * 2013-03-22 2014-10-02 Yahoo Japan Corp 関連情報抽出装置、関連情報抽出方法および関連情報抽出プログラム

Also Published As

Publication number Publication date
JPWO2017009908A1 (ja) 2017-07-13
TWI592859B (zh) 2017-07-21
CA2991100C (en) 2023-10-17
US20180329872A1 (en) 2018-11-15
CA2991100A1 (en) 2017-01-19
WO2017009908A1 (ja) 2017-01-19
US11132496B2 (en) 2021-09-28
TW201706821A (zh) 2017-02-16

Similar Documents

Publication Publication Date Title
US11030420B2 (en) Translating language characters in media content
CN109376681B (zh) 一种多人姿态估计方法及系统
JP6501501B2 (ja) 情報処理装置、情報処理方法、情報処理システム及びプログラム
US10467466B1 (en) Layout analysis on image
EP3376470B1 (en) Moving body tracking method, moving body tracking device, and program
JP6977513B2 (ja) 機械学習方法及び装置
CN111461070B (zh) 文本识别方法、装置、电子设备及存储介质
JP5991704B1 (ja) 電子書籍表示装置、電子書籍表示方法、及びプログラム
CN115019324A (zh) 文本扫描的交互方法、装置、计算机设备和存储介质
CN105022480A (zh) 一种输入方法及终端
JP6294572B2 (ja) 画像処理装置、画像処理方法、及びプログラム
CN108989704B (zh) 图像生成方法和装置、终端设备
JP6337680B2 (ja) 画像処理システム、画像処理装置、プログラム及び画像処理方法
JP6547244B2 (ja) 動作処理装置、動作処理方法及びプログラム
KR101651842B1 (ko) 전자문서 레이아웃 생성 방법 및 장치
US9159118B2 (en) Image processing apparatus, image processing system, and non-transitory computer-readable medium
CN110969161B (zh) 图像处理方法、电路、视障辅助设备、电子设备和介质
JP2022035280A (ja) 情報処理装置、プログラム及び情報処理方法
WO2017203705A1 (ja) 画像処理装置、画像処理方法及び画像処理プログラム
WO2023017723A1 (ja) 情報処理装置、情報処理システム、情報処理方法、及びプログラム
JP2007304748A (ja) 画像処理システム
JP6390210B2 (ja) 画像処理装置、画像処理方法及びプログラム
CN117764823A (zh) 图片扩充方法、装置、计算机设备及存储介质
JP2024002327A (ja) 情報処理装置、情報処理システム、情報処理方法、及びプログラム
CN115700825A (zh) 白板的笔迹识别方法、装置和电子设备

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160802

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160809

R150 Certificate of patent or registration of utility model

Ref document number: 5991704

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250