JP2018142286A - 電子図書製作用プログラム - Google Patents
電子図書製作用プログラム Download PDFInfo
- Publication number
- JP2018142286A JP2018142286A JP2017037787A JP2017037787A JP2018142286A JP 2018142286 A JP2018142286 A JP 2018142286A JP 2017037787 A JP2017037787 A JP 2017037787A JP 2017037787 A JP2017037787 A JP 2017037787A JP 2018142286 A JP2018142286 A JP 2018142286A
- Authority
- JP
- Japan
- Prior art keywords
- ruby
- character
- electronic book
- operator
- function
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 239000010979 ruby Substances 0.000 claims abstract description 115
- 229910001750 ruby Inorganic materials 0.000 claims abstract description 115
- 230000009471 action Effects 0.000 claims description 5
- 238000004519 manufacturing process Methods 0.000 claims description 5
- 238000000034 method Methods 0.000 description 14
- 230000006870 function Effects 0.000 description 11
- 230000008569 process Effects 0.000 description 10
- 230000008676 import Effects 0.000 description 6
- 230000001360 synchronised effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
Landscapes
- Character Discrimination (AREA)
- Document Processing Apparatus (AREA)
- Character Input (AREA)
Abstract
【解決手段】 操作者が指定した範囲の中で、文字を認識する機能と、操作者が指定した範囲内の文字列が縦書きか横書きかを判定する機能と、認識した文字にルビが含まれているか否かを判定する機能と、ルビが含まれていると判定した場合には、ルビと、当該ルビが振られている文字とを関連付けする機能と、ルビが振られている文字を電子図書データに変換する際に、関連付けされたルビがルビが振られている文字に対して所定の位置に配置されるように、電子図書データに変換する機能と、を実行させる。
【選択図】 図3
Description
特許文献2に開示されている装置では、再生する音声データと表示部に表示させているテキストデータとを同期させ、現在再生中の音声データに該当するテキスト位置を対応付けできる。
なお、元の書籍としてPDFや紙媒体しか存在しない場合もある。このような場合、OCRソフトなど既存のソフトを用いれば、通常の文字に関してデータ化は可能である。
また、元の書籍がPDFで文章にルビが存在している場合、PDFで文字列を選択すれば、ルビも含めて文字の読み取りも可能ではある。しかし、PDFでは、ルビと通常の文字とは異なるレイヤーに配置されている場合があり、ルビを含めて文字列を読み込んだとしても、ルビと、ルビに対応する文字との位置が大きくずれてしまうという課題がある。
この構成を採用することによって、ルビが本来振られている文字に対して、ルビを正確な位置に配置した電子図書データを製作することができる。
コンピュータ10は、通常のパーソナルコンピュータを用いることができ、LCDモニタ等の表示部12、制御部14、記憶装置16、キーボード17、マウス等のポインティングデバイス18を備えている。制御部14は、CPU、ROM及びRAM等からなるメモリを有している。記憶装置16としては、HDDなどを採用することができる。
なお、コンピュータ10にスキャナ19を接続していなくてもよく、この場合、元の書籍のPDF又はその他のデータは、コンピュータ10とは切り離されている別の機器によって、予めPDF又はその他のデータに変換され、この元の書籍のPDF又はその他のデータを、インターネット経由又はCD、USBメモリ等の記録媒体を介してコンピュータ10が読み取り、記憶装置16に記憶する。
電子図書製作用プログラムPを起動させた場合における表示部12の表示内容を、図2に示す。
また、電子図書製作用プログラムPの実行工程を図3〜図6に示す。
なお、以下の実施形態では、元の書籍データが、文字情報を取得可能なPDFである場合を例として説明する。
電子図書製作用プログラムPが起動すると、コンピュータ10の表示部12には、電子図書製作用プログラムPの操作画面20が表示される。
操作者は、元の書籍データをファイル表示部21に表示させるために、まずファイルボタン22をクリックする。ファイルボタン22がクリックされると、記憶装置16内のフォルダが表示され、操作者は電子図書へ変換する対象のファイルを選択する。
電子図書製作用プログラムPは、操作者が選択した記憶装置16内のファイルを読み出してファイル表示部21に表示する(図3のS100)。
なお、操作画面20には、「テキスト、見出し、画像」のうちのいずれか1つの属性を選択できるラジオボタン23が設けられており、指定する前には、まず操作者は、操作画面20のラジオボタン23から、指定しようとする範囲の属性が「テキスト、見出し、画像」のいずれかであるか選択する。
図2では、操作者が4か所の範囲を指定したところを示している。また、電子図書製作用プログラムPは、操作者がポインティングデバイス18を操作して範囲を指定すると、その範囲を矩形で囲むように表示する(図3のS102)。電子図書製作用プログラムPは、操作者がラジオボタン23でテキスト又は見出しと指定している場合には、矩形で表示された範囲内には文字が存在していると認定し、操作者がラジオボタン23で画像と指定している場合には、矩形で表示された範囲内には画像が存在していると認定する。
また、操作画面20には、操作者が指定した範囲の属性がテキスト、見出し、画像のいずれであるか、また指定した順番が、取り込み枠一覧26として表示される。
取り込みボタン24がクリックされると、電子図書製作用プログラムPは、操作者が指定した範囲のPDFデータを、電子図書データに変換する。
縦書きか、横書きかの判定の具体的な工程は、図4のフローチャートに基づいて説明する。
縦書きか、横書きかの判定の後、電子図書製作用プログラムPは、認識した文字にルビが含まれているか否かを判定する(図3のS108)。
認識した文字にルビが含まれているか否かを判定する具体的な工程は、図5〜図7に基づいて説明する。
例えば、図7の例で基準線が付されている文字が10ptであって、基準線が付されていない文字が4ptであったとすると、この4ptの文字をルビと判定する。
そこで、電子図書製作用プログラムPは、文字の大きさと文字数から、通常の文章中の文字か、ルビか、又はそれ以外の文字かを判定することができる。この場合、例えば、文字の大きさ(pt)×文字数=判定値とし、判定値が最も大きい文字を通常の文章中の文字とし、通常の文章中の文字の大きさから設定した閾値よりも小さい判定値の文字をルビと判定することができる。
ルビと、このルビが振られている文字とを関連付けする具体的な工程は、図9及び図10に基づいて説明する。
1行又は1列内に、ルビが1つだけの場合は、電子図書製作用プログラムPは、横書きの場合そのルビの横方向(x方向)の位置を含む漢字を、縦書きの場合そのルビの縦方向(y方向)の位置を含む漢字を、ルビが振られている漢字であると判定し、ルビとこのルビが振られている漢字とを関連付けする(図9のS401)。
電子図書製作用プログラムPは、ルビのグループ化の際、各ルビの位置情報から隣り合うルビとの間の距離を算出する(図9のS402)。そして、この距離が予め設定した閾値以内である場合には、この距離で隣り合っている複数のルビを1つのグループとして設定する(図9のS404、図10)。
具体的には、電子図書製作用プログラムPは、グループ化した複数のルビの先頭位置を含む漢字から、グループ化した複数のルビの終端位置を含む漢字までを、当該グループ化したルビが振られている漢字又は単語であるとして関連付けする(図9のS406)。
このようにすることで、ルビと、ルビが振られている文字とが正確な位置に配置された電子図書を製作できる。
そこで、本願の電子図書製作用プログラムPは、図表を電子図書データに変換する際に、図表内に余白28を検出した場合には、この余白28を削除して余白28の両側に位置する図表を結合させるように動作する。また、余白28の両側に位置する図表の結合時には、結合部分をビットマップで同色に修正するとよい。
このようにすれば、電子図書に変換した図表について余白28が存在することを無くすことができる。
そこで、本願の電子図書製作用プログラムPは、図表を電子図書データに変換する際に、図表内に重複個所(図示せず)を検出した場合には、この重複した個所の重複している画像データの一方を削除するように動作する。
このようにすれば、電子図書に変換した図表について重複個所が存在することを無くすことができる。
この場合、電子図書製作用プログラムPはOCR機能を有することが必要である。電子図書製作用プログラムPは、縦書きか横書きかを判定するステップにおいて、PDFに含まれる文字ごとの位置情報ではなく、操作者が指定した範囲内における各文字の位置を算出する必要がある。
DAISY規格の電子図書データは、コンテンツを表現可能なsmil(Synchronized Multimedia Integration Language)ファイルと、見出し情報が記述されたnccファイル又はncxファイルと、テキストデータを記述したマークアップ言語であるhtmlファイル又はxmlファイルを備えている。
12 表示部
14 制御部
16 記憶装置
17 キーボード
18 ポインティングデバイス
19 スキャナ
20 操作画面
21 ファイル表示部
22 ファイルボタン
23 ラジオボタン
24 取り込みボタン
25 順番の表示
26 取り込み枠一覧
28 余白
P 電子図書製作用プログラム
Claims (6)
- コンピュータに、
元の書籍のPDF又は画像データを取り込み、コンピュータの表示部に表示させる機能と、
前記表示部で表示された元の書籍のうち、電子図書データに変換すべき文字列の範囲を操作者が指定すると、指定した範囲の中で、文字を認識する機能と、
操作者が指定した範囲内の文字列が縦書きか横書きかを判定する機能と、
認識した文字にルビが含まれているか否かを判定する機能と、
ルビが含まれていると判定した場合には、ルビと、当該ルビが振られている文字とを関連付けする機能と、
ルビが振られている文字を電子図書データに変換する際に、関連付けされたルビが、ルビが振られている文字に対して所定の位置に配置されるように、電子図書データに変換する機能と、
を実行させるための電子図書製作用プログラム。 - 前記縦書きか横書きかを判定する機能は、
操作者が指定した範囲内での各文字の縦横の座標、又は表示部で表示されているページ内での各文字の縦横の座標を検出し、
縦座標が同一で横座標が異なる文字が多い場合、横書きと判定し、
横座標が同一で縦座標が異なる文字が多い場合、縦書きと判定することを特徴とする請求項1記載の電子図書製作用プログラム。 - 前記ルビが含まれているか否かを判定する機能は、
操作者が指定した範囲内の文字列が横書きと判定された場合、横方向に延びる文字列における所定の範囲以上の大きさの各文字の横方向に延びる中心線を算出し、各文字の中心線の最も多い個所を基準線として設定し、横書きの行ごとに基準線を設定し、
操作者が指定した範囲内の文字列が縦書きと判定された場合、縦方向に延びる文字列における所定の範囲以上の大きさの各文字の縦方向に延びる中心線を算出し、各文字の中心線の最も多い個所を基準線として設定し、縦書きの列ごとに基準線を設定し、
設定した基準線と接触せず、且つ文字の大きさが他の文字の大きさよりも所定の範囲以下である文字が存在する場合に、当該文字をルビと判定することを特徴とする請求項1又は請求項2記載の電子図書製作用プログラム。 - ルビが含まれていると判定された場合における、前記ルビと、当該ルビが振られている文字とを関連付けする機能は、
隣り合うルビどうしの距離が予め設定された閾値以内の場合に、該閾値以内の複数のルビを1つの漢字又は1つの単語に振られているルビであると判定して、1つの漢字又は1つの単語に振られていると判定された複数のルビをグループ化し、該グループ化した複数のルビの先頭位置を含む漢字から、前記グループ化した複数のルビの終端位置を含む漢字までを、当該グループ化したルビが振られている漢字又は単語であるとして関連付けし、
隣り合うルビどうしの距離が前記閾値以上であって、グループ化されない1文字のルビが存在する場合、該ルビの位置を含む漢字を、当該ルビが振られている漢字であるとして関連付けすることを特徴とする請求項1〜請求項3のうちのいずれか1項記載の電子図書製作用プログラム。 - 操作者が指定した範囲の中に画像データが存在し、且つ該画像データに縦方向又は横方向に延びる余白が存在する場合、
該余白を削除し、余白の両側に存在する画像データを結合させることを特徴とする請求項1〜請求項4のうちのいずれか1項記載の電子図書製作用プログラム。 - 操作者が指定した範囲の中に画像データが存在し、且つ該画像データに縦方向又は横方向に延びる重複した個所が存在する場合、
該重複した個所において、重複した画像データのいずれか一方を削除することを特徴とする請求項1〜請求項5のうちのいずれか1項記載の電子図書製作用プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017037787A JP6543290B2 (ja) | 2017-02-28 | 2017-02-28 | 電子図書製作用プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017037787A JP6543290B2 (ja) | 2017-02-28 | 2017-02-28 | 電子図書製作用プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018142286A true JP2018142286A (ja) | 2018-09-13 |
JP6543290B2 JP6543290B2 (ja) | 2019-07-10 |
Family
ID=63528197
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017037787A Active JP6543290B2 (ja) | 2017-02-28 | 2017-02-28 | 電子図書製作用プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6543290B2 (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109977238A (zh) * | 2019-04-01 | 2019-07-05 | 杭州赛鲁班网络科技有限公司 | 生成绘本的系统、方法和装置 |
CN111915174A (zh) * | 2020-07-23 | 2020-11-10 | 北京师范大学 | 基于电子绘本的小学生审辩性思维测评方法及系统 |
JP2020201435A (ja) * | 2019-06-12 | 2020-12-17 | 株式会社ポニーキャニオン | 情報処理端末及び情報処理方法 |
CN113052179A (zh) * | 2021-03-09 | 2021-06-29 | 安徽淘云科技股份有限公司 | 多音字处理方法、装置、电子设备及存储介质 |
JP7432041B1 (ja) | 2022-08-11 | 2024-02-15 | 韓國電子通信研究院 | 古文献の原文イメージのデジタル化のための電子装置および方法 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03244093A (ja) * | 1990-02-22 | 1991-10-30 | Oki Electric Ind Co Ltd | 文字認識装置 |
JPH06348890A (ja) * | 1993-06-02 | 1994-12-22 | Canon Inc | 文書処理方法及び装置 |
JP2001273509A (ja) * | 2000-03-28 | 2001-10-05 | Toshiba Corp | 文書画像編集装置及び文書画像編集方法 |
JP2010072850A (ja) * | 2008-09-17 | 2010-04-02 | Konica Minolta Business Technologies Inc | 画像処理装置 |
JP2010244211A (ja) * | 2009-04-02 | 2010-10-28 | Nippon Telegr & Teleph Corp <Ntt> | 情報入力装置および情報入力方法 |
JP2012212293A (ja) * | 2011-03-31 | 2012-11-01 | Dainippon Printing Co Ltd | 文書認識装置、文書認識方法、プログラム及び記憶媒体 |
WO2014050481A1 (ja) * | 2012-09-26 | 2014-04-03 | 富士フイルム株式会社 | 文書画像処理装置ならびにその動作制御方法およびその動作制御プログラム |
JP2014085689A (ja) * | 2012-10-19 | 2014-05-12 | Ntt Communications Corp | 画像再配置方法、画像再配置システム、および画像再配置プログラム |
JP2016062263A (ja) * | 2014-09-17 | 2016-04-25 | 株式会社東芝 | 情報処理装置、画像変更方法及びプログラム |
US9460089B1 (en) * | 2012-11-07 | 2016-10-04 | Amazon Technologies, Inc. | Flow rendering of annotation characters |
-
2017
- 2017-02-28 JP JP2017037787A patent/JP6543290B2/ja active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03244093A (ja) * | 1990-02-22 | 1991-10-30 | Oki Electric Ind Co Ltd | 文字認識装置 |
JPH06348890A (ja) * | 1993-06-02 | 1994-12-22 | Canon Inc | 文書処理方法及び装置 |
JP2001273509A (ja) * | 2000-03-28 | 2001-10-05 | Toshiba Corp | 文書画像編集装置及び文書画像編集方法 |
JP2010072850A (ja) * | 2008-09-17 | 2010-04-02 | Konica Minolta Business Technologies Inc | 画像処理装置 |
JP2010244211A (ja) * | 2009-04-02 | 2010-10-28 | Nippon Telegr & Teleph Corp <Ntt> | 情報入力装置および情報入力方法 |
JP2012212293A (ja) * | 2011-03-31 | 2012-11-01 | Dainippon Printing Co Ltd | 文書認識装置、文書認識方法、プログラム及び記憶媒体 |
WO2014050481A1 (ja) * | 2012-09-26 | 2014-04-03 | 富士フイルム株式会社 | 文書画像処理装置ならびにその動作制御方法およびその動作制御プログラム |
JP2014085689A (ja) * | 2012-10-19 | 2014-05-12 | Ntt Communications Corp | 画像再配置方法、画像再配置システム、および画像再配置プログラム |
US9460089B1 (en) * | 2012-11-07 | 2016-10-04 | Amazon Technologies, Inc. | Flow rendering of annotation characters |
JP2016062263A (ja) * | 2014-09-17 | 2016-04-25 | 株式会社東芝 | 情報処理装置、画像変更方法及びプログラム |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109977238A (zh) * | 2019-04-01 | 2019-07-05 | 杭州赛鲁班网络科技有限公司 | 生成绘本的系统、方法和装置 |
JP2020201435A (ja) * | 2019-06-12 | 2020-12-17 | 株式会社ポニーキャニオン | 情報処理端末及び情報処理方法 |
CN111915174A (zh) * | 2020-07-23 | 2020-11-10 | 北京师范大学 | 基于电子绘本的小学生审辩性思维测评方法及系统 |
CN113052179A (zh) * | 2021-03-09 | 2021-06-29 | 安徽淘云科技股份有限公司 | 多音字处理方法、装置、电子设备及存储介质 |
JP7432041B1 (ja) | 2022-08-11 | 2024-02-15 | 韓國電子通信研究院 | 古文献の原文イメージのデジタル化のための電子装置および方法 |
Also Published As
Publication number | Publication date |
---|---|
JP6543290B2 (ja) | 2019-07-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8719029B2 (en) | File format, server, viewer device for digital comic, digital comic generation device | |
JP2018142286A (ja) | 電子図書製作用プログラム | |
JP5674450B2 (ja) | 電子コミックのビューワ装置、電子コミックの閲覧システム、ビューワプログラム、該ビューワプログラムが記録された記録媒体ならびに電子コミックの表示方法 | |
US7197462B2 (en) | System and method for information access | |
US11657725B2 (en) | E-reader interface system with audio and highlighting synchronization for digital books | |
JP5634853B2 (ja) | 電子コミックのビューワ装置、電子コミックの閲覧システム、ビューワプログラム、ならびに電子コミックの表示方法 | |
US8819545B2 (en) | Digital comic editor, method and non-transitory computer-readable medium | |
US8930814B2 (en) | Digital comic editor, method and non-transitory computer-readable medium | |
US8952985B2 (en) | Digital comic editor, method and non-transitory computer-readable medium | |
US20130326341A1 (en) | Digital comic editor, method and non-transitorycomputer-readable medium | |
JP2012185323A (ja) | 再生装置、再生方法、プログラムおよび記録媒体 | |
WO2012086359A1 (ja) | ビューワ装置、閲覧システム、ビューワプログラム及び記録媒体 | |
JP5674451B2 (ja) | ビューワ装置、閲覧システム、ビューワプログラム及び記録媒体 | |
JP6731011B2 (ja) | 電子図書の表示用データの作成装置 | |
JPH08263260A (ja) | テキスト読み上げ方法 | |
US20210073458A1 (en) | Comic data display system, method, and program | |
KR102414993B1 (ko) | 연관 정보 제공 방법 및 시스템 | |
US6456274B1 (en) | Multi-media editing system for edting at least two types of information | |
US20050097439A1 (en) | Information processing method and information processing apparatus | |
US10606940B2 (en) | Annotation sharing method, annotation sharing apparatus, and computer program product | |
JPH10124494A (ja) | 情報処理機器及び注釈付加方法 | |
EP0522645B1 (en) | Multi-media handling system | |
JP2013015698A (ja) | 表示装置、表示装置方法、および、表示プログラム | |
JP2022169024A (ja) | 情報処理装置、情報処理プログラムおよび情報処理方法 | |
KR20190142761A (ko) | 멀티미디어 핵심추출로 새로운 콘텐츠 만들기 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190108 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190131 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190611 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190614 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6543290 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |