JP2014164670A - 電子書籍データ作成方法及びマークアップ言語データ作成方法 - Google Patents
電子書籍データ作成方法及びマークアップ言語データ作成方法 Download PDFInfo
- Publication number
- JP2014164670A JP2014164670A JP2013037262A JP2013037262A JP2014164670A JP 2014164670 A JP2014164670 A JP 2014164670A JP 2013037262 A JP2013037262 A JP 2013037262A JP 2013037262 A JP2013037262 A JP 2013037262A JP 2014164670 A JP2014164670 A JP 2014164670A
- Authority
- JP
- Japan
- Prior art keywords
- data
- word processor
- electronic book
- conversion means
- converted
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Abstract
【解決手段】組版データから電子書籍データを作成する電子書籍データ作成方法において、組版データをワープロソフトで読み書き可能なワープロデータに自動的に変換する第1の変換手段を用いて、組版データをワープロデータに変換し、電子書籍用の付加情報を設定する第2の変換手段を用いて、ワープロデータを変換し、変換されたワープロデータを、作業者が整形し、ワープロデータを電子書籍データに自動的に変換する第3の変換手段を用いて、整形後のワープロデータを電子書籍データに変換する。
【選択図】図1
Description
電子書籍は、電子書籍リーダーや汎用パソコンに対応したデータ形式の電子書籍データとしてダウンロード可能となっていたり、またメディアに記録されたりして一般ユーザに提供される。
電子書籍リーダーの種類ごとの電子書籍データのデータ形式としては、XMDF、ドットブック、EPUBなど、様々な種類のデータ形式が存在する。
電子書籍リーダーを製造販売するメーカーでは自社の電子書籍リーダーに適合するデータ形式であればよいので、どのようなデータ形式の電子書籍データを作成すべきかについては検討の必要性がないためであると考えられる。また、汎用パソコンで読み取る場合には、一般に普及しているデータ形式で作成すればよいためと考えられる。
また、作業者は、電子書籍データのデータ構造やタグ仕様を熟知していないと作業ができないため、データ形式ごとに専門の作業者が必要となってしまうという課題もあった。
これに対し、上述した特許文献1及び特許文献2でもみられるように、XML形式などを用いた汎用的な中間データ形式を策定し、各組版データから汎用的な中間データ形式に変換し、汎用的な中間データ形式から各電子書籍データ形式に変換とすることで、課題を解決しようという試みがなされている。
しかしながら、前述したようなリンク情報の付加や編集においては、データ固有の構造やタグ仕様を熟知する必要があることに変わりはなく、作業効率の課題の解決には至らない。
電子書籍データの編集は、容易に行うことができ、かつ必要に応じて、各種データ形式に変換できることが可能であることが理想である。
この方法によれば、まず組版データをワープロデータに変換することで、作業者は異なるデータ形式の電子書籍データを整形するのではなく、ワープロソフトで整形を行え、整形後のワープロデータを、電子書籍データに変換すればよいので、効率よく整形作業が行える。また、整形をワープロデータで行うので、電子書籍データに詳しくなくても作業が行える。
この方法によれば、書籍中に外字が存在していても、確実に電子書籍データの作成が行える。
この方法によれば、複数種類の組版データが存在していても、すべて同じワープロソフトで整形することができ、作業効率を上げることができる。
この方法によれば、まず組版データをワープロデータに変換することで、作業者はワープロソフトで整形を行え、整形後のワープロデータを、マークアップ言語データに変換すればよいので、効率よく整形作業が行える。また、整形をワープロデータで行うので、最終的なデータである電子書籍データやその他のマルチメディアデータに詳しくなくても作業が行える。
また、本発明にかかるマークアップ言語データ作成方法によれば、マークアップ言語データを容易に効率よく作成することができ、また最終的な電子書籍データやその他のマルチメディアデータに詳しくなくても作業が行える。
電子書籍データ及びマークアップ言語データの作成は、作業者が各変換プログラムを用いてコンピュータ上でデータを自動的に変換し、変換プログラムで対応できない箇所や調整が必要となる箇所は作業者が手作業で整形することによって行われる。
コンピュータ30は、汎用的なパーソナルコンピュータなどを採用することができる。
コンピュータ30は、CPU及びメモリを含み、ソフトウェアプログラムを実行することによって各制御を行うことが可能な制御部32と、キーボードおよびマウス等のポインティングデバイスから構成され、操作者が制御部32に対して、情報を入力する入力手段34と、液晶ディスプレイやCRT等の制御部32からの信号に応じて情報を表示可能なモニタ36と、ソフトウェアプログラムや各種データを記憶する記憶装置38とを備えている。
記憶手段38の記憶媒体は、主にハードディスク等が挙げられる。
また、記憶装置38には、組版データ用フォルダ10、ワープロデータ用フォルダ12、電子書籍データ用フォルダ14、画像データ用フォルダ16、マークアップ言語データ用フォルダ18が構築されている。
なお、汎用的なワープロソフトの例としては、マイクロソフト社のWORDなどが挙げられる。
また、第1の変換手段P1は、ワープロデータに直接取り込めない画像やワープロデータ上で表示できない外字については、所在位置と情報を文字列に変換してワープロデータに配置する。なお、画像はファイル名を文字列に変換してから画像が所在する位置に配置し、外字は文字コードを文字列に変換してから所在する位置に配置する。
さらに、組版データに罫表が存在する場合、第1の変換手段P1は、ワープロデータ上で罫表を再現することが可能であるが、大多数の電子書籍は罫表を画像で表示するため、罫表は画像または罫表内のテキストを特定の文字列で囲んで罫表の所在位置に配置する。
第1の変換手段P1である変換プログラムは、作業者が指定する組版データ用フォルダ10に記憶されている組版データを全て読み出し、変換処理によってワープロデータに変換した後、作業者が指定したワープロデータ用フォルダ12に全てのワープロデータを記憶する。
なお、組版データ用フォルダ10、及びワープロデータ用フォルダ12は、作業者のコンピュータ30内の記憶装置38に構成されていることに限定されず、ネットワークを介して接続された、他の記憶装置にそれぞれが構成されていてもよい。
第1の変換手段P1は、組版データのテキストデータと共に書籍体裁を制御するためのレイアウト情報もワープロデータに変換している。
このレイアウト情報は、段落スタイル名・行揃え・改行・改ページ等の段落情報と、テキストスタイル名、文字サイズ・文字色・フォント・イタリック・下線・上付き文字・下付き文字・ルビ・傍点等のインライン情報で構成されている。
第1の変換手段P1は、これらのワープロデータ上で表現できない情報をワープロデータにそのまま変換することができないため、文字列に置き換えてワープロデータに配置する。文字列に置き換えることで、情報が欠落することを防ぎ、その後の整形作業や変換処理によって、適切な情報に置き換えられる。
第1の変換手段P1は、ワープロデータに取り込めない画像があった場合、画像のファイル名を取得し、図4に示す文字列に変換してワープロデータの所定の位置に配置する。
また、第1の変換手段P1は、罫表があった場合は、罫表内のテキストのみを抽出し、図4に示す所定の文字列で罫表内のテキストを囲んでからワープロデータの所定の位置に配置する。
さらに、第1の変換手段P1は、外字があった場合は、使用されている外字の文字コードを図4の例のような文字列に変換し、ワープロデータの所定の位置に配置する。
さらに、第1の変換手段P1は、合成文字・縦中横があった場合は、ワープロソフト上での表現が困難であるため、該当するテキストデータを図4で示す文字列で囲み、ワープロデータの所定の位置に配置する。
これは、一般的な電子書籍が、柱として表示する文字列をテキストデータとして保持しないためであり、組版データ内のテキストデータを必要としないためである。また、電子書籍には頁の概念が存在しないため、同様にノンブルのテキストデータもワープロデータには変換しない。
一般的に組版データは、段落情報の定義部分とテキストデータの定義部分が分かれている。この例では、組版データの最初に段落情報が定義され、その後にテキストデータが定義されている。
段落情報は、それぞれ段落スタイル名と段落情報が設定されている。この例では、行頭の「DM」の後の番号「1」・「30」がスタイル名に該当しており、番号以降に文字サイズ、フォント、段落インデントの段落情報が設定されている。
テキストデータでは、段落の先頭で段落スタイル名が呼び出されており、この呼び出しによって段落情報が各段落に適用される。この例では、「CM」の後の番号「30」・「1」が呼び出されている段落スタイル名であり、それぞれの段落情報が適用されることで組版データのレイアウトがワープロソフト上でも再現される。
インライン情報はテキストデータ内で定義されており、タグまたは組版制御用の特殊な文字によってインライン情報が設定されている。
この例では、組版制御用の特殊文字によってフォント・下線・文字サイズが設定されており、該当する文字列の開始位置と終了位置が特殊文字によって囲まれている。
第1の変換手段P1は、テキストデータをワープロデータに変換する際、このインライン情報も読み込み、ワープロデータ形式のインライン情報に変換し、組版データでのレイアウトをワープロデータで再現している。
第2の変換手段P2は、ワープロデータから外字を検出する機能を有している。
図7に示すように、外字検出は、作業者が指定するワープロデータ用フォルダ12に記憶されているワープロデータ(第1の変換手段によって組版データから変換されたワープロデータ)を全て読み込み、第2の変換手段の外字検出を実行することで、ワープロデータ内の外字を検出する。
電子書籍では、データ形式によって文字エンコーディングが異なっており、組版データで使用されているテキストデータの文字がそのまま利用できるとは限らない。このため、事前に文字エンコーディング変換できない文字を検出し、代替文字または画像に置き換える必要がある。
作業者は、外字検出の実行時に、変換する文字エンコーディングを指定すると、外字検出は指定された文字エンコーディングに変換できない文字をワープロデータ内から検出する。すなわち、第2の変換手段P2では、外字検出と同時に文字エンコーディング変換できない文字の検出を実行することができる。
この例では、ワープロデータの文字エンコーディングをUTF8からJIS X 0208に変換する場合の外字検出を示している。
第2の変換手段P2の外字検出機能は、ワープロデータ内の外字用文字列[GAI code="MA29B2"]を外字として検出し、機種依存文字である「丸付き数字1」「丸付き数字2」「〜」をJIS X 0208に変換できない文字として検出している。なお、外字検出の結果は、図8に示す例のような一覧形式で表示される。
第2の変換手段P2の外字置換機能は、作業者があらかじめ作成した外字置換用ファイル19と作業者が指定するワープロデータ用フォルダ12に記憶されているワープロデータを読み込み、外字置換用ファイル19で設定された置換対象文字をワープロデータ内から検索して置換文字に置き換える。
外字置換用ファイル19は、作業者があらかじめ作成し、コンピュータ30の記憶装置38内の任意のフォルダに記憶させておく。
なお、外字を画像データに置き換える場合、図10の例に定義した画像指定用の文字列を置換文字に設定する。また、画像ファイル名を保持することで、第3または第4の変換手段(後述する)を用いて、後の工程で設定したファイル名の画像に置き換えることができるようになる。
また、外字置換用ファイル19を作成する際、置換対象となる外字は前述の外字検出機能によって一覧表示されるため、この検出結果に基づいて外字置換用ファイル19を作成してもよい。
図11で示すように、画像取り込み機能は、作業者が指定する画像データ用フォルダ14に記憶された画像データと、ワープロデータ用フォルダ12に記憶されているワープロデータを読み込み、ワープロデータ中の画像指定用の文字列を検索し、文字列で設定されている画像ファイル名から対象となる画像データを抽出して、ワープロデータの画像用文字列の所在位置に抽出した画像データを埋め込む。
整形内容としては、字句の修正、段落・テキストのスタイル設定、レイアウト調整、画像の貼り付け、リンク設定などがある。
この整形作業は、それぞれ形式が異なる電子書籍データ上で整形を行うのではなく、一般的なワープロデータ上で整形を行うことで、電子書籍データに詳しくなくても作業が行え、効率よく整形作業が行える。
また、検索・文書比較・変更履歴・ハイパーリンクなどのワープロソフトの機能を利用することで、整形した内容を簡単に確認できることも、整形作業の特徴の1つとして挙げられる。
字句修正やレイアウト調整は、ワープロソフトで作業を行うため、検索や文書比較、変更履歴などのワープロ機能を使って、整形内容の検出、確認を行う。
図12で示すように、第3の変換手段P3は、作業者によって指定されたワープロデータ用フォルダ12に記憶されているワープロデータを読み込み、テキストデータ・段落情報・インライン情報等を電子書籍データの形式に変換し、作業者が指定する電子書籍データ用フォルダ16に、変換した電子書籍データを記憶する。
マークアップ言語データの作成については、組版データから、第2の変換手段P2を用いた変換後に作業者が手作業で整形するまでは、電子書籍データ作成方法と共通である。したがって、組版データから、第2の変換手段P2を用いた変換後に作業者が手作業で整形するまでは、説明を省略する。
図13で示すように、第4の変換手段P4は、作業者によって指定されたワープロデータ用フォルダ12に記憶されているワープロデータを読み込み、テキストデータ・段落情報・インライン情報等をマークアップ言語データの形式に変換し、作業者が指定するマークアップ言語データ用フォルダ18に、変換したマークアップデータを記憶する。
この第4の変換手段P4を用いることで、電子書籍以外のマルチメディアデータの提供にも対応することが可能である。
例えば、経済産業省「コンテンツ緊急電子化事業」等にて、データ形式の差を吸収するために汎用的なフォーマットが策定されたならば、そのデータ形式に変換することで、編集の容易さと、データ形式の統一が両立する。
12 ワープロデータ用フォルダ
13,16,17 画像データ用フォルダ
14 電子書籍データ用フォルダ
18 マークアップ言語データ用フォルダ
19 外字置換用ファイル
30 コンピュータ
32 制御部
34 入力手段
36 モニタ
38 記憶手段
38 ハードディスク
A,B,C 組版ソフト
P1 第1の変換手段
P2 第2の変換手段
P3 第3の変換手段
P4 第4の変換手段
Claims (12)
- 組版データから電子書籍データを作成する電子書籍データ作成方法において、
組版データをワープロソフトで読み書き可能なワープロデータに自動的に変換する第1の変換手段を用いて、組版データをワープロデータに変換し、
電子書籍用の付加情報を設定する第2の変換手段を用いて、ワープロデータを変換し、
変換されたワープロデータを、作業者が整形し、
ワープロデータを電子書籍データに自動的に変換する第3の変換手段を用いて、整形後のワープロデータを電子書籍データに変換することを特徴とする電子書籍データ作成方法。 - 第2の変換手段は、
整形する前のワープロデータに対して、外字を検出する外字検出手段を用いて、変換されたワープロデータ内の外字を検出し、
作業者は、検出された外字を置き換え文字で置換するか、又は画像外字を作成して置換することを特徴とする請求項1記載の電子書籍データ作成方法。 - 第2の変換手段を用いて、別ファイルとして用意されたイメージデータをワープロデータに対して自動的に取り込み、
取り込まれたイメージデータの情報を第3の変換手段を用いて、電子書籍データに変換することを特徴とする請求項1又は請求項2記載の電子書籍データ作成方法。 - 第3の変換手段は、
作業者が整形・追加したワープロデータの文字・レイアウト情報・ハイパーリンク情報を電子書籍データに変換することを特徴とする請求項1〜請求項3のうちのいずれか1項記載の電子書籍データ作成方法。 - 第1の変換手段は、複数種類の組版データを1種類のワープロデータに変換可能であることを特徴とする請求項1〜請求項4のうちのいずれか1項記載の電子書籍データ作成方法。
- 第1の変換手段は、
少なくとも組版データの文字及びレイアウト情報を、ワープロデータに変換し、
且つワープロデータ上で表現できない画像及び外字は文字列に置き換えることを特徴とする請求項1〜請求項5のうちのいずれか1項記載の電子書籍データ作成方法。 - 組版データから、電子書籍データに変換可能なマークアップ言語データを作成するマークアップ言語データ作成方法において、
組版データをワープロソフトで読み書き可能なワープロデータに自動的に変換する第1の変換手段を用いて、組版データをワープロデータに変換し、
電子書籍用の付加情報を設定する第2の変換手段を用いて、ワープロデータを変換し、
変換されたワープロデータを、作業者が整形し、
ワープロデータをマークアップ言語データに自動的に変換する第4の変換手段を用いて、整形後のワープロデータをマークアップ言語データに変換することを特徴とするマークアップ言語データ作成方法。 - 第2の変換手段は、
整形する前のワープロデータに対して、外字を検出する外字検出手段を用いて、変換されたワープロデータ内の外字を検出し、
作業者は、検出された外字を置き換え文字で置換するか、又は画像外字を作成して置換することを特徴とする請求項7記載のマークアップ言語データ作成方法。 - 第2の変換手段を用いて、別ファイルとして用意されたイメージデータをワープロデータに対して自動的に取り込み、
取り込まれたイメージデータの情報を第4の変換手段を用いて、マークアップ言語データに変換することを特徴とする請求項7又は請求項8記載のマークアップ言語データ作成方法。 - 第4の変換手段は、
作業者が整形・追加したワープロデータの文字・レイアウト情報・ハイパーリンク情報をマークアップ言語データに変換することを特徴とする請求項7〜請求項9のうちのいずれか1項記載のマークアップ言語データ作成方法。 - 第1の変換手段は、複数種類の組版データを1種類のワープロデータに変換可能であることを特徴とする請求項7〜請求項10のうちのいずれか1項記載のマークアップ言語データ作成方法。
- 第1の変換手段は、
少なくとも組版データの文字及びレイアウト情報を、ワープロデータに変換し、
且つワープロデータ上で表現できない画像及び外字は文字列に置き換えることを特徴とする請求項7〜請求項11のうちのいずれか1項記載のマークアップ言語データ作成方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013037262A JP6206835B2 (ja) | 2013-02-27 | 2013-02-27 | 電子書籍データ作成方法及びマークアップ言語データ作成方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013037262A JP6206835B2 (ja) | 2013-02-27 | 2013-02-27 | 電子書籍データ作成方法及びマークアップ言語データ作成方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014164670A true JP2014164670A (ja) | 2014-09-08 |
JP6206835B2 JP6206835B2 (ja) | 2017-10-04 |
Family
ID=51615190
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013037262A Active JP6206835B2 (ja) | 2013-02-27 | 2013-02-27 | 電子書籍データ作成方法及びマークアップ言語データ作成方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6206835B2 (ja) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009282969A (ja) * | 2008-04-25 | 2009-12-03 | Dainippon Hourei Printing Co Ltd | 書籍掲載文書の電子的な編集・内容変更システム、書籍掲載文書の電子的な編集・内容変更プログラムおよび書籍作成システム |
JP3178624U (ja) * | 2012-07-12 | 2012-09-20 | 名鉄局印刷株式会社 | 電子文書作成装置 |
JP2013033432A (ja) * | 2011-07-06 | 2013-02-14 | Toppan Printing Co Ltd | 電子書籍フォーマット変換方法、変換システム |
-
2013
- 2013-02-27 JP JP2013037262A patent/JP6206835B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009282969A (ja) * | 2008-04-25 | 2009-12-03 | Dainippon Hourei Printing Co Ltd | 書籍掲載文書の電子的な編集・内容変更システム、書籍掲載文書の電子的な編集・内容変更プログラムおよび書籍作成システム |
JP2013033432A (ja) * | 2011-07-06 | 2013-02-14 | Toppan Printing Co Ltd | 電子書籍フォーマット変換方法、変換システム |
JP3178624U (ja) * | 2012-07-12 | 2012-09-20 | 名鉄局印刷株式会社 | 電子文書作成装置 |
Non-Patent Citations (1)
Title |
---|
田原 恭二: "電子書籍を支えるIT技術", 印刷雑誌, vol. 第94巻第9号, JPN6016036011, 15 September 2011 (2011-09-15), JP, pages 15 - 19 * |
Also Published As
Publication number | Publication date |
---|---|
JP6206835B2 (ja) | 2017-10-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN100454293C (zh) | 文档编辑方法和文档编辑设备 | |
US8107727B2 (en) | Document processing apparatus, document processing method, and computer program product | |
CN100356372C (zh) | 计算机版式文件生成方法和打开方法 | |
Edhlund et al. | Nvivo 11 essentials | |
US9817887B2 (en) | Universal text representation with import/export support for various document formats | |
JP4666996B2 (ja) | 電子ファイリングシステム、電子ファイリング方法 | |
CN112433995B (zh) | 文件格式转换方法、系统、计算机设备及存储介质 | |
TW201416884A (zh) | 字型發布系統及字型發布方法 | |
US20120054605A1 (en) | Electronic document conversion system | |
KR102296939B1 (ko) | 다중 모드를 지원하는 pdf 등의 전자문서를 관리하는 장치 및 방법 | |
US9817913B2 (en) | Method and apparatus for collecting, merging and presenting content | |
JP6206835B2 (ja) | 電子書籍データ作成方法及びマークアップ言語データ作成方法 | |
JP2002288153A (ja) | アプリケーション非依存データ生成方法及び情報処理プログラム及びレイアウト情報処理システム。 | |
CN102262617B (zh) | 一种书版小样处理方法及装置 | |
CN114973798A (zh) | 一种单词学习卡生成方法及装置 | |
JP2013033432A (ja) | 電子書籍フォーマット変換方法、変換システム | |
JP5645481B2 (ja) | 装置、方法、及びプログラム | |
JP2000076226A (ja) | 文書データの編集システム | |
Zenzaro et al. | Ceed: a cooperative web-based editor for critical editions | |
JP2014035638A (ja) | 電子マニュアル出力システム及び電子マニュアル出力方法並びに電子マニュアル出力プログラム | |
Marmel | Teach Yourself Visually Word 2016 | |
Gribomont | OCR with Google Vision API and Tesseract | |
JP2018206303A (ja) | 情報処理装置及びプログラム | |
JP4508264B2 (ja) | データベース構築装置、データベース構築方法、データベース構築プログラム、記録媒体 | |
JP2012141702A (ja) | 電子文書変換装置及び電子文書変換方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20151225 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160920 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160916 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20161116 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170404 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170525 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170808 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170828 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6206835 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |