JP6206835B2 - Electronic book data creation method and markup language data creation method - Google Patents

Electronic book data creation method and markup language data creation method Download PDF

Info

Publication number
JP6206835B2
JP6206835B2 JP2013037262A JP2013037262A JP6206835B2 JP 6206835 B2 JP6206835 B2 JP 6206835B2 JP 2013037262 A JP2013037262 A JP 2013037262A JP 2013037262 A JP2013037262 A JP 2013037262A JP 6206835 B2 JP6206835 B2 JP 6206835B2
Authority
JP
Japan
Prior art keywords
data
conversion means
image
word processor
electronic book
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013037262A
Other languages
Japanese (ja)
Other versions
JP2014164670A (en
Inventor
浩 養田
浩 養田
新也 飯島
新也 飯島
Original Assignee
大日本法令印刷株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 大日本法令印刷株式会社 filed Critical 大日本法令印刷株式会社
Priority to JP2013037262A priority Critical patent/JP6206835B2/en
Publication of JP2014164670A publication Critical patent/JP2014164670A/en
Application granted granted Critical
Publication of JP6206835B2 publication Critical patent/JP6206835B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Document Processing Apparatus (AREA)

Description

本発明は、電子書籍で用いられる電子書籍データを作成する方法、及び電子書籍やその他マルチメディア等に利用できるマークアップ言語データを作成する方法に関する。   The present invention relates to a method for creating electronic book data used in an electronic book, and a method for creating markup language data that can be used for an electronic book or other multimedia.

電子書籍は、従来のように印刷物としての書籍ではなく、専用の表示装置(以下、電子書籍リーダーと称する場合がある)や汎用パソコンなどで書籍内容が表示される。
電子書籍は、電子書籍リーダーや汎用パソコンに対応したデータ形式の電子書籍データとしてダウンロード可能となっていたり、またメディアに記録されたりして一般ユーザに提供される。
An electronic book is not a book as a printed matter as in the past, but the book content is displayed on a dedicated display device (hereinafter also referred to as an electronic book reader) or a general-purpose personal computer.
An electronic book can be downloaded as electronic book data in a data format compatible with an electronic book reader or a general-purpose personal computer, or is recorded on a medium and provided to a general user.

電子書籍データの作成方法としては、例えば特許文献1及び特許文献2に提案されている。これらの方法によれば、所定のコンテンツを電子書籍にする際に、テキストデータとともに画像データへのリンク情報を記述することにより、ユーザの利便性を高めようとしている。   As a method of creating electronic book data, for example, Patent Document 1 and Patent Document 2 are proposed. According to these methods, when a predetermined content is converted to an electronic book, the user's convenience is improved by describing link information to image data together with text data.

特開2012−69005号公報JP 2012-69005 A WO2005/101232WO2005 / 101232

ところで、電子書籍を読み取るのを汎用パソコンで行う場合には、電子書籍データのデータ形式は一般的な画像データでも良いかもしれないが、専用の電子書籍リーダーを用いる場合には、電子書籍リーダーの種類に適合したデータ形式が必要とされる。
電子書籍リーダーの種類ごとの電子書籍データのデータ形式としては、XMDF、ドットブック、EPUBなど、様々な種類のデータ形式が存在する。
By the way, when reading an electronic book with a general-purpose personal computer, the data format of the electronic book data may be general image data, but when using a dedicated electronic book reader, A data format suitable for the type is required.
There are various types of data formats such as XMDF, dot book, and EPUB as data formats of electronic book data for each type of electronic book reader.

上述した従来の特許文献1及び特許文献2に示されている電子書籍データの作成方法では、電子書籍データのデータ形式については特に記載がない。
電子書籍リーダーを製造販売するメーカーでは自社の電子書籍リーダーに適合するデータ形式であればよいので、どのようなデータ形式の電子書籍データを作成すべきかについては検討の必要性がないためであると考えられる。また、汎用パソコンで読み取る場合には、一般に普及しているデータ形式で作成すればよいためと考えられる。
In the above-described conventional methods for creating electronic book data shown in Patent Literature 1 and Patent Literature 2, there is no particular description regarding the data format of the electronic book data.
The manufacturer that manufactures and sells e-book readers only needs to have a data format that is compatible with its own e-book reader, so there is no need to consider what data format e-book data should be created. Conceivable. In addition, when reading with a general-purpose personal computer, it is considered that it should be created in a data format that is generally popular.

しかし、出版会社や印刷会社において電子書籍データを提供する場合には、特定のデータ形式の電子書籍データだけではなく、様々な電子書籍リーダーで読み取れるように、複数種類のデータ形式の電子書籍データを作成しなくてはならない。   However, when e-book data is provided by a publisher or printing company, not only e-book data in a specific data format but also e-book data in multiple types of data formats can be read by various e-book readers. Must be created.

また、上述した特許文献1及び特許文献2においては、電子書籍データの元となるデータについては、テキストデータと画像データであるとの記載しかない。しかし、テキストデータだけでは、インデント、文字サイズ、ルビなどのレイアウト情報が不足しているので、書籍として体裁の整った電子書籍データを作成することができない。   Further, in Patent Document 1 and Patent Document 2 described above, there is only a description that the data that is the source of the electronic book data is text data and image data. However, the text data alone is insufficient for layout information such as indentation, character size, ruby, and so on, so that it is impossible to create electronic book data that is well-formed as a book.

なお、印刷会社には、書籍の元となるデータとして組版データが存在している。組版データといっても組版ソフトの種類によってさまざまなデータ形式が存在する。従来は、これらの組版データをそれぞれのデータ形式の電子書籍データに変換し、変換された電子書籍データを作業者が編集して書籍としての体裁を整える方法を採用していた。   Note that the printing company has typesetting data as the original data of the book. There are various data formats depending on the type of typesetting software. Conventionally, a method has been adopted in which these typesetting data are converted into electronic book data in respective data formats, and an operator edits the converted electronic book data to arrange the appearance as a book.

しかし、同一内容の書籍であっても、元々の組版データのデータ形式が異なっており、しかもこれらを様々なデータ形式の電子書籍データに変換し、変換後の電子書籍データごとに作業者が手作業で編集作業を行わなくてはならないため、電子書籍データの作成効率が非常に悪いという課題があった。
また、作業者は、電子書籍データのデータ構造やタグ仕様を熟知していないと作業ができないため、データ形式ごとに専門の作業者が必要となってしまうという課題もあった。
However, even if the books have the same contents, the data format of the original typesetting data is different, and these are converted into electronic book data of various data formats, and the operator manually handles each converted electronic book data. There is a problem that the efficiency of creating electronic book data is very poor because the editing work must be performed.
In addition, since the worker cannot work unless he / she is familiar with the data structure and tag specifications of the electronic book data, there is a problem that a specialized worker is required for each data format.

また、電子書籍では、文書内の該当箇所へのリンク、画像データへのリンク、又は文書中の字句の編集(“100頁を参照”のような部分を“こちらを参照”という字句に置き換える。)等、電子書籍特有の編集が必要になる。これらの情報を電子書籍データに付加又は編集する際も、電子書籍データのデータ構造やタグ仕様を熟知した作業者が、手作業で行う必要があり、作成効率が非常に悪いという課題があった。   In an electronic book, a link such as a link to a corresponding part in a document, a link to image data, or editing of a lexical phrase in a document (“refer to page 100” is replaced with a lexical phrase “refer here”). ) Etc., editing specific to electronic books is required. When adding or editing this information to electronic book data, it is necessary for an operator who is familiar with the data structure and tag specifications of the electronic book data to perform it manually, and there is a problem that the creation efficiency is very poor. .

なお、組版データをデータ変換プログラムを用いて電子書籍データに変換する場合は、データ変換プログラムのインプットである組版データと、アウトプットである電子書籍データの組み合わせ毎にプログラムの開発が必要となるという課題がある。
これに対し、上述した特許文献1及び特許文献2でもみられるように、XML形式などを用いた汎用的な中間データ形式を策定し、各組版データから汎用的な中間データ形式に変換し、汎用的な中間データ形式から各電子書籍データ形式に変換とすることで、課題を解決しようという試みがなされている。
しかしながら、前述したようなリンク情報の付加や編集においては、データ固有の構造やタグ仕様を熟知する必要があることに変わりはなく、作業効率の課題の解決には至らない。
電子書籍データの編集は、容易に行うことができ、かつ必要に応じて、各種データ形式に変換できることが可能であることが理想である。
When converting formatted data into electronic book data using a data conversion program, it is necessary to develop a program for each combination of formatted data that is an input of the data conversion program and electronic book data that is an output. There are challenges.
On the other hand, as seen in Patent Document 1 and Patent Document 2 described above, a general-purpose intermediate data format using an XML format or the like is formulated, and each formatted data is converted into a general-purpose intermediate data format. Attempts have been made to solve the problem by converting from a general-purpose intermediate data format to each electronic book data format.
However, in addition or editing of link information as described above, it is still necessary to be familiar with the data-specific structure and tag specifications, and the work efficiency problem cannot be solved.
Ideally, electronic book data can be easily edited and converted into various data formats as needed.

そこで本発明は上記課題を解決すべくなされ、その目的とするところは、組版データから複数種類のデータ形式の電子書籍データを容易に効率よく作成することができ、また電子書籍データに詳しくなくても作業可能な電子書籍データ作成方法、及びマークアップ言語データを容易に効率よく作成することができ、また電子書籍データに詳しくなくても作業可能なマークアップ言語データ作成方法を提供することにある。   Therefore, the present invention has been made to solve the above-mentioned problems, and an object of the present invention is to easily and efficiently create electronic book data of a plurality of types of data formats from formatted data, and is not familiar with electronic book data. The present invention is to provide an electronic book data creation method that can be worked on, and a markup language data creation method that can easily and efficiently create markup language data and that can work even if the electronic book data is not detailed. .

本発明にかかる電子書籍データ作成方法によれば、組版データから電子書籍データを作成する電子書籍データ作成方法において、コンピュータの記憶装置には、コンピュータが実行可能なプログラムとして第1の変換手段、第2の変換手段及び第3の変換手段が記憶されており、第1の変換手段は、作業者が指定する組版データ用フォルダに記憶されている組版データを全て読み出し、段落情報及びインライン情報を含み組版データの体裁を制御するためのレイアウト情報をワープロデータに変換し、次に組版データのテキストデータをワープロデータに変換し、作業者が指定するワープロデータ用フォルダに全てのワープロデータを記憶し、第2の変換手段は、前記ワープロデータ用フォルダに記憶されているワープロデータを全て読み込み、外字と、文字エンコーディングできない文字とを検出し、検出された外字を、あらかじめ記憶されている外字置換用ファイルに基づいて置換文字に置き換え、文字エンコーディングできない文字を、あらかじめ記憶されている画像ファイルに置き換えるか又は代替文字に置き換え、第3の変換手段は、作業者が指定するワープロデータ用フォルダに記憶されているワープロデータを読み込み、テキストデータ・段落情報を電子書籍データの形式に変換し、作業者が指定する電子書籍データ用フォルダに変換した電子書籍データを記憶し、前記第1の変換手段は、組版データをワープロデータに変換する際に、組版データに含まれる柱及びノンブルのデータをワープロデータに変換しないことを特徴としている。
この方法によれば、まず組版データをワープロデータに変換することで、作業者は異なるデータ形式の電子書籍データを整形するのではなく、ワープロソフトで整形を行え、整形後のワープロデータを、電子書籍データに変換すればよいので、効率よく整形作業が行える。また、整形をワープロデータで行うので、電子書籍データに詳しくなくても作業が行える。
According to the electronic book data creation method of the present invention, in the electronic book data creation method for creating electronic book data from typesetting data, the storage device of the computer includes a first conversion unit as a program executable by the computer, 2 conversion means and third conversion means are stored, and the first conversion means reads all the formatted data stored in the formatted data folder designated by the operator, and includes paragraph information and inline information. The layout information for controlling the format of the formatted data is converted into word processing data, then the text data of the formatted data is converted into word processing data, and all the word processing data is stored in the word processing data folder designated by the operator, The second conversion means reads all the word processor data stored in the word processor data folder. Detects external characters and characters that cannot be character-encoded, replaces the detected external characters with replacement characters based on a pre-stored external character replacement file, and converts characters that cannot be character-encoded into a pre-stored image file. The third conversion means reads the word processor data stored in the word processor data folder designated by the operator, converts the text data / paragraph information into the electronic book data format, The electronic book data converted into the electronic book data folder designated by the user is stored, and the first converting means converts the column data and the noble data included in the typesetting data into a word processor when converting the type setting data into word processing data. It is characterized by not converting to data.
According to this method, by first converting the formatted data into word processing data, the operator can format the electronic book data in a different data format, but can perform formatting with the word processing software, and the formatted word processing data is converted into electronic format. Since it is only necessary to convert the data into book data, the shaping work can be performed efficiently. In addition, since the shaping is performed using word processing data, the work can be performed even if the electronic book data is not detailed.

また、第1の変換手段は、組版データに画像が存在する場合には、画像のファイル名を文字列に変換してから画像が所在する位置に配置し、組版データに罫表が存在する場合には、罫表を表示する画像又は罫表内のテキストを特定の文字列で囲んで罫表が所在する位置に配置し、第2の変換手段は、ワープロデータの画像又は罫表を示す文字列に対し、別ファイルとして用意されたイメージデータをワープロデータに対して自動的に取り込み、第3の変換手段は、取り込まれたイメージデータの情報電子書籍データに変換し、且つワープロデータに含まれるハイパーリンク情報を電子書籍のリンク情報に変換することを特徴としてもよい。 Further, the first conversion means converts the image file name into a character string and arranges it at a position where the image is located when an image exists in the formatted data, and a ruled table exists in the formatted data Includes a ruled table image or text in the ruled table surrounded by a specific character string and arranged at the position where the ruled table is located, and the second conversion means is a word processor data image or a character indicating the ruled table. The image data prepared as a separate file for the column is automatically captured into the word processor data, and the third conversion means converts the captured image data information into electronic book data and is included in the word processor data. The hyperlink information may be converted into link information of an electronic book .

また、第1の変換手段は、複数種類の組版データを1種類のワープロデータに変換可能であることを特徴としてもよい。
この方法によれば、複数種類の組版データが存在していても、すべて同じワープロソフトで整形することができ、作業効率を上げることができる。
Further, the first conversion means may convert a plurality of types of typesetting data into one type of word processor data.
According to this method, even if there are a plurality of types of typesetting data, they can all be formatted with the same word processor software, and work efficiency can be improved.

本発明にかかるマークアップ言語データ作成方法によれば、組版データから、電子書籍データに変換可能なマークアップ言語データを作成するマークアップ言語データ作成方法において、コンピュータの記憶装置には、コンピュータが実行可能なプログラムとして第1の変換手段、第2の変換手段及び第4の変換手段が記憶されており、第1の変換手段は、作業者が指定する組版データ用フォルダに記憶されている組版データを全て読み出し、段落情報及びインライン情報を含み組版データの体裁を制御するためのレイアウト情報をワープロデータに変換し、次に組版データのテキストデータをワープロデータに変換し、作業者が指定するワープロデータ用フォルダに全てのワープロデータを記憶し、第2の変換手段は、前記ワープロデータ用フォルダに記憶されているワープロデータを全て読み込み、外字と、文字エンコーディングできない文字とを検出し、検出された外字を、あらかじめ記憶されている外字置換用ファイルに基づいて置換文字に置き換え、文字エンコーディングできない文字を、あらかじめ記憶されている画像ファイルに置き換えるか又は代替文字に置き換え、第4の変換手段は、作業者が指定するワープロデータ用フォルダに記憶されているワープロデータを読み込み、テキストデータ・段落情報をマークアップ言語データの形式に変換し、作業者が指定するマークアップ言語データ用フォルダに変換したマークアップ言語データを記憶し、前記第1の変換手段は、組版データをワープロデータに変換する際に、組版データに含まれる柱及びノンブルのデータをワープロデータに変換しないことを特徴としている。
この方法によれば、まず組版データをワープロデータに変換することで、作業者はワープロソフトで整形を行え、整形後のワープロデータを、マークアップ言語データに変換すればよいので、効率よく整形作業が行える。また、整形をワープロデータで行うので、最終的なデータである電子書籍データやその他のマルチメディアデータに詳しくなくても作業が行える。
According to the markup language data creation method of the present invention, in the markup language data creation method for creating markup language data that can be converted into electronic book data from typesetting data, the computer storage device executes the computer The first conversion means, the second conversion means, and the fourth conversion means are stored as possible programs, and the first conversion means stores the typesetting data stored in the typesetting data folder designated by the operator. All of the text, and the layout information for controlling the appearance of the formatted data including paragraph information and inline information is converted to word processor data, then the text data of the formatted data is converted to word processor data, and the word processor data specified by the operator All the word processor data is stored in the folder, and the second conversion means Reads all word processor data stored in the folder, detects external characters and characters that cannot be encoded, replaces the detected external characters with replacement characters based on the stored external character replacement file, and cannot encode characters The character is replaced with a pre-stored image file or replaced with a substitute character, and the fourth conversion means reads the word processor data stored in the word processor data folder designated by the operator, and the text data / paragraph information Is converted into the markup language data format, the markup language data converted into the markup language data folder designated by the operator is stored, and the first converting means converts the typesetting data into word processing data. Column and noble data included in typesetting data It is characterized in that not converted into a word processor data.
According to this method, by first converting the formatted data into word processing data, the operator can perform formatting with the word processing software, and the formatted word processing data only needs to be converted into markup language data. Can be done. In addition, since the shaping is performed with word processor data, the work can be performed without being familiar with the final data, e-book data or other multimedia data.

また、第1の変換手段は、組版データに画像が存在する場合には、画像のファイル名を文字列に変換してから画像が所在する位置に配置し、組版データに罫表が存在する場合には、罫表を表示する画像又は罫表内のテキストを特定の文字列で囲んで罫表が所在する位置に配置し、第2の変換手段は、ワープロデータの画像又は罫表を示す文字列に対し、別ファイルとして用意されたイメージデータをワープロデータに対して自動的に取り込み、第4の変換手段は、取り込まれたイメージデータの情報マークアップ言語データに変換し、且つワープロデータに含まれるハイパーリンク情報をマークアップ言語のリンク情報に変換することを特徴としてもよい。 Further, the first conversion means converts the image file name into a character string and arranges it at a position where the image is located when an image exists in the formatted data, and a ruled table exists in the formatted data Includes a ruled table image or text in the ruled table surrounded by a specific character string and arranged at the position where the ruled table is located, and the second conversion means is a word processor data image or a character indicating the ruled table. The image data prepared as a separate file for the column is automatically taken into the word processor data, and the fourth conversion means converts the information of the taken image data into the markup language data, and also into the word processor data. The hyperlink information included may be converted into link information in a markup language .

さらに、第1の変換手段は、複数種類の組版データを1種類のワープロデータに変換可能であることを特徴としてもよい。   Further, the first conversion means may convert a plurality of types of typesetting data into one type of word processor data.

本発明にかかる電子書籍データ作成方法によれば、組版データから複数種類のデータ形式の電子書籍データを容易に効率よく作成することができ、また電子書籍データに詳しくなくても作業が行える。
また、本発明にかかるマークアップ言語データ作成方法によれば、マークアップ言語データを容易に効率よく作成することができ、また最終的な電子書籍データやその他のマルチメディアデータに詳しくなくても作業が行える。
According to the electronic book data creation method according to the present invention, electronic book data of a plurality of types of data formats can be easily and efficiently created from typesetting data, and work can be performed even if the electronic book data is not detailed.
In addition, according to the markup language data creation method of the present invention, markup language data can be created easily and efficiently, and work can be performed even if the final electronic book data and other multimedia data are not detailed. Can be done.

電子書籍作成方法及びマークアップ言語データ作成方法の全体の流れを示す説明図である。It is explanatory drawing which shows the flow of the whole electronic book creation method and markup language data creation method. 電子書籍作成方法及びマークアップ言語データ作成方法に用いるコンピュータの内部構成を示すブロック図である。It is a block diagram which shows the internal structure of the computer used for an electronic book creation method and a markup language data creation method. 第1の変換手段の変換について示す説明図である。FIG. 5 is an explanatory diagram showing conversion by a first conversion means. 第1の変換手段の変換内容を示す説明図である。It is explanatory drawing which shows the conversion content of a 1st conversion means. 段落情報の変換について示す説明図である。It is explanatory drawing shown about conversion of paragraph information. インライン情報の変換について示す説明図である。It is explanatory drawing shown about conversion of inline information. 外字の検出について示す説明図である。It is explanatory drawing shown about the detection of an external character. 外字の検出と外字一覧について示す説明図である。It is explanatory drawing shown about the detection of an external character, and an external character list. 外字の置換について示す説明図である。It is explanatory drawing shown about substitution of an external character. 外字置換用ファイルと置換結果について示す説明図である。It is explanatory drawing shown about an external character replacement file and a replacement result. 画像の取り込みについて示す説明図である。It is explanatory drawing shown about acquisition of an image. 第3の変換手段の変換内容を示す説明図である。It is explanatory drawing which shows the conversion content of a 3rd conversion means. 第4の変換手段の変換内容を示す説明図である。It is explanatory drawing which shows the conversion content of a 4th conversion means.

以下、本発明の好適な実施の形態を添付図面を用いて説明する。図1には、電子書籍データ作成方法及びマークアップ言語データ作成方法全体の流れを図示している。
電子書籍データ及びマークアップ言語データの作成は、作業者が各変換プログラムを用いてコンピュータ上でデータを自動的に変換し、変換プログラムで対応できない箇所や調整が必要となる箇所は作業者が手作業で整形することによって行われる。
DESCRIPTION OF EXEMPLARY EMBODIMENTS Hereinafter, preferred embodiments of the invention will be described with reference to the accompanying drawings. FIG. 1 illustrates the overall flow of an electronic book data creation method and a markup language data creation method.
The e-book data and markup language data are created by the worker who automatically converts the data on the computer using each conversion program. It is done by shaping at work.

本実施形態で使用されるコンピュータの構成を図2に示す。
コンピュータ30は、汎用的なパーソナルコンピュータなどを採用することができる。
コンピュータ30は、CPU及びメモリを含み、ソフトウェアプログラムを実行することによって各制御を行うことが可能な制御部32と、キーボードおよびマウス等のポインティングデバイスから構成され、操作者が制御部32に対して、情報を入力する入力手段34と、液晶ディスプレイやCRT等の制御部32からの信号に応じて情報を表示可能なモニタ36と、ソフトウェアプログラムや各種データを記憶する記憶装置38とを備えている。
記憶手段38の記憶媒体は、主にハードディスク等が挙げられる。
A configuration of a computer used in this embodiment is shown in FIG.
The computer 30 can employ a general-purpose personal computer.
The computer 30 includes a CPU and a memory, and includes a control unit 32 capable of performing each control by executing a software program, and a pointing device such as a keyboard and a mouse. , An input means 34 for inputting information, a monitor 36 capable of displaying information in accordance with a signal from a control unit 32 such as a liquid crystal display or a CRT, and a storage device 38 for storing software programs and various data. .
The storage medium of the storage means 38 is mainly a hard disk or the like.

また、コンピュータ30は、LAN(Local Area Network)等のネットワークを介して他のコンピュータや電子機器等と通信可能に接続されていてもよい。   The computer 30 may be communicably connected to other computers, electronic devices, and the like via a network such as a LAN (Local Area Network).

コンピュータ30の記憶装置38には、作業者が読み出して実行可能なプログラムである第1の変換手段P1、第2の変換手段P2、第3の変換手段P3、及び第4の変換手段P4が記憶されている。作業者は、各工程において必要な変換手段を読み出して実行させることができる。
また、記憶装置38には、組版データ用フォルダ10、ワープロデータ用フォルダ12、電子書籍データ用フォルダ14、画像データ用フォルダ16、マークアップ言語データ用フォルダ18が構築されている。
The storage device 38 of the computer 30 stores first conversion means P1, second conversion means P2, third conversion means P3, and fourth conversion means P4, which are programs that can be read and executed by the operator. Has been. The operator can read out and execute conversion means necessary in each process.
In the storage device 38, a composition data folder 10, a word processor data folder 12, an electronic book data folder 14, an image data folder 16, and a markup language data folder 18 are constructed.

本実施形態の組版データは、異なるデータ形式のものを用いることができる。図1では、例として3種類の組版ソフトA,B,Cが図示され、3種類の組版データの形式から電子書籍に変換可能であるところを図示している。   The format data of this embodiment can be in different data formats. In FIG. 1, three types of typesetting software A, B, and C are illustrated as an example, and the three types of typesetting data can be converted into electronic books from the format.

複数の組版ソフトA,B,Cから生成された組版データを第1の変換手段を用いて自動的に、汎用的なワープロソフトで読み書き可能なワープロデータに変換する。
なお、汎用的なワープロソフトの例としては、マイクロソフト社のWORDなどが挙げられる。
The composition data generated from the plurality of composition software A, B, and C is automatically converted into word processor data that can be read and written by general-purpose word processor software using the first conversion means.
An example of general-purpose word processor software is Microsoft's WORD.

第1の変換手段P1は、組版データをワープロデータに変換する変換プログラムである。この変換プログラムは、複数の組版データの種類に対応しており、異なる種類の組版データであっても、同一のワープロデータ形式に変換する。   The first conversion means P1 is a conversion program that converts typesetting data into word processor data. This conversion program corresponds to a plurality of types of typesetting data, and converts different types of typesetting data into the same word processor data format.

第1の変換手段P1は、組版データをワープロデータに変換する際、組版データのテキストと共にインデント・文字サイズ・ルビなどのレイアウト情報もワープロデータに変換する。
また、第1の変換手段P1は、ワープロデータに直接取り込めない画像やワープロデータ上で表示できない外字については、所在位置と情報を文字列に変換してワープロデータに配置する。なお、画像はファイル名を文字列に変換してから画像が所在する位置に配置し、外字は文字コードを文字列に変換してから所在する位置に配置する。
さらに、組版データに罫表が存在する場合、第1の変換手段P1は、ワープロデータ上で罫表を再現することが可能であるが、大多数の電子書籍は罫表を画像で表示するため、罫表は画像または罫表内のテキストを特定の文字列で囲んで罫表の所在位置に配置する。
The first conversion means P1 converts layout information such as indent, character size, and ruby into word processing data together with the text of the formatting data when converting the formatting data into word processing data.
Further, the first conversion means P1 converts the location and information into a character string and arranges them in the word processor data for images that cannot be directly imported into the word processor data or external characters that cannot be displayed on the word processor data. The image is arranged at the position where the image is located after the file name is converted into the character string, and the external character is arranged at the position where the character code is converted into the character string.
Further, when a ruled table exists in the formatted data, the first conversion unit P1 can reproduce the ruled table on the word processor data, but most electronic books display the ruled table as an image. In the ruled table, an image or text in the ruled table is surrounded by a specific character string and arranged at the location of the ruled table.

図3に、第1の変換手段の変換内容について示している。
第1の変換手段P1である変換プログラムは、作業者が指定する組版データ用フォルダ10に記憶されている組版データを全て読み出し、変換処理によってワープロデータに変換した後、作業者が指定したワープロデータ用フォルダ12に全てのワープロデータを記憶する。
なお、組版データ用フォルダ10、及びワープロデータ用フォルダ12は、作業者のコンピュータ30内の記憶装置38に構成されていることに限定されず、ネットワークを介して接続された、他の記憶装置にそれぞれが構成されていてもよい。
FIG. 3 shows the conversion contents of the first conversion means.
The conversion program as the first conversion means P1 reads all the formatting data stored in the formatting data folder 10 designated by the worker, converts it into word processing data by conversion processing, and then converts the word processing data designated by the worker. All the word processor data is stored in the folder 12.
The typesetting data folder 10 and the word processor data folder 12 are not limited to being configured in the storage device 38 in the operator's computer 30, but are connected to other storage devices connected via a network. Each may be configured.

図4には、組版データからワープロデータに変換する情報を示している。
第1の変換手段P1は、組版データのテキストデータと共に書籍体裁を制御するためのレイアウト情報もワープロデータに変換している。
このレイアウト情報は、段落スタイル名・行揃え・改行・改ページ等の段落情報と、テキストスタイル名、文字サイズ・文字色・フォント・イタリック・下線・上付き文字・下付き文字・ルビ・傍点等のインライン情報で構成されている。
FIG. 4 shows information for converting typesetting data into word processing data.
The first conversion means P1 converts the layout information for controlling the book format together with the text data of the typesetting data into word processor data.
This layout information includes paragraph information such as paragraph style name, line alignment, line feed, page break, etc., text style name, character size, character color, font, italic, underline, superscript, subscript, ruby, side points, etc. It consists of inline information.

なお、段落情報およびインライン情報は、組版データ内でタグ又は組版制御用の特殊な文字を使って表現されており、第1の変換手段P1はこの情報(タグ又は組版制御用の特殊な文字)を解析してレイアウト情報をワープロデータのデータ形式に変換している。   The paragraph information and the inline information are expressed in the typesetting data using a special character for tag or typesetting control, and the first conversion means P1 uses this information (tag or special character for typesetting control). The layout information is converted to the data format of word processor data.

また、図4は組版データをワープロデータへ変換するにあたり、ワープロデータ上で表現できない情報も図示している。
第1の変換手段P1は、これらのワープロデータ上で表現できない情報をワープロデータにそのまま変換することができないため、文字列に置き換えてワープロデータに配置する。文字列に置き換えることで、情報が欠落することを防ぎ、その後の整形作業や変換処理によって、適切な情報に置き換えられる。
FIG. 4 also illustrates information that cannot be expressed on the word processor data when converting the formatted data into word processor data.
Since the first conversion means P1 cannot convert the information that cannot be expressed on the word processor data into the word processor data as it is, the first conversion means P1 replaces the information with a character string and arranges it in the word processor data. By replacing it with a character string, it is possible to prevent information from being lost, and it can be replaced with appropriate information by subsequent shaping work or conversion processing.

ワープロデータ上で表現できず、文字列に置き換える情報は、画像・罫表・外字・合成文字・縦中横などが挙げられる。
第1の変換手段P1は、ワープロデータに取り込めない画像があった場合、画像のファイル名を取得し、図4に示す文字列に変換してワープロデータの所定の位置に配置する。
また、第1の変換手段P1は、罫表があった場合は、罫表内のテキストのみを抽出し、図4に示す所定の文字列で罫表内のテキストを囲んでからワープロデータの所定の位置に配置する。
さらに、第1の変換手段P1は、外字があった場合は、使用されている外字の文字コードを図4の例のような文字列に変換し、ワープロデータの所定の位置に配置する。
さらに、第1の変換手段P1は、合成文字・縦中横があった場合は、ワープロソフト上での表現が困難であるため、該当するテキストデータを図4で示す文字列で囲み、ワープロデータの所定の位置に配置する。
Examples of information that cannot be expressed on word processor data and replaced with character strings include images, ruled tables, external characters, composite characters, vertical, middle, and horizontal.
When there is an image that cannot be imported into the word processor data, the first conversion means P1 acquires the file name of the image, converts it into a character string shown in FIG. 4, and arranges it at a predetermined position in the word processor data.
Further, when there is a ruled table, the first conversion means P1 extracts only the text in the ruled table, surrounds the text in the ruled table with the predetermined character string shown in FIG. Place at the position.
Furthermore, if there is an external character, the first conversion means P1 converts the character code of the external character being used into a character string as shown in the example of FIG. 4 and arranges it at a predetermined position in the word processor data.
Furthermore, the first conversion means P1 encloses the corresponding text data with the character string shown in FIG. 4 because it is difficult to express it on the word processor software if there is a composite character / vertical / vertical / horizontal. Arranged at a predetermined position.

第1の変換手段P1は、電子書籍に不要となる柱やノンブルなどのテキストデータをワープロデータに変換しない。
これは、一般的な電子書籍が、柱として表示する文字列をテキストデータとして保持しないためであり、組版データ内のテキストデータを必要としないためである。また、電子書籍には頁の概念が存在しないため、同様にノンブルのテキストデータもワープロデータには変換しない。
The first conversion means P1 does not convert text data such as pillars and nobles that are unnecessary for the electronic book into word processor data.
This is because a general electronic book does not hold a character string to be displayed as a column as text data, and does not require text data in typesetting data. In addition, since there is no concept of pages in electronic books, similarly, noble text data is not converted into word processor data.

図5に、組版データからワープロデータへの段落情報の変換例を示す。
一般的に組版データは、段落情報の定義部分とテキストデータの定義部分が分かれている。この例では、組版データの最初に段落情報が定義され、その後にテキストデータが定義されている。
段落情報は、それぞれ段落スタイル名と段落情報が設定されている。この例では、行頭の「DM」の後の番号「1」・「30」がスタイル名に該当しており、番号以降に文字サイズ、フォント、段落インデントの段落情報が設定されている。
テキストデータでは、段落の先頭で段落スタイル名が呼び出されており、この呼び出しによって段落情報が各段落に適用される。この例では、「CM」の後の番号「30」・「1」が呼び出されている段落スタイル名であり、それぞれの段落情報が適用されることで組版データのレイアウトがワープロソフト上でも再現される。
FIG. 5 shows an example of conversion of paragraph information from typesetting data to word processing data.
In general, the formatted data is divided into a paragraph information definition part and a text data definition part. In this example, paragraph information is defined at the beginning of the formatted data, and text data is defined thereafter.
As the paragraph information, a paragraph style name and paragraph information are set, respectively. In this example, the numbers “1” and “30” after “DM” at the beginning of the line correspond to the style name, and the character size, font, and paragraph information of the paragraph indent are set after the number.
In text data, a paragraph style name is called at the beginning of a paragraph, and this call applies paragraph information to each paragraph. In this example, the numbers “30” and “1” after “CM” are called paragraph style names, and the layout of the formatted data is reproduced on the word processing software by applying the respective paragraph information. The

第1の変換手段P1は、初めに、組版データから段落情報の定義箇所を読み込み、段落情報毎に段落スタイル名と段落情報を記憶領域に記憶する。次にテキストデータを読み込むが、段落情報を呼び出している場合は、まず記憶領域に記憶している段落情報から対応する段落スタイル名を呼び出し、段落情報をワープロデータに変換した後、テキストデータをワープロデータに変換する。   The first conversion means P1 first reads the paragraph information definition portion from the formatted data, and stores the paragraph style name and paragraph information for each paragraph information in the storage area. Next, the text data is read. If the paragraph information is called, the paragraph style name is first called from the paragraph information stored in the storage area, the paragraph information is converted into word processing data, and then the text data is read. Convert to data.

図6に組版データからワープロデータへのインライン情報の変換例を示す。
インライン情報はテキストデータ内で定義されており、タグまたは組版制御用の特殊な文字によってインライン情報が設定されている。
この例では、組版制御用の特殊文字によってフォント・下線・文字サイズが設定されており、該当する文字列の開始位置と終了位置が特殊文字によって囲まれている。
第1の変換手段P1は、テキストデータをワープロデータに変換する際、このインライン情報も読み込み、ワープロデータ形式のインライン情報に変換し、組版データでのレイアウトをワープロデータで再現している。
FIG. 6 shows an example of inline information conversion from formatted data to word processor data.
The inline information is defined in the text data, and the inline information is set by tags or special characters for typesetting control.
In this example, the font, underline, and character size are set by special characters for typesetting control, and the start position and end position of the corresponding character string are surrounded by special characters.
When converting the text data into word processor data, the first conversion means P1 reads this in-line information, converts it into in-line information in the word processor data format, and reproduces the layout of the formatted data with the word processor data.

次に、図1に戻り、全体の流れの続きを説明する。
第2の変換手段P2は、ワープロデータから外字を検出する機能を有している。
図7に示すように、外字検出は、作業者が指定するワープロデータ用フォルダ12に記憶されているワープロデータ(第1の変換手段によって組版データから変換されたワープロデータ)を全て読み込み、第2の変換手段の外字検出を実行することで、ワープロデータ内の外字を検出する。
Next, returning to FIG. 1, the continuation of the overall flow will be described.
The second conversion means P2 has a function of detecting an external character from word processor data.
As shown in FIG. 7, the external character detection is performed by reading all the word processor data (the word processor data converted from the formatted data by the first conversion means) stored in the word processor data folder 12 designated by the worker, The external character in the word processor data is detected by executing the external character detection of the conversion means.

また、第2の変換手段P2は、外字検出機能以外に、文字エンコーディング変換できない文字の検出機能も有している。
電子書籍では、データ形式によって文字エンコーディングが異なっており、組版データで使用されているテキストデータの文字がそのまま利用できるとは限らない。このため、事前に文字エンコーディング変換できない文字を検出し、代替文字または画像に置き換える必要がある。
作業者は、外字検出の実行時に、変換する文字エンコーディングを指定すると、外字検出は指定された文字エンコーディングに変換できない文字をワープロデータ内から検出する。すなわち、第2の変換手段P2では、外字検出と同時に文字エンコーディング変換できない文字の検出を実行することができる。
Further, the second conversion means P2 has a function of detecting characters that cannot be converted to character encoding in addition to the function of detecting external characters.
In an electronic book, the character encoding differs depending on the data format, and the characters of the text data used in the formatted data cannot always be used as they are. For this reason, it is necessary to detect characters that cannot be converted into character encoding in advance and replace them with substitute characters or images.
When an operator specifies a character encoding to be converted when executing external character detection, the external character detection detects characters that cannot be converted into the specified character encoding from the word processor data. That is, the second conversion means P2 can detect a character that cannot be converted into a character encoding simultaneously with the detection of an external character.

図8に外字の検出例を示す。
この例では、ワープロデータの文字エンコーディングをUTF8からJIS X 0208に変換する場合の外字検出を示している。
第2の変換手段P2の外字検出機能は、ワープロデータ内の外字用文字列[GAI code="MA29B2"]を外字として検出し、機種依存文字である「丸付き数字1」「丸付き数字2」「〜」をJIS X 0208に変換できない文字として検出している。なお、外字検出の結果は、図8に示す例のような一覧形式で表示される。
FIG. 8 shows an example of detecting an external character.
In this example, external character detection in the case of converting the character encoding of word processor data from UTF8 to JIS X 0208 is shown.
The external character detection function of the second conversion means P2 detects the external character string [GAI code = "MA29B2"] in the word processor data as an external character, and the model-dependent characters "circled number 1""circled number 2""" To "" are detected as characters that cannot be converted to JIS X 0208. The result of external character detection is displayed in a list format as in the example shown in FIG.

また、図9に示すように、第2の変換手段P2は、ワープロデータ内の外字を置き換える機能(外字置換機能)も有する。
第2の変換手段P2の外字置換機能は、作業者があらかじめ作成した外字置換用ファイル19と作業者が指定するワープロデータ用フォルダ12に記憶されているワープロデータを読み込み、外字置換用ファイル19で設定された置換対象文字をワープロデータ内から検索して置換文字に置き換える。
外字置換用ファイル19は、作業者があらかじめ作成し、コンピュータ30の記憶装置38内の任意のフォルダに記憶させておく。
As shown in FIG. 9, the second conversion means P2 also has a function of replacing an external character in the word processor data (external character replacement function).
The external character replacement function of the second conversion means P2 reads the external character replacement file 19 created in advance by the operator and the word processor data stored in the word processor data folder 12 designated by the operator, and the external character replacement file 19 Search the word processor data for the set replacement target character and replace it with the replacement character.
The external character replacement file 19 is created in advance by an operator and stored in an arbitrary folder in the storage device 38 of the computer 30.

図10に示す例では、ワープロデータ中の外字「[GAI code="MA29B2"]」とJIS X 0208に文字エンコーディング変換できない文字「丸付き数字1」、「丸付き数字2」をそれぞれ代替文字に置き換えている。また、JIS X 0208に文字エンコーディング変換できない文字「〜」は、該当する代替文字が無いため、作成した画像データに置き換える。
なお、外字を画像データに置き換える場合、図10の例に定義した画像指定用の文字列を置換文字に設定する。また、画像ファイル名を保持することで、第3または第4の変換手段(後述する)を用いて、後の工程で設定したファイル名の画像に置き換えることができるようになる。
In the example shown in FIG. 10, the external characters “[GAI code =“ MA29B2 ”]” in the word processor data and the characters “circled number 1” and “circled number 2” that cannot be converted to JIS X 0208 are used as substitute characters. Replaced. Also, the character “˜” that cannot be converted into character encoding in JIS X 0208 is replaced with the created image data because there is no corresponding substitute character.
When replacing external characters with image data, the character string for image designation defined in the example of FIG. 10 is set as the replacement character. Also, by holding the image file name, it is possible to replace the image with the file name set in the subsequent process using the third or fourth conversion means (described later).

外字をどの代替文字、または画像に置き換えるかは、作成する電子書籍データによって異なるため、作業者がその必要に応じて外字置換用ファイル19を手作業で作成する。
また、外字置換用ファイル19を作成する際、置換対象となる外字は前述の外字検出機能によって一覧表示されるため、この検出結果に基づいて外字置換用ファイル19を作成してもよい。
Which substitute character or image is to be replaced with an external character differs depending on the electronic book data to be created, and therefore the worker manually creates the external character replacement file 19 as necessary.
Further, when the external character replacement file 19 is created, the external characters to be replaced are displayed in a list by the above-described external character detection function. Therefore, the external character replacement file 19 may be created based on the detection result.

第2の変換手段P2は、別途作成した画像データを読み込み、ワープロデータに取り込む機能も有する。
図11で示すように、画像取り込み機能は、作業者が指定する画像データ用フォルダ14に記憶された画像データと、ワープロデータ用フォルダ12に記憶されているワープロデータを読み込み、ワープロデータ中の画像指定用の文字列を検索し、文字列で設定されている画像ファイル名から対象となる画像データを抽出して、ワープロデータの画像用文字列の所在位置に抽出した画像データを埋め込む。
The second conversion means P2 also has a function of reading separately created image data and taking it into word processor data.
As shown in FIG. 11, the image capturing function reads the image data stored in the image data folder 14 specified by the operator and the word processor data stored in the word processor data folder 12, and the image in the word processor data is read. The designated character string is searched, the target image data is extracted from the image file name set in the character string, and the extracted image data is embedded at the location of the image character string in the word processor data.

第2の変換手段P2による、外字検出、文字エンコーディング変換できない文字の検出、外字置換、画像データの取り込み等が完了した後、ワープロデータに対して作業者が手作業で整形を行う。
整形内容としては、字句の修正、段落・テキストのスタイル設定、レイアウト調整、画像の貼り付け、リンク設定などがある。
この整形作業は、それぞれ形式が異なる電子書籍データ上で整形を行うのではなく、一般的なワープロデータ上で整形を行うことで、電子書籍データに詳しくなくても作業が行え、効率よく整形作業が行える。
また、検索・文書比較・変更履歴・ハイパーリンクなどのワープロソフトの機能を利用することで、整形した内容を簡単に確認できることも、整形作業の特徴の1つとして挙げられる。
After the second conversion means P2 completes the detection of external characters, the detection of characters that cannot be converted to character encoding, the replacement of external characters, the capture of image data, etc., the operator manually shapes the word processor data.
Formatting contents include lexical correction, paragraph / text style setting, layout adjustment, image pasting, link setting, and the like.
This formatting work is not performed on e-book data of different formats, but can be performed even if you are not familiar with e-book data by shaping on general word processor data, so that you can efficiently format Can be done.
Another feature of the formatting work is that it allows easy confirmation of the formatted content by using word processing software functions such as search, document comparison, change history, and hyperlinks.

整形作業では、修正指示の原稿に基づき、ワープロデータに対して、作業者が手作業で字句の修正や空行や改頁等のレイアウト調整を行う。
字句修正やレイアウト調整は、ワープロソフトで作業を行うため、検索や文書比較、変更履歴などのワープロ機能を使って、整形内容の検出、確認を行う。
In the formatting operation, the operator manually corrects the lexical phrase and adjusts the layout such as blank lines and page breaks on the word processor data based on the correction instruction document.
Since lexical correction and layout adjustment are performed using word processing software, word processing functions such as search, document comparison, and change history are used to detect and confirm formatting content.

スタイル設定では、事前に作成したレイアウト定義に基づいて、段落またはテキストにスタイルを設定する。ここでのスタイルとは、行揃え・インデント・文字サイズ・文字色等のレイアウト情報の組み合わせを名前を付けて個別に登録したものであり、この登録したスタイルを段落またはテキストに適用することで、ワープロデータに均一なレイアウトを容易に設定することが可能になる。なお、スタイル機能の代表的なものとしては、WORDのスタイルシート機能が挙げられる。   In the style setting, a style is set for a paragraph or text based on a layout definition created in advance. The style here is a combination of layout information such as line alignment, indentation, character size, character color, etc. that is individually registered with a name. By applying this registered style to a paragraph or text, It is possible to easily set a uniform layout for word processing data. A representative style function is a WORD style sheet function.

リンクの設定では、ワープロソフトの機能を利用して、ワープロデータ上でのリンク設定を可能にする。具体的な作業としては、参照先の文字列に対してブックマークを設定し、参照元に文字列に設定したハイパーリンクで参照先のブックマークを選択することでリンクが設定される。   In the link setting, it is possible to set a link on the word processor data by using the function of the word processor software. As a specific work, a bookmark is set for a reference character string, and a link is set by selecting the reference bookmark with a hyperlink set to the character string as a reference source.

後述するように第3または第4の変換手段は、このワープロデータのブックマークとハイパーリンクの情報を解析・変換することで、電子書籍データまたはマークアップ言語データでのリンクを実現する。   As will be described later, the third or fourth conversion means realizes a link in electronic book data or markup language data by analyzing and converting the bookmark and hyperlink information of the word processor data.

画像の貼り付けでは、作業者が新たに追加する画像などをワープロデータに手作業で貼り付ける。また、書籍とは異なる位置に画像を配置する場合は、ワープロソフトのカット&ペースト機能を使い、画像を任意の位置に移動する。   In the pasting of an image, an image newly added by the operator is manually pasted into word processing data. Also, when placing an image at a position different from the book, the image is moved to an arbitrary position using the cut-and-paste function of the word processor software.

作業者の手作業による整形作業終了後、第3の変換手段P3によってワープロデータを電子書籍データに変換する。
図12で示すように、第3の変換手段P3は、作業者によって指定されたワープロデータ用フォルダ12に記憶されているワープロデータを読み込み、テキストデータ・段落情報・インライン情報等を電子書籍データの形式に変換し、作業者が指定する電子書籍データ用フォルダ16に、変換した電子書籍データを記憶する。
After the shaping work by the operator's manual work is finished, the third conversion means P3 converts the word processor data into electronic book data.
As shown in FIG. 12, the third conversion means P3 reads the word processor data stored in the word processor data folder 12 designated by the operator, and converts the text data, paragraph information, inline information, etc. into the electronic book data. The converted electronic book data is stored in the electronic book data folder 16 designated by the operator.

第3の変換手段P2は、テキストデータと段落スタイル・行揃え・改行・改ページ等からなる段落情報とテキストスタイル・文字サイズ・フォント・イタリック・下線・上付き文字・下付き文字・ルビ・傍点・リンク等からなるインライン情報をワープロデータから読み込み、電子書籍データのデータ形式に応じて変換を実行する。   The third conversion means P2 includes text information and paragraph information consisting of paragraph style, line alignment, line feed, page break, etc. and text style, character size, font, italic, underline, superscript, subscript, ruby, and side points. -Read inline information such as links from word processor data, and execute conversion according to the data format of electronic book data.

また、第3の変換手段P3は、ワープロデータに取り込んだ画像データを解析・抽出し、電子書籍データ用フォルダ16内に配置された画像データ用フォルダ17に、ワープロデータから抽出した画像データを記憶する。これにより、ワープロデータに取り込んだ画像データが電子書籍データからも閲覧できる。なお、第3の変換手段P3を用いた変換工程の実行時に用いる画像データ用フォルダ17は、電子書籍データ用フォルダ16内に配置されたものであり、上述した第2の変換手段P2の変換工程で用いた画像データ用フォルダ16とは異なるフォルダである。   The third conversion means P3 analyzes and extracts the image data taken in the word processor data, and stores the image data extracted from the word processor data in the image data folder 17 arranged in the electronic book data folder 16. To do. Thereby, the image data taken into word processor data can be browsed also from electronic book data. The image data folder 17 used when executing the conversion process using the third conversion means P3 is arranged in the electronic book data folder 16, and the conversion process of the second conversion means P2 described above. This folder is different from the image data folder 16 used in FIG.

第3の変換手段P3は、作業者が変換する電子書籍のデータ形式を選択することで、ワープロデータから複数種類の電子書籍データを作成する。作成される電子書籍データの例としては、XMDF、EPUB、ドットブックなどが挙げられる。   The 3rd conversion means P3 produces multiple types of electronic book data from word processor data by selecting the data format of the electronic book which an operator converts. Examples of created electronic book data include XMDF, EPUB, and dot book.

次に、マークアップ言語データの作成方法について説明する。
マークアップ言語データの作成については、組版データから、第2の変換手段P2を用いた変換後に作業者が手作業で整形するまでは、電子書籍データ作成方法と共通である。したがって、組版データから、第2の変換手段P2を用いた変換後に作業者が手作業で整形するまでは、説明を省略する。
Next, a method for creating markup language data will be described.
The creation of the markup language data is the same as the electronic book data creation method from the typesetting data until the operator manually shapes it after the conversion using the second conversion means P2. Therefore, the description is omitted from the formatted data until the operator manually shapes the data after conversion using the second conversion means P2.

作業者の手作業による整形作業終了後、第4の変換手段P4によってワープロデータをマークアップ言語データに変換する。ここでいうマークアップ言語データとは、電子書籍以外のHTMLやXMLなどのデータのことを指している。
図13で示すように、第4の変換手段P4は、作業者によって指定されたワープロデータ用フォルダ12に記憶されているワープロデータを読み込み、テキストデータ・段落情報・インライン情報等をマークアップ言語データの形式に変換し、作業者が指定するマークアップ言語データ用フォルダ18に、変換したマークアップデータを記憶する。
この第4の変換手段P4を用いることで、電子書籍以外のマルチメディアデータの提供にも対応することが可能である。
After finishing the manual shaping work by the operator, the fourth conversion means P4 converts the word processor data into markup language data. Markup language data here refers to data such as HTML and XML other than electronic books.
As shown in FIG. 13, the fourth conversion means P4 reads word processor data stored in the word processor data folder 12 designated by the worker, and converts text data, paragraph information, inline information, etc. into markup language data. The converted markup data is stored in the markup language data folder 18 designated by the operator.
By using the fourth conversion means P4, it is possible to provide multimedia data other than electronic books.

第4の変換手段P4は、テキストデータと段落スタイル・行揃え・改行・改ページ等からなる段落情報とテキストスタイル・文字サイズ・フォント・イタリック・下線・上付き文字・下付き文字・ルビ・傍点・リンク等からなるインライン情報をワープロデータから読み込み、マークアップ言語データの形式に変換する。   The fourth conversion means P4 includes paragraph information and text style, text style, character size, font, italic, underline, superscript, subscript, ruby, and side points composed of text data, paragraph style, line alignment, line feed, and page break. -Read inline information such as links from word processing data and convert it to markup language data format.

また、第4の変換手段P4は、ワープロデータに取り込んだ画像データをプログラムによって取り出し、マークアップ言語データ用フォルダ18内に配置された画像データ用フォルダ13に取り出した画像データを記憶する。これにより、ワープロデータに取り込んだ画像データをマークアップ言語データからも閲覧できる。なお、第4の変換手段P4を用いた変換工程の実行時に用いる画像データ用フォルダ13は、マークアップ言語データ用フォルダ18内に配置されたものであり、上述した第2の変換手段P2の変換工程で用いた画像データ用フォルダ16とは異なるフォルダである。   The fourth conversion means P4 takes out the image data taken into the word processor data by a program and stores the taken image data in the image data folder 13 arranged in the markup language data folder 18. As a result, the image data captured in the word processor data can be viewed from the markup language data. The image data folder 13 used when executing the conversion process using the fourth conversion means P4 is arranged in the markup language data folder 18, and is converted by the second conversion means P2 described above. This folder is different from the image data folder 16 used in the process.

また、第4の変換手段P4は、電子書籍用に作成したワープロデータをHTMLに変換することが可能であり、ワープロデータを電子書籍データに変換せずともWEBブラウザを使って内容を確認できることも特徴の1つとして挙げられる。   The fourth conversion means P4 can convert the word processor data created for the electronic book into HTML, and can confirm the contents using the WEB browser without converting the word processor data into the electronic book data. One of the features.

また、第4の変換手段P4は、特定のデータ形式に捉われずにマークアップ言語データに変換するようにしてもよい。
例えば、経済産業省「コンテンツ緊急電子化事業」等にて、データ形式の差を吸収するために汎用的なフォーマットが策定されたならば、そのデータ形式に変換することで、編集の容易さと、データ形式の統一が両立する。
Further, the fourth conversion means P4 may convert the markup language data without being limited to a specific data format.
For example, if a general-purpose format was formulated to absorb the difference in data format at the Ministry of Economy, Trade and Industry's “Content Emergency Computerization Project”, etc., by converting it to that data format, Unify data formats.

10 組版データ用フォルダ
12 ワープロデータ用フォルダ
13,16,17 画像データ用フォルダ
14 電子書籍データ用フォルダ
18 マークアップ言語データ用フォルダ
19 外字置換用ファイル
30 コンピュータ
32 制御部
34 入力手段
36 モニタ
38 記憶手段
38 ハードディスク
A,B,C 組版ソフト
P1 第1の変換手段
P2 第2の変換手段
P3 第3の変換手段
P4 第4の変換手段
DESCRIPTION OF SYMBOLS 10 Format data folder 12 Word processor data folder 13, 16, 17 Image data folder 14 Electronic book data folder 18 Markup language data folder 19 External character replacement file 30 Computer 32 Control unit 34 Input means 36 Monitor 38 Storage means 38 Hard disks A, B, C Typesetting software P1 First conversion means P2 Second conversion means P3 Third conversion means P4 Fourth conversion means

Claims (6)

組版データから電子書籍データを作成する電子書籍データ作成方法において、
コンピュータの記憶装置には、コンピュータが実行可能なプログラムとして第1の変換手段、第2の変換手段及び第3の変換手段が記憶されており、
第1の変換手段は、
作業者が指定する組版データ用フォルダに記憶されている組版データを全て読み出し、段落情報及びインライン情報を含み組版データの体裁を制御するためのレイアウト情報をワープロデータに変換し、次に組版データのテキストデータをワープロデータに変換し、作業者が指定するワープロデータ用フォルダに全てのワープロデータを記憶し、
第2の変換手段は、
前記ワープロデータ用フォルダに記憶されているワープロデータを全て読み込み、外字と、文字エンコーディングできない文字とを検出し、検出された外字を、あらかじめ記憶されている外字置換用ファイルに基づいて置換文字に置き換え、文字エンコーディングできない文字を、あらかじめ記憶されている画像ファイルに置き換えるか又は代替文字に置き換え、
第3の変換手段は、
作業者が指定するワープロデータ用フォルダに記憶されているワープロデータを読み込み、テキストデータ・段落情報を電子書籍データの形式に変換し、作業者が指定する電子書籍データ用フォルダに変換した電子書籍データを記憶し、
前記第1の変換手段は、組版データをワープロデータに変換する際に、
組版データに含まれる柱及びノンブルのデータをワープロデータに変換しないことを特徴とする電子書籍データ作成方法。
In an electronic book data creation method for creating electronic book data from typesetting data,
The storage device of the computer stores the first conversion unit, the second conversion unit, and the third conversion unit as a computer-executable program.
The first conversion means is
Read all the formatting data stored in the formatting data folder specified by the operator, convert the layout information including paragraph information and inline information to control the appearance of the formatting data into word processing data, and then Converts text data into word processing data, stores all word processing data in the word processing data folder specified by the operator,
The second conversion means is
Reads all word processor data stored in the word processor data folder, detects external characters and characters that cannot be character encoded, and replaces the detected external characters with replacement characters based on the stored external character replacement file. Replace characters that cannot be character-encoded with pre-stored image files or substitute characters,
The third conversion means is
Electronic book data that is read from word processing data stored in a word processing data folder specified by the operator, converted into text data / paragraph information format, and converted to the electronic book data folder specified by the operator Remember
The first converting means converts the typesetting data into word processing data,
An electronic book data creation method characterized by not converting column and noble data included in typesetting data into word processor data.
第1の変換手段は、
組版データに画像が存在する場合には、画像のファイル名を文字列に変換してから画像が所在する位置に配置し、組版データに罫表が存在する場合には、罫表を表示する画像又は罫表内のテキストを特定の文字列で囲んで罫表が所在する位置に配置し、
第2の変換手段は、
ワープロデータの画像又は罫表を示す文字列に対し、別ファイルとして用意されたイメージデータをワープロデータに対して自動的に取り込み、
第3の変換手段は、
取り込まれたイメージデータの情報電子書籍データに変換し、且つワープロデータに含まれるハイパーリンク情報を電子書籍のリンク情報に変換することを特徴とする請求項記載の電子書籍データ作成方法。
The first conversion means is
If an image exists in the formatted data, the image file name is converted to a character string and then placed at the position where the image is located. If a ruled table exists in the formatted data, the image that displays the ruled table Or place the text in the ruled table in a specific character string and place it at the position where the ruled table is located,
The second conversion means is
The image data prepared as a separate file is automatically imported to the word processor data for the word processor data image or the character string indicating the ruled table .
The third conversion means is
Captured the information of the image data is converted to electronic book data, and electronic book data creation method according to claim 1, wherein the converting the hyperlink information included in word processing data in the link information of the electronic book.
第1の変換手段は、複数種類の組版データを1種類のワープロデータに変換可能であることを特徴とする請求項1又は請求項2記載の電子書籍データ作成方法。 3. The electronic book data creation method according to claim 1, wherein the first conversion means can convert a plurality of types of typesetting data into one type of word processor data. 組版データから、電子書籍データに変換可能なマークアップ言語データを作成するマークアップ言語データ作成方法において、
コンピュータの記憶装置には、コンピュータが実行可能なプログラムとして第1の変換手段、第2の変換手段及び第4の変換手段が記憶されており、
第1の変換手段は、
作業者が指定する組版データ用フォルダに記憶されている組版データを全て読み出し、段落情報及びインライン情報を含み組版データの体裁を制御するためのレイアウト情報をワープロデータに変換し、次に組版データのテキストデータをワープロデータに変換し、作業者が指定するワープロデータ用フォルダに全てのワープロデータを記憶し、
第2の変換手段は、
前記ワープロデータ用フォルダに記憶されているワープロデータを全て読み込み、外字と、文字エンコーディングできない文字とを検出し、検出された外字を、あらかじめ記憶されている外字置換用ファイルに基づいて置換文字に置き換え、文字エンコーディングできない文字を、あらかじめ記憶されている画像ファイルに置き換えるか又は代替文字に置き換え、
第4の変換手段は、
作業者が指定するワープロデータ用フォルダに記憶されているワープロデータを読み込み、テキストデータ・段落情報をマークアップ言語データの形式に変換し、作業者が指定するマークアップ言語データ用フォルダに変換したマークアップ言語データを記憶し、
前記第1の変換手段は、組版データをワープロデータに変換する際に、
組版データに含まれる柱及びノンブルのデータをワープロデータに変換しないことを特徴とするマークアップ言語データ作成方法。
In a markup language data creation method for creating markup language data that can be converted from formatted data into electronic book data,
The computer storage device stores a first conversion unit, a second conversion unit, and a fourth conversion unit as a computer-executable program,
The first conversion means is
Read all the formatting data stored in the formatting data folder specified by the operator, convert the layout information including paragraph information and inline information to control the appearance of the formatting data into word processing data, and then Converts text data into word processing data, stores all word processing data in the word processing data folder specified by the operator,
The second conversion means is
Reads all word processor data stored in the word processor data folder, detects external characters and characters that cannot be character encoded, and replaces the detected external characters with replacement characters based on the stored external character replacement file. Replace characters that cannot be character-encoded with pre-stored image files or substitute characters,
The fourth conversion means is
The word processor data stored in the word processor data folder specified by the operator is read, the text data / paragraph information is converted to the mark-up language data format, and the mark is converted to the mark-up language data folder specified by the operator. Memorize up-language data,
The first converting means converts the typesetting data into word processing data,
A markup language data creation method characterized by not converting column and noble data included in typesetting data into word processing data.
第1の変換手段は、
組版データに画像が存在する場合には、画像のファイル名を文字列に変換してから画像が所在する位置に配置し、組版データに罫表が存在する場合には、罫表を表示する画像又は罫表内のテキストを特定の文字列で囲んで罫表が所在する位置に配置し、
第2の変換手段は、
ワープロデータの画像又は罫表を示す文字列に対し、別ファイルとして用意されたイメージデータをワープロデータに対して自動的に取り込み、
第4の変換手段は、
取り込まれたイメージデータの情報マークアップ言語データに変換し、且つワープロデータに含まれるハイパーリンク情報をマークアップ言語のリンク情報に変換することを特徴とする請求項4記載のマークアップ言語データ作成方法。
The first conversion means is
If an image exists in the formatted data, the image file name is converted to a character string and then placed at the position where the image is located. If a ruled table exists in the formatted data, the image that displays the ruled table Or place the text in the ruled table in a specific character string and place it at the position where the ruled table is located,
The second conversion means is
The image data prepared as a separate file is automatically imported to the word processor data for the word processor data image or the character string indicating the ruled table .
The fourth conversion means is
5. The markup language data creation according to claim 4, wherein the captured image data information is converted into markup language data , and the hyperlink information included in the word processing data is converted into markup language link information. Method.
第1の変換手段は、複数種類の組版データを1種類のワープロデータに変換可能であることを特徴とする請求項4又は請求項5記載のマークアップ言語データ作成方法。 6. The markup language data creation method according to claim 4, wherein the first conversion means can convert a plurality of types of typesetting data into one type of word processor data.
JP2013037262A 2013-02-27 2013-02-27 Electronic book data creation method and markup language data creation method Active JP6206835B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013037262A JP6206835B2 (en) 2013-02-27 2013-02-27 Electronic book data creation method and markup language data creation method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013037262A JP6206835B2 (en) 2013-02-27 2013-02-27 Electronic book data creation method and markup language data creation method

Publications (2)

Publication Number Publication Date
JP2014164670A JP2014164670A (en) 2014-09-08
JP6206835B2 true JP6206835B2 (en) 2017-10-04

Family

ID=51615190

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013037262A Active JP6206835B2 (en) 2013-02-27 2013-02-27 Electronic book data creation method and markup language data creation method

Country Status (1)

Country Link
JP (1) JP6206835B2 (en)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5521384B2 (en) * 2008-04-25 2014-06-11 大日本法令印刷株式会社 Electronic editing / content change system for book publication document, electronic editing / content change program for book publication document, and book creation system
JP2013033432A (en) * 2011-07-06 2013-02-14 Toppan Printing Co Ltd Electronic book format conversion method, conversion system
JP3178624U (en) * 2012-07-12 2012-09-20 名鉄局印刷株式会社 Electronic document creation device

Also Published As

Publication number Publication date
JP2014164670A (en) 2014-09-08

Similar Documents

Publication Publication Date Title
US10671251B2 (en) Interactive eReader interface generation based on synchronization of textual and audial descriptors
US8107727B2 (en) Document processing apparatus, document processing method, and computer program product
CN100454293C (en) Document editing method, document editing device
JP4666996B2 (en) Electronic filing system and electronic filing method
CN112433995B (en) File format conversion method, system, computer device and storage medium
TW201416884A (en) Font distribution system and method of font distribution
KR102296939B1 (en) Managing apparatus and method of electronic documents like pdf files for multi-modes
Turró Are PDF documents accessible?
JP6206835B2 (en) Electronic book data creation method and markup language data creation method
WO2017002130A1 (en) Transformation of marked-up content to a reversible file format for automated browser based pagination
JP2002288153A (en) Application-independent data forming method, information processing program, and layout information processing system
JP2013033432A (en) Electronic book format conversion method, conversion system
JP6388756B2 (en) Electronic manual output system, electronic manual output method, and electronic manual output program
JP5707937B2 (en) Electronic document conversion apparatus and electronic document conversion method
JP5645481B2 (en) Apparatus, method, and program
JP2000076226A (en) Document data editing system
Marmel Teach Yourself Visually Word 2016
JP2004289357A (en) Method and apparatus for adding additional information, and additional information adding program
JP4508264B2 (en) Database construction apparatus, database construction method, database construction program, recording medium
Gribomont OCR with Google Vision API and Tesseract
JP7480560B2 (en) Text extraction device and program
JP2011248421A (en) Data creation method and data creation system
JP2018206303A (en) Information processing apparatus and program
JP5085147B2 (en) Layout processing apparatus, layout processing method, program, and recording medium
Gribomont Programming Historian

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20151225

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160920

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160916

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161116

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170404

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170525

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170808

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170828

R150 Certificate of patent or registration of utility model

Ref document number: 6206835

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250