JP2013016108A - Document processing method - Google Patents
Document processing method Download PDFInfo
- Publication number
- JP2013016108A JP2013016108A JP2011149939A JP2011149939A JP2013016108A JP 2013016108 A JP2013016108 A JP 2013016108A JP 2011149939 A JP2011149939 A JP 2011149939A JP 2011149939 A JP2011149939 A JP 2011149939A JP 2013016108 A JP2013016108 A JP 2013016108A
- Authority
- JP
- Japan
- Prior art keywords
- document
- file
- files
- document file
- electronic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
Description
本発明は、多数のマークアップ済み電子文書ファイル(以下、単に「文書」ともいう)にまたがる階層化番号と参照を効率的に作成する仕組みに係り、この仕組みを利用した文書処理方法、並びに、文書処理装置に関する。
特に、本発明は、文書内のデータが木構造を有する複数の要素に分類された構造化文書を処理するための方法、その方法を利用した文書処理装置に関する。
The present invention relates to a mechanism for efficiently creating hierarchical numbers and references across a number of marked-up electronic document files (hereinafter also simply referred to as “documents”), a document processing method using this mechanism, and The present invention relates to a document processing apparatus.
In particular, the present invention relates to a method for processing a structured document in which data in a document is classified into a plurality of elements having a tree structure, and a document processing apparatus using the method.
インターネットでは膨大な量の電子文書ファイルが流通している。WWW(World
WideWeb)上で公開されるこれら電子文書ファイルのほとんどはHTMLまたはXHTML等のマークアップがなされてコンピュータの記憶装置の上に分散した状態で公開されており、分散ファイル間の参照関係を設定したリンクによって情報をたどっていく仕組みとなっている。
A huge amount of electronic document files are distributed on the Internet. WWW (World
Most of these electronic document files published on WideWeb) are published in a state of being distributed on a computer storage device with markup such as HTML or XHTML, and a link in which a reference relationship between the distributed files is set It is a mechanism to follow information by.
しかし、これらの電子文書ファイルは体系化されておらず、膨大な量の電子文書ファイルを効率よく体系化することができないという問題点が指摘されるようになった。
すなわち、マークアップされた多数の文書ファイルを整理・体系化して一つのパッケージとしてまとめた電子書籍として発行するために、複数のマークアップ済み電子文書ファイルを簡便に、効率よく整理し、体系化する処理を行なうための方法および装置の開発が求められている。
However, these electronic document files are not systematized, and it has been pointed out that a huge amount of electronic document files cannot be efficiently organized.
In other words, in order to publish a large number of marked-up document files as an electronic book that is organized and organized into a single package, multiple marked-up electronic document files are organized and organized easily and efficiently. There is a need to develop a method and apparatus for performing processing.
本発明は、上記の電子文書ファイルの現状に鑑み、多数の文書ファイルを体系化するために複数の文書ファイルを階層化し順序付けして並べた上で、複数の文書ファイル内の見出し、図表のキャプション、注釈などを対象として階層化した番号を、各文書ファイルをまたがる連続番号として付与するとともに、見出しや図表のキャプション、注釈、用語・索引語などを取り出して一覧表などにした新しい文書ファイルを作り出して、元の文書ファイルと新しい文書ファイル間の関係する場所を相互に参照するリンクを設定する文書処理を簡便かつ効率的に行なう方法および装置を提供することを、課題とする。 In view of the current state of the above-mentioned electronic document file, the present invention provides a caption and chart caption in a plurality of document files after arranging and arranging a plurality of document files in order to organize a large number of document files. In addition to assigning hierarchical numbers for annotations, etc., as a continuous number across each document file, create a new document file that takes out captions, annotations, terms, index terms, etc. from headings and charts and makes it a list Thus, an object of the present invention is to provide a method and an apparatus for simply and efficiently performing document processing for setting a link that mutually refers to a related place between an original document file and a new document file.
すなわち本発明は、上記の課題を解決することができる文書処理方法、及び、文書処理装置を提供することを目的とするが、この目的は、特許請求の範囲における独立請求項1,2に記載の発明の組み合わせ、或は、独立請求項4又は5に記載の発明により達成される。また、従属請求項3の発明は、本発明の更なる有利な具体例を規定している。以下、本発明について詳しく述べる。
That is, the present invention aims to provide a document processing method and a document processing apparatus capable of solving the above-mentioned problems, and this object is described in the
上記課題を解決することを目的としてなされた本発明の文書処理装置の構成は、各々が木構造としてマークアップ済みの多数の文書ファイルを記録・保管する記憶装置と、多数の文書ファイル同士の関係を木構造として定義し、木構造の根からの階層(深さ)に応じた階層化番号形式を定義し、所定マークアップ部分を取り出して集め新しい文書ファイルを作成し、相互参照を設定するための処理を定義する出版編成機構部と、前記記憶装置から取り出した文書ファイルを、前記木構造定義に従って結合した上で前記階層化番号形式定義により階層化した連続番号を付与し、前記所定マークアップ部分を取出す定義を使って多数の文書ファイルから所定マークアップ部分を取り出して新しい文書を作成し、その新しい文書と元の文書間で相互参照のためのリンクを作り出した上で、前記の結合された電子文書ファイルを元のファイル単位に分割する機能を有する文書処理加工部と、文書処理加工部の出力をパッケージして電子書籍を作成する電子書籍出力機構部と、を含むことを特徴とするものである。 The configuration of the document processing apparatus of the present invention, which has been made for the purpose of solving the above problems, includes a storage device that records and stores a large number of document files each marked up as a tree structure, and a relationship between the large number of document files. Is defined as a tree structure, a hierarchical number format is defined according to the hierarchy (depth) from the root of the tree structure, a predetermined markup part is extracted and collected to create a new document file, and a cross-reference is set A publishing organization mechanism for defining the processing of the document and the document file retrieved from the storage device are combined in accordance with the tree structure definition and given a serial number hierarchized by the hierarchical number format definition, and the predetermined markup Create a new document by extracting predetermined markup parts from a number of document files using the definition to extract parts, and then create a new document and the original document Create an electronic book by creating a link for reference and packaging the document processing unit with the function of dividing the combined electronic document file into original file units and the output of the document processing unit And an electronic book output mechanism unit.
一方、上記の課題を解決できる本発明文書処理方法の構成は、次の通りである。
すなわち、本発明文書処理方法における第一の工程は、マークアップが施された多数の文書ファイルを記録している記録装置から電子ファイルのファイル名と名前を読み取って多数の電子文書ファイルを一つにパッケージしたときに読み込む際の順序関係と階層関係を木構造で定義し、階層化番号形式を定義し、マークアップを使って新しい文書を作り出し、元の文書と新しい文書の関連する箇所の間の相互参照設定を定義する工程である。
本発明文書処理方法における第二の工程は、マークアップが施された多数の文書ファイルを記録している記録装置から電子文書ファイルを読み出して、文書ファイル同士の木構造の指定にしたがって、電子文書ファイル同士を結合したうえで、結合された電子文書ファイル内のマークアップで指定された部分に階層化した連続番号を付与する工程と、結合された電子文書ファイルの指定マークアップ部分を複製または移動して新しい電子文書ファイルを作り出し、結合された電子文書ファイルと新しい電子文書ファイル間の関係する箇所に双方向の参照をマークアップする工程と、結合された電子文書ファイルを元の電子文書ファイル単位に分割する工程とからなる。
本発明文書処理方法における第三の工程は、上記第二の工程で出来上がった電子文書ファイル群を受け取って電子書籍の形にパッケージする工程であり、本発明文書処理方法は、上記の第一工程〜第三工程を備えたものである。
On the other hand, the configuration of the document processing method of the present invention that can solve the above-described problems is as follows.
That is, the first step in the document processing method of the present invention is to read a file name and name of an electronic file from a recording device that records a large number of document files that have been marked up, and Define the ordering and hierarchical relationships in a tree structure when packaged in a package, define a hierarchical number format, create a new document using markup, and between the original document and the relevant part of the new document This is a step of defining the cross reference setting.
The second step in the document processing method of the present invention is to read an electronic document file from a recording device that records a large number of document files that have been marked up, and in accordance with the designation of the tree structure of the document files, the electronic document After combining files, the process of assigning a hierarchical serial number to the part specified in the markup in the combined electronic document file and copying or moving the specified markup part of the combined electronic document file Creating a new electronic document file, marking up a bi-directional reference at the relevant location between the combined electronic document file and the new electronic document file, and combining the combined electronic document file with the original electronic document file unit. And the process of dividing into two.
The third step in the document processing method of the present invention is a step of receiving the electronic document file group completed in the second step and packaging it in the form of an electronic book, and the document processing method of the present invention is the above first step. -It has a third step.
本発明における電子書籍の形式としてはEPUBのように多数のXHTMLを一つのアーカイブにパッケージして配布する形式を作り出すが、EPUBに限らず、類似のパッケージ形式の電子出版物を作るために使うことができる。また、マークアップはXML、HTML、XHTMLおよびそれらに対して拡張または限定をおこなった形式のうちのいずれかの形式で記述されても良い。
本発明の文書処理装置における記録媒体は、コンピュータ読み取り可能な記録媒体であって、上記いずれかに記載の方法をコンピュータに実行させるためのプログラムを記録する。
本発明の電子文書はコンピュータで読み取り可能な電子ファイルとしてコンピュータの記憶装置に記録されるものであるが、できあがった電子書籍を除いて永続的に記録されるものである必要はなく処理工程が終わった時点で消去されても良い。
なお、上述した本発明の概要は、本発明の構成に必要な特徴のすべてを列挙したものではなく、これらの特徴のサブコンビネーションもまた発明となりうる。
The format of the electronic book in the present invention is to create a format in which a large number of XHTML is packaged and distributed in a single archive, such as EPUB, but is not limited to EPUB, and is used to create an electronic publication in a similar package format. Can do. Further, the markup may be described in any one of XML, HTML, XHTML, and a format in which these are extended or limited.
The recording medium in the document processing apparatus of the present invention is a computer-readable recording medium, and records a program for causing a computer to execute any of the methods described above.
The electronic document of the present invention is recorded in a computer storage device as an electronic file that can be read by a computer. However, the electronic document does not need to be permanently recorded except for the completed electronic book, and the processing process is completed. It may be erased at that time.
The summary of the present invention described above does not list all the features necessary for the configuration of the present invention, and sub-combinations of these features can also be the invention.
本発明は、多数の文書ファイルを体系化するために複数の文書ファイルを階層化し順序付けして並べた上で、複数の文書ファイルの見出し、図表のキャプション、注釈などを対象として階層化した番号を、各文書ファイルをまたがる連続番号として付与するとともに、見出しや図表のキャプション、注釈、用語・索引語などを取り出して一覧表などにした新しい文書ファイルを作り出して、元の文書ファイルと新しい文書ファイル間の関係する場所を相互に参照するリンクを設定することにより、複数の文書ファイルを処理するから、マークアップされた多数の文書ファイルを効率よく整理・体系化して一つのパッケージとしてまとめた電子書籍として形成することが、容易かつ簡便にできる。 In the present invention, in order to organize a large number of document files, a plurality of document files are hierarchized and arranged in an order, and the numbers hierarchized for a plurality of document file headings, captions of captions, annotations, etc. In addition to assigning each document file as a sequential number that spans each document file, a new document file is created by taking out captions, annotations, terms, index terms, etc. of headings and diagrams and creating a list, etc., between the original document file and the new document file Since multiple document files are processed by setting links that refer to each other's related locations, an electronic book that efficiently organizes and organizes a large number of marked-up document files into a single package It is easy and simple to form.
以下、発明の実施の形態を通じて本発明を説明する。
なお、以下の実施形態は請求項にかかる発明を限定するものではなく、又、実施形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。
すなわち、以下の説明では、本発明の実施形態として、請求項の発明に関わりのない部分については説明を省略しているので、実施形態の説明だけで完全なソリューションを実現することはできない。
Hereinafter, the present invention will be described through embodiments of the invention.
The following embodiments do not limit the invention according to the claims, and all combinations of features described in the embodiments are not necessarily essential to the solution means of the invention.
That is, in the following description, as the embodiment of the present invention, the description of the part not related to the invention of the claims is omitted, so that a complete solution cannot be realized only by the description of the embodiment.
図1は、本実施形態の処理装置の単位(以下、ユニットという)の構成を示したものである。図1において、文書ファイル記録ユニット10は、ハードディスクなどの記憶媒体を利用してマークアップ済みの多数の文書ファイルを格納するものである。出版物編成指示ユニット20は、ユーザーと対話するための画面を持つときは画面上に多数の文書ファイルのファイル名およびファイルの内容を表示しながらユーザーの要求に従って、多数の文書ファイルから電子書籍としてパッケージする文書ファイルを選択し、電子書籍を構成する文書ファイルの並びの順序と上下の階層構造を設定する木構造を作成する機能と階層化した番号形式を設定するユニットである。電子文書加工処理ユニット30は、多数の文書ファイルを文書ファイル記録ユニット10から受け取り、出版物編成指示ユニット20が作成した木構造設定データを参照して文書ファイルを一つに結合し、結合した文書ファイルに出版物編成指示ユニット20で規定した階層化した番号形式を付与し、元の文書ファイル単位に分割するユニットである。電子書籍出力生成ユニット40は、多数の文書ファイルを電子書籍50にパッケージするユニットである。
FIG. 1 shows the configuration of a unit (hereinafter referred to as a unit) of the processing apparatus of this embodiment. In FIG. 1, a document
図2は、文書ファイル記録ユニット10の内部に保存された文書ファイル群110を対象として、出版物編成指示ユニット20の中に設けたユーザーとの対話機能をもつ出版物木構造定義ユニット120を使って文書ファイル間の木構造を作成する様子を示す説明図である。出版物木構造定義ユニット120は、文書ファイル群110の中の多数のファイルを整理して電子書籍のパッケージを木構造で表す。図2では電子書籍のパッケージ名をPub1として設定しており、Pub1が根(第0階層)に該当する。いうまでもなくパッケージ名は任意に変更可能である。木構造の子供(第1階層)の先頭のファイルがfile−1、次のファイルがfile−2であり、file−2の子供(第2階層)の先頭のファイルがfile−3であり、以下、同じ階層にfile−nまで配置する木構造を作成した様子を表している。この木構造定義は、出版物木構造定義データ130として記憶媒体に記録される。
また、この木構造では文書ファイルを取り出す順番は、file−1、file−2、file−3、以下file−nと規定する。
FIG. 2 uses a publication tree
Further, in this tree structure, the document file extraction order is defined as file-1, file-2, file-3, and hereinafter file-n.
図3は、図2におけるfile−1の内容を模式的に例示している。file−1はXHTMLに類似のXMLで記述された内部が木構造の文書であるが、図3では本発明とは関連性のない部分の説明を省略している。以下、文書ファイルの内容の説明では同じ要領で説明を省略する。file−1の内部でh1、h2要素は見出しを表すマークアップである。XHTMLでは見出しには階層の概念がないので、この例ではdiv要素で囲む方式で階層化している。HTML5では階層を表すためにsection要素を導入しているが、これはdivの代わりにsectionで階層構造を表すのである。このようにXMLを使った電子文書のマークアップでは、異なる要素と属性の組を使って等価なマークアップを表現することができるが、本実施例の記述とは一見異なっていても、論理的には等価なマークアップ方式を使う実施形態も本発明範囲内のものである。 FIG. 3 schematically illustrates the contents of file-1 in FIG. The file-1 is a document having a tree structure inside XML that is similar to XHTML. However, in FIG. 3, the description of the portion not related to the present invention is omitted. Hereinafter, the description of the contents of the document file will be omitted in the same manner. Within file-1, h1 and h2 elements are markups representing headings. In XHTML, there is no concept of hierarchy in the headings, so in this example, hierarchization is performed by enclosing with div elements. In HTML5, a section element is introduced in order to represent a hierarchy, but this represents a hierarchical structure by section instead of div. In this way, in the markup of an electronic document using XML, an equivalent markup can be expressed using a combination of different elements and attributes, but even if it differs from the description of this embodiment, it is logical. Embodiments using an equivalent markup scheme are also within the scope of the present invention.
図4は、file−2の内容を示している。file−2にはh1で表す見出し要素のみを含んでいる。 FIG. 4 shows the contents of file-2. file-2 contains only the heading element represented by h1.
図5は、file−3の内容を示している。file−3にはh1で表す見出し要素とh2で表す見出し要素を含んでおり、これをdiv要素でマークアップして階層化している。 FIG. 5 shows the contents of file-3. The file-3 includes a heading element represented by h1 and a heading element represented by h2, and these are marked up with a div element and hierarchized.
図6は、出版物編成指示ユニット20の中に設けた階層化番号形式定義ユニット210の中で電子書籍の文書ファイルの内部の見出し部分に階層化した順序番号を付けるための設定を行なう様子を模式的に示したものである。ここでは、出版物を構成する文書ファイルの木構造の根から数えた階層レベルによって番号を構造化し、同一階層内における出現順序によって番号を増加する仕組みの構造化した番号を、見出しh1からh3要素の内容に付与する設定を行なう。
FIG. 6 shows a state in which the hierarchical number
図7および図8は、電子文書加工処理ユニット30の内部の処理の様子を模式的に示す説明図である。文書ファイル結合処理ユニット320は、出版物木構造定義データ130に記録された電子書籍パッケージを構成する文書ファイルを文書ファイル群110から取り出して、出版物木構造定義データ130で決めた木構造に従ってひとつのファイルに結合し、結合された文書ファイル340を記憶媒体の上に作りだす。階層番号付け処理ユニット350は結合された文書ファイル340を入力として、階層化番号形式定義データ220を使って図8に示されている階層番号付処理済み文書ファイル360に変換する。文書ファイル結合処理ユニット320と階層番号付け処理ユニット350は、標準的なXSLTプロセッサを使って容易に作成することができる。次に文書ファイル分割処理ユニット370が階層番号付処理済み文書ファイル360を元の文書ファイル単位に分割して電子書籍のパッケージを構成する文書ファイル群380を作りだして、文書ファイル記録ユニット10に記録する。
FIG. 7 and FIG. 8 are explanatory diagrams schematically showing the state of processing inside the electronic
図9は、結合された文書ファイル340の内部の様子を模式的に示している。結合された文書ファイル340の木構造における根要素はpublishであり、その属性に電子書籍のパッケージ名Pub1を設定している。結合された文書ファイルの区切りにはfile要素を配置し、file要素の内部に文書ファイルの内容を取り込んでいる。file要素のlevel属性に階層化番号形式定義データ220に記録されたその文書ファイルのレベルを記録し、name属性にファイル名を記録した形式でマークアップしている。XML仕様に基づくこのようなマークアップ方式と論理的に等価な表現方式は様々に考えられるが、本発明方式と等価な結合文書ファイルのマークアップ方式を使った実施形態は発明の範囲内のものである。
FIG. 9 schematically shows the internal state of the combined
図10は、結合された文書ファイル340から変換して作成した階層番号付処理済み文書ファイル360の内部の様子を模式的に例示したものである。図10で下線を施した部分が階層化番号である。階層化番号形式定義データ220によって階層番号をつける対象は、見出し要素h1〜h6と指定しているので、見出しの内容に階層化番号が付与される。階層については、出版物木構造定義データ130により、文書ファイル間の木構造で階層構造を規定しており、文書ファイル自体の階層レベルは、file要素のlevel属性で表現されており、さらに文書ファイルの内部では、div要素によって階層化しているので、結合済み文書ファイル自体も木構造であり、その内部のすべての見出し要素h1〜h6について、木構造の根要素であるpublishからみて、何レベル目の階層に該当するかということを一意に決定でき、同一階層レベル内での当該見出しの出現順序を一意に決定できる。
FIG. 10 schematically illustrates an internal state of the hierarchically numbered processed
図11〜図13は、階層化番号をつける処理を施したあとの結合ファイル360を元の文書ファイル単位に分割してできた文書ファイルの内容である。各文書ファイルの名前は結合ファイル図10のfile要素のname属性の値として保持されているので、分割してできた文書ファイルには元の文書ファイル名を付与することができる。
FIG. 11 to FIG. 13 show the contents of a document file obtained by dividing the combined
図14は、請求項2の発明を実施した適用例の概要を示したものである。図14で示す概要における処理の例は、文書ファイルの組400は、二つの文書ファイル410と420から構成する。文書ファイル410と410の内容には、注釈文章がマークアップされている。文書ファイル410から注釈文章を削除し、その代わりに注釈参照と注釈一覧文書ファイル450の関連する箇所へのリンクを挿入した文書ファイル430に変換し、文書ファイル420から注釈文章を削除し、その代わりに注釈参照と注釈一覧文書ファイル450の関連する箇所へのリンクを挿入した文書ファイル440に変換する。注釈一覧文書450には各注釈の文章からその文章が含まれていた文書ファイルの含まれていた箇所へのリンクを設定する。
FIG. 14 shows an outline of an application example in which the invention of
図15および図16は、請求項2の発明を実施するさいの電子文書加工処理ユニット30の内部の処理の様子を例示した説明図である。請求項2の発明の実施形態では、結合された文書ファイル340を作成するところまでは先に説明した実施形態と共通である。次に、電子文書加工処理ユニット30内に設けた注釈処理ユニット510は注釈処理指示データ500を使って結合された文書ファイル340の内部の注釈文章を削除して、その代わりに注釈参照番号と注釈ファイル530の中の参照先へのリンクを挿入して、注釈処理済み結合文書ファイル520に変換する。結合された文書ファイル340の中の注釈文章は注釈ファイル530に集められて、注釈処理済み結合文書ファイル520の注釈参照番号への参照のためのリンクを設定する。注釈処理ユニット510は、標準的なXSLTプロセッサをつかって容易に作成することができる。次に、電子文書加工処理ユニット30内に設けた文書ファイル分割処理ユニット370が注釈処理済結合文書ファイル520を元の文書ファイル単位に分割して電子書籍パッケージを構成する文書ファイル群380を作りだして、文書ファイル記録ユニット10に記録する。
FIGS. 15 and 16 are explanatory views illustrating the state of processing inside the electronic
図17および図18は、注釈処理を行なおうとする二つの文書ファイルfile−10とfile−11の内容を示したところである。注釈はnote要素でマークアップされている。noteには注釈の場所を示すための識別子がid属性の値として設定されている。注釈をnoteではない別の要素でマークアップしても本実施例と同様の効果を得ることができるので、これと等価なマークアップを使った実施形態は本発明の範囲内のものである。 FIGS. 17 and 18 show the contents of two document files file-10 and file-11 to be subjected to the annotation process. Annotations are marked up with note elements. In the note, an identifier for indicating the location of the annotation is set as the value of the id attribute. Even if the annotation is marked up with another element other than “note”, the same effect as in this embodiment can be obtained. Therefore, an embodiment using markup equivalent to this is within the scope of the present invention.
図19は、文書ファイル図17と文書ファイル図18を結合したときの結合された文書ファイル340の内容である。
FIG. 19 shows the contents of the combined
図20は、結合済みの文書ファイル340の注釈マークアップの内容である文章を削除して、そこに、注釈文章をあつめて作成した注釈ファイル530の注釈番号への参照のためのリンクを挿入したものである。この実施形態では注釈番号は階層によらずnote要素の出現順序で番号を付与しているが、請求項1の方法を適用して注釈に階層化番号をつけることも容易である。
In FIG. 20, the text that is the content of the annotation markup of the combined
図21は、新しく作成した注釈ファイル530の内容である。各注釈はliでマークアップしているが、liには、元の文書の注釈のnoteのidに対応するidを設定している。このidがあるので結合済みの文書ファイル340から注釈ファイル530へのリンクを設定することができる。各注釈には元の文書の該当箇所への参照リンクを設定している。
FIG. 21 shows the contents of a newly created
図22と図23は、注釈処理済みの結合ファイルを元の文書ファイルfile−10とfile−11に分割したものである。 22 and FIG. 23 are obtained by dividing the combined file after the annotation processing into the original document file file-10 and file-11.
図14で概要を示し、段落0023〜0028で実施例を説明した注釈処理では、元の文書ファイルの中の注釈としてマークアップされた箇所を削除して注釈番号を挿入した。本発明では、図表のキャプションを集めて一覧する新しい文書ファイルを作成して、元の文書ファイルの図表キャプションと新しい文書ファイルの対応する図表キャプションに相互参照のリンクを設定する仕組みも上記例と同様にして実現できる。
これにより元の文書のマークアップ箇所の操作の異なる実施形態も本発明の範囲内のものであることが分かる。
In the annotation process outlined in FIG. 14 and described in the embodiments in paragraphs 0023 to 0028, the part numbered as an annotation in the original document file is deleted and the annotation number is inserted. In the present invention, a mechanism for creating a new document file for collecting and listing chart captions and setting a cross-reference link between the chart caption of the original document file and the corresponding chart caption of the new document file is the same as the above example. Can be realized.
Thus, it can be seen that different embodiments of manipulation of markup locations in the original document are also within the scope of the present invention.
本発明は以上の通りであるから、多数の文書ファイルを利用して電子書籍を作成する上できわめて有用である。 Since the present invention is as described above, it is extremely useful for creating an electronic book using a large number of document files.
10 文書ファイル記録ユニット
20 出版物編成指示ユニット
30 電子文書加工処理ユニット
40 電子書籍生成出力ユニット
50 電子書籍
10 Document
Claims (5)
多数の文書ファイル同士の関係を木構造として定義し、前記記憶装置から取り出した文書ファイルを、前記木構造定義に従って結合した上で多数の文書間にまたがる階層化した連続番号を付与する機能と、所定マークアップ部分を取り出して集めて新しい文書ファイルを作成するための処理を定義し、かつ、その定義を使って多数の文書ファイルから所定マークアップ部分を取り出して新しい文書を作成する機能と、その新しい文書と元の文書間で相互参照を実現するリンクを作り出した上で、電子文書ファイルを元のファイル単位に分割する機能を有する文書処理加工部と、
文書処理加工部の出力をパッケージして電子書籍を作成する電子書籍出力機構部と、
を含むことを特徴とする文書処理装置。 A storage device that records and stores a large number of document files, each marked up as a tree structure;
A function of defining a relationship between a large number of document files as a tree structure, and combining the document files retrieved from the storage device according to the tree structure definition and assigning a serial number that is hierarchized between the multiple documents; A function for defining and processing to create a new document file by extracting and collecting predetermined markup parts, and creating a new document by extracting predetermined markup parts from a number of document files using the definition, and A document processing unit having a function of dividing an electronic document file into original file units after creating a link that realizes a cross-reference between the new document and the original document;
An electronic book output mechanism unit that creates an electronic book by packaging the output of the document processing unit;
A document processing apparatus comprising:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011149939A JP5739253B2 (en) | 2011-07-06 | 2011-07-06 | Document processing method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011149939A JP5739253B2 (en) | 2011-07-06 | 2011-07-06 | Document processing method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013016108A true JP2013016108A (en) | 2013-01-24 |
JP5739253B2 JP5739253B2 (en) | 2015-06-24 |
Family
ID=47688724
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011149939A Active JP5739253B2 (en) | 2011-07-06 | 2011-07-06 | Document processing method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5739253B2 (en) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09185607A (en) * | 1995-12-28 | 1997-07-15 | Dainippon Screen Mfg Co Ltd | Hyper text layout device |
JPH09305603A (en) * | 1996-05-14 | 1997-11-28 | Fuji Xerox Co Ltd | Structurized document processor, structurized document processing method and database system |
JP2000250908A (en) * | 1999-02-26 | 2000-09-14 | Planet Computer:Kk | Support device for production of electronic book |
JP2004139466A (en) * | 2002-10-18 | 2004-05-13 | Fujitsu Ltd | Electronic document printing program, and electronic document printing system |
-
2011
- 2011-07-06 JP JP2011149939A patent/JP5739253B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09185607A (en) * | 1995-12-28 | 1997-07-15 | Dainippon Screen Mfg Co Ltd | Hyper text layout device |
JPH09305603A (en) * | 1996-05-14 | 1997-11-28 | Fuji Xerox Co Ltd | Structurized document processor, structurized document processing method and database system |
JP2000250908A (en) * | 1999-02-26 | 2000-09-14 | Planet Computer:Kk | Support device for production of electronic book |
JP2004139466A (en) * | 2002-10-18 | 2004-05-13 | Fujitsu Ltd | Electronic document printing program, and electronic document printing system |
Also Published As
Publication number | Publication date |
---|---|
JP5739253B2 (en) | 2015-06-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8856645B2 (en) | Generating formatted documents based on collected data content | |
JP4921785B2 (en) | Managing and using data in computer-generated documents | |
US8756489B2 (en) | Method and system for dynamic assembly of form fragments | |
US8762834B2 (en) | User interface for defining a text file transformation | |
US20120210298A1 (en) | Locating changes in source code | |
JP2007156965A (en) | Document processing method, program, and system | |
US20080313158A1 (en) | Database file management system, integration module and browsing interface of database file management system, database file management method | |
Khalili et al. | Wysiwym authoring of structured content based on schema. org | |
CN102332023A (en) | Method and system for fast semantic annotation of e-book | |
WO2014124443A1 (en) | Creating and editing digital content works | |
CN104699714A (en) | Method and device for transferring files of book edition format into files of EPUB format | |
US20070255722A1 (en) | Data-driven page layout | |
JPWO2005098660A1 (en) | Document processing apparatus and document processing method | |
JPWO2005098658A1 (en) | Document processing apparatus and document processing method | |
JPWO2007052680A1 (en) | Document processing apparatus and document processing method | |
JP5739253B2 (en) | Document processing method | |
US20120109911A1 (en) | Compression Of XML Data | |
Witt et al. | SusTEInability of linguistic resources through feature structures | |
Greenberg et al. | Guidelines for Preserving New Forms of Scholarship | |
Becker et al. | CollectionBuilder-CONTENTdm: Developing a Static Web ‘Skin’for CONTENTdm-Based Digital Collections | |
JP6753190B2 (en) | Document retrieval device and program | |
Gruenpeter et al. | Software Stories for landmark legacy code | |
Le et al. | Dpaper: An Authoring Tool for Extractable Digital Papers | |
Gärtner et al. | Preserving workflow reproducibility: the RePlay-DH client as a tool for process documentation | |
Pereira | RODA-in-a generic tool for the mass creation of submission information packages |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140411 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20141015 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20141021 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150407 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150423 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5739253 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |