JPH11212997A - Book data registration method/system - Google Patents

Book data registration method/system

Info

Publication number
JPH11212997A
JPH11212997A JP10016175A JP1617598A JPH11212997A JP H11212997 A JPH11212997 A JP H11212997A JP 10016175 A JP10016175 A JP 10016175A JP 1617598 A JP1617598 A JP 1617598A JP H11212997 A JPH11212997 A JP H11212997A
Authority
JP
Japan
Prior art keywords
book
book data
information
tag
items
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10016175A
Other languages
Japanese (ja)
Inventor
Kozue Kai
こずえ 甲斐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Comware Corp
Original Assignee
NTT Communicationware Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Communicationware Corp filed Critical NTT Communicationware Corp
Priority to JP10016175A priority Critical patent/JPH11212997A/en
Publication of JPH11212997A publication Critical patent/JPH11212997A/en
Pending legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To define general-purpose Document Type Declaration(DTD) irrespective of a field and to retrieve a book database irrespective of the field, which does not need to manage a database at every specified field. SOLUTION: In a book data registration method, the constitution structures of various types of books are analyzed, items whose meanings are equal are collected into a similar item, the general-purpose structures of the books are decided and the general-purpose structure is defined by using tags showing the respective items so as to define DTD (step S11). Structure information of registered book data is decided (step S12) by analyzing the structure of registered book data based on DTD. Registered book data is made into Standard Generalized Makeup Language(SGML) containing book data structure information by using the tags in DTD based on structure information (step S13) and it is registered in the database (step S14).

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、書籍データを書籍
構造定義に従って標準記述言語化し、データベースに登
録する書籍データ登録方法および書籍データ登録システ
ムに関するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a book data registration method and a book data registration system for converting book data into a standard description language according to a book structure definition and registering it in a database.

【0002】[0002]

【従来の技術】近年、インターネットの利用の便をより
よくするために電子メール、ファイル転送等の機能を備
えたWWWシステム(World Wide Web System)が構築
されている。そして、このWWWシステムを利用した書
籍データの検索が試みられている。なお、ここで”書籍
データ”とは電子化(コード化)された書籍のことをい
う。書籍データの検索を可能とするためには、書籍デー
タのデータベース化を行わなければならない。また、こ
の検索効率を高めるために、データベースに登録する書
籍データの書籍構造情報を含めて登録する必要がある。
すなわち、著者名あるいは出版日に基づいて書籍データ
の検索を行いたいという要望にこたえるためには、著者
名あるいは出版日がいずれであるか、といった情報がな
いと、これらをキーとしたスムースな検索ができないか
らである。また、登録する書籍データごとに書籍データ
の構造情報が異なると効率的な検索ができない。そのた
め、登録する書籍データの書籍構造情報のひな形となる
書籍構造定義(Document TypeDeclaration:以下「DT
D」と呼ぶ)が必要となる。従来のDTDとしては、マ
ニュアル等に適し、改正時の差分情報を重視した NCALS
general DTD や、論文集に適し、本文情報のみの掲載
を可能とした Elsevier Science Full Length Article
DTD 等のDTDが提案されている。そして、これらDT
Dに基づき、登録するマニュアル等の構造が解析され、
この解析結果に基づき標準の言語構成である標準記述言
語化(Standard Generalized Makeup Language:以下
「SGML化」と呼ぶ)され、ローダによりデータベー
スに登録される。
2. Description of the Related Art In recent years, a WWW system (World Wide Web System) having functions such as e-mail and file transfer has been constructed in order to make Internet use more convenient. A search for book data using this WWW system has been attempted. Here, the "book data" refers to a computerized (coded) book. In order to be able to search book data, a database of book data must be created. Further, in order to enhance the search efficiency, it is necessary to register the book data including the book structure information of the book data to be registered in the database.
In other words, in order to respond to a request to search book data based on author name or publication date, if there is no information such as author name or publication date, a smooth search using these as keys Is not possible. Also, if the structure information of the book data differs for each book data to be registered, efficient search cannot be performed. Therefore, a book structure definition (Document Type Declaration: hereinafter referred to as “DT”) serving as a template of book structure information of book data to be registered.
D "). As a conventional DTD, NCALS is suitable for manuals, etc., and emphasizes difference information at the time of revision.
Elsevier Science Full Length Article that is suitable for general DTD and dissertation collections and allows only text information to be posted
DTDs such as the DTD have been proposed. And these DT
Based on D, the structure of the manual etc. to be registered is analyzed,
Based on the analysis result, the language is converted into a standard description language (Standard Generalized Makeup Language: hereinafter referred to as “SGML conversion”), which is a standard language configuration, and registered in a database by a loader.

【0003】[0003]

【発明が解決しようとする課題】ところで、上述の NCA
LS general DTD や Elsevier Science Full Length Art
icle DTD といったDTDは、特定の分野の書籍の書籍
構造を表すことに適しているが、他の分野の書籍をその
DTDに合わせて書籍構造の分析をすることは困難であ
る。すなわち、どのような分野の書籍へも対応可能な汎
用的なDTDとなっていない。そのため、上述のDTD
に基づいて書籍データをデータベースへ登録した場合、
特定分野ごとのデータベースとなってしまう。その結
果、特定分野ごとにデータベース管理をしなければなら
ず、かつ、分野を問わない書籍データベースの検索を行
うことが困難となる。
However, the above-mentioned NCA
LS general DTD and Elsevier Science Full Length Art
A DTD such as icle DTD is suitable for representing a book structure of a book in a specific field, but it is difficult to analyze a book structure of a book in another field according to the DTD. That is, it is not a general-purpose DTD that can handle books in any field. Therefore, the above DTD
If the book data is registered in the database based on the
It becomes a database for each specific field. As a result, it is necessary to manage the database for each specific field, and it is difficult to search the book database regardless of the field.

【0004】本発明はこのような事情に鑑みてなされた
もので、分野を問わない汎用的なDTDを定義し、この
DTDを用いて書籍データをデータベースへ登録するこ
とにより、特定分野ごとのデータベース管理が必要な
く、かつ、分野を問わない書籍データベースの検索を可
能とする書籍データ登録方法および書籍データ登録シス
テムを提供することを目的とする。
[0004] The present invention has been made in view of such circumstances, and defines a general-purpose DTD regardless of the field, and registers book data in the database using the DTD. It is an object of the present invention to provide a book data registration method and a book data registration system that do not require management and allow a search of a book database in any field.

【0005】[0005]

【課題を解決するための手段】上記目的を達成するため
に、本発明のうち請求項1に記載の発明は、複数種類の
書籍の構成構造を分析し、意味の等しい項目を類似項目
としてまとめて書籍の汎用構造を決定し、各項目を意味
するタグにより該汎用構造を定義することで書籍構造定
義を行い、登録する書籍データの構造を前記書籍構造定
義に基づいて分析することにより、該登録する書籍デー
タの構造情報を定め、前記登録する書籍データを該書籍
データの構造情報に基づき、前記書籍構造定義で用いた
タグを利用して書籍データ構造情報を含む標準記述言語
化し、前記標準記述言語化された書籍データをデータベ
ースに登録することを特徴とする書籍データ登録方法で
ある。また、請求項2に記載の発明は、請求項1に記載
の書籍データ登録方法において、前記書籍構造定義が、
前記書籍の汎用構造で囲いきれない書籍データの項目を
分類するためのタグを含むことを特徴としている。ま
た、請求項3に記載の発明は、請求項1または請求項2
に記載の書籍データ登録方法において、前記書籍構造定
義が、書籍の紙面図や書籍番号といった書籍の固有情報
を保持するためのタグを含むことを特徴としている。ま
た、請求項4に記載の発明は、請求項1乃至請求項3の
いずれかに記載の書籍データ登録方法において、前記書
籍構造定義が、該書籍構造の定義において、同一項目が
複数段必要となる項目を入れ子構造により定義している
ことを特徴としている。また、請求項5に記載の発明
は、請求項1乃至請求項4のいずれかに記載の書籍デー
タ登録方法において、前記標準記述言語化は、前記登録
する書籍データの記事ごとに行うことを特徴としてい
る。
In order to achieve the above object, according to the first aspect of the present invention, the structure of a plurality of types of books is analyzed, and items having the same meaning are grouped as similar items. By determining the general structure of the book, defining the general structure by a tag meaning each item, define the book structure, and analyzing the structure of the book data to be registered based on the book structure definition, Determine the structure information of the book data to be registered, convert the book data to be registered into a standard description language including book data structure information using the tag used in the book structure definition based on the structure information of the book data, A book data registration method characterized by registering book data in a description language into a database. According to a second aspect of the present invention, in the book data registration method according to the first aspect, the book structure definition includes:
It is characterized by including a tag for classifying items of book data that cannot be surrounded by the general-purpose structure of the book. The invention according to claim 3 is the invention according to claim 1 or claim 2.
In the book data registration method described in Item 1, the book structure definition includes a tag for holding book-specific information such as a book space and a book number. According to a fourth aspect of the present invention, in the book data registration method according to any one of the first to third aspects, the book structure definition requires a plurality of rows of the same item in the book structure definition. Is defined by a nested structure. According to a fifth aspect of the present invention, in the book data registration method according to any one of the first to fourth aspects, the standard description linguistic conversion is performed for each article of the book data to be registered. And

【0006】次に、請求項6に記載の発明は、複数種類
の書籍の構成構造を分析し意味の等しい項目を類似項目
としてまとめて決定された書籍の汎用構造をタグにより
定義した書籍構造定義に基づいて、登録する書籍データ
の構造情報を定めるための構造情報制定部と、前記登録
する書籍データを該書籍データの構造情報に基づき、前
記書籍構造定義で用いたタグを利用して書籍データ構造
情報を含んだ標準記述言語化する標準記述言語化部と、
前記標準記述言語化された書籍データをデータベースに
登録する登録処理部とを備えたことを特徴とする書籍デ
ータ登録システムである。また、請求項7に記載の発明
は、請求項6に記載の書籍データ登録システムにおい
て、前記書籍構造定義が、前記書籍の汎用構造で囲いき
れない書籍データの項目を分類するためのタグを含むこ
とを特徴としている。また、請求項8に記載の発明は、
請求項6または請求項7に記載の書籍データ登録システ
ムにおいて、前記書籍構造定義が、書籍の紙面図や書籍
番号といった書籍の固有情報を保持するためのタグを含
むことを特徴としている。また、請求項9に記載の発明
は、請求項6乃至請求項8に記載の書籍データ登録シス
テムにおいて、前記書籍構造定義が、該書籍構造の定義
において、同一項目が複数段必要となる項目を入れ子構
造により定義していることを特徴としている。また、請
求項10に記載の発明は、請求項6乃至請求項9に記載
の書籍データ登録システムにおいて、前記標準記述言語
化部が、前記登録する書籍データの記事ごとに標準記述
言語化を行うことを特徴としている。
Next, the invention according to claim 6 is a book structure definition in which the structure of books of a plurality of types is analyzed and the general structure of the book determined by grouping items having the same meaning as similar items is defined by a tag. Based on the structure information defining unit for determining the structure information of the book data to be registered, and the book data to be registered based on the structure information of the book data, the book data using the tag used in the book structure definition A standard description linguistic conversion unit for converting into a standard description language including structural information;
A registration processing unit for registering the book data in the standard description language into a database. According to a seventh aspect of the present invention, in the book data registration system according to the sixth aspect, the book structure definition includes a tag for classifying items of book data that cannot be surrounded by the general-purpose structure of the book. It is characterized by: The invention described in claim 8 is:
The book data registration system according to claim 6 or 7, wherein the book structure definition includes a tag for holding book-specific information such as a book space diagram and a book number. According to a ninth aspect of the present invention, in the book data registration system according to any one of the sixth to eighth aspects, the book structure definition includes an item that requires a plurality of identical items in the book structure definition. It is characterized by being defined by a nested structure. According to a tenth aspect of the present invention, in the book data registration system according to the sixth to ninth aspects, the standard description linguistic unit performs standard description linguistic conversion for each article of the book data to be registered. It is characterized by:

【0007】また、請求項11に記載の発明は、請求項
6に記載の書籍データ登録システムにおいて、前記標準
記述言語化部が、所定の代名詞を該代名詞が示す事項に
変換する統一処理部を備えたことを特徴としている。ま
た、請求項12に記載の発明は、請求項6に記載の書籍
データ登録システムにおいて、前記標準記述言語化部
が、参照対象をページ情報からリンク情報に置換する統
一処理部を備えたことを特徴としている。また、請求項
13に記載の発明は、請求項6に記載の書籍データ登録
システムにおいて、前記標準記述言語化部が、日付情報
を所定の日付情報表示形式に変換する統一処理部を備え
たことを特徴としている。
According to an eleventh aspect of the present invention, in the book data registration system according to the sixth aspect, the standard description linguistic unit includes a unified processing unit for converting a predetermined pronoun into a matter indicated by the pronoun. It is characterized by having. According to a twelfth aspect of the present invention, in the book data registration system according to the sixth aspect, the standard description linguistic unit includes a unified processing unit that replaces a reference target from page information with link information. Features. According to a thirteenth aspect of the present invention, in the book data registration system according to the sixth aspect, the standard description linguistic unit includes a unified processing unit that converts date information into a predetermined date information display format. It is characterized by.

【0008】[0008]

【発明の実施の形態】以下、本発明の一実施形態による
書籍データ登録方法および書籍データ登録システムを図
面を参照して説明する。図1は、電子書籍データベース
へ1の登録および検索を説明するための図である。電子
書籍データベース1への書籍データの登録は、書籍デー
タ登録システム2を用いて行われる。一方、検索はWW
Wサーバ3を介して行われる。この場合、WWWサーバ
3とクライアントとなる端末4間は、HTTP(Hyper
Text Transfer Protocol)と呼ばれるプロトコルを用い
て通信が行われる。そして、端末4は、電子書籍データ
ベース1を検索するためのリクエストを行い、WWWサ
ーバ3はレスポンスとしてハイパーテキスト記述言語で
あるHTML(Hyper TextMarkup Language)で記述さ
れた検索結果を送る。端末4では、このHTML形式で
記述されたデータの表示を行うためのブラウザと呼ばれ
るソフトを利用して電子書籍データベース1の検索、検
索結果の表示を行う。なお、検索はWWWサーバを介す
る場合に限定されず、一般的なデータベースサーバを介
して行われるものであってもよい。また、図1では書籍
データ登録システム2および端末4を1つだけ示してい
るが、複数の書籍データ登録システム2による書籍デー
タの登録、あるいは、複数の端末4による検索が行われ
る環境であってもよい。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS Hereinafter, a book data registration method and a book data registration system according to one embodiment of the present invention will be described with reference to the drawings. FIG. 1 is a diagram for explaining registration and search of 1 in the electronic book database. Registration of book data in the electronic book database 1 is performed using the book data registration system 2. On the other hand, search is WW
This is performed via the W server 3. In this case, between the WWW server 3 and the terminal 4 as a client, an HTTP (Hyper
Communication is performed using a protocol called Text Transfer Protocol). Then, the terminal 4 makes a request for searching the electronic book database 1, and the WWW server 3 sends a search result described in HTML (Hyper Text Markup Language), which is a hypertext description language, as a response. The terminal 4 searches the electronic book database 1 and displays the search results using software called a browser for displaying the data described in the HTML format. Note that the search is not limited to the case where the search is performed via a WWW server, and may be performed through a general database server. Although only one book data registration system 2 and one terminal 4 are shown in FIG. 1, this is an environment in which book data registration by a plurality of book data registration systems 2 or search by a plurality of terminals 4 are performed. Is also good.

【0009】次に、本発明の書籍データ登録方法につい
て説明する。図2は、本発明の書籍データ登録方法の概
要を示したフローチャートである。はじめに、複数種類
の書籍の構成構造を分析し、意味の等しい項目を類似項
目としてまとめて書籍の汎用構造の決定を行い、各項目
を表わすタグを用いてこの汎用構造を定義することによ
りDTD(書籍構造定義)の決定を行う(ステップS1
1)。そして、ステップS11で定義したDTDに基づ
いて、登録する書籍データの構造を分析し、登録する書
籍データの構造情報を定める(ステップS12)。次
に、登録する書籍データをステップS12で定めた書籍
データの構造情報に基づき、ステップS11のDTDに
より定義されたタグを用いて書籍データ構造情報を含む
SGML化(標準記述言語化)する(ステップS1
3)。ここでSGML化するのは、一度標準的な記述形
式での記述を行うことで、電子書籍データベース1への
登録を容易にするためである。すなわち、どのようなデ
ータベース構造にも対応可能とするためである。そし
て、SGML化された書籍データを電子書籍データベー
ス1に登録する(ステップS14)。このステップS1
2からS14を繰り返すことで、ステップS11で決定
された汎用的なDTDに基づき、順次書籍データを電子
書籍データベース1に登録していく。なお、ステップS
11で一旦DTDが決定されると、このDTDは原則と
して変更されない。以上が、書籍データ登録における処
理の流れである。
Next, the book data registration method of the present invention will be described. FIG. 2 is a flowchart showing an outline of the book data registration method of the present invention. First, the structure of a plurality of types of books is analyzed, items having the same meaning are grouped as similar items, the general structure of the book is determined, and the general structure is defined using a tag representing each item, whereby the DTD ( Determine book structure definition (step S1)
1). Then, based on the DTD defined in step S11, the structure of the book data to be registered is analyzed, and the structure information of the book data to be registered is determined (step S12). Next, based on the book data structure information determined in step S12, the book data to be registered is converted into SGML (standard description language) including book data structure information using a tag defined by the DTD in step S11 (step S11). S1
3). Here, the reason why the SGML is used is to facilitate the registration in the electronic book database 1 by once describing in a standard description format. That is, it is possible to support any database structure. Then, the SGML-converted book data is registered in the electronic book database 1 (step S14). This step S1
By repeating steps S2 to S14, book data is sequentially registered in the electronic book database 1 based on the general-purpose DTD determined in step S11. Step S
Once the DTD is determined at 11, this DTD is in principle unchanged. The above is the flow of processing in book data registration.

【0010】次に、本発明で用いるDTDについて詳細
に説明する。図3は、書籍の汎用的な構造の骨組みを示
す図である。なお、図3の書籍の汎用的な構造の骨組み
は、複数種類の書籍の構成内容を分析することにより決
定する。図3より、書籍中には書誌名や出版日付といっ
た項目を含む書誌31があり、さらに複数の記事(符号
32等)が含まれる。さらに、記事は本文(符号33
等)を含み、この本文は章、節、項に分けられるととも
に、図、表等を含んでいる構造が汎用的な構造と分析さ
れたことが分かる。
Next, the DTD used in the present invention will be described in detail. FIG. 3 is a diagram illustrating a framework of a general-purpose structure of a book. Note that the skeleton of the general-purpose structure of the book in FIG. 3 is determined by analyzing the contents of a plurality of types of books. 3, the book includes a bibliography 31 including items such as a bibliography name and a publication date, and further includes a plurality of articles (reference numeral 32 and the like). Further, the article is the main text (reference numeral 33).
This text is divided into chapters, sections, and sections, and it can be seen that the structure including figures, tables, and the like was analyzed as a general-purpose structure.

【0011】ここで、図3では示していないが、この汎
用的な構造の決定において、表現が異なるが意味の等し
い項目を類似項目としてまとめて書籍の構造を表わす項
目決定を行なっている。例えば、「編集」と「問い合わ
せ」と「発行元」や、「Fig」と「図」と「図表」な
どがそれである。これらは、それぞれ異なる項目として
定義するのではなく、同じ1つの項目として定義する。
一例として、「Fig」、「図」、「図表」は、すべて
「図」の項目として定義する。このように、表現が異な
るが意味の等しい項目をまとめることで、汎用的な書籍
構造の定義が可能となる。さらに、登録する書籍データ
中で、表現が異なるが意味の等しい項目が別々の項目名
となることもなくなり、データベース登録後における検
索効率を高めることができるからである。これにより、
分野を問わない汎用的なDTDを定義できるようにな
る。そして、このDTDに基づき書籍データをデータベ
ースへ登録することで、特定分野ごとのデータベース管
理が必要なく、かつ、分野を問わない書籍データベース
の検索が可能となる。なお、図3では、書籍の一般的な
構造の骨組み(概要)を示すのみとし、詳細については
図4以降で説明する。
Although not shown in FIG. 3, in the determination of the general-purpose structure, items having different expressions but having the same meaning are grouped as similar items to determine an item representing the structure of the book. For example, “edit”, “inquiry”, and “issuer”, “FIG”, “figure”, and “figure” are such. These are not defined as different items, but as the same one item.
As an example, "Fig", "figure", and "figure" are all defined as "figure" items. In this way, by grouping items having different expressions but having the same meaning, a general-purpose book structure can be defined. Furthermore, in the book data to be registered, items having different expressions but having the same meaning do not have different item names, and search efficiency after database registration can be improved. This allows
A general-purpose DTD can be defined regardless of the field. Then, by registering the book data in the database based on the DTD, it is not necessary to manage the database for each specific field, and it is possible to search the book database regardless of the field. Note that FIG. 3 only shows the framework (outline) of the general structure of a book, and details will be described later with reference to FIG.

【0012】図4は、本発明で用いるDTDの骨格を示
す図である。ここでは、理解しやすいように書籍を構成
する項目の関係を図示すことにより、書籍の構造を表わ
している。図4より”書誌名”、”公称発行年月日”等
の項目を含む項目”書誌”41がまず定義される。この
項目”書誌”41の構造として、上述の項目のほか”巻
号通番”、”通称号数”、”書誌情報”、”記事”を含
んでる。
FIG. 4 is a diagram showing the skeleton of the DTD used in the present invention. Here, the structure of the book is represented by showing the relationship between items constituting the book for easy understanding. 4, an item "bibliography" 41 including items such as "bibliographic name" and "nominal issue date" is first defined. The structure of this item "bibliography" 41 includes "volume serial number", "number of common names", "bibliographic information", and "article" in addition to the above items.

【0013】なお、項目”巻号通番”42において、そ
の最後に「?」という記号が付されているが、これはこ
の項目の情報が1個もしくは0個含まれることを意味す
る。なお、”0個”とは、この項目に対応するデータが
登録対象となる書籍データに含まれないことを意味す
る。また、項目”書誌情報”43が記号「<>」で括ら
れているが、これは、その項目の構造を定義する項目が
別途設けられていることを意味する。例えば、項目”書
誌情報”43では、符号45にその項目の構造が別途定
義されている。また、項目”記事”44では、その最後
に「+」という記号が付されているが、これはその項目
が1個以上含まれることを意味する。また、符号48に
示す項目”価格”の最後に「*」という記号が付されて
いるが、これはその項目が0個以上含まれることを意味
する。一方、項目の最後に記号の付されていない項目
は、この項目が必ず1個含まれることを意味する。以上
のことをまとめると、 記号なし ・・・ 必ず1個含まれる項目 記号「?」 ・・・ 1個もしくは0個含まれる項目 記号「+」 ・・・ 1個以上含まれる項目 記号「*」 ・・・ 0個以上含まれる項目 記号<>によるくくり ・・・ その項目の構造が別途定義 となる。この規則は、図4から図9において共通する。
なお、上記記号を各項目に付けるか否かは、上述の複数
の書籍の分析過程において決定される。
In the item "volume serial number" 42, a symbol "?" Is added at the end of the item, which means that one or zero pieces of information of this item are included. Note that “0” means that the data corresponding to this item is not included in the book data to be registered. The item "bibliographic information" 43 is enclosed by a symbol "<>", which means that an item defining the structure of the item is separately provided. For example, in the item "bibliographic information" 43, the structure of the item is separately defined by reference numeral 45. In addition, in the item “article” 44, a symbol “+” is added at the end, which means that one or more items are included. In addition, the symbol “*” is added at the end of the item “price” indicated by reference numeral 48, which means that the item is included in zero or more. On the other hand, an item without a symbol at the end of the item means that one item is always included. To sum up the above, there is no symbol: an item that always contains one symbol “?”: An item that contains one or zero symbols “+”: an item that contains one or more symbols “*” ... Items that contain 0 or more items Concatenated by the symbol <> ... The structure of the item is defined separately. This rule is common in FIGS. 4 to 9.
Whether or not the above-mentioned symbol is attached to each item is determined in the process of analyzing a plurality of books described above.

【0014】次に、”書誌情報”の構造を定義した項目
45では、その中に含まれる項目として、”ISBNコ
ード”46や”ISSNコード”47といった書籍番号
がある。これら書籍番号は、各書籍において一意に付さ
れたコードである。このように書籍番号といった書籍の
固有情報を保持するための項目を設けることにより、こ
れら固有情報に基づいた電子書籍データベースの検索が
可能となる。一方、 ”記事”の構造を定義した項目4
9では、その中に含まれる項目として、”分野タイト
ル”、”分野サブタイトル”、”記事情報”等が含まれ
る。なお、”書誌情報”45中の項目として”目次”4
0がある。書籍内で記事は順序性がないが、唯一この項
目”目次”によってのみ、その順序性が示されることに
なる。
Next, in the item 45 defining the structure of "bibliographic information", there are book numbers such as "ISBN code" 46 and "ISSN code" 47 as items included therein. These book numbers are codes uniquely assigned to each book. By providing an item for holding book-specific information such as a book number, it is possible to search the electronic book database based on these pieces of unique information. On the other hand, item 4 that defines the structure of "article"
9 includes "field title", "field subtitle", "article information", and the like as items included therein. It should be noted that "table of contents" 4
There is 0. Articles in a book are unordered, but only in this "table of contents" the order is indicated.

【0015】この図4に示すDTDの骨格と図3の書籍
の汎用的な構造の骨組みとの対応関係を説明すると、項
目”書誌”41、および項目”書誌情報”45が図3の
書誌31に基づき定義されたものとなっており、項目”
記事”49が図3の記事(符号32等)に基づき定義さ
れたものとなっている。
The correspondence between the skeleton of the DTD shown in FIG. 4 and the skeleton of the general structure of the book shown in FIG. 3 will be described. It is defined based on the item "
The article "49" is defined based on the article (reference numeral 32 and the like) in FIG.

【0016】ところで、特定の項目は複数の項目の構造
定義中で使用される場合がある。たとえば、”文章”と
いう項目は、”記事”、”要約”、”脚注”といった項
目の構造を定義するのに必要となるであろうし、”イメ
ージ”という項目は、”図”のみならず、”表紙”、”
裏表紙”、”ロゴ”といった項目の構造を定義するのに
必要となる。このような、複数の項目の構造を定義する
際に汎用的に用いられる項目を「独立構成項目」として
別途定義し、書籍構造の定義を容易にする。図5は、こ
の独立構成項目およびその構造定義を示す図である。図
より、独立構成項目として、”文章”、”編集者”、”
会社”、”人物”、”イメージ”、”部署”が定義され
ている。なお、これら独立構成項目は、他の項目の構造
を定義する際に汎用的に用いられるほか、例えば項目”
人物”を項目”著者”と読み替えて定義するといったよ
うに、項目名の読み替えにより汎用的に使われる場合も
ある。なお、図5において、符号51に示す項目”テキ
スト”の前の記号「or」は、この記号「or」でまと
められる複数の項目のいずれかにより構成されることを
意味する。また、符号52に示す項目”公称”、”人物
名”、”役割”をまとめた記号「()」は、これら複数
の項目が1単位となることを意味する。符号52の例で
は、項目”公称”、”人物名”、”役割”が一単位とな
り、記号「+」によりこの単位が1個以上含まれること
を意味する。なお、この規則は、図4から図9において
共通する。
Incidentally, a specific item may be used in the structure definition of a plurality of items. For example, the item "text" will be needed to define the structure of items such as "articles", "summary", and "footnotes", and the item "image" is not only a figure, "Cover", "
It is necessary to define the structure of items such as “back cover” and “logo.” Such items that are commonly used when defining the structure of multiple items are separately defined as “independent component items”. , Facilitate the definition of book structure. FIG. 5 is a diagram showing this independent configuration item and its structure definition. As shown in the figure, "Sentence", "Editor", "
The terms “company”, “person”, “image”, and “department” are defined.These independent configuration items are used for general purposes when defining the structure of other items.
There is also a case where the term “author” is defined as a “person”, which is generally used by reading the item name, etc. In addition, in FIG. Means that it is constituted by any of a plurality of items summarized by the symbol "or". Further, the symbol “()” that summarizes the items “nominal”, “person name”, and “role” shown by the reference numeral 52 means that these plural items constitute one unit. In the example of reference numeral 52, the items "nominal", "person name", and "role" are one unit, and the symbol "+" means that one or more units are included. This rule is common to FIGS. 4 to 9.

【0017】ところで、決定したDTDに基づき登録す
る書籍データを分析する段階で、DTDにより定義され
る書籍の汎用構造で囲いきれない項目が生じる場合があ
る。このような項目を分類するための項目を設ける必要
がある。そこで図6に示すように、標準的な構造で対応
できない部分を分類するために項目”メモ”を定義す
る。図より、この項目”メモ”は、項目”文章”、”パ
ラグラフ区切り記号”、”段落区切り記号”のいずれか
が0個以上含まれる構成となっている。この項目”メ
モ”は、複数種類の書籍の構成構造を分析過程で、書籍
の汎用構造で囲いきれない項目が生じると判断された項
目内に加えられる。例えば、図5の符号53に示すよう
に、項目”イメージ”の構造定義中にこの項目”メモ”
が加えられている。項目”メモ”は、他の項目の構造定
義内においても加えられておいるが、それらについては
別途説明する。このように、書籍の汎用構造で囲いきれ
ない項目を分類するための項目”メモ”を設けることに
より、登録する書籍データ中に書籍の汎用構造で囲いき
れない項目が生じても、分類可能となる。
By the way, at the stage of analyzing the book data to be registered based on the determined DTD, there may be cases where items that cannot be surrounded by the general-purpose structure of the book defined by the DTD occur. It is necessary to provide items for classifying such items. Therefore, as shown in FIG. 6, an item “memo” is defined in order to classify a portion that cannot be handled by the standard structure. As shown in the figure, this item “memo” has a configuration including zero or more of any of the items “sentence”, “paragraph separator”, and “paragraph separator”. This item “memo” is added to items that are determined in the process of analyzing the structure of a plurality of types of books to include items that cannot be surrounded by the general-purpose structure of the book. For example, as indicated by reference numeral 53 in FIG. 5, this item “memo” is included in the structure definition of the item “image”.
Has been added. The item "memo" is added in the structure definition of other items, but they will be described separately. In this way, by providing an item “memo” for classifying items that cannot be surrounded by the general-purpose structure of a book, it is possible to classify even if an item that cannot be surrounded by the general-purpose structure of a book occurs in the registered book data. Become.

【0018】次に、図4において、項目”書誌情報”4
5と項目”記事”49の構造定義内で、記号「<>」で
括られた項目、すなわち別途構造定義されている項目の
構造定義について、図7から図9を用いて説明する。図
7は、項目”書誌情報”内において、別途構造定義され
ている項目の構造定義を示す図である。図7では、項
目”書誌情報”内の項目”価格”、”発行者”、”装
丁”、”広告”、”付録”、”目次”、”出版履歴”の
構造定義が示されている。さらに、これら項目の構造定
義内にあり、別途構造定義されている項目であって、こ
れまでにその項目の構造定義が示されていないものにつ
いても示している。例えば項目”装丁”78内の項目”
表紙”75、”裏表紙”76、”ロゴ”77がこれに該
当する。
Next, in FIG. 4, the item "Bibliographic information" 4
The structure definition of the item enclosed by the symbol “<>” in the structure definition of the item 5 and the item “article” 49, that is, the structure definition of the separately defined item will be described with reference to FIGS. 7 to 9. FIG. 7 is a diagram showing a structure definition of an item whose structure is separately defined in the item "bibliographic information". FIG. 7 shows the structural definitions of the items “price”, “publisher”, “bookbinding”, “advertisement”, “appendix”, “table of contents”, and “publishing history” in the item “bibliographic information”. Further, items that are included in the structure definition of these items and are separately defined in structure, and for which the structure definition of the item has not been shown so far are also shown. For example, the item "item in binding" 78
The cover “75”, “back cover” 76, and “logo” 77 correspond to this.

【0019】図7において、図6で説明した項目”メ
モ”が、項目”価格”、”装丁”、”出版履歴”の構造
定義内(符号71、72、73の部分)に含まれてい
る。これらは、複数の書籍の分析の結果、DTDで定義
される書籍の汎用構造で囲いきれない項目が生じると判
断された項目である。また、項目”装丁”78内には、
項目”表紙”、”裏表紙”、”ロゴ”があり、これら項
目(符号75、76、77)は、それぞれ表紙、裏表
紙、ロゴのイメージといった書籍における固有情報を納
めるために設けられた項目である。これら部分は、視覚
的にインパクトのある部分であり、このような情報も分
類できるようにすることで、電子書籍データベースに対
する多面的な検索が可能となる。また、項目”目次”7
9は、その構造定義中に自己の項目”目次”(符号7
4)を含む入れ子構造となっている。目次は、一般的に
複数のタイトルやそのページにより構成され、あるタイ
トルに対しさらに細かい目次が付けられている場合があ
る。すなわち複数段構成の目次となっている場合があ
る。そして、この目次が複数段構成となっている場合に
おいて、その段数は書籍によって異なる。よって、この
ように入れ子構造で定義することにより、くり返し回数
の制限がいっさいなくなり、いかなる段数の目次構成に
も対応できるようになる。
In FIG. 7, the item “memo” explained in FIG. 6 is included in the structure definition of the items “price”, “bookbinding” and “publishing history” (parts indicated by reference numerals 71, 72 and 73). . These are items determined as a result of analysis of a plurality of books to include items that cannot be surrounded by the general-purpose structure of the book defined by the DTD. Also, in the item "Binding" 78,
There are items “cover”, “back cover”, and “logo”, and these items (reference numerals 75, 76, and 77) are provided for storing information specific to the book such as a cover, a back cover, and a logo image. It is. These parts are parts that have a visual impact, and by enabling such information to be classified, a multifaceted search of the electronic book database becomes possible. Also, the item “Table of Contents” 7
9 is its own item "table of contents" (reference numeral 7) in the structure definition.
4) Nested structure is included. The table of contents is generally composed of a plurality of titles and their pages, and a certain table may have a more detailed table of contents. That is, it may be a table of contents of a multi-stage configuration. When the table of contents has a plurality of levels, the number of levels varies depending on the book. Therefore, by defining in a nested structure in this way, there is no restriction on the number of repetitions, and it becomes possible to cope with a table of contents of any number of stages.

【0020】次に、図8、9は、項目”記事”内におい
て、別途構造定義されている項目の構造定義を示す図で
ある。図8では、項目”記事”内の項目”記事情
報”、”段落”の構造定義が示され、図9では、項目”
記事”内の項目”表”、”図”、”囲み記事”、”参
照”の構造定義が示されている。また、図7と同様に、
これら項目の構造定義内にあり、別途構造定義されてい
る項目であって、これまでにその項目の構造定義が示さ
れていないものについても示している。図8において、
項目”段落”81は、その構造定義中に項目”本文”が
あり、その項目”本文”が符号82に示すように構造定
義されている。そして、この項目”本文”82の構造定
義中に符号83で示すように項目”段落”が含まれてい
る。このように入れ子構造で定義することで、くり返し
回数の制限がいっさいなくなり、いかなる段数の段落構
成にも対応できるようになる。
Next, FIGS. 8 and 9 are diagrams showing the structure definition of items separately defined in the item "article". FIG. 8 shows the structure definition of the items “article information” and “paragraph” in the item “article”.
The structural definitions of the items “table”, “figure”, “enclosed article”, and “reference” in the article are shown.
Items which are included in the structure definition of these items and are separately defined in structure, and for which the structure definition of the item has not been shown so far are also shown. In FIG.
The item “paragraph” 81 has an item “text” in its structure definition, and the structure of the item “text” is defined as indicated by reference numeral 82. The structure definition of the item “body” 82 includes an item “paragraph” as indicated by reference numeral 83. By defining in a nested structure in this way, there is no restriction on the number of repetitions, and it is possible to cope with a paragraph configuration having any number of columns.

【0021】次に、図4から図9で説明した書籍構造の
各項目を表わすタグを用いてDTDの定義を行った例を
示す。図10、図11は、このDTDにおけるタグによ
る定義の一部を示す図である。なお、図面のスペースの
都合上、図10の続きが図11となっている。まず、図
10、図11において用いられる記号の意味を説明す
る。記号は、それぞれ、 記号なし ・・・ 必ず1個含まれるタグ(項目) 記号「?」・・・ 1個もしくは0個含まれるタグ(項目) 記号「+」・・・ 1個以上含まれるタグ(項目) 記号「*」・・・ 0個以上含まれるタグ(項目) 記号「|」・・・ OR(オア)を表し、いずれかのタ
グ(項目)で構成を意味する。また、記号「<」および
「>」の対応で区切れの対応づけがなされている。以
下、図10、図11の内容について説明する。
Next, an example in which the DTD is defined using tags representing the items of the book structure described with reference to FIGS. 4 to 9 will be described. FIG. 10 and FIG. 11 are diagrams showing some of the definitions by tags in the DTD. Note that FIG. 11 is a continuation of FIG. 10 due to the space of the drawing. First, the meaning of the symbols used in FIGS. 10 and 11 will be described. Each symbol has no symbol… Tag (item) that is always included 1 Symbol “?”… Tag (item) that is included 1 or 0 Symbol “+”… Tag that is included 1 or more (Item) Symbol “*”... Tag (item) containing 0 or more symbols Symbol “|”... Represents OR (OR), and means a configuration with any tag (item). In addition, delimiters are associated with the symbols “<” and “>”. Hereinafter, the contents of FIGS. 10 and 11 will be described.

【0022】図10の符号101に示すラインは、この
DTDのドキュメントタイプを表しており、そのドキュ
メントタイプが”MAGAZINE”と定義されている。符号1
02で、このDTDの名前が、”jawme.dtd”と示され
ている。なお、”--<Title> ???? --”は、その
タグの意味を表し、”????”がタグの意味となる。
符号103から105に示すラインは、図5の独立構成
項目を表すタグである。例えば符号103のライン
は、”<Title>”以下の部分より”文章”に関するタグ
であることが分かる。また”ENTITY”は独立構成項目を
意味し、次の”%text”が文章のタグを示す。そして、
それにつづく記号””で囲まれた部分がこの文章の構造
定義となり、この構造定義に用いられるタグ(項目)が
示されている。なお、この中の”(#PCDATA)”は、テキ
スト(文字列)を表す。また、”sub”、”sup”、”ma
thtxt”、”em”、”I”、”b”は、それぞれ、下付き
文字、上付き文字、数学的表現、強調、斜体、ボールド
を表し、これらのタグにより構成される。また、これら
のタグが記号”|”(OR)で結ばれていることからい
ずれかのタグにより構成されることを意味する。なお、
これらの下付き文字等のタグの定義は、例えば符号10
6から108のようになされている。なお、この中の”
RCDATA”は、下付き文字等の修飾用のタグであることを
意味する。また、”ELEMENT”はタグの定義を意味す
る。
The line indicated by reference numeral 101 in FIG. 10 represents the document type of the DTD, and the document type is defined as "MAGAZINE". Sign 1
02, the name of this DTD is indicated as "jawme.dtd". "-<Title>????-" represents the meaning of the tag, and "????" means the tag.
Lines denoted by reference numerals 103 to 105 are tags indicating the independent configuration items in FIG. For example, it can be seen that the line denoted by reference numeral 103 is a tag relating to “sentence” from the part below “<Title>”. “ENTITY” means an independent configuration item, and the next “% text” indicates a text tag. And
The portion surrounded by the symbol "" is the structure definition of this sentence, and the tag (item) used for this structure definition is shown. Note that “(#PCDATA)” in this represents a text (character string). Also, “sub”, “sup”, “ma”
“thtxt”, “em”, “I”, and “b” represent subscripts, superscripts, mathematical expressions, emphasis, italic, and bold, respectively, and are constituted by these tags. Since the tags are connected by the symbol "|" (OR), it means that the tag is constituted by any tag.
The definition of tags such as these subscripts is, for example,
6 to 108. Please note that "
“RCDATA” means a tag for modification such as a subscript, and “ELEMENT” means a tag definition.

【0023】そして、符号104に示すラインにタグ”
%EDITOR”(編集者)の構造定義がなされ、符号105
に示すラインにタグ”%Image”(イメージ)の構造定義
がなされている。他の独立構成項目についても同様に構
造定義がなされるものとする。 符号109に示すライ
ンでは、図6で説明した書籍の汎用構造で囲いきれない
項目を分類するためのタグ”memo”(メモ)の構造が定
義されている。図より、このタグ”memo”は、”(%tex
t)”(文章)、”br”(パラグラフの区切り記号)、”
p”(段落の区切り記号)のいずれかからなり、記号”
*”よりこれらを1つの単位としたものが、0個以上含
まれるものとして定義されている。なお、符号105に
示すタグ”%Image”(イメージ)の構造定義内にこのタ
グ”memo”が用いられている。符号110に示すライン
には、図4で説明した項目”書誌”を表すタグ”MAGAGI
NE”(書誌)の構造定義がなされている。そして、この
構造定義内で用いられているタグとして、”name”(書
誌名)、"pubnrml"(公称発行年月日)等が、符号11
1、112に示すラインで定義され、別途構造定義され
ているタグ”MAGINFO”(書誌情報)、”DOCMENT”(記
事)が図11の符号113、121で示すラインで構造
定義されている。
Then, the tag "
% EDITOR ”(editor) structure definition
The structure definition of tag "% Image" (image) is made in the line shown in. Structural definitions are similarly made for other independent configuration items. The line indicated by reference numeral 109 defines the structure of a tag “memo” for classifying items that cannot be surrounded by the general-purpose structure of the book described with reference to FIG. From the figure, this tag “memo” is replaced by “(% tex
t) ”(text),“ br ”(paragraph separator),“
p ”(paragraph separator), and the symbol“
* ”Is defined as one or more of these as one unit. The tag“ memo ”is included in the structure definition of the tag“% Image ”(image) indicated by reference numeral 105. A tag “MAGAGI” representing the item “Bibliography” described in FIG.
The structure definition of “NE” (bibliography) is made, and “name” (bibliographic name), “pubnrml” (nominal publication date) and the like are used as tags in this structure definition.
The tags “MAGINFO” (bibliographic information) and “DOCMENT” (article) defined by the lines 1 and 112 and separately defined in structure are defined by the lines 113 and 121 in FIG.

【0024】図11において、符号113に示すタグ”
MAGINFO”(書誌情報)は、図4の項目”書誌情報”4
5に対応し、その構造定義中にタグ”isbncd”(ISB
Nコード)、”issncd”(ISSNコード)といった、
書籍の固有情報を保持するためのタグが含まれている。
そして、これらタグがそれぞれ符号114、116に示
すラインで定義されている。また、タグ”Pprice”(価
格)が、符号117に示すラインに定義されており、こ
の構造定義内に、図7で説明したように書籍の汎用構造
で囲いきれない項目を分類するためのタグ”memo”(メ
モ)を含んで定義されている。また、このタグ”MAGINF
O”(書誌情報)に含まれるタグ”COVER”(装丁)が、
符号118に示すラインで構造定義され、この中には図
7で説明したようにタグ”fcover”(表紙)、”bcove
r”(裏表紙)、”logo”(ロゴ)といった書籍におけ
る固有情報を納めるためのタグが含まれている。そし
て、これらが符号118a、118b等に示すラインに
おいて定義されている。さらにタグ”COVER”(装丁)
内には図7で説明したようにタグ”memo”(メモ)が含
まれて定義されている。
In FIG. 11, the tag "113"
“MAGINFO” (bibliographic information) is the item “bibliographic information” 4 in FIG.
5 and the tag "isbncd" (ISB
N code), "issncd" (ISSN code)
Contains a tag to hold the book's unique information.
These tags are defined by lines indicated by reference numerals 114 and 116, respectively. A tag “Pprice” (price) is defined in a line indicated by reference numeral 117. In this structure definition, a tag for classifying items that cannot be surrounded by the general structure of a book as described with reference to FIG. It is defined to include "memo". Also, this tag "MAGINF
The tag “COVER” (binding) included in “O” (bibliographic information)
The structure is defined by the line indicated by reference numeral 118, and includes tags “fcover” (cover) and “bcove” as described with reference to FIG.
Tags for storing unique information in the book, such as "r" (back cover) and "logo" (logo), are included. These are defined in lines indicated by reference numerals 118a, 118b, and the like. COVER ”
The tag includes a tag "memo" (memo) as described with reference to FIG.

【0025】また、タグ”MAGINFO”(書誌情報)に含
まれるタグ”CONTENTS”(目次)が、符号120に示す
ラインで構造定義され、この中は図7で説明したように
複数段の目次構成に対応するために、その中にタグ”CO
NTENTS”(目次)を含む入れ子構造として構造定義され
ている。なお、SGML化においてそのタグにより示さ
れる範囲を表わすために開始を意味するタグと終了を意
味するタグを用いるが、符号120等のラインで用いら
れている記号”-O”はそのうち終了を意味するタグの省
略が可能なことを表す。なお、この開始を意味するタグ
と終了を意味するタグについては、図14、15にて別
途詳細に説明する。次に、符号121に示すタグ”DOCU
MENT”(記事)は、図4の項目”記事”49に対応し、
その構造定義中にタグ”PARAGRAP”(段落)が含まれ、
このタグが符号122に示すラインで構造定義されてい
る。また、このタグ”PARAGRAP”(段落)内には、タ
グ”body”(本文)が含まれ、符号123に示すライン
で構造定義されている。そして、このタグ”body”(本
文)の構造定義中にタグ”DOCUMENT”(記事)を含む入
れ子構造として定義されている。最後に符号124で示
すラインにより、このDTDの定義が終了する。
A tag "CONTENTS" (table of contents) included in the tag "MAGINFO" (bibliographic information) is structurally defined by a line indicated by reference numeral 120, and includes a multi-level table of contents as described with reference to FIG. In order to respond to the tag "CO
The structure is defined as a nested structure including “NTENTS” (table of contents). In SGMLization, a tag indicating a start and a tag indicating an end are used to represent a range indicated by the tag. The symbol "-O" used in the line indicates that the tag indicating the end can be omitted, and the tag indicating the start and the tag indicating the end are shown in FIGS. Next, the tag “DOCU” indicated by reference numeral 121 will be described in detail.
MENT ”(article) corresponds to the item“ article ”49 in FIG.
The tag “PARAGRAP” (paragraph) is included in the structure definition,
The structure of this tag is defined by the line indicated by reference numeral 122. The tag “PARAGRAP” (paragraph) includes the tag “body” (text), and the structure is defined by the line indicated by reference numeral 123. The tag “body” (body) is defined as a nested structure including the tag “DOCUMENT” (article) in the structure definition. Finally, the definition of this DTD is completed by the line indicated by reference numeral 124.

【0026】以上が、本実施の形態で用いるDTDであ
る。なお、このDTDは、 1)複数の書籍の構成構造を分析し、意味の等しい項目
を類似項目としてまとめて書籍の汎用構造の決定を行う 2)書籍の汎用構造で囲いきれない書籍データを分類す
るための項目(タグ)”メモ”を含む 3)書籍の紙面図や書籍番号といった書籍の固有情報を
保持するための項目(タグ)を含む 4)同一項目が複数段必要となる項目を入れ子構造で定
義している点において特徴を備え、このうち1以上の特
徴を含むDTDであればよく、上述のDTDに限定され
るものではない。
The above is the DTD used in the present embodiment. The DTD analyzes 1) the structure of a plurality of books and analyzes items having the same meaning as similar items to determine the general structure of the book. 2) Classifies book data that cannot be surrounded by the general structure of the book. 3) Includes items (tags) for holding book-specific information such as book space and book numbers. 4) Nest items that require multiple rows of the same item. A DTD having features in terms of its structure and including at least one feature among them is sufficient, and is not limited to the above-described DTD.

【0027】次に、上述のDTDを用いた書籍データ登
録システム2について詳細に説明する。図12は、本発
明の書籍データ登録システム2のブロック構成図であ
る。図より、書籍データ登録システム2は、各種データ
処理を行う処理部21と、各種データを記憶する記憶部
31とを備える。また、書籍データ登録システム2は、
CRT(Cathode Ray Tube)等の表示装置11、キーボ
ードやマウスといった入力装置12、電子書籍データベ
ースへ書籍データを登録する際の出力部となる出力装置
13が接続される。そして、処理部21は、DTDに基
づいて登録する書籍データの構造情報を定めるための構
造情報制定部22、書籍データの構造情報に基づきDT
Dにおいて定義されたタグを用いて書籍データの構造情
報を含めてSGML化するSGML化部23、SGML
化された書籍データを電子書籍データベース1に登録す
る登録処理部24とにより構成される。なお、この3つ
の処理部は、それぞれ図2のステップS12、S13、
S14の処理に対応する。
Next, the book data registration system 2 using the above-mentioned DTD will be described in detail. FIG. 12 is a block diagram of the book data registration system 2 of the present invention. As shown in the figure, the book data registration system 2 includes a processing unit 21 that performs various data processing and a storage unit 31 that stores various data. In addition, the book data registration system 2
A display device 11 such as a CRT (Cathode Ray Tube), an input device 12 such as a keyboard and a mouse, and an output device 13 serving as an output unit when registering book data in an electronic book database are connected. Then, the processing unit 21 includes a structure information establishing unit 22 for determining structure information of the book data to be registered based on the DTD, and a DT based on the structure information of the book data.
SGML conversion unit 23 that converts the data into SGML including the structure information of the book data using the tag defined in D, SGML
And a registration processing unit 24 for registering the converted book data in the electronic book database 1. The three processing units correspond to steps S12, S13, and S13 in FIG.
This corresponds to the process of S14.

【0028】また、構造情報制定部22は、登録する書
籍データを処理可能な形式でロードする書籍データロー
ド部25、書籍データの構造情報の処理を行う構造指定
処理部26、書籍の構造情報が定義したDTDに対応す
るするか判断する定義チェック処理部27を備える。S
GML化部23は、SGML化の処理をするSGML処
理部28と、登録した書籍データの検索効率が高まるよ
うに所定の変換処理をする統一処理部29とを備える。
なお、この処理部21は、専用のハードウェアにより実
現されるものであっても、プログラムとして提供され図
示しなCPU(中央演算処理装置)により実行され、そ
の機能が実現されるものであってもよい。
The structure information establishing unit 22 includes a book data loading unit 25 for loading book data to be registered in a processable format, a structure designation processing unit 26 for processing book data structure information, and a book structure information. A definition check processing unit 27 that determines whether or not it corresponds to the defined DTD is provided. S
The GML conversion unit 23 includes an SGML processing unit 28 that performs an SGML conversion process, and a unified processing unit 29 that performs a predetermined conversion process so as to increase the search efficiency of the registered book data.
The processing unit 21 may be realized by dedicated hardware, but may be provided as a program and executed by a CPU (Central Processing Unit) (not shown) to realize its function. Is also good.

【0029】一方、記憶部31には上述のDTD情報3
2、登録対処となる書籍データ33、構造情報制定部2
2のワーク領域となる構造情報34、SGML化部29
の出力結果となるSGML化ファイル35が記憶され
る。なお、この記憶部31は、たとえばRAM(Random
Access Memory)あるいはハードディスク等の記憶装置
により構成される。
On the other hand, the storage unit 31 stores the above-mentioned DTD information 3
2. Book data 33 to be registered, structure information establishment unit 2
2, the structure information 34 serving as the work area, and the SGML conversion unit 29
Is stored as the SGML-converted file 35 which is the output result of. The storage unit 31 stores, for example, a RAM (Random
Access Memory) or a storage device such as a hard disk.

【0030】次に、この書籍データ登録システム2の動
作を図面を用いて詳細に説明する。図13は、書籍デー
タ登録システム2の動作を表したフローチャートであ
る。はじめに、書籍データロード部25により登録する
書籍データを記憶部31の書籍データ33部分にロード
する(ステップS21)。現在の多くの出版物は、DT
P(Desk Top Publishing)によりその編集が行われ、
電子化された書籍データが存在する。しかし、DTPシ
ステムによってその書籍データのデータ形式が異なる。
そこで、この書籍データロード部25は、書籍データ登
録システム2で処理しやすい形式にしてロードを行う。
そのため書籍データロード部25は、各種書籍データの
データ形式に対応可能で、かつ、書籍データ登録システ
ム2で処理しやすい形式でロードする機能を備える。な
お、電子化された書籍データがない場合、あるいは、印
刷された書籍を利用しなければならない場合には、OC
R(Optical Character Reader)を用いて、あるいは、
キー入力により電子化した後、書籍データロード部25
によりロードすることになる。
Next, the operation of the book data registration system 2 will be described in detail with reference to the drawings. FIG. 13 is a flowchart showing the operation of the book data registration system 2. First, the book data to be registered by the book data loading unit 25 is loaded into the book data 33 of the storage unit 31 (step S21). Many current publications are DT
Edited by P (Desk Top Publishing)
Electronic book data exists. However, the data format of the book data differs depending on the DTP system.
Therefore, the book data loading unit 25 performs loading in a format that can be easily processed by the book data registration system 2.
For this reason, the book data loading unit 25 has a function of supporting various data formats of book data and loading the book data in a format that can be easily processed by the book data registration system 2. If there is no digitized book data or if a printed book must be used, the OC
Using R (Optical Character Reader) or
After digitization by key input, the book data loading unit 25
Will be loaded.

【0031】次に、構造指定処理部26により、ロード
した書籍データの構造指定をユーザに行わせ、その指定
された情報を記憶部31に記憶させる(ステップS2
2)。記憶部31への記憶処理は、その項目の範囲とそ
の構造情報(項目内容)を対にして記憶させる。なお、
DTDで作成された書籍データにおいては、そのデータ
中に書籍の構造情報を示す情報を含む場合がある。その
ような場合、構造指定処理部26はその構造情報をこの
システムのユーザに示し、それが適切かのチェックをユ
ーザに行ってもらうようにし、ユーザの指定の負担を減
らすようにしてもよい。この場合、書籍データロード部
25は、これら構造情報も含めてロードすることにな
る。また、構造指定処理部26は、DTDに則した書籍
データの構造解析を行い、その結果が適切かユーザにチ
ェックしてもらうようにしてもよい。
Next, the structure designation processing unit 26 allows the user to designate the structure of the loaded book data, and stores the designated information in the storage unit 31 (step S2).
2). The storage process in the storage unit 31 stores the range of the item and the structure information (item content) in pairs. In addition,
In book data created by the DTD, information indicating book structure information may be included in the data. In such a case, the structure designation processing unit 26 may present the structure information to the user of the system, and have the user check whether the structure information is appropriate, thereby reducing the burden of the user designation. In this case, the book data loading unit 25 loads the information including the structure information. Further, the structure specification processing unit 26 may perform a structure analysis of the book data in accordance with the DTD, and have the user check whether the result is appropriate.

【0032】次に、定義チェック処理部27により、指
定された構造情報が記憶部31に記憶されたDTD情報
32に則しているかのチェックを行う(ステップS2
3)。そして、則していない場合には、エラー表示を行
い、再度指定させる(ステップS24)。DTD情報3
2に則していない例としては、図4の項目”書誌情報”
45内の項目”ISBNコード”46は、1個もしくは
0個含まれるものとして定義されているが、ユーザが2
つ目のISBNコードの指定を行った場合、エラーとな
る。これにより、DTDの定義に則した構造情報が記憶
部31に順次記憶されていくことになる。
Next, the definition check processing unit 27 checks whether the specified structure information conforms to the DTD information 32 stored in the storage unit 31 (step S2).
3). If not, an error message is displayed and the user is designated again (step S24). DTD information 3
As an example that does not conform to item 2, the item "Bibliographic information" in FIG.
The item “ISBN code” 46 in 45 is defined as including one or zero items.
If the second ISBN code is specified, an error will occur. Thus, the structure information according to the definition of the DTD is sequentially stored in the storage unit 31.

【0033】そして、構造情報制定部22は、登録対象
となる電子データの構造情報の指定がすべて終了したか
判断し(ステップS25)、終了した場合には次の処理
に移る。なお、終了の判断は、ユーザによる指示、もし
くは、書籍データの全ての部分について構造情報の指定
が行われているかにより判断する。次に、SGML処理
部28により、造情報34を利用して書籍データ33を
構SGML化し、記憶部35にSGML化ファイル35
として記憶させる(ステップS26)。この処理により
SGML化されたファイルの一例を図14、図15に示
す。なお、図面のスペースの都合上、図14の続きが図
15となっている。
Then, the structure information establishing unit 22 determines whether or not all the specification of the structure information of the electronic data to be registered has been completed (step S25). When the specification has been completed, the process proceeds to the next processing. The determination of the end is made based on an instruction from the user or whether or not the structure information has been specified for all parts of the book data. Next, the SGML processing unit 28 converts the book data 33 into SGML using the format information 34 and stores the SGML file 35 in the storage unit 35.
(Step S26). FIGS. 14 and 15 show an example of a file converted to SGML by this processing. Note that FIG. 15 is a continuation of FIG. 14 due to the space of the drawing.

【0034】まず、図14、図15において用いられる
記号の意味を説明する。図において「<>」で囲まれた
文字が、図10、図11等で説明したタグを示してい
る。そして、タグ名を”A”とすると、”<A>”か
ら”</A>”でまでの範囲が、そのタグの意味する内
容の始めから終わりの範囲を示す。すなわち”<A>”
が開始を意味するタグとなり、”</A>”が終了を意
味するタグとなる。以下、図14、図15の内容を説明
する。図14の符号141に示すラインには、ドキュメ
ントタイプが示され、上述のDTDが利用されているこ
とが記述されている。そして、符号142に示すタグ”
<MAGAGINE>”(書誌)から図15の符号174に示す”
</MAGAGINE>”までが、書誌全体を表すことを意味す
る。この書誌の中には、大きく分けて、符号143に示
す”name”(書誌名)、符号144に示す”pubnrml”
(公称発行年月日)、符号145から符号163に示
す”MAGINFO”(書誌情報)、符号164から173に
示す”DOCUMENT”(記事)等が含まれている。また、符
号143に示すラインより書誌名が”NTT BUSINESS”
であることが分かる。他も、各タグで示す範囲によりそ
の内容が分かるようになっている。
First, the meaning of the symbols used in FIGS. 14 and 15 will be described. In the figure, characters surrounded by “<>” indicate the tags described with reference to FIGS. Assuming that the tag name is "A", the range from "<A>" to "</A>" indicates the range from the beginning to the end of the meaning of the tag. That is, “<A>”
Is a tag meaning start, and "</A>" is a tag meaning end. Hereinafter, the contents of FIGS. 14 and 15 will be described. The line indicated by reference numeral 141 in FIG. 14 indicates the document type and describes that the above-described DTD is used. Then, the tag “142”
<MAGAGINE> “(bibliography) indicates 174 shown in FIG.
</ MAGAGINE> ”represents the entire bibliography. In the bibliography,“ name ”(bibliographic name) indicated by reference numeral 143 and“ pubnrml ”indicated by reference numeral 144
(Nominal issue date), “MAGINFO” (bibliographic information) shown by reference numerals 145 to 163, “DOCUMENT” (article) shown by reference numerals 164 to 173, and the like. Also, the bibliographic name is “NTT BUSINESS” from the line indicated by reference numeral 143.
It turns out that it is. In addition, the contents can be understood from the range indicated by each tag.

【0035】また、書誌情報として、図14の符号14
6から149に示す”Pprice”(価格)、符号150か
ら155に示す”COVER”(装丁)、図15の符号15
6から162に示す”CONTENTS”(目次)等が含まれて
いるが分かる。そして、図14の符号148に示す部分
より”Pprice”(価格)内には、タグ”memo”(メモ)
として、”税抜き”が含まれている。また、”COVER”
(装丁)内において、符号151から154に示す部分
に書籍の固有情報である”fcover”(表紙)があり、そ
の中において、符号152に示す”file”(フィル名)
および符号153に示す”filesize”(ファイルサイ
ズ)が指定されている。また、図15の”CONTENTS”
(目次)内において、符号157に示す”field”(分
野タイトル)、および、”title”(タイトル)と”pag
e”(ページ)を組とした2つの情報(符号158と1
59の組と符号160と161の組)等が含まれてい
る。
As the bibliographic information, reference numeral 14 in FIG.
"Pprice" (price) shown from 6 to 149, "COVER" (bookbinding) shown from 150 to 155, and 15 shown in FIG.
It can be seen that “CONTENTS” (table of contents) and the like shown in Nos. 6 to 162 are included. The tag “memo” (memo) is included in “Pprice” (price) from the portion indicated by reference numeral 148 in FIG.
Includes “excluding tax”. Also, “COVER”
In the (bookbinding), there are "fcover" (cover), which is the unique information of the book, in the portions indicated by reference numerals 151 to 154, and "file" (fill name) indicated by reference numeral 152 therein.
And “filesize” (file size) indicated by reference numeral 153. Also, “CONTENTS” in FIG.
In the (table of contents), "field" (field title) indicated by reference numeral 157, and "title" (title) and "pag"
e "(page) as a set of two pieces of information (reference numerals 158 and 1).
59 sets and reference numerals 160 and 161).

【0036】記事としては、符号165に示す”fiel
d”(分野タイトル)、符号166から169に示す”D
OCINFO”(記事情報)、符号170から172に示す”
PARAGRAP”(段落)等が含まれている。なお、各記事は
目次によりその順番が対応づけられるが、符号157と
符号165の部分、符号158と符号167の部分、符
号159と符号168の部分で対応付けらていることが
分かる。また、”PARAGRAP”(段落)内には、符号17
1に示すように”body”(本文)が含まれている。な
お、図14、図15の例では複数の記事が1つのSGM
Lファイルに納められているが、記事ごとにSGMLフ
ァイルを作成すとよい。なぜならば、発行年月日が異な
る書籍であっても、その書籍中にシリーズ物の記事があ
る場合がある。このような場合、記事ごとにSGMLフ
ァイルとすることで関連する記事ごとの対応付けが容易
となるからである。また、検索の対象は、一般に記事が
単位となることからも、記事ごとにSGMLファイルの
作成を行うことで、記事だけの抽出が容易になる。な
お、この場合、バラバラになった記事はそのSGMLフ
ァイル内に含まれる目次情報によってのみ関連付けられ
ることになる。
As an article, "fiel" shown by reference numeral 165
d ”(field title),“ D ”indicated by reference numerals 166 to 169
OCINFO "(article information), indicated by reference numerals 170 to 172"
PARAGRAP ”(paragraphs), etc. The order of each article is associated with the table of contents, but reference numbers 157 and 165, reference numbers 158 and 167, and reference numbers 159 and 168 It can be seen that they are associated with each other in the “PARAGRAP” (paragraph).
As shown in FIG. 1, "body" (text) is included. In the examples of FIGS. 14 and 15, a plurality of articles are one SGM.
Although stored in an L file, it is preferable to create an SGML file for each article. This is because, even if the books have different publication dates, there may be a series of articles in the books. In such a case, the SGML file is used for each article, so that it becomes easy to associate each related article. In addition, since the search target is generally an article, the creation of an SGML file for each article makes it easy to extract only the article. Note that, in this case, the articles that have fallen apart are associated only by the table of contents information included in the SGML file.

【0037】次に、統一処理部28により登録した書籍
データの検索効率が高まるように所定形式に統一する処
理が行われる(ステップS27)。ここで、統一処理と
は、 1)所定の代名詞を該代名詞が示す事項への変換 2)参照対象をページ情報からリンク情報へ置換 3)日付情報を所定の日付情報表示形式へ変換 のいずれか1つもしくは2以上の処理のことを言う。
Next, a process of unifying the registered book data into a predetermined format is performed by the unification processing unit 28 so as to increase the search efficiency of the registered book data (step S27). Here, the unifying process is any one of 1) conversion of a predetermined pronoun to an item indicated by the pronoun 2) replacement of a reference target from page information to link information 3) conversion of date information to a predetermined date information display format It refers to one or more processes.

【0038】なお、所定の代名詞を該代名詞が示す事項
への変換とは、例えば本文中に出現する「本誌」、「本
稿」をそれが示す書誌名や記事名に置換することをい
う。検索の段階において、書誌名や記事名がキーワード
として利用された場合、「本誌」、「本稿」では、その
キーワードによりヒットすることができない。そこで、
電子書籍データベース1への登録前に、「本誌」、「本
稿」等の本文外の事項を示す代名詞をその代名詞が示す
事項に置換する。また、書籍データを電子書籍データベ
ース1へ登録すると、各情報はデータベース中で情報オ
ブジェクトおよびその識別子(ID)によって管理され
ることから、ページ情報が意味をなさなくなる。よって
検索する際に、検索結果に応じて参照対象を参照しよう
としてもできなくなる。そこで、参照対象をページ情報
からリンク情報に置換する。なお、リンク情報として、
例えばURL(Uniform Resource Locator)を用いる。
The conversion of a given pronoun into a matter indicated by the pronoun means, for example, replacing "booklet" and "booklet" appearing in the text with the bibliographic name or article name indicated thereby. If a bibliographic name or an article name is used as a keyword at the search stage, no hits can be found in the “book” or “book” by the keyword. Therefore,
Prior to registration in the electronic book database 1, pronouns indicating items outside the text, such as "this journal" and "this manuscript", are replaced with the items indicated by the pronouns. When book data is registered in the electronic book database 1, each piece of information is managed in the database by an information object and its identifier (ID), so that the page information becomes meaningless. Therefore, when searching, it is impossible to refer to the reference target according to the search result. Therefore, the reference target is replaced with the link information from the page information. In addition, as link information,
For example, a URL (Uniform Resource Locator) is used.

【0039】また、日付情報の所定の日付情報表示形式
への変換は、日付をキーワードとしたときの検索ヒット
率を高めるために行われる。例えば、日付情報表示形式
として、”4桁の整数による西暦/2桁の整数による月
/2桁の整数による日”とすると、日付情報として、”
平成9年5月5日”といった記述は、”1997/05
/05”に変換される。なお、この統一処理は、SGM
L化された書籍データのタグを利用し、SGML化ファ
イル35内のタグ間に挟まれるデータの置換、変更によ
り実現する。
The conversion of the date information into a predetermined date information display format is performed in order to increase the search hit rate when the date is used as a keyword. For example, if the date information display format is “4 years integer month / two digits integer month / two digits integer day”, then as date information, “
A description such as “May 5, 1997” is “1997/05
/ 05 ". This unifying process is performed by SGM
This is realized by using the tag of the book data that has been converted to L and replacing or changing the data sandwiched between the tags in the SGML conversion file 35.

【0040】最後に、登録処理部24により、このSG
ML化ファイル35を出力装置13を介して電子書籍デ
ータベースへ送信することによりデータベースへの登録
を行う(ステップS28)。なお、電子書籍データベー
ス1のDBMS(Data BaseManagement System)は、こ
のSGML化ファイルの解析を行い、そのデータベース
の論理的構造に適したように分解し、登録を行う。な
お、登録に際し、それらのデータの関連付けを行うため
に、必要に応じて識別子(ID)を付与し、このIDに
より各データの関連付けを行う。図16に、電子書籍デ
ータベース1への登録後の書籍を構成する各データの関
連イメージを示す。以上のようにして、書籍データ登録
システム2は動作する。
Finally, the registration processing section 24 executes this SG
The ML file 35 is registered in the database by transmitting it to the electronic book database via the output device 13 (step S28). Note that a DBMS (Data Base Management System) of the electronic book database 1 analyzes the SGML file, decomposes the file into a form suitable for the logical structure of the database, and registers the file. At the time of registration, an identifier (ID) is added as necessary to associate the data, and the data is associated with the ID. FIG. 16 shows a related image of each data constituting the book after registration in the electronic book database 1. The book data registration system 2 operates as described above.

【0041】なお、図12に示す書籍データ登録システ
ム2の処理部21の機能を実現するためのプログラムを
コンピュータ読み取り可能な記録媒体に記録して、この
記録媒体に記録されたプログラムをコンピュータシステ
ムに読み込ませ、実行することにより書籍データの電子
書籍データベース1への登録処理を行ってもよい。な
お、ここでいう「コンピュータシステム」とは、OSや
周辺機器等のハードウェアを含むものとする。
A program for realizing the function of the processing section 21 of the book data registration system 2 shown in FIG. 12 is recorded on a computer-readable recording medium, and the program recorded on this recording medium is stored in a computer system. By reading and executing, the book data may be registered in the electronic book database 1. Here, the “computer system” includes an OS and hardware such as peripheral devices.

【0042】[0042]

【発明の効果】以上説明したように、本発明による書籍
データ登録方法および書籍データ登録システムによれ
ば、下記の効果を得ることができる。請求項1または請
求項6の発明によれば、複数種類の書籍の構成構造を分
析し、意味の等しい項目を類似項目としてまとめて書籍
の汎用構造を決定し、各項目を意味するタグにより該汎
用構造を定義することで書籍構造定義を行い、これに基
づき書籍データの登録を行っている。このように、表現
が異なるが意味の等しい項目をまとめることで、汎用的
な書籍構造の定義が可能となる。そして、この書籍構造
定義を用いて登録する書籍データをデータベースへ登録
することにで、特定分野ごとのデータベース管理が必要
なく、かつ、分野を問わない書籍データベースの検索が
可能となる。また、請求項2または請求項7の発明によ
れば、書籍構造定義は、書籍の汎用構造で囲いきれない
書籍データを分類するためのタグを含んでいる。これに
より、登録する書籍データ中に書籍の汎用構造で囲いき
れない項目が生じても、分類可能となる。
As described above, according to the book data registration method and book data registration system of the present invention, the following effects can be obtained. According to the first or sixth aspect of the present invention, the structure of a plurality of types of books is analyzed, items having the same meaning are grouped as similar items to determine the general-purpose structure of the book, and a tag indicating each item is used to determine the general structure. A book structure is defined by defining a general-purpose structure, and book data is registered based on the book structure. In this way, by grouping items having different expressions but having the same meaning, a general-purpose book structure can be defined. By registering the book data to be registered in the database using the book structure definition, it is not necessary to manage the database for each specific field, and the book database can be searched regardless of the field. According to the second or seventh aspect of the present invention, the book structure definition includes a tag for classifying book data that cannot be surrounded by a general-purpose structure of a book. Thereby, even if an item that cannot be surrounded by the general-purpose structure of the book occurs in the book data to be registered, the book data can be classified.

【0043】また、請求項3または請求項8の発明によ
れば、書籍構造定義は、書籍の固有情報を保持するため
のタグを含んでいる。このように書籍番号といった書籍
の固有情報を保持するためのタグを設けることにより、
これら固有情報に基づいた電子書籍データベースの検索
が可能となる。また、請求項4または請求項9の発明に
よれば、書籍構造定義は、同一項目が複数段必要となる
項目を入れ子構造により定義している。このように入れ
子構造で定義することにより、くり返し回数の制限がい
っさいなくなり、いかなる段数にもその項目が対応でき
るようになる。また、請求項5または請求項10の発明
によれば、標準記述言語化は登録する書籍データの記事
ごとに行なっている。検索の対象は、一般に記事が単位
となることからも、記事ごとにSGMLファイルの作成
を行うことで、記事だけの抽出が容易になる。
According to the third or eighth aspect of the present invention, the book structure definition includes a tag for holding book-specific information. By providing tags to hold book-specific information such as book numbers,
An electronic book database can be searched based on these unique information. According to the fourth or ninth aspect of the present invention, the book structure definition defines items requiring the same item in a plurality of levels by using a nested structure. By defining in a nested structure in this way, there is no restriction on the number of repetitions, and the item can correspond to any number of steps. According to the invention of claim 5 or claim 10, the standard description linguistic conversion is performed for each article of the book data to be registered. Since a search target is generally a unit of an article, creation of an SGML file for each article facilitates extraction of only the article.

【0044】また、請求項11乃至請求項13の発明に
よれば、所定事項を所定形式に統一する処理が行われて
いる。これにより、登録した書籍データの検索効率が高
まるようになる。
According to the eleventh to thirteenth aspects, a process for unifying predetermined items into a predetermined format is performed. As a result, the search efficiency of the registered book data is improved.

【図面の簡単な説明】[Brief description of the drawings]

【図1】 電子書籍データベースへの登録および検索を
説明するための図である。
FIG. 1 is a diagram for describing registration and search in an electronic book database.

【図2】 本発明の書籍データ登録方法の概要を示した
フローチャートである。
FIG. 2 is a flowchart showing an outline of a book data registration method of the present invention.

【図3】 雑誌の一般的な構造の骨組みを示す図であ
る。
FIG. 3 is a diagram showing a skeleton of a general structure of a magazine.

【図4】 本発明で用いるDTDの骨格を示す図であ
る。
FIG. 4 is a diagram showing a skeleton of DTD used in the present invention.

【図5】 本発明で用いるDTDの独立構成項目の構造
を示す図である。
FIG. 5 is a diagram showing the structure of an independent configuration item of a DTD used in the present invention.

【図6】 標準的な構造で対応できない部分を分類する
ために用意された項目”メモ”の構造を示す図である。
FIG. 6 is a diagram showing a structure of an item “memo” prepared for classifying a part that cannot be handled by a standard structure.

【図7】 書誌情報の構造を示す図である。FIG. 7 is a diagram showing a structure of bibliographic information.

【図8】 記事の構造を示す1つめの図である。FIG. 8 is a first diagram showing the structure of an article.

【図9】 記事の構造を示す2つめの図である。FIG. 9 is a second diagram showing the structure of an article.

【図10】 本発明で用いるDTDにおけるタグの一部
を示す1つめの図である。
FIG. 10 is a first diagram showing a part of a tag in a DTD used in the present invention.

【図11】 本発明で用いるDTDにおけるタグの一部
を示す2つめの図である。
FIG. 11 is a second diagram showing a part of the tag in the DTD used in the present invention.

【図12】 本発明の書籍データ登録システムのブロッ
ク構成図である。
FIG. 12 is a block diagram of a book data registration system according to the present invention.

【図13】 書籍データ登録システムの動作を表したフ
ローチャートである。
FIG. 13 is a flowchart showing the operation of the book data registration system.

【図14】 SGMLファイルの一例を示した1つめの
図である。
FIG. 14 is a first diagram showing an example of an SGML file.

【図15】 SGMLファイルの一例を示した2つめの
図である。
FIG. 15 is a second diagram illustrating an example of an SGML file.

【図16】 電子書籍データベースへの登録後の書籍を
構成する各データの関連イメージを示した図である。
FIG. 16 is a diagram showing a related image of each data constituting the book after registration in the electronic book database.

【符号の説明】[Explanation of symbols]

1 電子書籍データベース 2 書籍データ
登録システム 3 WWWサーバ 4 端末 11 表示装置 12 入力装置 13 出力装置 21 処理部 22 構造情報制定部 23 SGML化
部 24 登録処理部 25 書籍データロード部 26 構造指定処
理部 27 定義チェック処理部 28 SGML処理部 29 統一処理部 31 記憶部 32 DTD情報 33 書籍データ 34 構造情報 35 SGML化
ファイル
Reference Signs List 1 electronic book database 2 book data registration system 3 WWW server 4 terminal 11 display device 12 input device 13 output device 21 processing unit 22 structure information establishment unit 23 SGML conversion unit 24 registration processing unit 25 book data loading unit 26 structure designation processing unit 27 Definition check processing unit 28 SGML processing unit 29 Unified processing unit 31 Storage unit 32 DTD information 33 Book data 34 Structural information 35 SGML file

Claims (13)

【特許請求の範囲】[Claims] 【請求項1】 複数種類の書籍の構成構造を分析し、意
味の等しい項目を類似項目としてまとめて書籍の汎用構
造を決定し、各項目を意味するタグにより該汎用構造を
定義することで書籍構造定義を行い、 登録する書籍データの構造を前記書籍構造定義に基づい
て分析することにより、該登録する書籍データの構造情
報を定め、 前記登録する書籍データを該書籍データの構造情報に基
づき、前記書籍構造定義で用いたタグを利用して書籍デ
ータ構造情報を含む標準記述言語化し、 前記標準記述言語化された書籍データをデータベースに
登録することを特徴とする書籍データ登録方法。
1. A structure of a plurality of types of books is analyzed, items having the same meaning are grouped as similar items to determine a general-purpose structure of the book, and the general-purpose structure is defined by a tag meaning each item. By performing a structure definition, by analyzing the structure of the book data to be registered based on the book structure definition, to determine the structure information of the book data to be registered, the book data to be registered based on the structure information of the book data, A book data registration method, comprising: converting a standard description language into a standard description language including book data structure information using a tag used in the book structure definition; and registering the standard description language into the database.
【請求項2】 前記書籍構造定義は、 前記書籍の汎用構造で囲いきれない書籍データの項目を
分類するためのタグを含むことを特徴とする請求項1記
載の書籍データ登録方法。
2. The book data registration method according to claim 1, wherein the book structure definition includes a tag for classifying items of book data that cannot be surrounded by the general-purpose structure of the book.
【請求項3】 前記書籍構造定義は、 書籍の紙面図や書籍番号といった書籍の固有情報を保持
するためのタグを含むことを特徴とする請求項1または
請求項2に記載の書籍データ登録方法。
3. The book data registration method according to claim 1, wherein the book structure definition includes a tag for holding unique information of the book, such as a page diagram of the book and a book number. .
【請求項4】 前記書籍構造定義は、 該書籍構造の定義において、同一項目が複数段必要とな
る項目を入れ子構造により定義していることを特徴とす
る請求項1乃至請求項3のいずれかに記載の書籍データ
登録方法。
4. The book structure definition according to claim 1, wherein, in the definition of the book structure, items requiring the same item in a plurality of levels are defined by a nested structure. Book data registration method described in.
【請求項5】 前記標準記述言語化は、 前記登録する書籍データの記事ごとに行うことを特徴と
する請求項1乃至請求項4のいずれかに記載の書籍デー
タ登録方法。
5. The book data registration method according to claim 1, wherein the standard description language conversion is performed for each article of the book data to be registered.
【請求項6】 複数種類の書籍の構成構造を分析し意味
の等しい項目を類似項目としてまとめて決定された書籍
の汎用構造をタグにより定義した書籍構造定義に基づい
て、登録する書籍データの構造情報を定めるための構造
情報制定部と、 前記登録する書籍データを該書籍データの構造情報に基
づき、前記書籍構造定義で用いたタグを利用して書籍デ
ータ構造情報を含んだ標準記述言語化する標準記述言語
化部と、 前記標準記述言語化された書籍データをデータベースに
登録する登録処理部とを備えたことを特徴とする書籍デ
ータ登録システム。
6. A structure of book data to be registered based on a book structure definition in which a tag is used to define a general structure of a book determined by analyzing constituent structures of a plurality of types of books and collecting items having the same meaning as similar items. A structure information establishing unit for determining information; and converting the book data to be registered into a standard description language including book data structure information using the tag used in the book structure definition based on the structure information of the book data. A book data registration system comprising: a standard description linguistic unit; and a registration processing unit for registering the standard description linguistic book data in a database.
【請求項7】 前記書籍構造定義は、 前記書籍の汎用構造で囲いきれない書籍データの項目を
分類するためのタグを含むことを特徴とする請求項6記
載の書籍データ登録システム。
7. The book data registration system according to claim 6, wherein the book structure definition includes a tag for classifying items of book data that cannot be surrounded by the general-purpose structure of the book.
【請求項8】 前記書籍構造定義は、 書籍の紙面図や書籍番号といった書籍の固有情報を保持
するためのタグを含むことを特徴とする請求項6または
請求項7に記載の書籍データ登録システム。
8. The book data registration system according to claim 6, wherein the book structure definition includes a tag for holding unique information of the book, such as a page diagram and a book number of the book. .
【請求項9】 前記書籍構造定義は、 該書籍構造の定義において、同一項目が複数段必要とな
る項目を入れ子構造により定義していることを特徴とす
る請求項6乃至請求項8のいずれかに記載の書籍データ
登録システム。
9. The book structure definition according to claim 6, wherein, in the definition of the book structure, items requiring the same item in a plurality of levels are defined by a nested structure. Book data registration system described in.
【請求項10】 前記標準記述言語化部は、 前記登録する書籍データの記事ごとに標準記述言語化を
行うことを特徴とする請求項6乃至請求項9のいずれか
に記載の書籍データ登録システム。
10. The book data registration system according to claim 6, wherein the standard description linguistic unit performs the standard description linguistic for each article of the book data to be registered. .
【請求項11】 前記標準記述言語化部は、 所定の代名詞を該代名詞が示す事項に変換する統一処理
部を備えたことを特徴とする請求項6記載の書籍データ
登録システム。
11. The book data registration system according to claim 6, wherein the standard description verbalization unit includes a unified processing unit that converts a predetermined pronoun into a matter indicated by the pronoun.
【請求項12】 前記標準記述言語化部は、 参照対象をページ情報からリンク情報に置換する統一処
理部を備えたことを特徴とする請求項6記載の書籍デー
タ登録システム。
12. The book data registration system according to claim 6, wherein the standard description linguistic unit includes a unified processing unit that replaces a reference target from page information with link information.
【請求項13】 前記標準記述言語化部は、 日付情報を所定の日付情報表示形式に変換する統一処理
部を備えたことを特徴とする請求項6記載の書籍データ
登録システム。
13. The book data registration system according to claim 6, wherein said standard description linguistic unit includes a unified processing unit for converting date information into a predetermined date information display format.
JP10016175A 1998-01-28 1998-01-28 Book data registration method/system Pending JPH11212997A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10016175A JPH11212997A (en) 1998-01-28 1998-01-28 Book data registration method/system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10016175A JPH11212997A (en) 1998-01-28 1998-01-28 Book data registration method/system

Publications (1)

Publication Number Publication Date
JPH11212997A true JPH11212997A (en) 1999-08-06

Family

ID=11909182

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10016175A Pending JPH11212997A (en) 1998-01-28 1998-01-28 Book data registration method/system

Country Status (1)

Country Link
JP (1) JPH11212997A (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20000024013A (en) * 2000-01-10 2000-05-06 김호욱 A Method Of Internet Publishing On Demand
KR100290665B1 (en) * 1999-01-19 2001-05-15 남궁석 Method for storing and managing structured document in relational database
JP2001167113A (en) * 1999-12-09 2001-06-22 Nec Corp System and method for full text retrieval considering imparted information
JP2002117213A (en) * 2000-10-11 2002-04-19 Nec Corp Manual distributing method using network
JP2004013716A (en) * 2002-06-10 2004-01-15 Mori Seiki Co Ltd Operation data accumulation/transmission device, operation management device and operation management system

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100290665B1 (en) * 1999-01-19 2001-05-15 남궁석 Method for storing and managing structured document in relational database
JP2001167113A (en) * 1999-12-09 2001-06-22 Nec Corp System and method for full text retrieval considering imparted information
KR20000024013A (en) * 2000-01-10 2000-05-06 김호욱 A Method Of Internet Publishing On Demand
JP2002117213A (en) * 2000-10-11 2002-04-19 Nec Corp Manual distributing method using network
JP2004013716A (en) * 2002-06-10 2004-01-15 Mori Seiki Co Ltd Operation data accumulation/transmission device, operation management device and operation management system

Similar Documents

Publication Publication Date Title
JP3494292B2 (en) Error correction support method for application data, computer device, application data providing system, and storage medium
US7392466B2 (en) Method and system of annotation for electronic documents
US7751624B2 (en) System and method for automating document search and report generation
US8484552B2 (en) Extensible stylesheet designs using meta-tag information
US7475333B2 (en) Defining form formats with layout items that present data of business application
US7958444B2 (en) Visualizing document annotations in the context of the source document
CN101361059B (en) System and method supporting displaying content on portable apparatus
JP4150452B2 (en) Font acquisition method, registration method, and printing method
EP1225516A1 (en) Storing data of an XML-document in a relational database
US20010014900A1 (en) Method and system for separating content and layout of formatted objects
US20050234843A1 (en) Computer program for storing electronic files and associated attachments in a single searchable database
US6915303B2 (en) Code generator system for digital libraries
US20070061719A1 (en) Address data collection and formatting apparatus and method for worldwide address formats
WO2008041367A1 (en) Document searching device, document searching method, document searching program
CN112199960B (en) Standard knowledge element granularity analysis system
KR20090084161A (en) Search system using contents information in document file
JPH11212997A (en) Book data registration method/system
Grant et al. The NASA astrophysics data system: Data holdings
Rasmussen et al. The data documentation initiative: a preservation standard for research
JP5707937B2 (en) Electronic document conversion apparatus and electronic document conversion method
Pantelia ‘Noûs, INTO CHAOS’: THE CREATION OF THE THESAURUS OF THE GREEK LANGUAGE
JP2006133933A (en) Computer processing method
EP1377917A2 (en) Extensible stylesheet designs using meta-tag information
JP4119413B2 (en) Knowledge information collection system, knowledge search system, and knowledge information collection method
Barrueco et al. Building an Autonomous citation index for GL: RePEc, the Economics working papers case.