JP2002358217A - Device for processing structured document and program thereof - Google Patents

Device for processing structured document and program thereof

Info

Publication number
JP2002358217A
JP2002358217A JP2001168191A JP2001168191A JP2002358217A JP 2002358217 A JP2002358217 A JP 2002358217A JP 2001168191 A JP2001168191 A JP 2001168191A JP 2001168191 A JP2001168191 A JP 2001168191A JP 2002358217 A JP2002358217 A JP 2002358217A
Authority
JP
Japan
Prior art keywords
data
structured
character data
processing
structured document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001168191A
Other languages
Japanese (ja)
Inventor
Yoshifumi Tanimoto
好史 谷本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Murata Machinery Ltd
Original Assignee
Murata Machinery Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Murata Machinery Ltd filed Critical Murata Machinery Ltd
Priority to JP2001168191A priority Critical patent/JP2002358217A/en
Priority to US10/160,978 priority patent/US7069503B2/en
Publication of JP2002358217A publication Critical patent/JP2002358217A/en
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

PROBLEM TO BE SOLVED: To easily process a structured document in which non-character data are changed into characters. SOLUTION: The non-character data such as image and audio data are changed into the characters, and the structured document is made by adding structured information for deciding processing contents. There are provided instructions for extracting the structured information indicating attribute of the original non-character data in the structured document wherein non-character data are the main frame of the data, and instructions for deciding processing of the structured document based on the extracted structured information.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の利用分野】この発明は、ファクシミリデータや
動画データ、音声データなどのノンキャラクターデータ
を構造化した、構造化文書の処理に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to structured document processing in which non-character data such as facsimile data, moving image data, and audio data are structured.

【0002】[0002]

【従来技術】XML(Extensible Markup Language),
SVG(Scalable Vector Graphics),XHTML(Ext
ensible Hypertext Markup Language),VoiceXML(V
oiceExtensible Markup Language)などの構造化文書の
ための規格が提案されている。これらの規格で代表的な
ものはXMLで、SVGはこれを図形のベクトルデータ
に拡張変更した規格であり、XHTMLはHTMLをX
MLで再定義した規格であり、VoiceXMLはXMLを
音声データに適用した規格である。これらの規格では、
データはキャラクターデータで、データの意味内容を情
報処理装置が理解して扱えるように、タグなどで構造化
して用いる。XMLなどはマークアップ言語であるが、
データの構造化を目的とする点で、データの表現(タブ
や改行、フォントなどの指定)を目的とするHTMLと
は異なっている。
2. Description of the Related Art Extensible Markup Language (XML),
SVG (Scalable Vector Graphics), XHTML (Ext
ensible Hypertext Markup Language), VoiceXML (V
Standards for structured documents, such as the oice Extensible Markup Language, have been proposed. A typical one of these standards is XML, SVG is a standard obtained by extending and changing this to graphic vector data, and XHTML is HTML
VoiceXML is a standard redefined by ML, and VoiceXML is a standard in which XML is applied to audio data. In these standards,
The data is character data and is structured using tags or the like so that the information processing device can understand and handle the meaning of the data. XML is a markup language,
It differs from HTML for the purpose of data structuring (designation of tabs, line feeds, fonts, etc.) in that data is structured.

【0003】XMLなどの特徴は、構造化されたデータ
に対して、属性の名前を新たに定義できる点にある。属
性はデータの名前とデータ自体のセットであり、名前を
データの意味や内容と対応させれば、名前によってデー
タを解釈して、処理・加工できる。そしてデータの処理
・加工の便宜の点から、扱えるデータはキャラクターデ
ータに限られ、特にXMLでは非数値的なキャラクター
データ、即ちテキストデータのみを取り扱える。構造化
文書のための規格でも、SVGはベクトルデータを扱う
ことができる。従って画像データをラスターフォーマッ
トからベクトルフォーマットに変換すれば構造化でき、
ベクトルデータなので図形の縮小・拡大・変形・消去・
追加・修正などが容易である。またVoiceXMLは音声
データを扱うことができる。
A feature such as XML is that attribute names can be newly defined for structured data. The attribute is a set of the data name and the data itself. If the name is associated with the meaning and content of the data, the data can be interpreted by the name and processed / processed. For convenience in data processing and processing, data that can be handled is limited to character data. In particular, XML can handle only non-numeric character data, that is, text data. Even with the standard for structured documents, SVG can handle vector data. Therefore, if image data is converted from raster format to vector format, it can be structured,
Because it is vector data, it is possible to reduce, enlarge, deform, delete,
Addition and modification are easy. VoiceXML can handle audio data.

【0004】[0004]

【発明の課題】この発明の基本的課題は、画像データや
音声データ等のノンキャラクターデータと関連づけられ
た構造化文書を受信した際に、容易に処理できるように
することにある(請求項1〜6)。請求項2の発明での
追加の課題は、キャラクター化されたノンキャラクター
データを再生できるようにすることにある。請求項3の
発明での追加の課題は、ノンキャラクターデータに適宜
の加工を施すことができるようにすることにある。請求
項4,6の発明は、構造化文書の処理条件をユーザが容
易に決定できるようにすることにある。
SUMMARY OF THE INVENTION It is a basic object of the present invention to facilitate processing when a structured document associated with non-character data such as image data or audio data is received. ~ 6). An additional object of the second aspect of the present invention is to enable reproduction of characterized non-character data. An additional object of the present invention is to enable non-character data to be appropriately processed. A fourth object of the present invention is to enable a user to easily determine processing conditions for a structured document.

【0005】[0005]

【発明の構成】この発明の構造化文書処理装置は、ノン
キャラクターデータとリンクあるいはノンキャラクター
データをキャラクター化することにより、ノンキャラク
ターデータと関連づけられた構造化文書を受信した際
に、該構造化文書中の構造化情報を参照して、前記関連
づけられたノンキャラクターデータを処理するようにし
たものである(請求項1)。
The structured document processing apparatus according to the present invention, when receiving a structured document associated with non-character data by characterizing non-character data and link or non-character data, The related non-character data is processed with reference to structured information in a document (claim 1).

【0006】この発明で、ノンキャラクターデータは静
止画データや動画データなどの画像データや音声データ
などを意味し、文字、数値、制御データからなるキャラ
クターデータとの対比語として用いる。
In the present invention, non-character data means image data such as still image data and moving image data, audio data, and the like, and is used as a contrast with character data including characters, numerical values, and control data.

【0007】好ましくは、前記キャラクター化したデー
タをノンキャラクターデータに再変換するための手段を
設ける(請求項2)。好ましくは、関連づけられたノン
キャラクターデータを、構造化情報に基づき加工するた
めの手段を設ける(請求項3)。また好ましくは、構造
化情報から処理内容を決定するためのテーブルと、該テ
ーブルへのユーザの入力を受け付けてテーブルに記憶さ
せる手段とを設けて、構造化情報で前記テーブルを参照
して処理を決定するように構成する(請求項4)。
Preferably, there is provided means for re-converting the characterized data into non-character data. Preferably, means is provided for processing the associated non-character data based on the structured information. Also preferably, a table for determining the processing content from the structured information and means for receiving a user's input to the table and storing the table in the table are provided, and the processing is performed by referring to the table with the structured information. It is configured to be determined (claim 4).

【0008】この発明の構造化文書処理プログラムは、
ノンキャラクターデータをデータ本体とする構造化文書
中の、元のノンキャラクターデータの属性を示す構造化
情報を抽出するための命令と、抽出した構造化情報に基
づいて構造化文書の処理を決定するための命令とを備え
たものである(請求項5)。
[0008] The structured document processing program of the present invention comprises:
A command for extracting structured information indicating an attribute of the original non-character data in a structured document having non-character data as a data body, and processing of the structured document is determined based on the extracted structured information. (Claim 5).

【0009】好ましくは、構造化情報を参照してノンキ
ャラクターデータへの処理内容を決定するためのテーブ
ルを生成するための命令と、該テーブルへのユーザの入
力を受け付け該テーブルに記憶するための命令とを設け
て、前記抽出した構造化情報により前記テーブルを参照
して、ノンキャラクターデータの処理内容を決定する
(請求項6)。
[0009] Preferably, an instruction for generating a table for determining the processing content of the non-character data with reference to the structured information, and a command for receiving a user input to the table and storing it in the table are provided. An instruction is provided to determine the processing content of the non-character data by referring to the table based on the extracted structured information (claim 6).

【0010】[0010]

【発明の作用と効果】この発明では、ノンキャラクター
データと関連づけられた構造化文書を受信した際に、構
造化文書中の構造化情報を参照して、ノンキャラクター
データを処理できる。このため構造化情報を用いて、ノ
ンキャラクターデータを適切に処理できる(請求項1〜
6)。
According to the present invention, when a structured document associated with non-character data is received, the non-character data can be processed with reference to the structured information in the structured document. Therefore, non-character data can be appropriately processed using the structured information.
6).

【0011】請求項2の発明では、ノンキャラクターデ
ータがキャラクターデータに変換されて構造化文書に含
められている場合でも、元のノンキャラクターデータへ
再変換できるので、ノンキャラクターデータを再生して
プリントしあるいは表示できる。請求項3の発明では、
ノンキャラクターデータにインデックスを付してデータ
ベースに入力する、構造化情報と重ねてプリントする、
所定の宛先に転送する、などの加工を容易に行うことが
できる。
According to the second aspect of the invention, even when non-character data is converted to character data and included in a structured document, the non-character data can be converted back to the original non-character data. Or display. In the invention of claim 3,
Index non-character data and enter it into the database, print with structured information,
Processing such as transfer to a predetermined destination can be easily performed.

【0012】請求項4,6の発明では、構造化情報から
処理内容を決定するためのテーブルを設け、かつテーブ
ルに記憶した処理内容はユーザが入力自在なので、ユー
ザの選択に従って適宜の処理を柔軟に実行できる。
According to the fourth and sixth aspects of the present invention, a table for determining the processing content from the structured information is provided, and the processing content stored in the table can be input by the user, so that appropriate processing can be flexibly performed according to the user's selection. Can be executed.

【0013】[0013]

【実施例】図1〜図6に実施例を示す。図1は実施例の
基本的構成を示し、2は構造化文書生成装置で、音声デ
ータや画像データ等のノンキャラクターデータの送信と
受信とができ、かつ構造化文書の送受信ができる。また
構造化文書生成装置2は、DVD,CD−ROM等の記
憶媒体9に記憶した構造化文書生成プログラムを読み取
り、これに伴って自己のリソースを構造化情報生成部6
等に割り当て、構造化文書の生成を行う。構造化文書生
成装置2はLAN4に接続されて、ノンキャラクターデ
ータの送受信と構造化文書の送受信とを行う。これ以外
に公衆電話回線網(PSTN)に接続されて、ファクシ
ミリデータ等の送受信を行う。さらにインターネット等
のネットワークに接続されて、インターネットファクシ
ミリや動画データ、音声データ等の送受信を行う。また
イメージスキャナやデジタルビデオカメラなどとして、
ノンキャラクターデータを生成する。
1 to 6 show an embodiment. FIG. 1 shows a basic configuration of the embodiment. Reference numeral 2 denotes a structured document generation device which can transmit and receive non-character data such as audio data and image data, and can transmit and receive a structured document. The structured document generation device 2 reads a structured document generation program stored in a storage medium 9 such as a DVD or a CD-ROM, and allocates its own resources to the structured information generation unit 6.
To generate a structured document. The structured document generation device 2 is connected to the LAN 4 and performs transmission and reception of non-character data and transmission and reception of a structured document. In addition, it is connected to a public telephone network (PSTN) to transmit and receive facsimile data and the like. Further, it is connected to a network such as the Internet and transmits and receives Internet facsimile, moving image data, audio data, and the like. In addition, as an image scanner or digital video camera,
Generate non-character data.

【0014】構造化情報生成部6は、通信自体に関する
情報から、またe−メール形式でノンキャラクターデー
タを受信した場合のヘッダや本文から、あるいは構造化
文書生成装置でイメージスキャン等を行う場合のユーザ
の入力などから、構造化情報を発生させる。ノンキャラ
クターデータは、構造化文書ファイル10の添付ファイ
ル11としても良く、あるいはキャラクターデータに変
換しても良い。キャラクターデータに変換する場合に
は、ノンキャラクターデータに再変換するための情報を
構造化情報に含めておく。
The structured information generating unit 6 receives information from the communication itself, a header or text when non-character data is received in an e-mail format, or an image when the structured document generating apparatus performs image scanning or the like. Generates structured information from user input or the like. The non-character data may be an attached file 11 of the structured document file 10, or may be converted into character data. When converting to character data, information for re-converting to non-character data is included in the structured information.

【0015】通信自体に関する情報には、データの送信
元のアドレスやID、ファクシミリ、動画、音声などの
データの種類、通信モード、インターネットの場合の受
信までの通信経路、受信した自機の装置番号、受信日
時、通信時間、データ量、通信結果などがあり、これら
は通信に必要なあるいは通信に伴うパラメータや、発信
元、受信装置の情報である。これらから適当なものを選
択し、そのままあるいは別のキーワードなどに変換して
構造化情報とする。またe−メール形式のデータの場
合、ノンキャラクターデータは添付ファイルにあり、ヘ
ッダや本文には通信自体に関する情報の他に、タイトル
や、回覧/全員配布/プロジェクト要員のみ、などの転
送先の情報、極秘/社外秘などの秘密のランクなどが記
載され、これらはノンキャラクターデータの処理に参照
できる。そこでヘッダや本文から得られるデータを構造
化情報として、構造化文書を作成する。
The information relating to the communication itself includes the address and ID of the data transmission source, the type of data such as facsimile, moving image, voice, etc., the communication mode, the communication path up to reception in the case of the Internet, and the device number of the own device that has received the data. , Reception date and time, communication time, data amount, communication result, and the like, which are information necessary for communication or associated with communication, information on a transmission source, and a receiving device. Appropriate ones are selected from these, and are converted into structured information as it is or converted into another keyword or the like. In the case of e-mail format data, non-character data is included in the attached file, and in the header and body, in addition to information on the communication itself, information on the transfer destination such as title, circulation / distribution of all members / project personnel only, etc. , Secret rank such as top secret / external secret, etc., which can be referred to for processing non-character data. Therefore, a structured document is created using data obtained from the header and the body as structured information.

【0016】またイメージスキャナなどのように、ノン
キャラクターデータの発生源として構造化文書生成装置
を用いる場合、データの読み込み時に、キーワードや転
送先、取り扱い、タイトルなどをユーザが入力すること
を期待でき、これらを構造化情報とする。キャラクター
変換部8は、ノンキャラクターデータをキャラクターデ
ータに変換するためのもので、特に設けなくても良い。
そして構造化文書ファイル10は、ノンキャラクターデ
ータの添付ファイル11とリンクして、構造化文書処理
装置12等の所定の宛先にLAN4等を介して転送され
る。なお図1では、図示の都合上、LAN4を介さない
かのように表示した。
When a structured document generation device is used as a source of non-character data, such as an image scanner, the user can expect to input keywords, transfer destinations, handling, titles, and the like when reading data. These are structured information. The character conversion unit 8 is for converting non-character data into character data, and may not be provided.
The structured document file 10 is linked to the attached file 11 of the non-character data and transferred to a predetermined destination such as the structured document processing device 12 via the LAN 4 or the like. In FIG. 1, for the sake of illustration, the display is as if it were not via the LAN 4.

【0017】構造化文書処理装置12は、構造化情報を
参照して、加工やプリント,表示,記憶,配信,転送等
の処理を行い、構造化文書の処理プログラムをDVDや
CD−ROMなどの記憶媒体13から読み込む。加工,
プリント,表示,記憶,配信,転送等の処理を決定する
ため、構造化情報を構造化情報抽出部14で抽出し、処
理条件記憶部16に用いた処理条件を参照して、構造化
文書の処理を決定する。ノンキャラクター変換部18
は、構造化文書中のキャラクターデータをノンキャラク
ターデータに再変換するためのもので、設けなくても良
い。記憶部20は構造化した文書自体や、その添付ファ
イル、リンク情報、処理、主要な属性等を記憶する。
The structured document processing device 12 performs processing such as processing, printing, display, storage, distribution, and transfer with reference to the structured information, and stores a processing program for the structured document in a DVD or CD-ROM. Read from the storage medium 13. processing,
In order to determine processing such as print, display, storage, distribution, transfer, and the like, structured information is extracted by the structured information extraction unit 14, and the processing conditions used in the processing condition storage unit 16 are referred to to determine the structure of the structured document. Determine the processing. Non-character conversion unit 18
Is for re-converting the character data in the structured document into non-character data, and need not be provided. The storage unit 20 stores the structured document itself, its attached file, link information, processing, main attributes, and the like.

【0018】図1の実施例を、ファクシミリサーバ22
と文書管理サーバ24との関係として、具体的に表現し
た例を図2に示す。ファクシミリサーバ22と文書管理
サーバ24とはLAN4を介して接続され、ファクシミ
リサーバ22にはインターネットや公衆電話回線網等か
らファクシミリデータが送信される。ファクシミリデー
タには、データ本体となる画像データの他に、発信元の
アドレスや解像度,符号化の方式,紙のサイズ,データ
の枚数,親展送信やポーリング送信等の特殊モード送信
の場合の送信モード等の、通信自体に関する情報が付加
されている。ファクシミリデータを受信したファクシミ
リサーバ22では、受信した日時や受信装置が複数ある
場合の受信装置の番号、通信時間や通信結果等の、受信
装置側で判明する情報が生成する。これらの通信自体に
関する情報から構造化情報生成部6で構造化情報を抽出
する。
The embodiment shown in FIG.
FIG. 2 shows a specific example of the relationship between the document management server 24 and the document management server 24. The facsimile server 22 and the document management server 24 are connected via the LAN 4, and facsimile data is transmitted to the facsimile server 22 from the Internet or a public telephone line network. In the facsimile data, in addition to the image data serving as the data itself, the transmission address in the case of the special mode transmission such as the address and resolution of the transmission source, the encoding method, the paper size, the number of data, the confidential transmission and the polling transmission And other information about the communication itself. The facsimile server 22 that has received the facsimile data generates information that can be determined on the receiving device side, such as the date and time of reception, the number of the receiving device when there are a plurality of receiving devices, the communication time, and the communication result. The structured information generator 6 extracts the structured information from the information on the communication itself.

【0019】またe−メール形式でファクシミリデータ
を受信した場合には、ヘッダや本文から、タイトルや転
送するクライアント名、回覧、全員配布、秘密クラス2
などのキーワードを構造化情報生成部6で抽出して、構
造化情報に付加する。さらに必要に応じノンキャラクタ
ーデータをキャラクターデータに変換して構造化文書に
含め、あるいはノンキャラクターデータのファイルを構
造化文書に添付してリンクさせる。なおノンキャラクタ
ーデータをキャラクターデータに変換する場合、再変換
用のデータを構造化情報に付加する。
When facsimile data is received in the e-mail format, the title, the name of the client to be transferred, the circulation, the distribution to all, the secret class 2
The structured information generation unit 6 extracts keywords such as the keyword, and adds the extracted keywords to the structured information. If necessary, the non-character data is converted into character data and included in the structured document, or a file of the non-character data is attached to the structured document and linked. When converting non-character data into character data, data for re-conversion is added to the structured information.

【0020】構造化文書ファイル10は、例えばノンキ
ャラクターデータの添付ファイル11と共に、文書管理
サーバ24に転送され、構造化情報を構造化情報抽出部
14で抽出し、該当する処理を処理条件記憶部16のデ
ータを参照して決定する。処理は例えば、記憶部20に
記憶する、所定のクライアント26〜28に配信する、
プリントする、表示する、構造化情報からキーワードを
抽出してデータベースに入力する、フロントページなど
の要約データを作成する、ノンキャラクターに構造化情
報を重ねて合成する、などの要素からなり、これらを組
み合わせて実行しても良い。
The structured document file 10 is transferred to the document management server 24 together with, for example, the attached file 11 of non-character data. The structured information is extracted by the structured information extracting unit 14, and the corresponding processing is performed by the processing condition storing unit. Determined with reference to 16 data. The processing is, for example, stored in the storage unit 20, distributed to predetermined clients 26 to 28,
It consists of elements such as printing, displaying, extracting keywords from structured information and inputting them to the database, creating summary data such as front pages, and overlaying structured information on non-characters and combining them. It may be executed in combination.

【0021】プリントや表示の場合、ノンキャラクター
データに再変換してプリントあるいは表示し、また構造
化情報をユーザの便宜のためにノンキャラクターデータ
と合成して、プリントあるいは表示する。合成としては
例えば、ノンキャラクターデータのプリントアウトや表
示の余白、フロントページなどに、構造化情報をプリン
トすることがある。加工は、例えばノンキャラクターデ
ータへの構造化情報の合成、要約用のフロントページの
作成、データベースへの入力などがある。
In the case of printing or displaying, the data is reconverted to non-character data and printed or displayed, and the structured information is combined with the non-character data for the convenience of the user and printed or displayed. As the combination, for example, there is a case where structured information is printed on a printout of non-character data, a display margin, a front page, or the like. The processing includes, for example, combining structured information with non-character data, creating a front page for summarizing, and inputting to a database.

【0022】図3に、図1での構造化文書生成装置2と
構造化文書処理装置12との関係を模式化して示す。構
造化文書生成装置2は、画像データ40と通信路や通信
方法に関する通信自体に関する情報42とを受信する。
そして通信自体に関する情報から構造化情報を抽出し、
その一部をデータ変換部44でキーワード等に変換し、
他をそのまま透過させて、構造化部46でタグ等を付加
する。また必要に応じて画像データをキャラクター変換
部8でキャラクターデータに変換し、キャラクター変換
しない場合、画像データをノンキャラクターデータのま
まで添付ファイルとする。
FIG. 3 schematically shows the relationship between the structured document generation device 2 and the structured document processing device 12 in FIG. The structured document generation device 2 receives the image data 40 and the information 42 on the communication itself regarding the communication path and the communication method.
And extract structured information from information about the communication itself,
A part thereof is converted into a keyword or the like by the data conversion unit 44,
Others are transmitted as they are, and a tag or the like is added by the structuring unit 46. If necessary, the image data is converted into character data by the character conversion unit 8, and when the character conversion is not performed, the image data is used as an attached file without any non-character data.

【0023】構造化文書処理装置では、受信した構造化
文書ファイル10から、構造化情報抽出部14で構造化
情報を抽出し、処理条件記憶部16内の処理条件テーブ
ル48を構造化情報で参照して、処理内容を決定する。
また処理条件テーブル48は構造化情報から処理内容を
決定するためのテーブルで、構造化情報に対応する処理
内容はユーザ入力50からユーザが入力したものを記憶
する。
In the structured document processing apparatus, the structured information extracting unit 14 extracts the structured information from the received structured document file 10, and refers to the processing condition table 48 in the processing condition storage unit 16 with the structured information. Then, the processing content is determined.
The processing condition table 48 is a table for determining the processing content from the structured information, and stores the processing content corresponding to the structured information that is input by the user from the user input 50.

【0024】図4に、構造化文書処理装置12での構造
化文書の処理プログラムを示す。構造化文書が構造化文
書処理装置12へ転送されると、ステップ1で構造化情
報抽出部14で構造化情報を抽出する。ステップ2で、
構造化情報を用い、例えば処理条件記憶部16内の処理
条件テーブルを参照して処理を決定し、ステップ3で処
理を実行する。
FIG. 4 shows a structured document processing program in the structured document processing device 12. When the structured document is transferred to the structured document processing device 12, in step 1, the structured information extracting unit 14 extracts the structured information. In step 2,
Using the structured information, for example, the processing is determined with reference to the processing condition table in the processing condition storage unit 16, and the processing is executed in step S3.

【0025】処理は、ノンキャラクターデータを再生す
る、ノンキャラクターデータの概要を作成する(例えば
フロントページを要約データとする)、構造化情報等を
用いてデータベースに入力する、ノンキャラクターデー
タと構造化情報を合成する、記憶する、転送する、など
の要素からなり、これらを組み合わせて実行しても良
い。プリントや表示などの再生の場合、キャラクターデ
ータ化されている場合は、ノンキャラクターデータに再
変換して再生する。構造化文書の処理プログラムには、
これ以外に処理条件テーブルを生成し、ユーザに構造化
情報に対する処理内容をテーブルに入力させて記憶する
ための命令がある。
The processing includes reproducing non-character data, creating an outline of the non-character data (for example, using the front page as summary data), inputting it to a database using structured information or the like, It consists of elements such as synthesizing, storing, and transferring information, and may be executed in combination. In the case of reproduction such as printing or display, if it is converted into character data, it is converted to non-character data and reproduced. Structured document processing programs include:
In addition, there is an instruction for generating a processing condition table and for allowing a user to input the processing content for the structured information into the table and store it.

【0026】図5に、ファクシミリデータをSVG規格
で構造化文書に変換した例を示す。構造化情報はタグを
生成して構造化されて文書属性の欄に記載され、例えば
タイトルとして受信した文書番号が記載され、ファクシ
ミリ通信の手法や受信装置のアドレス,受信した日付,
通信結果,ページ数,通信時間,受信装置のファクシミ
リ番号や発信元のファクシミリ番号が記載されている。
これ以外に元の画像データがバイナリーデータで、TI
FF(アドビ社の提唱のタグ付きイメージファイルフォ
ーマット)で受信したものであり、解像度が400dp
iで、走査方向にも副走査方向にも解像度が同じで、A
4用紙が用いられ、画像データへのコーディングはMM
Rで行われたことが記載されている。
FIG. 5 shows an example in which facsimile data is converted into a structured document according to the SVG standard. The structured information is structured by generating a tag and described in a document attribute column. For example, the received document number is described as a title, a facsimile communication method, an address of a receiving device, a received date,
The communication result, the number of pages, the communication time, the facsimile number of the receiving device, and the facsimile number of the transmission source are described.
In addition, the original image data is binary data,
It was received in FF (tagged image file format proposed by Adobe) and has a resolution of 400 dp
i, the resolution is the same in both the scanning direction and the sub-scanning direction.
Four papers are used, and coding to image data is MM
R.

【0027】そして文書属性の下の欄に、画像データを
ベクトル化したデータが記載されている。図5のように
すると、構造化情報を用いて、文書の処理や加工,記
憶,配信等の処置を決定でき、また画像データがキャラ
クターデータとして構造化文書中に一体に記憶されてい
るので、データの取り扱いが容易になる。
In the column below the document attribute, data obtained by vectorizing the image data is described. According to FIG. 5, the processing such as processing, processing, storage, and distribution of the document can be determined by using the structured information, and the image data is integrally stored as the character data in the structured document. Data handling becomes easier.

【0028】図6にTIFFデータをXML規格で構造
化した例を示す。図6の上左側はTIFFデータを示
し、画像データのキャラクター変換の手法としてBAS
E64を用い、テキストデータに変換する。元々のデー
タがTIFF形式であったことや、TIFFデータをB
ASE64によりキャラクターデータに変換したこと、
並びに通信自体から得られた情報等をキーワードとして
属性化し、これ以外にBASE64によりテキストデー
タに変換したデータを記載する。
FIG. 6 shows an example in which TIFF data is structured according to the XML standard. The upper left side of FIG. 6 shows TIFF data, and BAS is used as a method of character conversion of image data.
It is converted into text data using E64. The fact that the original data was in TIFF format
Converted to character data by ASE64,
In addition, information or the like obtained from the communication itself is attributed as a keyword, and in addition, data converted to text data by BASE64 is described.

【0029】実施例の作用効果を示す。実施例では、フ
ァクシミリデータや動画データ、音声データ等を、構造
化情報を用いて処理できる。そして構造化情報に対する
処理内容は、テーブルを用いてユーザが自由に定義でき
る。
The operation and effect of the embodiment will be described. In the embodiment, facsimile data, moving image data, audio data, and the like can be processed using structured information. Then, the processing contents for the structured information can be freely defined by the user using the table.

【図面の簡単な説明】[Brief description of the drawings]

【図1】 実施例での、ノンキャラクターデータの構造
化と転送並びに処理を示すブロック図
FIG. 1 is a block diagram showing structuring, transfer, and processing of non-character data in an embodiment.

【図2】 図1の実施例をファクシミリデータの処理に
適用した例を示すブロック図
FIG. 2 is a block diagram showing an example in which the embodiment of FIG. 1 is applied to processing of facsimile data.

【図3】 実施例でのファクシミリデータの構造化と処
理のモデルを示す図
FIG. 3 is a diagram showing a model of structuring and processing of facsimile data in the embodiment.

【図4】 実施例での構造化文書の処理プログラムを説
明するフローチャート
FIG. 4 is a flowchart illustrating a structured document processing program according to the embodiment.

【図5】 実施例でファクシミリデータをSVG文書に
構造化した例を示す図
FIG. 5 is a diagram showing an example in which facsimile data is structured into an SVG document in the embodiment.

【図6】 実施例でファクシミリデータをXML文書に
構造化した例を示す図
FIG. 6 is a diagram showing an example in which facsimile data is structured into an XML document in the embodiment.

【符号の説明】[Explanation of symbols]

2 構造化文書生成装置 4 LAN 6 構造化情報生成部 8 キャラクター変換部 9,13 記憶媒体 10 構造化文書ファイル 12 構造化文書処理装置 14 構造化情報抽出部 16 処理条件記憶部 18 ノンキャラクター変換部 20 記憶部 22 ファクシミリサーバ 24 文書管理サーバ 26〜28 クライアント 40 画像データ 42 構造化情報 44 データ変換部 46 構造化部 48 処理条件テーブル 50 ユーザ入力 52 処理部 Reference Signs List 2 structured document generation device 4 LAN 6 structured information generation unit 8 character conversion unit 9, 13 storage medium 10 structured document file 12 structured document processing device 14 structured information extraction unit 16 processing condition storage unit 18 non-character conversion unit Reference Signs List 20 storage unit 22 facsimile server 24 document management server 26-28 client 40 image data 42 structured information 44 data conversion unit 46 structuring unit 48 processing condition table 50 user input 52 processing unit

Claims (6)

【特許請求の範囲】[Claims] 【請求項1】 ノンキャラクターデータとリンクあるい
はノンキャラクターデータをキャラクター化することに
より、ノンキャラクターデータと関連づけられた構造化
文書を受信した際に、該構造化文書中の構造化情報を参
照して、前記関連づけられたノンキャラクターデータを
処理するようにした構造化文書処理装置。
When a structured document associated with non-character data is received by linking the non-character data or characterizing the non-character data, the non-character data is referred to by referring to the structured information in the structured document. , A structured document processing apparatus configured to process the associated non-character data.
【請求項2】 キャラクター化したデータをノンキャラ
クターデータに再変換するための手段を設けたことを特
徴とする、請求項1の構造化文書処理装置。
2. The structured document processing apparatus according to claim 1, further comprising means for converting characterized data into non-character data again.
【請求項3】 前記関連づけられたノンキャラクターデ
ータを、前記構造化情報に基づき加工するための手段を
設けたことを特徴とする、請求項1または2の構造化文
書処理装置。
3. The structured document processing apparatus according to claim 1, further comprising means for processing the associated non-character data based on the structured information.
【請求項4】 構造化情報から処理内容を決定するため
のテーブルと、該テーブルへのユーザの入力を受け付け
てテーブルに記憶させる手段とを設けて、前記構造化情
報で前記テーブルを参照して処理内容を決定するように
構成したことを特徴とする、請求項1の構造化文書処理
装置。
4. A table for determining the processing content from the structured information, and means for receiving a user's input to the table and storing the table in the table, and referring to the table with the structured information 2. The structured document processing apparatus according to claim 1, wherein the processing content is determined.
【請求項5】 ノンキャラクターデータと関連づけられ
た構造化文書中から、構造化情報を抽出するための命令
と、抽出した構造化情報に基づいて前記ノンキャラクタ
ーデータを処理するための命令とを備えた、構造化文書
処理プログラム。
5. An image processing apparatus comprising: a command for extracting structured information from a structured document associated with non-character data; and a command for processing the non-character data based on the extracted structured information. A structured document processing program.
【請求項6】 構造化情報を参照してノンキャラクター
データへの処理内容を決定するためのテーブルを生成す
るための命令と、該テーブルへのユーザの入力を受け付
け該テーブルに記憶するための命令とを設けて、前記抽
出した構造化情報により前記テーブルを参照して、ノン
キャラクターデータの処理内容を決定するようにしたこ
とを特徴とする、請求項5の構造化文書処理プログラ
ム。
6. An instruction for generating a table for determining the processing content of non-character data with reference to structured information, and an instruction for receiving a user input to the table and storing the table in the table 6. The structured document processing program according to claim 5, wherein the processing contents of the non-character data are determined by referring to the table based on the extracted structured information.
JP2001168191A 2001-06-04 2001-06-04 Device for processing structured document and program thereof Pending JP2002358217A (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2001168191A JP2002358217A (en) 2001-06-04 2001-06-04 Device for processing structured document and program thereof
US10/160,978 US7069503B2 (en) 2001-06-04 2002-05-30 Device and program for structured document generation data structure of structural document

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001168191A JP2002358217A (en) 2001-06-04 2001-06-04 Device for processing structured document and program thereof

Publications (1)

Publication Number Publication Date
JP2002358217A true JP2002358217A (en) 2002-12-13

Family

ID=19010454

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001168191A Pending JP2002358217A (en) 2001-06-04 2001-06-04 Device for processing structured document and program thereof

Country Status (1)

Country Link
JP (1) JP2002358217A (en)

Similar Documents

Publication Publication Date Title
US5781914A (en) Converting documents, with links to other electronic information, between hardcopy and electronic formats
US7535477B2 (en) Data converter, data conversion method, program for making computer function as data converter and recording medium for storing this program
US20030014445A1 (en) Document reflowing technique
US7860892B2 (en) Information processing apparatus, history file generation method and program
US7296059B2 (en) Device, method, and program for transmitting reduced quality images linked to original quality images
JP4066691B2 (en) Print control apparatus and program
US20030005045A1 (en) Device and program for structured document generation data structure of structural document
JP2010147582A (en) Image forming apparatus, document reading apparatus, server apparatus, and data processing system
KR100893829B1 (en) Object transfer method with format adaptation
JPH09231022A (en) Document accumulator
JP2007060355A (en) Image processing unit, image processing method, and image processing program
US20060140513A1 (en) Dynamic image production method and system
US20030046352A1 (en) Device, method and program product for data transmission management
KR100823265B1 (en) Method and apparatus for transmitting XHTML-Print document at mobile device
US7613833B2 (en) Data processing apparatus and data processing method, and computer program
JP2008310816A (en) System and method for compact representation of multiple markup page data
JP4075430B2 (en) Print control apparatus, print control method, and program
JP4308448B2 (en) Content generation according to the output device
JP2006309443A (en) Information processing system, information processor, information processing terminal, information processing method, program for executing the method in computer, and storage medium
JP2002358217A (en) Device for processing structured document and program thereof
JP3059894U (en) Automatic home page creation system based on handwritten documents
JP3724728B2 (en) Structured document processing device
JP3682861B2 (en) Facsimile server and its program
JPH10326236A (en) Multimedia electronic mail system
JP2004145736A (en) Character recognition device, character recognition data output method, program and recording medium

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060523

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060718

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060821