JP3724728B2 - 構造化文書処理装置 - Google Patents

構造化文書処理装置 Download PDF

Info

Publication number
JP3724728B2
JP3724728B2 JP2002095640A JP2002095640A JP3724728B2 JP 3724728 B2 JP3724728 B2 JP 3724728B2 JP 2002095640 A JP2002095640 A JP 2002095640A JP 2002095640 A JP2002095640 A JP 2002095640A JP 3724728 B2 JP3724728 B2 JP 3724728B2
Authority
JP
Japan
Prior art keywords
data
structured
document
information
facsimile
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2002095640A
Other languages
English (en)
Other versions
JP2003296303A (ja
Inventor
好史 谷本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Murata Machinery Ltd
Original Assignee
Murata Machinery Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Murata Machinery Ltd filed Critical Murata Machinery Ltd
Priority to JP2002095640A priority Critical patent/JP3724728B2/ja
Publication of JP2003296303A publication Critical patent/JP2003296303A/ja
Application granted granted Critical
Publication of JP3724728B2 publication Critical patent/JP3724728B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)
  • Facsimiles In General (AREA)
  • Storing Facsimile Image Data (AREA)

Description

【0001】
【発明の利用分野】
この発明は、構造化文書の生成に関する。
【0002】
【従来技術】
XML(Extensible Markup Language),SVG(Scalable Vector Graphics),XHTML(Extensible Hypertext Markup Language),VoiceXML(Voice Extensible Markup Language)などの構造化文書のための規格が提案されている。これらの規格で代表的なものはXMLで、SVGはこれを図形のベクトルデータに拡張変更した規格である。これらの規格では、データはキャラクターデータなどで、データの意味内容を情報処理装置が理解して扱えるように、タグなどで構造化して用いる。
【0003】
XMLなどの特徴は、構造化されたデータに対して、属性の名前を新たに定義できる点にある。属性はデータの名前とデータ自体のセットであり、名前をデータの意味や内容と対応させれば、名前によってデータを解釈して、処理・加工できる。そしてデータの処理・加工の便宜の点から、扱えるデータはキャラクターデータに限られ、特にXMLでは非数値的なキャラクターデータ、即ちテキストデータのみを取り扱える。
【0004】
しかし、ファクシミリで画像データを受信しても、これは構造化されていない非構造化データであるため、データの処理・加工を行うことはできず、このままでは扱いにくい。
【0005】
【発明の課題】
この発明の基本的課題は、ファクシミリデータを受信した際に、構造化文書を自動的に生成できるようにすることにある(請求項1〜3)。
請求項2の発明での追加の課題は、受信時の条件に応じて文書フォーマットや属性情報を定め、該条件により文書フォーマットを変えたり属性情報を用いたりして、適切な構造化文書を生成することにある。
請求項3の発明の追加の課題は、構造化文書を生成するだけでなく、所定の出力ができるようにすることにある。
【0006】
【発明の構成】
この発明の構造化文書処理装置は、ファクシミリデータの受信を行うための手段と、受信したファクシミリデータの、通信路に関する情報あるいは通信方法に関する情報を、通信に関するデータとして抽出するためのデータ抽出・変換部と、前記抽出したデータを条 件として構造化情報を求めるための条件テーブルと、前記求めた構造化情報中の属性情報と前記抽出したデータとを属性情報とし、かつファクシミリデータ中の画データをキャラクターデータに変換もしくはリンクさせた、構造化文書を生成するための手段とを設けたものである(請求項1)。
【0007】
好ましくは前記条件テーブルにより、前記構造化情報中の属性情報と文書フォーマットとを求める(請求項2)。また好ましくは、前記生成した構造化文書に対して、所定の出力をするための出力手段を備えることとする(請求項3)。
なおこの発明でのデータの受信には、G3等のファクシミリやインターネットファクシミリの受信がある。また所定の出力は、例えば文書管理サーバに送信することであり、構造化文書を受信した文書管理サーバでは、該文書を転送したり保存することができる。送信は、そのほかクライアントのパーソナルコンピュータ等に送信することであっても良く、転送先や保存先等も定義することができる。
【0008】
【発明の作用と効果】
この発明では、受信したファクシミリデータから、通信路に関する情報あるいは通信方法に関する情報を、通信に関するデータとして抽出する。そして抽出したデータを条件として、条件テーブルで構造化情報を求めて、求めた構造化情報中の属性情報と抽出したデータとを属性情報とし、画データをキャラクター変換もしくはリンクさせた構造化文書に、受信ファクシミリデータを変換する(請求項1〜3)。好ましくは条件テーブルから構造化情報中の属性情報の他に文書フォーマットを求め、求めた文書フォーマットを用いて構造化文書を生成する(請求項2)。受信したファクシミリデータを、受信時の条件から得られる所定の文書フォーマットに整形するので、様々なフォーマットを使い分けることができる。また属性情報も様々な属性名やその値を付与できるので、データの種類や内容について相当の整理ができる。このため受信したファクシミリデータの処理や保管、メンテナンスなどが容易になる(請求項1,2)。また構造化した文書を所定の形式で出力すれば、該データの利用や処理、管理を容易に行うことができる(請求項3)。
【0009】
通信に関するデータと、このデータから得られる条件に対応づけられた構造化情報とを共に属性情報とすると、文書管理が容易な構造化文書を生成することができる。例えば受信時の条件として発信元アドレスを得て、該発信元アドレスから定義された属性情報を得、該発信元アドレスと該属性情報とを用い、文書を構造化できるので、構造化文書の処理や保管等の管理がより容易になる。
【0010】
【実施例】
図1〜図5に、実施例を示す。図1において、2は構造化文書処理装置としてのファクシミリサーバで、画像データ等のノンキャラクターデータの送信と受信とができ、かつこれらと関連づけられた構造化文書の送受信ができる。ファクシミリサーバ2は、構造化文書生成用のプログラムを適宜の記憶媒体から読み取って実行する。ファクシミリサーバ2はLAN4に接続されて、構造化文書の送受信とノンキャラクターデータの送受信とを行う。これ以外に公衆電話回線網(PSTN)に接続されて、ファクシミリデータ等の送受信を行う。さらにインターネット等のネットワークに接続されて、インターネットファクシミリ等の送受信を行う。またファクシミリサーバ2でファクシミリデータを読み込んだり、イメージスキャナとしてスキャナデータの読み込みも行う。
【0011】
ファクシミリサーバ2には、データ抽出・変換部6があり、通信に関する情報から構造化文書の属性として用いるものを抽出し、構造化文書の属性に変換する。実施例では、さらに受信データから通信に関する情報を抽出し、この抽出した情報を条件とし、構造化条件テーブル9の条件から、対応する構造化文書の属性情報と文書フォーマットとを得る。そして、受信データに該属性情報(属性名及びその値)を付与すると共に、該文書フォーマットに従い構造化文書へ整形する。テキスト変換部8は、元の画像データがバイナリーデータなのでTIFF(アドビ社提唱のタグ付きイメージファイルフォーマット)で受信し、これをBase64などによりキャラクタデータに変換する。
【0012】
ファクシミリサーバ2は、構造化文書生成プログラムを記憶しており、自己のリソースをデータ抽出・変換部6等に割り当て、構造化文書10の生成を行えるようにする。そして構造化文書10はファクシミリサーバ2から、ノンキャラクターデータの添付ファイルなど共に、文書管理サーバ12等の所定の宛先にLAN4等を介して転送される。またノンキャラクターデータをキャラクター変換する場合は、構造化文書中にキャラクターデータを含めて送信する。文書管理サーバ12は、この構造化文書を所定のクライアント等20〜22に配信しても良く、各クライアントは、文書管理サーバ12を検索して、必要な文書等を入手等ができることとしても良い。なおファクシミリサーバ2の図示しない記憶部では、構造化した文書自体や、その処理、あるいは構造化条件テーブル9等を記憶する。
【0013】
さらに詳しく説明すると、ファクシミリサーバ2と文書管理サーバ12とはLAN4を介して接続され、ファクシミリサーバ2はインターネットや公衆電話回線網等からファクシミリデータを受信したり、スキャナデータを読み込む。受信したファクシミリデータには、データ本体となる画像データの他に、発信元のアドレスや解像度,符号化の方式,紙のサイズ,データの枚数,親展送信やポーリング送信等の特殊モード送信の場合の送信モード等の、通信に関するデータが付加されている。ファクシミリデータを受信したファクシミリサーバ2では、受信した日時や受信装置が複数ある場合の受信装置の番号、通信時間や通信結果等の、受信装置側で判明する情報を得る。これらのファクシミリサーバ2で受信した通信に関する情報からデータ抽出・変換部6でデータを抽出し、抽出した通信に関する情報を属性情報として変換することができる。そして該条件を用い、条件テーブル9を参照し、対応する属性情報と文書形式とを得る。テキスト変換部8は前記のように、ファクシミリデータの本体である画像データを、キャラクターデータに変換する。そしてデータ抽出・変換部6で属性として抽出・変換したデータと、条件テーブル9から得た条件に対応した属性名及びぞのデータ(値)とに、キャラクター変換部8でキャラクターデータに変換した画像データを追加し、所定の文書形式で構造化文書10を作成する。
【0014】
構造化文書10は文書管理サーバ12に転送され、文書管理サーバ12では通信に関する情報を構造化した部分から、処理の条件や分類検索のキーワード等を抽出する等の処理を行うことができる。抽出したデータから、該当する処理条件を図示しない処理条件記憶部のデータを参照して決定し、記憶部に記憶したり、所定のクライアント20〜22に配信、プリントアウトなどの処理を行う。
【0015】
図2に、条件毎に定めた属性情報と文書形式とを格納する構造化条件テーブル9を示す。図において、30は条件格納部で、ファクシミリサーバ2が受信したデータの通信に関する情報から得た条件を格納する。例えば条件1では、条件としてTSI(発信者番号)を格納しており、受信データがG3等のファクシミリデータであることを示す。また条件2では、ヘッダのサブジェクト欄がサービスレポートであることを定義し、受信データはインターネットファクシミリで受信したデータである。条件3では、スキャナで読みとったスキャンデータである場合の、ユーザ名を定義している。それぞれの条件に対し、属性情報格納部32に属性情報を、文書形式格納部34に文書形式(フォーマット)を、それぞれあらかじめ定めておく。
【0016】
そして、条件が一致するデータを受信すると、対応する属性情報や文書形式を用い、受信データを構造化する。なお属性情報の欄では、属性名とその値とが定義されており、例えば条件1の属性情報である「Company=XXXX」では、「Company」が属性名で、「XXXX」がその値である。そして文書形式は出力形式を定義したもので、例えば形式1は受信したファクシミリの転送情報としてのフォーマットを定義し、形式2はサービスレポートとしてのフォーマットを定義し、形式3はファクシミリサーバ2での読み込み情報としてのフォーマットを定義する。ただしこれらはあらかじめ定めたフォーマットであるが、受信データの構造化に際してその都度定義することとしても良い。
【0017】
構造化条件テーブル9を用い、送信元が「TSI=075-123-4567」のファクシミリデータを受信したときは、文書形式をファクシミリ受信のフォーマットとし、属性名「Company」に対し値「XXXX」を与える。またサブジェクト部が ゛Service Report゛のメールを受信したときは、文書形式をサービスレポートとし、属性名「Type」に対し値「Service Report」を与える。同様にユーザ名が゛ABC゛のデータを読み込んだときはスキャナデータであるため、文書形式を内部での読み込み情報としてフォーマットし、属性名「Type」に対し値「YYY」を与える。構造化した文書の送付先は、文書管理サーバ12等であるが、条件毎に定めても良く、例えば条件1であればクライアント20等にも配信することとしても良く、その都度定めても良い。さらにファクシミリサーバ2のプリンタで、出力することとしても良い。なお通信に関する情報として、例えば通信路に関する情報があり、受信装置の番号や通信時間,受信日時,通信結果,発信元のサブアドレス等であっても良い。また通信方法に関する情報としては、ファクシミリデータの解像度や符号化の方式,紙のサイズ等がある。これらの情報を、条件として用いることとしても良い。
【0018】
図3に、実施例の受信データの構造化アルゴリズムを示す。なお図3の実施例では、受信データをファクシミリデータの場合とする。まずファクシミリデータを受信すると(ステップS1)、通信に関する情報、すなわちファクシミリの場合は発信者番号TSIを抽出する(ステップS2)。次いで条件を記憶した構造化条件テーブルを参照し、その条件に合致する属性情報と文書形式とを得る(ステップS3)。そして受信した画像データをキャラクターデータに変換し(ステップS4)、ステップ3で得た文書形式に従い、条件に対応する属性情報、及び抽出した情報のうちそのまま属性として用いるもの(例えば「TSI=075-123-4567」)とを、構造化する部分に適宜のタグを付して、構造化文書を生成する(ステップS5)。そして、生成した構造化文書を例えば文書管理サーバへ出力する(ステップS6)。なお画像データをキャラクタデータに変換しない場合は、画像データを構造化文書の添付ファイルとして送信しても良い。
【0019】
図4に、ファクシミリデータを構造化文書に変換した例を示す。通信に関する情報(TSI=075-123-4567)はタグを生成して構造化され、受信ファクシミリに関する情報、例えば受信時間やページ数や通信結果等も構造化され、構造化条件テーブルから得た属性情報「Company=XXXX」もタグを生成して構造化されて記載される。なお受信した画像データを構造化せずリンクして対応づけ、添付ファイルなどの形でリンクさせるために、例えば「ImageID」のタグが生成され、イメージオブジェクトとしてファイルナンバー゛file01234゛が記載されている。
【0020】
図5に、インターネットファクシミリデータやe-Mailでの画像データを構造化文書に変換した例を示す。通信に関する情報は、ここでは例えばヘッダのサブジェクト欄から得て、サブジェクト欄が゛Service Report゛であれば、受信データに関するその他の情報と共にタグを生成して構造化し、構造化条件テーブルから得た属性情報「Type=Service Report」もタグを生成して構造化して記載する。なお図5に示すように文書形式を例えばサービスレポートとして、メンテナンスのためにサービスマン等が検索しやすいフォーマットで、文書管理サーバに送信される。図5では、画像データを含んだ文書を作成する場合、例えば元の画像データがバイナリーデータで、TIFFで受信したものである場合、このTIFFデータをXML規格で構造化した例を示している。TIFFデータは、画像データのキャラクター変換の手法としてBASE64等を用いてテキストデータに変換する。
【0021】
このように実施例では、通信に関する情報から抽出した条件で、入力された画像データを構造化文書として生成する。これらの条件はあらかじめ構造化条件テーブルに格納し、条件毎に属性情報や文書形式を定義しておくので、通信毎に様々なフォーマットや属性情報を付与することができ、ファクシミリサーバは適切な構造化文書を生成することができる。そして、文書管理サーバ等に出力されるので、クライアント等は該文書管理サーバに対し検索を行ったりでき、あるいは該サーバから必要な構造化文書をクライアント等に転送し、該文書を有効に利用できる。
【図面の簡単な説明】
【図1】 実施例での、非キャラクターデータの構造化と転送とを示すブロック図
【図2】 構造化のための、条件毎の属性情報と文書フォーマットとを含む構造化条件テーブルを示す図
【図3】 ファクシミリデータの構造化の処理を示すフローチャート
【図4】 ファクシミリデータをXML文書に構造化した例を示す図
【図5】 画像データを含むファクシミリデータをXML文書に構造化した例を示す図
【符号の説明】
2 ファクシミリサーバ
4 LAN
6 データ抽出・変換部
8 テキスト変換部
9 構造化条件テーブル
10 構造化文書
12 文書管理サーバ
20〜22 クライアント
30 条件格納部
32 属性情報格納部
34 文書形式格納部

Claims (3)

  1. ファクシミリデータの受信を行うための手段と、
    受信したファクシミリデータの、通信路に関する情報あるいは通信方法に関する情報を、通信に関するデータとして抽出するためのデータ抽出・変換部と、
    前記抽出したデータを条件として構造化情報を求めるための条件テーブルと、
    前記求めた構造化情報中の属性情報と前記抽出したデータとを属性情報とし、かつファクシミリデータ中の画データをキャラクターデータに変換もしくはリンクさせた、構造化文書を生成するための手段とを設けた構造化文書処理装置
  2. 前記条件テーブルにより、前記構造化情報中の属性情報と文書フォーマットとを求めるようにしたことを特徴とする、請求項1の構造化文書処理装置。
  3. 前記生成した構造化文書に対して、所定の出力をするための出力手段を備えたことを特徴とする、請求項1または2の構造化文書処理装置。
JP2002095640A 2002-03-29 2002-03-29 構造化文書処理装置 Expired - Lifetime JP3724728B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002095640A JP3724728B2 (ja) 2002-03-29 2002-03-29 構造化文書処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002095640A JP3724728B2 (ja) 2002-03-29 2002-03-29 構造化文書処理装置

Publications (2)

Publication Number Publication Date
JP2003296303A JP2003296303A (ja) 2003-10-17
JP3724728B2 true JP3724728B2 (ja) 2005-12-07

Family

ID=29387273

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002095640A Expired - Lifetime JP3724728B2 (ja) 2002-03-29 2002-03-29 構造化文書処理装置

Country Status (1)

Country Link
JP (1) JP3724728B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007053435A (ja) * 2005-08-15 2007-03-01 Softbank Bb Corp 受信情報管理装置及び方法
JP4861803B2 (ja) 2006-12-01 2012-01-25 株式会社リコー 情報処理装置、画像処理装置、情報処理方法及び情報処理プログラム

Also Published As

Publication number Publication date
JP2003296303A (ja) 2003-10-17

Similar Documents

Publication Publication Date Title
US7839529B2 (en) Data communication apparatus and method
JP3554271B2 (ja) 情報通信装置
US7266557B2 (en) File retrieval method and system
US7296059B2 (en) Device, method, and program for transmitting reduced quality images linked to original quality images
WO1997022203A1 (fr) Appareil de transmission d'images
CN110855555B (zh) 邮件发送方法、装置、设备及计算机可读存储介质
US7991828B2 (en) Network communication apparatus generating XML responses based on HTTP requests
EP1176773A2 (en) Method and device for electronic mail conversion
JP2004220551A (ja) スキャン文書を送信するための宛先電子メールアドレスの決定
US20040246531A1 (en) Server device having electronic bulletin board function
JP2002318535A (ja) 情報処理装置、情報処理方法、情報処理システム及び情報処理プログラム
JPH10307826A (ja) 文書管理装置
JP3724728B2 (ja) 構造化文書処理装置
JP2003308312A (ja) 文書サーバ及び文書処理プログラム
US20020018236A1 (en) Bi-directional facsimile mechanism using the internet
US20080275909A1 (en) Systems and methods for managing image data and metadata
JP2001216230A (ja) ネットワークを利用した文書処理方法および装置
JP3682861B2 (ja) ファクシミリサーバとそのプログラム
JP2006050373A (ja) ネットワーク通信装置
JP3651323B2 (ja) 中継装置及び画像送信装置
JP2002358230A (ja) 構造化文書のデータ構造と構造化文書生成装置及びそのプログラム
JP2007280105A (ja) アップロード要求装置、アップロード要求方法およびアップロード要求プログラム
JP3443515B2 (ja) ファクシミリ型電子メール装置
JP3724729B2 (ja) 構造化文書処理装置とそのプログラム
JP3724730B2 (ja) 構造化文書の処理装置及び処理プログラム

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040419

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040422

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040621

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050902

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050915

R150 Certificate of patent or registration of utility model

Ref document number: 3724728

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110930

Year of fee payment: 6

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110930

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120930

Year of fee payment: 7

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130930

Year of fee payment: 8

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130930

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140930

Year of fee payment: 9

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term