JP3682861B2 - Facsimile server and its program - Google Patents

Facsimile server and its program Download PDF

Info

Publication number
JP3682861B2
JP3682861B2 JP2001168190A JP2001168190A JP3682861B2 JP 3682861 B2 JP3682861 B2 JP 3682861B2 JP 2001168190 A JP2001168190 A JP 2001168190A JP 2001168190 A JP2001168190 A JP 2001168190A JP 3682861 B2 JP3682861 B2 JP 3682861B2
Authority
JP
Japan
Prior art keywords
data
information
structured document
facsimile
attribute
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2001168190A
Other languages
Japanese (ja)
Other versions
JP2002368937A (en
Inventor
好史 谷本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Murata Machinery Ltd
Original Assignee
Murata Machinery Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Murata Machinery Ltd filed Critical Murata Machinery Ltd
Priority to JP2001168190A priority Critical patent/JP3682861B2/en
Priority to US10/160,978 priority patent/US7069503B2/en
Publication of JP2002368937A publication Critical patent/JP2002368937A/en
Application granted granted Critical
Publication of JP3682861B2 publication Critical patent/JP3682861B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Computer And Data Communications (AREA)
  • Facsimiles In General (AREA)
  • Processing Or Creating Images (AREA)

Description

【0001】
【発明の利用分野】
この発明は、構造化文書の生成に関する。
【0002】
【従来技術】
XML(Extensible Markup Language),SVG(Scalable Vector Graphics),XHTML(Extensible Hypertext Markup Language),VoiceXML(Voice Extensible Markup Language)などの構造化文書のための規格が提案されている。これらの規格で代表的なものはXMLで、SVGはこれを図形のベクトルデータに拡張変更した規格であり、XHTMLはHTMLをXMLで再定義した規格であり、VoiceXMLはXMLを音声データに適用した規格である。これらの規格では、データはキャラクターデータで、データの意味内容を情報処理装置が理解して扱えるように、タグなどで構造化して用いる。XMLなどはマークアップ言語であるが、データの構造化を目的とする点で、データの表現(タブや改行、フォントなどの指定)を目的とするHTMLとは異なっている。
【0003】
XMLなどの特徴は、構造化されたデータに対して、属性の名前を新たに定義できる点にある。属性はデータの名前とデータ自体のセットであり、名前をデータの意味や内容と対応させれば、名前によってデータを解釈して、処理・加工できる。そしてデータの処理・加工の便宜の点から、扱えるデータはキャラクターデータに限られ、特にXMLでは非数値的なキャラクターデータ、即ちテキストデータのみを取り扱える。
【0004】
構造化文書のための規格でも、SVGはベクトルデータを扱うことができる。従って画像データをラスターフォーマットからベクトルフォーマットに変換すれば構造化でき、ベクトルデータなので図形の縮小・拡大・変形・消去・追加・修正などが容易である。またVoiceXMLは音声データを扱うことができる。しかしこれらの規格は、画像データや音声データ自体を構造化することを目的とした規格である。SVGやVoiceXMLとは別に、音声や画像の認識が研究されている。例えば、音声や画像の意味を理解する、特徴を抽出する、画像から物体を切り出す、動画から物体や人物などの動きを抽出する、などである。
【0005】
【発明の課題】
この発明の基本的課題は、受信したファクシミリデータと関連づけた構造化文書を容易に生成できるようにすることにある(請求項1〜10)。
請求項4,9の発明での追加の課題は、抽出した情報から、データの宛先のクライアントを決定して転送できるようにすることにある。
請求項5,10の発明の追加の課題は、抽出した情報を変換して、柔軟に構造化できるようにすることにある。
【0006】
【発明の構成】
この発明のファクシミリサーバは、ファクシミリデータの送受信を行うための手段と、マークアップ言語を用いた構造化文書の送受信を行うための手段と、ファクシミリ受信により得られたデータ中の、画像データ以外の通信自体に関する情報から構造化文書の属性とすべきものを抽出し、その一部をそのまま属性データとし、残部を他の情報に変換した上で属性データとするためのデータ抽出・変換部と、前記データ抽出・変換部からの属性データを属性として、かつ受信したファクシミリデータと関連づけて、マークアップ言語を用いた構造化文書を生成するための手段とを設けたものである(請求項1)。
【0007】
好ましくはファクシミリデータ中の画像データをキャラクター変換して前記構造化文書の属性とすると共に、少なくともキャラクター変換の方式と、前記通信自体に関する情報中の符号化方式とを属性として前記構造化文書を生成する(請求項2)。
【0008】
好ましくは、前記通信自体に関する情報は、受信した自機に関する情報と、通信路に関する情報、並びに通信プロトコルに基づいて送信された情報から抽出されたものである(請求項3)。なおこれ以外の追加の属性として、送信元に関する情報を属性としても良い。なお通信自体に関する情報は基本的制御データなので、キャラクターデータと見なす。送信元アドレスとしては、送信元のネットワークアドレス、送信元のファクシミリ番号やそのサブアドレスなどがあり、受信した自機に関する情報としては、複数の受信装置を備えた装置の場合の装置番号などがある。通信路に関する情報には、通信の良否などの結果、データ量、通信に用いた時間と通信時刻などがある。通信プロトコルに基づいて送信された情報には、画像の解像度、データの圧縮や符号化の規約、通信番号親展通信、ポーリング通信などの通信モードの指定、ページ数、改頁などの注釈データなどがある。通信プロトコルに基づく情報、送信元アドレスに関する情報、受信した自機に関する情報と、通信路に関する情報などの境界は曖昧であり、これらを総称して通信自体に関する情報と呼ぶ。
【0009】
また好ましくは、前記抽出した情報から、前記生成した構造化文書に対するクライアントを決定して、所定の転送先へ転送する(請求項4)。
特に好ましくは、前記抽出した情報に対して、そのまま属性データとするものと他の情報に変換した上で属性データとするものとを決定するためのテーブルを、前記抽出した情報で参照自在に設ける(請求項5)。
【0010】
この発明の構造化文書の生成プログラムは、ファクシミリデータの送受信を行うための手段と、マークアップ言語を用いた構造化文書の送受信を行うための手段とを備え、かつプログラムを読み取って実行自在なファクシミリサーバのためのプログラムであって、ファクシミリ受信により得られたデータ中の、画像データ以外の通信自体に関する情報ら構造化文書の属性とすべきものを抽出し、その一部をそのまま属性データとし、残部を他の情報に変換した上で属性データとするための抽出命令と、前記抽出命令からの属性データを属性として、かつ前記ファクシミリデータと関連づけて、マークアップ言語を用いた構造化文書を生成するための命令とを備えたことを特徴とする(請求項6)。
なお構造化文書の生成プログラムに関し、構造化文書の生成装置や生成手続き、生成後の転送、加工、処理に関する事項は、生成プログラムには適用不能なものを除き、そのまま生成プログラムにも当てはまる。
【0011】
好ましくは、ファクシミリデータ中の画像データをキャラクター変換して前記構造化文書の属性とするための命令と、少なくともキャラクター変換の方式と、前記通信自体に関する情報中の符号化方式とを用いて前記構造化文書を生成するための命令とを設ける(請求項7)。
好ましくは、前記抽出命令では、受信した自機に関する情報と、通信路に関する情報、並びに通信プロトコルに基づいて送信された情報から、通信自体に関する情報を抽出する(請求項8)。なおこれ以外に追加の属性として、送信元アドレスに関する情報を用いても良い。
また好ましくは、前記抽出した情報から、前記生成した構造化文書に対するクライアントを決定して、所定の転送先へ転送するための転送命令を備えている(請求項9)。
特に好ましくは、前記抽出命令では、抽出した情報に対して、そのまま属性データとするものと他の情報に変換した上で属性データとするものとを、テーブルを参照して決定する(請求項10)。
【0012】
【発明の作用と効果】
この発明では、通信自体に関する情報を属性に追加して、ファクシミリデータと関連づけられ、かつマークアップ言語を用いた構造化文書を生成する(請求項1〜10)。以下、「構造化文書」は「マークアップ言語を用いた構造化文書」を意味する。
関連づけてとは、添付ファイルなどの形でリンクさせることや、ファクシミリデータ中の画像データをキャラクター変換して構造化文書中に含んでいることを意味する。通信自体に関する情報には例えば発信元のアドレス、データの種類、通信を行った日時、通信量、通信時間などのデータの規模に関する情報が含まれ、これらを属性として構造化するだけで、データの種類や内容について相当の整理ができる。このためファクシミリデータの処理や保管、メンテナンスなどが容易になる。
【0013】
ここでファクシミリデータ中の画像データをキャラクター変換して構造化文書の属性とすると共に、少なくともキャラクター変換の方式と、前記通信自体に関する情報中の符号化方式とを属性として構造化文書を生成すると、画像データがキャラクターデータとして構造化文書中に一体に記憶されているので、データの取り扱いが容易になる(請求項2,7)。
通信自体に関する情報は、受信した自機に関する情報と、通信路に関する情報、並びに通信プロトコルに基づいて送信された情報であり、これらは受信時に自然と得られる情報で、容易に属性に追加できる(請求項3,8)。
【0014】
また通信自体に関する情報から、そのデータを必要とするクライアントを決定して所定の転送先へ転送すると、必要なクライアントへ必要なデータを提供できる(請求項4,9)。
【0015】
またこの発明では、抽出した通信自体に関する情報を、一部はそのまま属性データとし、残部は変換して属性データとするので、文書の管理がさらに容易になる。例えば発信元アドレスから文書の種類が推定できる場合、発信元アドレスよりも文書の種類を属性とできるので扱いやすい(請求項1〜10)。
【0016】
【実施例】
図1〜図7に、実施例とその変形とを示す。図1はこの発明の基本的実施例を示し、2は構造化文書生成装置で、ファクシミリデータの送信と受信とができ、かつこれらと関連づけられた構造化文書の送受信ができる。また構造化文書生成装置2は、構造化文書生成用のプログラムを適宜の記憶媒体から読み取って実行する。構造化文書生成装置2はLAN4に接続されて、ノンキャラクターデータの送受信と構造化文書の送受信とを行う。これ以外に公衆電話回線網(PSTN)に接続されて、ファクシミリデータ等の送受信を行う。さらにインターネット等のネットワークに接続されて、インターネットファクシミリ等の送受信を行う。
【0017】
構造化文書生成装置2には、データ抽出・変換部6があり、通信自体に関する情報から構造化文書の属性として用いるものを抽出し、それらの一部をより扱いやすいデータに変換して構造化文書の属性に変換し、残部はそのまま構造化文書の属性に変換する。キャラクター変換部8は設けなくても良く、通信により受信したノンキャラクターデータの本体をキャラクターデータに変換する。構造化文書生成装置2は、DVD,CD−ROM等の記憶媒体9に記憶した構造化文書生成プログラムを読み取り、これに伴って自己のリソースをデータ抽出・変換部6等に割り当て、構造化文書10の生成を行えるようにする。そして構造化文書10は構造化文書生成装置2から、ノンキャラクターデータの添付ファイル11などと共に、構造化文書処理装置12等の所定の宛先にLAN4等を介して転送される。またノンキャラクターデータをキャラクター変換する場合は、構造化文書中にキャラクターデータを含めて送信する。なお図1では、図示の都合上、LAN4を介さないかのように表示した。
【0018】
構造化文書処理装置12は、構造化文書の属性を用いて、加工やプリント,表示,記憶,配信(転送)等の処理を行い、構造化文書の処理プログラムをDVDやCD−ROMなどの記憶媒体13から読み込む。加工,プリント,表示,記憶,配信等の処理内容を決定するため、通信自体に関する情報を構造化した属性をデータ抽出部14で抽出し、抽出したデータを用いて、処理条件記憶部16に用いた処理条件を検索し、これに従って転送された構造化文書の処理を決定する。非キャラクター変換部18は、構造化文書中のキャラクター化したデータをノンキャラクターデータに再変換するためのもので、設けなくても良い。記憶部20は構造化した文書自体や、その処理、あるいは主要な属性等を記憶する。
【0019】
図1の実施例を、ファクシミリサーバ22と文書管理サーバ24との関係として、具体的に表現した例を図2に示す。ファクシミリサーバ22と文書管理サーバ24とはLAN4を介して接続され、ファクシミリサーバ22にはインターネットや公衆電話回線網等からファクシミリデータが送信される。ファクシミリデータには、データ本体となる画像データの他に、発信元のアドレスや解像度,符号化の方式,紙のサイズ,データの枚数,親展送信やポーリング送信等の特殊モード送信の場合の送信モード等の、通信自体に関するデータが付加されている。ファクシミリデータを受信したファクシミリサーバ22は、受信した日時や受信装置が複数ある場合の受信装置の番号、通信時間や通信結果等の、受信装置側で判明する情報を生成する。ファクシミリサーバ22で受信した通信自体に関する情報と、ファクシミリサーバ22で生成可能な通信自体に関する情報とを、通信自体に関する情報とする。通信自体に関する情報からデータ抽出・変換部6でデータを抽出し、そのうち一部を設計図、経理書類などの文書のタイトルや、関係するクライアント名や、回覧、全員配布、秘密クラス2などの取り扱い条件等に変換する。またキャラクター変換部8は前記のように、ファクシミリデータの本体である画像データを、キャラクターデータに変換する。そしてデータ抽出・変換部6で属性として抽出・変換したデータに、キャラクター変換部8でキャラクターデータに変換した画像データを追加し、構造化文書10を作成する。
【0020】
構造化文書10は文書管理サーバ24に転送され、通信自体に関する情報を構造化した部分から、データ抽出部14で、処理の条件や分類検索のキーワード等を抽出する。抽出したデータから、該当する処理条件を処理条件記憶部16のデータを参照して決定し、記憶部20に記憶、所定のクライアント26〜28に配信、プリントアウトなどの処理を行う。
【0021】
図3に、図2の場合を例に受信データの構造化アルゴリズムを示す。ステップ1でファクシミリデータを受信すると、自機を含む通信路に関する情報や通信方法に関する情報を抽出する。通信路に関する情報としては、受信装置の番号や通信時間,受信日時,通信結果,発信元の番号や発信元のサブアドレス等がある。また通信方法に関する情報としては、ファクシミリデータの解像度や符号化の方式,紙のサイズ等がある(ステップ2)。次いでファクシミリサーバに記憶した構造化条件テーブルを参照し、抽出した情報のうちそのまま属性として用いるものと、変換して属性化するものと、廃棄する部分とを決定し、構造化する部分に適宜のタグを付す。また構造化文書の転送先を決定する(ステップ3)。次いで例えば、画像データをキャラクターデータに変換し、用いた変換方式を属性に追加する(ステップ4)。この処理を行わない場合、画像データを構造化文書の添付ファイルとする。そして構造化文書や添付ファイルを転送し、構造化に用いたデータと転送先並びに転送結果を記憶する(ステップ5)。
【0022】
図4に、図1での構造化文書生成装置2と構造化文書処理装置12との関係を模式化して示す。構造化文書生成装置2は、画像データ40と通信路や通信方法に関する通信自体に関する情報42とを受信する。そして通信自体に関する情報からデータを抽出し、その一部をデータ変換部44でキーワード等に変換し、構造化部46でタグ等を付して構造化する。また画像データをキャラクター変換部8でキャラクターデータに変換し、あるいは添付ファイルとする。
【0023】
構造化文書ファイル10は構造化文書処理装置12へ転送され、データ抽出部14で処理条件を決定し、あるいは保管・検索等のためのキーワードを抽出し、抽出したデータに従って処理条件記憶部16で処理・加工の条件を決定する。そしてノンキャラクターデータとしてあるいはキャラクターデータとして処理部48で所定の処理を施して出力する。処理としては、記憶部に所定の条件で記憶する、所定のクライアントに転送する、通信自体に関する情報を用いてデータベースを作成する、画像データ等へ復元する際に例えば先頭ページだけ等の要約版を作成する、あるいは画像データに抽出したキーワード等を合成して表示する、等がある。
【0024】
図5に、ファクシミリデータをSVG規格で構造化文書に変換した例を示す。通信自体に関する情報はタグを生成して構造化されて文書属性の欄に記載され、例えばタイトルとして受信した文書番号が記載され、ファクシミリ通信の手法や受信装置のアドレス,受信した日付,通信結果,ページ数,通信時間,受信装置のファクシミリ番号や発信元のファクシミリ番号が記載されている。これ以外に元の画像データがバイナリーデータで、TIFF(アドビ社の提唱のタグ付きイメージファイルフォーマット)で受信したものであり、解像度が400dpiで、走査方向にも副走査方向にも解像度が同じで、A4用紙が用いられ、画像データへのコーディングはMMRで行われたことが記載されている。
【0025】
そして文書属性の下の欄に、画像データをベクトル化したデータが記載されている。図5のようにすると、文書の属性を用いて文書管理装置は、文書の処理や加工,記憶,配信等の処置を決定でき、また画像データがキャラクターデータとして構造化文書中に一体に記憶されているので、データの取り扱いが容易になる。
【0026】
図6にTIFFデータをXML規格で構造化した例を示す。図6の上左側はTIFFデータを示し、画像データのキャラクター変換の手法としてBASE64を用い、テキストデータに変換する。元々のデータがTIFF形式であったことや、TIFFデータをBASE64によりキャラクターデータに変換したこと、並びに通信自体から得られた情報等をキーワードとして属性化し、これ以外にBASE64によりテキストデータに変換したデータを記載する。
【0027】
実施例の作用効果を示す。実施例では、通信自体に関する情報から抽出・変換したキーワードで、ファクシミリデータと関連づけた構造化文書を生成できる。これらのキーワードを自動的に生成でき、ファクシミリデータ自体の意味の解釈や特徴の抽出等は不要である。通信自体に関する情報を抽出・変換してキーワードとすると、発信元と通信の日時やデータの種類等から、相当の程度にデータの意味や内容を特定できる。これに、ある発信元からファクシミリ送信されたデータは設計図書である、などの簡単なルールを抽出・変換部に入力自在にすれば、文書の内容自体をかなりの程度に特定できる。
【0028】
図7に、ホームセキュリティシステムからのデータ転送に応用した参考例を示す。50はホームセキュリティシステムで、例えば個々の家庭に設けられ、火災や戸締まり、ガス、水道、電気等の状態をチェックしているものとする。ホームセキュリティシステム50には多数のセンサが設けられ、センサから入力されたデータはノンキャラクターの生データとして、PHS回線等を通じてセンタ52に送信される。センタ52では送信元のアドレスと、転送されてきたデータの内容とから、構造化条件テーブル54を用いて構造化文書60を生成する。例えば構造化文書60では、タイトルがセキュリティセンタからのお知らせで、宛先や日時並びに項目<水漏れ>と、それに対してホームセキュリティシステム50が取った処理<元栓を閉じる>並びに処理結果<処理終了>とを属性とし、携帯電話や職場のパーソナルコンピュータ等の端末56へ送信する。
【0029】
端末56を有するユーザの側では、火災等の特別な場合を除いて、電話でセンタ52から呼び出されることは好まないものである。かといって窓が開いている、簡単な水漏れがあったが復旧した等の場合に、全く通知しないというのも好ましいものではない。そこでこのような軽微な問題とそれに対する処理結果を構造化文書60で通知されると、ユーザは時間のあるときに簡単にチェックできる。
【図面の簡単な説明】
【図1】 実施例での、非キャラクターデータの構造化と転送並びに処理を示すブロック図
【図2】 図1の実施例をファクシミリデータの処理に適用した例を示すブロック図
【図3】 ファクシミリデータの構造化プログラムを説明するフローチャート
【図4】 ファクシミリデータの構造化と転送先での処理のモデルを示す図
【図5】 ファクシミリデータをSVG文書に構造化した例を示す図
【図6】 ファクシミリデータをXML文書に構造化した例を示す図
【図7】 センサ信号の転送に利用した参考例を示すブロック図
【符号の説明】
2 構造化文書生成装置
4 LAN
6 データ抽出・変換部
8 キャラクター変換部
9,13 記憶媒体
10 構造化文書
12 構造化文書処理装置
14 データ抽出部
16 処理条件記憶部
18 非キャラクター変換部
20 記憶部
22 ファクシミリサーバ
24 文書管理サーバ
26〜28 クライアント
40 画像データ
42 通信自体に関する情報
44 データ変換部
46 構造化部
48 処理部
50 ホームセキュリティシステム
52 センタ
54 構造化条件テーブル
56 端末
60 構造化文書
[0001]
[Field of the Invention]
The present invention relates to generation of structured documents.
[0002]
[Prior art]
Standards for structured documents such as XML (Extensible Markup Language), SVG (Scalable Vector Graphics), XHTML (Extensible Hypertext Markup Language), and VoiceXML (Voice Extensible Markup Language) have been proposed. A typical example of these standards is XML, SVG is a standard obtained by extending this to graphic vector data, XHTML is a standard in which HTML is redefined in XML, and VoiceXML applies XML to audio data. It is a standard. In these standards, the data is character data, which is structured with tags or the like so that the information processing apparatus can understand and handle the semantic content of the data. XML or the like is a markup language, but is different from HTML for the purpose of data representation (designation of tabs, line feeds, fonts, etc.) in that it aims at structuring data.
[0003]
A feature such as XML is that attribute names can be newly defined for structured data. An attribute is a set of the name of data and the data itself. If the name corresponds to the meaning and content of the data, the data can be interpreted and processed / processed by the name. For convenience of data processing and processing, the data that can be handled is limited to character data. In particular, XML can handle only non-numeric character data, that is, text data.
[0004]
Even in the standard for structured documents, SVG can handle vector data. Therefore, if the image data is converted from the raster format to the vector format, the image data can be structured. Since the image data is vector data, it is easy to reduce, enlarge, deform, delete, add, and modify graphics. VoiceXML can handle audio data. However, these standards are standards aimed at structuring image data and audio data itself. Apart from SVG and VoiceXML, speech and image recognition are being studied. For example, understanding the meaning of voice or image, extracting features, extracting an object from an image, extracting a motion of an object or a person from a moving image, and the like.
[0005]
[Problems of the Invention]
A basic object of the present invention is to make it possible to easily generate a structured document associated with received facsimile data (claims 1 to 10).
An additional problem of the inventions of claims 4 and 9 is to determine and transfer a data destination client from the extracted information.
An additional problem of the inventions of claims 5 and 10 is to convert the extracted information so that it can be structured flexibly.
[0006]
[Structure of the invention]
The facsimile server according to the present invention includes means for transmitting / receiving facsimile data, means for transmitting / receiving structured documents using a markup language, and data other than image data in data obtained by facsimile reception. A data extraction / conversion unit for extracting what should be an attribute of a structured document from information about the communication itself , converting a part thereof as attribute data and converting the remaining part into other information, and converting it into attribute data; Means for generating a structured document using a markup language by using attribute data from the data extraction / conversion unit as an attribute and associating it with the received facsimile data is provided.
[0007]
Preferably, the image data in the facsimile data is character-converted to make the attribute of the structured document, and the structured document is generated using at least the character conversion method and the encoding method in the information relating to the communication itself as attributes. (Claim 2).
[0008]
Preferably, the information relating to the communication itself is extracted from the received information relating to the own device, the information relating to the communication path, and the information transmitted based on the communication protocol. As other additional attributes, information on the transmission source may be used as the attribute. Note that information related to the communication itself is basic control data, and is therefore considered character data. The transmission source address includes the transmission source network address, the transmission source facsimile number and its sub-address, and the received information about the own device includes a device number in the case of a device including a plurality of reception devices. The information on the communication path includes the result of communication quality, the amount of data, the time used for communication, and the communication time. Information transmitted based on the communication protocol includes image resolution, data compression and encoding rules, communication number confidential communication, specification of communication mode such as polling communication, number of pages, annotation data such as page breaks, etc. is there. The boundaries between the information based on the communication protocol, the information related to the transmission source address, the received information related to the own device, and the information related to the communication path are ambiguous, and these are collectively referred to as information related to the communication itself.
[0009]
Preferably, a client for the generated structured document is determined from the extracted information and transferred to a predetermined transfer destination (claim 4).
Particularly preferably, a table for determining whether the extracted information is to be used as attribute data or converted to other information and used as attribute data is provided with reference to the extracted information. (Claim 5).
[0010]
The structured document generation program of the present invention comprises means for transmitting / receiving facsimile data and means for transmitting / receiving structured documents using a markup language, and is readable and executable by reading the program. A program for a facsimile server, which extracts data to be attributed to a structured document from information related to communication itself other than image data from data obtained by facsimile reception , and a part of the extracted data is used as attribute data as it is. an extraction instruction to the attribute data after converting the remaining portion to the other information, the attribute data from the extracted instruction as an attribute, and in association with the facsimile data, generates a structured document using a markup language And an instruction for performing the operation (claim 6).
Regarding the structured document generation program, the items related to the structured document generation apparatus and generation procedure, transfer after generation, processing, and processing apply to the generation program as they are, except for items that are not applicable to the generation program.
[0011]
Preferably, the structure is obtained by using an instruction for character-converting image data in facsimile data to be an attribute of the structured document, at least a character conversion method, and an encoding method in information relating to the communication itself. And a command for generating a digitized document (Claim 7).
Preferably, in the extraction command, information related to the communication itself is extracted from the received information related to the own device, information related to the communication path, and information transmitted based on the communication protocol. In addition to this, information regarding the source address may be used as an additional attribute.
Preferably, a transfer command for determining a client for the generated structured document from the extracted information and transferring it to a predetermined transfer destination is provided.
Particularly preferably, in the extraction command, the extracted information is determined as attribute data as it is and converted into other information as attribute data with reference to a table. ).
[0012]
[Operation and effect of the invention]
In the present invention, information related to the communication itself is added to the attribute to generate a structured document associated with the facsimile data and using the markup language (claims 1 to 10). Hereinafter, “structured document” means “structured document using a markup language”.
Linking means linking in the form of an attached file or the like, or image data in facsimile data is character-converted and included in a structured document. Information on the communication itself includes, for example, information on the scale of the data such as the address of the sender, the type of data, the date and time of communication, the amount of communication, the communication time, etc. A considerable arrangement of types and contents. This facilitates processing, storage and maintenance of facsimile data.
[0013]
Here, the image data in the facsimile data is converted into the character of the structured document and the structured document is generated using at least the character conversion method and the encoding method in the information related to the communication itself as an attribute. Since the image data is integrally stored in the structured document as character data, the data can be handled easily (claims 2 and 7).
The information regarding the communication itself is the information regarding the received own device, the information regarding the communication path, and the information transmitted based on the communication protocol. These are information obtained naturally at the time of reception and can be easily added to the attribute ( Claims 3 and 8).
[0014]
If the client that needs the data is determined from the information about the communication itself and transferred to a predetermined transfer destination, the necessary data can be provided to the required client.
[0015]
In the present invention, part of the extracted information relating to the communication itself is directly used as attribute data, and the rest is converted into attribute data, so that document management is further facilitated. For example, when the document type can be estimated from the source address, it is easier to handle because the document type can be an attribute than the source address (claims 1 to 10).
[0016]
【Example】
1 to 7 show an embodiment and its modifications. FIG. 1 shows a basic embodiment of the present invention. Reference numeral 2 denotes a structured document generation apparatus which can send and receive facsimile data and can send and receive structured documents associated with them. The structured document generation apparatus 2 reads and executes a structured document generation program from an appropriate storage medium. The structured document generation apparatus 2 is connected to the LAN 4 and performs transmission / reception of non-character data and transmission / reception of a structured document. In addition to this, it is connected to a public telephone network (PSTN), and transmits and receives facsimile data and the like. Further, it is connected to a network such as the Internet, and transmits / receives an Internet facsimile or the like.
[0017]
The structured document generation apparatus 2 has a data extraction / conversion unit 6 that extracts information to be used as attributes of the structured document from information related to the communication itself, and converts some of the data into easier-to-handle data for structuring. It converts into the attribute of a document, and the remainder is converted into the attribute of a structured document as it is. The character conversion unit 8 may not be provided, and converts the main body of the non-character data received by communication into character data. The structured document generation apparatus 2 reads the structured document generation program stored in the storage medium 9 such as a DVD or CD-ROM, and assigns its own resources to the data extraction / conversion unit 6 and the like accordingly, and the structured document is generated. 10 can be generated. The structured document 10 is transferred from the structured document generating apparatus 2 to a predetermined destination such as the structured document processing apparatus 12 through the LAN 4 together with the non-character data attachment file 11 and the like. In addition, when converting non-character data to a character, the structured data is transmitted including the character data. In FIG. 1, for the convenience of illustration, it is displayed as if it is not via the LAN 4.
[0018]
The structured document processing apparatus 12 performs processing such as processing, printing, display, storage, and distribution (transfer) using the attribute of the structured document, and stores the structured document processing program such as a DVD or a CD-ROM. Read from the medium 13. In order to determine processing contents such as processing, printing, display, storage, and distribution, the data extraction unit 14 extracts attributes that are structured information related to the communication itself, and uses the extracted data for the processing condition storage unit 16. The processing conditions that have been transferred are searched, and the processing of the structured document transferred according to the processing conditions is determined. The non-character converting unit 18 is for re-converting the characterized data in the structured document into non-character data, and may not be provided. The storage unit 20 stores the structured document itself, its processing, main attributes, and the like.
[0019]
An example in which the embodiment of FIG. 1 is specifically expressed as the relationship between the facsimile server 22 and the document management server 24 is shown in FIG. The facsimile server 22 and the document management server 24 are connected via the LAN 4, and facsimile data is transmitted to the facsimile server 22 from the Internet or a public telephone line network. For facsimile data, in addition to the image data that is the data body, the transmission mode in the case of a special mode transmission such as the transmission source address and resolution, encoding method, paper size, number of data, confidential transmission and polling transmission Data relating to the communication itself is added. The facsimile server 22 that has received the facsimile data generates information that is known on the receiving device side, such as the date and time of reception, the number of the receiving device when there are a plurality of receiving devices, the communication time, and the communication result. Information on the communication itself received by the facsimile server 22 and information on the communication itself that can be generated by the facsimile server 22 are information on the communication itself. Data is extracted from the information related to the communication itself by the data extraction / conversion unit 6, and some of them are handled as titles of documents such as design drawings and accounting documents, related client names, circulation, distribution of all members, secret class 2, etc. Convert to conditions. Further, as described above, the character conversion unit 8 converts the image data which is the main body of the facsimile data into character data. Then, the image data converted into the character data by the character conversion unit 8 is added to the data extracted and converted as attributes by the data extraction / conversion unit 6 to create a structured document 10.
[0020]
The structured document 10 is transferred to the document management server 24, and processing conditions, classification search keywords, and the like are extracted by the data extraction unit 14 from a portion where information related to communication itself is structured. Corresponding processing conditions are determined from the extracted data by referring to the data in the processing condition storage unit 16, stored in the storage unit 20, distributed to predetermined clients 26 to 28, and printed out.
[0021]
FIG. 3 shows a received data structuring algorithm by taking the case of FIG. 2 as an example. When the facsimile data is received in step 1, information relating to the communication path including the own machine and information relating to the communication method are extracted. The information regarding the communication path includes the number of the receiving device, the communication time, the reception date and time, the communication result, the transmission source number, the transmission source subaddress, and the like. Information relating to the communication method includes the resolution of the facsimile data, the encoding method, the paper size, and the like (step 2). Next, referring to the structured condition table stored in the facsimile server , the extracted information to be used as an attribute as it is, the attribute to be converted and attributed, and the portion to be discarded are determined. Add a tag. Also, the transfer destination of the structured document is determined (step 3). Next, for example, the image data is converted into character data, and the conversion method used is added to the attribute (step 4). When this processing is not performed, the image data is used as an attached file of the structured document. Then, the structured document and the attached file are transferred, and the data used for structuring, the transfer destination, and the transfer result are stored (step 5).
[0022]
FIG. 4 schematically shows the relationship between the structured document generation apparatus 2 and the structured document processing apparatus 12 in FIG. The structured document generation apparatus 2 receives the image data 40 and information 42 related to the communication itself regarding the communication path and the communication method. Then, data is extracted from information relating to the communication itself, a part of the data is converted into a keyword or the like by the data conversion unit 44, and a tag or the like is attached to the structuring unit 46 to be structured. Also, the image data is converted into character data by the character conversion unit 8 or is used as an attached file.
[0023]
The structured document file 10 is transferred to the structured document processing apparatus 12, and the data extraction unit 14 determines processing conditions or extracts keywords for storage and retrieval, and the processing condition storage unit 16 according to the extracted data. Determine processing and processing conditions. Then, a predetermined process is performed by the processing unit 48 as non-character data or as character data and output. As processing, a summary version such as only the first page is stored when the database is stored under a predetermined condition in the storage unit, transferred to a predetermined client, a database is created using information on communication itself, or restored to image data or the like. For example, a keyword that is created or extracted from image data is displayed.
[0024]
FIG. 5 shows an example of converting facsimile data into a structured document according to the SVG standard. Information about the communication itself is structured by generating a tag and described in the column of the document attribute, for example, the document number received as a title is described, the method of facsimile communication, the address of the receiving device, the received date, the communication result, The number of pages, communication time, facsimile number of the receiving device and the facsimile number of the sender are described. In addition to this, the original image data is binary data, which is received in TIFF (tagged image file format proposed by Adobe), the resolution is 400 dpi, and the resolution is the same in both the scanning direction and the sub-scanning direction. A4 paper is used, and it is described that the coding to the image data was performed by MMR.
[0025]
In the column below the document attribute, data obtained by vectorizing the image data is described. As shown in FIG. 5, the document management apparatus can determine processing such as document processing, processing, storage, and distribution by using document attributes, and image data is stored in the structured document integrally as character data. Data handling becomes easier.
[0026]
FIG. 6 shows an example in which TIFF data is structured according to the XML standard. The upper left side of FIG. 6 shows TIFF data, which is converted to text data using BASE64 as a character conversion method for image data. Data that the original data was in TIFF format, that TIFF data was converted to character data by BASE64, and that information obtained from communication itself was attributed as keywords, and other data that was converted to text data by BASE64 Is described.
[0027]
The effect of an Example is shown. In the embodiment, a structured document associated with facsimile data can be generated with a keyword extracted and converted from information relating to communication itself. These keywords can be automatically generated, and it is not necessary to interpret the meaning of the facsimile data itself or extract features. If information related to the communication itself is extracted and converted into keywords, the meaning and content of the data can be specified to a considerable extent based on the transmission source and the date and time of communication and the type of data. In addition, if a simple rule such as data transmitted by facsimile from a source is a design book can be input to the extraction / conversion unit, the content of the document itself can be specified to a considerable extent.
[0028]
FIG. 7 shows a reference example applied to data transfer from the home security system. Reference numeral 50 denotes a home security system, which is provided in an individual home, for example, and checks the status of fire, door shut, gas, water supply, electricity, and the like. The home security system 50 is provided with a large number of sensors, and data input from the sensors is transmitted as non-character raw data to the center 52 through a PHS line or the like. The center 52 generates a structured document 60 using the structured condition table 54 from the address of the transmission source and the contents of the transferred data. For example, in the structured document 60, the title is a notification from the security center, the destination, date and time, and the item <leakage>, and the processing taken by the home security system 50 <close the main plug> and the processing result <processing end> Are transmitted to a terminal 56 such as a mobile phone or a personal computer at work.
[0029]
The user having the terminal 56 does not like being called from the center 52 by telephone except in special cases such as fire. However, it is not preferable not to notify at all when the window is open, or there is a simple water leak but it is restored. Therefore, when such a minor problem and a processing result for it are notified by the structured document 60, the user can easily check when there is time.
[Brief description of the drawings]
FIG. 1 is a block diagram showing structuring, transfer and processing of non-character data in an embodiment. FIG. 2 is a block diagram showing an example in which the embodiment of FIG. 1 is applied to facsimile data processing. Flowchart explaining data structuring program [FIG. 4] A diagram showing a model of facsimile data structuring and processing at a transfer destination [FIG. 5] A diagram showing an example of structuring facsimile data into an SVG document [FIG. 6] Fig. 7 is a diagram showing an example of structured facsimile data in an XML document. Fig. 7 is a block diagram showing a reference example used for transferring sensor signals.
2 Structured document generator 4 LAN
6 Data Extraction / Conversion Unit 8 Character Conversion Units 9 and 13 Storage Medium 10 Structured Document 12 Structured Document Processing Device 14 Data Extraction Unit 16 Processing Condition Storage Unit 18 Non-Character Conversion Unit 20 Storage Unit 22 Facsimile Server 24 Document Management Server 26 ~ 28 Client 40 Image data 42 Information on communication itself 44 Data conversion unit 46 Structured unit 48 Processing unit 50 Home security system 52 Center 54 Structured condition table 56 Terminal 60 Structured document

Claims (10)

ファクシミリデータの送受信を行うための手段と、
マークアップ言語を用いた構造化文書の送受信を行うための手段と、
ファクシミリ受信により得られたデータ中の、画像データ以外の通信自体に関する情報から構造化文書の属性とすべきものを抽出し、その一部をそのまま属性データとし、残部を他の情報に変換した上で属性データとするためのデータ抽出・変換部と、
前記データ抽出・変換部からの属性データを属性として、かつ受信したファクシミリデータと関連づけて、マークアップ言語を用いた構造化文書を生成するための手段とを設けたファクシミリサーバ。
Means for sending and receiving facsimile data;
Means for sending and receiving structured documents using a markup language;
Extracting what should be the attribute of the structured document from the information related to the communication itself other than the image data from the data obtained by facsimile reception , converting the part as attribute data as it is and converting the rest to other information A data extraction / conversion unit for attribute data;
A facsimile server provided with means for generating a structured document using a markup language by using the attribute data from the data extraction / conversion unit as an attribute and associating with the received facsimile data.
ファクシミリデータ中の画像データをキャラクター変換して前記構造化文書の属性とすると共に、少なくともキャラクター変換の方式と、前記通信自体に関する情報中の符号化方式とを属性として前記構造化文書を生成するようにしたことを特徴とする、請求項1のファクシミリサーバ。  Image data in facsimile data is character-converted into attributes of the structured document, and the structured document is generated using at least the character conversion method and the encoding method in the information related to the communication itself as attributes. The facsimile server according to claim 1, wherein 前記通信自体に関する情報は、受信した自機に関する情報と、通信路に関する情報、並びに通信プロトコルに基づいて送信された情報から抽出されたものであることを特徴とする、請求項1のファクシミリサーバ。  2. The facsimile server according to claim 1, wherein the information relating to the communication itself is extracted from the received information relating to the own machine, the information relating to the communication path, and the information transmitted based on the communication protocol. 前記抽出した情報から、前記生成した構造化文書に対するクライアントを決定して、所定の転送先へ転送するようにしたことを特徴とする、請求項3のファクシミリサーバ。  4. The facsimile server according to claim 3, wherein a client for the generated structured document is determined from the extracted information and transferred to a predetermined transfer destination. 前記抽出した情報に対して、そのまま属性データとするものと他の情報に変換した上で属性データとするものとを決定するためのテーブルを、前記抽出した情報で参照自在に設けたことを特徴とする、請求項1〜4のいずれかのファクシミリサーバ。 The extracted information is provided with a table for determining what is used as attribute data as it is and what is converted into other information to be used as attribute data so that the extracted information can be referred to. The facsimile server according to claim 1. ファクシミリデータの送受信を行うための手段と、マークアップ言語を用いた構造化文書の送受信を行うための手段とを備え、かつプログラムを読み取って実行自在なファクシミリサーバのためのプログラムであって、
ファクシミリ受信により得られたデータ中の、画像データ以外の通信自体に関する情報ら構造化文書の属性とすべきものを抽出し、その一部をそのまま属性データとし、残部を他の情報に変換した上で属性データとするための抽出命令と、
前記抽出命令からの属性データを属性として、かつ前記ファクシミリデータと関連づけて、マークアップ言語を用いた構造化文書を生成するための命令とを備えたことを特徴とする、構造化文書生成プログラム。
A program for a facsimile server that includes means for sending and receiving facsimile data and means for sending and receiving structured documents using a markup language, and that can be read and executed by a program,
Extract data that should be attributed to a structured document from information related to communication itself other than image data from the data obtained by facsimile reception, convert that part as attribute data as it is, and convert the rest to other information An extraction command for attribute data;
A structured document generation program comprising: an instruction for generating a structured document using a markup language by using attribute data from the extraction instruction as an attribute and associating with the facsimile data.
ファクシミリデータ中の画像データをキャラクター変換して前記構造化文書の属性とするための命令と、
少なくともキャラクター変換の方式と、前記通信自体に関する情報中の符号化方式とを用いて前記構造化文書を生成するための命令とを設けたことを特徴とする、請求項6の構造化文書生成プログラム。
An instruction for character-converting image data in the facsimile data to be an attribute of the structured document;
7. The structured document generation program according to claim 6, further comprising: an instruction for generating the structured document using at least a character conversion method and an encoding method in information relating to the communication itself. .
前記抽出命令では、受信した自機に関する情報と、通信路に関する情報、並びに通信プロトコルに基づいて送信された情報から、通信自体に関する情報を抽出することを特徴とする、請求項6の構造化文書生成プログラム。  7. The structured document according to claim 6, wherein in the extraction command, information on the communication itself is extracted from the received information on the own device, information on the communication path, and information transmitted based on the communication protocol. Generation program. 前記抽出した情報から、前記生成した構造化文書に対するクライアントを決定して、所定の転送先へ転送するための転送命令を備えたことを特徴とする、請求項8の構造化文書生成プログラム。  9. The structured document generation program according to claim 8, further comprising a transfer instruction for determining a client for the generated structured document from the extracted information and transferring the client to a predetermined transfer destination. 前記抽出命令では、抽出した情報に対して、そのまま属性データとするものと他の情報に変換した上で属性データとするものとを、テーブルを参照して決定するようにしたことを特徴とする、請求項6〜9のいずれかの構造化文書生成プログラム。 In the extraction command, the extracted information is determined as attribute data as it is and converted into other information as attribute data by referring to a table. The structured document generation program according to any one of claims 6 to 9.
JP2001168190A 2001-06-04 2001-06-04 Facsimile server and its program Expired - Lifetime JP3682861B2 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2001168190A JP3682861B2 (en) 2001-06-04 2001-06-04 Facsimile server and its program
US10/160,978 US7069503B2 (en) 2001-06-04 2002-05-30 Device and program for structured document generation data structure of structural document

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001168190A JP3682861B2 (en) 2001-06-04 2001-06-04 Facsimile server and its program

Publications (2)

Publication Number Publication Date
JP2002368937A JP2002368937A (en) 2002-12-20
JP3682861B2 true JP3682861B2 (en) 2005-08-17

Family

ID=19010453

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001168190A Expired - Lifetime JP3682861B2 (en) 2001-06-04 2001-06-04 Facsimile server and its program

Country Status (1)

Country Link
JP (1) JP3682861B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4876998B2 (en) 2007-03-22 2012-02-15 ブラザー工業株式会社 Communications system

Also Published As

Publication number Publication date
JP2002368937A (en) 2002-12-20

Similar Documents

Publication Publication Date Title
US7069503B2 (en) Device and program for structured document generation data structure of structural document
KR100293402B1 (en) Image transmission apparatus
US7464333B2 (en) Image processing apparatus, and method for controlling the image processing apparatus to process displayable and non-displayable data received from a server
US7936472B2 (en) Driverless image printing
US8857715B2 (en) Multi-function apparatus and method of controlling the same
US20050108353A1 (en) Image processing device and control method of image processing device
JPH07175813A (en) Composite communication processor
JPH09231022A (en) Document accumulator
JP2010182206A (en) Image processing apparatus and image processing method
US7991828B2 (en) Network communication apparatus generating XML responses based on HTTP requests
JPH10307826A (en) Document management device
US20090083316A1 (en) Information processing apparatus, information processing method, and information processing program
JP3682861B2 (en) Facsimile server and its program
US9369594B2 (en) Transmission device, relay device, recording medium and control method of transmission system
JP4177305B2 (en) Network communication equipment
US20020018236A1 (en) Bi-directional facsimile mechanism using the internet
JP2010097588A (en) Data relay apparatus, image forming method, program and recording medium
JP3724728B2 (en) Structured document processing device
US20040010757A1 (en) Method and system to place a scanned document in the body of an email
JP2009027648A (en) Image processing device
JP2008242820A (en) Document processing system
JP2007280105A (en) Upload request device, upload request method, and upload request program
JP2002358230A (en) Data structure of structured document, structured document generation device and program therefor
US8971507B2 (en) Facsimile server, facsimile system, and facsimile transmission method
CN100507900C (en) Structured document processing device and recording medium recording structured document processing program

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040716

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040722

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040907

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20041008

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20041203

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20050131

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050324

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20050329

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050506

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050519

R150 Certificate of patent or registration of utility model

Ref document number: 3682861

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080603

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110603

Year of fee payment: 6

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110603

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120603

Year of fee payment: 7

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130603

Year of fee payment: 8

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130603

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140603

Year of fee payment: 9

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term