JP3724729B2 - Structured document processing apparatus and program thereof - Google Patents

Structured document processing apparatus and program thereof Download PDF

Info

Publication number
JP3724729B2
JP3724729B2 JP2002099651A JP2002099651A JP3724729B2 JP 3724729 B2 JP3724729 B2 JP 3724729B2 JP 2002099651 A JP2002099651 A JP 2002099651A JP 2002099651 A JP2002099651 A JP 2002099651A JP 3724729 B2 JP3724729 B2 JP 3724729B2
Authority
JP
Japan
Prior art keywords
processing
data
structured document
text
converted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2002099651A
Other languages
Japanese (ja)
Other versions
JP2003296304A (en
Inventor
好史 谷本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Murata Machinery Ltd
Original Assignee
Murata Machinery Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Murata Machinery Ltd filed Critical Murata Machinery Ltd
Priority to JP2002099651A priority Critical patent/JP3724729B2/en
Priority to US10/391,914 priority patent/US20030188265A1/en
Priority to CNB031086209A priority patent/CN100507900C/en
Publication of JP2003296304A publication Critical patent/JP2003296304A/en
Application granted granted Critical
Publication of JP3724729B2 publication Critical patent/JP3724729B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)

Description

【0001】
【発明の利用分野】
この発明は構造化文書の処理に関する。
【0002】
【従来技術】
ファクシミリデータなどのイメージデータを、構造化文書の添付ファイルなどとして、文書管理を容易にすることが提案されている。このようにすることにより、構造化文書によりイメージデータを管理することができる。しかし、イメージデータなどのバイナリデータにどのような処理を施すのかは、一々マニュアルで入力しなければならない。
【0003】
【発明の課題】
この発明の基本的課題は、テキスト変換されたバイナリデータを含む構造化文書に対して、テキスト変換されたバイナリデータに対する処理を構造化文書自体に基づいて決定できるようにすることにある(請求項1〜4)
請求項1,3の発明での追加の課題は、バイナリデータを受信した際の通信に関する情報を用いて、処理を適切に決定できるようにすることにある。
請求項2,4の発明での追加の課題は、バイナリデータ自体を用いて、処理の種類を決定できるようにすることにある。
【0004】
【発明の構成】
この発明の構造化文書処理装置は、受信したイメージデータをテキスト変換されたバイナリデータとして含み、かつ受信時に得られた通信に関するデータを本来のテキストデータとして含む構造化文書に対して、該構造化文書の本来のテキストデータ中の通信に関するデータでの、発信元のアドレスや電話番号、発信元の名称、宛先の名称、あるいはサブジェクト欄の記載からキーワードを抽出すると共に、抽出したキーワードに従って、前記テキスト変換されたバイナリデータに対する処理の種類を決定するための、抽出手段と、決定した種類の処理を実行するための処理手段とを設けたものである(請求項1)。
【0005】
この発明の構造化文書処理装置は、受信したイメージデータをテキスト変換されたバイナリデータとして含み、受信時に得られた通信に関するデータを本来のテキストデータとして含む構造化文書に対して、該構造化文書中のテキスト変換されたバイナリデータを文字認識してキーワードを抽出すると共に、抽出したキーワードに従って前記テキスト変換されたバイナリデータに対する処理の種類を決定するための、抽出手段と、決定した種類の処理を実行するための処理手段とを設けたものである(請求項2)。
【0006】
この発明の構造化文書の処理プログラムは、受信したイメージデータをテキスト変換されたバイナリデータとして含み、受信時に得られた通信に関するデータを本来のテキストデータとして含む構造化文書に対して、該構造化文書の本来のテキストデータ中の通信に関するデータでの、発信元のアドレスや電話番号、発信元の名称、宛先の名称、あるいはサブジェクト欄の記載からキーワードを抽出すると共に、抽出したキーワードに従って、前記テキスト変換されたバイナリデータに対する処理の種類を決定するための、抽出命令と、決定した種類の処理を実行するための処理命令とを設けたものである(請求項3)。
【0007】
この発明の構造化文書の処理プログラムは、受信したイメージデータをテキスト変換されたバイナリデータとして含み、受信時に得られた通信に関するデータを本来のテキストデータとして含む構造化文書に対して、該構造化文書中のテキスト変換されたバイナリデータを文字認識してキーワードを抽出すると共に、抽出したキーワードに従って前記テキスト変換されたバイナリデータに対する処理の種類を決定するための、抽出命令と、決定した種類の処理を実行するための処理命令とを設けたものである(請求項4)
【0008】
【発明の作用と効果】
この発明の構造化文書の処理装置や処理プログラムでは、構造化文書自体から、構造化文書中のテキスト変換されたバイナリデータの処理の種類を決定するための情報を抽出して処理するので、構造化文書中のテキスト変換されたバイナリデータの処理を、構造化文書自体で定義して自動的に行える(請求項1〜4)。
【0009】
ここでテキスト変換されたバイナリデータの処理を、ディスプレイへの表示、プリント、ファイル転送、別ファイルとして元の構造化文書とリンクさせて保存する、などの出力とし、処理の種類を決定するための情報に基づいてこれらの出力形態を決定すると、テキスト変換されたバイナリデータをどのように出力するかを自動的に決定できる。
【0010】
ここで本来のテキストデータから、処理の種類を決定するための情報を抽出すると、本来のテキストデータをあたかも処理の種類を決定するためのキーワードのようにして、処理の種類を決定できる。
【0011】
また本来のテキストデータ中の、バイナリデータの受信時の通信に関するデータから、処理の種類を決定するための情報を抽出すると、送信元や通信手段、通信経路、e−メールでのサブジェクト欄の記載などの通信に関する情報により、処理の種類を決定できる(請求項1,3)。
【0012】
さらにテキスト変換されたバイナリデータ中のキーワードなどへの文字認識結果、に基づいて処理の種類を決定すると、バイナリデータの特徴に応じた処理を行うことができる(請求項2,4)。
【0013】
【実施例】
図1〜図10に実施例を示す。図1に、実施例の構造化文書処理装置12の使用環境を示すと、2はLANで、4はファクシミリサーバで、6はメールサーバであり、8は文書管理サーバで、10はクライアントの端末である。ファクシミリサーバ4は、公衆電話回線網などを介してG3ファクシミリなどの送受信を行うと共に、メールサーバ6などを経由して、インターネットファクシミリの送受信を行う。またファクシミリサーバ4は、ファクシミリの他にプリンタ機能やコピー機能,イメージスキャナ機能などを組み込んだ複合機であり、LAN2の画像に関する入出力を行うサーバである。
【0014】
実施例の構造化文書処理装置12は、例えばファクシミリサーバ4に組み込むが、メールサーバ6や文書管理サーバ8、クライアントの端末10などに組み込んでも良い。また構造化文書処理装置12のハードウェアをファクシミリサーバ4などに組み込むことに代えて、構造化文書の処理プログラムを記憶した記憶媒体14などを用いて、処理プログラムをファクシミリサーバ4や文書管理サーバ8あるいは端末10などに記憶させても良い。
【0015】
図2に構造化文書処理装置12の構成を示すと、20は構造化文書入出力手段で、ファクシミリサーバ4などに既存のものを用いても良く、22は抽出手段で、構造化文書自体から、テキスト変換されたバイナリデータに対して施す処理の種類を決定するための情報を抽出する。ここではバイナリデータは、ファクシミリサーバ4などを経由するイメージデータであり、テキスト変換されて構造化文書中に埋め込まれている。なお簡単のために、処理前の構造化文書中でのテキスト変換されたイメージデータやバイナリデータを、単に「イメージデータ」や「バイナリデータ」と呼ぶことがある。処理後の構造化文書について、単に「イメージデータ」や「バイナリデータ」というときは、文字通りのイメージデータやバイナリデータを言い、テキスト変換されていないバイナリデータの形式とする。
【0016】
抽出手段22は、構造化文書自体の特徴、例えば本来のテキストデータ中に含まれるキーワードを抽出する。抽出手段22は特に、イメージデータ(この時点では原則としてバイナリデータ)をe−メールやファクシミリなどにより受信した際の通信に関するデータから、ファクシミリなどの発信元のアドレスや電話番号あるいは発信元の名称、宛先の名称、サブジェクト欄の記載、などをキーワードとして抽出する。ここに本来のテキストデータは、テキストとしての意味を持つデータを意味する。抽出手段22は、構造化文書中のテキスト変換されたバイナリデータを文字認識した際に得られる、「緊急」やその他のキーワードなどにより、処理の種類を決定する。さらに抽出手段22は、テキスト変換されたイメージデータのサイズや構造化文書中でイメージデータの部分が占めるデータの割合などによって、処理の種類を決定しても良い。23はルール表で、ファクシミリなどの発信元番号や発信元アドレス,発信元の名称,ヘッダ欄のサブジェクトなどでのキーワード,バイナリデータを文字認識した際のキーワード,あるいはバイナリデータのサイズや比重などに従って、処理の種類を決定するためのルールを記憶している。
【0017】
処理手段24は、抽出手段22によって決定された種類の処理を、テキスト変換されたバイナリデータに施す。バイナリデータは構造化文書中にテキストデータに変換されて記憶されているので、テキストデータを元のバイナリデータにデコードするためのデコード手段25を設ける。処理の種類としては、テキスト変換されたイメージデータを元のイメージデータにデコードして表示部に表示する、同様に元のイメージデータにデコードしてプリンタからプリントする、ファイル転送する、イメージデータにデコードして別ファイルとして保存し、リンク名やファイルパスを記載してリンクする、などのことが多い。ファイル・アロケーション手段26は、デコードしたイメージデータを別ファイルとして保存すると共に、それに対するリンク名やファイルパスなどを元の構造化文書中に埋め込む。なおリンク名を埋め込むことやファイルパスを埋め込むことなどを、単にリンクさせると言う。
【0018】
バイナリデータの処理では、JPG,PNG,GIFなどのブラウザで表示できるファイル形式に変換したり、データを縮小/拡大したり、あるいは色変換を施したりする、などの変換を施す場合が多い。これらはイメージデータなどのバイナリデータに対する、表示やプリントなどの出力前の変換である。またJPG,PNG,GIFは各々イメージデータに対するフォーマットの種類である。変換手段27は、バイナリデータに対して、ファイルフォーマットの変換、縮小/拡大、色変換などの変換を施すためのものである。表示/プリント手段28は、処理の種類が構造化文書中のイメージデータの画面表示などである場合に、構造化文書あるいはそのイメージデータ部分を画面に表示させ、また処理の種類が出力である場合に、構造化文書あるいはそのイメージデータ部分をプリントするためのものである。構造化文書を画面に表示する場合、本来のテキスト部分と、それ以外のバイナリデータをテキスト変換した部分とを、別のウィンドウに表示することが好ましい。加工手段29は、バイナリデータに対してこれ以外の加工を施すためのもので、例えば文字認識を施し、認識した文字を<message>などの属性で、本来のテキスト部分に移すなどの処理を行う。
【0019】
図3に、構造化文書の処理プログラム30の構成を示す、この構造化文書の処理プログラム30は、図1に示したように、適宜の記憶媒体14などに記憶させて、あるいは通信回線などを介してファクシミリサーバ4などに転送する。図3において、32は構造化文書の入出力サブルーチンで、ファクシミリサーバ4などに既存の資源を利用しても良く、34は処理手法の抽出サブルーチンで、構造化文書自体から、構造化文書中のイメージデータに対する処理の種類を決定する。処理の決定の手法は、図2の抽出手段22に関して説明したものと同様である。
【0020】
36は処理実行サブルーチンで、デコードサブルーチン37とファイル・アロケーションサブルーチン38と変換サブルーチン39と表示/プリントサブルーチン40と加工サブルーチン41とを備えている。処理実行サブルーチン36や、これに付属するデコードサブルーチン37〜加工サブルーチン41での処理の内容は、図2の処理手段24〜加工手段29に関して説明したものと同様で、デコードサブルーチン37はテキストデータに変換されたイメージデータを元のバイナリデータに変換する。ファイル・アロケーションサブルーチン38は、バイナリ変換したイメージデータを別ファイルとして保存すると共に、リンク名やファイルパスワードなどのリンク情報を構造化文書中に埋め込む。変換サブルーチン39は、ファイルのフォーマットを変換し、縮小/拡大などの変換や、色変換などを行う。表示/プリントサブルーチン40は、ファイルの表示やプリントなどの出力を行う。加工サブルーチン41は、バイナリ変換したイメージデータへの文字認識などを行う。このように構造化文書の処理プログラム30に関しては、構造化文書処理装置12に関する説明がそのまま当てはまる。
【0021】
図4〜図6に構造化文書の例とその表示例とを示す。図4は処理手段で処理する前の構造化文書で、例えば受信したG3ファクシミリデータをMMRによりコード化し、Base64により7ビット変換して、テキスト変換されたイメージデータとして構造化文書中に記述してある。また発信元の電話番号(TSI)や受信の日時、ページ数、ファクシミリデータの開始位置などを、本来のテキストデータとして記載してある。これに対して例えばTSIやインターネットファクシミリの場合のヘッダでのsenderの欄の記載をキーワードとし、TSIやsender欄の記載により処理の種類を決定する。
【0022】
図4の構造化文書中のイメージデータをバイナリデータに復号し、JPGファイルにフォーマット変換し、”FILE2782.JPG”としてリンクさせた構造化文書の例を図5に示す。図5の構造化文書には記載していないが、ファクシミリデータを受信したことを所定の端末に表示することを処理として追加しても良く、例えば図6の構造化文書中の通信に関する情報(TSIと受信日時並びにページ数)とリンク情報とを表示した例を図6に示す。またTSIやインターネットファクシミリでのヘッダでのsenderの欄の記載やサブジェクト欄の記載が所定の条件に一致する場合に、正常に受信しかつ文書管理サーバやその他の宛先などに転送したことなどを返信することを、処理に追加してもよい。
【0023】
図5の構造化文書では、イメージデータのファイルをリンク名を指定することによりリンクさせるようにしたが、ファイルパスなどを指定してリンクさせるようにしても良い。このような例を図7,図8に示すと、バイナリデータをfile2782.jpgに変換し、ディレクトリworkに記憶させることを、ファイルパスとして指定する。ここでファクシミリデータを受信したことを指定の端末に表示することとした場合、例えば図8のような表示となる。
【0024】
図9は、構造化文書中のテキスト変換されたバイナリデータをJPEG形式のファイルに変換し、ファイルパスを構造化文書中に埋め込むと共に、”file2782.jpg”のイメージファイルに対して、画面表示あるいはプリンタへの出力などの処理を行うように、構造化文書中に記述した例を示す。図10はこれに対応する表示例で、所定のクライアントの端末などに表示され、通信に関する情報(TSIや受信日時、ページ数、受信の良否とファクシミリ受信のID、インターネットファクシミリの場合のヘッダ欄の記載、など)並びに受信した画像データ自体が表示されている。
【0025】
実施例では、構造化文書はファクシミリサーバ4などで作成して、文書管理サーバ8や端末10などに送信するものとしたが、端末10や文書管理サーバ8で構造化文書を作成し、ファクシミリサーバ4などで処理の種類を決定して実行しても良い。
【0026】
実施例では、構造化文書中のデータ自体を用いて、構造化文書中のテキスト変換されたバイナリデータへの処理の種類を決定して実行する。このため構造化文書自体を用いて、表示,プリント,ファイル転送,バイナリデータにデコードして別ファイルとしリンクして保存、などの処理の種類を自動的に決定して実行できる。
【図面の簡単な説明】
【図1】 実施例の構造化文書処理装置の使用環境を示すブロック図
【図2】 実施例の構造化文書処理装置のブロック図
【図3】 実施例の構造化文書処理プログラムの構成を示す図
【図4】 実施例で用いた処理前の構造化文書の例を示す図
【図5】 図4の構造化文書を処理して作成した構造化文書の例を示す図で、元の構造化文書中のイメージデータはテキスト変換を解除して復号し、”FILE2782.JPG”として保存し、リンク名”FILE2782”を埋め込んである。
【図6】 図5の構造化文書の出力例を示す図で、リンク情報を含む本来のテキスト部分を画面表示してある。
【図7】 図4の構造化文書を処理して作成した構造化文書の例を示す図で、元の構造化文書中のイメージデータは復号して別のファイルに分離して保存し、ファイルパス名を埋め込んである。
【図8】 図7の構造化文書の出力例を示す図
【図9】 図4の構造化文書を処理して作成した構造化文書の例を示す図で、元の構造化文書中のイメージデータを別ファイルにして保存すると共に、本来のテキスト部分とイメージ部分の画面表示を行うようにしてある。
【図10】 図9の構造化文書の出力例を示す図である。
【符号の説明】
2 LAN
4 ファクシミリサーバ
6 メールサーバ
8 文書管理サーバ
10 端末
12 構造化文書処理装置
14 記憶媒体
20 構造化文書入出力手段
22 抽出手段
23 ルール表
24 処理手段
25 デコード手段
26 ファイル・アロケーション手段
27 変換手段
28 表示/プリント手段
29 加工手段
30 構造化文書の処理プログラム
32 構造化文書の入出力サブルーチン
34 処理手法の抽出サブルーチン
36 処理実行サブルーチン
37 デコードサブルーチン
38 ファイル・アロケーションサブルーチン
39 ファイル変換サブルーチン
40 表示/プリントサブルーチン
41 加工サブルーチン
[0001]
[Field of the Invention]
The present invention relates to processing of structured documents.
[0002]
[Prior art]
It has been proposed to facilitate document management by using image data such as facsimile data as an attached file of a structured document. In this way, image data can be managed by a structured document. However, what kind of processing is to be performed on binary data such as image data must be manually input.
[0003]
[Problems of the Invention]
The basic object of the invention is to provide a structured document containing binary data text conversion, is to make it a process for the text converted binary data can be determined based on the structured document itself (claim 1-4) .
An additional problem in the first and third aspects of the invention is to make it possible to appropriately determine processing using information related to communication when binary data is received.
An additional problem in the inventions of claims 2 and 4 is that the type of processing can be determined using binary data itself.
[0004]
[Structure of the invention]
The structured document processing apparatus according to the present invention provides a structured document for a structured document that includes received image data as binary data that has undergone text conversion, and that also includes data relating to communication obtained at the time of reception as original text data. In the data related to communication in the original text data of the document, a keyword is extracted from the address or telephone number of the sender, the name of the sender, the name of the destination, or the description in the subject field, and according to the extracted keyword, the text An extraction unit for determining the type of processing for the converted binary data and a processing unit for executing the determined type of processing are provided (claim 1).
[0005]
The structured document processing apparatus of the present invention includes the received image data as binary data subjected to text conversion, and the structured document with respect to the structured document including the communication-related data obtained at the time of reception as the original text data. And extracting the keyword by recognizing the text-converted binary data and extracting the keyword, and determining the type of processing for the text-converted binary data according to the extracted keyword, and the determined type of processing And a processing means for executing (claim 2).
[0006]
The structured document processing program according to the present invention includes the received image data as binary data subjected to text conversion, and the structured document including the data related to communication obtained at the time of reception as the original text data. In the data related to communication in the original text data of the document, a keyword is extracted from the address or telephone number of the sender, the name of the sender, the name of the destination, or the description in the subject field, and according to the extracted keyword, the text An extraction instruction for determining the type of processing for the converted binary data and a processing instruction for executing the determined type of processing are provided (claim 3).
[0007]
The structured document processing program according to the present invention includes the received image data as binary data subjected to text conversion, and the structured document including the data related to communication obtained at the time of reception as the original text data. Extraction command and processing of the determined type for character recognition of text-converted binary data in a document and extracting a keyword and determining a processing type for the text-converted binary data according to the extracted keyword And a processing instruction for executing the above (Claim 4) .
[0008]
[Operation and effect of the invention]
In the structured document processing apparatus and processing program of the present invention, information for determining the type of processing of text-converted binary data in the structured document is extracted and processed from the structured document itself. Processing of text-converted binary data in a structured document can be automatically performed by defining the structured document itself (claims 1 to 4 ).
[0009]
The processing of binary data that has been converted to text here is output for display on the display, printing, file transfer, linking to the original structured document as a separate file, etc., and determining the type of processing If these output forms are determined based on information, it is possible to automatically determine how to output text-converted binary data.
[0010]
If information for determining the type of processing is extracted from the original text data, the type of processing can be determined as if the original text data was a keyword for determining the type of processing.
[0011]
In addition, when information for determining the type of processing is extracted from the data related to communication at the time of receiving binary data in the original text data, the description of the transmission source, communication means, communication path, and subject column in e-mail the information regarding the communication, such as, can determine the type of processing (claim 1,3).
[0012]
Furthermore character recognition results to such text conversion keywords in the binary data and determines the type of Zui second base processing, it is possible to perform processing according to the characteristic of binary data (claim 2,4).
[0013]
【Example】
1 to 10 show an embodiment. FIG. 1 shows the usage environment of the structured document processing apparatus 12 of the embodiment. 2 is a LAN, 4 is a facsimile server, 6 is a mail server, 8 is a document management server, and 10 is a client terminal. It is. The facsimile server 4 performs transmission / reception of G3 facsimile and the like via a public telephone line network, and also performs Internet facsimile transmission / reception via the mail server 6 and the like. The facsimile server 4 is a multifunction machine incorporating a printer function, a copy function, an image scanner function, and the like in addition to a facsimile machine, and is a server that performs input / output related to images on the LAN 2.
[0014]
The structured document processing apparatus 12 of the embodiment is incorporated in the facsimile server 4, for example, but may be incorporated in the mail server 6, the document management server 8, the client terminal 10, or the like. Instead of incorporating the hardware of the structured document processing apparatus 12 into the facsimile server 4 or the like, the processing program is stored in the facsimile server 4 or the document management server 8 using the storage medium 14 storing the structured document processing program. Or you may memorize | store in the terminal 10 grade | etc.,.
[0015]
FIG. 2 shows the structure of the structured document processing apparatus 12. Reference numeral 20 denotes a structured document input / output means, and an existing one may be used for the facsimile server 4 or the like. Reference numeral 22 denotes an extracting means, from the structured document itself. Extract information for determining the type of processing to be performed on the text-converted binary data. Here, the binary data is image data that passes through the facsimile server 4 or the like , and is converted into text and embedded in the structured document. For simplicity, text-converted image data or binary data in a structured document before processing may be simply referred to as “image data” or “binary data”. When the structured document after processing is simply referred to as “image data” or “binary data”, it means literal image data or binary data, which is in the form of binary data that has not undergone text conversion.
[0016]
The extraction means 22 extracts the characteristics of the structured document itself, for example, keywords included in the original text data. In particular, the extraction means 22 uses the address or telephone number of the facsimile or the name of the sender from the data related to the communication when the image data (binary data in principle at this time) is received by e-mail or facsimile. The name of the destination, the description in the subject field, etc. are extracted as keywords. Here, the original text data means data having a meaning as text. The extraction unit 22 determines the type of processing based on “emergency” or other keywords obtained when the text-converted binary data in the structured document is recognized. Further, the extraction unit 22 may determine the type of processing based on the size of the image data that has been converted into text, the ratio of the data occupied by the image data portion in the structured document, and the like. 23 is a rule table according to a sender number or sender address such as a facsimile, a sender name, a keyword in a subject in a header field, a keyword when character recognition of binary data, or a size or specific gravity of binary data. A rule for determining the type of processing is stored.
[0017]
The processing unit 24 applies the type of processing determined by the extracting unit 22 to the binary data subjected to text conversion. Since the binary data is converted into text data and stored in the structured document, a decoding means 25 is provided for decoding the text data into the original binary data. As processing types, text-converted image data is decoded into the original image data and displayed on the display unit. Similarly, the original image data is decoded and printed from the printer, transferred to a file, and decoded into image data. Often saved as a separate file and linked with the link name or file path. The file allocation means 26 stores the decoded image data as a separate file and embeds the link name and file path for the decoded image data in the original structured document. Note that embedding a link name or embedding a file path is simply linking.
[0018]
In the binary data processing, conversion to a file format that can be displayed by a browser such as JPG, PNG, GIF, reduction / enlargement of data, or color conversion is often performed. These are conversions to binary data such as image data before output such as display and printing. JPG, PNG, and GIF are the types of formats for image data. The conversion means 27 is for performing conversion such as file format conversion, reduction / enlargement, and color conversion on the binary data. The display / printing means 28 displays the structured document or its image data portion on the screen when the processing type is a screen display of image data in the structured document, and the processing type is output. And for printing a structured document or its image data portion. When the structured document is displayed on the screen, it is preferable to display the original text portion and the portion obtained by converting the other binary data into text in separate windows. The processing unit 29 is for performing other processing on the binary data. For example, the processing unit 29 performs character recognition, and performs processing such as transferring the recognized character to the original text portion with an attribute such as <message>. .
[0019]
FIG. 3 shows the structure of the structured document processing program 30. This structured document processing program 30, as shown in FIG. 1, is stored in an appropriate storage medium 14 or a communication line or the like. Via the facsimile server 4 or the like. In FIG. 3, 32 is an input / output subroutine for the structured document, and existing resources may be used for the facsimile server 4 and the like, and 34 is an extraction subroutine for the processing technique. Determine the type of processing for image data. The method for determining the processing is the same as that described with respect to the extracting means 22 in FIG.
[0020]
A process execution subroutine 36 includes a decode subroutine 37, a file allocation subroutine 38, a conversion subroutine 39, a display / print subroutine 40, and a processing subroutine 41. The processing contents in the processing execution subroutine 36 and the decoding subroutine 37 to processing subroutine 41 attached thereto are the same as those described with respect to the processing means 24 to processing means 29 in FIG. 2, and the decoding subroutine 37 is converted into text data. The converted image data is converted to the original binary data. The file allocation subroutine 38 saves the binary-converted image data as a separate file and embeds link information such as a link name and a file password in the structured document. The conversion subroutine 39 converts the file format, performs conversion such as reduction / enlargement, and color conversion. The display / print subroutine 40 performs output such as file display and printing. The processing subroutine 41 performs character recognition on the binary-converted image data. As described above, regarding the structured document processing program 30, the description regarding the structured document processing apparatus 12 is applied as it is.
[0021]
4 to 6 show examples of structured documents and display examples thereof. FIG. 4 shows a structured document before processing by the processing means. For example, the received G3 facsimile data is encoded by MMR, converted to 7 bits by Base64, and described as text-converted image data in the structured document. is there. In addition, the sender's telephone number (TSI), the date and time of reception, the number of pages, the starting position of facsimile data, etc. are described as original text data. On the other hand, for example, the description in the sender column in the header in the case of TSI or Internet facsimile is used as a keyword, and the type of processing is determined by the description in the TSI or sender column.
[0022]
FIG. 5 shows an example of a structured document obtained by decoding the image data in the structured document of FIG. 4 into binary data, converting the format into a JPG file, and linking it as “FILE2782.JPG”. Although not described in the structured document of FIG. 5, displaying the fact that facsimile data has been received on a predetermined terminal may be added as a process. For example, information on communication in the structured document of FIG. FIG. 6 shows an example in which TSI, reception date and time and the number of pages) and link information are displayed. In addition, when the description in the sender column or subject column in the header of TSI or Internet facsimile matches the specified conditions, it will be sent back to the document management server or other destination etc. It may be added to the process.
[0023]
In the structured document of FIG. 5, the image data file is linked by designating the link name, but it may be linked by designating the file path or the like. 7 and 8, it is designated as a file path that binary data is converted into file2782.jpg and stored in the directory work. Here, when the fact that the facsimile data has been received is displayed on a designated terminal, the display is as shown in FIG. 8, for example.
[0024]
FIG. 9 shows how to convert binary data that has been text-converted in a structured document into a JPEG format file, embed the file path in the structured document, and display the image file “file2782.jpg” on the screen or An example described in a structured document so as to perform processing such as output to a printer is shown. FIG. 10 shows a display example corresponding to this, which is displayed on a predetermined client terminal or the like, and information related to communication (TSI, reception date and time, number of pages, reception quality and facsimile reception ID, header column in the case of Internet facsimile) And the received image data itself is displayed.
[0025]
In the embodiment, the structured document is created by the facsimile server 4 or the like and transmitted to the document management server 8 or the terminal 10, but the structured document is created by the terminal 10 or the document management server 8 and the facsimile server. The type of processing may be determined by 4 or the like and executed.
[0026]
In the embodiment, using the data itself in the structured document, the type of processing to the text-converted binary data in the structured document is determined and executed. Therefore, using the structured document itself, it is possible to automatically determine and execute the type of processing such as display, printing, file transfer, decoding into binary data, linking as a separate file and saving.
[Brief description of the drawings]
FIG. 1 is a block diagram showing a use environment of a structured document processing apparatus according to an embodiment. FIG. 2 is a block diagram of a structured document processing apparatus according to the embodiment. FIG. 3 shows a configuration of a structured document processing program according to the embodiment. FIG. 4 is a diagram showing an example of a structured document before processing used in the embodiment. FIG. 5 is a diagram showing an example of a structured document created by processing the structured document of FIG. The image data in the converted document is decrypted after canceling the text conversion, stored as “FILE2782.JPG”, and the link name “FILE2782” is embedded.
6 is a diagram illustrating an example of output of the structured document in FIG. 5, in which an original text portion including link information is displayed on the screen.
7 is a diagram showing an example of a structured document created by processing the structured document of FIG. 4. The image data in the original structured document is decoded, separated into another file, and saved. The path name is embedded.
8 is a diagram showing an example of output of the structured document in FIG. 7. FIG. 9 is a diagram showing an example of a structured document created by processing the structured document in FIG. 4, and an image in the original structured document. The data is saved as separate files, and the original text and image portions are displayed on the screen.
10 is a diagram illustrating an output example of the structured document in FIG. 9; FIG.
[Explanation of symbols]
2 LAN
4 Facsimile server 6 Mail server 8 Document management server 10 Terminal 12 Structured document processing device 14 Storage medium 20 Structured document input / output means 22 Extraction means 23 Rule table 24 Processing means 25 Decoding means 26 File allocation means 27 Conversion means 28 Display / Printing means 29 Processing means 30 Structured document processing program 32 Structured document input / output subroutine 34 Processing technique extraction subroutine 36 Processing execution subroutine 37 Decoding subroutine 38 File allocation subroutine 39 File conversion subroutine 40 Display / printing subroutine 41 Processing subroutine

Claims (4)

受信したイメージデータをテキスト変換されたバイナリデータとして含み、かつ受信時に得られた通信に関するデータを本来のテキストデータとして含む構造化文書に対して、For structured documents that contain the received image data as binary data that has been converted to text, and that contain the data related to communication obtained at the time of reception as the original text data,
該構造化文書の本来のテキストデータ中の通信に関するデータでの、発信元のアドレスや電話番号、発信元の名称、宛先の名称、あるいはサブジェクト欄の記載からキーワードを抽出すると共に、抽出したキーワードに従って、前記テキスト変換されたバイナリデータに対する処理の種類を決定するための、抽出手段と、  The keyword is extracted from the address or telephone number of the sender, the name of the sender, the name of the destination, or the description in the subject column in the data related to the communication in the original text data of the structured document, and according to the extracted keyword Extraction means for determining the type of processing for the text-converted binary data;
決定した種類の処理を実行するための処理手段とを設けた、構造化文書処理装置。  A structured document processing apparatus comprising processing means for executing a determined type of processing.
受信したイメージデータをテキスト変換されたバイナリデータとして含み、受信時に得られた通信に関するデータを本来のテキストデータとして含む構造化文書に対して、For structured documents that contain received image data as binary data that has been converted to text, and that contain data related to communication obtained at the time of reception as original text data,
該構造化文書中のテキスト変換されたバイナリデータを文字認識してキーワードを抽出すると共に、抽出したキーワードに従って前記テキスト変換されたバイナリデータに対する処理の種類を決定するための、抽出手段と、  Extracting means for character-recognizing text-converted binary data in the structured document to extract a keyword, and determining a type of processing for the text-converted binary data according to the extracted keyword;
決定した種類の処理を実行するための処理手段とを設けた、構造化文書処理装置。  A structured document processing apparatus comprising processing means for executing a determined type of processing.
受信したイメージデータをテキスト変換されたバイナリデータとして含み、受信時に得られた通信に関するデータを本来のテキストデータとして含む構造化文書に対して、For structured documents that contain received image data as binary data that has been converted to text, and that contain data related to communication obtained at the time of reception as original text data,
該構造化文書の本来のテキストデータ中の通信に関するデータでの、発信元のアドレスや電話番号、発信元の名称、宛先の名称、あるいはサブジェクト欄の記載からキーワードを抽出すると共に、抽出したキーワードに従って、前記テキスト変換されたバイナリデータに対する処理の種類を決定するための、抽出命令と、  The keyword is extracted from the address or telephone number of the sender, the name of the sender, the name of the destination, or the description in the subject column in the data related to the communication in the original text data of the structured document, and according to the extracted keyword An extraction instruction for determining a type of processing for the text-converted binary data;
決定した種類の処理を実行するための処理命令とを設けた、構造化文書処理プログラム。  A structured document processing program provided with processing instructions for executing a determined type of processing.
受信したイメージデータをテキスト変換されたバイナリデータとして含み、受信時に得られた通信に関するデータを本来のテキストデータとして含む構造化文書に対して、
該構造化文書中のテキスト変換されたバイナリデータを文字認識してキーワードを抽出すると共に、抽出したキーワードに従って前記テキスト変換されたバイナリデータに対する処理の種類を決定するための、抽出命令と、
決定した種類の処理を実行するための処理命令とを設けた、構造化文書処理プログラム
For structured documents that include the received image data as binary data that has been converted to text, and that contain the data related to communication obtained at the time of reception as the original text data,
An extraction instruction for character recognition of the text-converted binary data in the structured document to extract a keyword, and determining a type of processing for the text-converted binary data according to the extracted keyword;
A structured document processing program provided with processing instructions for executing a determined type of processing .
JP2002099651A 2002-04-02 2002-04-02 Structured document processing apparatus and program thereof Expired - Lifetime JP3724729B2 (en)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2002099651A JP3724729B2 (en) 2002-04-02 2002-04-02 Structured document processing apparatus and program thereof
US10/391,914 US20030188265A1 (en) 2002-04-02 2003-03-19 Structured document processing device and recording medium recording structured document processing program
CNB031086209A CN100507900C (en) 2002-04-02 2003-04-02 Structured document processing device and recording medium recording structured document processing program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002099651A JP3724729B2 (en) 2002-04-02 2002-04-02 Structured document processing apparatus and program thereof

Publications (2)

Publication Number Publication Date
JP2003296304A JP2003296304A (en) 2003-10-17
JP3724729B2 true JP3724729B2 (en) 2005-12-07

Family

ID=29388209

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002099651A Expired - Lifetime JP3724729B2 (en) 2002-04-02 2002-04-02 Structured document processing apparatus and program thereof

Country Status (1)

Country Link
JP (1) JP3724729B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7096629B1 (en) * 2021-06-21 2022-07-06 特許業務法人Ipx Information processing equipment, information processing methods and programs

Also Published As

Publication number Publication date
JP2003296304A (en) 2003-10-17

Similar Documents

Publication Publication Date Title
US20050055627A1 (en) System and method for personalizing electronic mail messages
JP4579759B2 (en) Image processing apparatus, image processing method, and computer program
JP2002318535A (en) Information processor, information processing method, information processing system and information processing program
JP5893294B2 (en) Image processing apparatus, control method therefor, and program
JP2006237787A (en) Image processing apparatus
JP3724729B2 (en) Structured document processing apparatus and program thereof
JP5264155B2 (en) Program, file management apparatus and file management method
JP2009027648A (en) Image processing device
US20040010757A1 (en) Method and system to place a scanned document in the body of an email
JP3724730B2 (en) Structured document processing apparatus and processing program
JP3724728B2 (en) Structured document processing device
US20030188265A1 (en) Structured document processing device and recording medium recording structured document processing program
JP2012156860A (en) Image processing system
JP4165482B2 (en) Image display program and image display apparatus
JP2010146123A (en) Document processor, document processing method and program
JP4948144B2 (en) Image processing apparatus, image processing system, image processing method, image processing program, and storage medium
JP4358714B2 (en) Network compatible electronic multifunction devices
JP2007089134A (en) Image processing system, method, and program, and image forming apparatus
JP3682861B2 (en) Facsimile server and its program
JP4182439B2 (en) Internet facsimile machine and program thereof
JP2003289417A (en) Facsimile server
JP3468219B2 (en) Internet facsimile machine
JP4337277B2 (en) Data transmission apparatus, data transmission method, data transmission program, and computer-readable recording medium recording the data transmission program
JP2004140551A (en) Network image communication apparatus
JP2001084188A (en) Information communication equipment

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040421

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040426

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040621

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050902

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050915

R150 Certificate of patent or registration of utility model

Ref document number: 3724729

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110930

Year of fee payment: 6

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110930

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120930

Year of fee payment: 7

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130930

Year of fee payment: 8

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130930

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140930

Year of fee payment: 9

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term