JP2005115543A - Structured document information analysis method, structured document information analysis device, and program for the same - Google Patents
Structured document information analysis method, structured document information analysis device, and program for the same Download PDFInfo
- Publication number
- JP2005115543A JP2005115543A JP2003347127A JP2003347127A JP2005115543A JP 2005115543 A JP2005115543 A JP 2005115543A JP 2003347127 A JP2003347127 A JP 2003347127A JP 2003347127 A JP2003347127 A JP 2003347127A JP 2005115543 A JP2005115543 A JP 2005115543A
- Authority
- JP
- Japan
- Prior art keywords
- page
- document information
- information
- structured document
- output
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Abstract
Description
本発明は、文書情報出力装置が文書情報サーバの保持する構造化文書情報を受信し、文書情報出力装置がその受信した構造化文書情報を出力する際の構造化文書情報解析方法及び構造化文書情報解析装置ならびにそのプログラムに関する。 The present invention relates to a structured document information analysis method and a structured document when a document information output device receives structured document information held by a document information server and the document information output device outputs the received structured document information. The present invention relates to an information analysis apparatus and a program thereof.
従来、端末とサーバが通信ネットワークを介して接続されたシステムにおいて、端末が通信ネットワークを経由してサーバにアクセスし、そのサーバで記憶している文書情報を画面に表示する技術が存在する。ここで、文書情報のデータ量が多い場合には、画面に表示される文書のページが長くなる。しかしながら端末の画面は縦の長さが決まっているので、ページが長い場合などには、端末は画面にスクロールバーを表示し、そして、ユーザのスクロールバーの上下の操作に基づいて、画面外のはみ出したページ部分を徐々に表示している。このような長いページの一部分を画面に表示し、スクロールバーの上下によって画面からはみ出した部分を順次表示させる端末の表示方法においては、ページの中で参照したい部分を画面に表示させるまでユーザはスクロールバーの上下の操作を行なわなければならないという問題や、長いページのどの辺りにユーザの参照したい部分があるのかをいちいち探さなければならないと言った問題があり不便であった。そして、この問題を解決する為の方法として構造化文書を分割して画面に表示する技術が提案されている(例えば、特許文献1参照)。
しかしながら、上述の特許文献1の技術は、構造化文書を分割して、その分割後の構造化文書を画面に表示しているが、端末の画面に表示されるページが画面内に収まらない可能性がある。また端末以外に、プリンターが通信ネットワークを介してサーバからデータ量の多い文書情報を取得しその文書情報を印刷する場合においては、プリンターは1ページに印刷できる文書情報のデータ量を1ページずつ決定する処理を行なわなければばならないので、その分の処理に時間がかかっていた。
そこでこの発明は、上述の端末やプリンターといった文書情報出力装置などにおいて構造化文書情報を1ページ単位で出力することができ、またその1ページ単位の出力の処理負荷を下げることができる、構造化文書情報解析方法及び構造化文書情報解析装置ならびにそのプログラムを提供することを目的としている。
However, although the technique of
Therefore, the present invention can output structured document information in units of one page in a document information output device such as the above-described terminal or printer, and can reduce the processing load of output in units of one page. It is an object of the present invention to provide a document information analysis method, a structured document information analysis apparatus, and a program thereof.
本発明は、上述の課題を解決すべくなされたもので、文書の内容と前記文書の構造の情報とを保持する構造化文書情報と、前記文書情報出力装置の出力する1ページ分のデータ量の情報保持するページ出力仕様情報と前記構造化文書情報とに基づいて作成され、前記構造化文書情報の前記構造における分割位置とページ番号とを対応付けて保持するページ情報とを用いて文書情報出力装置の出力する前記構造化文書情報の1ページ分を解析する構造化文書情報解析装置の構造化文書情報解析方法であって、指定されたページ番号に対応する前記分割位置を前記ページ情報から読み取る分割位置読み取り過程と、前記読み取った分割位置によって分割された前記構造化文書情報の前記文書の内容を前記構造化文書情報の前記1ページ分とする1ページ検出過程と、前記構造化文書情報の1ページ分を出力する1ページ出力過程とを有することを特徴とする構造化文書情報解析方法である。これにより、構造化文書情報解析装置はページ情報を参照すれば、出力するデータの先頭位置と最後位置を前記構造化文書情報の分割位置から即時に検出することができるので処理負荷を軽減でき、また高速にデータを画面に表示することができる。
SUMMARY OF THE INVENTION The present invention has been made to solve the above-described problems. Structured document information that holds document contents and information on the structure of the document, and a data amount for one page that is output from the document information output apparatus. Document information using page information that is generated based on the page output specification information that holds the information and the structured document information, and that holds the division position and the page number in the structure of the structured document information in association with each other A structured document information analyzing method for a structured document information analyzing apparatus for analyzing one page of the structured document information output from an output device, wherein the division position corresponding to a specified page number is determined from the page information. The division position reading process to be read and the content of the document of the structured document information divided by the read division position is set as one page of the
また、本発明は、文書の内容と前記文書の構造の情報とを保持する構造化文書情報と、前記文書情報出力装置の出力する1ページ分のデータ量の情報保持するページ出力仕様情報と前記構造化文書情報とに基づいて作成され、前記構造化文書情報の前記構造における分割位置とページ番号とを対応付けて保持するページ情報とを用いて文書情報出力装置の出力する前記構造化文書情報の1ページ分を解析する構造化文書情報解析装置であって、指定されたページ番号に対応する前記分割位置を前記ページ情報から読み取る分割位置読み取り手段と、前記読み取った分割位置によって分割された前記構造化文書情報の前記文書の内容を前記構造化文書情報の前記1ページ分とする1ページ検出手段と、前記構造化文書情報の1ページ分を出力する1ページ出力手段とを備えることを特徴とする構造化文書情報解析装置である。 The present invention also provides structured document information that holds document contents and information on the structure of the document, page output specification information that holds information on the amount of data for one page output from the document information output device, and The structured document information that is generated based on the structured document information and that is output from the document information output device using page information that associates and holds a division position and a page number in the structure of the structured document information. A structured document information analyzing apparatus for analyzing one page of a divided position reading means for reading the divided position corresponding to a specified page number from the page information, and the divided position divided by the read divided position. One page detecting means for setting the content of the document of the structured document information to the one page of the structured document information, and outputting one page of the structured document information A structured document information analyzing apparatus, characterized in that it comprises a single page output means.
また、本発明は、文書の内容と前記文書の構造の情報とを保持する構造化文書情報と、前記文書情報出力装置の出力する1ページ分のデータ量の情報保持するページ出力仕様情報と前記構造化文書情報とに基づいて作成され、前記構造化文書情報の前記構造における分割位置とページ番号とを対応付けて保持するページ情報とを用いて文書情報出力装置の出力する前記構造化文書情報の1ページ分を解析する構造化文書情報解析装置のコンピュータに実行させるプログラムであって、指定されたページ番号に対応する前記分割位置を前記ページ情報から読み取る分割位置読み取り処理と、前記読み取った分割位置によって分割された前記構造化文書情報の前記文書の内容を前記構造化文書情報の前記1ページ分とする1ページ検出処理と、前記構造化文書情報の1ページ分を出力する1ページ出力処理とをコンピュータに実行させるプログラムである。 Further, the present invention provides structured document information that holds document content and structure information of the document, page output specification information that holds information of a data amount for one page output from the document information output device, and The structured document information that is generated based on the structured document information and that is output from the document information output device using page information that associates and holds a division position and a page number in the structure of the structured document information. A program that is executed by a computer of a structured document information analysis apparatus that analyzes one page of a divided position reading process that reads the division position corresponding to a specified page number from the page information, and the read division A one-page detection process in which the content of the document of the structured document information divided according to the position is the one page of the structured document information; Is a program for executing a one-page output process of outputting one page of the structured document information into the computer.
以下、本発明の一実施形態による文書情報出力システムを図面を参照して説明する。図1は同実施形態における文書情報出力システムの構成を示すブロック図である。この図において、符号1は文書情報サーバである。また2はPCなどの文書情報出力装置(構造化文書情報解析装置)である。文書情報サーバ1と文書情報出力装置2とは通信ネットワークを介して接続されている。そして文書情報サーバ1において、11は文書識別情報と構造化文書情報とを対応付けて記憶する構造化文書情報記憶部である。ここで、文書識別情報は構造化文書情報を特定する為のURL(Uniform Resource Locator)である。また構造化文書情報はHTMLやXHTMLで記述された文書情報であり、出力する文書の内容(要素内容)をタグ(構造の情報)によって表している。
A document information output system according to an embodiment of the present invention will be described below with reference to the drawings. FIG. 1 is a block diagram showing a configuration of a document information output system in the embodiment. In this figure,
また12はインターフェース部であり、文書情報出力装置2からのアクセスに基づいて文書情報出力装置2へ文書選択用のウェブページを送信し、また文書情報出力装置2からページ出力仕様情報とURLを受信する。また13は文書情報読み取り部であり、インターフェース部12の受信したURLに対応する構造化文書情報を構造化文書情報記憶部11より読み取る。また14はページ情報作成部であり、インターフェース部12からページ出力仕様情報を、また文書情報読み取り部13から構造化文書情報を受け付けて、そのページ出力仕様情報と構造化文書情報とに基づいてページ情報を作成する。なおページ出力仕様情報とは、文書情報出力装置2の文書情報出力の1ページ単位のデータ量を決定できる各種情報を格納した情報であり、例えば、文書情報出力装置2がPCであれば、PCの備えたモニタの画面の解像度(モニタの1画面で表示できる画素数)や画面サイズである。また15は送信処理部であり、ページ情報作成部14の作成したページ情報と文書情報読取装置13が構造化文書情報記憶部11から読み取った構造化文書情報とを、文書情報出力装置2に送信する。
An
また文書情報出力装置2において符号21は送受信処理部であり、文書情報サーバ1へのページ出力仕様情報やURLの送信と、文書情報サーバ1からの構造化文書情報やページ情報の受信を行なう。また文書情報出力処理部(分割位置読み取り手段、1ページ検出手段、1ページ出力手段)22は、文書情報サーバ1から受信した構造化文書情報とページ情報とに基づいて構造化文書情報を1ページずつのデータ量で分割して画面に出力する。ここで本発明における1ページのデータ量は、例えば文書情報出力装置2がPCや携帯端末であれば、それらの表示画面に収まるデータ量であり、また文書情報出力装置2がプリンターであれば1枚の紙に出力するデータ量である。
In the document
次に、構造化文書情報について説明する。図2は構造化文書情報を木構造で表した図である。この図のように、構造化文書情報は木構造で表すことができる。そして木構造の節や葉の各ノードは、HTMLやXHTMLなどの構造化文書情報におけるタグに対応するものである。そして文書情報サーバ1のページ情報作成部14は、構造化文書情報によって表される木構造の節や葉のノードに対応する要素内容のデータ量を順次足していき、文書情報出力装置2が出力する1ページ分のデータ量に達した節や葉のノードを、分割位置と決定する。なお、ページ情報作成部14の処理の詳細については後述する。
Next, structured document information will be described. FIG. 2 is a diagram showing structured document information in a tree structure. As shown in this figure, structured document information can be represented by a tree structure. Each node of the tree-structured node or leaf corresponds to a tag in structured document information such as HTML or XHTML. Then, the page
図3は文書情報出力システムの処理フローを示す図である。図3を用いて、文書情報出力システムにおける処理フローを順を追って説明する。
まず、文書情報出力装置2を操作するユーザが、文書情報サーバ1にアクセスする操作を行なうと、文書情報出力装置2は通信ネットワークを介して文書情報サーバ1に文書選択用ウェブページを要求する(ステップS1)。すると文書情報サーバ1のインターフェース部12は、文書選択用のウェブページを文書情報出力装置2に送信する(ステップS2)。そして、文書情報出力装置2の画面に文書選択用のウェブページが表示される。ユーザが文書選択用のウェブページから1つ文書を選択すると文書情報出力装置2の送受信処理部21は、ユーザの選択した文書に対応するURLと、文書情報出力装置2が予め記憶部に記憶しているページ出力仕様情報とを、文書情報サーバ1に送信する(ステップS3)。
FIG. 3 is a diagram showing a processing flow of the document information output system. The processing flow in the document information output system will be described in order with reference to FIG.
First, when a user who operates the document
次に、文書情報サーバ1のインターフェース部12は、文書情報出力装置2から受信したURLを文書情報読み取り部13に通知する。すると文書情報読み取り部13は通知を受けたURLに対応する構造化文書情報を構造化文書情報記憶部11から読み取る(ステップS4)。そして文書情報読み取り部13は、読み取った構造化文書情報をページ情報作成部14と送信処理部15に転送する。次にページ情報作成部14が、ページ出力仕様情報に含まれる文書情報出力装置2の画面サイズと画面の解像度を読み取る(ステップS5)。ここで文書情報出力装置2の画面の解像度が72dpi(dot per inch)、また画面サイズが縦×横=15インチ×15インチであるとする。
Next, the
またページ情報作成部14は、文書情報読み取り部13から受け付けた構造化文書情報の木構造を解析し、その木構造の節や葉に対応する構造化文書情報中のタグに基づいて、当該構造化文書情報中の要素内容を読み取り、データ量を計算する。例えば、ページ情報作成部14が解析した木構造が図2のような木構造であるとすると、ページ情報作成部14はまず、節b1の要素内容、節c1の要素内容、節d1の要素内容、葉e1〜e3の要素内容のデータ量を順に足していく。また葉e3の要素内容のデータ量まで足した後は、節d2の要素内容とその子の要素内容を順次カウントしていく。つまり、画面に表示される要素内容のデータ量をその表示の順番に足していく。そしてページ情報作成部14は、カウントしたデータ量が画面サイズと画面の解像度から得られる画面の1ページのデータ量に達すると、そのデータ量に達した葉や節の直前にカウントした要素内容の葉や根を1ページ目の分割位置として記憶する。
Further, the page
ここで、画面の解像度が72dpi、1文字のフォントサイズが12ポイント、12ポイントの文字が12ドットで表されるとすると、1インチ四方に12ポイントの文字が6文字入る。従ってページ出力仕様情報より画面サイズが15インチ×15インチであるので、文書情報出力装置2の画面には、1350文字表示できる。よって、ページ情報作成部14は、木構造の節や葉に対応するタグの各要素内容に含まれる文字数を順にカウントし、データ量が1350文字を超えた場合には、その1350文字目を要素内容とするタグの節または葉の前の節または葉の木構造における位置を1ページ目の分割位置とする。そして、ページ情報作成部14は1ページ目から順に各ページの分割位置を記録したページ情報を作成する(ステップS6)。
Here, assuming that the screen resolution is 72 dpi, the font size of one character is 12 points, and a 12-point character is represented by 12 dots, six 12-point characters are included in one square. Accordingly, since the screen size is 15 inches × 15 inches from the page output specification information, 1350 characters can be displayed on the screen of the document
図2より、1ページ目の分割位置を/a/b1/c1/d2/e5とする。また2ページ目の分割位置を/a/b1/c2/d5とする。また3ページ目の分割位置を/a/b2/c3/d8とする。また4ページ目の分割位置を/a/b2/c4/d11とする。そしてページ情報作成部14は、作成したページ情報を送信処理部15に転送する。送信処理部15は、文書情報読み取り部13から受け付けた構造化文書情報とページ情報作成部14から受け付けたページ情報とを、通信ネットワークを介して文書情報出力装置2に送信する(ステップS7)。
From FIG. 2, it is assumed that the division position of the first page is / a / b1 / c1 / d2 / e5. Further, the division position of the second page is assumed to be / a / b1 / c2 / d5. The division position of the third page is assumed to be / a / b2 / c3 / d8. The division position of the fourth page is assumed to be / a / b2 / c4 / d11. Then, the page
文書情報出力装置2の送受信処理部21は文書情報サーバ1から構造化文書情報とページ情報とを受信すると、それらを文書情報出力処理部22に転送する。次に文書情報出力処理部22は、ページ情報から1ページ目の分割位置を読み込み、構造化文書情報の最初のデータから/a/b1/c1/d2/e5までの1ページ目のデータを画面に表示する(ステップS8)。次にユーザが2ページ目の出力指示を行なうと、文書情報出力装置2の文書情報出力処理部22は、/a/b1/c1/d2/e5の次のデータである/a/b1からページ情報に記載されている2ページ目の分割位置の/a/b1/c2/d5までで示されるデータを画面に表示する。以降、ユーザがページの指定を行なうごとに、その前のページの分割位置の次のデータからユーザの指定したページの分割位置までで示されるデータを画面に表示していく。なお、前のページの分割位置から次のページの分割位置の木構造におけるノードを走査する方法は、構造化文書情報で表される木構造において行きがけ順で行なわれる。以上の処理により、文書情報出力装置2はユーザからページを指定されると、ページ情報を参照すれば、画面に表示するデータの先頭位置と最後位置を即時に検出することができ、構造化文書情報のうちの1ページ分のデータが分かるので、文書情報出力装置2の処理負荷を軽減でき、また高速に1ページのデータを画面に表示することができる。
When the transmission /
図4はページ情報のデータ構成を示す図である。この図が示すように、ページ情報は各ページの番号とそのページ分割位置とを対応付けて保持している。そして、上述のステップS8の処理において、文書情報出力装置2の文書情報出力処理部22は、ページ情報の分割位置を読み込んで、各ページのデータを把握している。
FIG. 4 shows the data structure of page information. As shown in this figure, the page information holds the number of each page and its page division position in association with each other. In the process of step S8 described above, the document information
なお、本実施形態においては、文書情報サーバ1が構造化文書情報解析装置となり、ページ情報と構造化文書情報を共に文書情報出力装置2に送信しているが、文書情報サーバ1がページ出力仕様情報に基づいて1ページずつ構造化文書のデータを分割する構造化文書情報解析装置の処理を行ない、その分割後の構造化文書を文書情報出力装置2に送信するようにしても良い。この場合、ステップS1〜ステップS6までは同様であり、その後、文書情報サーバ1の送信処理部15がページ情報から1ページ目の分割位置を読み込み、構造化文書情報の最初のデータから/a/b1/c1/d2/e5までのデータを文書情報出力装置2に送信する。そして、文書情報出力装置2が受信したデータを画面に表示する。このようにすれば、文書情報出力装置2はページ情報を参照して、画面に表示する1ページ分のデータの先頭位置と最後位置を検出しなくても、1ページ単位で画面に分割後の構造化文書を表示することができる。
In this embodiment, the
なお上述の文書情報サーバ及び文書情報出力装置は内部に、コンピュータシステムを有している。そして、上述した処理の過程は、プログラムの形式でコンピュータ読み取り可能な記録媒体に記憶されており、このプログラムをコンピュータが読み出して実行することによって、上記処理が行われる。ここでコンピュータ読み取り可能な記録媒体とは、磁気ディスク、光磁気ディスク、CD−ROM、DVD−ROM、半導体メモリ等をいう。また、このコンピュータプログラムを通信回線によってコンピュータに配信し、この配信を受けたコンピュータが当該プログラムを実行するようにしても良い。 The document information server and the document information output apparatus described above have a computer system inside. The process described above is stored in a computer-readable recording medium in the form of a program, and the above process is performed by the computer reading and executing this program. Here, the computer-readable recording medium means a magnetic disk, a magneto-optical disk, a CD-ROM, a DVD-ROM, a semiconductor memory, or the like. Alternatively, the computer program may be distributed to the computer via a communication line, and the computer that has received the distribution may execute the program.
また、図1における処理部の機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより上述の処理を行ってもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータシステム」は、ホームページ提供環境(あるいは表示環境)を備えたWWWシステムも含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ(RAM)のように、一定時間プログラムを保持しているものも含むものとする。 In addition, the program for realizing the function of the processing unit in FIG. 1 is recorded on a computer-readable recording medium, and the program recorded on the recording medium is read into the computer system and executed to execute the above-described processing. You may go. Here, the “computer system” includes an OS and hardware such as peripheral devices. The “computer system” includes a WWW system having a homepage providing environment (or display environment). The “computer-readable recording medium” refers to a storage device such as a flexible medium, a magneto-optical disk, a portable medium such as a ROM and a CD-ROM, and a hard disk incorporated in a computer system. Further, the “computer-readable recording medium” refers to a volatile memory (RAM) in a computer system that becomes a server or a client when a program is transmitted via a network such as the Internet or a communication line such as a telephone line. In addition, those holding programs for a certain period of time are also included.
また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。また、上記プログラムは、前述した機能の一部を実現するためのものであっても良い。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であっても良い。 The program may be transmitted from a computer system storing the program in a storage device or the like to another computer system via a transmission medium or by a transmission wave in the transmission medium. Here, the “transmission medium” for transmitting the program refers to a medium having a function of transmitting information, such as a network (communication network) such as the Internet or a communication line (communication line) such as a telephone line. The program may be for realizing a part of the functions described above. Furthermore, what can implement | achieve the function mentioned above in combination with the program already recorded on the computer system, and what is called a difference file (difference program) may be sufficient.
1・・・文書情報サーバ、2・・・文書情報出力装置、11・・・構造化文書情報記憶部、12・・・インターフェース部、13・・・文書情報読み取り部、14・・・ページ情報作成部、15・・・送信処理部、21・・・送受信処理部、22・・・文書情報出力処理部
DESCRIPTION OF
Claims (3)
文書情報出力装置の出力する1ページ分のデータ量の情報保持するページ出力仕様情報と前記構造化文書情報とに基づいて作成され、前記構造化文書情報の前記構造における分割位置とページ番号とを対応付けて保持するページ情報と、
を用いて前記文書情報出力装置の出力する前記構造化文書情報の1ページ分を解析する構造化文書情報解析装置の構造化文書情報解析方法であって、
指定されたページ番号に対応する前記分割位置を前記ページ情報から読み取る分割位置読み取り過程と、
前記読み取った分割位置によって分割された前記構造化文書情報の前記文書の内容を前記構造化文書情報の前記1ページ分とする1ページ検出過程と、
前記構造化文書情報の1ページ分を出力する1ページ出力過程と、
を有することを特徴とする構造化文書情報解析方法。 Structured document information for holding document contents and information on the structure of the document;
Created based on page output specification information that holds information of the data amount for one page output by the document information output device and the structured document information, and the division position and page number in the structure of the structured document information Page information to be stored in association,
A structured document information analysis method for a structured document information analysis apparatus for analyzing one page of the structured document information output from the document information output apparatus using
A division position reading process for reading the division position corresponding to the specified page number from the page information;
A one-page detection process in which the content of the document of the structured document information divided by the read division position is the one page of the structured document information;
A one-page output process for outputting one page of the structured document information;
A structured document information analysis method characterized by comprising:
文書情報出力装置の出力する1ページ分のデータ量の情報保持するページ出力仕様情報と前記構造化文書情報とに基づいて作成され、前記構造化文書情報の前記構造における分割位置とページ番号とを対応付けて保持するページ情報と、
を用いて前記文書情報出力装置の出力する前記構造化文書情報の1ページ分を解析する構造化文書情報解析装置であって、
指定されたページ番号に対応する前記分割位置を前記ページ情報から読み取る分割位置読み取り手段と、
前記読み取った分割位置によって分割された前記構造化文書情報の前記文書の内容を前記構造化文書情報の前記1ページ分とする1ページ検出手段と、
前記構造化文書情報の1ページ分を出力する1ページ出力手段と、
を備えることを特徴とする構造化文書情報解析装置。 Structured document information for holding document contents and information on the structure of the document;
Created based on page output specification information that holds information of the data amount for one page output by the document information output device and the structured document information, and the division position and page number in the structure of the structured document information Page information to be stored in association,
A structured document information analyzing device for analyzing one page of the structured document information output from the document information output device using
Division position reading means for reading the division position corresponding to the specified page number from the page information;
1-page detecting means for setting the content of the document of the structured document information divided by the read division position to be one page of the structured document information;
One page output means for outputting one page of the structured document information;
A structured document information analysis apparatus comprising:
文書情報出力装置の出力する1ページ分のデータ量の情報保持するページ出力仕様情報と前記構造化文書情報とに基づいて作成され、前記構造化文書情報の前記構造における分割位置とページ番号とを対応付けて保持するページ情報と、
を用いて前記文書情報出力装置の出力する前記構造化文書情報の1ページ分を解析する構造化文書情報解析装置のコンピュータに実行させるプログラムであって、
指定されたページ番号に対応する前記分割位置を前記ページ情報から読み取る分割位置読み取り処理と、
前記読み取った分割位置によって分割された前記構造化文書情報の前記文書の内容を前記構造化文書情報の前記1ページ分とする1ページ検出処理と、
前記構造化文書情報の1ページ分を出力する1ページ出力処理と、
をコンピュータに実行させるプログラム。
Structured document information for holding document contents and information on the structure of the document;
Created based on page output specification information that holds information of the data amount for one page output by the document information output device and the structured document information, and the division position and page number in the structure of the structured document information Page information to be stored in association,
A program to be executed by a computer of a structured document information analysis device that analyzes one page of the structured document information output from the document information output device using
A division position reading process for reading the division position corresponding to the specified page number from the page information;
A one-page detection process in which the content of the document of the structured document information divided by the read division position is the one page of the structured document information;
A one-page output process for outputting one page of the structured document information;
A program that causes a computer to execute.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003347127A JP2005115543A (en) | 2003-10-06 | 2003-10-06 | Structured document information analysis method, structured document information analysis device, and program for the same |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003347127A JP2005115543A (en) | 2003-10-06 | 2003-10-06 | Structured document information analysis method, structured document information analysis device, and program for the same |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005115543A true JP2005115543A (en) | 2005-04-28 |
Family
ID=34539819
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003347127A Withdrawn JP2005115543A (en) | 2003-10-06 | 2003-10-06 | Structured document information analysis method, structured document information analysis device, and program for the same |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2005115543A (en) |
Cited By (41)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007087399A (en) * | 2005-09-22 | 2007-04-05 | Sharp Corp | Method for display adjustment of image generation device |
JP2008234148A (en) * | 2007-03-19 | 2008-10-02 | Ricoh Co Ltd | Document display, document display method, and document display program |
US7969596B2 (en) | 2004-10-08 | 2011-06-28 | Sharp Laboratories Of America, Inc. | Methods and systems for imaging device document translation |
US7970813B2 (en) | 2004-10-08 | 2011-06-28 | Sharp Laboratories Of America, Inc. | Methods and systems for imaging device event notification administration and subscription |
US8001183B2 (en) | 2004-10-08 | 2011-08-16 | Sharp Laboratories Of America, Inc. | Methods and systems for imaging device related event notification |
US8001587B2 (en) | 2004-10-08 | 2011-08-16 | Sharp Laboratories Of America, Inc. | Methods and systems for imaging device credential management |
US8001586B2 (en) | 2004-10-08 | 2011-08-16 | Sharp Laboratories Of America, Inc. | Methods and systems for imaging device credential management and authentication |
US8006176B2 (en) | 2004-10-08 | 2011-08-23 | Sharp Laboratories Of America, Inc. | Methods and systems for imaging-device-based form field management |
US8006293B2 (en) | 2004-10-08 | 2011-08-23 | Sharp Laboratories Of America, Inc. | Methods and systems for imaging device credential acceptance |
US8006292B2 (en) | 2004-10-08 | 2011-08-23 | Sharp Laboratories Of America, Inc. | Methods and systems for imaging device credential submission and consolidation |
US8015234B2 (en) | 2004-10-08 | 2011-09-06 | Sharp Laboratories Of America, Inc. | Methods and systems for administering imaging device notification access control |
US8018610B2 (en) | 2004-10-08 | 2011-09-13 | Sharp Laboratories Of America, Inc. | Methods and systems for imaging device remote application interaction |
US8024792B2 (en) | 2004-10-08 | 2011-09-20 | Sharp Laboratories Of America, Inc. | Methods and systems for imaging device credential submission |
US8023130B2 (en) | 2004-10-08 | 2011-09-20 | Sharp Laboratories Of America, Inc. | Methods and systems for imaging device accounting data maintenance |
US8032579B2 (en) | 2004-10-08 | 2011-10-04 | Sharp Laboratories Of America, Inc. | Methods and systems for obtaining imaging device notification access control |
US8032608B2 (en) | 2004-10-08 | 2011-10-04 | Sharp Laboratories Of America, Inc. | Methods and systems for imaging device notification access control |
US8035831B2 (en) | 2004-10-08 | 2011-10-11 | Sharp Laboratories Of America, Inc. | Methods and systems for imaging device remote form management |
US8051125B2 (en) | 2004-10-08 | 2011-11-01 | Sharp Laboratories Of America, Inc. | Methods and systems for obtaining imaging device event notification subscription |
US8051140B2 (en) | 2004-10-08 | 2011-11-01 | Sharp Laboratories Of America, Inc. | Methods and systems for imaging device control |
US8049677B2 (en) | 2004-10-08 | 2011-11-01 | Sharp Laboratories Of America, Inc. | Methods and systems for imaging device display element localization |
US8060921B2 (en) | 2004-10-08 | 2011-11-15 | Sharp Laboratories Of America, Inc. | Methods and systems for imaging device credential authentication and communication |
US8060930B2 (en) | 2004-10-08 | 2011-11-15 | Sharp Laboratories Of America, Inc. | Methods and systems for imaging device credential receipt and authentication |
US8065384B2 (en) | 2004-10-08 | 2011-11-22 | Sharp Laboratories Of America, Inc. | Methods and systems for imaging device event notification subscription |
US8106922B2 (en) | 2004-10-08 | 2012-01-31 | Sharp Laboratories Of America, Inc. | Methods and systems for imaging device data display |
US8115945B2 (en) | 2004-10-08 | 2012-02-14 | Sharp Laboratories Of America, Inc. | Methods and systems for imaging device job configuration management |
US8115947B2 (en) | 2004-10-08 | 2012-02-14 | Sharp Laboratories Of America, Inc. | Methods and systems for providing remote, descriptor-related data to an imaging device |
US8115946B2 (en) | 2004-10-08 | 2012-02-14 | Sharp Laboratories Of America, Inc. | Methods and sytems for imaging device job definition |
US8115944B2 (en) | 2004-10-08 | 2012-02-14 | Sharp Laboratories Of America, Inc. | Methods and systems for local configuration-based imaging device accounting |
US8120793B2 (en) | 2004-10-08 | 2012-02-21 | Sharp Laboratories Of America, Inc. | Methods and systems for displaying content on an imaging device |
US8120798B2 (en) | 2004-10-08 | 2012-02-21 | Sharp Laboratories Of America, Inc. | Methods and systems for providing access to remote, descriptor-related data at an imaging device |
US8120797B2 (en) | 2004-10-08 | 2012-02-21 | Sharp Laboratories Of America, Inc. | Methods and systems for transmitting content to an imaging device |
US8120799B2 (en) | 2004-10-08 | 2012-02-21 | Sharp Laboratories Of America, Inc. | Methods and systems for accessing remote, descriptor-related data at an imaging device |
US8125666B2 (en) | 2004-10-08 | 2012-02-28 | Sharp Laboratories Of America, Inc. | Methods and systems for imaging device document management |
US8156424B2 (en) | 2004-10-08 | 2012-04-10 | Sharp Laboratories Of America, Inc. | Methods and systems for imaging device dynamic document creation and organization |
US8213034B2 (en) | 2004-10-08 | 2012-07-03 | Sharp Laboratories Of America, Inc. | Methods and systems for providing remote file structure access on an imaging device |
US8237946B2 (en) | 2004-10-08 | 2012-08-07 | Sharp Laboratories Of America, Inc. | Methods and systems for imaging device accounting server redundancy |
US8345272B2 (en) | 2006-09-28 | 2013-01-01 | Sharp Laboratories Of America, Inc. | Methods and systems for third-party control of remote imaging jobs |
US8384925B2 (en) | 2004-10-08 | 2013-02-26 | Sharp Laboratories Of America, Inc. | Methods and systems for imaging device accounting data management |
KR20130034864A (en) * | 2011-09-29 | 2013-04-08 | 엘지전자 주식회사 | Electronic device and control method for electronic device |
US8428484B2 (en) | 2005-03-04 | 2013-04-23 | Sharp Laboratories Of America, Inc. | Methods and systems for peripheral accounting |
CN111191079A (en) * | 2019-12-25 | 2020-05-22 | 中国平安财产保险股份有限公司 | Document content acquisition method, device, equipment and storage medium |
-
2003
- 2003-10-06 JP JP2003347127A patent/JP2005115543A/en not_active Withdrawn
Cited By (44)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8065384B2 (en) | 2004-10-08 | 2011-11-22 | Sharp Laboratories Of America, Inc. | Methods and systems for imaging device event notification subscription |
US7970813B2 (en) | 2004-10-08 | 2011-06-28 | Sharp Laboratories Of America, Inc. | Methods and systems for imaging device event notification administration and subscription |
US7969596B2 (en) | 2004-10-08 | 2011-06-28 | Sharp Laboratories Of America, Inc. | Methods and systems for imaging device document translation |
US8060930B2 (en) | 2004-10-08 | 2011-11-15 | Sharp Laboratories Of America, Inc. | Methods and systems for imaging device credential receipt and authentication |
US8001183B2 (en) | 2004-10-08 | 2011-08-16 | Sharp Laboratories Of America, Inc. | Methods and systems for imaging device related event notification |
US8001587B2 (en) | 2004-10-08 | 2011-08-16 | Sharp Laboratories Of America, Inc. | Methods and systems for imaging device credential management |
US8001586B2 (en) | 2004-10-08 | 2011-08-16 | Sharp Laboratories Of America, Inc. | Methods and systems for imaging device credential management and authentication |
US8006176B2 (en) | 2004-10-08 | 2011-08-23 | Sharp Laboratories Of America, Inc. | Methods and systems for imaging-device-based form field management |
US8006293B2 (en) | 2004-10-08 | 2011-08-23 | Sharp Laboratories Of America, Inc. | Methods and systems for imaging device credential acceptance |
US8006292B2 (en) | 2004-10-08 | 2011-08-23 | Sharp Laboratories Of America, Inc. | Methods and systems for imaging device credential submission and consolidation |
US8060921B2 (en) | 2004-10-08 | 2011-11-15 | Sharp Laboratories Of America, Inc. | Methods and systems for imaging device credential authentication and communication |
US8018610B2 (en) | 2004-10-08 | 2011-09-13 | Sharp Laboratories Of America, Inc. | Methods and systems for imaging device remote application interaction |
US8384925B2 (en) | 2004-10-08 | 2013-02-26 | Sharp Laboratories Of America, Inc. | Methods and systems for imaging device accounting data management |
US8023130B2 (en) | 2004-10-08 | 2011-09-20 | Sharp Laboratories Of America, Inc. | Methods and systems for imaging device accounting data maintenance |
US8032579B2 (en) | 2004-10-08 | 2011-10-04 | Sharp Laboratories Of America, Inc. | Methods and systems for obtaining imaging device notification access control |
US8032608B2 (en) | 2004-10-08 | 2011-10-04 | Sharp Laboratories Of America, Inc. | Methods and systems for imaging device notification access control |
US8035831B2 (en) | 2004-10-08 | 2011-10-11 | Sharp Laboratories Of America, Inc. | Methods and systems for imaging device remote form management |
US8051125B2 (en) | 2004-10-08 | 2011-11-01 | Sharp Laboratories Of America, Inc. | Methods and systems for obtaining imaging device event notification subscription |
US8051140B2 (en) | 2004-10-08 | 2011-11-01 | Sharp Laboratories Of America, Inc. | Methods and systems for imaging device control |
US8049677B2 (en) | 2004-10-08 | 2011-11-01 | Sharp Laboratories Of America, Inc. | Methods and systems for imaging device display element localization |
US8015234B2 (en) | 2004-10-08 | 2011-09-06 | Sharp Laboratories Of America, Inc. | Methods and systems for administering imaging device notification access control |
US8270003B2 (en) | 2004-10-08 | 2012-09-18 | Sharp Laboratories Of America, Inc. | Methods and systems for integrating imaging device display content |
US8024792B2 (en) | 2004-10-08 | 2011-09-20 | Sharp Laboratories Of America, Inc. | Methods and systems for imaging device credential submission |
US8106922B2 (en) | 2004-10-08 | 2012-01-31 | Sharp Laboratories Of America, Inc. | Methods and systems for imaging device data display |
US8115945B2 (en) | 2004-10-08 | 2012-02-14 | Sharp Laboratories Of America, Inc. | Methods and systems for imaging device job configuration management |
US8115947B2 (en) | 2004-10-08 | 2012-02-14 | Sharp Laboratories Of America, Inc. | Methods and systems for providing remote, descriptor-related data to an imaging device |
US8115946B2 (en) | 2004-10-08 | 2012-02-14 | Sharp Laboratories Of America, Inc. | Methods and sytems for imaging device job definition |
US8115944B2 (en) | 2004-10-08 | 2012-02-14 | Sharp Laboratories Of America, Inc. | Methods and systems for local configuration-based imaging device accounting |
US8120793B2 (en) | 2004-10-08 | 2012-02-21 | Sharp Laboratories Of America, Inc. | Methods and systems for displaying content on an imaging device |
US8120798B2 (en) | 2004-10-08 | 2012-02-21 | Sharp Laboratories Of America, Inc. | Methods and systems for providing access to remote, descriptor-related data at an imaging device |
US8120797B2 (en) | 2004-10-08 | 2012-02-21 | Sharp Laboratories Of America, Inc. | Methods and systems for transmitting content to an imaging device |
US8120799B2 (en) | 2004-10-08 | 2012-02-21 | Sharp Laboratories Of America, Inc. | Methods and systems for accessing remote, descriptor-related data at an imaging device |
US8125666B2 (en) | 2004-10-08 | 2012-02-28 | Sharp Laboratories Of America, Inc. | Methods and systems for imaging device document management |
US8156424B2 (en) | 2004-10-08 | 2012-04-10 | Sharp Laboratories Of America, Inc. | Methods and systems for imaging device dynamic document creation and organization |
US8201077B2 (en) | 2004-10-08 | 2012-06-12 | Sharp Laboratories Of America, Inc. | Methods and systems for imaging device form generation and form field data management |
US8213034B2 (en) | 2004-10-08 | 2012-07-03 | Sharp Laboratories Of America, Inc. | Methods and systems for providing remote file structure access on an imaging device |
US8237946B2 (en) | 2004-10-08 | 2012-08-07 | Sharp Laboratories Of America, Inc. | Methods and systems for imaging device accounting server redundancy |
US8428484B2 (en) | 2005-03-04 | 2013-04-23 | Sharp Laboratories Of America, Inc. | Methods and systems for peripheral accounting |
JP2007087399A (en) * | 2005-09-22 | 2007-04-05 | Sharp Corp | Method for display adjustment of image generation device |
US8345272B2 (en) | 2006-09-28 | 2013-01-01 | Sharp Laboratories Of America, Inc. | Methods and systems for third-party control of remote imaging jobs |
JP2008234148A (en) * | 2007-03-19 | 2008-10-02 | Ricoh Co Ltd | Document display, document display method, and document display program |
KR20130034864A (en) * | 2011-09-29 | 2013-04-08 | 엘지전자 주식회사 | Electronic device and control method for electronic device |
KR101900093B1 (en) * | 2011-09-29 | 2018-09-18 | 엘지전자 주식회사 | Electronic device and control method for electronic device |
CN111191079A (en) * | 2019-12-25 | 2020-05-22 | 中国平安财产保险股份有限公司 | Document content acquisition method, device, equipment and storage medium |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2005115543A (en) | Structured document information analysis method, structured document information analysis device, and program for the same | |
JP4290011B2 (en) | Viewer device, control method therefor, and program | |
US5897644A (en) | Methods and apparatus for fixed canvas presentations detecting canvas specifications including aspect ratio specifications within HTML data streams | |
US7565605B2 (en) | Reorganizing content of an electronic document | |
US6351317B1 (en) | Printing system using communication network | |
JP4248411B2 (en) | Method, system, computer program and storage device for displaying a document | |
US7240281B2 (en) | System, method and program for printing an electronic document | |
JP2008176820A (en) | System and method for content delivery over wireless communication medium to portable computing device | |
US20190073342A1 (en) | Presentation of electronic information | |
JP5327246B2 (en) | Image processing program | |
CN110837347A (en) | Webpage printing method based on analysis plug-in, server and storage medium | |
JP2008158589A (en) | Updated information notification device, and updated information notification program | |
US7275206B1 (en) | Method and computer program product for identifying hypertext links in document printouts | |
US8127219B1 (en) | Printing and rendering hyperlink destinations | |
US20020107894A1 (en) | Method and apparatus for selectively inserting formatting commands into web pages | |
US9019552B2 (en) | Information processing apparatus, system and method for outputting data to a medium | |
JP4691071B2 (en) | Page action activation device, page action activation control method, and page action activation control program | |
BRPI1107156A2 (en) | information processing apparatus and method | |
JP2011028779A (en) | Portable terminal, method and program for controlling portable terminal | |
US20060242571A1 (en) | Systems and methods for processing derivative featurees in input files | |
JP2005115542A (en) | Document information output system and document information output method | |
JP4411922B2 (en) | Structured document display processing apparatus, structured document display processing method, structured document display processing program | |
JP2908425B1 (en) | Marking / redisplay method for homepages using frames | |
JP2001243151A (en) | Browser system and recording medium | |
JP4637557B2 (en) | Mobile terminal, mobile terminal control method and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20070109 |