JP2005115702A - Document display device, program, and method for displaying document - Google Patents

Document display device, program, and method for displaying document Download PDF

Info

Publication number
JP2005115702A
JP2005115702A JP2003350062A JP2003350062A JP2005115702A JP 2005115702 A JP2005115702 A JP 2005115702A JP 2003350062 A JP2003350062 A JP 2003350062A JP 2003350062 A JP2003350062 A JP 2003350062A JP 2005115702 A JP2005115702 A JP 2005115702A
Authority
JP
Japan
Prior art keywords
page
document
change
change amount
layout
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003350062A
Other languages
Japanese (ja)
Other versions
JP2005115702A5 (en
Inventor
Masahiro Kato
雅弘 加藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2003350062A priority Critical patent/JP2005115702A/en
Publication of JP2005115702A publication Critical patent/JP2005115702A/en
Publication of JP2005115702A5 publication Critical patent/JP2005115702A5/ja
Pending legal-status Critical Current

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To extract and display information for a general understanding of the content of an electronic document. <P>SOLUTION: For each page of a document consisting of a plurality of pages, a structure data creation means 24 obtains layout information showing the layout of components that constitute each page, to create structure data showing a hierarchial structure on the layout between areas occupied by the components on each page. Next, a variation calculating means 25 calculates a variation showing the degree of variation in the hierarchial structure between a page of interest and a page in front of the page of interest in ascending or descending order of the pages. The variation calculated by the variation calculating means 25 is compared with a preset threshold, and if the variation is equal to or greater than the threshold, a display means 27 displays the page of interest. <P>COPYRIGHT: (C)2005,JPO&NCIPI

Description

本発明は、ユーザが所望する情報を電子文書から抽出して表示する技術に関する。   The present invention relates to a technique for extracting and displaying information desired by a user from an electronic document.

文書の縮小イメージをパーソナルコンピュータのディスプレイ上にページ順に並べて表示するプレビュー機能を有する文書エディタが供給されている。このプレビュー機能は、電子文書の内容を概略的に把握することを目的としたものである。ところが、縮小イメージを多数並べて表示させた場合、文書全体のレイアウトを確認ことはできるが、各ページに記載された文字を判読することは困難である。一方、文字を判読するために表示の倍率を上げると、表示されるページ数が少なくなるため、文書全体を見終わるまで画面をスクロールする手間がかかる。また、携帯情報端末のように表示画面の面積が小さい場合や文書のページ数が多い場合には、多数回のスクロール操作あるいはページ送りが必要となるため、作業効率が低くなる。   A document editor having a preview function for displaying a reduced image of a document in a page order on a personal computer display is provided. The preview function is intended to roughly grasp the contents of the electronic document. However, when a large number of reduced images are displayed side by side, the layout of the entire document can be confirmed, but it is difficult to read the characters written on each page. On the other hand, if the display magnification is increased in order to interpret the characters, the number of pages to be displayed is reduced, and it takes time to scroll the screen until the entire document is viewed. Further, when the area of the display screen is small or the number of pages of a document is large as in the case of a portable information terminal, a large number of scroll operations or page feeds are required, so that work efficiency is lowered.

ところで、電子文書の内容を概略的に把握することを目的として種々の技術が提案されている(例えば、特許文献1)。特許文献1に記載の技術では、情報量の削減度合いを表す「外観度」という指標を導入し、ユーザが最適と判断した外観度を設定することにより、電子文書の内容の概略的把握に寄与する情報のみを表示させる。ここでは、文書の特徴を表す情報は、通常と異なるサイズやフォントの文字を用いて記載されているという前提に立ち、例えば、全角文字と倍角文字が混在する文書では倍角文字はそのまま表示し、全角文字についてはその外接矩形のみを表示させる。あるいは、下線などの文字修飾を削除して表示する。これによって、表示を高速化するとともに、概略的把握に寄与する情報のみがユーザに提供されるため、ユーザの負担を軽減することができるとしている。
特開平8−221444号公報
By the way, various techniques have been proposed for the purpose of roughly grasping the contents of an electronic document (for example, Patent Document 1). In the technique described in Patent Document 1, an index called “appearance degree” indicating the degree of information reduction is introduced, and the appearance degree determined by the user to be optimal is set, thereby contributing to a rough grasp of the contents of the electronic document. Only the information to be displayed is displayed. Here, based on the premise that information representing the characteristics of the document is described using characters of a size or font different from normal, for example, in a document in which full-width characters and double-width characters are mixed, double-width characters are displayed as they are, For full-width characters, only the circumscribed rectangle is displayed. Alternatively, the character modification such as underline is deleted and displayed. This speeds up the display and provides only the information that contributes to the general grasp to the user, thereby reducing the burden on the user.
JP-A-8-212444

しかしながら、特許文献1に記載の技術は、通常と異なるサイズやフォントで記載されている文字の有無に関わらず、全ページを表示するから、作業効率の大幅な向上にはつながらない。また、文字を表示するか否かの判定基準が文字の特徴に限定されているため、ユーザはこれらに限定された情報しか得ることができない。
本発明は、上述した背景のもとになされたものであり、電子文書の内容の概略的把握のための情報を抽出し、その情報を表示させることができる技術の提供を目的とする。
However, since the technique described in Patent Document 1 displays all pages regardless of the presence or absence of characters described in a different size or font, it does not lead to a significant improvement in work efficiency. In addition, since the criterion for determining whether or not to display characters is limited to the characteristics of the characters, the user can obtain only information limited thereto.
The present invention has been made based on the above-described background, and an object thereof is to provide a technique capable of extracting information for roughly grasping the contents of an electronic document and displaying the information.

上述の課題を解決するために、本発明は、複数のページからなる文書のページの各々について、当該ページを構成する構成要素のレイアウトを表すレイアウト情報を取得し、当該ページにおいて各構成要素の占める領域間のレイアウト上の階層構造を表す構造データを生成する構造データ生成手段と、注目ページと、ページの昇順または降順における該注目ページの1つ手前のページとの、前記階層構造の変化の度合いを表す変化量を算出する変化量算出手段と、前記変化量算出手段により求められた変化量と予め定められた閾値とを比較し、該変化量が該閾値以上である場合に当該注目ページを表示する表示手段とを有する文書表示装置を提供する。   In order to solve the above-described problem, the present invention acquires, for each page of a document composed of a plurality of pages, layout information representing the layout of the constituent elements constituting the page, and each constituent element occupies the page. The degree of change in the hierarchical structure between the structural data generating means for generating the structural data representing the hierarchical structure on the layout between the areas, the target page, and the page immediately before the target page in the ascending or descending order of the page The change amount calculating means for calculating the change amount representing the change amount and the change amount obtained by the change amount calculating means are compared with a predetermined threshold value, and when the change amount is equal to or greater than the threshold value, Provided is a document display device having display means for displaying.

また、本発明は、コンピュータ装置を、複数のページからなる文書のページの各々について、当該ページを構成する構成要素のレイアウトを表すレイアウト情報を取得し、当該ページにおいて各構成要素の占める領域間のレイアウト上の階層構造を表す構造データを生成する構造データ生成手段と、注目ページと、ページの昇順または降順における該注目ページの1つ手前のページとの、前記階層構造の変化の度合いを表す変化量を算出する変化量算出手段と、前記変化量算出手段により求められた変化量と予め定められた閾値とを比較し、該変化量が該閾値以上である場合に当該注目ページを表示する表示手段として機能させるためのプログラムを提供する。   Further, according to the present invention, the computer apparatus obtains layout information representing the layout of the constituent elements constituting the page for each page of the document including a plurality of pages, and between the areas occupied by the constituent elements in the page. A change that represents the degree of change in the hierarchical structure between the structural data generating means for generating the structural data representing the hierarchical structure on the layout, the page of interest, and the page immediately before the page of interest in the ascending or descending order of the page A change amount calculating means for calculating an amount, a display for comparing the amount of change obtained by the change amount calculating means with a predetermined threshold and displaying the page of interest when the amount of change is equal to or greater than the threshold A program for functioning as a means is provided.

また、本発明は、複数のページからなる文書のページの各々について、当該ページを構成する構成要素のレイアウトを表すレイアウト情報を取得し、当該ページにおいて各構成要素の占める領域間のレイアウト上の階層構造を表す構造データを生成する構造データ生成ステップと、注目ページと、ページの昇順または降順における該注目ページの1つ手前のページとの、前記階層構造の変化の度合いを表す変化量を算出する変化量算出ステップと、前記変化量算出手段により求められた変化量と予め定められた閾値とを比較し、該変化量が該閾値以上である場合に当該注目ページを表示する表示ステップとを有する文書表示方法を提供する。   Further, the present invention acquires layout information representing the layout of the constituent elements constituting the page for each page of a document composed of a plurality of pages, and the layout hierarchy between the regions occupied by the constituent elements on the page. A structure data generation step for generating structure data representing a structure, a change amount indicating a degree of change in the hierarchical structure between the page of interest and a page immediately before the page of interest in the ascending or descending order of the page. A change amount calculating step; and a display step of comparing the change amount obtained by the change amount calculating means with a predetermined threshold value and displaying the page of interest when the change amount is equal to or greater than the threshold value. Provide a document display method.

本発明によれば、構造データ生成手段が、複数のページからなる文書のページの各々について、当該ページを構成する構成要素のレイアウトを表すレイアウト情報を取得し、当該ページにおいて各構成要素の占める領域間のレイアウト上の階層構造を表す構造データを生成する。次に、変化量算出手段が、注目ページと、ページの昇順または降順における該注目ページの1つ手前のページとの、前記階層構造の変化の度合いを表す変化量を算出する。そして、表示手段が、前記変化量算出手段により求められた変化量と予め定められた閾値とを比較し、該変化量が該閾値以上である場合に当該注目ページを表示する。   According to the present invention, for each page of a document composed of a plurality of pages, the structure data generation unit obtains layout information representing the layout of the constituent elements constituting the page, and the area occupied by the constituent elements in the page Generate structure data that represents the hierarchical structure of the layout. Next, the change amount calculation means calculates a change amount indicating the degree of change in the hierarchical structure between the page of interest and the page immediately before the page of interest in the ascending or descending order of the page. Then, the display unit compares the change amount obtained by the change amount calculation unit with a predetermined threshold value, and displays the page of interest when the change amount is equal to or greater than the threshold value.

本発明によれば、電子文書の内容の概略的把握のための情報を抽出し、その情報を表示させることができる。   According to the present invention, it is possible to extract information for roughly grasping the contents of an electronic document and display the information.

人間が未知の文書を手にして、その文書に何が書かれているのかを概略的に知りたいとき、多くの場合、手早くページをめくって視覚的に特徴のあるページが現れたときにそのページに目を留める。視覚的に特徴のあるページとしては、例えば、目次、章・節・項の見出し、図表を含んだページが挙げられる。ところが、たとえそのようなページであっても、何ページにもわたって同一のレイアウトのページが続くと、人間はこれには目を留めずにページをめくっていく。つまり、人間が目を留めるのは、それ以前のページに対してレイアウトが変化したページである。
本発明は、複数ページからなる文書のページ間のレイアウトの変化を定量化し、手前のページに対するレイアウトの変化量が大きなページを抽出して表示させるための装置を提供するものである。
When a human takes an unknown document and wants to know roughly what is written in the document, it is often the case when a page with visual features appears quickly by turning the page quickly Keep an eye on the page. Examples of visually distinctive pages include pages that include a table of contents, chapter / section / section headings, and charts. However, even if it is such a page, if the page of the same layout continues over many pages, a human will turn a page without paying attention to this. In other words, human beings will notice a page whose layout has changed from the previous page.
The present invention provides an apparatus for quantifying a layout change between pages of a document composed of a plurality of pages, and extracting and displaying a page having a large layout change amount with respect to the previous page.

[構成]
図1は、文書表示装置10のハードウェア構成を示す図である。ROM(Read Only Memory)102には、プログラム10Pが書き込まれている。CPU(Central Processing Unit)101は、文書表示装置10に電源(図示省略)が投入されると、ROM102に書き込まれているプログラム10Pを読み出し、RAM(Random Access Memory)103をワークエリアとしてプログラム10Pを実行する。CPU101がプログラム10Pを実行することによって、文書表示装置10には、図11に示すモジュール群が仮想的に形成される。なお、外部の装置にプログラム10Pを記憶させておき、ネットワーク113を介してプログラム10PをダウンロードしてROM102に記憶させることとしてもよい。
[Constitution]
FIG. 1 is a diagram illustrating a hardware configuration of the document display device 10. A program 10P is written in a ROM (Read Only Memory) 102. When a power (not shown) is turned on to the document display device 10, a CPU (Central Processing Unit) 101 reads a program 10P written in the ROM 102, and uses the RAM (Random Access Memory) 103 as a work area to store the program 10P. Execute. When the CPU 101 executes the program 10P, the module group shown in FIG. 11 is virtually formed in the document display device 10. The program 10P may be stored in an external device, and the program 10P may be downloaded via the network 113 and stored in the ROM 102.

文書蓄積部117は、文書データあるいは文書の画像を表す画像データを蓄積するハードディスクドライブである。文書処理部118はCPU101による制御の下で、文書蓄積部117に蓄積されている文書データあるいは画像データを読み出し、各種の処理を行う。CPU101、ROM102,RAM103、文書蓄積部117および文書処理部118はバス115に接続されている。
表示部105は、CRT(Cathode Ray Tube)あるいは液晶パネルである。操作部107は、ポインティングデバイス(マウスあるいはデジタイザ)およびキーボードである。スキャナ109は、原稿を光学的に読み取り、画像信号を出力する。プリンタ111は、電子写真方式あるいはインクジェット方式のプリンタである。表示部105、操作部107、スキャナ109およびプリンタ111はそれぞれインターフェイス106、108、110、112を介してバス116に接続されており、バス115とバス116とはバスブリッジ104によって接続されている。バス116は、インターフェイス114を介してネットワーク113に接続されており、文書表示装置10と外部の装置との通信を仲介する。
The document storage unit 117 is a hard disk drive that stores document data or image data representing an image of a document. The document processing unit 118 reads out document data or image data stored in the document storage unit 117 under the control of the CPU 101, and performs various processes. The CPU 101, ROM 102, RAM 103, document storage unit 117, and document processing unit 118 are connected to the bus 115.
The display unit 105 is a CRT (Cathode Ray Tube) or a liquid crystal panel. The operation unit 107 is a pointing device (mouse or digitizer) and a keyboard. The scanner 109 optically reads a document and outputs an image signal. The printer 111 is an electrophotographic printer or an inkjet printer. The display unit 105, the operation unit 107, the scanner 109, and the printer 111 are connected to the bus 116 via the interfaces 106, 108, 110, and 112, respectively. The bus 115 and the bus 116 are connected by the bus bridge 104. The bus 116 is connected to the network 113 via the interface 114, and mediates communication between the document display device 10 and an external device.

次に、CPU101がプログラム10Pを実行することによって文書表示装置10に仮想的に形成されるモジュール群について、図11を用いて説明する。
文書取得手段21は、文書のレイアウト情報を内包した文書データまたは文書の画像を表す画像データを取得する手段である。ここで文書データとは、ワードプロセッサ等のアプリケーションプログラムを用いて作成された文書データ、あるいは、ページ記述言語で記述された文書データを指す。これらの文書データには文字情報の他、図形の画像を表す情報、表の罫線を表す情報、および各ページ内におけるそれらのレイアウトを表す情報が内包されている。文書の画像を表す画像データとは、スキャナ109等の画像入力装置を用いて文書を走査することによって生成された画像データである。文書データおよび画像データは、予め文書蓄積部117に格納されていてもよいし、外部の装置からネットワーク113を介して文書表示装置10が受信することとしてもよい。
Next, a module group virtually formed in the document display device 10 when the CPU 101 executes the program 10P will be described with reference to FIG.
The document acquisition unit 21 is a unit that acquires document data including document layout information or image data representing an image of a document. Here, the document data refers to document data created using an application program such as a word processor, or document data described in a page description language. In addition to character information, these document data include information representing graphic images, information representing ruled lines of the table, and information representing their layout within each page. The image data representing the image of the document is image data generated by scanning the document using an image input device such as the scanner 109. The document data and the image data may be stored in the document storage unit 117 in advance, or may be received by the document display device 10 via the network 113 from an external device.

第1の取得手段22は、文書の各ページを構成する構成要素のレイアウトを表すレイアウト情報を文書データから抽出する手段である。構成要素とは、文章、図、表などである。本実施形態においては、文章が空間的に連続している領域を文章領域と呼ぶ。また、図によって占められる領域を図領域、表によって占められる領域を表領域と呼ぶ。
第2の取得手段23は、画像データにより表される文書の画像を解析することによって当該文書のレイアウト情報を取得する手段である。画像データは、文書をスキャナ109で走査して得られた画素値によって構成されており、文書データが内包しているようなレイアウト情報を有していない。そのため、第2の取得手段23では、既知のレイアウト解析技術を用いて、当該画像で表される文書のレイアウト情報を得る。レイアウト解析は、例えば特開2000−90194号公報に記載されている技術を用いて行う。この技術では、文書画像に含まれる文章が縦書きか横書きかを判定し、その判定結果によって文書を分割する境界を設定する。また、文書画像を構成する画素の投影分布を算出し、所定のしきい値に満たない頻度の区間を用いて分割境界を設定する。
第1の取得手段22はこのようにして文書のレイアウト情報を取得し、各ページを文章領域、図領域および表領域の集合として認識する。
The first acquisition means 22 is means for extracting layout information representing the layout of the constituent elements constituting each page of the document from the document data. A component is a sentence, a figure, a table, or the like. In the present embodiment, an area in which sentences are spatially continuous is referred to as a sentence area. An area occupied by the figure is called a figure area, and an area occupied by the table is called a table area.
The second acquisition unit 23 is a unit that acquires the layout information of the document by analyzing the image of the document represented by the image data. The image data is composed of pixel values obtained by scanning the document with the scanner 109, and does not have layout information that the document data contains. Therefore, the second acquisition unit 23 obtains the layout information of the document represented by the image using a known layout analysis technique. The layout analysis is performed using a technique described in, for example, Japanese Patent Laid-Open No. 2000-90194. In this technique, it is determined whether a sentence included in a document image is vertical writing or horizontal writing, and a boundary for dividing the document is set according to the determination result. Further, the projection distribution of the pixels constituting the document image is calculated, and the division boundary is set using a section having a frequency that does not satisfy a predetermined threshold.
In this way, the first acquisition unit 22 acquires the layout information of the document, and recognizes each page as a set of a text area, a figure area, and a table area.

構造データ生成手段24は、複数のページからなる文書のページの各々について、当該ページを構成する構成要素のレイアウトを表すレイアウト情報を取得し、当該ページにおいて各構成要素の占める領域間のレイアウト上の階層構造を表す構造データを生成する手段である。ここで、構造データ生成手段24は、文書取得手段21により文書データが取得された場合には第1の取得手段22を用いてレイアウト情報を取得する。一方、文書取得手段21により画像データが取得された場合には第2の取得手段23を用いてレイアウト情報を取得する。図5に示すように、本実施形態における構造データは、ページの各々を根とする木構造を有する。   The structure data generation unit 24 obtains layout information representing the layout of the constituent elements constituting the page for each page of the document composed of a plurality of pages, and on the layout between the regions occupied by the constituent elements on the page. This is means for generating structure data representing a hierarchical structure. Here, when the document data is acquired by the document acquisition unit 21, the structure data generation unit 24 acquires the layout information using the first acquisition unit 22. On the other hand, when image data is acquired by the document acquisition unit 21, layout information is acquired using the second acquisition unit 23. As shown in FIG. 5, the structure data in the present embodiment has a tree structure with each page as a root.

変化量算出手段25は、注目ページとその1つ手前のページとの階層構造の変化の度合いを表す変化量を算出する手段である。変化量は、ページの昇順と降順の両方向で算出する
変化量記憶手段26は、変化量算出手段25により求められた変化量を注目ページと対応付けて記憶する手段である。
表示手段27は、注目ページの変化量と予め定められた閾値とを比較し、変化量が閾値以上である場合には注目ページを表示する手段である。ここで、表示手段27は、変化量記憶手段26によって記憶されている変化量が閾値以上であるページを抽出し、抽出されたページの画像をページの昇順または降順で表示する。
構造データ生成手段24、変化量算出手段25、変化量記憶手段26および表示手段27によって行われる処理については、動作の説明において詳述する。
The change amount calculating means 25 is a means for calculating a change amount indicating the degree of change in the hierarchical structure between the page of interest and the previous page. The change amount is calculated in both the ascending and descending order of the page. The change amount storage unit 26 is a unit that stores the change amount obtained by the change amount calculating unit 25 in association with the page of interest.
The display unit 27 is a unit that compares the amount of change of the page of interest with a predetermined threshold, and displays the page of interest when the amount of change is greater than or equal to the threshold. Here, the display unit 27 extracts pages whose change amount stored in the change amount storage unit 26 is equal to or greater than the threshold value, and displays the images of the extracted pages in the ascending or descending order of the pages.
The processing performed by the structure data generation unit 24, the change amount calculation unit 25, the change amount storage unit 26, and the display unit 27 will be described in detail in the description of the operation.

[動作]
上記の構成からなる文書表示装置10の動作について説明する。ただし、文書表示装置10は、ハードウェアがソフトウェアを用いることによって動作する装置であるから、これ以降の説明においては、動作の主体を、仮想的に形成されるモジュールではなく、ハードウェアとする。
ここで、文書の例について説明する。図4は、文書表示装置10による処理の対象とする文書の例を示す図である。この例は、横書き2段組を基本とする書式に従って作成された文書(例えば、論文)の例である。
[Operation]
The operation of the document display device 10 having the above configuration will be described. However, since the document display device 10 is a device that operates by using software as hardware, in the following description, the subject of operation is hardware, not a virtually formed module.
Here, an example of a document will be described. FIG. 4 is a diagram illustrating an example of a document to be processed by the document display device 10. This example is an example of a document (for example, a paper) created in accordance with a format based on horizontal writing two columns.

1ページ目と2ページ目とでは文書のレイアウトが異なることがわかる。1ページ目では、まず先頭に大きな文字サイズで題目が1行記載されており、その下に抄録が6行記載されている。さらにその下には、本文が2段組で左右の各段に13行記載されている。2ページ目では、1ページ目の本文と同様に2段組で記載されており、同様のレイアウトのページがL−2ページ目まで続く。L−1ページ目では、ページ上方にグラフが挿入されている。Lページ目では、2ページ目と同様のレイアウトとなり、このレイアウトのページがM−3ページ目まで続く。M−2ページ目では、右の段の下部にクルマの図が挿入され、M−1ページ目では、ページ全体に表が記載されている。Mページ目では2ページ目と同様のレイアウトとなり、このレイアウトがN−1ページ目まで続く。そして、Nページ目では、右の段に著者の顔写真と紹介記事が記載されている。   It can be seen that the layout of the document is different between the first page and the second page. In the first page, first, one line of the title is written at the top with a large character size, and there are six lines of abstracts below. Below that, the main text is written in two columns and 13 lines on each of the left and right columns. The second page is described in two columns as in the case of the first page, and pages with the same layout continue to the L-2 page. In the (L-1) th page, a graph is inserted above the page. The L-th page has the same layout as the second page, and this layout page continues to the M-3th page. On the M-2 page, a car figure is inserted at the bottom of the right column, and on the M-1 page, a table is written on the entire page. The M page has the same layout as the second page, and this layout continues to the (N-1) th page. On the Nth page, the photograph of the author's face and an introductory article are written on the right side.

図2は、CPU101がプログラム10Pを実行することによって行われる処理のフローを示す図である。ここでは、文書表示装置10には電源が投入されており、CPU101によってプログラム10Pが実行されているものとする。
まず、ユーザが操作部107を操作することにより、文書表示装置10に表示させる文書(文書データまたは画像データ)を指定するための指示が入力される(ステップS01)。ここで指定される文書は、予め文書蓄積部117に格納されている文書でもよいし、外部の装置に格納されている文書をネットワーク113経由で受信してもよい。次に、CPU101は、ユーザにより指定された文書を文書蓄積部117から読み出し、あるいは、外部の装置からネットワーク113経由で受信し、そのデータをRAM103上に展開する(ステップS02)、そして、この文書について構造データが作成済みであるか否かを判定する(ステップS03)。構造データが作成済みである場合には(ステップS03:YES)、文書表示処理に移行する(ステップS05)。構造データが作成されていない場合には(ステップS03:NO)、構造データ作成処理に移行する(ステップS04)。ステップS04およびステップS05における処理の詳細については後述する。
FIG. 2 is a diagram illustrating a flow of processing performed by the CPU 101 executing the program 10P. Here, it is assumed that the document display apparatus 10 is turned on and the CPU 101 is executing the program 10P.
First, when the user operates the operation unit 107, an instruction for designating a document (document data or image data) to be displayed on the document display device 10 is input (step S01). The document designated here may be a document stored in the document storage unit 117 in advance, or a document stored in an external device may be received via the network 113. Next, the CPU 101 reads out a document designated by the user from the document storage unit 117 or receives it from an external device via the network 113 and develops the data on the RAM 103 (step S02). It is determined whether or not structure data has been created for (Step S03). If the structure data has been created (step S03: YES), the process proceeds to document display processing (step S05). If the structure data has not been created (step S03: NO), the process proceeds to the structure data creation process (step S04). Details of the processes in step S04 and step S05 will be described later.

図3は、構造データ作成処理(ステップS04)の詳細なフローを示す図である。まず、CPU101は、RAM103上に展開された文書の1ページ目を注目ページとする(ステップS401)。次に、CPU101は、取得されたデータがスキャナ109等の画像入力装置によって入力された画像データであるかどうかを判定し(ステップS402)、画像データであると判定された場合には(ステップS402:YES)、文書レイアウト解析処理を行ってレイアウト情報を取得する(S403)。一方、ステップS402において、画像データではないと判定された場合(ステップS402:NO)、すなわち、取得されたデータが文書データである場合には、所定のデータ変換作業を行い、レイアウト情報を抽出する(S404)。   FIG. 3 is a diagram showing a detailed flow of the structure data creation process (step S04). First, the CPU 101 sets the first page of the document expanded on the RAM 103 as the attention page (step S401). Next, the CPU 101 determines whether or not the acquired data is image data input by an image input device such as the scanner 109 (step S402). When it is determined that the acquired data is image data (step S402). : YES), a document layout analysis process is performed to obtain layout information (S403). On the other hand, if it is determined in step S402 that the data is not image data (step S402: NO), that is, if the acquired data is document data, a predetermined data conversion operation is performed to extract layout information. (S404).

次に、CPU101は、ステップS403またはステップS404で取得されたレイアウト情報に基づいて、注目ページの構造データを生成する(S405)。図5に示すように、構造データは、ページの各々を根とする木構造を有している。木構造の階層は、以下のようにして決定される。1ページ目の例では、まず横方向に3つの領域に分割された後、最も下の領域が縦方向に2分割されたとみなされる。これを木構造で表すと、根の1つ下の階層には2つの葉と1つの中間接点が存在し、2つの葉は領域1と領域2に対応付けられる。中間接点の1つ下の階層にはさらに2つの葉が存在し、2つの葉は領域3と領域4に対応付けられる。   Next, the CPU 101 generates the structure data of the page of interest based on the layout information acquired in step S403 or step S404 (S405). As shown in FIG. 5, the structure data has a tree structure with each page as a root. The hierarchy of the tree structure is determined as follows. In the example of the first page, it is first divided into three regions in the horizontal direction, and then the lowermost region is considered to be divided into two in the vertical direction. If this is represented by a tree structure, there are two leaves and one intermediate contact in the hierarchy one level below the root, and the two leaves are associated with regions 1 and 2. There are two more leaves in the hierarchy one level below the intermediate contact, and the two leaves are associated with regions 3 and 4.

一方、M−2ページ目の例では、まず縦方向に2つの領域に分割された後、右側の領域が横方向に2分割されたものとみなされる。これを木構造で表すと、根の1つ下の階層に1つの葉と1つの中間接点が存在し、葉は領域1に対応付けられる。中間接点の1つ下の階層には、さらに2つの葉が存在し、2つの葉は領域2と領域3に対応付けられる。
図3のフロー図の説明に戻る。ステップS406では、注目ページが2ページ目以降のページであるか否かを判定する。2ページ目以降である場合には(ステップS406:YES)、1つ前のページの構造データと注目ページの構造データとからその変化量を算出する(ステップS407)。
On the other hand, in the example of the (M−2) -th page, it is assumed that the right area is first divided into two areas in the vertical direction and then divided into two areas in the horizontal direction. If this is represented by a tree structure, one leaf and one intermediate contact exist in the hierarchy one level below the root, and the leaf is associated with the region 1. There are two more leaves in the hierarchy one level below the intermediate contact, and the two leaves are associated with region 2 and region 3.
Returning to the flowchart of FIG. In step S406, it is determined whether the page of interest is the second page or later. If it is the second page or later (step S406: YES), the amount of change is calculated from the structure data of the previous page and the structure data of the page of interest (step S407).

ここで、ステップS407における変化量の算出手順について説明する。まず、CPU101は、木構造を構成する葉の各々にその階層に応じた重み付けを行う。図6は、重み付けの方法を示す図である。ここでは、構造データの階層を上から順にLevel_0、Level_1、Level_2、Level_3と称する。そして、レイアウトの変化に対して重み付けを行う。例えば、隣接ページ間でLevel_0とLevel_1との間でレイアウトの変化が生じた場合にはWeight_1を、Level_1とLevel_2の間ではWeight_2を、Level_2とLevel_3の間ではWeight_3を与える。変化の事象が複数の場合には、事象の数を重み付けに乗じ、すべての事象についての重み付けの合計を変化量と定義する。なお、階層の数は、取り扱う文書のレイアウトに応じて変わることはいうまでもない。   Here, the calculation procedure of the change amount in step S407 will be described. First, the CPU 101 weights each leaf constituting the tree structure according to its hierarchy. FIG. 6 is a diagram illustrating a weighting method. Here, the hierarchy of the structure data is referred to as Level_0, Level_1, Level_2, and Level_3 in order from the top. Then, weighting is performed on the layout change. For example, Weight_1 is given when the layout changes between Level_0 and Level_1 between adjacent pages, Weight_2 is given between Level_1 and Level_2, and Weight_3 is given between Level_2 and Level_3. When there are a plurality of change events, the weight is multiplied by the number of events, and the sum of the weights for all events is defined as the change amount. Needless to say, the number of hierarchies varies depending on the layout of the document to be handled.

変化量算出の例として、1ページ目と2ページ目の例を考える(図5参照)。この場合、1ページ目の領域1と領域2が消滅したものが2ページ目であるとみなすことができる。図6の木構造によると、1ページ目のLevel_1の2つの葉が根(Level_0)に吸収されたことになる。このときの変化量ΔPは、
ΔP=2×Weight_1
と表される。
同様に、Nページ目では、N−1ページ目の領域2が3つの領域に分割された後、その3つの領域がさらに2分割されたものとみなすことができる。このときの変化量ΔPは、
ΔP=3×Weight_2+(2×Weight_3)×3
と表される。
As an example of the amount of change calculation, consider the first and second pages (see FIG. 5). In this case, it can be regarded that the area 1 and area 2 on the first page disappeared is the second page. According to the tree structure in FIG. 6, two leaves of Level_1 on the first page are absorbed by the root (Level_0). The amount of change ΔP at this time is
ΔP = 2 × Weight_1
It is expressed.
Similarly, in the Nth page, after the area 2 of the (N-1) th page is divided into three areas, it can be considered that the three areas are further divided into two. The amount of change ΔP at this time is
ΔP = 3 × Weight_2 + (2 × Weight_3) × 3
It is expressed.

一方、Mページ目では、M−1ページ目との間にレイアウト上の相関は見られない。この場合には、M−1ページ目の2つの領域が消滅した後、Mページの2つの領域が出現したものとみなされる。このときの変化量ΔPは、
ΔP=2×Weight_1+2×Weight_1
となる。
また、上述のように、1ページ目は、何もないページに対して3つの領域が出現した後に最も下の領域が左右2つに分割されたものとみなすことができるから、変化量ΔPは、
ΔP=3×Weight_1+2×Weight_2
と表される。
On the other hand, there is no correlation in layout between the Mth page and the M-1th page. In this case, it is considered that the two areas of the M page appear after the two areas of the (M−1) th page disappear. The amount of change ΔP at this time is
ΔP = 2 × Weight_1 + 2 × Weight_1
It becomes.
Further, as described above, since the first page can be regarded as the lowermost area divided into the left and right after the appearance of the three areas for the empty page, the change amount ΔP is ,
ΔP = 3 × Weight_1 + 2 × Weight_2
It is expressed.

変化量の算出にあたっては、Weight_1、Weight_2、Weighr_3、・・・にそれぞれ適当な値を与える。例えば、Weight_1=8、Weight_2=2、Weight_3=1を与えた場合、1ページ目から2ページ目への変化量は16となり、N−1ページ目からNページ目への変化量は12となる。図7は、このようにして求められた変化量の推移を示す図である。このように、レイアウトの変化が大きいほど、大きな変化量が算出されることになる。
図3のフロー図の説明に戻る。変化量を算出した後、CPU101は、注目ページが最終ページであるか否かを判定する(ステップS408)。注目ページが最終ページである場合には(ステップS408:YES)、処理を終了する。最終ページでない場合には(ステップS408:NO)、次のページを注目ページに設定し(S409)、ステップS402に戻る。
In calculating the change amount, appropriate values are given to Weight_1, Weight_2, Weighr_3,. For example, when Weight_1 = 8, Weight_2 = 2, and Weight_3 = 1 are given, the change amount from the first page to the second page is 16, and the change amount from the N-1 page to the N page is 12. . FIG. 7 is a diagram showing the transition of the variation obtained in this way. Thus, the greater the layout change, the greater the amount of change.
Returning to the flowchart of FIG. After calculating the change amount, the CPU 101 determines whether the page of interest is the last page (step S408). If the page of interest is the last page (step S408: YES), the process ends. If it is not the last page (step S408: NO), the next page is set as the page of interest (S409), and the process returns to step S402.

次に、上記のようにして求められた変化量を用いて、変化量の大きなページを表示するための処理について、図8を用いて説明する。図8は、文書表示処理(図3のステップS05)の詳細なフローを示す図である。
まず、CPU101は、RAM103上に展開している注目文書の1ページ目を表示部105に表示させる(ステップS501)。図10は、文書表示装置10の画面に表示されるユーザインターフェイスの一例を示す図である。画面の下端には、表示するページを切り替えるためのボタンが表示されている。早めくりボタンは、レイアウトの変化量が大きなページのみを順に表示させるためのボタンであり、順方向と逆方向が選択可能となっている。順方向とはページの昇順であり、逆方向とはページの降順である。本実施例では、イベント駆動型の表示装置(アプリケーションプログラム)を想定しており、CPU101は、何らかのイベントが生じた場合にはこれが早めくりボタンが押下されたイベントであるかどうかを判断する(S502)。イベントが早めくりボタンの押下でない場合には(ステップS502:NO)、それぞれのイベントに応じた文書表示処理を実行する(ステップS510)。一方、イベントが早めくりボタン押下である場合には(ステップS502:YES)、それが順方向であるか逆方向であるかを判定する(ステップS503)。順方向の場合には(ステップS503:YES)、注目ページより後に変化点ページがあるかどうかを判定し(ステップS504)、逆方向の場合には(ステップS503:NO)、注目ページより前に変化点ページがあるかどうかを判定する(ステップS507)。
Next, processing for displaying a page with a large change amount using the change amount obtained as described above will be described with reference to FIG. FIG. 8 is a diagram showing a detailed flow of the document display process (step S05 in FIG. 3).
First, the CPU 101 displays the first page of the document of interest developed on the RAM 103 on the display unit 105 (step S501). FIG. 10 is a diagram illustrating an example of a user interface displayed on the screen of the document display device 10. A button for switching the page to be displayed is displayed at the lower end of the screen. The fast-forward button is a button for sequentially displaying only pages with a large amount of layout change, and the forward direction and the reverse direction can be selected. The forward direction is the ascending order of pages, and the reverse direction is the descending order of pages. In the present embodiment, an event-driven display device (application program) is assumed, and when any event occurs, the CPU 101 determines whether this is an event in which the fast-forward button is pressed (S502). ). If the event is not a press of the fast-forward button (step S502: NO), document display processing corresponding to each event is executed (step S510). On the other hand, if the event is a fast-forward button press (step S502: YES), it is determined whether the event is forward or backward (step S503). In the case of the forward direction (step S503: YES), it is determined whether or not there is a change point page after the page of interest (step S504), and in the case of the reverse direction (step S503: NO), before the page of interest. It is determined whether there is a change point page (step S507).

ここで変化点について説明する。変化点とは、レイアウトの変化量が大きなページであり、変化量の閾値を適宜設定することにより抽出することができる。図9は、図7に示した変化量の推移において、閾値TH1〜TH3を設定することにより、変化点に相当するページ(変化点ページ)を抽出した例である。例えば、変化量の閾値としてTH1を選択することにより、比較的大きなレイアウト変化が生じたページだけを変化点ページとして抽出することができる。一方で、閾値TH3を選択することにより、レイアウトに微小な変化が生じたページをも変化点ページとして抽出することが可能となる。この閾値は、文書ごとに設定してもよいし、予め定めた一定値を用いてもよい。もちろん、ユーザによる任意の設定も可能である。また、一度閲覧した文書については、そのときに用いられた閾値を文書蓄積部117に記憶させておいてもよいし、文書表示装置10に学習機能を持たせ最適な閾値を選択させるようにしてもよい。   Here, the changing point will be described. A change point is a page with a large amount of change in layout, and can be extracted by appropriately setting a threshold of change. FIG. 9 is an example in which pages (change point pages) corresponding to change points are extracted by setting threshold values TH1 to TH3 in the transition of the change amounts shown in FIG. For example, by selecting TH1 as the change amount threshold value, only pages in which a relatively large layout change has occurred can be extracted as change point pages. On the other hand, by selecting the threshold value TH3, it is possible to extract a page in which a minute change has occurred in the layout as a change point page. This threshold value may be set for each document, or a predetermined constant value may be used. Of course, any setting by the user is also possible. For a document that has been browsed once, the threshold used at that time may be stored in the document storage unit 117, or the document display device 10 may have a learning function to select an optimum threshold. Also good.

図8の説明に戻る。ステップS504で、注目ページより後に変化点ページがある場合には(ステップS504:YES)、CPU101は、その変化点ページを表示部105に表示させる(ステップS505)。注目ページより後に変化点ページがない場合には(ステップS504:NO)、最終ページを表示させる(ステップS506)。
一方、ステップS507で、注目ページより前に変化点ページがある場合には(ステップS507:YES)、CPU101は、その変化点ページを表示部105に表示させる(ステップS508)。注目ページより前に変化点ページがない場合には(ステップS507:NO)、1ページ目を表示させる(ステップS509)。
ここまでの処理が終了したならば、CPU101は、文書表示を終了するか否かをユーザに選択させることを促す表示を行う(ステップS511)。文書表示を終了する旨の指示が入力されたならば(ステップS511:YES)、CPU101はすべての処理を終了する。文書表示を終了しない旨の指示が入力されたならば(ステップS511:NO)、ステップS502に戻る。
Returning to the description of FIG. If there is a change point page after the page of interest in step S504 (step S504: YES), the CPU 101 displays the change point page on the display unit 105 (step S505). If there is no change point page after the page of interest (step S504: NO), the last page is displayed (step S506).
On the other hand, if there is a change point page before the page of interest in step S507 (step S507: YES), the CPU 101 displays the change point page on the display unit 105 (step S508). If there is no change point page before the page of interest (step S507: NO), the first page is displayed (step S509).
When the processing so far is completed, the CPU 101 performs a display prompting the user to select whether or not to end the document display (step S511). If an instruction to end document display is input (step S511: YES), the CPU 101 ends all processing. If an instruction not to end the document display is input (step S511: NO), the process returns to step S502.

以上説明したように、本発明によれば、複数ページからなる文書のページ間のレイアウトの変化を定量化し、レイアウトが大きく変化するページを抽出して表示させることができる。すなわち、人間が視覚的に特徴のあるページに注目することによってその文書に何が書かれているのかを概略的に知るという行為が文書表示装置の画面上で実現される。これによって、電子文書の内容の概略的把握のための情報を抽出し、その情報を表示させることができる。
また、入力されるデータが文書データと画像データのいずれであっても、レイアウト情報を抽出できるから、任意の形式のデータに対応することができる。また、算出された変化量を記憶しておき、変化量が閾値以上であるページを順番(昇順または降順)に表示させるから、効率的に文書の内容を把握することが可能となる。また、閾値を変更することによって、レイアウトの変化の度合いが比較的小さいページであっても表示させるといったきめ細かな設定が可能となる。
As described above, according to the present invention, it is possible to quantify changes in layout between pages of a document composed of a plurality of pages, and to extract and display pages whose layout changes greatly. In other words, the act of roughly knowing what is written in the document by paying attention to a visually characteristic page is realized on the screen of the document display device. As a result, information for roughly grasping the contents of the electronic document can be extracted and displayed.
Further, since the layout information can be extracted regardless of whether the input data is document data or image data, it can correspond to data of an arbitrary format. Further, since the calculated amount of change is stored and pages whose amount of change is equal to or greater than the threshold value are displayed in order (ascending order or descending order), it is possible to efficiently grasp the contents of the document. Further, by changing the threshold value, it is possible to make fine settings such as displaying even a page with a relatively small degree of layout change.

[変形例]
以上説明した形態に限らず、本発明は種々の形態で実施可能である。例えば、上述の実施形態を以下のように変形した形態でも実施可能である。
[Modification]
The present invention is not limited to the form described above, and can be implemented in various forms. For example, the embodiment described above can be modified as follows.

上述の実施形態においては、全ページについて変化量を算出し、算出された変化量を文書蓄積部117に記憶されておき、変化量が閾値以上であるページを順次表示させることとしているが、1ページ毎に逐次処理することとしてもよい。すなわち、1ページ毎に変化量算出、閾値との比較、表示/非表示の処理を行うこととしてもよい。   In the above-described embodiment, the amount of change is calculated for all pages, the calculated amount of change is stored in the document storage unit 117, and pages whose amount of change is equal to or greater than the threshold are sequentially displayed. It is good also as processing sequentially for every page. That is, it is possible to perform change amount calculation, comparison with a threshold value, and display / non-display processing for each page.

上述の実施形態においては、文書データと画像データのどちらにでも対応可能としているが、文書データ、画像データのいずれかのみに対応するように本発明を変形してもよい。   In the above-described embodiment, both document data and image data can be supported. However, the present invention may be modified so as to support only document data or image data.

表示部および操作部を有する1または複数の表示端末装置をネットワークを介して文書表示装置10に接続し、表示端末装置に文書を表示させるようにしてもよい。例えば、図書館などに文書表示装置10と表示端末装置を設置しておき、図書館の所蔵図書の画像データを文書表示装置10に格納しておく。このようにすれば、図書館の利用者が表示端末装置を用いて、所蔵図書の内容を概略的に把握することが可能となる。   One or a plurality of display terminal devices having a display unit and an operation unit may be connected to the document display device 10 via a network, and the document may be displayed on the display terminal device. For example, a document display device 10 and a display terminal device are installed in a library or the like, and image data of a library book in the library is stored in the document display device 10. In this way, it is possible for the library user to roughly grasp the contents of the holding book using the display terminal device.

レイアウト解析によって認識された文章領域、図領域、表領域の中から所望の領域のみを抽出して表示させるようにしてもよい。例えば、数値データが重要である技術論文などでは、図や表の記載されたページのみを表示させることによって、数値データを手早く閲覧することが可能となる。   Only a desired area may be extracted and displayed from the text area, figure area, and table area recognized by the layout analysis. For example, in technical papers in which numerical data is important, it is possible to quickly view numerical data by displaying only pages with figures and tables.

本発明の一実施形態に係る文書表示装置の構成を示す図である。It is a figure which shows the structure of the document display apparatus which concerns on one Embodiment of this invention. CPUがプログラムを実行することによって行われる処理のフローを示す図である。It is a figure which shows the flow of the process performed when CPU runs a program. 構造データ作成処理の詳細なフローを示す図である。It is a figure which shows the detailed flow of a structure data creation process. 文書表示装置による処理の対象とする文書の例を示す図である。It is a figure which shows the example of the document made into the object of the process by a document display apparatus. 構造データの例を示す図である。It is a figure which shows the example of structure data. 重み付けの方法を示す図である。It is a figure which shows the method of weighting. 変化量の推移を示す図である。It is a figure which shows transition of change amount. 文書表示処理の詳細なフローを示す図である。It is a figure which shows the detailed flow of a document display process. 変化量の閾値の設定例を示す図である。It is a figure which shows the example of a setting of the threshold value of change amount. ユーザインターフェイスの一例を示す図である。It is a figure which shows an example of a user interface. CPUがプログラムを実行することによって形成される仮想的モジュールを示す図である。It is a figure which shows the virtual module formed when CPU runs a program.

符号の説明Explanation of symbols

10…文書表示装置、101…CPU、102…ROM,103…RAM、105…表示部、107…操作部、109…スキャナ、111…プリンタ、113…ネットワーク、117…文書蓄積部、118…文書処理部、
21…文書取得手段、22…第1の取得手段、23…第2の取得手段、24…構造データ生成手段、25…変化量算出手段、26…変化量記憶手段、27…表示手段。
DESCRIPTION OF SYMBOLS 10 ... Document display apparatus 101 ... CPU, 102 ... ROM, 103 ... RAM, 105 ... Display part, 107 ... Operation part, 109 ... Scanner, 111 ... Printer, 113 ... Network, 117 ... Document storage part, 118 ... Document processing Part,
21 ... Document acquisition means, 22 ... First acquisition means, 23 ... Second acquisition means, 24 ... Structure data generation means, 25 ... Change amount calculation means, 26 ... Change amount storage means, 27 ... Display means.

Claims (5)

複数のページからなる文書のページの各々について、当該ページを構成する構成要素のレイアウトを表すレイアウト情報を取得し、当該ページにおいて各構成要素の占める領域間のレイアウト上の階層構造を表す構造データを生成する構造データ生成手段と、
注目ページと、ページの昇順または降順における該注目ページの1つ手前のページとの、前記階層構造の変化の度合いを表す変化量を算出する変化量算出手段と、
前記変化量算出手段により求められた変化量と予め定められた閾値とを比較し、該変化量が該閾値以上である場合に当該注目ページを表示する表示手段と
を有する文書表示装置。
For each page of a document made up of a plurality of pages, layout information representing the layout of the constituent elements constituting the page is acquired, and structural data representing the hierarchical structure on the layout between the regions occupied by the constituent elements on the page is obtained. Structure data generation means to generate;
A change amount calculating means for calculating a change amount indicating a degree of change in the hierarchical structure between the attention page and the page immediately before the attention page in the ascending or descending order of the pages;
A document display device comprising: a display unit that compares a change amount obtained by the change amount calculation unit with a predetermined threshold value and displays the attention page when the change amount is equal to or greater than the threshold value.
文書のレイアウト情報を内包した文書データまたは文書の画像を表す画像データを取得する文書取得手段と、
前記文書データからレイアウト情報を抽出する第1の取得手段と
前記画像データにより表される文書の画像を解析することによって該文書のレイアウト情報を取得する第2の取得手段と
を有し、
前記構造データ生成手段は、前記文書取得手段により文書データが取得された場合には前記第1の取得手段を用いてレイアウト情報を取得する一方、前記文書取得手段により画像データが取得された場合には前記第2の取得手段を用いてレイアウト情報を取得する
ことを特徴とする請求項1に記載の文書表示装置。
Document acquisition means for acquiring document data including document layout information or image data representing an image of the document;
First acquisition means for extracting layout information from the document data, and second acquisition means for acquiring layout information of the document by analyzing an image of the document represented by the image data,
The structure data generation unit acquires layout information using the first acquisition unit when the document data is acquired by the document acquisition unit, while the image data is acquired by the document acquisition unit. The document display apparatus according to claim 1, wherein the layout information is acquired using the second acquisition unit.
前記変化量算出手段により求められた変化量を当該注目ページと対応付けて記憶する変化量記憶手段を有し、
前記表示手段は、前記変化量記憶手段により記憶されている変化量が閾値以上であるページを抽出し、抽出されたページの画像をページの昇順または降順で表示する
ことを特徴とする請求項1または2に記載の文書表示装置。
Change amount storage means for storing the change amount obtained by the change amount calculation means in association with the page of interest;
The said display means extracts the page whose variation | change_quantity memorize | stored by the said variation | change_quantity storage means is more than a threshold value, and displays the image of the extracted page in the ascending order or descending order of a page. Or the document display apparatus of 2.
コンピュータ装置を、
複数のページからなる文書のページの各々について、当該ページを構成する構成要素のレイアウトを表すレイアウト情報を取得し、当該ページにおいて各構成要素の占める領域間のレイアウト上の階層構造を表す構造データを生成する構造データ生成手段と、
注目ページと、ページの昇順または降順における該注目ページの1つ手前のページとの、前記階層構造の変化の度合いを表す変化量を算出する変化量算出手段と、
前記変化量算出手段により求められた変化量と予め定められた閾値とを比較し、該変化量が該閾値以上である場合に当該注目ページを表示する表示手段
として機能させるためのプログラム。
Computer equipment,
For each page of a document made up of a plurality of pages, layout information representing the layout of the constituent elements constituting the page is acquired, and structural data representing the hierarchical structure on the layout between the regions occupied by the constituent elements on the page is obtained. Structure data generation means to generate;
A change amount calculating means for calculating a change amount indicating a degree of change in the hierarchical structure between the attention page and the page immediately before the attention page in the ascending or descending order of the pages;
A program for comparing the amount of change obtained by the amount-of-change calculating means with a predetermined threshold and functioning as display means for displaying the page of interest when the amount of change is equal to or greater than the threshold.
複数のページからなる文書のページの各々について、当該ページを構成する構成要素のレイアウトを表すレイアウト情報を取得し、当該ページにおいて各構成要素の占める領域間のレイアウト上の階層構造を表す構造データを生成する構造データ生成ステップと、
注目ページと、ページの昇順または降順における該注目ページの1つ手前のページとの、前記階層構造の変化の度合いを表す変化量を算出する変化量算出ステップと、
前記変化量算出手段により求められた変化量と予め定められた閾値とを比較し、該変化量が該閾値以上である場合に当該注目ページを表示する表示ステップと
を有する文書表示方法。
For each page of a document made up of a plurality of pages, layout information representing the layout of the constituent elements constituting the page is acquired, and structural data representing the hierarchical structure on the layout between the regions occupied by the constituent elements on the page is obtained. A structural data generation step to generate;
A change amount calculating step for calculating a change amount indicating a degree of change in the hierarchical structure between the attention page and the page immediately before the attention page in the ascending or descending order of the pages;
A document display method comprising: a display step of comparing a change amount obtained by the change amount calculation unit with a predetermined threshold value and displaying the page of interest when the change amount is equal to or greater than the threshold value.
JP2003350062A 2003-10-08 2003-10-08 Document display device, program, and method for displaying document Pending JP2005115702A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003350062A JP2005115702A (en) 2003-10-08 2003-10-08 Document display device, program, and method for displaying document

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003350062A JP2005115702A (en) 2003-10-08 2003-10-08 Document display device, program, and method for displaying document

Publications (2)

Publication Number Publication Date
JP2005115702A true JP2005115702A (en) 2005-04-28
JP2005115702A5 JP2005115702A5 (en) 2006-11-02

Family

ID=34541749

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003350062A Pending JP2005115702A (en) 2003-10-08 2003-10-08 Document display device, program, and method for displaying document

Country Status (1)

Country Link
JP (1) JP2005115702A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007316743A (en) * 2006-05-23 2007-12-06 Fujitsu Ltd Partial document retrieving program, method and device
JP2009187277A (en) * 2008-02-06 2009-08-20 Fujitsu Ltd Display device
JP2010278495A (en) * 2009-05-26 2010-12-09 Konica Minolta Business Technologies Inc Image processing apparatus and program
JP2014174900A (en) * 2013-03-12 2014-09-22 Canon Inc Image processor, image processing method and program

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007316743A (en) * 2006-05-23 2007-12-06 Fujitsu Ltd Partial document retrieving program, method and device
JP2009187277A (en) * 2008-02-06 2009-08-20 Fujitsu Ltd Display device
JP2010278495A (en) * 2009-05-26 2010-12-09 Konica Minolta Business Technologies Inc Image processing apparatus and program
JP2014174900A (en) * 2013-03-12 2014-09-22 Canon Inc Image processor, image processing method and program

Similar Documents

Publication Publication Date Title
US5754873A (en) Method and apparatus for scaling a selected block of text to a preferred absolute text height and scaling the remainder of the text proportionately
US8745515B2 (en) Presentation of large pages on small displays
EP2684114B1 (en) Task-based address bar and tabs scaling
JPH09106333A (en) Document processor
JP2006179003A (en) Semantic document smart nail
JP2007506987A (en) Method and system for improving readability with control flow bitmap
JP2000029451A (en) Display method of table calculating sheet
JP4101491B2 (en) Synthetic font editing apparatus, synthetic font editing program and recording medium recording the same
US20040177325A1 (en) Edit location indicator
EP1962489A2 (en) Document edit device
US7577914B1 (en) Automatically sized computer-generated workspaces
US7366978B1 (en) Method and system for creating a grid-like coordinate system for addressing data contained in an irregular computer-generated table
JP2005115702A (en) Document display device, program, and method for displaying document
JP2006053741A (en) Tag information processing method, tag information processing system, and tag information processing program
JPH04278992A (en) Character string display method
JP2014021694A (en) Portable information terminal, table display method for portable information terminal and table display program for portable information terminal
US20220357841A1 (en) System and method for parallel multi-column text presentation and editing on a computer display
JP4015243B2 (en) Document creation apparatus and recording medium
JP6765113B2 (en) Character string processing device, character string processing method, character string processing program and computer-readable recording medium
JP3101402B2 (en) Document editing method and document editing device
JPH03189724A (en) Document processor
JP3027834B2 (en) Document file name display
JP2000251087A (en) Information processor, information processing method and storage medium
JP2021082088A (en) Information processing device, control method thereof, program, and storage medium
JPH04127265A (en) Document processor

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060919

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060919

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090227

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090303

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090430

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20091117