JP2002169836A - Support system for integration and rearrangement of information - Google Patents

Support system for integration and rearrangement of information

Info

Publication number
JP2002169836A
JP2002169836A JP2000365373A JP2000365373A JP2002169836A JP 2002169836 A JP2002169836 A JP 2002169836A JP 2000365373 A JP2000365373 A JP 2000365373A JP 2000365373 A JP2000365373 A JP 2000365373A JP 2002169836 A JP2002169836 A JP 2002169836A
Authority
JP
Japan
Prior art keywords
information
data
layout form
tag
original data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2000365373A
Other languages
Japanese (ja)
Other versions
JP3877957B2 (en
Inventor
Akiyuki Fujino
亮之 藤野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2000365373A priority Critical patent/JP3877957B2/en
Publication of JP2002169836A publication Critical patent/JP2002169836A/en
Application granted granted Critical
Publication of JP3877957B2 publication Critical patent/JP3877957B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To provide a support system for integration and rearrangement of information which can precisely integrate and display information analog a layout form that a user generates. SOLUTION: This integration and rearrangement support system for information is equipped with a layout form generating means 21 which determines the layout form matching a style that the user requires and also saves a tag as a key for extracting necessary data in an item of the layout form at the same time, an information acquiring means 22 which acquires source data including the tag from the source information that the user specifies, an information integrating means 23 which extracts data corresponding to the tag from the saves source data and integrates the data, and an integrated information output means 61 which outputs the generated integrated data according to the layout form.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、データベースやW
WW上にある情報からユーザが望む特定の情報を抜粋し
て取得することで情報の整理を支援する情報の集約整理
支援システムに関する。
[0001] The present invention relates to a database and W
The present invention relates to an information consolidation and support system that supports the organization of information by extracting and acquiring specific information desired by a user from information on the WW.

【0002】[0002]

【従来の技術】近年、インターネットの発達により、イ
ンターネットのWWW(WorldWide Web)
上から様々な情報やサービスを入手できるようになって
いる。しかし、WWW上に存在する情報は、その量が膨
大であり、また情報の形式や編集スタイルも様々である
ため、ユーザが必要とする情報を抜粋して効率的に取得
し整理することは容易ではない。
2. Description of the Related Art In recent years, with the development of the Internet, the WWW (World Wide Web) of the Internet has been developed.
Various information and services can be obtained from above. However, since the amount of information existing on the WWW is enormous and the information formats and editing styles are various, it is easy to extract and efficiently obtain and organize the information required by the user. is not.

【0003】そこで、WWW上の情報をユーザの望む条
件に沿って効率的に取得する技術が提案されている。特
開平11−203100号公報には、WWW上のHTM
L(Hyper Text Markup Language)文書を取得し、その
中にある画像データなどの不要情報をHTMLタグから
判断して除去し、文書のレイアウトは保持したまま不要
情報の部分を空白にして出力する技術が開示されてい
る。また、特開平11−134341号公報には、同じ
くWWW上のHTML文書を取得し、その中からあらか
じめ設定したキーワードを検索し、検索結果とHTML
タグを利用して、キーワードを含むひとまとまりの文字
列を抜粋して表示する技術が開示されている。
[0003] Therefore, there has been proposed a technique for efficiently obtaining information on the WWW according to conditions desired by a user. Japanese Patent Application Laid-Open No. 11-203100 discloses an HTM on WWW.
A technology that acquires an L (Hyper Text Markup Language) document, removes unnecessary information such as image data from the HTML tag by judging it from an HTML tag, and outputs a blank portion of the unnecessary information while maintaining the document layout. Is disclosed. Japanese Patent Application Laid-Open No. 11-134341 also discloses that an HTML document on the WWW is acquired, a keyword set in advance is searched from the HTML document, and the search result and the HTML
There is disclosed a technique for extracting and displaying a group of character strings including a keyword using a tag.

【0004】[0004]

【発明が解決しようとする課題】前記従来の情報取得技
術では、元情報の記述言語であるHTMLを手掛かりに
して必要な情報を抽出しているため、抽出対象となるH
TML文書にユーザの望む情報が記載されていない場合
には、そのHTML文書に埋め込まれたリンクをたどっ
て新たなHTML文書を探さなければならなかった。こ
のことから、ユーザが望む情報の一覧性が著しく低下し
てしまうという不便があった。
In the conventional information acquisition technique, since necessary information is extracted by using HTML, which is a description language of the original information, as a clue, the H to be extracted is used.
If the information desired by the user is not described in the TML document, a new HTML document has to be searched for by following the link embedded in the HTML document. For this reason, there is an inconvenience that the list of information desired by the user is significantly reduced.

【0005】また、特開平11−203100号公報に
開示された技術では、ユーザの望む情報がどのHTML
タグの範囲に記載されているか判断できないため、必要
な情報を取りこぼしてしまう可能性があった。また、例
えば画像など、必要のない情報を空白のまま表示するた
めに、表示段階でのレイアウト上の効率が悪かった。
Further, in the technique disclosed in Japanese Patent Application Laid-Open No. 11-203100, information
Since it cannot be determined whether the tag is described in the range of the tag, there is a possibility that necessary information may be missed. In addition, since unnecessary information such as an image is displayed in a blank state, layout efficiency at the display stage is low.

【0006】また、特開平11−134341号公報に
開示された技術では、キーワードの検索のみによってユ
ーザの望む情報の有無を判断しているため、必要な情報
の取りこぼしや不要な情報の取り込みを避けられなかっ
た。また、表示段階でのレイアウトが統一されていない
ため、取得した情報を比較検討するのにはなはだ不便で
あった。
In the technique disclosed in Japanese Patent Application Laid-Open No. H11-134341, the presence or absence of information desired by the user is determined only by searching for a keyword. I couldn't. Further, since the layout at the display stage is not unified, it is very inconvenient to compare and examine the acquired information.

【0007】かかる事情から、ユーザの望む情報を精度
良く取得し、これをユーザの望むレイアウトで見やすく
表示することが求められている。具体的には、ユーザの
望む情報が複数箇所の元情報に分散している場合に、そ
れらの中から必要な情報を抽出し、同じレイアウトフォ
ームに編集して表示することにより、比較検討を容易に
する、といった要望である。
[0007] Under such circumstances, it is required to obtain information desired by the user with high accuracy and to display the information in a layout desired by the user in a legible manner. More specifically, if the information desired by the user is distributed among multiple pieces of original information, the necessary information is extracted from the information and edited and displayed on the same layout form, making comparison and examination easier. It is a request to do.

【0008】すなわち本発明は、ユーザが望む情報のレ
イアウトフォームをユーザ自身が作成し、そのレイアウ
トフォームに沿って情報を精度良く集約して表示するこ
とにより、集約された情報の一覧性を高めるとともに集
約情報の比較をしやすくできるような情報の集約整理支
援システムを提供することを解決課題とするものであ
る。
That is, according to the present invention, a layout form of information desired by the user is created by the user himself, and the information is accurately aggregated and displayed according to the layout form, thereby improving the listability of the aggregated information. It is an object of the present invention to provide an information aggregation and support system that makes it easy to compare aggregated information.

【0009】[0009]

【課題を解決するための手段】前記課題を解決するた
め、本発明の情報の集約整理支援システムは、ユーザが
求める情報を集約して表示するためのレイアウトフォー
ムを決定するとともに、そのレイアウトフォーム内の項
目に対応するデータを抽出するためのキーとなるタグを
保存するレイアウトフォーム作成手段と、ユーザが指定
した元情報の範囲内から前記タグを含む元データを取得
する情報取得手段と、前記元データから前記タグに対応
するデータを抽出して集約データを生成する情報集約手
段と、前記情報集約手段により生成された集約データを
前記レイアウトフォームに合わせて出力する集約情報出
力手段と、を備えることを特徴とする。この構成によれ
ば、大量の情報の中からユーザが求める情報を効率的
に、かつ精度良く抽出し、それをユーザの好みのレイア
ウトフォーム上に集約して表示することができるので、
情報の整理や閲覧、比較分析などが容易になる。
SUMMARY OF THE INVENTION In order to solve the above-mentioned problems, an information summarizing and organizing support system according to the present invention determines a layout form for summarizing and displaying information required by a user. A layout form creating means for storing a tag serving as a key for extracting data corresponding to the item, an information acquiring means for acquiring original data including the tag from a range of the original information specified by the user, Information aggregation means for extracting data corresponding to the tag from data to generate aggregated data, and aggregated information output means for outputting the aggregated data generated by the information aggregation means in accordance with the layout form It is characterized by. According to this configuration, it is possible to efficiently and accurately extract information required by the user from a large amount of information and to collectively display the information on a layout form desired by the user.
Information can be easily organized, viewed, and compared.

【0010】そして、前記レイアウトフォーム作成手段
において、キーとなるタグにXMLタグを使用すること
により、ユーザが求める情報を、単なるデータの形式で
はなく、個々の意味を踏まえて的確に抽出することがで
きる。
[0010] In the layout form creation means, by using an XML tag as a key tag, information required by a user can be accurately extracted based on individual meanings, not just a data format. it can.

【0011】さらに、前記レイアウトフォーム作成手段
において、XMLタグとレイアウトフォーム内の項目と
を関連付けるにあたり、XML文書からXMLタグの付
与された箇所をドラッグ・アンド・ドロップ操作により
入力できるように構成することもできる。この構成によ
れば、ユーザがXMLタグについての詳しい知識を持た
ない場合でも、容易に本発明を利用することができる。
[0011] Further, the layout form creation means may be configured such that, when associating an XML tag with an item in the layout form, a portion to which the XML tag is added can be input from the XML document by a drag-and-drop operation. Can also. According to this configuration, the present invention can be easily used even when the user does not have detailed knowledge of the XML tag.

【0012】また、本発明における前記情報取得手段
は、レイアウトフォームに対応する元データを、ユーザ
がURLにより指定したWWW上のウェブページから取
得するように構成されたことを特徴とする。この構成に
よれば、多種多様で大量の情報を有しているWWW上か
ら、ユーザの求める情報を幅広く取得することができる
ので、取得される情報の質や量が充実する。
Further, the information acquisition means of the present invention is characterized in that the information acquisition means is configured to acquire original data corresponding to a layout form from a web page on the WWW designated by a URL by a user. According to this configuration, information desired by the user can be acquired widely from the WWW having various and large amounts of information, so that the quality and quantity of acquired information are enhanced.

【0013】前記情報取得手段は、レイアウトフォーム
に対応する元データをユーザが指定したWWW上のウェ
ブページから抽出できない場合に、前記ウェブページか
らリンクをたどって他のウェブページを探索することに
より、必要な元データを補充するように構成されてもよ
い。この構成よれば、あらかじめユーザが指定した情報
だけでなく、その情報と関連ある他の情報も自動的に探
索される。したがって、ユーザが全ての情報がある場所
を把握していない場合でも、断片的な情報を手掛かりに
して広範囲に情報を取得することができる。
When the original data corresponding to the layout form cannot be extracted from the web page on the WWW specified by the user, the information obtaining means searches for another web page by following the link from the web page. It may be configured to supplement necessary original data. According to this configuration, not only information specified by the user in advance, but also other information related to the information is automatically searched. Therefore, even when the user does not know where all the information is located, it is possible to acquire information over a wide range using fragmentary information as a clue.

【0014】また、本発明における前記情報集約手段
は、情報取得手段によって取得された元データから、共
通のレイアウトフォームで複数セットの集約データを生
成するように構成することができる。この構成によれ
ば、取得された大量の情報が共通のレイアウトフォーム
に集約整理されるので、情報の比較検討が容易になり、
情報の見落としも防止される。
Further, the information aggregating means in the present invention can be configured to generate a plurality of sets of aggregated data in a common layout form from the original data acquired by the information acquiring means. According to this configuration, a large amount of acquired information is consolidated and arranged in a common layout form, so that comparison of information is facilitated,
Oversight of information is also prevented.

【0015】また、前記情報集約手段は、情報取得手段
によって取得された複数セットの元データから、タグに
対応するデータを抽出して集約データを生成するように
構成することもできる。この構成によれば、ユーザの求
める情報の断片がさまざまな場所に分散して存在する場
合でも、それらをひとつのレイアウトフォームに集約す
ることで、情報の活用性を格段に向上させることができ
る。
The information aggregating means may be configured to extract data corresponding to a tag from a plurality of sets of original data acquired by the information acquiring means to generate aggregated data. According to this configuration, even when pieces of information desired by the user are dispersedly present in various places, the pieces of information can be collected into one layout form, so that the usability of information can be significantly improved.

【0016】さらに、本発明の情報の集約整理支援シス
テムは、前記情報集約手段においてレイアウトフォーム
内の全項目に対応するデータを元データから抽出できな
かった場合に、データの抽出ができなかった項目のタグ
を変更または追加して、元データの再取得ができるよう
に構成することができる。この構成によれば、ユーザが
求めるデータを十分に抽出できなかった場合でも、他の
タグをキーにして再度、必要な元データの取得をやり直
すことができるので、情報の取りこぼしを減らし、求め
る情報を確実に取得することができる。
Further, in the information summarizing and organizing support system of the present invention, when the data corresponding to all the items in the layout form cannot be extracted from the original data by the information aggregating means, the data cannot be extracted. The tag can be changed or added so that the original data can be reacquired. According to this configuration, even when the data required by the user cannot be sufficiently extracted, the necessary original data can be obtained again using another tag as a key. Can be reliably obtained.

【0017】また、本発明の情報の集約整理支援システ
ムは、前記情報集約手段においてレイアウトフォーム内
の全項目に対応するデータを元データから抽出できなか
った場合に、元データを取得する対象となる元情報の指
定範囲を変更または追加して、元データの再取得ができ
るように構成することができる。この構成によれば、元
データの情報量が不十分であった場合にこれを再取得し
て補充することができるので、情報の取りこぼしを減ら
し、求める情報を確実に取得することができる。
Further, in the information summarizing and organizing support system of the present invention, when data corresponding to all items in the layout form cannot be extracted from the original data by the information summarizing means, the original data is acquired. The designated range of the original information can be changed or added so that the original data can be reacquired. According to this configuration, when the information amount of the original data is insufficient, it can be reacquired and supplemented, so that missing information can be reduced and the desired information can be acquired reliably.

【0018】また、本発明における前記集約情報出力手
段は、情報集約手段において抽出したデータがどの元デ
ータから抽出されたものであるかを示す抽出元情報を表
示するように構成されたことを特徴とする。この構成に
よれば、集約整理された情報から、ユーザが更なる関連
情報を入手することが容易になる。
In the present invention, the integrated information output means is configured to display extraction source information indicating from which original data the data extracted by the information collection means is extracted. And According to this configuration, it is easy for the user to obtain further related information from the collected and arranged information.

【0019】また、前記集約情報出力手段は、共通のレ
イアウトフォームで生成された複数セットの集約データ
を一覧表形式で表示するように構成されたことを特徴と
する。この構成によれば、共通のレイアウトフォームで
集約された情報の視認性がさらに向上し、情報の比較検
討が容易になる。
The integrated information output means is configured to display a plurality of sets of integrated data generated in a common layout form in a list form. According to this configuration, the visibility of the information aggregated by the common layout form is further improved, and comparison of the information is facilitated.

【0020】[0020]

【発明の実施の形態】以下、本発明の実施の形態につい
て、図面を参照しつつ説明する。
Embodiments of the present invention will be described below with reference to the drawings.

【0021】<システム構成>図1は、本発明の情報の
集約整理支援システムのシステム構成を示している。パ
ーソナルコンピュータ10(以下、「PC」と記す。)
内には、本発明の動作に必要なデバイスの制御や管理を
行うデータ処理部20、データ処理部20が必要とする
データを保存する記憶部30、データ処理部20をWW
Wに接続するためのネットワークインターフェース(I
/F)40が設けられている。データ処理部20は、P
C10のメモリ上に格納されているプログラムの集まり
で、レイアウトフォーム作成部21と、元データ取得部
22と、取捨選択部23とを有する。記憶部30は、P
C10のメモリ上に領域を確保されている保存用の空間
で、ウェブデータ記憶部31と、XMLデータ記憶部3
2と、フォームデータ記憶部33と、集約データ記憶部
34とを有する。また、データ処理部20には、ユーザ
からの各種入力を受け付けるための入力制御部51及び
入力装置52、ならびに各種処理結果をユーザに通知す
るための出力制御部61および出力装置62が接続され
ている。
<System Configuration> FIG. 1 shows a system configuration of an information aggregation / arrangement support system according to the present invention. Personal computer 10 (hereinafter, referred to as “PC”)
Inside, a data processing unit 20 for controlling and managing devices necessary for the operation of the present invention, a storage unit 30 for storing data required by the data processing unit 20, and a data processing unit 20
Network interface (I
/ F) 40 are provided. The data processing unit 20
A collection of programs stored on the memory of the C10, which includes a layout form creation unit 21, an original data acquisition unit 22, and a selection unit 23. The storage unit 30 stores P
A storage space in which an area is secured in the memory of the C10, the web data storage unit 31 and the XML data storage unit 3
2, a form data storage unit 33, and an aggregated data storage unit 34. The data processing unit 20 is connected to an input control unit 51 and an input device 52 for receiving various inputs from the user, and an output control unit 61 and an output device 62 for notifying the user of various processing results. I have.

【0022】<情報の集約整理処理全体の流れ>図2
は、本発明による情報の集約整理処理全体の流れを示
す。本発明による情報の集約整理処理は、ステップS1
0(以下、各ステップを「S10」のように略記す
る。)のレイアウトフォーム作成処理、S20の元デー
タ取得処理、S30の集約データ生成処理、S40の出
力処理、の順で行われる。以下、これらの各処理につい
て順に詳述する。
<Overall Flow of Information Aggregation and Arrangement Processing> FIG. 2
Shows the flow of the entire information aggregation / arrangement process according to the present invention. The information consolidating and organizing process according to the present invention is performed in step S1.
0 (hereinafter, each step is abbreviated as “S10”), a layout form creation process, an original data acquisition process in S20, an aggregated data generation process in S30, and an output process in S40. Hereinafter, each of these processes will be described in detail in order.

【0023】<レイアウトフォーム作成処理>S10の
レイアウトフォーム作成処理では、ユーザがどのような
内容の情報を取得し、それをどのような形態に集約して
表示するのかをあらかじめ指定するためのレイアウトフ
ォームを作成する。このレイアウトフォーム作成処理
は、図1に示したデータ処理部20の中のレイアウトフ
ォーム作成部21にて行われる。図3に、このレイアウ
トフォーム作成処理の流れを示し、図4に、具体的なレ
イアウトフォーム70の作成例を示す。
<Layout Form Creation Processing> In the layout form creation processing in S10, a layout form for the user to specify in advance what kind of information is to be acquired and in what form the information is to be aggregated and displayed. Create This layout form creation processing is performed by the layout form creation unit 21 in the data processing unit 20 shown in FIG. FIG. 3 shows the flow of the layout form creation process, and FIG. 4 shows a specific example of creating a layout form 70.

【0024】レイアウトフォーム70を作成するために
は、まずS11でキャプション入力を行い、情報の集約
項目となるキャプション部71を作成する。続いて、S
12の入力スペース作成で、取得した情報を集約して表
示するためのデータ入力部72を作成する。続いて、S
13の入力スペースの関連付けで、前記データ入力部7
2に取得した情報を表示させるのに必要な設定情報を入
力する。S14の追加入力では、S11からS13まで
の作業を、ユーザが必要とするキャプション部71およ
びデータ入力部72の数だけ繰り返して行う。
In order to create the layout form 70, first, a caption is input in S11, and a caption section 71 serving as an information aggregation item is created. Then, S
In the creation of the 12 input spaces, a data input section 72 for collecting and displaying the acquired information is created. Then, S
13, the data input unit 7
2. Enter the setting information necessary to display the acquired information. In the additional input in S14, the operations from S11 to S13 are repeated by the number of caption sections 71 and data input sections 72 required by the user.

【0025】図4の例に沿って説明すると、レイアウト
フォーム70は、情報を集約すべき項目となる複数のキ
ャプション部71と、各キャプション部71に対応して
設けられるデータ入力部72とから構成される。ユーザ
は、レイアウトフォーム70のページ上に自由にキャプ
ション部71およびデータ入力部72を配置できるが、
これらは必ず対になるように配置する。この例では、キ
ャプション部71として、「製品名」、「型番」、「性
能」、「価格」、「オプション」が入力され、それぞれ
に対応するデータ入力部72が矩形のスペースとして各
キャプション部71の右横に確保されている。
Referring to the example of FIG. 4, the layout form 70 is composed of a plurality of caption sections 71 as items to be aggregated and a data input section 72 provided corresponding to each caption section 71. Is done. The user can freely arrange the caption section 71 and the data input section 72 on the page of the layout form 70,
These are always arranged in pairs. In this example, “product name”, “model number”, “performance”, “price”, and “option” are input as the caption section 71, and the corresponding data input section 72 is formed as a rectangular space. Is secured to the right.

【0026】データ入力部72には、取得された情報
(元データ)の中から各キャプション部71に対応する
個々のデータが抽出されて表示される。この抽出は、個
々の情報が保有する意味内容に基づいて行われる必要が
あり、そのための設定情報を入力するのが入力スペース
の関連付けである。本発明では、個々の情報を意味的に
抽出する鍵としてXMLタグを利用する。以下、XML
タグを利用した入力スペースの関連付けについて説明す
る。
In the data input section 72, individual data corresponding to each caption section 71 is extracted from the acquired information (original data) and displayed. This extraction needs to be performed based on the semantic content of each piece of information, and inputting the setting information for that is input space association. In the present invention, an XML tag is used as a key for semantically extracting individual information. Hereafter, XML
The association of the input space using the tag will be described.

【0027】図5は、取得される元データの一例とし
て、ある製品のスペック表(a)および価格表(b)の
表示形態を示した図で、図6は、図5(a)に示したス
ペック表の論理構造の一部をXML形式の文書で表現し
たものである。図6に示すように、XML文書は、開始
タグと終了タグとが対になったXMLタグにより、明確
な階層構造をなすように記述されている。そこで、あら
かじめデータ入力部72に必要とするデータのXMLタ
グを指定しておき、指定されたXMLタグを元データか
ら検索することで、必要なデータをデータ入力部72に
抽出することができる。
FIG. 5 is a diagram showing a display form of a specification table (a) and a price table (b) of a certain product as an example of the obtained original data. FIG. A part of the logical structure of the specification table is expressed in an XML format document. As shown in FIG. 6, the XML document is described so as to form a clear hierarchical structure by an XML tag in which a start tag and an end tag are paired. Therefore, the required data can be extracted to the data input unit 72 by previously specifying the XML tag of the required data in the data input unit 72 and searching the specified XML tag from the original data.

【0028】ただし、あらかじめ必要な情報に係るXM
Lタグを指定するには、元データの中で使用されている
XMLタグの種類や階層構造がすべて判明している必要
がある。しかし、XML文書ではその作成者がXMLタ
グを自由に定義できるので、本発明のユーザがそのXM
Lタグの定義をすべて確認し適切に指定するのは容易で
はない。そこで、本発明では、XMLタグの入力を支援
する方法として、XML文書からデータ入力部72に関
連付けしたい文字列を選択し、ドラッグ・アンド・ドロ
ップ操作で入力する方法を採用する。この入力方法につ
いて、図7を参照しつつ説明する。
However, XM related to necessary information in advance
In order to specify an L tag, it is necessary to know all types and hierarchical structures of the XML tags used in the original data. However, since the creator of the XML document can freely define the XML tag, the user of the present invention can use the XML tag.
It is not easy to check all the definitions of L tags and specify them appropriately. Therefore, in the present invention, as a method of supporting input of an XML tag, a method of selecting a character string to be associated with the data input unit 72 from an XML document and inputting the character string by a drag-and-drop operation is employed. This input method will be described with reference to FIG.

【0029】ユーザは、まず所望の情報を保有している
元データのサンプルをXML文書で用意する。そして、
まずS131で、データ入力部72に抽出したいデータ
が記載されたXML文書中の関連部分を選択する。図4
に示したレイアウトフォーム70および図5(a)〜図
6に示したスペック表を例にとると、レイアウトフォー
ム70の「型番」というキャプション部71に対応する
データ入力部72に、図5(a)のスペック表から「型
番」の意味を持つ文字列を取り込みたい場合は、例えば
型番のひとつを示す「8244」という文字列を選択す
る。そして、S132で、この選択された文字列の前後
を囲むXMLタグの抽出を行う。この例では、図6に示
したXML文書から、「8244」という文字列が<型
番>・</型番>というXMLタグによって指定されて
おり、このXMLタグがデータ入力部72に入力され
る。このXMLタグを抽出する処理は、図5(a)のス
ペック表の上ではユーザには見えないが、<型番>・<
/型番>というXMLタグがどういう意味を持っている
かをユーザが知る必要はない。XMLタグが抽出できた
場合は、S133にてXMLタグの保存を行い、抽出で
きなかった場合は、S134で再入力指示を行う。この
手順で、すべてのデータ入力部72にXMLタグを入力
する。
A user first prepares a sample of original data holding desired information in an XML document. And
First, in S131, the data input unit 72 selects a related part in the XML document in which data to be extracted is described. FIG.
5A and the specification tables shown in FIGS. 5A to 6 as examples, the data input unit 72 corresponding to the caption unit 71 of “model number” of the layout form 70 is provided in FIG. If it is desired to take in a character string having the meaning of "model number" from the specification table of (1), for example, a character string "8244" indicating one of the model numbers is selected. Then, in step S132, an XML tag surrounding the selected character string is extracted. In this example, from the XML document shown in FIG. 6, the character string “8244” is specified by the XML tags of <model number> and </ model number>, and the XML tag is input to the data input unit 72. The process of extracting the XML tag is not visible to the user on the specification table of FIG.
The user does not need to know what the XML tag “/ model number” has. If the XML tag can be extracted, the XML tag is stored in S133. If the XML tag cannot be extracted, a re-input instruction is performed in S134. In this procedure, the XML tags are input to all the data input units 72.

【0030】こうして、各キャプション部71とそれに
対応する各データ入力部72、および各データ入力部7
2に対応して意味的に関連付けされた各XMLタグが、
それぞれ入力される。このデータは、図8に示すような
構造のフォームデータとして、図1に示した記憶部30
のフォームデータ記憶部33に保存される。また、抽出
された各XMLタグは、記憶部30のXMLデータ記憶
部32にも保存される。
Thus, each caption section 71, each corresponding data input section 72, and each data input section 7
2, each XML tag semantically associated with
Each is entered. This data is stored as form data having a structure as shown in FIG.
Is stored in the form data storage unit 33. The extracted XML tags are also stored in the XML data storage unit 32 of the storage unit 30.

【0031】<元データ取得処理>S10のレイアウト
フォーム作成処理によって所望のレイアウトフォーム7
0が準備できると、続いて、S20の元データ取得処理
を行う。元データ取得処理とは、ユーザが作成したレイ
アウトフォーム70を埋めるのに必要な情報を、ユーザ
が指定したデータセット(情報を取得する対象となる元
データの集合)あるいはWWW上のウェブページから取
得する処理であり、レイアウトフォーム70上の全ての
データ入力部72を埋めるのに必要な元データを取得す
ることを最終目的とする。この元データ取得処理は、図
1に示したデータ処理部20の中の元データ取得部22
にて行われる。この元データ取得処理の流れを図9に示
す。まず、S21で、元データ取得部22は前記レイア
ウトフォーム作成処理で作成されたフォームデータをフ
ォームデータ記憶部33から取得する。次に、S22
で、レイアウトフォーム70を埋めるのに必要な元デー
タを取得する。さらに、このレイアウトフォーム70に
対し複数のデータセットを与える場合は、S23で元デ
ータの追加入力を行う。
<Original Data Acquisition Processing> The desired layout form 7 is obtained by the layout form creation processing in S10.
When 0 is ready, the original data acquisition process of S20 is performed. The original data acquisition processing is to acquire information necessary for filling the layout form 70 created by the user from a data set designated by the user (a set of original data from which information is to be acquired) or a web page on the WWW. The final purpose is to acquire the original data necessary to fill all the data input sections 72 on the layout form 70. This original data acquisition processing is performed by the original data acquisition unit 22 in the data processing unit 20 shown in FIG.
It is performed in. FIG. 9 shows the flow of the original data acquisition processing. First, in S21, the original data acquisition unit 22 acquires form data created in the layout form creation processing from the form data storage unit 33. Next, S22
Then, original data necessary for filling the layout form 70 is acquired. Further, when a plurality of data sets are given to the layout form 70, additional input of original data is performed in S23.

【0032】S22の元データ取得処理の流れについ
て、図10を参照しつつ詳述する。まず、ユーザはS2
21でデータセットを指定し、そのファイル名やURL
を入力する。すると、元データ取得部22はS222
で、指定されたデータセット内にフォームデータで指定
されたXMLタグがすべてあるかどうかを検索する。デ
ータセット内にすべてのXMLタグが見つかった場合
は、S223で、そのデータセットを保存する。XML
タグが見つからなかった場合は、S224で、このデー
タセット内に他文書へのリンクがあるかどうかを調べ
る。リンクがない場合は、S223で、ここまでのデー
タセットを保存する。リンクがある場合は、S225
で、まずリンク探索の上限であるかを判断する。リンク
探索の上限の決定は、特開2000−90111に開示
された技術を利用する。探索上限にかかっていれば探索
を終了し、S223で、ここまでのデータセットを保存
する。探索可能であれば、S226で、リンクをたどっ
て他の元データを取得し、S222で、新たに取得した
元データ内に必要なXMLタグがあるかどうかの判断を
繰り返す。このような手順で、できるかぎりレイアウト
フォーム70内のすべてのデータ入力部72を埋めるの
に必要な元データを取得する。
The flow of the original data acquisition process in S22 will be described in detail with reference to FIG. First, the user enters S2
21. Specify the data set, its file name and URL
Enter Then, the original data acquisition unit 22 proceeds to S222
Search for all the XML tags specified by the form data in the specified data set. If all the XML tags are found in the data set, the data set is saved in S223. XML
If no tag is found, it is checked in step S224 whether there is a link to another document in this data set. If there is no link, the data set so far is saved in S223. If there is a link, S225
First, it is determined whether the upper limit of the link search is reached. The determination of the upper limit of the link search utilizes a technique disclosed in JP-A-2000-90111. If the upper limit of the search is reached, the search is terminated, and in S223, the data set up to this point is stored. If the search is possible, in S226, another original data is obtained by following the link, and in S222, the determination as to whether or not a necessary XML tag is included in the newly obtained original data is repeated. With such a procedure, original data necessary to fill all the data input sections 72 in the layout form 70 is acquired as much as possible.

【0033】<集約データ生成処理>S20の元データ
取得処理によって必要な元データが取得されると、続い
て、S30の集約データ生成処理を行う。この集約デー
タ生成処理は、S10で作成されたレイアウトフォーム
70の各データ入力部72に、S20で取得した元デー
タの中からそれぞれ対応するデータを抽出して入力する
処理である。この集約データ生成処理は、図1に示した
データ処理部20の中の取捨選択部23にて行われる。
この集約データ生成処理の流れを図11に示す。まず、
S31で、レイアウトフォーム70の各データ入力部7
2に関連付けられたXMLタグを取得し、このXMLタ
グによって元データを検索する。図4に示したレイアウ
トフォーム70および図5(a)〜図6に示したスペッ
ク表を例にとると、レイアウトフォーム70上の「製品
名」に対応するデータ入力部72には、XML文書中の
<シリーズ>・</シリーズ>というXMLタグが対応
し、これらのXMLタグで検索することにより、「MN
−360」という文字列が抽出される。これをデータ入
力部72の数だけ繰り返し、各XMLタグに対応するデ
ータを元データから順次抽出して、集約データを生成す
る。
<Aggregated Data Generation Process> When the required original data is acquired by the original data acquisition process of S20, subsequently, the aggregated data generation process of S30 is performed. This aggregated data generation process is a process of extracting and inputting corresponding data from the original data acquired in S20 to each data input unit 72 of the layout form 70 created in S10. This aggregated data generation process is performed by the selection unit 23 in the data processing unit 20 shown in FIG.
FIG. 11 shows the flow of the aggregated data generation process. First,
In S31, each data input unit 7 of the layout form 70
Then, an XML tag associated with No. 2 is acquired, and the original data is searched by using the XML tag. Taking the layout form 70 shown in FIG. 4 and the specification tables shown in FIGS. 5A to 6 as examples, the data input unit 72 corresponding to the “product name” on the layout form 70 includes XML tags such as <series> and </ series> correspond to each other, and by searching using these XML tags, "MN"
The character string "-360" is extracted. This is repeated by the number of data input units 72, and data corresponding to each XML tag is sequentially extracted from the original data to generate aggregated data.

【0034】このとき、元データの内容によっては、複
数の集約データを生成する場合がある。前記の例では、
元データ中に複数個の型番とそれに対応する各スペック
が記載されているので、ユーザとしては図12に示すよ
うに、複数枚のレイアウトフォーム70に型番別にスペ
ックを集約したいとする。ここで、各型番と各スペック
とが互いに対応したデータとして抽出できるかどうかと
いうことが問題になる。これについて、図6に示したX
ML文書を例にとり説明する。
At this time, depending on the contents of the original data, a plurality of aggregated data may be generated. In the above example,
Since a plurality of model numbers and respective specifications corresponding to the model numbers are described in the original data, it is assumed that the user wants to aggregate the specifications by model number into a plurality of layout forms 70 as shown in FIG. Here, it is a problem whether each model number and each specification can be extracted as data corresponding to each other. In this regard, X shown in FIG.
This will be described using an ML document as an example.

【0035】図6のXML文書を、<型番>というXM
Lタグ(以下、終了タグは省略する。)および<スペッ
ク>というXMLタグで検索すると、<型番>というX
MLタグでは「8244」、「8128」、「432
2」…という文字列が得られ、<スペック>というXM
Lタグでは「○○○○」、「□□□□」、「△△△△」
…という文字列が得られる。このままでは、どの型番と
どのスペックが対応しているのかわからない。しかし、
XML文書は明快な階層構造を有するという特長があ
り、慣例として同種のデータや意味的に関連するデータ
は同じXMLタグで括られ、同一階層にまとめられる。
この原則によれば、<機種>というXMLタグで括られ
た同じ階層にある<型番>と<スペック>とが互いに対
応するものであると判別できる。このように、XMLタ
グの階層構造を手掛かりにすれば、型番「8244」と
スペック「○○○○」、型番「8128」とスペック
「□□□□」…のように、互いに対応するデータを同一
のレイアウトフォーム70に集約することができる。
The XML document shown in FIG.
When an L tag (hereinafter, an end tag is omitted) and an XML tag of <specification> are searched, an X of <model number> is obtained.
For the ML tag, “8244”, “8128”, “432”
2 ”... is obtained, and the XM
For the L tag, "○○○○", "□□□□", "△△△△"
... is obtained. It is not clear which model numbers correspond to which specifications. But,
XML documents have the feature of having a clear hierarchical structure, and the same type of data and semantically related data are conventionally enclosed in the same XML tag and put together in the same hierarchy.
According to this principle, it can be determined that <model number> and <specification> in the same hierarchy enclosed by an XML tag of <model> correspond to each other. As described above, if the hierarchical structure of the XML tag is used as a clue, data corresponding to each other such as a model number “8244” and a specification “XXXXX”, and a model number “8128” and a specification “□□□□”. They can be combined into the same layout form 70.

【0036】なお、XML文書における階層構造やタグ
定義については、業界で標準化を図る動きもある。その
標準化が進めば、レイアウトフォーム作成処理において
も、XML文書の基本的な階層構造を記憶し、あらかじ
め上位階層のXMLタグをサンプルとなる元データから
取得しておくなどして、より汎用性の高い情報の集約整
理が可能になる。
There is a movement in the industry to standardize the hierarchical structure and tag definitions in XML documents. As the standardization progresses, even in the layout form creation process, the basic hierarchical structure of the XML document is stored, and the XML tags of the upper hierarchy are acquired in advance from the original data as a sample, thereby increasing the versatility. High-level information can be aggregated and organized.

【0037】また、データを抽出するための元データが
複数にわたっている場合も、前記と同様に、抽出したデ
ータ間の対応関係を判別する必要がある。この場合は、
異なる元データから抽出した集約データを対比し、集約
データの一部が一致するもの同士を合成することによ
り、ひとまとまりの集約データとして結合することがで
きる。図5(a)のスペック表と同(b)の価格表の例
では、スペック表から[型番「8244」・スペック
「○○○○」]という集約データを抽出し、価格表から
[型番「8244」・価格「XXX」]という集約デー
タを抽出した後、型番「8244」というデータをキー
にして二つの集約データを結合する。これにより、[型
番「8244」・スペック「○○○○」・価格「XX
X」]という集約データを生成することができる。この
ように複数組の集約データを結合するためには、レイア
ウトフォーム作成処理において、ユーザの注目している
項目をあらかじめキー項目として指定しておく必要があ
る。このキー項目を適切に設定することにより、ユーザ
が求める情報をより有用な形態で集約することができ
る。
Also, when there are a plurality of original data for extracting data, it is necessary to determine the correspondence between the extracted data in the same manner as described above. in this case,
By comparing the aggregated data extracted from the different original data and synthesizing those in which a part of the aggregated data matches, it is possible to combine the aggregated data as a set of aggregated data. In the example of the price table shown in FIG. 5A and the price table shown in FIG. 5B, aggregated data of [model number “8244” and specification “xxxxxx”] is extracted from the specification table, and [model number “ After extracting the aggregated data of “8244” and price “XXX”], the two aggregated data are combined using the data of the model number “8244” as a key. As a result, [model number “8244”, specification “XXXXX”, price “XX
X "]. In order to combine a plurality of sets of aggregated data in this manner, it is necessary to previously specify an item of interest of the user as a key item in the layout form creation processing. By appropriately setting the key items, information required by the user can be collected in a more useful form.

【0038】次に、図11の中でS32で示した空欄処
理について説明する。空欄処理は、元データから必要な
データの抽出ができず、レイアウトフォーム70上のデ
ータ入力部72のいずれかに空欄が残ったとき、その空
欄を埋めるかどうかをユーザの追加入力によって判断
し、必要がある場合は再度、データの抽出を行う処理で
ある。
Next, the blank processing shown in S32 in FIG. 11 will be described. In the blank processing, when necessary data cannot be extracted from the original data and a blank remains in any of the data input units 72 on the layout form 70, it is determined whether or not to fill the blank by an additional input by the user. If necessary, the data is extracted again.

【0039】レイアウトフォーム70上にデータの抽出
ができなかったデータ入力部72がある場合、そのデー
タ入力部72は、一旦、空欄で表示されユーザに通知さ
れる。このときユーザは、データ処理部20に対し、以
下の2種類の命令を行うことができる。
If there is a data input section 72 on the layout form 70 from which data could not be extracted, the data input section 72 is displayed once in a blank space and notified to the user. At this time, the user can issue the following two types of commands to the data processing unit 20.

【0040】第一は、抽出条件を変更しての再抽出であ
る。これは、空欄となったデータ入力部72について、
データ抽出の際の検索キーとなるXMLタグを変更また
は追加入力して抽出条件を変更し、同じ元データを再
度、検索することにより、最初に取りこぼしたデータを
抽出し直す処理である。
The first is re-extraction after changing the extraction conditions. This is because, for the data input section 72 which is blank,
This is a process of changing or additionally inputting an XML tag serving as a search key at the time of data extraction to change an extraction condition, and retrieving the same original data again, thereby extracting data that was initially dropped.

【0041】第二は、元情報の範囲を拡大しての元デー
タの再取得である。これは、元情報の指定範囲を変更ま
たは追加して、より広い範囲から元データを再取得した
後、再び集約データ生成処理を行うことにより、新たな
データを補充する処理である。
The second is re-acquisition of the original data by expanding the range of the original information. This is a process of changing or adding the designated range of the original information, reacquiring the original data from a wider range, and performing the aggregated data generation process again to supplement the new data.

【0042】これらの処理の流れを図13に示す。まず
S321で、データの再抽出を行うべき空欄を選択す
る。次にS322で、この空欄のデータ入力部72に指
定するXMLタグの再入力を行うべきか否かを判断し、
必要に応じてS323で再入力およびそのXMLタグの
保存を行う。再入力を行わない場合は、そのままS32
4に移り、元データを再取得するためのデータセットの
追加入力を行う。ここでは、新たに元データを取得しな
おすための元情報の範囲をURL等により追加する。か
かるURLは、複数件でも可とする。データセットの追
加入力を行った場合は、S325で再取得されたデータ
セットを元データ取得部22に保存する。データセット
の再取得を行わない場合は、そのままS326に移る。
そして、新たに入力されたXMLタグまたは新たに取得
された元データに基づき、既述の集約データ生成処理
(S30)と同じ手順にて、この空欄に対する集約デー
タ生成処理を行う。
FIG. 13 shows the flow of these processes. First, in S321, a blank to be re-extracted is selected. Next, in S322, it is determined whether or not the XML tag specified in the blank data input section 72 should be re-input.
If necessary, re-input and storage of the XML tag are performed in S323. If re-input is not performed, S32 is left as it is.
Then, the process proceeds to step 4 to additionally input a data set for reacquiring the original data. Here, the range of the original information for newly acquiring the original data is added by a URL or the like. Such URLs may be plural. When the additional input of the data set is performed, the data set reacquired in S325 is stored in the original data acquisition unit 22. If the data set is not to be reacquired, the process proceeds to S326.
Then, based on the newly input XML tag or the newly acquired original data, aggregate data generation processing for this blank is performed in the same procedure as the above-described aggregated data generation processing (S30).

【0043】こうして生成した集約データを、図11の
S33で、データ記憶部30内の集約データ記憶部34
に保存する。保存される集約データのデータ構造を図1
4に例示する。集約データ80は、フォームデータ名8
1、XMLタグ名82、抽出データ83、抽出元データ
84、の4要素で構成される。フォームデータ名81
は、この集約データ80を生成する元になったレイアウ
トフォーム70の名称、XMLタグ名82は、データを
抽出するための検索に用いたXMLタグの名称、抽出デ
ータ83は、前記XMLタグでの検索によって抽出した
文字列などのデータ要素、抽出元データ84は、前記抽
出データ83を取得したデータセットのファイル名やU
RLを、それぞれ示す。フォームデータ名81以外のデ
ータ要素は、必要な数だけ、互いに対応づけられて同時
に保存される。
The aggregated data generated in this way is stored in the aggregated data storage unit 34 in the data storage unit 30 in S33 of FIG.
To save. Figure 1 shows the data structure of the aggregated data to be stored
4 is illustrated. The aggregate data 80 is the form data name 8
1, XML tag name 82, extraction data 83, and extraction source data 84. Form data name 81
Is the name of the layout form 70 from which the aggregated data 80 was generated, the XML tag name 82 is the name of the XML tag used in the search for extracting data, and the extracted data 83 is the name of the XML tag. A data element such as a character string extracted by the search and the extraction source data 84 are the file name or U
RL are indicated respectively. A required number of data elements other than the form data name 81 are simultaneously stored in association with each other.

【0044】<出力処理>S30の集約データ生成処理
によって集約データが生成・保存されると、続いて、S
40の出力処理を行う。この出力処理では、フォームデ
ータ記憶部33に保存されたフォームデータと、集約デ
ータ記憶部34に保存された集約データとの組み合わせ
により、レイアウトフォーム70に合わせた集約データ
の表示が行われる。前記した図12は、図4に例示した
レイアウトフォーム70を元にして、図5に例示した元
情報から必要なデータを集約整理したときの最終的な表
示形態を例示したものである。
<Output Process> When the aggregated data is generated and stored by the aggregated data generation process of S30, the process proceeds to S30.
40 output processing is performed. In this output process, the combined data displayed in the layout form 70 is displayed by a combination of the form data stored in the form data storage unit 33 and the combined data stored in the combined data storage unit 34. FIG. 12 described above illustrates a final display form when necessary data is consolidated and arranged from the original information illustrated in FIG. 5 based on the layout form 70 illustrated in FIG.

【0045】なお、出力の形態としては、抽出されたデ
ータが含まれていた元情報へのアクセスを容易にするた
めに、抽出されたデータが記載されていた元データのフ
ァイル名やURLを同時に表示することも考えられる。
これによれば、ユーザが集約情報を見て、それに関連す
る情報を追加的に探索・収集することが容易になる。ま
た、WWW上のURLであれば、自動的にリンクを生成
することでアクセスがより簡単になる。
In order to facilitate access to the original information containing the extracted data, a file name and a URL of the original data in which the extracted data is described are simultaneously output. It may be displayed.
According to this, it becomes easy for the user to look at the aggregated information and additionally search and collect information related thereto. In the case of a URL on the WWW, access is made easier by automatically generating a link.

【0046】また、図12のようなデータシート形式で
蓄積された複数セットの集約データを、図15に示すよ
うな一覧表形式で1ページ(1画面)に表示することに
より、集約情報の一覧性や比較性を高めることも可能で
ある。
By displaying a plurality of sets of aggregated data stored in a data sheet format as shown in FIG. 12 on one page (one screen) in a list format as shown in FIG. 15, a list of aggregated information is displayed. It is also possible to enhance sexuality and comparability.

【0047】[0047]

【発明の効果】本発明の情報の集約整理支援システム
は、ユーザが求める情報の表示形態を決定するとともに
抽出すべきデータのキーとなるタグを指定して保存する
レイアウトフォーム作成手段と、元情報から前記タグを
含む元データを取得する情報取得手段と、前記元データ
から前記タグに対応するデータを抽出して集約データを
生成する情報集約手段と、前記情報集約手段により生成
された集約データを前記レイアウトフォームに合わせて
出力する集約情報出力手段とを備えて構成されるので、
大量の情報の中からユーザが求める情報を効率的に、か
つ精度良く抽出し、それをユーザの好みの表示形態で表
示することが可能になる。したがって、情報の整理や閲
覧、比較分析などを迅速かつ効率的に行うことができ
る。
According to the present invention, there is provided an information summarizing and organizing support system which determines a display mode of information required by a user, specifies a tag which is a key of data to be extracted, and saves the layout form. Information acquisition means for acquiring the original data including the tag from, information aggregation means for extracting data corresponding to the tag from the original data to generate aggregated data, and aggregated data generated by the information aggregation means Since it is configured to include an integrated information output unit that outputs in accordance with the layout form,
It is possible to efficiently and accurately extract information required by a user from a large amount of information, and display the information in a display form desired by the user. Therefore, it is possible to quickly and efficiently organize and browse information and perform comparative analysis.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の実施の形態にかかる情報の集約整理支
援システムのシステム構成図である。
FIG. 1 is a system configuration diagram of an information aggregation / arrangement support system according to an embodiment of the present invention.

【図2】本発明による情報の集約整理処理の流れを示す
フローチャートである。
FIG. 2 is a flowchart showing a flow of an information aggregation / arrangement process according to the present invention.

【図3】図2中のレイアウトフォーム作成処理の流れを
示すフローチャートである。
FIG. 3 is a flowchart showing a flow of a layout form creation process in FIG. 2;

【図4】具体的なレイアウトフォームの作成例を示す図
である。
FIG. 4 is a diagram showing a specific example of creating a layout form.

【図5】元情報の一例として、ある製品のスペック表
(a)および価格表(b)の表示形態を示した図であ
る。
FIG. 5 is a diagram showing a display form of a specification table (a) and a price table (b) of a certain product as an example of original information.

【図6】図5(a)に示したスペック表の論理構造の一
部をXML形式で表現した図である。
6 is a diagram expressing a part of the logical structure of the specification table shown in FIG. 5A in an XML format.

【図7】図3中の入力スペースの関連付けにおいて、X
MLタグの入力を支援する方法を示すフローチャートで
ある。
FIG. 7 shows an example of X in association of the input space in FIG.
9 is a flowchart illustrating a method for supporting input of an ML tag.

【図8】レイアウトフォームのデータ構造を模式的に例
示した図である。
FIG. 8 is a diagram schematically illustrating a data structure of a layout form.

【図9】図2中の元データ取得処理の流れを示すフロー
チャートである。
FIG. 9 is a flowchart showing a flow of an original data acquisition process in FIG. 2;

【図10】図9中の元データ取得処理における元データ
の探索・保存処理の流れを示すフローチャートである。
FIG. 10 is a flowchart showing a flow of an original data search and storage process in the original data acquisition process in FIG. 9;

【図11】図2中の集約データ生成処理の流れを示すフ
ローチャートである。
FIG. 11 is a flowchart showing a flow of an aggregated data generation process in FIG. 2;

【図12】本発明によって最終的に出力される集約情報
の編集例を示す図である。
FIG. 12 is a diagram showing an example of editing aggregated information finally output by the present invention.

【図13】図11中の集約データ生成処理における空欄
処理の流れを示すフローチャートである。
13 is a flowchart showing a flow of a blank process in the aggregated data generation process in FIG.

【図14】集約データのデータ構造を模式的に例示した
図である。
FIG. 14 is a diagram schematically illustrating a data structure of aggregated data.

【図15】集約データを一覧表形式で表示したときの表
示例を示す図である。
FIG. 15 is a diagram illustrating a display example when aggregated data is displayed in a list format.

【符号の説明】[Explanation of symbols]

21 レイアウトフォーム作成部(レイアウトフォーム
作成手段) 22 元データ取得部(情報取得手段) 23 取捨選択部(情報集約手段) 61 出力制御部(集約情報出力手段) 70 レイアウトフォーム 80 集約データ
21 layout form creation unit (layout form creation unit) 22 original data acquisition unit (information acquisition unit) 23 sorting unit (information aggregation unit) 61 output control unit (aggregated information output unit) 70 layout form 80 aggregated data

Claims (11)

【特許請求の範囲】[Claims] 【請求項1】 ユーザが求める情報を集約して表示する
ためのレイアウトフォームを決定するとともに、そのレ
イアウトフォーム内の項目に対応するデータを抽出する
ためのキーとなるタグを保存するレイアウトフォーム作
成手段と、 ユーザが指定した元情報の範囲内から前記タグを含む元
データを取得する情報取得手段と、 前記元データから前記タグに対応するデータを抽出して
集約データを生成する情報集約手段と、 前記情報集約手段により生成された集約データを前記レ
イアウトフォームに合わせて出力する集約情報出力手段
と、 を備えることを特徴とする情報の集約整理支援システ
ム。
1. A layout form creation means for deciding a layout form for collecting and displaying information required by a user and storing a tag serving as a key for extracting data corresponding to an item in the layout form. And information acquisition means for acquiring original data including the tag from within the range of the original information specified by the user; information aggregation means for extracting aggregated data by extracting data corresponding to the tag from the original data; An integrated information output unit that outputs the integrated data generated by the information aggregating unit in accordance with the layout form.
【請求項2】 レイアウトフォーム作成手段において、
キーとなるタグにXMLタグを使用することを特徴とす
る請求項1に記載の情報の集約整理支援システム。
2. A layout form creation means, comprising:
2. The information aggregation / arrangement support system according to claim 1, wherein an XML tag is used as a key tag.
【請求項3】 レイアウトフォーム作成手段において、
XMLタグとレイアウトフォーム内の項目とを関連付け
るにあたり、XML文書からXMLタグの付与された箇
所をドラッグ・アンド・ドロップ操作により入力できる
ように構成されたことを特徴とする請求項2に記載の情
報の集約整理支援システム。
3. The layout form creation means,
3. The information according to claim 2, wherein, when associating the XML tag with an item in the layout form, a portion to which the XML tag is added can be input from the XML document by a drag-and-drop operation. Aggregation and sorting support system.
【請求項4】 情報取得手段は、レイアウトフォームに
対応する元データを、ユーザがURLにより指定したW
WW上のウェブページから取得するように構成されたこ
とを特徴とする請求項1に記載の情報の集約整理支援シ
ステム。
4. An information acquisition unit according to claim 1, wherein the original data corresponding to the layout form is designated by a W
2. The information aggregation and consolidation support system according to claim 1, wherein the system is configured to acquire the information from a web page on the WW.
【請求項5】 情報取得手段は、レイアウトフォームに
対応する元データをユーザが指定したWWW上のウェブ
ページから抽出できない場合に、前記ウェブページから
リンクをたどって他のウェブページを探索することによ
り、必要な元データを補充するように構成されたことを
特徴とする請求項4に記載の情報の集約整理支援システ
ム。
5. The information acquiring means, when the original data corresponding to the layout form cannot be extracted from the web page specified by the user on the WWW, by following the link from the web page and searching for another web page. 5. The information aggregation and consolidation support system according to claim 4, wherein the system is configured to supplement necessary original data.
【請求項6】 情報集約手段は、情報取得手段によって
取得された元データから、共通のレイアウトフォームで
複数セットの集約データを生成することを特徴とする請
求項1に記載の情報の集約整理支援システム。
6. The information consolidating and organizing support according to claim 1, wherein the information consolidating means generates a plurality of sets of consolidated data in a common layout form from the original data acquired by the information acquiring means. system.
【請求項7】 情報集約手段は、情報取得手段によって
取得された複数セットの元データから、タグに対応する
データを抽出して集約データを生成することを特徴とす
る請求項1に記載の情報の集約整理支援システム。
7. The information according to claim 1, wherein the information aggregating unit extracts aggregated data by extracting data corresponding to the tag from a plurality of sets of original data acquired by the information acquiring unit. Aggregation and sorting support system.
【請求項8】 情報集約手段においてレイアウトフォー
ム内の全項目に対応するデータを元データから抽出でき
なかった場合に、データの抽出ができなかった項目のタ
グを変更または追加して、元データの再取得ができるよ
うに構成されたことを特徴とする請求項1に記載の情報
の集約整理支援システム。
8. When data corresponding to all items in the layout form cannot be extracted from the original data by the information aggregating means, the tag of the item for which data could not be extracted is changed or added, and 2. The information aggregation / arrangement support system according to claim 1, wherein the system is configured to enable reacquisition.
【請求項9】 情報集約手段においてレイアウトフォー
ム内の全項目に対応するデータを元データから抽出でき
なかった場合に、元データを取得する対象となる元情報
の指定範囲を変更または追加して、元データの再取得が
できるように構成されたことを特徴とする請求項1に記
載の情報の集約整理支援システム。
9. When the information aggregating means cannot extract data corresponding to all items in the layout form from the original data, the designated range of the original information from which the original data is to be obtained is changed or added. 2. The system according to claim 1, wherein the original data can be re-acquired.
【請求項10】 集約情報出力手段は、情報集約手段に
おいて抽出したデータがどの元データから抽出されたも
のであるかを示す抽出元情報を表示するように構成され
たことを特徴とする請求項1に記載の情報の集約整理支
援システム。
10. The integrated information output means is configured to display extraction source information indicating from which original data the data extracted by the information integration means is extracted. 1. The information aggregation and support system described in 1.
【請求項11】 集約情報出力手段は、共通のレイアウ
トフォームで生成された複数セットの集約データを一覧
表形式で表示するように構成されたことを特徴とする請
求項6に記載の情報の集約整理支援システム。
11. The aggregation of information according to claim 6, wherein the aggregation information output unit is configured to display a plurality of sets of aggregation data generated in a common layout form in a list format. Organizing support system.
JP2000365373A 2000-11-30 2000-11-30 Information consolidation support system Expired - Fee Related JP3877957B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000365373A JP3877957B2 (en) 2000-11-30 2000-11-30 Information consolidation support system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000365373A JP3877957B2 (en) 2000-11-30 2000-11-30 Information consolidation support system

Publications (2)

Publication Number Publication Date
JP2002169836A true JP2002169836A (en) 2002-06-14
JP3877957B2 JP3877957B2 (en) 2007-02-07

Family

ID=18836150

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000365373A Expired - Fee Related JP3877957B2 (en) 2000-11-30 2000-11-30 Information consolidation support system

Country Status (1)

Country Link
JP (1) JP3877957B2 (en)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2390453A (en) * 2002-07-03 2004-01-07 Nec Corp Searching for Tagged Data in a Structured Document
JP2005309498A (en) * 2004-04-16 2005-11-04 Kddi Corp Information extraction system, information extraction method and computer program
CN1328687C (en) * 2003-06-11 2007-07-25 中兴通讯股份有限公司 Centralized broad spectrum report generation method based on expandable sign language
JPWO2005098659A1 (en) * 2004-04-08 2008-02-28 株式会社ジャストシステム Document processing apparatus and document processing method
JP2010026802A (en) * 2008-07-18 2010-02-04 Profield Co Ltd Information processor
US10726076B2 (en) 2014-11-14 2020-07-28 Fujitsu Limited Information acquisition method, and information acquisition device

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012009005A (en) * 2010-05-24 2012-01-12 Pfu Ltd Business form processing system, ocr device, ocr processing program, business form creation device, business form creation program, and business form processing method

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2390453A (en) * 2002-07-03 2004-01-07 Nec Corp Searching for Tagged Data in a Structured Document
CN1328687C (en) * 2003-06-11 2007-07-25 中兴通讯股份有限公司 Centralized broad spectrum report generation method based on expandable sign language
JPWO2005098659A1 (en) * 2004-04-08 2008-02-28 株式会社ジャストシステム Document processing apparatus and document processing method
JP2005309498A (en) * 2004-04-16 2005-11-04 Kddi Corp Information extraction system, information extraction method and computer program
JP4558369B2 (en) * 2004-04-16 2010-10-06 Kddi株式会社 Information extraction system, information extraction method, and computer program
JP2010026802A (en) * 2008-07-18 2010-02-04 Profield Co Ltd Information processor
US10726076B2 (en) 2014-11-14 2020-07-28 Fujitsu Limited Information acquisition method, and information acquisition device

Also Published As

Publication number Publication date
JP3877957B2 (en) 2007-02-07

Similar Documents

Publication Publication Date Title
EP2041672B1 (en) Methods and apparatus for reusing data access and presentation elements
EP1376408B1 (en) Extraction of information from structured documents
US20090019386A1 (en) Extraction and reapplication of design information to existing websites
US20050283453A9 (en) Concept navigation in data storage systems
EP1582976A2 (en) Graphical user interface for guiding the customisation of layout templates
US20120102390A1 (en) Method and apparatus for generating widget
JP2006285513A (en) Information processing support system, and information processing support program
Ahmadi et al. User-centric adaptation of Web information for small screens
Götz Supporting systematic literature reviews in computer science: the systematic literature review toolkit
JP2005050078A (en) Structured document processor, structured document processing method and program
JP2002169836A (en) Support system for integration and rearrangement of information
JP2000020537A (en) Text retrieving device and computer-readable recording medium having recorded text retrieving program thereon
JP2001109741A (en) Method and system for preparing html data
JP2007279978A (en) Document retrieval device and document retrieval method
US20120150899A1 (en) System and method for selectively generating tabular data from semi-structured content
JP2012150638A (en) Content recommendation device, content recommendation method and program
JP2003281149A (en) Method of setting access right and system of structured document management
JP4133549B2 (en) Structured document file management apparatus and structured document file management method
CN113407678B (en) Knowledge graph construction method, device and equipment
JP2008046879A (en) Page display device, page display method and computer program
KR20020061443A (en) Method and system for data gathering, processing and presentation using computer network
Fernandes et al. Transcoding for web accessibility for the blind: Semantics from structure
JP2004118543A (en) Method for retrieving structured document, and method, device and program for supporting retrieval
KR20000049713A (en) Web-based Internet Newspaper Edit System and Edit Method
JP2000148766A (en) Method and device for internet information acquisition

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060214

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060417

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060711

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060906

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20061031

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20061101

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 3877957

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091110

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101110

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111110

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111110

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121110

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121110

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131110

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees