JP2003167879A - タグ付き情報表示方法,タグ付き情報表示プログラム,及びタグ付き情報表示装置 - Google Patents

タグ付き情報表示方法,タグ付き情報表示プログラム,及びタグ付き情報表示装置

Info

Publication number
JP2003167879A
JP2003167879A JP2001370102A JP2001370102A JP2003167879A JP 2003167879 A JP2003167879 A JP 2003167879A JP 2001370102 A JP2001370102 A JP 2001370102A JP 2001370102 A JP2001370102 A JP 2001370102A JP 2003167879 A JP2003167879 A JP 2003167879A
Authority
JP
Japan
Prior art keywords
information
tag
tagged
conversion rule
extracted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2001370102A
Other languages
English (en)
Other versions
JP4251804B2 (ja
Inventor
Yoshinori Katayama
佳則 片山
Fumito Nishino
文人 西野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2001370102A priority Critical patent/JP4251804B2/ja
Publication of JP2003167879A publication Critical patent/JP2003167879A/ja
Application granted granted Critical
Publication of JP4251804B2 publication Critical patent/JP4251804B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【目的】 利用者の要求に応じて、任意の種類の情報を
タグ付き文書から抽出して表示することができるタグ付
き情報表示方法を、提供することである。 【構成】タグ付き文書表示プログラム23を実行してい
るCPU1は、サンプルXMLテキストのタグ構造を抽
出し、抽出されたタグ構造の中から、情報利用者が必要
とする情報の種類を示すものとしてプロファイル25に
列挙されていたキーワードと同一又は同義のタグを、そ
の上位タグともに、抽出する。更に、CPU1は、抽出
されたタグを画面表示し、オペレータによる編集,即
ち、項目の削除,一項目として表示すべき情報の種類を
特定するIDの結合を受け付ける。CPU1は、編集後
のタグを変換規則として用い、変換規則中のIDに対応
したタグに基づいて、表示対象XMLから情報を抽出
し、抽出した情報を、当該タグに対応したフィールド名
称とともに、表示する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、タグ付き情報から
オペレータに必要な情報を抽出して表示するためのタグ
付き情報表示方法,タグ付き情報表示プログラム,及び
タグ付き情報表示装置に、関する。
【0002】
【従来の技術】近年、インターネットやイントラネット
の発展により、WEB上のハイパーテキスト,データベ
ース,新聞,書籍等の印刷,出版物を含め、莫大な情報
が簡単に入手可能となっている。これらの情報は様々な
形式で記述されているので、オペレータに必要な情報を
含む文書がヒットしたとしても、ヒットした莫大な文書
中からオペレータに必要な情報を探し出して、これを目
的にあった型に整理しなおさなければ、その利用は難し
い。
【0003】そのため、検索対象となる文書から情報を
抽出して整理するための技術開発が進められているが、
このような技術においては、検索対象となる文書には、
それに含まれる個々の情報の意味を明らかにするための
XML(Extensible MarkupLanguate)やSGML(Sta
ndard Generalized Markup Language)等による情報タ
グが付与され、文書を検索するツールや整理保存するツ
ールには、これら情報タグを手懸かりに必要な情報を知
識として抽出する機能が備えられている。
【0004】
【発明が解決しようとする課題】しかしながら、これら
のツールは、情報の検索や整理等の処理目的に依って夫
々事前に用意されるものであるので、その処理結果の表
示形式も、ツール毎に異なった画一的なものであった。
一方、情報の使用目的は個々の利用者毎に異なる。例え
ば、利用者の職制(管理職,一般職等)や対象業務(営
業,サービスエンジニア,開発)毎に、必要とする情報
の内容は異なり、出力結果の利用方法(詳細である必要
があるか概要で足りるか,内部資料として利用されるか
外部資料として利用されるか)や表示方法(リスト形
式,カード形式)によっても、表示すべき情報の範囲は
異なってくる。
【0005】本発明は、このような問題点に鑑みてなさ
れたものであり、その課題は、利用者の要求に応じて、
任意の種類の情報をタグ付き情報から抽出して表示する
ことができるタグ付き情報表示方法,タグ付き情報表示
プログラム,及びタグ付き情報表示装置を、提供するこ
とである。
【0006】
【課題を解決するための手段】上記課題を解決するため
に案出された本発明によるタグ付き情報表示方法は、予
め、前記利用者が必要とする情報の種類を示す一又は複
数のキーワードを含むプロファイルを生成するプロファ
イル生成ステップと、サンプルとなるタグ付き情報か
ら、そのタグ付き情報に含まれる複数のタグを抽出する
タグ構造抽出ステップと、抽出された複数のタグから、
更に、前記キーワードに相当するタグのみを抽出し、変
換規則情報として生成する変換規則生成ステップと、表
示対象のタグ付き情報から、前記変換規則に含まれるタ
グと同じタグによって特定されている情報を抽出する情
報抽出ステップと、抽出された情報を表示する表示ステ
ップとを、順次行うことを特徴とする。
【0007】また、本発明によるタグ付き情報表示プロ
グラムは、コンピュータに対して、利用者が必要とする
情報の種類を示す一又は複数のキーワードを含むプロフ
ァイルを生成するプロファイル生成ステップと、サンプ
ルとなるタグ付き情報から、そのタグ付き情報に含まれ
る複数のタグを抽出するタグ構造抽出ステップと、抽出
された複数のタグから、更に、前記キーワードに相当す
るタグのみを抽出し、変換規則情報として生成する変換
規則生成ステップと、表示対象のタグ付き情報から、前
記変換規則に含まれるタグと同じタグによって特定され
ている情報を抽出する情報抽出ステップと、抽出された
情報を表示する表示ステップとを、順次実行させること
を特徴とする。
【0008】また、本発明によるタグ付き情報表示装置
は、予め、前記利用者が必要とする情報の種類を示す一
又は複数のキーワードを含むプロファイルを生成するプ
ロファイル生成手段と、サンプルとなるタグ付き情報か
ら、そのタグ付き情報に含まれる複数のタグを抽出する
タグ構造抽出手段と、抽出された複数のタグから、更
に、前記キーワードに相当するタグのみを抽出し、変換
規則情報として生成する変換規則生成手段と、表示対象
のタグ付き情報から、前記変換規則に含まれるタグと同
じタグによって特定されている情報を抽出する情報抽出
手段と、抽出された情報を表示する表示手段とを、備え
たことを特徴とする。
【0009】以上のように構成されると、サンプルとな
る一つ又は複数のタグ付き情報から、そのタグ付き情報
に含まれるタグが抽出される。そして、このように抽出
されたタグの中から、予め利用者が必要としている情報
の種類を示すプロファイル中のキーワードに相当するタ
グのみが、変換規則情報として抽出される。そして、上
述したようにして得られた変換規則に含まれるタグに相
当する情報が、表示対象タグ付き情報から抽出されて、
表示される。従って、個々の利用者が真に必要とする情
報のみが自動的に表示対象タグ付き情報から抽出されて
表示されるので、これらの情報を手作業で探し出す手間
が省ける。また、表示は、変換規則に従った統一的形式
でなされるので、種々雑多なタグ付き情報から必要な情
報を得ることが可能になる。
【0010】なお、本発明においてタグ付き情報には、
XML文書の他、SGML文書やHTML文書等、あら
ゆる種類のタグ付き文書が含まれる。
【0011】
【発明の実施の形態】以下、図面に基づいて、本発明の
実施の形態を説明する。 (実施形態の原理)図1は、本発明の実施形態の原理を
示す概念図である。この図1に示されたように、本実施
形態においては、インターネット上で拡布された印刷
物,出版物,データベース等から、XMLタグ付き情報
が、抽出,検索,分析等によって得られると、それら全
てのXMLタグ付き情報のタグ構造情報を統合した(足
し合わせた)タグ構造情報が得られる。一方、情報利用
者が必要とする情報を示すキーワードを列挙したプロフ
ァイルが、手動又は自動で生成される。そして、統合後
のタグ情報情報から、プロファイルに含まれるキーワー
ドと同一又は同義のタグのみがその階層構造を示す態様
で抽出され、更に、情報利用者によって編集がなされ、
変換規則として記憶される。そして、この変換規則によ
って指定されたタグを付された情報が、表示対象XML
テキストから抽出されて、表示される。 (実施形態のハードウェア構成)図2は、本発明による
タグ付き情報表示方法を実施するためのプログラム(タ
グ付き情報表示プログラム)を実行するコンピュータシ
ステム(タグ付き情報表示装置)を概略的に示すブロッ
ク図である。このコンピュータシステムは、ネットワー
ク(インターネット等)に接続して情報を収集する機能
を有するコンピュータとして、構成されている。
【0012】図2に示すように、このコンピュータは、
互いにバスBを介して接続されたCPU1,ハードディ
スク2,RAM3,通信デバイス4,表示装置5及び入
力装置6から、構成されている。
【0013】CPU1は、ハードディスク2に格納され
ている各種プログラムを実行することによって、コンピ
ュータ全体の制御を行い、情報処理を行う。
【0014】ハードディスク2には、前記各種プログラ
ムとともに、各種データが格納されている。このハード
ディスク2に格納されている各種プログラムには、通信
機能を備えたオペレーションシステム20,インターネ
ットやイントラネットを介してWEB上のコンテンツを
閲覧するためのブラウザプログラム21及びWEB上の
データベースから情報を検査するための検索ツール22
が、含まれている。更に、各種プログラムには、ブラウ
ザプログラム21や検索ツール22によって収集された
文書(XMLテキスト)から必要な情報を抽出して表示
するためのタグ付き情報表示プログラム23が、含まれ
る。なお、このタグ付き情報表示プログラム23は、C
PU1に対して、図3のフローチャートに示されたプロ
ファイル生成処理プロセス,図4及び図5のフローチャ
ートに示された事前処理プロセス,及び、図6のフロー
チャートに示された表示処理プロセスを、実行させる。
【0015】また、ハードディスク2に格納されている
各種データには、業種別オントロジー24,プロファイ
ル25及び変換規則26が含まれている。この業種別オ
ントロジー24は、各業種毎に、その業種において一般
的に使われている同義語をまとめてリスト化したもので
ある。また、プロファイル25は、このタグ付き情報表
示方法によって表示される情報を利用する各利用者毎に
用意されており、図9に示すように、夫々、そのユーザ
が必要とする情報の種類(即ち、XMLタグとして定義
され得る情報種類)をリストアップしたものである。ま
た、変換規則26は、CPU1が上記ハイパーテキスト
表示プログラム23による事前処理プロセスを実行する
ことによって各利用者毎に生成されたデータであり、図
15に示すように、表示対象XMLテキストから抽出す
べき情報の種類とその階層構造を定義するものである。
【0016】RAM3は、CPU1が上述した各種プロ
グラムを実行するに際して作業領域として利用されるラ
ンダムアクセスメモリであり、各種プログラムによって
生成された情報を一時的に記憶する。
【0017】通信デバイス4は、通信回線との間のイン
ターフェースであり、通信回線がアナログ電話回線であ
ればモデム(ADSLモデムを含む)が用いられ、デジ
タル回線であればTAが用いら、ローカルエリアネット
ワークであればLANカードが用いられる。
【0018】表示装置5は、CPU1によって生成され
た各種表示データに従った画面表示を行うCRT(Cath
ode-Ray-Tube),液晶表示パネル等である。
【0019】入力装置6は、オペレータがコマンド,デ
ータ等の情報を手入力するためのキーボード,ポインテ
ィングデバイス等である。 (実施形態の処理内容)次に、CPU1が上述したタグ
付文書表示プログラム23に従って実行する各種プロセ
スの内容を、説明する。 <プロファイル生成処理プロセス>図3に示すプロファ
イル生成処理プロセスは、このコンピュータのオペレー
タがデータ利用者である場合に、実行される。
【0020】このプロファイル生成処理がスタートして
最初のS001では、CPU1は、オペレータ(データ
利用者)によるプロファイル情報入力を受け付ける。即
ち、CPU1は、オペレータ(データ利用者)が必要と
する情報の種類を示す一又は複数のキーワードを入力す
るための所定フォーマットの入力画面を、表示装置5の
スクリーン上に表示し、この入力画面に一つ又は複数個
のキーワードが入力されるのを待つ。そして、1又は複
数個のキーワードが入力されると、CPU1は、処理を
S002へ進める。
【0021】S002では、CPU1は、S001にて
入力された全キーワード(即ち、プロファイル情報)に
基づいて、そのオペレータ(データ利用者)についての
プロファイル25を生成し、ハードディスク2に格納す
る。これととともに、検索キーワードのランキング順位
(初期状態においては、検索キーワードが未登録)を表
すランキング表をも、同時に、ハードディスク2に格納
する。
【0022】続くS003以降の処理は、他のプログラ
ムが実行されている裏で、並行実行される処理であり、
一旦、コンピュータの電源を落とした後であっても、電
源再投入後に、オペレーションシステム20の機能によ
り再スタートする。
【0023】S003では、CPU1は、オペレータ
(データ利用者)によって情報検索が実行されるのを待
つ。そして、情報検索が実行されると、CPU1は、処
理をS004へ進め、その情報検索において指定された
検索キーワードと同一又は同義のキーワードを、当該オ
ペレータ(データ利用者)専用にハードディスク2に格
納されているプロファイル25から探し出す。そして、
探し出されたキーワードについてのランキング表でのラ
ンキング順位を一つアップさせる。なお、検索キーワー
ドがランキング表に掲載されていない場合には、CPU
1は、検索キーワードをランキング表に追加する(登録
時においては10位とする)。
【0024】次のS005では、S004でのランクア
ップ後のランキング順位が1位となったか否かをチェッ
クする。そして、1位でなければ処理をS003に戻
し、1位であれば、S006にて当該検索キーワード
を、当該オペレータ(データ利用者)専用にハードディ
スク2に格納されているプロファイル25に追加した後
に、処理をS003に戻す。
【0025】以上のプロファイル生成処理が継続的に実
行されることにより、データ利用者であるオペレータが
必要としているデータを表示させるためのプロファイル
25が、先ず、オペレータによって手動生成され、その
後で、オペレータの情報収集履歴に応じて自動更新され
る(プロファイル作成ステップ、プロファイル作成手段
に相当)。従って、オペレータの役職や職種に適合した
キーワードを、任意に取捨選択して、プロファイル25
に含めることができるとともに、実際に必要な情報の種
類を示すキーワードが、自動的にプロファイル25に追
加される。 <事前処理プロセス>図4及び図5に示す事前処理プロ
セスは、情報利用者がデータ使用の目的を新たに設定し
た時に、オペレータによって任意に実行される。例え
ば、任意の検索キーワードを指定した検索(XML検索
等)を実行することによって多数のXMLテキスト(タ
グ付文書)が得られた時に、実行される。この事前処理
は、表示対象となる一群のXMLテキストの全て、もし
くは、その中から無作為に抽出した複数のXMLテキス
トに対して実行される。この事前処理の対象となるXM
Lテキストを、以下、サンプルテキストという。
【0026】この事前処理のスタート後、最初のS10
1では、CPU1は、サンプルテキストを一つ読み込
む。次のS102では、CPU1は、S101にて読み
込んだサンプルテキストからXMLタグ構造を抽出する
(タグ構造抽出ステップ、タグ構造抽出手段に相当)。
図8の例に示すように、このXMLタグ構造は、サンプ
ルテキストに付されたタグの名称(通常、そのタグによ
って囲まれる情報の種類を示す文言が充てられる)のみ
を、タグ相互間の階層構造を反映して抽出したデータで
ある。次のS103では、CPU1は、S102にて抽
出したXMLタグ構造を、「XMLタグ構造情報」とし
てRAM3に一次記憶する。
【0027】続いて、CPU1は、S104乃至S11
0のループ処理を実行する。このループ処理に入って最
初のS104では、CPU1は、未読込のサンプルテキ
ストがあるか否かをチェックする。そして、未読込のサ
ンプルテキストがある場合には、CPU1は、S105
において、次のサンプルテキストを読み込む。
【0028】次のS106では、CPU1は、S105
にて読み込んだサンプルテキストのXMLタグ構造を抽
出する(タグ構造抽出ステップ、タグ構造抽出手段に相
当)。次のS107では、CPU1は、S106にて抽
出したXMLタグ構造を構成するタグを一つ特定する。
次のS108では、CPU1は、S107にて特定した
タグと同一又は同義のタグがRAM3上のXMLタグ構
造情報に含まれているか否かを、チェックする。なお、
処理対象タグと同義のタグの範囲を調べるために、CP
U1は、上述した業種別オントロジー24を参照する。
そして、同一又は同義のタグがあった場合には、CPU
1は、処理をそのままS110へ進める。これに対し
て、同一又は同義のタグが無かった場合には、CPU1
は、S109において処理対象タグ(S107にて特定
されたタグ)をRAM3上のXMLタグ構造情報に統合
(処理対象タグの上層タグと同一又は同義のタグがあれ
ば当該タグの下層に追加,処理対象タブの上層タグと同
一又は同義のタグがなければ最上層に追加)した後に、
処理をS110へ進める。S110では、CPU1は、
S106にて抽出したXMLタグ構造中に未特定のタグ
が残っているか否かをチェックし、残っていれば処理を
S107に戻し、残っていなければ処理をS104に戻
す。
【0029】以上に説明したS104乃至S110のル
ープ処理を繰り返した結果、未処理のサンプルテキスト
が無くなったとS104にて判定した場合には、CPU
1は、処理をS104からS111へ進める。S111
では、CPU1は、指定された情報利用者専用のプロフ
ァイル25を、ハードディスク2から読み込む。
【0030】次のS112では、CPU1は、RAM3
上に最終的に残されたXMLタグ構造情報から、S11
1にて読み込んだプロファイルに列挙されたキーワード
と同一又は同義のタグ及びその上位タグを抽出する。こ
の場合も、同義のタグの範囲を調べるために、CPU1
は、業種別オントロジー24を参照する。
【0031】次のS113では、CPU1は、図10に
示されるように、S112にて抽出した各タグに、その
階層構造を表すID(下位階層のタグのID=上位階層
のタグのID×10+α)を付与する。
【0032】次のS114では、CPU1は、S113
にて付与したIDが示す階層構造通りにS112にて抽
出した各タグを表す変換規則作成画面を、表示装置5の
スクリーン上に表示する。この変換規則作成画面には、
図12の画面例に示されるように、最終的に表示する際
における各項目毎に、その項目の名称を書き込む欄
(「フィールド名称」欄),その項目に表示されるべき
情報に対応するタグ(XMLテキスト中で情報を直接囲
む最下位階層のタグ)のIDを指定する欄(「タグ対
応」欄),その項目に表示されるべき情報を表示するた
めのフォントの大きさを指定する欄(「フォントサイ
ズ」欄),そのフォントの色を指定する欄(「フォント
色」欄),及び、その項目を削除するためのチェックボ
ックスが、備えられている。初期状態においては、これ
ら各項目は、夫々、個々の最下位階層のタグ毎に用意さ
れ、「フィールド名称」欄及び「タグ対応」欄には、夫
々、そのタグについてのデータ(タグの文言,ID)
が、初期設定されている。オペレータは、「フィールド
名称」欄の内容を任意に書き換えることによって、その
項目の名称(フィールド名称)を変更したり、「タグ対
応」欄に他のIDを追記することによって、その項目に
複数種類の情報が表示されるようにしたり、「フォント
サイズ」欄及び「フォント色」欄に任意にデータを記述
することによって、その項目に表示される文字を任意に
設定することができる。なお、上述したように或る項目
の「タグ対応」欄に複数のIDを指定した場合には、追
記されたIDが元々「タグ対応」欄に記述されていた項
目は不要になるので、その項目を削除するためのチェッ
クボックスがチェックされる。また、この変換規則作成
画面には、各項目の上位階層の項目のフィールド名称
(即ち、上位階層のタグの文言)が変更不能な態様で記
述されているとともに、その上位階層の項目を削除する
ためのチェックボックスも備えられている。更に、この
変換規則作成画面には、各種ボタン(「タグ構造表示」
ボタン31,「画面更新」ボタン32,「リセット」ボ
タン33,「スタイルシート作成」ボタン34及び「終
了」ボタン35)が、含まれている。なお、この変換規
則作成画面は、表計算プログラムによる編集画面であっ
ても良い。
【0033】次のS115では、CPU1は、この変換
規則作成画面に対する入力を待つ。そして、「終了」ボ
タン35が押下(入力装置6に含まれるポインティング
デバイスによってカーソルが当該ボタン上に重ねられた
状態で、そのポインティングデバイスのクリックボタン
が押下される事、以下同じ)された場合には、この事前
処理プロセスを終了し、「タグ構造表示」ボタンが押下
された場合には、処理をS116へ進め、「スタイルシ
ート作成」ボタン34が押下された場合には、処理をS
117へ進め、その他の入力(即ち、他のボタンの押
下,各欄へのデータ記入又は変更,各チェックボックス
へのクリック)があった場合には、処理をS120へ進
める。
【0034】S116では、CPU1は、図13に示す
ようなXMLタグ構造画面を、表示装置5のスクリーン
上に表示する。図13に示されるように、このXMLタ
グ構造画面には、S112にて抽出されたタグが、S1
13にて付与されたIDとともに、一覧表示されてい
る。S116を完了すると、CPU1は、処理をS11
5に戻す。
【0035】また、S110では、CPU1は、入力の
内容に従った処理を実行する。例えば、各欄にデータ記
入があった場合(即ち、ポインティングデバイスによっ
て記入対象欄がアクティブにされた状態でキーボードに
よって文字が入力されること)には、CPU1は、入力
された文字を記入対象欄に表示する。また、チェックマ
ークが付されていないチェックボックスがクリックされ
た場合にはそのチェックボックスにチェックマークを表
示し、チェックマークが付されているチェックボックス
がクリックされた場合にはそのチェックボックスからチ
ェックマークを消去する。また、「画面更新」ボタン3
2が押下された場合には、その時点でチェックボックス
にチェックマークが付されている項目を消去する。ま
た、「リセット」ボタン33が押下された場合には、変
換規則作成画面の内容を初期状態に戻す。
【0036】また、S117では、その時点で変換規則
作成画面に設定されている各データの内容に従って、図
14に示すような変換規則確認画面を、表示装置5のス
クリーン上に表示する。図14に示されるように、この
変換規則確認画面には、変換規則作成画面に設定されて
いた各項目毎の「フィールド名称」欄の内容,「タグ対
応」欄の内容,「フォントサイズ」欄の内容及び「フォ
ント色」欄の内容が、一覧表示されている。更に、この
変換規則確認画面には、「作成」ボタン36及び「戻
る」ボタン37が含まれている。
【0037】次のS118では、CPU1は、変換規則
確認画面中の「作成」ボタン36又は「戻る」ボタン3
7が押下されるのを待つ。そして、「戻る」ボタン37
が押下された場合には、処理をS115に戻し、「作
成」ボタン36が押下された場合には、処理をS119
に進める。
【0038】S119では、変換規則確認画面に一覧表
示されていた各項目毎の情報をコード化することにょっ
て、図15に示されるような変換規則26を作成し、こ
の変換規則26をハードディスク2に格納する。S11
9を完了すると、CPU1は、この事前処理を完了す
る。S111乃至S119の処理が、変換規則生成ステ
ップ及び変換規則生成手段に相当する。
【0039】以上のようにしてハードディスク2内に格
納された変換規則は、サンプルテキストの抽出元となっ
たXMLテキスト群に対する表示処理のために使用可能
である他、同種のXMLテキスト群(同じ検索キーワー
ドを用いて他のデータベース等から検索されたXMLテ
キスト群,類似の検索キーワードを用いて同じデータベ
ース等から検索されたXMLテキスト群,等)に対する
表示処理のために使用可能である。
【0040】更に、複数人が必要とする情報の種類が共
通している事情がある場合には、これら複数人に共通す
るプロファイル25に基づいて変換規則26が生成され
ても良いし、或る一人に固有のプロファイル25に基づ
いて生成された変換規則26が、他の者に情報を提示す
るために用いられても良い。 <表示処理>図6に示す表示処理は、上述した事前処理
の完了後において、サンプルテキストの抽出元となった
XMLテキスト群に対して、また、その後において同種
のXMLテキスト群が得られた後に当該XMLテキスト
群に対して、実行される。即ち、何れかのデータ利用者
専用の変換規則26及びXMLテキスト群を指定したコ
マンドが入力されることによって、スタートする。
【0041】このプロファイル精製処理のスタート後に
おける最初のS201では、CPU1は、コマンドにお
いて指定された変換規則26を読み込む。
【0042】次のS202では、CPU1は、コマンド
において指定された表示対象XMLテキストを一つ読み
込む。
【0043】次のS203では、CPU1は、S201
にて読み込まれた変換規則26中の各タグについて、夫
々、そのタグと同一又は同義のタグが付された記述(変
換規則26中のタグに上位タグがある場合には、その上
位タグと同一又は同義の上位タグを有するタグが付され
た記述)を、抽出する(情報抽出ステップ、情報抽出手
段に相当)。
【0044】次のS204では、CPU1は、全ての表
示対象XMLテキストについて、S202及びS203
の処理を完了したか否かを、チェックする。そして、未
だ表示対象XMLテキストが残っている場合には、処理
をS202に戻し、次の表示対象XMLテキストに対す
る処理を実行する。
【0045】これに対して、表示対象XMLテキストが
残っていない場合には、CPU1は、処理をS204か
らS205へ進める。このS205では、CPU1は、
全表示対象XMLテキストに対してS203にて抽出さ
れた情報を、表示装置5のスクリーン上にリスト形式で
表示する(表示ステップ、表示手段に相当)。図16
は、このリスト表示のためのリスト画面例を示す。図1
6に示すように、このリスト画面には、S203にて抽
出された各記述に対応した項目のうちリスト表示すべき
項目を指定するための項目指定欄38,この項目指定欄
38に指定された項目について、各表示対象XMLテキ
ストから抽出された情報を一覧表示するためのリスト欄
39,及び、「カード表示」ボタン40が、含まれてい
る。
【0046】次のS206では、CPU1は、リスト画
面への入力を待ち、「カード表示」ボタン40が押下さ
れた場合には、処理をS207へ進め、それ以外の入力
があった場合には、処理をS209へ進める。このS2
09では、CPU1は、入力内容に応じた処理を実行す
る。例えば、項目指定欄38に表示されている項目が変
更された場合には、リスト欄39に一覧表示される内容
を、変更後の項目について各表示対象XMLテキストか
ら抽出された情報に変更する。S209の完了後、CP
U1は、処理をS206に戻す。
【0047】一方、S207では、CPU1は、リスト
欄39中でアクティブにされていた(押下されていた)
項目を含むXMLテキストについて、S203にて抽出
された情報を、表示装置5のスクリーン上にカード形式
で表示する(表示ステップ、表示手段に相当)。図17
は、このカード表示のためのカード画面例を示す。図1
7に示すように、このカード画面には、カード表示対象
のXMLテキストから抽出された全情報を一覧表示する
カード欄41,及び、「リスト表示」ボタン42が、含
まれている。
【0048】次のS708では、CPU1は、「リスト
表示」ボタン42が押下されるのを待つ。そして、「リ
スト表示」ボタン42が押下されると、CPU1は、処
理をS205へ戻す。
【0049】この表示処理が実行されることにより、オ
ペレータは、リスト画面のリスト欄39に一覧表示され
ている情報に基づいて、カード表示すべきXMLテキス
トを選択する。そして、選択されたXMLテキストに対
するカード表示画面によって、そのXMLテキストから
自己が必要とするものとして絞り込んだ情報を、一目で
見ることができる。このように、オペレータは、表示形
式を任意に切り替えることができる。このように切り替
えがなされても、既に情報は表示対象XMLテキストか
ら抽出されているので、直ぐに表示がなされる。 (付記1)タグ付き情報から利用者に必要な情報を抽出
して表示するためのタグ付き情報表示方法であって、予
め、前記利用者が必要とする情報の種類を示す一又は複
数のキーワードを含むプロファイルを生成するプロファ
イル生成ステップと、サンプルとなるタグ付き情報か
ら、そのタグ付き情報に含まれる複数のタグを抽出する
タグ構造抽出ステップと、抽出された複数のタグから、
更に、前記キーワードに相当するタグのみを抽出し、変
換規則情報として生成する変換規則生成ステップと、表
示対象のタグ付き情報から、前記変換規則に含まれるタ
グと同じタグによって特定されている情報を抽出する情
報抽出ステップと、抽出された情報を表示する表示ステ
ップとを、順次行うことを特徴とするタグ付き情報表示
方法。(1) (付記2)前記変換規則生成ステップでは、更に、抽出
したタグを操作者に提示し、変換規則に含めるタグ操作
者からの要求に従って制限することを特徴とする付記1
記載のタグ付き情報表示方法。(2) (付記3)前記プロファイル生成ステップでは、前記利
用者の情報収集履歴を考慮し、情報収集に多用されたキ
ーワードを前記プロファイルに含めることを特徴とする
付記1記載のタグ付き情報表示方法。(3) (付記4)前記変換規則生成ステップでは、更に、変換
規則に含められるタグに対応した項目名を設定し、前記
表示ステップでは、前記情報抽出ステップにおいて前記
変換規則に含まれたタグによって特定されているものと
して前記表示対象のタグ付き情報から抽出された情報
を、そのタグに対応した項目名を付して表示することを
特徴とする付記1記載のタグ付き情報表示方法。 (付記5)前記タグ構造抽出ステップでは、サンプルと
なる複数のタグ付き情報から夫々抽出された複数のタグ
を統合することを特徴とする付記1記載のタグ付き情報
表示方法。 (付記6)前記統合を行う際には、同義語同士を正規化
することを特徴とする付記5記載のタグ付き情報表示方
法。 (付記7)前記表示ステップでは、前記情報抽出ステッ
プにおいて複数のタグ付き情報から夫々抽出された情報
をリスト形式で表示することを特徴とする付記1記載の
タグ付き情報表示方法。 (付記8)前記表示ステップでは、前記情報抽出ステッ
プにおいて単一のタグ付き情報から抽出された複数の情
報をカード形式で表示することを特徴とする付記1記載
のタグ付き情報表示方法。 (付記7)コンピュータに対して、利用者が必要とする
情報の種類を示す一又は複数のキーワードを含むプロフ
ァイルを生成するプロファイル生成ステップと、サンプ
ルとなるタグ付き情報から、そのタグ付き情報に含まれ
る複数のタグを抽出するタグ構造抽出ステップと、抽出
された複数のタグから、更に、前記キーワードに相当す
るタグのみを抽出し、変換規則情報として生成する変換
規則生成ステップと、表示対象のタグ付き情報から、前
記変換規則に含まれるタグと同じタグによって特定され
ている情報を抽出する情報抽出ステップと、抽出された
情報を表示する表示ステップとを、順次実行させること
を特徴とするタグ付き情報表示プログラム。(4) (付記8)タグ付き情報から利用者に必要な情報を抽出
して表示するためのタグ付き情報表示装置であって、予
め、前記利用者が必要とする情報の種類を示す一又は複
数のキーワードを含むプロファイルを生成するプロファ
イル生成手段と、サンプルとなるタグ付き情報から、そ
のタグ付き情報に含まれる複数のタグを抽出するタグ構
造抽出手段と、抽出された複数のタグから、更に、前記
キーワードに相当するタグのみを抽出し、変換規則情報
として生成する変換規則生成手段と、表示対象のタグ付
き情報から、前記変換規則に含まれるタグと同じタグに
よって特定されている情報を抽出する情報抽出手段と、
抽出された情報を表示する表示手段とを備えたことを特
徴とするタグ付き情報表示装置。(5) (付記9)タグ付き情報から利用者に必要な情報を抽出
して表示するためのタグ付き情報表示方法であって、予
め、前記利用者が必要とする情報の種類を示す一又は複
数のキーワードを含むプロファイルを生成するプロファ
イル生成ステップと、サンプルとなるタグ付き情報か
ら、そのタグ付き情報に含まれる複数のタグを、その階
層構造を表す形態で抽出するタグ構造抽出ステップと、
抽出された複数のタグから、更に、前記キーワードに相
当する下位階層のタグのみを、その下位階層のタグの上
位階層に当たるタグと組み合わせて抽出し、変換規則情
報として生成する変換規則生成ステップと、表示対象の
タグ付き情報から、前記変換規則に含まれる下位階層の
タグ及び上位階層のタグの組合せと同じタグの組み合わ
せによって特定されている情報を抽出する情報抽出ステ
ップと、抽出された情報を表示する表示ステップとを、
順次行うことを特徴とするタグ付き情報表示方法。 (付記10)コンピュータに対して、利用者が必要とす
る情報の種類を示す一又は複数のキーワードを含むプロ
ファイルを生成するプロファイル生成ステップと、サン
プルとなるタグ付き情報から、そのタグ付き情報に含ま
れる複数のタグを、その階層構造を表す形態で抽出する
タグ構造抽出ステップと、抽出された複数のタグから、
更に、前記キーワードに相当する下位階層のタグのみ
を、その下位階層のタグの上位階層に当たるタグと組み
合わせて抽出し、変換規則情報として生成する変換規則
生成ステップと、表示対象のタグ付き情報から、前記変
換規則に含まれる下位階層のタグ及び上位階層のタグの
組合せと同じタグの組み合わせによって特定されている
情報を抽出する情報抽出ステップと、抽出された情報を
表示する表示ステップとを、順次実行させることを特徴
とするタグ付き情報表示プログラム。 (付記11)タグ付き情報から利用者に必要な情報を抽
出して表示するためのタグ付き情報表示装置であって、
予め、前記利用者が必要とする情報の種類を示す一又は
複数のキーワードを含むプロファイルを生成するプロフ
ァイル生成手段と、サンプルとなるタグ付き情報から、
そのタグ付き情報に含まれる複数のタグを、その階層構
造を表す形態で抽出するタグ構造抽出手段と、抽出され
た複数のタグから、更に、前記キーワードに相当する下
位階層のタグのみを、その下位階層のタグの上位階層に
当たるタグと組み合わせて抽出し、変換規則情報として
生成する変換規則生成手段と、表示対象のタグ付き情報
から、前記変換規則に含まれる下位階層のタグ及び上位
階層のタグの組合せと同じタグの組み合わせによって特
定されている情報を抽出する情報抽出手段と、抽出され
た情報を表示する表示手段とを備えたことを特徴とする
タグ付き情報表示装置。
【0050】
【発明の効果】以上のように構成された本発明の情報表
示方法によれば、利用者の要求に応じて、任意の種類の
情報を、タグ付き文書から抽出して表示することができ
る。
【図面の簡単な説明】
【図1】 本発明の一実施形態による情報表示システム
の概念図
【図2】 情報表示システムのハードウェア構成を示す
ブロック図
【図3】 タグ付き文書表示プログラムに従って実行さ
れるプロファイル生成処理プロセスを示すフローチャー
【図4】 タグ付き文書表示プログラムに従って実行さ
れる事前処理プロセスを示すフローチャート
【図5】 タグ付き文書表示プログラムに従って実行さ
れる事前処理プロセスを示すフローチャート
【図6】 タグ付き文書表示プログラムに従って実行さ
れる表示処理プロセスを示すフローチャート
【図7】 XMLテキストの一例を示す図
【図8】 XMLタグ構造情報の一例を示す図
【図9】 プロファイルの一例を示す図
【図10】 XMLタグ構造情報からプロファイルに従
って抽出されてIDが付されたタグの一例を示す図
【図11】 フィールド名称とIDとの関係を示す表
【図12】 変換規則作成画面を示す図
【図13】 タグ構造画面を示す図
【図14】 変換規則確認画面を示す図
【図15】 変換規則の一例を示す図
【図16】 リスト表示画面を示す図
【図17】 カード表示画面を示す図
【符号の説明】
1 CPU 2 ハードディスク 5 表示装置 6 入力装置 23 タグ付き文書表示プログラム 25 プロファイル 26 変換規則
───────────────────────────────────────────────────── フロントページの続き Fターム(参考) 5B009 NA06 TA11 VA02 VA09 5B075 KK07 ND03 NK02 NK31 NR03 NR20 PP30 PQ02 PR08 QP10 QS20 UU06

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】タグ付き情報から利用者に必要な情報を抽
    出して表示するためのタグ付き情報表示方法であって、 予め、前記利用者が必要とする情報の種類を示す一又は
    複数のキーワードを含むプロファイルを生成するプロフ
    ァイル生成ステップと、 サンプルとなるタグ付き情報から、そのタグ付き情報に
    含まれる複数のタグを抽出するタグ構造抽出ステップ
    と、 抽出された複数のタグから、更に、前記キーワードに相
    当するタグのみを抽出し、変換規則情報として生成する
    変換規則生成ステップと、 表示対象のタグ付き情報から、前記変換規則に含まれる
    タグと同じタグによって特定されている情報を抽出する
    情報抽出ステップと、 抽出された情報を表示する表示ステップとを、順次行う
    ことを特徴とするタグ付き情報表示方法。
  2. 【請求項2】前記変換規則生成ステップでは、更に、抽
    出したタグを操作者に提示し、変換規則に含めるタグ操
    作者からの要求に従って制限することを特徴とする請求
    項1記載のタグ付き情報表示方法。
  3. 【請求項3】前記プロファイル生成ステップでは、前記
    利用者の情報収集履歴を考慮し、情報収集に多用された
    キーワードを前記プロファイルに含めることを特徴とす
    る請求項1記載のタグ付き情報表示方法。
  4. 【請求項4】コンピュータに対して、 利用者が必要とする情報の種類を示す一又は複数のキー
    ワードを含むプロファイルを生成するプロファイル生成
    ステップと、 サンプルとなるタグ付き情報から、そのタグ付き情報に
    含まれる複数のタグを抽出するタグ構造抽出ステップ
    と、 抽出された複数のタグから、更に、前記キーワードに相
    当するタグのみを抽出し、変換規則情報として生成する
    変換規則生成ステップと、 表示対象のタグ付き情報から、前記変換規則に含まれる
    タグと同じタグによって特定されている情報を抽出する
    情報抽出ステップと、 抽出された情報を表示する表示ステップとを、順次実行
    させることを特徴とするタグ付き情報表示プログラム。
  5. 【請求項5】タグ付き情報から利用者に必要な情報を抽
    出して表示するためのタグ付き情報表示装置であって、 予め、前記利用者が必要とする情報の種類を示す一又は
    複数のキーワードを含むプロファイルを生成するプロフ
    ァイル生成手段と、 サンプルとなるタグ付き情報から、そのタグ付き情報に
    含まれる複数のタグを抽出するタグ構造抽出手段と、 抽出された複数のタグから、更に、前記キーワードに相
    当するタグのみを抽出し、変換規則情報として生成する
    変換規則生成手段と、 表示対象のタグ付き情報から、前記変換規則に含まれる
    タグと同じタグによって特定されている情報を抽出する
    情報抽出手段と、 抽出された情報を表示する表示手段とを備えたことを特
    徴とするタグ付き情報表示装置。
JP2001370102A 2001-12-04 2001-12-04 情報表示方法、情報表示プログラム及び情報表示装置 Expired - Fee Related JP4251804B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001370102A JP4251804B2 (ja) 2001-12-04 2001-12-04 情報表示方法、情報表示プログラム及び情報表示装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001370102A JP4251804B2 (ja) 2001-12-04 2001-12-04 情報表示方法、情報表示プログラム及び情報表示装置

Publications (2)

Publication Number Publication Date
JP2003167879A true JP2003167879A (ja) 2003-06-13
JP4251804B2 JP4251804B2 (ja) 2009-04-08

Family

ID=19179380

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001370102A Expired - Fee Related JP4251804B2 (ja) 2001-12-04 2001-12-04 情報表示方法、情報表示プログラム及び情報表示装置

Country Status (1)

Country Link
JP (1) JP4251804B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006236262A (ja) * 2005-02-28 2006-09-07 Fujitsu Ltd 情報抽出プロブラム及び方法
WO2006137564A1 (ja) * 2005-06-24 2006-12-28 Justsystems Corporation 文書処理装置
JP2010079857A (ja) * 2008-09-29 2010-04-08 Toshiba Corp 構造化データ検索プログラム及び構造化データ検索装置
JP2010182291A (ja) * 2009-02-03 2010-08-19 Nec (China) Co Ltd 知識注釈結果検査方法および知識注釈結果検査システム
JP4637113B2 (ja) * 2003-11-28 2011-02-23 キヤノン株式会社 階層データの好ましいビューを構築するための方法

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4637113B2 (ja) * 2003-11-28 2011-02-23 キヤノン株式会社 階層データの好ましいビューを構築するための方法
JP2006236262A (ja) * 2005-02-28 2006-09-07 Fujitsu Ltd 情報抽出プロブラム及び方法
WO2006137564A1 (ja) * 2005-06-24 2006-12-28 Justsystems Corporation 文書処理装置
JPWO2006137564A1 (ja) * 2005-06-24 2009-01-22 株式会社ジャストシステム 文書処理装置
JP2010079857A (ja) * 2008-09-29 2010-04-08 Toshiba Corp 構造化データ検索プログラム及び構造化データ検索装置
JP2010182291A (ja) * 2009-02-03 2010-08-19 Nec (China) Co Ltd 知識注釈結果検査方法および知識注釈結果検査システム
US8423503B2 (en) 2009-02-03 2013-04-16 Nec (China) Co., Ltd. Knowledge annotation result checking method and system

Also Published As

Publication number Publication date
JP4251804B2 (ja) 2009-04-08

Similar Documents

Publication Publication Date Title
US10706091B2 (en) User driven computerized selection, categorization, and layout of live content components
US20020123991A1 (en) Method for querying a database in which a query statement is issued to a database management system for which data types can be defined
TWI290698B (en) System and method for updating and displaying patent citation information
US20030018611A1 (en) Document information management system
US20030229631A1 (en) Database access mechanisms for a computer user interface
US20090313539A1 (en) Information processor, information processing method, and recording medium
US7908586B1 (en) Collapse on content property
JP2000242655A (ja) 情報処理装置、情報処理方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
US7895337B2 (en) Systems and methods of generating a content aware interface
JPH07175825A (ja) 文書の検索および表示方法
US8612431B2 (en) Multi-part record searches
JP4469432B2 (ja) インターネット情報処理装置、インターネット情報処理方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2004192355A (ja) 情報の検索方法およびその装置および情報検索のためのコンピュータプログラム
JP3767763B2 (ja) 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP4251804B2 (ja) 情報表示方法、情報表示プログラム及び情報表示装置
JP3597661B2 (ja) 情報提示システムおよび情報提示方法
US7386794B2 (en) Apparatus and method for performing the management of operation history
JP3154992B2 (ja) 情報検索装置、及び情報検索プログラムが記憶された記憶媒体
JP2000231569A (ja) インターネット情報検索装置、インターネット情報検索方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP4000332B2 (ja) 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2000099543A (ja) 情報検索装置
JP2004341770A (ja) データ管理システム及びデータ管理方法
JP3243949B2 (ja) 文書作成支援装置
Tran Veterinary Agency Management Web Application
JP2990314B2 (ja) データ管理装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20041202

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20071116

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20071210

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080422

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080526

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080701

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080818

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080924

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081113

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090106

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090120

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120130

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees