JP4251804B2 - Information display method, information display program, and information display apparatus - Google Patents

Information display method, information display program, and information display apparatus Download PDF

Info

Publication number
JP4251804B2
JP4251804B2 JP2001370102A JP2001370102A JP4251804B2 JP 4251804 B2 JP4251804 B2 JP 4251804B2 JP 2001370102 A JP2001370102 A JP 2001370102A JP 2001370102 A JP2001370102 A JP 2001370102A JP 4251804 B2 JP4251804 B2 JP 4251804B2
Authority
JP
Japan
Prior art keywords
tag
information
display
displayed
extracted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2001370102A
Other languages
Japanese (ja)
Other versions
JP2003167879A (en
Inventor
佳則 片山
文人 西野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2001370102A priority Critical patent/JP4251804B2/en
Publication of JP2003167879A publication Critical patent/JP2003167879A/en
Application granted granted Critical
Publication of JP4251804B2 publication Critical patent/JP4251804B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、タグ付き情報からオペレータに必要な情報を抽出して表示するためのタグ付き情報表示方法,タグ付き情報表示プログラム,及びタグ付き情報表示装置に、関する。
【0002】
【従来の技術】
近年、インターネットやイントラネットの発展により、WEB上のハイパーテキスト,データベース,新聞,書籍等の印刷,出版物を含め、莫大な情報が簡単に入手可能となっている。これらの情報は様々な形式で記述されているので、オペレータに必要な情報を含む文書がヒットしたとしても、ヒットした莫大な文書中からオペレータに必要な情報を探し出して、これを目的にあった型に整理しなおさなければ、その利用は難しい。
【0003】
そのため、検索対象となる文書から情報を抽出して整理するための技術開発が進められているが、このような技術においては、検索対象となる文書には、それに含まれる個々の情報の意味を明らかにするためのXML(Extensible Markup Languate)やSGML(Standard Generalized Markup Language)等による情報タグが付与され、文書を検索するツールや整理保存するツールには、これら情報タグを手懸かりに必要な情報を知識として抽出する機能が備えられている。
【0004】
【発明が解決しようとする課題】
しかしながら、これらのツールは、情報の検索や整理等の処理目的に依って夫々事前に用意されるものであるので、その処理結果の表示形式も、ツール毎に異なった画一的なものであった。一方、情報の使用目的は個々の利用者毎に異なる。例えば、利用者の職制(管理職,一般職等)や対象業務(営業,サービスエンジニア,開発)毎に、必要とする情報の内容は異なり、出力結果の利用方法(詳細である必要があるか概要で足りるか,内部資料として利用されるか外部資料として利用されるか)や表示方法(リスト形式,カード形式)によっても、表示すべき情報の範囲は異なってくる。
【0005】
本発明は、このような問題点に鑑みてなされたものであり、その課題は、利用者の要求に応じて、任意の種類の情報をタグ付き情報から抽出して表示することができるタグ付き情報表示方法,タグ付き情報表示プログラム,及びタグ付き情報表示装置を、提供することである。
【0006】
【課題を解決するための手段】
上記課題を解決するために案出された本発明によるタグ付き情報表示方法は、予め、前記利用者が必要とする情報の種類を示す一又は複数のキーワードを含むプロファイルを生成するプロファイル生成ステップと、サンプルとなるタグ付き情報から、そのタグ付き情報に含まれる複数のタグを抽出するタグ構造抽出ステップと、抽出された複数のタグから、更に、前記キーワードに相当するタグのみを抽出し、変換規則情報として生成する変換規則生成ステップと、表示対象のタグ付き情報から、前記変換規則に含まれるタグと同じタグによって特定されている情報を抽出する情報抽出ステップと、抽出された情報を表示する表示ステップとを、順次行うことを特徴とする。
【0007】
また、本発明によるタグ付き情報表示プログラムは、コンピュータに対して、利用者が必要とする情報の種類を示す一又は複数のキーワードを含むプロファイルを生成するプロファイル生成ステップと、サンプルとなるタグ付き情報から、そのタグ付き情報に含まれる複数のタグを抽出するタグ構造抽出ステップと、抽出された複数のタグから、更に、前記キーワードに相当するタグのみを抽出し、変換規則情報として生成する変換規則生成ステップと、表示対象のタグ付き情報から、前記変換規則に含まれるタグと同じタグによって特定されている情報を抽出する情報抽出ステップと、抽出された情報を表示する表示ステップとを、順次実行させることを特徴とする。
【0008】
また、本発明によるタグ付き情報表示装置は、予め、前記利用者が必要とする情報の種類を示す一又は複数のキーワードを含むプロファイルを生成するプロファイル生成手段と、サンプルとなるタグ付き情報から、そのタグ付き情報に含まれる複数のタグを抽出するタグ構造抽出手段と、抽出された複数のタグから、更に、前記キーワードに相当するタグのみを抽出し、変換規則情報として生成する変換規則生成手段と、表示対象のタグ付き情報から、前記変換規則に含まれるタグと同じタグによって特定されている情報を抽出する情報抽出手段と、抽出された情報を表示する表示手段とを、備えたことを特徴とする。
【0009】
以上のように構成されると、サンプルとなる一つ又は複数のタグ付き情報から、そのタグ付き情報に含まれるタグが抽出される。そして、このように抽出されたタグの中から、予め利用者が必要としている情報の種類を示すプロファイル中のキーワードに相当するタグのみが、変換規則情報として抽出される。そして、上述したようにして得られた変換規則に含まれるタグに相当する情報が、表示対象タグ付き情報から抽出されて、表示される。従って、個々の利用者が真に必要とする情報のみが自動的に表示対象タグ付き情報から抽出されて表示されるので、これらの情報を手作業で探し出す手間が省ける。また、表示は、変換規則に従った統一的形式でなされるので、種々雑多なタグ付き情報から必要な情報を得ることが可能になる。
【0010】
なお、本発明においてタグ付き情報には、XML文書の他、SGML文書やHTML文書等、あらゆる種類のタグ付き文書が含まれる。
【0011】
【発明の実施の形態】
以下、図面に基づいて、本発明の実施の形態を説明する。
(実施形態の原理)
図1は、本発明の実施形態の原理を示す概念図である。この図1に示されたように、本実施形態においては、インターネット上で拡布された印刷物,出版物,データベース等から、XMLタグ付き情報が、抽出,検索,分析等によって得られると、それら全てのXMLタグ付き情報のタグ構造情報を統合した(足し合わせた)タグ構造情報が得られる。一方、情報利用者が必要とする情報を示すキーワードを列挙したプロファイルが、手動又は自動で生成される。そして、統合後のタグ情報情報から、プロファイルに含まれるキーワードと同一又は同義のタグのみがその階層構造を示す態様で抽出され、更に、情報利用者によって編集がなされ、変換規則として記憶される。そして、この変換規則によって指定されたタグを付された情報が、表示対象XMLテキストから抽出されて、表示される。
(実施形態のハードウェア構成)
図2は、本発明によるタグ付き情報表示方法を実施するためのプログラム(タグ付き情報表示プログラム)を実行するコンピュータシステム(タグ付き情報表示装置)を概略的に示すブロック図である。このコンピュータシステムは、ネットワーク(インターネット等)に接続して情報を収集する機能を有するコンピュータとして、構成されている。
【0012】
図2に示すように、このコンピュータは、互いにバスBを介して接続されたCPU1,ハードディスク2,RAM3,通信デバイス4,表示装置5及び入力装置6から、構成されている。
【0013】
CPU1は、ハードディスク2に格納されている各種プログラムを実行することによって、コンピュータ全体の制御を行い、情報処理を行う。
【0014】
ハードディスク2には、前記各種プログラムとともに、各種データが格納されている。このハードディスク2に格納されている各種プログラムには、通信機能を備えたオペレーションシステム20,インターネットやイントラネットを介してWEB上のコンテンツを閲覧するためのブラウザプログラム21及びWEB上のデータベースから情報を検査するための検索ツール22が、含まれている。更に、各種プログラムには、ブラウザプログラム21や検索ツール22によって収集された文書(XMLテキスト)から必要な情報を抽出して表示するためのタグ付き情報表示プログラム23が、含まれる。なお、このタグ付き情報表示プログラム23は、CPU1に対して、図3のフローチャートに示されたプロファイル生成処理プロセス,図4及び図5のフローチャートに示された事前処理プロセス,及び、図6のフローチャートに示された表示処理プロセスを、実行させる。
【0015】
また、ハードディスク2に格納されている各種データには、業種別オントロジー24,プロファイル25及び変換規則26が含まれている。この業種別オントロジー24は、各業種毎に、その業種において一般的に使われている同義語をまとめてリスト化したものである。また、プロファイル25は、このタグ付き情報表示方法によって表示される情報を利用する各利用者毎に用意されており、図9に示すように、夫々、そのユーザが必要とする情報の種類(即ち、XMLタグとして定義され得る情報種類)をリストアップしたものである。また、変換規則26は、CPU1が上記ハイパーテキスト表示プログラム23による事前処理プロセスを実行することによって各利用者毎に生成されたデータであり、図15に示すように、表示対象XMLテキストから抽出すべき情報の種類とその階層構造を定義するものである。
【0016】
RAM3は、CPU1が上述した各種プログラムを実行するに際して作業領域として利用されるランダムアクセスメモリであり、各種プログラムによって生成された情報を一時的に記憶する。
【0017】
通信デバイス4は、通信回線との間のインターフェースであり、通信回線がアナログ電話回線であればモデム(ADSLモデムを含む)が用いられ、デジタル回線であればTAが用いら、ローカルエリアネットワークであればLANカードが用いられる。
【0018】
表示装置5は、CPU1によって生成された各種表示データに従った画面表示を行うCRT(Cathode-Ray-Tube),液晶表示パネル等である。
【0019】
入力装置6は、オペレータがコマンド,データ等の情報を手入力するためのキーボード,ポインティングデバイス等である。
(実施形態の処理内容)
次に、CPU1が上述したタグ付文書表示プログラム23に従って実行する各種プロセスの内容を、説明する。
<プロファイル生成処理プロセス>
図3に示すプロファイル生成処理プロセスは、このコンピュータのオペレータがデータ利用者である場合に、実行される。
【0020】
このプロファイル生成処理がスタートして最初のS001では、CPU1は、オペレータ(データ利用者)によるプロファイル情報入力を受け付ける。即ち、CPU1は、オペレータ(データ利用者)が必要とする情報の種類を示す一又は複数のキーワードを入力するための所定フォーマットの入力画面を、表示装置5のスクリーン上に表示し、この入力画面に一つ又は複数個のキーワードが入力されるのを待つ。そして、1又は複数個のキーワードが入力されると、CPU1は、処理をS002へ進める。
【0021】
S002では、CPU1は、S001にて入力された全キーワード(即ち、プロファイル情報)に基づいて、そのオペレータ(データ利用者)についてのプロファイル25を生成し、ハードディスク2に格納する。これととともに、検索キーワードのランキング順位(初期状態においては、検索キーワードが未登録)を表すランキング表をも、同時に、ハードディスク2に格納する。
【0022】
続くS003以降の処理は、他のプログラムが実行されている裏で、並行実行される処理であり、一旦、コンピュータの電源を落とした後であっても、電源再投入後に、オペレーションシステム20の機能により再スタートする。
【0023】
S003では、CPU1は、オペレータ(データ利用者)によって情報検索が実行されるのを待つ。そして、情報検索が実行されると、CPU1は、処理をS004へ進め、その情報検索において指定された検索キーワードと同一又は同義のキーワードを、当該オペレータ(データ利用者)専用にハードディスク2に格納されているプロファイル25から探し出す。そして、探し出されたキーワードについてのランキング表でのランキング順位を一つアップさせる。なお、検索キーワードがランキング表に掲載されていない場合には、CPU1は、検索キーワードをランキング表に追加する(登録時においては10位とする)。
【0024】
次のS005では、S004でのランクアップ後のランキング順位が1位となったか否かをチェックする。そして、1位でなければ処理をS003に戻し、1位であれば、S006にて当該検索キーワードを、当該オペレータ(データ利用者)専用にハードディスク2に格納されているプロファイル25に追加した後に、処理をS003に戻す。
【0025】
以上のプロファイル生成処理が継続的に実行されることにより、データ利用者であるオペレータが必要としているデータを表示させるためのプロファイル25が、先ず、オペレータによって手動生成され、その後で、オペレータの情報収集履歴に応じて自動更新される(プロファイル作成ステップ、プロファイル作成手段に相当)。従って、オペレータの役職や職種に適合したキーワードを、任意に取捨選択して、プロファイル25に含めることができるとともに、実際に必要な情報の種類を示すキーワードが、自動的にプロファイル25に追加される。
<事前処理プロセス>
図4及び図5に示す事前処理プロセスは、情報利用者がデータ使用の目的を新たに設定した時に、オペレータによって任意に実行される。例えば、任意の検索キーワードを指定した検索(XML検索等)を実行することによって多数のXMLテキスト(タグ付文書)が得られた時に、実行される。この事前処理は、表示対象となる一群のXMLテキストの全て、もしくは、その中から無作為に抽出した複数のXMLテキストに対して実行される。この事前処理の対象となるXMLテキストを、以下、サンプルテキストという。
【0026】
この事前処理のスタート後、最初のS101では、CPU1は、サンプルテキストを一つ読み込む。次のS102では、CPU1は、S101にて読み込んだサンプルテキストからXMLタグ構造を抽出する(タグ構造抽出ステップ、タグ構造抽出手段に相当)。図8の例に示すように、このXMLタグ構造は、サンプルテキストに付されたタグの名称(通常、そのタグによって囲まれる情報の種類を示す文言が充てられる)のみを、タグ相互間の階層構造を反映して抽出したデータである。次のS103では、CPU1は、S102にて抽出したXMLタグ構造を、「XMLタグ構造情報」としてRAM3に一次記憶する。
【0027】
続いて、CPU1は、S104乃至S110のループ処理を実行する。このループ処理に入って最初のS104では、CPU1は、未読込のサンプルテキストがあるか否かをチェックする。そして、未読込のサンプルテキストがある場合には、CPU1は、S105において、次のサンプルテキストを読み込む。
【0028】
次のS106では、CPU1は、S105にて読み込んだサンプルテキストのXMLタグ構造を抽出する(タグ構造抽出ステップ、タグ構造抽出手段に相当)。次のS107では、CPU1は、S106にて抽出したXMLタグ構造を構成するタグを一つ特定する。次のS108では、CPU1は、S107にて特定したタグと同一又は同義のタグがRAM3上のXMLタグ構造情報に含まれているか否かを、チェックする。なお、処理対象タグと同義のタグの範囲を調べるために、CPU1は、上述した業種別オントロジー24を参照する。そして、同一又は同義のタグがあった場合には、CPU1は、処理をそのままS110へ進める。これに対して、同一又は同義のタグが無かった場合には、CPU1は、S109において処理対象タグ(S107にて特定されたタグ)をRAM3上のXMLタグ構造情報に統合(処理対象タグの上層タグと同一又は同義のタグがあれば当該タグの下層に追加,処理対象タブの上層タグと同一又は同義のタグがなければ最上層に追加)した後に、処理をS110へ進める。S110では、CPU1は、S106にて抽出したXMLタグ構造中に未特定のタグが残っているか否かをチェックし、残っていれば処理をS107に戻し、残っていなければ処理をS104に戻す。
【0029】
以上に説明したS104乃至S110のループ処理を繰り返した結果、未処理のサンプルテキストが無くなったとS104にて判定した場合には、CPU1は、処理をS104からS111へ進める。S111では、CPU1は、指定された情報利用者専用のプロファイル25を、ハードディスク2から読み込む。
【0030】
次のS112では、CPU1は、RAM3上に最終的に残されたXMLタグ構造情報から、S111にて読み込んだプロファイルに列挙されたキーワードと同一又は同義のタグ及びその上位タグを抽出する。この場合も、同義のタグの範囲を調べるために、CPU1は、業種別オントロジー24を参照する。
【0031】
次のS113では、CPU1は、図10に示されるように、S112にて抽出した各タグに、その階層構造を表すID(下位階層のタグのID=上位階層のタグのID×10+α)を付与する。
【0032】
次のS114では、CPU1は、S113にて付与したIDが示す階層構造通りにS112にて抽出した各タグを表す変換規則作成画面を、表示装置5のスクリーン上に表示する。この変換規則作成画面には、図12の画面例に示されるように、最終的に表示する際における各項目毎に、その項目の名称を書き込む欄(「フィールド名称」欄),その項目に表示されるべき情報に対応するタグ(XMLテキスト中で情報を直接囲む最下位階層のタグ)のIDを指定する欄(「タグ対応」欄),その項目に表示されるべき情報を表示するためのフォントの大きさを指定する欄(「フォントサイズ」欄),そのフォントの色を指定する欄(「フォント色」欄),及び、その項目を削除するためのチェックボックスが、備えられている。初期状態においては、これら各項目は、夫々、個々の最下位階層のタグ毎に用意され、「フィールド名称」欄及び「タグ対応」欄には、夫々、そのタグについてのデータ(タグの文言,ID)が、初期設定されている。オペレータは、「フィールド名称」欄の内容を任意に書き換えることによって、その項目の名称(フィールド名称)を変更したり、「タグ対応」欄に他のIDを追記することによって、その項目に複数種類の情報が表示されるようにしたり、「フォントサイズ」欄及び「フォント色」欄に任意にデータを記述することによって、その項目に表示される文字を任意に設定することができる。なお、上述したように或る項目の「タグ対応」欄に複数のIDを指定した場合には、追記されたIDが元々「タグ対応」欄に記述されていた項目は不要になるので、その項目を削除するためのチェックボックスがチェックされる。また、この変換規則作成画面には、各項目の上位階層の項目のフィールド名称(即ち、上位階層のタグの文言)が変更不能な態様で記述されているとともに、その上位階層の項目を削除するためのチェックボックスも備えられている。更に、この変換規則作成画面には、各種ボタン(「タグ構造表示」ボタン31,「画面更新」ボタン32,「リセット」ボタン33,「スタイルシート作成」ボタン34及び「終了」ボタン35)が、含まれている。なお、この変換規則作成画面は、表計算プログラムによる編集画面であっても良い。
【0033】
次のS115では、CPU1は、この変換規則作成画面に対する入力を待つ。そして、「終了」ボタン35が押下(入力装置6に含まれるポインティングデバイスによってカーソルが当該ボタン上に重ねられた状態で、そのポインティングデバイスのクリックボタンが押下される事、以下同じ)された場合には、この事前処理プロセスを終了し、「タグ構造表示」ボタンが押下された場合には、処理をS116へ進め、「スタイルシート作成」ボタン34が押下された場合には、処理をS117へ進め、その他の入力(即ち、他のボタンの押下,各欄へのデータ記入又は変更,各チェックボックスへのクリック)があった場合には、処理をS120へ進める。
【0034】
S116では、CPU1は、図13に示すようなXMLタグ構造画面を、表示装置5のスクリーン上に表示する。図13に示されるように、このXMLタグ構造画面には、S112にて抽出されたタグが、S113にて付与されたIDとともに、一覧表示されている。S116を完了すると、CPU1は、処理をS115に戻す。
【0035】
また、S110では、CPU1は、入力の内容に従った処理を実行する。例えば、各欄にデータ記入があった場合(即ち、ポインティングデバイスによって記入対象欄がアクティブにされた状態でキーボードによって文字が入力されること)には、CPU1は、入力された文字を記入対象欄に表示する。また、チェックマークが付されていないチェックボックスがクリックされた場合にはそのチェックボックスにチェックマークを表示し、チェックマークが付されているチェックボックスがクリックされた場合にはそのチェックボックスからチェックマークを消去する。また、「画面更新」ボタン32が押下された場合には、その時点でチェックボックスにチェックマークが付されている項目を消去する。また、「リセット」ボタン33が押下された場合には、変換規則作成画面の内容を初期状態に戻す。
【0036】
また、S117では、その時点で変換規則作成画面に設定されている各データの内容に従って、図14に示すような変換規則確認画面を、表示装置5のスクリーン上に表示する。図14に示されるように、この変換規則確認画面には、変換規則作成画面に設定されていた各項目毎の「フィールド名称」欄の内容,「タグ対応」欄の内容,「フォントサイズ」欄の内容及び「フォント色」欄の内容が、一覧表示されている。更に、この変換規則確認画面には、「作成」ボタン36及び「戻る」ボタン37が含まれている。
【0037】
次のS118では、CPU1は、変換規則確認画面中の「作成」ボタン36又は「戻る」ボタン37が押下されるのを待つ。そして、「戻る」ボタン37が押下された場合には、処理をS115に戻し、「作成」ボタン36が押下された場合には、処理をS119に進める。
【0038】
S119では、変換規則確認画面に一覧表示されていた各項目毎の情報をコード化することにょって、図15に示されるような変換規則26を作成し、この変換規則26をハードディスク2に格納する。S119を完了すると、CPU1は、この事前処理を完了する。S111乃至S119の処理が、変換規則生成ステップ及び変換規則生成手段に相当する。
【0039】
以上のようにしてハードディスク2内に格納された変換規則は、サンプルテキストの抽出元となったXMLテキスト群に対する表示処理のために使用可能である他、同種のXMLテキスト群(同じ検索キーワードを用いて他のデータベース等から検索されたXMLテキスト群,類似の検索キーワードを用いて同じデータベース等から検索されたXMLテキスト群,等)に対する表示処理のために使用可能である。
【0040】
更に、複数人が必要とする情報の種類が共通している事情がある場合には、これら複数人に共通するプロファイル25に基づいて変換規則26が生成されても良いし、或る一人に固有のプロファイル25に基づいて生成された変換規則26が、他の者に情報を提示するために用いられても良い。
<表示処理>
図6に示す表示処理は、上述した事前処理の完了後において、サンプルテキストの抽出元となったXMLテキスト群に対して、また、その後において同種のXMLテキスト群が得られた後に当該XMLテキスト群に対して、実行される。即ち、何れかのデータ利用者専用の変換規則26及びXMLテキスト群を指定したコマンドが入力されることによって、スタートする。
【0041】
このプロファイル精製処理のスタート後における最初のS201では、CPU1は、コマンドにおいて指定された変換規則26を読み込む。
【0042】
次のS202では、CPU1は、コマンドにおいて指定された表示対象XMLテキストを一つ読み込む。
【0043】
次のS203では、CPU1は、S201にて読み込まれた変換規則26中の各タグについて、夫々、そのタグと同一又は同義のタグが付された記述(変換規則26中のタグに上位タグがある場合には、その上位タグと同一又は同義の上位タグを有するタグが付された記述)を、抽出する(情報抽出ステップ、情報抽出手段に相当)。
【0044】
次のS204では、CPU1は、全ての表示対象XMLテキストについて、S202及びS203の処理を完了したか否かを、チェックする。そして、未だ表示対象XMLテキストが残っている場合には、処理をS202に戻し、次の表示対象XMLテキストに対する処理を実行する。
【0045】
これに対して、表示対象XMLテキストが残っていない場合には、CPU1は、処理をS204からS205へ進める。このS205では、CPU1は、全表示対象XMLテキストに対してS203にて抽出された情報を、表示装置5のスクリーン上にリスト形式で表示する(表示ステップ、表示手段に相当)。図16は、このリスト表示のためのリスト画面例を示す。図16に示すように、このリスト画面には、S203にて抽出された各記述に対応した項目のうちリスト表示すべき項目を指定するための項目指定欄38,この項目指定欄38に指定された項目について、各表示対象XMLテキストから抽出された情報を一覧表示するためのリスト欄39,及び、「カード表示」ボタン40が、含まれている。
【0046】
次のS206では、CPU1は、リスト画面への入力を待ち、「カード表示」ボタン40が押下された場合には、処理をS207へ進め、それ以外の入力があった場合には、処理をS209へ進める。このS209では、CPU1は、入力内容に応じた処理を実行する。例えば、項目指定欄38に表示されている項目が変更された場合には、リスト欄39に一覧表示される内容を、変更後の項目について各表示対象XMLテキストから抽出された情報に変更する。S209の完了後、CPU1は、処理をS206に戻す。
【0047】
一方、S207では、CPU1は、リスト欄39中でアクティブにされていた(押下されていた)項目を含むXMLテキストについて、S203にて抽出された情報を、表示装置5のスクリーン上にカード形式で表示する(表示ステップ、表示手段に相当)。図17は、このカード表示のためのカード画面例を示す。図17に示すように、このカード画面には、カード表示対象のXMLテキストから抽出された全情報を一覧表示するカード欄41,及び、「リスト表示」ボタン42が、含まれている。
【0048】
次のS708では、CPU1は、「リスト表示」ボタン42が押下されるのを待つ。そして、「リスト表示」ボタン42が押下されると、CPU1は、処理をS205へ戻す。
【0049】
この表示処理が実行されることにより、オペレータは、リスト画面のリスト欄39に一覧表示されている情報に基づいて、カード表示すべきXMLテキストを選択する。そして、選択されたXMLテキストに対するカード表示画面によって、そのXMLテキストから自己が必要とするものとして絞り込んだ情報を、一目で見ることができる。このように、オペレータは、表示形式を任意に切り替えることができる。このように切り替えがなされても、既に情報は表示対象XMLテキストから抽出されているので、直ぐに表示がなされる。
(付記1)
タグ付き情報から利用者に必要な情報を抽出して表示するためのタグ付き情報表示方法であって、
予め、前記利用者が必要とする情報の種類を示す一又は複数のキーワードを含むプロファイルを生成するプロファイル生成ステップと、
サンプルとなるタグ付き情報から、そのタグ付き情報に含まれる複数のタグを抽出するタグ構造抽出ステップと、
抽出された複数のタグから、更に、前記キーワードに相当するタグのみを抽出し、変換規則情報として生成する変換規則生成ステップと、
表示対象のタグ付き情報から、前記変換規則に含まれるタグと同じタグによって特定されている情報を抽出する情報抽出ステップと、
抽出された情報を表示する表示ステップとを、
順次行うことを特徴とするタグ付き情報表示方法。(1)
(付記2)
前記変換規則生成ステップでは、更に、抽出したタグを操作者に提示し、変換規則に含めるタグ操作者からの要求に従って制限する
ことを特徴とする付記1記載のタグ付き情報表示方法。(2)
(付記3)
前記プロファイル生成ステップでは、前記利用者の情報収集履歴を考慮し、情報収集に多用されたキーワードを前記プロファイルに含める
ことを特徴とする付記1記載のタグ付き情報表示方法。(3)
(付記4)
前記変換規則生成ステップでは、更に、変換規則に含められるタグに対応した項目名を設定し、
前記表示ステップでは、前記情報抽出ステップにおいて前記変換規則に含まれたタグによって特定されているものとして前記表示対象のタグ付き情報から抽出された情報を、そのタグに対応した項目名を付して表示する
ことを特徴とする付記1記載のタグ付き情報表示方法。
(付記5)
前記タグ構造抽出ステップでは、サンプルとなる複数のタグ付き情報から夫々抽出された複数のタグを統合する
ことを特徴とする付記1記載のタグ付き情報表示方法。
(付記6)
前記統合を行う際には、同義語同士を正規化する
ことを特徴とする付記5記載のタグ付き情報表示方法。
(付記7)
前記表示ステップでは、前記情報抽出ステップにおいて複数のタグ付き情報から夫々抽出された情報をリスト形式で表示する
ことを特徴とする付記1記載のタグ付き情報表示方法。
(付記8)
前記表示ステップでは、前記情報抽出ステップにおいて単一のタグ付き情報から抽出された複数の情報をカード形式で表示する
ことを特徴とする付記1記載のタグ付き情報表示方法。
(付記7)
コンピュータに対して、
利用者が必要とする情報の種類を示す一又は複数のキーワードを含むプロファイルを生成するプロファイル生成ステップと、
サンプルとなるタグ付き情報から、そのタグ付き情報に含まれる複数のタグを抽出するタグ構造抽出ステップと、
抽出された複数のタグから、更に、前記キーワードに相当するタグのみを抽出し、変換規則情報として生成する変換規則生成ステップと、
表示対象のタグ付き情報から、前記変換規則に含まれるタグと同じタグによって特定されている情報を抽出する情報抽出ステップと、
抽出された情報を表示する表示ステップとを、
順次実行させることを特徴とするタグ付き情報表示プログラム。(4)
(付記8)
タグ付き情報から利用者に必要な情報を抽出して表示するためのタグ付き情報表示装置であって、
予め、前記利用者が必要とする情報の種類を示す一又は複数のキーワードを含むプロファイルを生成するプロファイル生成手段と、
サンプルとなるタグ付き情報から、そのタグ付き情報に含まれる複数のタグを抽出するタグ構造抽出手段と、
抽出された複数のタグから、更に、前記キーワードに相当するタグのみを抽出し、変換規則情報として生成する変換規則生成手段と、
表示対象のタグ付き情報から、前記変換規則に含まれるタグと同じタグによって特定されている情報を抽出する情報抽出手段と、
抽出された情報を表示する表示手段とを
備えたことを特徴とするタグ付き情報表示装置。(5)
(付記9)
タグ付き情報から利用者に必要な情報を抽出して表示するためのタグ付き情報表示方法であって、
予め、前記利用者が必要とする情報の種類を示す一又は複数のキーワードを含むプロファイルを生成するプロファイル生成ステップと、
サンプルとなるタグ付き情報から、そのタグ付き情報に含まれる複数のタグを、その階層構造を表す形態で抽出するタグ構造抽出ステップと、
抽出された複数のタグから、更に、前記キーワードに相当する下位階層のタグのみを、その下位階層のタグの上位階層に当たるタグと組み合わせて抽出し、変換規則情報として生成する変換規則生成ステップと、
表示対象のタグ付き情報から、前記変換規則に含まれる下位階層のタグ及び上位階層のタグの組合せと同じタグの組み合わせによって特定されている情報を抽出する情報抽出ステップと、
抽出された情報を表示する表示ステップとを、
順次行うことを特徴とするタグ付き情報表示方法。
(付記10)
コンピュータに対して、
利用者が必要とする情報の種類を示す一又は複数のキーワードを含むプロファイルを生成するプロファイル生成ステップと、
サンプルとなるタグ付き情報から、そのタグ付き情報に含まれる複数のタグを、その階層構造を表す形態で抽出するタグ構造抽出ステップと、
抽出された複数のタグから、更に、前記キーワードに相当する下位階層のタグのみを、その下位階層のタグの上位階層に当たるタグと組み合わせて抽出し、変換規則情報として生成する変換規則生成ステップと、
表示対象のタグ付き情報から、前記変換規則に含まれる下位階層のタグ及び上位階層のタグの組合せと同じタグの組み合わせによって特定されている情報を抽出する情報抽出ステップと、
抽出された情報を表示する表示ステップとを、
順次実行させることを特徴とするタグ付き情報表示プログラム。
(付記11)
タグ付き情報から利用者に必要な情報を抽出して表示するためのタグ付き情報表示装置であって、
予め、前記利用者が必要とする情報の種類を示す一又は複数のキーワードを含むプロファイルを生成するプロファイル生成手段と、
サンプルとなるタグ付き情報から、そのタグ付き情報に含まれる複数のタグを、その階層構造を表す形態で抽出するタグ構造抽出手段と、
抽出された複数のタグから、更に、前記キーワードに相当する下位階層のタグのみを、その下位階層のタグの上位階層に当たるタグと組み合わせて抽出し、変換規則情報として生成する変換規則生成手段と、
表示対象のタグ付き情報から、前記変換規則に含まれる下位階層のタグ及び上位階層のタグの組合せと同じタグの組み合わせによって特定されている情報を抽出する情報抽出手段と、
抽出された情報を表示する表示手段とを
備えたことを特徴とするタグ付き情報表示装置。
【0050】
【発明の効果】
以上のように構成された本発明の情報表示方法によれば、利用者の要求に応じて、任意の種類の情報を、タグ付き文書から抽出して表示することができる。
【図面の簡単な説明】
【図1】 本発明の一実施形態による情報表示システムの概念図
【図2】 情報表示システムのハードウェア構成を示すブロック図
【図3】 タグ付き文書表示プログラムに従って実行されるプロファイル生成処理プロセスを示すフローチャート
【図4】 タグ付き文書表示プログラムに従って実行される事前処理プロセスを示すフローチャート
【図5】 タグ付き文書表示プログラムに従って実行される事前処理プロセスを示すフローチャート
【図6】 タグ付き文書表示プログラムに従って実行される表示処理プロセスを示すフローチャート
【図7】 XMLテキストの一例を示す図
【図8】 XMLタグ構造情報の一例を示す図
【図9】 プロファイルの一例を示す図
【図10】 XMLタグ構造情報からプロファイルに従って抽出されてIDが付されたタグの一例を示す図
【図11】 フィールド名称とIDとの関係を示す表
【図12】 変換規則作成画面を示す図
【図13】 タグ構造画面を示す図
【図14】 変換規則確認画面を示す図
【図15】 変換規則の一例を示す図
【図16】 リスト表示画面を示す図
【図17】 カード表示画面を示す図
【符号の説明】
1 CPU
2 ハードディスク
5 表示装置
6 入力装置
23 タグ付き文書表示プログラム
25 プロファイル
26 変換規則
[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a tagged information display method, a tagged information display program, and a tagged information display device for extracting and displaying information necessary for an operator from tagged information.
[0002]
[Prior art]
In recent years, with the development of the Internet and Intranet, enormous information including prints and publications of hypertext, databases, newspapers, books, etc. on the WEB can be easily obtained. Since these pieces of information are described in various formats, even if a document containing information necessary for the operator is hit, the information necessary for the operator is searched from the enormous hit documents and the purpose is If it is not rearranged into a mold, its use is difficult.
[0003]
For this reason, technology development for extracting and organizing information from documents to be searched is being promoted. In such technology, the search target document has the meaning of each piece of information contained in it. Information tags such as XML (Extensible Markup Languate) and SGML (Standard Generalized Markup Language) are added to clarify, and the information necessary for clues to these information tags is used in tools for searching and organizing documents. Is extracted as knowledge.
[0004]
[Problems to be solved by the invention]
However, these tools are prepared in advance depending on the processing purpose such as information search and organization, and the display format of the processing results is also different for each tool. It was. On the other hand, the purpose of using information differs for each individual user. For example, the contents of the required information differ depending on the user's job system (managerial positions, general positions, etc.) and the target work (sales, service engineer, development), and how to use the output results (whether it needs to be detailed) The range of information to be displayed varies depending on whether the outline is sufficient, whether it is used as internal data or external data, and the display method (list format, card format).
[0005]
The present invention has been made in view of such problems, and the problem is that with a tag that can extract and display any kind of information from the tagged information according to a user's request. An information display method, a tagged information display program, and a tagged information display device are provided.
[0006]
[Means for Solving the Problems]
The tagged information display method according to the present invention devised to solve the above-described problem includes a profile generation step of generating a profile including one or more keywords indicating the type of information required by the user in advance. A tag structure extracting step for extracting a plurality of tags included in the tagged information from the sampled tagged information, and extracting only a tag corresponding to the keyword from the extracted tags and converting A conversion rule generation step for generating as rule information, an information extraction step for extracting information specified by the same tag as the tag included in the conversion rule from the tagged information to be displayed, and the extracted information are displayed. The display step is sequentially performed.
[0007]
In addition, a tagged information display program according to the present invention includes a profile generation step for generating a profile including one or a plurality of keywords indicating a type of information required by a user, and sampled tagged information. A tag structure extracting step for extracting a plurality of tags included in the tagged information, and a conversion rule for extracting only a tag corresponding to the keyword from the extracted plurality of tags and generating it as conversion rule information A generation step, an information extraction step for extracting information specified by the same tag as the tag included in the conversion rule, and a display step for displaying the extracted information are sequentially executed from the tagged information to be displayed. It is characterized by making it.
[0008]
In addition, the tagged information display device according to the present invention includes, in advance, profile generating means for generating a profile including one or a plurality of keywords indicating the type of information required by the user, and tagged information as a sample, Tag structure extraction means for extracting a plurality of tags included in the tagged information, and conversion rule generation means for extracting only tags corresponding to the keywords from the extracted tags and generating them as conversion rule information And information extracting means for extracting information specified by the same tag as the tag included in the conversion rule, and display means for displaying the extracted information, from the tagged information to be displayed. Features.
[0009]
If comprised as mentioned above, the tag contained in the tagged information is extracted from the one or several tagged information used as a sample. Only tags corresponding to keywords in the profile indicating the type of information required by the user are extracted as conversion rule information from the tags extracted in this way. Then, information corresponding to the tag included in the conversion rule obtained as described above is extracted from the display target tagged information and displayed. Therefore, since only the information that is really necessary for each user is automatically extracted from the display target tagged information and displayed, it is possible to save the trouble of manually searching for such information. Further, since the display is performed in a unified format according to the conversion rule, it is possible to obtain necessary information from various kinds of tagged information.
[0010]
In the present invention, the tagged information includes all types of tagged documents such as SGML documents and HTML documents in addition to XML documents.
[0011]
DETAILED DESCRIPTION OF THE INVENTION
Hereinafter, embodiments of the present invention will be described with reference to the drawings.
(Principle of embodiment)
FIG. 1 is a conceptual diagram showing the principle of an embodiment of the present invention. As shown in FIG. 1, in this embodiment, when information with XML tags is obtained by extraction, search, analysis, etc. from printed materials, publications, databases, etc. that are distributed on the Internet, all of them are obtained. The tag structure information obtained by integrating (adding) the tag structure information of the XML-tagged information is obtained. On the other hand, a profile listing keywords indicating information required by an information user is generated manually or automatically. Then, only tags that are identical or synonymous with the keywords included in the profile are extracted from the integrated tag information information in a manner indicating the hierarchical structure, and further edited by the information user and stored as conversion rules. Then, the information with the tag specified by the conversion rule is extracted from the display target XML text and displayed.
(Hardware configuration of the embodiment)
FIG. 2 is a block diagram schematically showing a computer system (tagged information display device) that executes a program (tagged information display program) for carrying out the tagged information display method according to the present invention. This computer system is configured as a computer having a function of collecting information by connecting to a network (such as the Internet).
[0012]
As shown in FIG. 2, the computer includes a CPU 1, a hard disk 2, a RAM 3, a communication device 4, a display device 5, and an input device 6 that are connected to each other via a bus B.
[0013]
The CPU 1 executes various programs stored in the hard disk 2 to control the entire computer and perform information processing.
[0014]
Various data are stored in the hard disk 2 together with the various programs. Various programs stored in the hard disk 2 are inspected for information from an operation system 20 having a communication function, a browser program 21 for browsing content on the web via the Internet or an intranet, and a database on the web. A search tool 22 is included. Further, the various programs include a tagged information display program 23 for extracting and displaying necessary information from documents (XML text) collected by the browser program 21 and the search tool 22. Note that the tagged information display program 23 provides the CPU 1 with the profile generation process shown in the flowchart of FIG. 3, the pre-process shown in the flowcharts of FIGS. 4 and 5, and the flowchart of FIG. The display processing process shown in FIG.
[0015]
The various data stored in the hard disk 2 includes an industry-specific ontology 24, a profile 25, and a conversion rule 26. This industry-specific ontology 24 is a list of synonyms generally used in each industry for each industry. The profile 25 is prepared for each user who uses the information displayed by the tagged information display method. As shown in FIG. 9, the type of information required by the user (ie , Information types that can be defined as XML tags). The conversion rule 26 is data generated for each user by the CPU 1 executing the pre-processing process by the hypertext display program 23, and is extracted from the display target XML text as shown in FIG. It defines the type of information to be and its hierarchical structure.
[0016]
The RAM 3 is a random access memory used as a work area when the CPU 1 executes the various programs described above, and temporarily stores information generated by the various programs.
[0017]
The communication device 4 is an interface with a communication line. If the communication line is an analog telephone line, a modem (including an ADSL modem) is used. If the communication line is a digital line, TA is used. LAN cards are used.
[0018]
The display device 5 is a CRT (Cathode-Ray-Tube), a liquid crystal display panel, or the like that performs screen display according to various display data generated by the CPU 1.
[0019]
The input device 6 is a keyboard, a pointing device, or the like for an operator to manually input information such as commands and data.
(Processing content of the embodiment)
Next, the contents of various processes executed by the CPU 1 according to the tagged document display program 23 will be described.
<Profile generation process>
The profile generation process shown in FIG. 3 is executed when the operator of this computer is a data user.
[0020]
In the first step S001 from the start of the profile generation process, the CPU 1 accepts profile information input by an operator (data user). That is, the CPU 1 displays on the screen of the display device 5 an input screen in a predetermined format for inputting one or a plurality of keywords indicating the type of information required by the operator (data user). Wait for one or more keywords to be entered. When one or more keywords are input, the CPU 1 advances the process to S002.
[0021]
In S002, the CPU 1 generates a profile 25 for the operator (data user) based on all the keywords (that is, profile information) input in S001, and stores the profile 25 in the hard disk 2. At the same time, a ranking table representing the ranking ranking of the search keyword (in the initial state, the search keyword is not registered) is also stored in the hard disk 2 at the same time.
[0022]
The subsequent processes after S003 are executed in parallel with the other programs being executed. Even after the computer is turned off, the functions of the operation system 20 are performed after the power is turned on again. To restart.
[0023]
In S003, the CPU 1 waits for an information search to be executed by an operator (data user). When the information search is executed, the CPU 1 advances the process to S004, and the keyword identical or synonymous with the search keyword specified in the information search is stored in the hard disk 2 exclusively for the operator (data user). Search from the profile 25. Then, the ranking in the ranking table for the found keyword is increased by one. When the search keyword is not listed in the ranking table, the CPU 1 adds the search keyword to the ranking table (the 10th place is set at the time of registration).
[0024]
In the next S005, it is checked whether or not the ranking after the rank increase in S004 has become the first. If it is not first, the process returns to S003. If it is first, the search keyword is added to the profile 25 stored in the hard disk 2 exclusively for the operator (data user) in S006. The process returns to S003.
[0025]
By continuously executing the above profile generation processing, a profile 25 for displaying data required by an operator who is a data user is first manually generated by the operator, and thereafter, information collection by the operator is performed. It is automatically updated according to the history (corresponding to profile creation step and profile creation means). Therefore, keywords suitable for the position and type of the operator can be arbitrarily selected and included in the profile 25, and keywords indicating the type of information actually required are automatically added to the profile 25. .
<Pre-processing process>
The preprocessing process shown in FIGS. 4 and 5 is arbitrarily executed by the operator when the information user newly sets the purpose of data use. For example, it is executed when a large number of XML texts (tagged documents) are obtained by executing a search (XML search or the like) specifying an arbitrary search keyword. This pre-processing is executed for all of a group of XML texts to be displayed or a plurality of XML texts randomly extracted from the group. The XML text to be subjected to this preprocessing is hereinafter referred to as sample text.
[0026]
In the first S101 after the start of the pre-processing, the CPU 1 reads one sample text. In the next S102, the CPU 1 extracts an XML tag structure from the sample text read in S101 (corresponding to a tag structure extraction step and tag structure extraction means). As shown in the example of FIG. 8, this XML tag structure includes only a tag name (usually a word indicating the type of information enclosed by the tag) attached to the sample text, and a hierarchy between the tags. This data is extracted reflecting the structure. In the next S103, the CPU 1 primarily stores the XML tag structure extracted in S102 in the RAM 3 as “XML tag structure information”.
[0027]
Subsequently, the CPU 1 executes a loop process from S104 to S110. In the first step S104 after entering this loop process, the CPU 1 checks whether or not there is an unread sample text. If there is an unread sample text, the CPU 1 reads the next sample text in S105.
[0028]
In the next S106, the CPU 1 extracts the XML tag structure of the sample text read in S105 (corresponding to a tag structure extraction step and tag structure extraction means). In next step S107, the CPU 1 specifies one tag constituting the XML tag structure extracted in step S106. In the next S108, the CPU 1 checks whether or not a tag identical or synonymous with the tag specified in S107 is included in the XML tag structure information on the RAM 3. Note that the CPU 1 refers to the industry-specific ontology 24 described above in order to examine the range of tags having the same meaning as the processing target tag. If there is a tag that is identical or synonymous, the CPU 1 advances the process to S110 as it is. On the other hand, if there is no identical or synonymous tag, the CPU 1 integrates the processing target tag (the tag specified in S107) into the XML tag structure information on the RAM 3 in S109 (upper layer of the processing target tag). If there is a tag that is the same or synonymous with the tag, the tag is added to the lower layer of the tag, and added to the uppermost layer if there is no tag that is the same or synonymous with the upper tag of the processing target tab. In S110, the CPU 1 checks whether or not an unspecified tag remains in the XML tag structure extracted in S106. If it remains, the process returns to S107, and if not, the process returns to S104.
[0029]
If it is determined in S104 that there is no unprocessed sample text as a result of repeating the loop processing of S104 to S110 described above, the CPU 1 advances the processing from S104 to S111. In S <b> 111, the CPU 1 reads the designated information user-specific profile 25 from the hard disk 2.
[0030]
In the next S112, the CPU 1 extracts from the XML tag structure information finally left on the RAM 3 a tag identical to or synonymous with the keyword listed in the profile read in S111 and its upper tag. Also in this case, the CPU 1 refers to the industry-specific ontology 24 in order to examine the range of synonymous tags.
[0031]
In the next step S113, as shown in FIG. 10, the CPU 1 assigns an ID representing the hierarchical structure (lower layer tag ID = higher layer tag ID × 10 + α) to each tag extracted in S112. To do.
[0032]
In the next S114, the CPU 1 displays on the screen of the display device 5 a conversion rule creation screen representing each tag extracted in S112 according to the hierarchical structure indicated by the ID assigned in S113. In this conversion rule creation screen, as shown in the screen example of FIG. 12, for each item at the time of final display, a column for writing the name of the item ("field name" column), displayed in that item A field ("tag correspondence" field) for specifying an ID of a tag corresponding to information to be performed (a tag in the lowest hierarchy directly surrounding information in the XML text), for displaying information to be displayed in the item A column for specifying the font size (“font size” column), a column for specifying the font color (“font color” column), and a check box for deleting the item are provided. In the initial state, each of these items is prepared for each tag at the lowest level, and the “field name” column and the “tag correspondence” column each have data (tag wording, ID) is initially set. The operator can change the name (field name) of the item by arbitrarily rewriting the contents of the “field name” column, or add another ID to the “tag correspondence” column, so that multiple types can be added to the item. The character displayed in the item can be arbitrarily set by displaying the above information or by arbitrarily describing data in the “font size” column and the “font color” column. As described above, when a plurality of IDs are specified in the “tag correspondence” column of a certain item, the item in which the added ID is originally described in the “tag correspondence” column becomes unnecessary. Check box for deleting item is checked. In addition, on the conversion rule creation screen, the field names of the items in the upper layer of each item (that is, the wording of the tag in the upper layer) are described in an unchangeable manner, and the items in the upper layer are deleted. A check box is also provided. Furthermore, on this conversion rule creation screen, various buttons ("tag structure display" button 31, "screen update" button 32, "reset" button 33, "style sheet creation" button 34, and "end" button 35) include. Note that this conversion rule creation screen may be an editing screen by a spreadsheet program.
[0033]
In next S115, the CPU 1 waits for an input to the conversion rule creation screen. When the “end” button 35 is pressed (when the cursor is over the button by the pointing device included in the input device 6 and the click button of the pointing device is pressed, the same applies hereinafter). Terminates this pre-processing process, and if the “tag structure display” button is pressed, the process proceeds to S116, and if the “create style sheet” button 34 is pressed, the process proceeds to S117. If there is any other input (ie, pressing of another button, entry or change of data in each column, click on each check box), the process proceeds to S120.
[0034]
In S 116, the CPU 1 displays an XML tag structure screen as shown in FIG. 13 on the screen of the display device 5. As shown in FIG. 13, on the XML tag structure screen, the tags extracted in S112 are listed together with the IDs assigned in S113. When S116 is completed, the CPU 1 returns the process to S115.
[0035]
In S110, the CPU 1 executes a process according to the input content. For example, when there is data entry in each field (that is, when a character is input by the keyboard with the entry target field activated by the pointing device), the CPU 1 displays the input character in the entry target field. To display. When a check box without a check mark is clicked, a check mark is displayed in the check box, and when a check box with a check mark is clicked, a check mark is displayed from the check box. Erase. Further, when the “update screen” button 32 is pressed, an item having a check mark in the check box at that time is deleted. When the “reset” button 33 is pressed, the content of the conversion rule creation screen is returned to the initial state.
[0036]
In S117, a conversion rule confirmation screen as shown in FIG. 14 is displayed on the screen of the display device 5 in accordance with the contents of each data set on the conversion rule creation screen at that time. As shown in FIG. 14, the conversion rule confirmation screen includes the contents of the “field name” field, the “tag correspondence” field, and the “font size” field for each item set in the conversion rule creation screen. And the contents of the “font color” column are displayed in a list. Further, the conversion rule confirmation screen includes a “create” button 36 and a “return” button 37.
[0037]
In next S 118, the CPU 1 waits for the “Create” button 36 or “Return” button 37 on the conversion rule confirmation screen to be pressed. If the “return” button 37 is pressed, the process returns to step S115. If the “create” button 36 is pressed, the process proceeds to step S119.
[0038]
In S119, the information for each item displayed in the list on the conversion rule confirmation screen is encoded to create a conversion rule 26 as shown in FIG. 15 and store this conversion rule 26 in the hard disk 2. To do. When S119 is completed, the CPU 1 completes this preliminary process. The processing from S111 to S119 corresponds to a conversion rule generation step and a conversion rule generation means.
[0039]
The conversion rules stored in the hard disk 2 as described above can be used for display processing for the XML text group from which the sample text is extracted, and the same kind of XML text group (using the same search keyword). XML text groups retrieved from other databases, etc., XML text groups retrieved from the same database using similar search keywords, etc.) can be used for display processing.
[0040]
Further, when there is a situation where the types of information required by a plurality of people are common, the conversion rule 26 may be generated based on the profile 25 common to the plurality of people, or may be unique to a certain one person. The conversion rule 26 generated based on the profile 25 may be used to present information to others.
<Display processing>
The display process shown in FIG. 6 is performed on the XML text group from which the sample text is extracted after completion of the above-described pre-processing, and after the same kind of XML text group is obtained thereafter. Is executed. That is, the process starts when a conversion rule 26 dedicated to any data user and a command designating an XML text group are input.
[0041]
In the first S201 after the start of the profile refining process, the CPU 1 reads the conversion rule 26 specified in the command.
[0042]
In next step S202, the CPU 1 reads one display target XML text specified in the command.
[0043]
In the next S203, the CPU 1 describes each tag in the conversion rule 26 read in S201 with a tag that is the same as or synonymous with the tag (the tag in the conversion rule 26 has an upper tag). In this case, a description having a tag having an upper tag identical or synonymous with the upper tag) is extracted (corresponding to an information extraction step and information extraction means).
[0044]
In the next S204, the CPU 1 checks whether or not the processes in S202 and S203 have been completed for all the display target XML texts. If the display target XML text still remains, the process returns to S202, and the process for the next display target XML text is executed.
[0045]
On the other hand, if no display target XML text remains, the CPU 1 advances the process from S204 to S205. In S205, the CPU 1 displays the information extracted in S203 for all the display target XML texts in a list format on the screen of the display device 5 (corresponding to a display step and a display unit). FIG. 16 shows a list screen example for this list display. As shown in FIG. 16, the list screen is designated in an item designation field 38 for designating an item to be displayed in a list among items corresponding to each description extracted in S203, and this item designation field 38. For each item, a list field 39 for displaying a list of information extracted from each display target XML text and a “card display” button 40 are included.
[0046]
In the next S206, the CPU 1 waits for an input to the list screen. If the “card display” button 40 is pressed, the process proceeds to S207. If there is any other input, the process proceeds to S209. Proceed to In S209, the CPU 1 executes a process according to the input content. For example, when the item displayed in the item designation field 38 is changed, the content displayed in the list field 39 is changed to information extracted from each display target XML text for the changed item. After completion of S209, the CPU 1 returns the process to S206.
[0047]
On the other hand, in S207, the CPU 1 displays the information extracted in S203 for the XML text including the item activated (pressed) in the list column 39 on the screen of the display device 5 in a card format. Display (equivalent to display step, display means). FIG. 17 shows an example of a card screen for displaying this card. As shown in FIG. 17, the card screen includes a card field 41 for displaying a list of all information extracted from the XML text to be displayed on the card, and a “list display” button 42.
[0048]
In the next S708, the CPU 1 waits for the “list display” button 42 to be pressed. When the “list display” button 42 is pressed, the CPU 1 returns the process to S205.
[0049]
By executing this display process, the operator selects the XML text to be displayed on the card based on the information listed in the list field 39 of the list screen. The card display screen for the selected XML text allows the user to see at a glance the information narrowed down from the XML text as required by the user. In this way, the operator can arbitrarily switch the display format. Even if the switching is performed in this way, the information is already extracted from the display target XML text, so that the information is immediately displayed.
(Appendix 1)
A tagged information display method for extracting and displaying information necessary for a user from tagged information,
A profile generation step for generating a profile including one or more keywords indicating the type of information required by the user in advance;
A tag structure extraction step for extracting a plurality of tags included in the tagged information from the tagged information as a sample;
A conversion rule generation step for extracting only tags corresponding to the keywords from the plurality of extracted tags and generating them as conversion rule information;
An information extraction step of extracting information specified by the same tag as the tag included in the conversion rule from the tagged information to be displayed;
A display step for displaying the extracted information;
A method for displaying tagged information, which is performed sequentially. (1)
(Appendix 2)
In the conversion rule generation step, the extracted tag is further presented to the operator and restricted according to a request from the tag operator to be included in the conversion rule.
The tagged information display method according to supplementary note 1, wherein: (2)
(Appendix 3)
In the profile generation step, keywords frequently used for information collection are included in the profile in consideration of the information collection history of the user.
The tagged information display method according to supplementary note 1, wherein: (3)
(Appendix 4)
In the conversion rule generation step, an item name corresponding to a tag included in the conversion rule is further set,
In the display step, the information extracted from the tagged information to be displayed as specified by the tag included in the conversion rule in the information extraction step is attached with an item name corresponding to the tag. indicate
The tagged information display method according to supplementary note 1, wherein:
(Appendix 5)
In the tag structure extraction step, a plurality of tags respectively extracted from a plurality of tagged information as samples are integrated.
The tagged information display method according to supplementary note 1, wherein:
(Appendix 6)
When synthesizing, synonyms are normalized
The tagged information display method according to supplementary note 5, characterized in that:
(Appendix 7)
In the display step, the information extracted from the plurality of tagged information in the information extraction step is displayed in a list format.
The tagged information display method according to supplementary note 1, wherein:
(Appendix 8)
In the display step, a plurality of information extracted from the single tagged information in the information extraction step is displayed in a card format.
The tagged information display method according to supplementary note 1, wherein:
(Appendix 7)
Against the computer,
A profile generation step for generating a profile including one or more keywords indicating the type of information required by the user;
A tag structure extraction step for extracting a plurality of tags included in the tagged information from the tagged information as a sample;
A conversion rule generation step for extracting only tags corresponding to the keywords from the plurality of extracted tags and generating them as conversion rule information;
An information extraction step of extracting information specified by the same tag as the tag included in the conversion rule from the tagged information to be displayed;
A display step for displaying the extracted information;
A tagged information display program that is sequentially executed. (4)
(Appendix 8)
A tagged information display device for extracting and displaying information necessary for a user from tagged information,
Profile generation means for generating a profile including one or more keywords indicating the type of information required by the user in advance;
Tag structure extraction means for extracting a plurality of tags included in the tagged information from the tagged information as a sample;
A conversion rule generating means for extracting only the tag corresponding to the keyword from the plurality of extracted tags and generating the conversion rule information;
Information extracting means for extracting information specified by the same tag as the tag included in the conversion rule from the tagged information to be displayed;
Display means for displaying the extracted information;
An information display device with a tag, characterized by comprising. (5)
(Appendix 9)
A tagged information display method for extracting and displaying information necessary for a user from tagged information,
A profile generation step for generating a profile including one or more keywords indicating the type of information required by the user in advance;
A tag structure extraction step of extracting a plurality of tags included in the tagged information from the sampled tagged information in a form representing the hierarchical structure;
A conversion rule generation step of extracting only the lower layer tag corresponding to the keyword from the plurality of extracted tags in combination with the tag corresponding to the upper layer of the lower layer tag, and generating the conversion rule information;
An information extraction step of extracting information specified by the same tag combination as the combination of the lower layer tag and the upper layer tag included in the conversion rule from the tagged information to be displayed;
A display step for displaying the extracted information;
A method for displaying tagged information, which is performed sequentially.
(Appendix 10)
Against the computer,
A profile generation step for generating a profile including one or more keywords indicating the type of information required by the user;
A tag structure extraction step of extracting a plurality of tags included in the tagged information from the sampled tagged information in a form representing the hierarchical structure;
A conversion rule generation step of extracting only the lower layer tag corresponding to the keyword from the plurality of extracted tags in combination with the tag corresponding to the upper layer of the lower layer tag, and generating the conversion rule information;
An information extraction step of extracting information specified by the same tag combination as the combination of the lower layer tag and the upper layer tag included in the conversion rule from the tagged information to be displayed;
A display step for displaying the extracted information;
A tagged information display program that is sequentially executed.
(Appendix 11)
A tagged information display device for extracting and displaying information necessary for a user from tagged information,
Profile generation means for generating a profile including one or more keywords indicating the type of information required by the user in advance;
Tag structure extraction means for extracting a plurality of tags included in the tagged information from the sampled tagged information in a form representing the hierarchical structure;
A conversion rule generating means for extracting only a lower-layer tag corresponding to the keyword from a plurality of extracted tags in combination with a tag corresponding to an upper layer of the lower-layer tag, and generating as conversion rule information;
Information extracting means for extracting from the tagged information to be displayed, information specified by the same tag combination as the lower layer tag and the upper layer tag included in the conversion rule;
Display means for displaying the extracted information;
An information display device with a tag, characterized by comprising.
[0050]
【The invention's effect】
According to the information display method of the present invention configured as described above, any type of information can be extracted from a tagged document and displayed in response to a user request.
[Brief description of the drawings]
FIG. 1 is a conceptual diagram of an information display system according to an embodiment of the present invention.
FIG. 2 is a block diagram showing a hardware configuration of the information display system
FIG. 3 is a flowchart showing a profile generation process executed in accordance with a tagged document display program.
FIG. 4 is a flowchart showing a preprocessing process executed in accordance with a tagged document display program.
FIG. 5 is a flowchart showing a preprocessing process executed in accordance with a tagged document display program.
FIG. 6 is a flowchart showing a display processing process executed in accordance with a tagged document display program.
FIG. 7 is a diagram showing an example of XML text
FIG. 8 is a diagram showing an example of XML tag structure information
FIG. 9 is a diagram showing an example of a profile
FIG. 10 is a diagram showing an example of a tag extracted from an XML tag structure information according to a profile and given an ID
FIG. 11 is a table showing the relationship between field names and IDs.
FIG. 12 shows a conversion rule creation screen
FIG. 13 shows a tag structure screen.
FIG. 14 shows a conversion rule confirmation screen.
FIG. 15 is a diagram showing an example of a conversion rule
FIG. 16 shows a list display screen.
FIG. 17 shows a card display screen.
[Explanation of symbols]
1 CPU
2 Hard disk
5 display devices
6 Input device
23 Tagged document display program
25 profiles
26 Conversion rules

Claims (3)

タグを用いて文書構造が規定されたタグ付き文書から利用者に必要な情報を抽出して表示する情報表示方法であって、
コンピュータが、
予め、前記利用者が必要とする一又は複数のキーワードを含むプロファイルを生成するプロファイル生成ステップと、
表示対象となる複数の前記タグ付き文書から抽出したサンプルとなるタグ付き文書から、そのタグ付き文書に含まれる複数のタグを抽出するタグ構造抽出ステップと、
抽出された複数のタグから、更に、前記キーワードと同一のタグを複数抽出し表示装置に表示し該表示された複数のタグに基づき、タグで囲まれた情報を表示する際における該タグ間の階層構造、該タグに対応して表示する表示名称、該タグに囲まれた情報を表示する際の表示属性のいずれかに関する表示処理規則を、前記利用者から受け付ける変換規則生成ステップと、
表示対象のタグ付き文書から、前記表示処理則に含まれるタグと同じタグで囲まれた情報を抽出する情報抽出ステップと、
抽出された前記タグで囲まれた情報を、前記表示処理規則に定められた前記タグ間の階層構造、前記タグに対応して表示する表示名称、前記タグに囲まれた情報の表示属性のいずれかに基づいて、表示装置に表示する表示ステップとを
実行する
ことを特徴とする情報表示方法。
An information display method for extracting and displaying information necessary for a user from a tagged document whose document structure is defined using a tag,
Computer
A profile generation step for generating a profile including one or more keywords required by the user in advance;
A tag structure extraction step of extracting a plurality of tags included in the tagged document from a tagged document that is a sample extracted from the plurality of tagged documents to be displayed;
From the extracted plurality of tags, further, the keyword and the same tag is displayed on the plurality extracted display device, based on a plurality of tags the display, definitive when displaying the information enclosed in the inter-tag the tag hierarchy, display attribute Neu display processing rules for Zureka conversion rule generation step Keru with receiving from the user at the time of displaying the display name, information enclosed in the tag to be displayed in correspondence with the tag When,
From tagged document to be displayed, and the information extracting step of extracting information enclosed in the same tag as the tag included in the display processing rules,
The information enclosed in extracted the tag, the hierarchical structure between the tag defined in the Display processing rules, display name to be displayed corresponding to the tag, the display attribute of the information enclosed in the tag An information display method characterized by executing a display step of displaying on a display device based on any one of them .
コンピュータに対して、
予め、利用者が必要とする一又は複数のキーワードを含むプロファイルを生成するプロファイル生成ステップと、
表示対象である、タグを用いて文書構造が規定されたタグ付き文書の複数から抽出したサンプルとなるタグ付き文書から、そのタグ付き文書に含まれる複数のタグを抽出するタグ構造抽出ステップと、
抽出された複数のタグから、更に、前記キーワードと同一のタグを複数抽出し表示装置に表示し該表示された複数のタグに基づき、タグで囲まれた情報を表示する際における該タグ間の階層構造、該タグに対応して表示する表示名称、該タグに囲まれた情報を表示する際の表示属性のいずれかに関する表示処理規則を、前記利用者から受け付ける変換規則生成ステップと、
表示対象のタグ付き文書から、前記表示処理則に含まれるタグと同じタグで囲まれた情報を抽出する情報抽出ステップと、
抽出された前記タグで囲まれた情報を、前記表示処理規則に定められた前記タグ間の階層構造、前記タグに対応して表示する表示名称、前記タグに囲まれた情報の表示属性のいずれかに基づいて、表示装置に表示する表示ステップとを
実行させる
ことを特徴とする情報表示プログラム。
Against the computer,
A profile generation step for generating a profile including one or more keywords required by the user in advance;
A tag structure extraction step for extracting a plurality of tags included in the tagged document from a tagged document that is a sample extracted from a plurality of tagged documents whose document structure is defined using tags, which is a display target;
From the extracted plurality of tags, further, the keyword and the same tag is displayed on the plurality extracted display device, based on a plurality of tags the display, definitive when displaying the information enclosed in the inter-tag the tag hierarchy, display attribute Neu display processing rules for Zureka conversion rule generation step Keru with receiving from the user at the time of displaying the display name, information enclosed in the tag to be displayed in correspondence with the tag When,
From tagged document to be displayed, and the information extracting step of extracting information enclosed in the same tag as the tag included in the display processing rules,
The information enclosed in extracted the tag, the hierarchical structure between the tag defined in the Display processing rules, display name to be displayed corresponding to the tag, the display attribute of the information enclosed in the tag An information display program that causes a display step to be displayed on a display device to be executed on the basis of either of them .
タグを用いて文書構造が規定されたタグ付き文書から利用者に必要な情報を抽出して表示する情報表示装置であって、
予め、前記利用者が必要とする一又は複数のキーワードを含むプロファイルを生成するプロファイル生成手段と、
表示対象となる複数の前記タグ付き文書から抽出したサンプルとなるタグ付き文書から、そのタグ付き文書に含まれる複数のタグを抽出するタグ構造抽出手段と、
抽出された複数のタグから、更に、前記キーワードと同一のタグを複数抽出し表示装置に表示し該表示された複数のタグに基づき、タグで囲まれた情報を表示する際における該タグ間の階層構造、該タグに対応して表示する表示名称、該タグに囲まれた情報を表示 する際の表示属性のいずれかに関する表示処理規則を、前記利用者から受け付ける変換規則生成手段と、
表示対象のタグ付き文書から、前記表示処理則に含まれるタグと同じタグで囲まれた情報を抽出する情報抽出手段と、
抽出された前記タグで囲まれた情報を、前記表示処理規則に定められた前記タグ間の階層構造、前記タグに対応して表示する表示名称、前記タグに囲まれた情報の表示属性のいずれかに基づいて、表示装置に表示する表示手段と
を備えたことを特徴とする情報表示装置。
An information display device that extracts and displays information necessary for a user from a tagged document whose document structure is defined using a tag,
Profile generation means for generating a profile including one or more keywords required by the user in advance;
Tag structure extraction means for extracting a plurality of tags included in the tagged document from a tagged document that is a sample extracted from the plurality of tagged documents to be displayed;
From the extracted plurality of tags, further, the keyword and the same tag is displayed on the plurality extracted display device, based on a plurality of tags the display, definitive when displaying the information enclosed in the inter-tag the tag hierarchical structure, display name to be displayed corresponding to the tag, the display processing rules relating to the display attributes Neu either the time of displaying the information enclosed in the tag, Keru with receiving from the user conversion rule generation means When,
From tagged document to be displayed, and information extracting means for extracting information enclosed in the same tag as the tag included in the display processing rules,
The information enclosed in extracted the tag, the hierarchical structure between the tag defined in the Display processing rules, display name to be displayed corresponding to the tag, the display attribute of the information enclosed in the tag An information display device comprising: a display unit configured to display on the display device based on either of them .
JP2001370102A 2001-12-04 2001-12-04 Information display method, information display program, and information display apparatus Expired - Fee Related JP4251804B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001370102A JP4251804B2 (en) 2001-12-04 2001-12-04 Information display method, information display program, and information display apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001370102A JP4251804B2 (en) 2001-12-04 2001-12-04 Information display method, information display program, and information display apparatus

Publications (2)

Publication Number Publication Date
JP2003167879A JP2003167879A (en) 2003-06-13
JP4251804B2 true JP4251804B2 (en) 2009-04-08

Family

ID=19179380

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001370102A Expired - Fee Related JP4251804B2 (en) 2001-12-04 2001-12-04 Information display method, information display program, and information display apparatus

Country Status (1)

Country Link
JP (1) JP4251804B2 (en)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4637113B2 (en) * 2003-11-28 2011-02-23 キヤノン株式会社 Method for building a preferred view of hierarchical data
JP4923413B2 (en) * 2005-02-28 2012-04-25 富士通株式会社 Information extraction program and method
JPWO2006137564A1 (en) * 2005-06-24 2009-01-22 株式会社ジャストシステム Document processing device
JP4843656B2 (en) * 2008-09-29 2011-12-21 株式会社東芝 Structured data search program and structured data search device
CN101794282B (en) 2009-02-03 2013-11-06 日电(中国)有限公司 Method and system for detection of knowledge tagging result

Also Published As

Publication number Publication date
JP2003167879A (en) 2003-06-13

Similar Documents

Publication Publication Date Title
US6658408B2 (en) Document information management system
US9348871B2 (en) Method and system for assessing relevant properties of work contexts for use by information services
US8978033B2 (en) Automatic method and system for formulating and transforming representations of context used by information services
JP4509366B2 (en) A system that scans and formats information on documents
US7113941B2 (en) Database access mechanisms for a computer user interface
US20020065852A1 (en) Online guided resume creation system that allows dynamic style formatting
JP2001527246A (en) Convert and display publication files
WO2006051297A1 (en) System and method for formulating and refining queries on structured data
US20060190483A1 (en) Data registration/search support device using a keyword
JPH1153392A (en) Information filtering device and related information presentation method applied to the device
JP3195252B2 (en) Document browsing support method and system
JP4251804B2 (en) Information display method, information display program, and information display apparatus
JP2002189721A (en) Web page retrieval system and translation system
US8612431B2 (en) Multi-part record searches
JP2004192355A (en) Informational searching method, its device and computer program for information search
JP2000231570A (en) Internet information processor, internet information processing method and computer readable recording medium with program making computer execute method recorded therein
US7386794B2 (en) Apparatus and method for performing the management of operation history
JP3154992B2 (en) Information search device and storage medium storing information search program
JP2000231569A (en) Internet information retrieving device, internet information retrieving method and computer readable recording medium with program making computer execute method recorded therein
JP3450598B2 (en) Technical term dictionary selection device
JPH10162011A (en) Information retrieval method, information retrieval system, information retrieval terminal equipment, and information retrieval device
JP2000322167A (en) Data management system and method for displaying data attribute
JP2000099543A (en) Information retrieval device
JP4617015B2 (en) Document display device, document display method, and program
JP2023125592A (en) Information processing system, information processing method, and program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20041202

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20071116

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20071210

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080422

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080526

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080701

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080818

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080924

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081113

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090106

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090120

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120130

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees