JP2007073072A - Related document display device - Google Patents
Related document display device Download PDFInfo
- Publication number
- JP2007073072A JP2007073072A JP2006315390A JP2006315390A JP2007073072A JP 2007073072 A JP2007073072 A JP 2007073072A JP 2006315390 A JP2006315390 A JP 2006315390A JP 2006315390 A JP2006315390 A JP 2006315390A JP 2007073072 A JP2007073072 A JP 2007073072A
- Authority
- JP
- Japan
- Prior art keywords
- document
- thread
- display device
- index
- documents
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
本発明は、参照関係にある文書群を整理し、その文書群をいろいろな観点から表示することによって、ユーザによる必要な情報へのアクセスを支援する技術に関する。 The present invention relates to a technique for assisting a user to access necessary information by organizing a document group having a reference relationship and displaying the document group from various viewpoints.
パソコン通信又はコンピュータネットワーク上で運用される電子会議室や電子ニュース等において、順次蓄積される文書集合の中から必要な文書をより迅速かつ簡単に見つけ出したいという要請が、従来からある。 2. Description of the Related Art Conventionally, there has been a demand for finding a necessary document more quickly and easily from a collection of documents stored sequentially in an electronic conference room or electronic news operated on a personal computer communication or a computer network.
このような要請に対して、文書集合中の各文書のタイトルを作成日順に並び替え、その結果得られるタイトルリストをユーザに掲示するという従来技術が知られている。
また、文書集合を互いに参照関係のある文書から構成される文書群に分類し、文書群中の各文書のタイトルをインデントして表示することにより、各文書の参照関係を掲示する従来技術や、文書群中の各文書の番号をツリーで表示することにより各文書の参照関係を掲示する従来技術も知られている。
In response to such a request, a conventional technique is known in which the titles of the documents in the document set are rearranged in order of creation date, and a title list obtained as a result is posted to the user.
In addition, by classifying a document set into a document group composed of documents having a reference relationship with each other, and displaying indented titles of each document in the document group, a conventional technique for displaying the reference relationship of each document, There is also known a conventional technique for displaying the reference relationship of each document by displaying the number of each document in the document group as a tree.
更に、文書集合の中から、特定のキーワードを含む文書を全文検索し、その検索結果を羅列的に掲示する従来技術も知られている。 Furthermore, a conventional technique is also known in which a full text search is performed for a document including a specific keyword from a document set and the search results are displayed in a list.
しかし、これらの従来技術におけるような限定された情報表示のみでは、以下に示される問題点を解決することができなかった。
1.雑多な文書集合の中から必要な文書又は必要な文書が含まれているであろう文書群を見つけ出すためには、掲示される文書のタイトルに頼るしかない。タイトルは、必ずしも文書内容を正確に表わしているとは限らないため、正確な検索が困難である。
However, only the limited information display as in these prior arts cannot solve the following problems.
1. In order to find out a necessary document or a group of documents that may contain a necessary document from the miscellaneous document set, it is necessary to rely on the title of the posted document. Since the title does not necessarily accurately represent the document content, it is difficult to perform an accurate search.
2.タイトルのインデント表示や文書番号のツリー表示だけでは、文書群全体の構造を把握すること、及び文書群における話題の推移を把握することが困難である。
3.種々の観点から必要な文書にアクセスすることができない。
2. It is difficult to grasp the structure of the entire document group and the transition of topics in the document group only by the indent display of the title and the tree display of the document number.
3. Necessary documents cannot be accessed from various viewpoints.
4.検索結果が多数件ある場合に、更に絞り込み検索を実行するか検索結果のリストを1件1件チェックしなければ、必要な文書にアクセスすることができない。
一方、複数の特定の文書からキーワードを抽出し、共通のキーワードを含む各文書に対し自動的に他の文書へのリンクを設定する技術が、知られている。この従来技術は、特許の公知例や研究論文等の特定文書中で互いの文献を相互参照することを可能にすることによって、関連する複数の文書を効率的に読み広げることを可能にする。
4). If there are a large number of search results, it is not possible to access a necessary document unless further narrowing search is executed or the search result list is checked one by one.
On the other hand, a technique for extracting a keyword from a plurality of specific documents and automatically setting a link to another document for each document including a common keyword is known. This prior art makes it possible to efficiently read a plurality of related documents by making it possible to cross-reference each other's documents in a specific document such as a known example of a patent or a research paper.
しかし、このような従来技術は、関連する文書の参照を容易にすることを目的としており、電子会議室や電子ニュース等の文書集合からの、必要な文書又は必要な文書が含まれているであろう文書群の検索の支援に、適用することはできなかった。 However, such prior art is intended to facilitate the reference of related documents, and includes necessary documents or necessary documents from a set of documents such as an electronic conference room and electronic news. It could not be applied to support searching for a group of documents.
本発明の課題は、大量の文書が含まれる文書集合からの、必要な文書又は必要な文書が含まれているであろう文書群の検索を、支援することにある。 An object of the present invention is to support a search for a necessary document or a group of documents that may contain a necessary document from a document set including a large number of documents.
本発明は、上記課題を解決するため、参照関係を有する文書からなる文書群を表示する関連文書表示装置であって、参照関係を有する文書群からなる文書データベースから、文書内容及び作者間の投稿パターンに基づいて前記文書群の内容を推定して、該内容の話題パターンに対応するインデックスを生成する内容推定手段と、利用者からの前記文書データベースに対する検索要求を入力する入力手段と、前記文書データベースの文書を検索する検索エンジン手段と、該検索エンジン手段からの検索結果と前記インデックスを利用して1つ以上のビユーを生成し、該1つ以上のビューを切り替えて表示装置に表示するビュー生成手段と、を含むことを特徴とするものである。 In order to solve the above-mentioned problem, the present invention is a related document display device for displaying a document group consisting of documents having a reference relationship. Content estimation means for estimating the content of the document group based on a pattern and generating an index corresponding to the topic pattern of the content; input means for inputting a search request for the document database from a user; and the document A search engine means for searching for documents in a database, a view for generating one or more views using a search result from the search engine means and the index, and switching the one or more views to display on a display device Generating means.
なお、本発明は、コンピュータにより使用されたときに、上述の本発明の構成によって実現される機能と同様の機能をコンピュータに行わせるためのコンピュータ読出し可能記録媒体として構成することもできる。 The present invention can also be configured as a computer-readable recording medium for causing a computer to perform the same functions as those realized by the above-described configuration of the present invention when used by a computer.
本発明によれば、自動的に推定された話題と共に検索結果が表示されるため、検索結果のスレッド数が多い場合でも、利用者は検索結果の概要を容易に把握することが可能となる。 According to the present invention, since the search result is displayed together with the automatically estimated topic, the user can easily grasp the outline of the search result even when the number of threads of the search result is large.
また、スレッド中の文書量が多くても、同じ作者が何度も投稿している場合がある。本発明によれば、作者を中心に見せるビユーが提供されることにより、スレッド内のキーパーソンが把握可能となるだけでなく、スレッドの全体構造もコンパクトに表示することが可能となる。 Also, even if the amount of documents in the thread is large, the same author may post many times. According to the present invention, by providing a view showing mainly the author, not only the key person in the thread can be grasped, but also the entire structure of the thread can be displayed in a compact manner.
このように、本発明によれば、文書群に対して種々の観点からアクセスすることが可能となる。 As described above, according to the present invention, it is possible to access a document group from various viewpoints.
以下、図面を参照しながら本発明の実施の形態について詳細に説明する。
〔全体構成〕
図1は、本発明の実施の形態が対象とする、文書集合及び文書群の例を示す図である。
Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.
〔overall structure〕
FIG. 1 is a diagram showing an example of a document set and a document group targeted by the embodiment of the present invention.
この例では、コンピュータネットワーク上に、ユーザが話題別に議論を行うフォーラムと呼ばれる仮想的な公開討論会場が設けられており、各フォーラムは、会議室と呼ばれる、更に細分化された話題を扱う複数の仮想的な会場に分類されている。ユーザがこの会議室に、発言文書を投稿(アップロード)することによって、議論が進行する。フォーラム及び会議室とも、サーバコンピュータ上のストレージエリアとして構成され、それらには、上述した分類基準に従って、文書が蓄積される。また、各会議室において、互いに参照関係を有する複数の文書からなる文書群がスレッドを構成する。 In this example, a virtual public discussion venue called a forum where users discuss by topic is provided on a computer network. Each forum is called a conference room, and a plurality of subdivided topics are handled. It is classified as a virtual venue. The discussion proceeds by the user posting (uploading) a comment document to the conference room. Both the forum and the conference room are configured as storage areas on the server computer, in which documents are stored according to the above-described classification criteria. In each conference room, a document group composed of a plurality of documents having a reference relationship with each other forms a thread.
ユーザが投稿する文書は、例えば、図2に示されるデータ構造を有しており、その文書の番号を示す文書番号、日付、タイトル、その文書が参照する文書の番号である参照文書番号、作者名(発言者名)等の文書の属性フィールドが記載されるヘッダ部と、文書の本体が記載される内容部とから構成されている。 The document posted by the user has, for example, the data structure shown in FIG. 2, and includes a document number indicating the number of the document, a date, a title, a reference document number that is the number of the document referenced by the document, It consists of a header portion in which an attribute field of a document such as a name (speaker name) is described, and a content portion in which the main body of the document is described.
本発明の実施の形態では、以下のような表示形態が可能となる。
1.キーワードビユー:会議室を構成する文書集合において、その文書集合中の各スレッド毎に、そのスレッドを構成する文書群からキーワードが抽出され、それらのキーワードが、それらの文書数及びそれらが含まれるスレッドのタイトルと合わせて、図25に示される表示形態で表示される。
In the embodiment of the present invention, the following display forms are possible.
1. Keyword view: In a document set constituting a conference room, for each thread in the document set, keywords are extracted from a group of documents constituting the thread, and those keywords are the number of those documents and the thread in which they are included. The title is displayed in the display form shown in FIG.
キーワードビユーによって、ユーザは、キーワードを頼りにして、雑多な文書集合の中から必要な文書が含まれているであろうスレッド(文書群)を容易に見つけ出すことが可能となる。 The keyword view allows the user to easily find a thread (document group) that may contain a necessary document from a miscellaneous document set, relying on the keyword.
2.スレッドビュー:文書の参照関係、タイトル、作者名、及び行数が一目にわかる図26に示される表示形態で、各スレッドを構成する文書群が表示される。
スレッドビューにより、スレッド全体の構造を把握し話題の推移を容易に把握することが可能となる。
2. Thread view: A document group constituting each thread is displayed in a display form shown in FIG. 26 in which the document reference relationship, title, author name, and number of lines can be seen at a glance.
With the thread view, it is possible to grasp the structure of the entire thread and easily grasp the transition of topics.
3.発言者ビュー:各文書のタイトルが、発言者(作者)毎に分類され、かつ発言者が発言の多い順にソートされ、同一発言者内では日付順で、図27に示される表示形態で、表示される。 3. Speaker View: The title of each document is classified by the speaker (author) and the speakers are sorted in descending order of the speakers, and are displayed in the date order within the same speaker in the display form shown in FIG. Is done.
発言者及び発言日付という観点から、文書集合(会議室)内の文書を参照することが可能となる。
4.各ビューへの検索結果の反映:ユーザが指定した検索キーワードに関連する文書が、図32又は図33に示される表示形態で、キーワードビユー、スレッドビュー等の表示中で強調表示される。
It is possible to refer to documents in a document set (conference room) from the viewpoint of a speaker and a statement date.
4). Reflecting search results to each view: A document related to a search keyword designated by the user is highlighted in the display of keyword view, thread view, etc. in the display form shown in FIG.
この結果、より正確な文書の把握が可能となる。
5.各ビューの切替え機能:上述のキーワードビユー、スレッドビュー、及び発言者ビューが任意に切替え可能とされることにより、種々の観点から必要な文書にアクセス可能となる。
As a result, a more accurate document can be grasped.
5. Switching function of each view: Necessary documents can be accessed from various viewpoints by arbitrarily switching the above-described keyword view, thread view, and speaker view.
以上のような表示形態を可能とする本発明の実施の形態について、詳細に説明する。
図3及び図4は、本発明の実施の形態のシステム構成図である。
フォーラム/会議室内の文書群は、所定のサーバコンピュータ上の文書群データベース301として、蓄積される。
An embodiment of the present invention that enables the display form as described above will be described in detail.
3 and 4 are system configuration diagrams according to the embodiment of this invention.
The document group in the forum / meeting room is stored as a
文書群解析装置302は、文書群データベース301内の各会議室に対応する文書集合毎に、それに含まれる文書群の解析を行う。
集計装置303は、文書群解析装置302による解析結果に基づいて、メタインデックス304、スレッドインデックス305、及び索引ファイル404を生成する。
The document
The
表示装置306は、メタインデックス304とスレッドインデックス305を用いて、キーワードビユー、スレッドビュー、又は発言者ビューの何れかの表示形態で、文書群を表示する。
The
また、文字列検索装置405は、ユーザによる検索語の指定に基づいて、索引ファイル404を用いながら文書群データベース301内の文書集合を構成する各文書に対して検索を実行する。表示装置306は、その検索結果を、キーワードビユー又はスレッドビューに反映させて表示する。
Further, the character
表示装置306は、メタインデックス304とスレッドインデックス305を用いて、キーワードビユー、スレッドビュー、又は発言者ビューの何れかの表示形態で、文書群を表示する。
The
文書群解析装置302は、書式解析部401、構造解析部402、及び内容解析部403とから構成される。
書式解析部401は、文書群データベース301内の文書集合を構成する図2のデータ構造を有する各文書のヘッダ部から、文書番号、タイトル、作者名、日付、及び参照文書番号を抽出し、また、各文書の内容部の行数を算出し、それらを、集計装置303を経由して、図5に示されるデータ構造を有するメタインデックス304に登録する。
The document
The
構造解析部402は、書式解析部401が各文書から抽出した文書番号と参照文書番号に基づいて、各文書をスレッドを単位とする文書群に分類し、集計装置303を経由して、スレッド毎に、それを構成する文書の参照関係のリストであるスレッドインデックス305を作成する。
The
図6は、スレッドインデックス305のデータ構造を示す図である。各スレッド毎に、ルート文書番号と、文書数と、スレッドの構造を示すリストとが登録される。リストは、
(親文書番号 子文書番号/サブツリー子文書番号/サブツリー....)
という記述形式によって記述され、”子文書番号/サブツリー”の部分には、更に再帰的(リカーシブ)に、子リストを記述することができる。
FIG. 6 is a diagram illustrating the data structure of the
(Parent document number Child document number / Subtree Child document number / Subtree ....)
The child list can be further recursively described in the “child document number / subtree” part.
図6に例示される2つのスレッドの各リストにより表現される各参照関係は、同図の表の右側に示される如くである。
また、構造解析部402は、解析したスレッドを構成する文書群を、更にタイトルを同一とするサブ文書群に分類し、各サブ文書群に色番号を付与し、各サブ文書群に含まれる文書に対応する図5のデータ構造を有するメタインデックス304内のエントリに、その文書が属するサブ文書群に付与された色番号を登録する。
Each reference relationship represented by each list of two threads illustrated in FIG. 6 is as shown on the right side of the table of FIG.
The
内容解析部403は、構造解析部402によって分類されたスレッド毎に、そのスレッドを構成する文書群を1つの結合文書ファイルにまとめ、その結合文書からキーワードを抽出する。日本語文書からキーワードを抽出する技術としては、種々の公知技術を採用することができる。この場合に、キーワード抽出の精度を向上させるために、ノイズとなる文字がパターンマッチングによって除去される。また、例えば、上位所定個数のキーワードのみが抽出される。
For each thread classified by the
内容解析部403によって抽出された各スレッドのキーワードは、集計装置303を経由して、そのスレッドのルート文書に対応する図5のデータ構造を有するメタインデックス304のエントリに、登録される。
The keywords of each thread extracted by the
また、内容解析部403は、スレッド毎に抽出したキーワードから、そのキーワードに含まれる索引語を抽出し、集計装置303を経由して、図7に示されるデータ構造を有する索引ファイル404を生成する。
Further, the
この索引ファイル404は、前述したように、文字列検索装置405によって参照される。
〔文書群解析装置302の詳細説明〕
図8は、図4の文書群解析装置302内の書式解析部401及び構造解析部402が実現する制御動作を示す動作フローチャートである。
The
[Detailed Description of Document Group Analysis Device 302]
FIG. 8 is an operation flowchart showing control operations realized by the
まず、書式解析部401は、文書群データベース301から新たに登録された新規文書ファイルから文書データを1行ずつ読み込みながら、その文書ファイルのヘッダ部(図2参照)から、文書番号、タイトル、作者名、日付、及び参照文書番号を抽出する(ステップ801→802→803→801のループ)。
First, the
書式解析部401は、ヘッダ部の抽出を終了すると、集計装置303を経由して、図5のデータ構造を有するメタインデックス304において新規エントリを生成し、そのエントリに、抽出した文書番号、タイトル、作者名、日付、及び参照文書番号を登録する(ステップ802→804)。
When finishing the extraction of the header part, the
次に、書式解析部401は、上記新規文書ファイル内のヘッダ部以降の内容部(図2参照)から文書データを1行ずつ読み込みながら、文書末尾(EOF:エンドオブファイル)が検出されるまで、内容部の行数をカウントする(ステップ805→806→807→805のループ)。
Next, the
書式解析部401は、文書末尾を検出すると、集計装置303を経由して、それまでにカウントした内容部の行数を、図5のデータ構造を有するメタインデックス304の、現在処理中の新規文書の文書番号に対応するエントリに、登録する(ステップ806→808)。
When the
なお、上述の行数のカウント処理において、他の文書から引用している行(例えば”> ”で始まる行)については、行数のカウントには算入しないことによって、その文書が実質的に発言している行数をカウントするように構成されてもよい。 In the above-mentioned line count processing, lines cited from other documents (for example, lines starting with “>”) are not included in the line count, so that the document is substantially remarked. It may be configured to count the number of lines being processed.
続いて、構造解析部402に制御が移り、構造解析部402は、まず、現在処理中の新規文書の文書番号を、集計装置303を経由して、図6のデータ構造を有するスレッドインデックス305に登録する(ステップ809)。
Subsequently, control is transferred to the
図9は、上記ステップ809の登録動作を示す動作フローチャートである。
まず、構造解析部402は、現在処理中の新規文書が、或るスレッドのルート文書であるか否かを判定する(ステップ901)。具体的には、構造解析部402は、図8のステップ801〜803のループにおいて、現在処理中の新規文書から参照文書番号が検出されなかった場合に、その文書はルート文書であると判定する。
FIG. 9 is an operation flowchart showing the registration operation in
First, the
構造解析部402は、現在処理中の新規文書が或るスレッドのルート文書であると判定した場合には、集計装置303を経由して、スレッドインデックス305において新規エントリを生成し、そのエントリに現在処理中の新規文書の文書番号をルート文書番号として登録する(ステップ901→902)。
If the
構造解析部402は、ステップ902の処理の後、上記エントリの文書数を1に初期設定し(ステップ906)、図8のステップ809の処理を終了する。
一方、構造解析部402は、現在処理中の新規文書が或るスレッドのルート文書ではないと判定した場合には、現在処理中の新規文書のヘッダ部から抽出されている参照文書番号が含まれるスレッドインデックス305中のエントリに、その参照文書番号を親文書番号とするリストが存在するか否かを判定する(ステップ901→903)。
After the processing in
On the other hand, if the
構造解析部402は、上述のエントリに、現在処理中の新規文書のヘッダ部から抽出されている参照文書番号を親文書番号とするリストが存在すると判定した場合には、現在処理中の新規文書のヘッダ部から抽出されている文書番号を、そのリストの子文書番号として登録する(ステップ903→905)。
If the
一方、構造解析部402は、上述のエントリに、現在処理中の新規文書のヘッダ部から抽出されている参照文書番号を親文書番号とするリストが存在しないと判定した場合には、そのエントリに、その参照文書番号を親文書番号とするリストを生成した上で、現在処理中の新規文書のヘッダ部から抽出されている文書番号を、そのリストの子文書番号として登録する(ステップ903→904→905)。
On the other hand, if the
構造解析部402は、ステップ905の処理の後、上述のエントリの文書数を更新(プラス1)し(ステップ906)、図8のステップ809の処理を終了する。
上記図9の動作フローチャートによって実現される制御動作の具体例につき、図10の説明図を用いて説明する。この図は、図6のスレッドインデックス305において、ルート文書番号が”001”であるスレッドのエントリのリストが生成される過程を示すものである。
After the processing in step 905, the
A specific example of the control operation realized by the operation flowchart of FIG. 9 will be described with reference to the explanatory diagram of FIG. This figure shows a process of generating a list of entries of a thread whose root document number is “001” in the
まず、文書番号”001”のルート文書が処理される時点で、図9のステップ901→902が実行されることにより、スレッドインデックス305において新規エントリが生成され、そのエントリに文書番号”001”がルート文書番号として登録され(図10の(1))、上記エントリの文書数が1に初期設定される。
First, when the root document with the document number “001” is processed, a new entry is generated in the
次に、文書番号”002”の文書が処理される時点で、図9のステップ901→903→904→905→906が実行されることにより、スレッドインデックス305内のルート文書番号”001”のエントリにおいて、文書番号”002”の文書から抽出された参照文書番号”001”を親文書番号とするリストが生成された後(図10の(2))、文書番号”002”がそのリストの子文書番号として登録され(図10の(3)の下線部)、上記エントリの文書数が2に更新される。
Next, when the document with the document number “002” is processed, the entry of the root document number “001” in the
次に、文書番号”003”の文書が処理される時点で、図9のステップ901→903→904→905→906が実行されることにより、スレッドインデックス305内のルート文書番号”001”のエントリにおいて、文書番号”003”の文書から抽出された参照文書番号”002”を親文書番号とするリストが生成された後(図10の(4)の下線部)、文書番号”003”がそのリストの子文書番号として登録され(図10の(5)の下線部)、上記エントリの文書数が3に更新される。
Next, when the document with the document number “003” is processed, the entry of the root document number “001” in the
次に、文書番号”004”の文書が処理される時点で、図9のステップ901→903→905→906が実行されることにより、スレッドインデックス305内のルート文書番号”001”のエントリにおいて、文書番号”004”の文書から抽出された参照文書番号”001”を親文書番号とするリストの子文書番号として、文書番号”004”が登録され(図10の(6)の下線部)、上記エントリの文書数が4に更新される。
Next, when the document with the document number “004” is processed, the
次に、文書番号”005”の文書が処理される時点で、図9のステップ901→903→904→905→906が実行されることにより、スレッドインデックス305内のルート文書番号”001”のエントリにおいて、文書番号”005”の文書から抽出された参照文書番号”004”を親文書番号とするリストが生成された後(図10の(7)の下線部)、文書番号”005”がそのリストの子文書番号として登録され(図10の(8)の下線部)、上記エントリの文書数が5に更新される。
Next, when the document with the document number “005” is processed, the entry of the root document number “001” in the
最後に、文書番号”006”の文書が処理される時点で、図9のステップ901→903→904→905→906が実行されることにより、スレッドインデックス305内のルート文書番号”001”のエントリにおいて、文書番号”006”の文書から抽出された参照文書番号”005”を親文書番号とするリストが生成された後(図10の(9)の下線部)、文書番号”006”がそのリストの子文書番号として登録され(図10の(10)の下線部)、上記エントリの文書数が6に更新される。
Finally, when the document with the document number “006” is processed, the entry of the root document number “001” in the
以上説明した図8のステップ809の処理の後、構造解析部402は、現在処理中の新規文書について色番号を決定し、その色番号を図5のデータ構造を有するメタインデックス304中の上記新規文書の文書番号に対応するエントリに登録する処理を実行する(図8のステップ810)。
After the processing of
図11は上記ステップ810の登録動作を示す動作フローチャートである。なお、この登録動作では、図12に示されるデータ構造を有するカラーテーブルが使用される。このテーブルは、特には図示しない記憶装置に記憶される。
FIG. 11 is an operation flowchart showing the registration operation in
まず、構造解析部402は、現在処理中の新規文書が、或るスレッドのルート文書であるか否かを判定する(ステップ1101)。具体的には、構造解析部402は、図8のステップ801〜803のループにおいて、現在処理中の新規文書から参照文書番号が検出されなかった場合に、その文書はルート文書であると判定する。
First, the
構造解析部402は、現在処理中の新規文書が或るスレッドのルート文書であると判定した場合は、そのルート文書の文書番号に対応するエントリを、図12のデータ構造を有するカラーテーブルに登録し、そのエントリに現在処理中の新規文書から抽出された文書番号及びタイトル(図8のステップ804参照)と、初期色番号を登録する(ステップ1101→1102→1103)。図12の例では、ルート文書番号”001”の色番号”#1”に対応するエントリが登録され、そのタイトルはメイントピックとなり、また、そのエントリの文書番号フィールドには、当初はルート文書番号”001”のみが登録される。
If the
その後、構造解析部402は、図5のデータ構造を有するメタインデックス304中の上記新規文書の文書番号に対応するエントリに、ステップ1103で登録した初期色番号を登録し(ステップ1103→1110)、図8のステップ810の処理を終了する。
After that, the
一方、構造解析部402は、現在処理中の新規文書が或るスレッドのルート文書ではないと判定した場合には、現在処理中の新規文書から抽出されたタイトル(図8のステップ804参照)が、”Re:”等の参照記号を含んでいるか否かを判定する(ステップ1101→1104)。
On the other hand, if the
構造解析部402は、現在処理中の新規文書から抽出されたタイトルが参照記号を含んでいると判定した場合はそのタイトルから参照記号を削除し(ステップ1104→1105)、現在処理中の新規文書から抽出されたタイトルが参照記号を含んではいないと判定した場合にはステップ1105は実行しない。
When the
その後、構造解析部402は、図12のデータ構造を有するカラーテーブル中の現在処理中の新規文書が属するスレッドに対応する何れかのエントリに、現在処理中の新規文書から抽出され参照記号を含まないタイトルと同じタイトルが登録されているか否かを判定する(ステップ1106)。現在処理中の新規文書が属するスレッドとそのルート文書番号は、図8のステップ809の処理において図6のデータ構造を有するスレッドインデックス305のエントリが決定される際に検出されるため、そのルート文書番号からカラーテーブル中のエントリが決定される。例えば、現在処理中の新規文書が文書番号”002”の文書である場合には、図12に示されるカラーテーブルにおいて、ルート文書番号”001”に属するエントリが検出される。
After that, the
構造解析部402は、図12のデータ構造を有するカラーテーブル中の現在処理中の新規文書が属するスレッドに対応する何れかのエントリに、現在処理中の新規文書から抽出され参照記号を含まないタイトルと同じタイトルが登録されていると判定した場合には、そのエントリの文書番号フィールドに、現在処理中の新規文書の文書番号を登録する(ステップ1106→1107)。例えば、現在処理中の新規文書が文書番号”002”の文書である場合には、図12に示されるカラーテーブルにおいて、ルート文書番号”001”に属し色番号”#1”が登録されているエントリの文書番号フィールドに、文書番号”002”が登録される。
The
その後、構造解析部402は、図5のデータ構造を有するメタインデックス304中の上記新規文書の文書番号に対応するエントリに、ステップ1107で登録が行われたカラーテーブル中のエントリに設定されている色番号を登録し(ステップ1107→1110)、図8のステップ810の処理を終了する。
Thereafter, the
一方、構造解析部402は、図12のデータ構造を有するカラーテーブル中の現在処理中の新規文書が属するスレッドに対応する何れのエントリにも、現在処理中の新規文書から抽出され参照記号を含まないタイトルと同じタイトルが登録されてはいないと判定した場合は、カラーテーブルにおいて上記スレッドに対応する新たなエントリを作成し(ステップ1108)、その作成したエントリに、そのスレッド内で新たな色番号と、現在処理中の新規文書から抽出された文書番号及びタイトル(図8のステップ804参照)を登録する(ステップ1106→1108→1109)。例えば、現在処理中の新規文書が文書番号”003”の文書である場合には、図12のカラーテーブルにおいて、ルート文書番号”001”に属する新たなエントリが作成され、そのエントリに、色番号”#2”と、文書番号”003”の文書のタイトルと、文書番号”003”とが登録される。このタイトルは、ルート文書番号”001”のタイトルであるメイントピックに対して、サブトピック1となる。
On the other hand, the
その後、構造解析部402は、図5のデータ構造を有するメタインデックス304中の上記新規文書の文書番号に対応するエントリに、ステップ1109でカラーテーブル中の新たなエントリに設定された新たな色番号を登録し(ステップ1109→1110)、図8のステップ810の処理を終了する。
After that, the
内容解析部403は、図6のデータ構造を有するスレッドインデックス305を参照することにより、前述したように、スレッド毎に、そのスレッドを構成する文書群を1つの結合文書ファイルにまとめ、その結合文書からキーワードを抽出する。この結果、抽出された各スレッドのキーワードは、そのスレッドのルート文書に対応する図5のデータ構造を有するメタインデックス304のエントリに、登録される。
The
〔表示装置306の詳細説明〕
表示装置306は、前述したように、図5のデータ構造を有するメタインデックス304と図6のデータ構造を有するスレッドインデックス305を用いて、キーワードビユー、スレッドビュー、又は発言者ビューの何れかの表示形態で、文書群を表示することができる。
[Detailed Description of Display Device 306]
As described above, the
ここで例えば、図4のシステムが、ホームページの表示を制御するWebサーバに接続されるように構成されれば、ユーザは、パーソナルコンピュータ等の手元の端末上のWebブラウザアプリケーションから上記Webサーバに接続して特定のフォーラムの特定の会議室にログインした後に、所定の各GUI(グラフィックユーザインタフェース)ボタンをマウス装置等でクリックすることによって、キーワードビユー、スレッドビュー、又は発言者ビューを切り替えて表示させることができる。 Here, for example, if the system of FIG. 4 is configured to be connected to a Web server that controls display of a home page, the user can connect to the Web server from a Web browser application on a terminal at hand such as a personal computer. Then, after logging in to a specific conference room in a specific forum, clicking a predetermined GUI (graphic user interface) button with a mouse device or the like switches the keyword view, thread view, or speaker view to be displayed. be able to.
より具体的には、表示装置306は、Webサーバに対して例えばCGI(コモンゲートウエイインタフェース)アプリケーションとして機能し、Webサーバから引き渡されたユーザからのリクエストに応答して、キーワードビユー、スレッドビュー、又は発言者ビュー等の各ビューを表現するHTML(ハイパーテキストマークアップ言語)による文書データを生成し、それをWebサーバに引き渡す。そして、これらのHTML文書データをWebサーバがユーザにインターネット等のコンピュータネットワークを経由して返信することにより、ユーザの端末上のWebブラウザアプリケーションに、上記ビューが表示される。
More specifically, the
まず、表示装置306が実現するキーワードビユーの表示動作について説明する。
前述したようにキーワードビユーにおいては、スレッド毎に、そのスレッドを構成する文書群から抽出されているキーワードが、その文書群の文書数及びそのスレッドのタイトルと合わせて、図25に示される表示形態で表示される。
First, a keyword view display operation realized by the
As described above, in the keyword view, for each thread, the keyword extracted from the document group constituting the thread is displayed together with the number of documents in the document group and the title of the thread, as shown in FIG. Is displayed.
図13は、表示装置306が実行するキーワードビユーの表示動作を示す動作フローチャートである。。まず、表示装置306は、図5のデータ構造を有するメタインデックス304のファイルを読み込む(ステップ1301)。
FIG. 13 is an operation flowchart showing a keyword view display operation executed by the
次に、表示装置306は、メタインデックス304のファイルから1エントリずつデータを読み込みながら、ルート文書が登録されているエントリを検索する(ステップ1301→1302→1301のループ)。各エントリがルート文書が登録されているエントリであるか否かは、各エントリの参照文書番号フィールドの値が無効なデータ値であるか否かによって判定することができる。
Next, the
表示装置306は、ルート文書が登録されているエントリを検出すると、そのルート文書番号を、そのルート文書番号に対応する文書群データベース301内のルート文書を表示するためのアプリケーションへの統一されたアドレス情報であるURL(Uniform Resource Locator)がHREF属性の値として指定されるアンカータグに変換する(ステップ1302→1303)。
When the
次に表示装置306は、図6のデータ構造を有するスレッドインデックス305において、上記ルート文書番号に対応するエントリを参照することにより、そのスレッドに含まれる文書数(子文書数)を取得する(ステップ1304)。
Next, the
そして、表示装置306は、図5のデータ構造を有するメタインデックス304において、上記ルート文書が登録されているエントリから、タイトル(メイントピック)と、キーワードとを抽出し、それらと、ステップ1303で変換されたアンカータグ形式のルート文書番号、及びステップ1304で取得した子文書数からなるデータ列を1テーブルレコードとして含むHTMLテーブル文書データを作成する(ステップ1305)。
Then, the
続いて、表示装置306は、メタインデックス304のファイルから文書末尾(EOF)を検出するまで、上記ステップ1301〜1305の一連の処理を繰り返し実行することにより、各スレッド毎のHTMLテーブル文書データを作成する(ステップ1306→1301)。
Subsequently, the
表示装置306は、メタインデックス304のファイルから文書末尾を検出すると(ステップ1306の判定がYES)、最終的に得られたHTMLテーブル文書データをWebサーバに引き渡して、キーワードビユーの表示動作を終了する。この結果、ユーザの端末のWebブラウザアプリケーション上に、図25に例示されるようなテーブル形式で、キーワードビユーが表示される。
When the
ユーザは、キーワードビユー上の各スレッド毎のキーワードを頼りにして、雑多な文書集合の中から必要な文書が含まれているであろうスレッドを容易に見つけ出すことが可能となる。 The user can easily find a thread that may contain a necessary document from a miscellaneous document set by relying on a keyword for each thread on the keyword view.
また、ユーザは、ルート文書に対応するアンカーをマウス装置等でクリックすることによって、所望のスレッドのルート文書に即座にアクセスすることができる。
上述のキーワードビユーの表示動作において、子文書数に応じて、各スレッドのテーブルレコードを色分けして表示するように構成されてもよい。これによって、ユーザは、スレッド毎の発言数を一目で判別することができる。
In addition, the user can immediately access the root document of a desired thread by clicking an anchor corresponding to the root document with a mouse device or the like.
In the above-mentioned keyword view display operation, the table record of each thread may be displayed in different colors according to the number of child documents. As a result, the user can determine the number of utterances for each thread at a glance.
続いて、表示装置306が実現するスレッドビューの表示動作について説明する。
前述したように、スレッドビューにおいては、文書の参照関係、タイトル、作者名、及び行数が一目にわかる図26に示される表示形態で、各スレッドを構成する文書群が表示される。
Next, a thread view display operation realized by the
As described above, in the thread view, a document group constituting each thread is displayed in the display form shown in FIG. 26 in which the document reference relationship, title, author name, and number of lines can be seen at a glance.
図26において、スレッドの参照関係及び話題の推移が色付きツリーによって表示される。各ツリーのノードは、各文書に対応し、その文書の作者名の先頭文字(2バイト)とその文書の行数を用いて、作者名[行数]の形式で表示される。また、各ノードの前後には、”*”、”+”、”=”、又は”.”等の記号が付される。これらの記号の意味は、下記の通りである。 In FIG. 26, thread reference relationships and topic transitions are displayed in a colored tree. The node of each tree corresponds to each document and is displayed in the form of author name [number of lines] using the first character (2 bytes) of the author name of the document and the number of lines of the document. Further, symbols such as “*”, “+”, “=”, or “.” Are attached before and after each node. The meaning of these symbols is as follows.
”*” この記号が付される文書がルート文書である。
”+” この記号が付される文書が参照している文書が他の文書によっても参照されている。
“*” The document with this symbol is the root document.
“+” A document referred to by a document to which this symbol is attached is also referred to by another document.
”=” この記号が付される文書を参照している文書が存在する。
”.” この記号が付される文書を参照している文書が存在しない。また、図26において、”Main Topic:”に続いてそのスレッドのルート文書のタイトルが表示され、”Sub Topic:”に続いてそのスレッド中に現れるルート文書のタイトル以外のタイトルが表示される。そして、各タイトルは色分けされ、各タイトルと同じタイトル(参照記号を除く)を有する文書に対応するノードは、そのタイトルの色と同じ色で表示される。
“=” There is a document that refers to a document with this symbol.
“.” There is no document referring to the document with this symbol. In FIG. 26, the title of the root document of the thread is displayed after “Main Topic:”, and the title other than the title of the root document appearing in the thread is displayed after “Sub Topic:”. Each title is color-coded, and a node corresponding to a document having the same title (excluding reference symbols) as each title is displayed in the same color as the title.
これによって、ユーザは、スレッド全体の構造を把握しスレッド内の話題の推移を一目で把握することが可能となる。
更に、各ノードはアンカーとして表示される。これにより、ユーザは、各ノードをマウス装置等によってクリックすることにより、そのノードに対応する文書に即座にアクセスすることができる。
As a result, the user can grasp the entire structure of the thread and grasp the transition of the topic in the thread at a glance.
Furthermore, each node is displayed as an anchor. Thereby, the user can immediately access a document corresponding to the node by clicking each node with a mouse device or the like.
図14は、表示装置306が実行するスレッドビユーの表示動作を示す動作フローチャートである。
まず、表示装置306は、図6のデータ構造を有するスレッドインデックス305のファイルから、1つのスレッドに対応する1つのエントリ(1行)のリストと、そのスレッドに含まれる文書数を、読み込む(ステップ1401)。例えば、図6のデータ構造を有するスレッドインデックス305において、ルート文書番号”001”に対応するリストとして、
(001 (002 003) (004 (005 006)))
が読み込まれ、文書数として”6”が読み込まれる。
FIG. 14 is an operation flowchart illustrating a thread view display operation executed by the
First, the
(001 (002 003) (004 (005 006)))
Is read and “6” is read as the number of documents.
次に、表示装置306は、読み込んだリストから、例えば図6の表の右側に示されるスレッドのツリー構造を復元する(ステップ1402)。このツリー構造を表現するために、表示装置306は、例えば図15に示されるような配列データを生成する。
Next, the
次に、表示装置306は、読み込んだリストの各ノードを構成する文書番号毎に、その文書番号に対応する図5のデータ構造を有するメタインデックス304のエントリを抽出し、そのエントリから、作者名、行数、色番号、及びタイトルを抽出する(ステップ1403)。これらの抽出されたデータは、上記各ノードに対応付けて記憶される。
Next, the
次に、表示装置306は、ステップ1401で読み込んだ文書数と、ステップ1403で抽出した各ノードの色番号とから、スレッドビューの先頭で表示される各タイトルの色を決定する(ステップ1404)。この動作は、各色番号に実際の色をマッピングする動作として実現される。
Next, the
次に、表示装置306は、スレッドに含まれるルート文書のタイトルとその他のタイトルを、”Main Topic:”及び”Sub Topic:”に続けて表示するためのHTML文書を作成する。この場合に、各タイトルは、前述した構造解析部402が管理する図12に示されるカラーテーブルの上記スレッドに属する各エントリから順次読み出され、同時に順次読み出される各色番号からステップ1404で決定された各色が算出され、その各色での表示が順次指定される。各色は、HTML文書の色指定命令( <font color= > タグ等)によって指定される。
Next, the
最後に、表示装置306は、ステップ1402で復元したスレッドのツリー構造を示す配列データを構成する左端のノードの文書番号から順に処理することにより、そのツリー構造を表示するためのHTML文書を作成する(ステップ1406)。この場合、前述したように、表示装置306は、ステップ1403で抽出した各ノードの作者名、行数、及び色番号に基づいて、ツリー構造の各ノードの文書番号を、そのノードに対応する文書の作者名の先頭文字(2バイト)とその文書の行数とからなる表示データ、
作者名[行数]
に変換し、更に、その表示データをそのノードの色番号に対応する色で表示させるためのHTML文書データを生成する。色番号と実際の色との対応関係は、ステップ1404で決定された対応関係に従う。また、前述したように、表示装置306は、各ノードに対応する上記表示データの前後に、その接続関係に基づいて、”*”、”+”、”=”、又は”.”等の記号を表示するためのHTML文書データを生成する。ここで、ツリー構造をそのままの形式で表示可能とするために、例えば、HTMLにおける制御用タグであるプリフォーマットタグ <PRE>が使用される。更に、上記ノード毎の表示データは、そのノードに対応する文書群データベース301内の文書データを表示するためのアプリケーションへのURLがHREF属性の値として指定されるアンカータグとして生成される。
Finally, the
Author name [Number of lines]
Furthermore, HTML document data for displaying the display data in a color corresponding to the color number of the node is generated. The correspondence relationship between the color number and the actual color follows the correspondence relationship determined in
続いて、表示装置306は、スレッドインデックス305のファイルから文書末尾(EOF)を検出するまで、上記ステップ1401〜1406の一連の処理を繰り返し実行することにより、各スレッド毎のビューデータを作成する(ステップ1407→1401)。
Subsequently, the
表示装置306は、スレッドインデックス305のファイルから文書末尾を検出すると(ステップ1407の判定がYES)、最終的に得られたHTMLテーブル文書データをWebサーバに引き渡して、スレッドビユーの表示動作を終了する。この結果、ユーザの端末のWebブラウザアプリケーション上に、図26に例示されるような形式で、スレッドビユーが表示される。
When the
次に、表示装置306が実現する発言者ビューの表示動作につき説明する。前述したように、発言者ビューにおいては、各文書のタイトルが、発言者(作者)毎に分類され、かつ発言者が発言の多い順にソートされ、同一発言者内では日付順で、図27に示される表示形態で、表示される。
Next, a speaker view display operation realized by the
図16は、表示装置306が実行する発言者ビユーの表示動作を示す動作フローチャートである。
表示装置306は、発言者ビューを実現するために、図17のデータ構造を有する作者配列データを使用する。そして、表示装置306は、発言者ビューの表示開始時に、この作者配列データを初期化する(ステップ1601)。
FIG. 16 is an operation flowchart showing the display operation of the speaker view executed by the
The
次に、表示装置306は、図5のデータ構造を有するメタインデックス304のファイルから1つのエントリのデータを読み込む(ステップ1602)。
次に、表示装置306は、このエントリから抽出される作者名の作者が、作者配列データに含まれていない作者であるか否かを判定する(ステップ1603)。
Next, the
Next, the
表示装置306は、上記エントリから抽出される作者名の作者が、作者配列データに含まれていない作者である場合には、作者配列データに新しい作者項目を追加する(ステップ1603→1604)。表示装置306は、上記エントリから抽出される作者名の作者が、作者配列データに含まれている作者である場合には、ステップ1604の処理は実行しない。
When the author of the author name extracted from the entry is an author not included in the author array data, the
次に、表示装置306は、作者配列データ中の該当する作者項目に、上記エントリから抽出される文書番号を登録する(ステップ1605)。
続いて、表示装置306は、メタインデックス304のファイルから文書末尾(EOF)を検出するまで、上記ステップ1602〜1605の一連の処理を繰り返し実行することにより、メタインデックス304に登録されている全ての文書番号を、作者別に作者配列データに登録する。
Next, the
Subsequently, the
表示装置306は、メタインデックス304のファイルから文書末尾を検出すると(ステップ1606の判定がNO)、作者配列データ中の各作者項目を、それぞれの項目に登録されている文書番号の数、即ち各作者毎の発言文書数に基づいてソートする(ステップ1607)。
When the
続いて、表示装置306は、作者配列データ中の同一作者項目内で、文書番号を、それに対応するメタインデックス304中のエントリから抽出される日付に基づいてソートする(ステップ1608)。
Subsequently, the
最後に、表示装置306は、上記ステップ1607及び1608でのソートの結果得られる作者配列データの各作者項目毎に、作者名と、その項目内の各文書番号に対応するメタインデックス304中のエントリから抽出される日付及びタイトルを表示するためのHTMLテーブル文書データを生成し、それをWebサーバに引き渡して、発言者ビューの表示動作を終了する。この結果、ユーザの端末のWebブラウザアプリケーション上に、図27に例示されるようなテーブル形式で、発言者ビューが表示される。
Finally, for each author item of the author array data obtained as a result of the sorting in
ユーザは、発言者ビュー上で、発言者及び発言日付という観点から、文書集合(会議室)内の文書を参照することが可能となる。
また、或る発言者の発言を時間を追って参照したり、会議室内で多くの発言をするリーダー的な発言者を一目で確認することができる。
On the speaker view, the user can refer to the documents in the document set (conference room) from the viewpoint of the speaker and the statement date.
In addition, it is possible to refer to a speaker's speech over time, or to confirm at a glance a leader speaker who makes a lot of speech in the conference room.
〔表示装置306の他の表示態様〕
次に、上記各ビューの表示動作以外に表示装置306が実現する各表示動作の態様について説明する。
[Other Display Modes of Display Device 306]
Next, aspects of each display operation realized by the
まず、表示装置306が実現する発言内容表示の動作につき説明する。前述したように、ユーザは、キーワードビユーにおけるそれぞれのスレッド上のアンカー又はスレッドビューにおける各ノード上のアンカーを、マウス装置等でクリックすることにより、各スレッドのルート文書又は各ノードに対応する文書等に、即座にアクセスすることができる。
First, an operation of displaying the message content realized by the
ユーザによってこれらの操作が実行された場合には、Webサーバから指示によって、表示装置306によって実行される図18に示される動作フローチャートの処理が例えばCGIとして起動される。この場合、この処理には、ユーザによって指定されたアンカータグに含まれる文書番号の情報が引き渡される。
When these operations are executed by the user, the process of the operation flowchart shown in FIG. 18 executed by the
この結果まず、表示装置306は、上記文書番号の情報を読み込んだ後(ステップ1801)、ヘッダ部に上記読み込んだ文書番号と同じ文書番号を含んでいる文書ファイルを読み込むまで、文書群データベース301からの文書ファイルの読込みを行う(ステップ1802→1803→1802のループ)。
As a result, the
表示装置306は、ヘッダ部に上記読み込んだ文書番号と同じ文書番号を含んでいる文書ファイルを読み込むと(ステップ1803の判定がYES)、新しい文書のヘッダ部を読み込むまで、ステップ1804〜1809のループにより、上記文書ファイルから1行ずつデータを読み込み、そのデータを1行分のHTML文書データに変換し、そのHTML文書データをWebサーバに出力する(ステップ1808)。
When the
この場合に、各行のデータが他の文書等へのURLを含んでいる場合には、表示装置306は、そのデータを上記URLがHREF属性の値として指定されるアンカータグに変換した上で出力する(ステップ1804→1805)。
In this case, when the data of each line includes a URL to another document or the like, the
この結果、ユーザは、発言内容の表示中のアンカーを更にマウス装置等によってクリックすることにより、更に他のリソースにジャンプすることができる。
また、各行のデータが他の文書の行を引用したコメント行である場合には、表示装置306は、そのデータの色を変換するタグを追加した上で出力する(ステップ1806→1807)。
As a result, the user can jump to another resource by clicking on the anchor whose message content is being displayed with the mouse device or the like.
If the data of each line is a comment line quoting a line of another document, the
この結果、ユーザは、コメント行を一目で判別することができる。表示装置306は、該当する文書データの出力処理を終了すると、上記文書を含むスレッドのツリー構造を表示するHTML文書データを生成し出力して、発言内容表示の動作を終了する(ステップ1809→1810)。この処理は、前述した図14の動作フローチャートで示されるスレッドビューの表示動作と同様にして実現できる。
As a result, the user can distinguish the comment line at a glance. When the output processing of the corresponding document data is finished, the
以上の表示動作の結果、ユーザの端末のWebブラウザアプリケーション上には、例えば図28に示されるように、表示画面の上半分に発言内容が表示され、表示画面の下半分にはその発言内容の文書を含むスレッドのツリー構造が表示される。なお、この表示画面には、図28に示されるように、キーワードビユーやスレッドビューを表示させるためのアンカーや、検索を実行するためのアンカー等を同時に表示させることもできる。 As a result of the above display operation, the content of the message is displayed on the upper half of the display screen on the Web browser application of the user terminal, as shown in FIG. 28, for example. A tree structure of threads containing the document is displayed. On this display screen, as shown in FIG. 28, an anchor for displaying a keyword view and a thread view, an anchor for executing a search, and the like can be displayed at the same time.
これらのビューの切替え機能により、例えば、キーワードビユー → スレッドビュー → 発言内容表示 → 発言者ビュー 発言内容表示 → スレッドビュー → ・・・ というように、会議室内の文書(発言)をユーザの嗜好に応じて横断的に参照してゆくことが可能となる。 With these view switching functions, for example, Keyword View → Thread View → Speech Content Display → Speaker View Speech Content Display → Thread View → ・ ・ ・ According to user preference It is possible to refer to them cross-sectionally.
次に、表示装置306が実現する作者別/日付別色分け表示の動作につき説明する。図19は、その動作を示す動作フローチャートである。
まず、表示装置306は、メタインデックス304及びスレッドインデックス305に基づいて、図20(a) に示されるように作者項目毎に文書番号が分類された作者配列データと、図20(b) に示されるように日付項目毎に文書番号が分類された日付配列データとを予め作成する。これらの作成処理の詳細は省略するが、前述した図16の動作フローチャートと同様の処理によって実現できる。そして、作者配列データ中の各作者項目又は日付配列データ中の各日付項目に、それぞれ異なる色が割り当てられる。この色の割当ては、作者項目毎の作者の総数又は日付項目毎の日付の総数から決定される。
Next, an operation of color-coded display by author / date realized by the
First, the
次に、表示装置306は、ユーザの指定に基づく項目選択ボタン情報をWebサーバを経由して取得し、作者ボタンが押されたか日付選択ボタンが押されたかを判定する(ステップ1902、1904、図29参照)。
Next, the
表示装置306は、作者ボタンが押されたと判定した場合には、図20(a) に示される作者配列データを参照することにより、スレッドツリーの表示データを作成し出力する(ステップ1902→1903)。この処理は、前述した図14の動作フローチャートと同様の処理によって実現されるが、この場合に、ツリーの各ノードは、そのノードに対応する作者名に対応する作者配列データ中の作者項目に割当てられている色で表示される。
If the
一方、表示装置306は、日付選択ボタンが押されたと判定した場合には、図20(b) に示される日付配列データを参照することにより、スレッドツリーの表示データを作成し出力する(ステップ1904→1905)。この処理も、前述した図14の動作フローチャートと同様の処理によって実現されるが、この場合に、ツリーの各ノードは、そのノードに対応する日付に対応する日付配列データ中の日付項目に割当てられている色で表示される。
On the other hand, when it is determined that the date selection button has been pressed, the
以上の表示動作の結果、例えばユーザが作者ボタンを押した場合には、ユーザの端末のWebブラウザアプリケーション上には、例えば図29に示されるように、作者別に色分けされたスレッドのツリーが表示され、ユーザは同一の作者の文書を一目で確認することができる。 As a result of the above display operation, for example, when the user presses the author button, a tree of threads color-coded by author is displayed on the Web browser application of the user's terminal as shown in FIG. 29, for example. The user can check the document of the same author at a glance.
次に、表示装置306が実現するスレッドビューを使った検索結果の強調表示の動作につき説明する。図21はその動作を示す動作フローチャートである。
まず、表示装置306は、検索後入力フォーム画面を表示するためのHTML文書データを生成し出力する(ステップ2101)。この結果、ユーザの端末のWebブラウザアプリケーション上には、例えば図30に示されるような検索入力フォーム画面が表示される。ユーザは、この検索入力フォームに検索語を入力して検索の実行を指定する。
Next, the search result highlighting operation using the thread view realized by the
First, the
上記検索入力フォームに入力された検索語は、Webサーバを経由して文字列検索装置405(図4)に引き渡される。文字列検索装置405は、ユーザによる検索語の指定に基づいて、索引ファイル404を用いながら文書群データベース301内の指定されたスレッドを構成する各文書に対して全文検索を実行し、その検索語を含む文書番号を出力する(ステップ2102、2103)。
The search term input in the search input form is delivered to the character string search device 405 (FIG. 4) via the Web server. The character
表示装置306は、上記検索語を含む文書番号を受け取ると、その文書番号を含むスレッドのツリー構造を表示するHTML文書データを、前述した図14の動作フローチャートと同様の処理によって表示する。この場合に、表示装置306は、上記文書番号を含むノードの色を強調色に指定する(ステップ2104、2105)。
When the
この結果、ユーザの端末のWebブラウザアプリケーション上において、例えば図31に示されるような検索結果に基づくスレッドビューの強調表示が実現される。これにより、ユーザは、スレッドの構造を把握しつつ、検索を実行することができる。 As a result, the thread view highlighting display based on the search result as shown in FIG. 31, for example, is realized on the Web browser application of the user terminal. Thereby, the user can execute a search while grasping the thread structure.
次に表示装置306が実現するキーワードビユーを使った検索結果の強調表示の動作につき説明する。図22はその動作を示す動作フローチャートである。
まず、表示装置306は、図21のステップ2101の場合と同様に、検索後入力フォーム画面を表示するためのHTML文書データを生成し出力する(ステップ2201)。ユーザは、この検索入力フォームに検索語を入力して検索の実行を指定する。
Next, the search result highlighting operation using the keyword view realized by the
First, the
上記検索入力フォームに入力された検索語は、Webサーバを経由して文字列検索装置405(図4)に引き渡される。文字列検索装置405は、ユーザによる検索語の指定に基づいて、索引ファイル404を用いながら文書群データベース301内の指定された会議室を構成する各文書に対して全文検索を実行し、その検索語を含む文書番号を出力する(ステップ2202、2203)。
The search term input in the search input form is delivered to the character string search device 405 (FIG. 4) via the Web server. The character
表示装置306は、上記検索語を含む文書番号を受け取ると、まず、図6のデータ構造を有するスレッドインデックス305を参照して、上記文書番号を含むエントリに対応するルート文書番号を抽出する(ステップ2204)。
Upon receiving the document number including the search term, the
続いて、表示装置306は、指定された会議室に関するキーワードビユーを表示するHTML文書データを、前述した図13の動作フローチャートと同様の処理によって表示する。この場合に、表示装置306は、ステップ2204で抽出されたルート文書番号に対応するスレッドのタイトル又はその表示エリア全体の色を強調色に指定し、更に、表示されるキーワード中に検索語が含まれている場合には、そのキーワードも強調色に指定する(ステップ2205、2206、2207)。
Subsequently, the
この結果、ユーザの端末のWebブラウザアプリケーション上において、例えば図32に示されるような検索結果に基づくキーワードビユーの強調表示が実現される。これにより、ユーザは、検索語を含むスレッドを一目で把握することができる。 As a result, the keyword view highlighting display based on the search result as shown in FIG. 32, for example, is realized on the Web browser application of the user terminal. Thereby, the user can grasp | ascertain the thread | sled containing a search word at a glance.
なお、表示装置306は、検索結果の文書番号とそれに対応するタイトルを、例えば図33に示されるように羅列して表示するように構成することも可能である。
最後に、表示装置306が実現するサブトピック毎のキーワードビユーの表示動作について説明する。
The
Finally, a keyword view display operation for each subtopic realized by the
前述したキーワードビユーは、スレッド毎にキーワードを表示するものであった。これに対して、サブトピック毎のキーワードビユーでは、1つのスレッド内のサブトピック毎に、キーワードを抽出して表示することができる。 The keyword view described above displays a keyword for each thread. In contrast, in the keyword view for each subtopic, keywords can be extracted and displayed for each subtopic within one thread.
この動作において、表示装置306は、図24のデータ構造を有するサブトピックインデックスを使用する。サブトピックインデックスは、図12に示されるカラーテーブルのデータ構造に対して、キーワードフィールドが追加されたデータ構造を有する。
In this operation, the
サブトピックインデックスは、実質的には前述したカラーテーブルを置き換えるものであるため、サブトピックインデックスにおけるキーワードフィールド以外のフィールドの内容は、構造解析部402による前述した図8のステップ810の処理によって予め登録されている。この場合、図8のステップ810の処理の説明において前述したように、カラーテーブルであるサブトピックインデックスには、ルート文書番号毎(スレッド毎)に、それに含まれるルート文書のタイトルを示すメイントピックと、それ以外の文書のタイトルを示すサブトピックのそれぞれに対応するエントリが得られる。表示装置306は、この登録内容を利用する。
Since the subtopic index substantially replaces the color table described above, the contents of the fields other than the keyword field in the subtopic index are registered in advance by the process of
図23は、表示装置306が実現するサブトピックからのキーワード抽出の制御を示す動作フローチャートである。
まず、表示装置306は、各スレッドについて、サブトピックインデックス内のそのスレッドに含まれる各エントリに登録されている文書番号に基づいて、メイントピック及びサブトピック単位で、それぞれに属する文書群を各結合文書ファイルにまとめ(ステップ2301)、その結果得られる各結合文書ファイルを内容解析部403(図4)に入力する(ステップ2302)。
FIG. 23 is an operation flowchart illustrating keyword extraction control from subtopics realized by the
First, for each thread, the
内容解析部403は、各結合文書ファイル別にキーワードを抽出し、その結果を表示装置306に返す。表示装置306は、内容解析部403から返された各結合文書ファイル別のキーワードを、サブトピックインデックス内の上記各結合文書ファイルに対応するエントリのキーワードフィールドに登録する(ステップ2303)。
The
以上のようにして、各スレッドについて、メイントピック及びサブトピック単位で、それぞれに属する文書群からキーワードが抽出される。
その後は、表示装置306は、サブトピックインデックスの内容に基づいて、ユーザにより指定されたスレッドに関して、そのスレッドのメイントピック及びサブトピック単位で、それぞれのタイトルとそれぞれに属するキーワードを表示するためのHTML文書データを生成し出力する。
As described above, keywords are extracted from the document group belonging to each thread for each main topic and subtopic.
Thereafter, the
この結果、ユーザの端末のWebブラウザアプリケーション上には、例えば、図34に示されるような形式で、サブトピック毎のキーワードビユーが表示される。これにより、ユーザは、キーワードによるより精密なトピックの絞込みを行うことができる。 As a result, the keyword view for each subtopic is displayed on the Web browser application of the user's terminal, for example, in the format shown in FIG. Thereby, the user can narrow down the topic more precisely by the keyword.
〔本発明の他の実施の形態(第2の実施の形態)〕
次に、本発明の他の実施の形態(以下、第2の実施の形態という)について説明する。
〔本発明の第2の実施の形態が実現する機能〕
まず、第2の実施の形態では、以下の3つの機能が実現される。
[Another embodiment of the present invention (second embodiment)]
Next, another embodiment of the present invention (hereinafter referred to as a second embodiment) will be described.
[Functions realized by the second embodiment of the present invention]
First, in the second embodiment, the following three functions are realized.
1.狭い画面の中でのスレッドの全体構造の把握機能:
スレッドのツリーが縮退(curtail )させられることにより、ある大きさの画面内でツリー構造の全体表示が可能となる。第2の実施の形態では、TTYキャラクタ端末上での表示を例に説明する。
1. Capability to understand the overall structure of threads within a narrow screen:
By reducing the thread tree, the entire tree structure can be displayed in a screen of a certain size. In the second embodiment, display on a TTY character terminal will be described as an example.
キャラクタ端末では、1行に1ノードが表示されるため、n行の画面内にはn個のノードを描画することができる。描画されるノードの選択基準としては、以下のものがある。
・そのノードを参照している子ノードの個数。
Since one node is displayed in one line on the character terminal, n nodes can be drawn on the screen of n lines. The selection criteria for nodes to be drawn include the following.
The number of child nodes that refer to that node.
・検索結果として得られる、そのノードを参照している子ノードの個数。
・ルートノード又は親ノードと異なるタイトルを持つノード。
2.スレッド内の話題の進行の推測機能:
「質問−答−お礼」といった特定の会話パターンが検出され、その情報が表示・検索に使用されることにより、効率の良い情報アクセスが可能となる。
-The number of child nodes referring to the node obtained as a search result.
A node with a different title from the root node or parent node.
2. Ability to guess the progress of topics in a thread:
A specific conversation pattern such as "question-answer-thank" is detected, and the information is used for display / search, thereby enabling efficient information access.
より具体的には、第2の実施の形態では、文書の属性情報(タイトル、作者、参照関係)と、文書の内容を特徴づける特定の文章パターンが推測されることにより、スレッド内の話題パターンが抽出される。 More specifically, in the second embodiment, a topic pattern in a thread is estimated by inferring document attribute information (title, author, reference relationship) and a specific sentence pattern characterizing the contents of the document. Is extracted.
3.利用者の発言パターンの視覚化:
ネットワークニュースでは、読んでいる人に対して発言する人の割合は非常に少ない。大きなスレッドであっても実は数人の人が論争しているだけという場合も少なくない。また、特定のニュースグループにおいて、有用な情報を発信する人が決まっている場合も多い。そこで、第2の実施の形態では、記事を投稿する利用者の観点から、ニュースやスレッドが整理されることにより、新たなビューが提供される。
3. Visualizing user speech patterns:
In network news, the percentage of people who speak is very small. In many cases, even with a large thread, only a few people are arguing. Moreover, there are many cases where a person who sends useful information is determined in a specific news group. Therefore, in the second embodiment, a new view is provided by organizing news and threads from the viewpoint of a user who posts an article.
より具体的には、第2の実施の形態では、ニュースグループ内の投稿履歴と、前述の話題推測機能に基づいて、利用者を観点とするビューが提供される。
〔本発明の第2の実施の形態の全体構成〕
図35は、本発明の第2の実施の形態の構成図である。
More specifically, in the second embodiment, a view from the viewpoint of the user is provided based on the posting history in the news group and the topic estimation function described above.
[Overall Configuration of Second Embodiment of the Present Invention]
FIG. 35 is a block diagram of the second embodiment of the present invention.
まず、検索フェーズの前の準備フェーズにおいては、以下の動作が実行される。
処理装置3501内の文書取得部3502は、ネットワークを通じて、参照関係のある文書群を取得し、二次記憶装置3503内に格納する。
First, in the preparation phase before the search phase, the following operations are executed.
A
内容推定部3504は、二次記憶装置3503に格納されている文書群の文書内容、文書付随情報、文書間の参照関係に基づいて、表示用インデックス3505を作成する。
検索エンジン3506は、二次記憶装置3503に格納されている文書群の文書内容に基づいて、検索用インデックス3507を作成する。
The
The
例えばネットワークニュースサービスでは、文書が随時投稿されてゆく。そのため、上記の準備フェーズは、例えば一日に一度のように定期的に実行され、二次記憶装置3503には、常に最新の文書群が格納される。
For example, in a network news service, documents are posted at any time. Therefore, the above preparation phase is periodically executed, for example, once a day, and the
検索フェーズの実行時には、以下の動作が実行される。
利用者は、入力装置3509から入力指示を行う。入力される情報には、検索キーワードと、検索結果を表示させるためのビューの種類、ビューの表示領域の大きさが含まれる。
When the search phase is executed, the following operations are executed.
The user gives an input instruction from the input device 3509. The input information includes the search keyword, the type of view for displaying the search result, and the size of the display area of the view.
ビュー生成部3508は、入力装置3509からの入力指示に基づいて、検索エンジン3506を呼び出し、それに対して二次記憶装置3503に格納されている文書群の中から上記入力指示に対応する文書群を検索させる。
The
ビュー生成部3508は、表示用インデックス3505を利用して、検索エンジン3506が検索した文書群を表示するための結果ビューを作成し、それを表示装置3510に出力する。この場合に、後述するスレッド木の縮退処理が実行される。
The
以上の動作は、利用者との間の対話処理に基づいて実行される。つまり、利用者は、結果表示を見て、検索キーワードを追加又は変更し、或いは、結果ビューを切り替える。
〔表示用インデックス3505の構造〕
第2の実施の形態において、検索前の準備フェーズでは、以下の種類のインデックスが作成される。
The above operation is executed based on a dialogue process with the user. That is, the user sees the result display, adds or changes a search keyword, or switches the result view.
[Structure of display index 3505]
In the second embodiment, the following types of indexes are created in the pre-search preparation phase.
1.ユーザインデックス:
このインデックスは、ユーザの管理を行うためのインデックスであり、図36に示されるように、エントリ毎に、下記情報を保持する。
1. User index:
This index is an index for managing users, and holds the following information for each entry as shown in FIG.
・ユーザID(UserID):そのエントリに対応するユーザのID(キー)である。
・名前:そのエントリに対応するユーザの名前である。
User ID (UserID): ID (key) of the user corresponding to the entry.
Name: The name of the user corresponding to the entry.
・略称:そのエントリに対応するユーザの略称である。
・発言数(回答数):そのエントリに対応するユーザの、会議室内における発言の総数と、Q and Aパターンにおける回答文書の数である。
Abbreviated name: Abbreviated name of the user corresponding to the entry.
Number of utterances (number of answers): The total number of utterances in the conference room and the number of answer documents in the Q and A pattern of the user corresponding to the entry.
2.文書インデックス:
このインデックスは、文書毎の情報管理を行うためのインデックスであり、図37に示されるように、エントリ毎に、下記情報を保持する。
2. Document index:
This index is an index for performing information management for each document, and holds the following information for each entry as shown in FIG.
・文書ID:そのエントリに対応する文書のID(キー)である。
・ユーザID(UserID):そのエントリに対応する文書を作成したユーザのID(キー)である。
Document ID: ID (key) of the document corresponding to the entry.
User ID (UserID): ID (key) of the user who created the document corresponding to the entry.
・タイトル:そのエントリに対応する文書のタイトルである。
・日付:そのエントリに対応する文書の作成日である。
・参照子孫数:そのエントリに対応する文書を参照する文書の総数である。
Title: The title of the document corresponding to the entry.
Date: The date of creation of the document corresponding to the entry.
Reference number of descendants: The total number of documents that refer to the document corresponding to the entry.
・ルートまでのパス:そのエントリに対応する文書が参照する先頭記事からその文書までのパスである。
・タイトルの識別番号:そのエントリに対応する文書のタイトルが、その文書が含まれるスレッド(文書群)中の何番目のタイトルであるかを示す番号である。
Path to root: A path from the first article referenced by the document corresponding to the entry to the document.
Title identification number: This is a number indicating the number of the title in the thread (document group) in which the document corresponding to the entry is included.
・記事種別:そのエントリに対応する文書が、Qand Aパターンに含まれる場合に、その文書がQ(質問)文書、A(答)文書、又はT(お礼)文書の何れにあたるかを示す情報である。 Article type: When the document corresponding to the entry is included in the Qand A pattern, information indicating whether the document corresponds to a Q (question) document, an A (answer) document, or a T (thank you) document is there.
3.スレッドインデックス:
このインデックスは、スレッド毎の情報管理を行うためのインデックスであり、図38に示されるように、エントリ毎に、下記情報を保持する。
3. Thread index:
This index is an index for managing information for each thread, and holds the following information for each entry, as shown in FIG.
・スレッドID:そのエントリに対応するスレッドのID(キー)である。
・スレッドの木構造:そのエントリに対応するスレッド内の文書の参照関係を文書IDのリストで表現したものである。
Thread ID: ID (key) of the thread corresponding to the entry.
Thread tree structure: A reference relation of documents in a thread corresponding to the entry is expressed by a list of document IDs.
・文書数:そのエントリに対応するスレッド内の文書の総数である。
・作者数:そのエントリに対応するスレッド内の文書の作者の数である。
・最多発言UID:そのエントリに対応するスレッド内で最も多く発言した作者のユーザIDである。
Document number: the total number of documents in the thread corresponding to the entry.
Number of authors: The number of authors of the document in the thread corresponding to the entry.
-Most utterance UID: The user ID of the author who made the most utterance in the thread corresponding to the entry.
・内容リスト:そのエントリに対応するスレッドに含まれるQ and Aパターン、論争(Discussion)パターン、又は雑談(Chat)パターンのパターンIDのリストである。Q and AパターンのパターンIDであるQA_IDは、後述するQAインデックス内のいずれかのエントリに登録されている。DiscussionパターンのパターンIDであるDS−IDは、後述するDISCUSSインデックス内のいずれかのエントリに登録されている。ChatパターンのパターンIDであるCT_IDは、後述するCHATインデックス内のいずれかのエントリに登録されている。 Content list: A list of pattern IDs of Q and A patterns, discussion patterns, or chat patterns included in the thread corresponding to the entry. QA_ID, which is the pattern ID of the Q and A pattern, is registered in any entry in the QA index described later. The DS-ID that is the pattern ID of the Discussion pattern is registered in one of the entries in the DISCUSS index described later. CT_ID which is the pattern ID of the Chat pattern is registered in one of the entries in the CHAT index described later.
4.QAインデックス:
このインデックスは、Q and Aパターンの情報管理を行うためのインデックスであり、図39に示されるように、エントリ毎に、下記情報を保持する。
4). QA index:
This index is an index for performing Q and A pattern information management, and holds the following information for each entry as shown in FIG.
・QA_ID:そのエントリに対応するQ and AパターンのID(キー)である。
・Question:そのエントリに対応するQand Aパターンを構成するQ(質問)文書に対応する文書IDを格納するフィールドである。
QA_ID: ID (key) of the Q and A pattern corresponding to the entry.
Question: A field for storing a document ID corresponding to a Q (question) document constituting a Qand A pattern corresponding to the entry.
・Answer:そのエントリに対応するQand Aパターンを構成するA(答え)文書群に対応する文書ID列を格納するフィールドである。
・Thanks:そのエントリに対応するQand Aパターンを構成するT(お礼)文書に対応する文書IDを格納するフィールドである。
Answer: A field for storing a document ID string corresponding to an A (answer) document group constituting a Qand A pattern corresponding to the entry.
Tanks: a field for storing a document ID corresponding to a T (thank you) document constituting a Qand A pattern corresponding to the entry.
・MaxAnswerUID:そのエントリに対応するQ and Aパターンを構成する各A(答え)文書の作者、すなわち、そのエントリ内の「Answer」フィールドに登録されている文書ID列中の各文書IDに対応する文書の作者うち、もっとも登場回数が多い人(又は人達)のユーザID(又はユーザID列)を格納するフィールドである。 MaxAnswerUID: corresponding to each document ID in the document ID column registered in the “Answer” field in the entry, that is, the author of each A (answer) document constituting the Q and A pattern corresponding to the entry This is a field for storing the user ID (or user ID string) of the person (or people) who appears most frequently among the authors of the document.
・ThreadID:そのエントリに対応するQand Aパターンが存在するスレッドのIDである。このスレッドIDは、スレッドインデックス内のいずれかのエントリに登録されている。 ThreadID: ID of a thread in which a Qand A pattern corresponding to the entry exists. This thread ID is registered in any entry in the thread index.
5.DISCUSSインデックス:
このインデックスは、Discussionパターンの情報管理を行うためのインデックスであり、図40に示されるように、エントリ毎に、下記情報を保持する。
5. DISCUSS index:
This index is an index for managing information of the Discusion pattern, and holds the following information for each entry as shown in FIG.
・DS_ID:そのエントリに対応するDiscussionパターンのID(キー)である。
・記事IDリスト:そのエントリに対応するDiscussionパターンを構成する文書群の文書ID列を格納するフィールドである。
DS_ID: ID (key) of the Discussion pattern corresponding to the entry.
Article ID list: a field for storing a document ID string of a document group constituting a Discusion pattern corresponding to the entry.
・UID:そのエントリに対応するDiscussionパターンを構成する文書群のユーザID列である。
・ThreadID:そのエントリに対応するDiscussionパターンが存在するスレッドのIDである。このスレッドIDは、スレッドインデックス内のいずれかのエントリに登録されている。
UID: a user ID column of a document group that constitutes a Discussion pattern corresponding to the entry.
ThreadID: ID of a thread in which a Discusion pattern corresponding to the entry exists. This thread ID is registered in any entry in the thread index.
6.CHATインデックス:
このインデックスは、Chatパターンの情報管理を行うためのインデックスであり、図41に示されるように、エントリ毎に、下記情報を保持する。
6). CHAT index:
This index is an index for performing information management of the Chat pattern, and holds the following information for each entry as shown in FIG.
・CT_ID:そのエントリに対応するChatパターンのID(キー)である。
・Chatリスト:そのエントリに対応するChatパターンを構成する文書群の文書ID列を格納するフィールドである。
CT_ID: ID (key) of the Chat pattern corresponding to the entry.
Chat list: A field for storing a document ID string of a document group constituting a Chat pattern corresponding to the entry.
・ThreadID:そのエントリに対応するChatパターンが存在するスレッドのIDである。このスレッドIDは、スレッドインデックス内のいずれかのエントリに登録されている。 ThreadID: ID of a thread in which a Chat pattern corresponding to the entry exists. This thread ID is registered in any entry in the thread index.
〔内容推定部3504の構成及び動作〕
図35に示される第2の実施の形態における内容推定部3504の動作について、以下に詳細に説明する。
[Configuration and operation of content estimation unit 3504]
The operation of the
前述したように、内容推定部3504は、二次記憶装置3503に格納されている文書群の文書内容、文書付随情報、文書間の参照関係に基づいて、表示用インデックス3505であるユーザインデックス、文書インデックス、スレッドインデックス、QAインデックス、DISCUSSインデックス、及びCHATインデックスを作成する。
As described above, the
図42は、内容推定部3504が実行する動作を示す動作フローチャートである。
まず、図37に示されるデータ構成を有する文書インデックスと図38に示されるデータ構成を有するスレッドインデックスが作成される(ステップ4201)。これらの詳細は省略するが、基本的に、前述した図8及び図9に示される動作フローチャートと同様の動作によって実現できる。この場合には、前述したメタインデックスが文書インデックスに対応する。このとき同時に、各文書中に現れる作成ユーザ名とユーザID、略称、及び発言数(回答数)を対応づけるための図36に示されるデータ構成を有するユーザインデックスも作成される。
FIG. 42 is an operation flowchart showing an operation executed by the
First, a document index having the data structure shown in FIG. 37 and a thread index having the data structure shown in FIG. 38 are created (step 4201). Although these details are omitted, it can be basically realized by an operation similar to the operation flowchart shown in FIGS. 8 and 9 described above. In this case, the above-described meta index corresponds to the document index. At the same time, a user index having a data structure shown in FIG. 36 for associating a created user name appearing in each document with a user ID, an abbreviation, and the number of utterances (number of answers) is also created.
次に、スレッドインデックス内の各エントリが参照されることにより、各エントリに対応するスレッド文書群が読み込まれ(ステップ4202)、全てのエントリに対するスレッド文書群の処理が終了したと判定されるまで(ステップ4206)、読み込まれたスレッド文書群毎に、Q and Aパターンの判定処理(ステップ4203)、Discussionパターンの判定処理(ステップ4204)、及びChatパターンの判定処理(ステップ4205)が実行される。 Next, by referring to each entry in the thread index, a thread document group corresponding to each entry is read (step 4202) until it is determined that the processing of the thread document group for all the entries has been completed ( Step 4206), Q and A pattern determination processing (Step 4203), Discussion pattern determination processing (Step 4204), and Chat pattern determination processing (Step 4205) are executed for each read thread document group.
図43は、図42のステップ4203のQ and Aパターンの判定処理の動作フローチャートである。この動作フローチャートでは、スレッド文書群内の各参照パス毎に、Q and Aパターンが推測される。 FIG. 43 is an operation flowchart of the Q and A pattern determination processing in step 4203 of FIG. In this operation flowchart, a Q and A pattern is estimated for each reference path in the thread document group.
まず、スレッドインデックス内の該当エントリの「スレッドの木構造」フィールドが参照されることによって、リーフ文書(パスの末端の文書)に対応する文書IDが1つ選択される(ステップ4301)。 First, by referring to the “thread tree structure” field of the corresponding entry in the thread index, one document ID corresponding to the leaf document (the document at the end of the path) is selected (step 4301).
次に、文書インデックスにおいて、ステップ4301で選択された文書IDを「文書ID」フィールドに含むエントリ内の「ルートまでのパス」フィールドから、下記条件を満たす文書IDが検索される(ステップ4302)。
Next, in the document index, a document ID satisfying the following conditions is searched from the “path to root” field in the entry including the document ID selected in
(条件)文書インデックスにおいて、その文書IDを「文書ID」フィールドに含むエントリ内の「記事種別」フィールドが未登録である。
続いて、上記条件を満たす文書IDが見つかったか否かが判定される(ステップ4303)。
(Condition) In the document index, the “article type” field in the entry including the document ID in the “document ID” field is not registered.
Subsequently, it is determined whether or not a document ID satisfying the above conditions is found (step 4303).
上記条件を満たす文書ID(以下、処理文書IDという)が見つかりステップ4303の判定がYESとなった場合には、その処理文書IDに対応する文書が二次記憶装置3503(図35)から読み出され、その文書中に、図44に示されるような、センテンスパターンが存在するか否かが判定される(ステップ4304)。
If a document ID satisfying the above conditions (hereinafter referred to as a processing document ID) is found and the determination in
ステップ4304の判定がNOならば、ステップ4308にジャンプする。
ステップ4304の判定がYESならば、文書インデックスのステップ4302で参照されたエントリ内の「ルートまでのパス」フィールドに登録されている文書IDのうち、下記条件を満たす文書IDが存在するか否かが判定される(ステップ4305)。
If the determination in
If the determination in
(条件)その文書IDに対応する文書は、処理文書IDの作者によって作成されたものであって、かつその文書IDは、図39に示されるデータ構成を有するQAインデックス内のいずれかのエントリ内の「Thanks」フィールドに登録されている。 (Condition) The document corresponding to the document ID is created by the author of the processing document ID, and the document ID is in any of the entries in the QA index having the data structure shown in FIG. In the “Tanks” field.
ステップ4305の判定がYESなら、ステップ4305で参照されたQAインデックス内のエントリの「Question」フィールドに、処理文書IDが追加される。また、図37に示されるデータ構成を有する文書インデックスにおいて、処理文書IDを「文書ID」フィールドに含むエントリ内の「記事種別」フィールドに、記号「Q」が追加される(ステップ4306)。 If the determination in step 4305 is YES, the processing document ID is added to the “Question” field of the entry in the QA index referenced in step 4305. Also, in the document index having the data structure shown in FIG. 37, the symbol “Q” is added to the “article type” field in the entry including the processed document ID in the “document ID” field (step 4306).
更に、文書インデックスのステップ4302で参照されたエントリ内の「ルートまでのパス」フィールドに登録されている文書ID群のうち、ステップ4305で参照されたQAインデックス内のエントリの「Question」フィールドに登録された処理文書IDとそのエントリの「Thanks」フィールドに登録された文書IDに挟まれた文書ID群が、そのエントリの「Answer」フィールドに追加される。また、図37に示されるデータ構成を有する文書インデックスにおいて、上記登録が行われた各文書IDを各「文書ID」フィールドに含む各エントリ内の「記事種別」フィールドに、それぞれ記号「A」が追加される(ステップ4306)。
Further, among the document ID groups registered in the “path to root” field in the entry referenced in
一方、ステップ4306の判定がNOなら、QAインデックスにおいて、{(そのインデックス内のQA_IDの最大値)+1}の値を「QA_ID」フィールドの値として有するエントリが作成され、そのエントリ内の「Question」フィールドに、処理文書IDが登録される。また、図37に示されるデータ構成を有する文書インデックスにおいて、処理文書IDを「文書ID」フィールドに含むエントリ内の「記事種別」フィールドに、記号「Q」が登録される(ステップ4307)。 On the other hand, if the determination in step 4306 is NO, in the QA index, an entry having a value of {(maximum value of QA_ID in the index) +1} as a value of the “QA_ID” field is created, and “Question” in the entry is created. The processing document ID is registered in the field. Also, in the document index having the data structure shown in FIG. 37, the symbol “Q” is registered in the “article type” field in the entry including the processed document ID in the “document ID” field (step 4307).
上記ステップ4306又は4307の処理の後、又はステップ4304の判定がNOとなった場合には、二次記憶装置3503から読み出されている処理文書IDに対応する文書中に、図45に示されるような、センテンスパターンが存在するか否かが判定される(ステップ4308)。
FIG. 45 shows the document corresponding to the processing document ID read from the
ステップ4308の判定がNOならば、ステップ4302に戻る。
ステップ4308の判定がYESならば、文書インデックスのステップ4302で参照されたエントリ内の「ルートまでのパス」フィールドに登録されている文書IDのうち、下記条件を満たす文書IDが存在するか否かが判定される(ステップ4309)。
If the determination in
If the determination in
(条件)その文書IDに対応する文書は、処理文書IDの作者によって作成されたものであって、かつその文書IDは、図39に示されるデータ構成を有するQAインデックス内のいずれかのエントリ内の「Question」フィールドに登録されている。 (Condition) The document corresponding to the document ID is created by the author of the processing document ID, and the document ID is in any of the entries in the QA index having the data structure shown in FIG. In the “Question” field.
ステップ4309の判定がYESなら、ステップ4309で参照されたQAインデックス内のエントリの「Thanks」フィールドに、処理文書IDが追加される。また、図37に示されるデータ構成を有する文書インデックスにおいて、処理文書IDを「文書ID」フィールドに含むエントリ内の「記事種別」フィールドに、記号「T」が追加される(ステップ4310)。
If the determination in
更に、文書インデックスのステップ4302で参照されたエントリ内の「ルートまでのパス」フィールドに登録されている文書ID群のうち、ステップ4309で参照されたQAインデックス内のエントリの「Thanks」フィールドに登録された処理文書IDとそのエントリの「Question」フィールドに登録された文書IDに挟まれた文書ID群が、そのエントリの「Answer」フィールドに追加される。また、図37に示されるデータ構成を有する文書インデックスにおいて、上記登録が行われた各文書IDを各「文書ID」フィールドに含む各エントリ内の「記事種別」フィールドに、それぞれ記号「A」が追加される(ステップ4310)。
Further, among the document ID groups registered in the “path to root” field in the entry referenced in
一方、ステップ4309の判定がNOなら、QAインデックスにおいて、{(そのインデックス内のQA_IDの最大値)+1}の値を「QA_ID」フィールドの値として有するエントリが作成され、そのエントリ内の「Thanks」フィールドに、処理文書IDが登録される。また、図37に示されるデータ構成を有する文書インデックスにおいて、処理文書IDを「文書ID」フィールドに含むエントリ内の「記事種別」フィールドに、記号「T」が登録される(ステップ4311)。
On the other hand, if the determination in
上記ステップ4310又は4311の処理の後、ステップ4302に戻り、次の文書IDの検索が実行される。
上記ステップ4302〜4311の処理が繰り返された結果、ステップ4303で、ステップ4302における条件を満たす文書IDが見つからなかったと判定された場合には、スレッドインデックス内の現在処理中のエントリの「スレッドの木構造」フィールドが参照されることによって、全てのリーフ文書に対応する文書IDに対する処理が試行されたか否かが判定される(ステップ4312)。
After the processing of
If it is determined in
全てのリーフ文書に対応する文書IDに対する処理が試行されてはおらずステップ4312の判定がNOの場合には、ステップ4301に戻り、次のパスに対応する話題パターンの推測処理が繰り返される。
If processing for the document IDs corresponding to all leaf documents has not been attempted and the determination in
全てのリーフ文書に対応する文書IDに対する処理が試行されステップ4312の判定がYESとなった場合には、図42のステップ4203のQ and Aパターンの判定処理を終了する。
If processing for document IDs corresponding to all leaf documents is attempted and the determination in
図46及び図47に、上述のQ and Aパターンの判定処理によって抽出されるスレッド構造とそれに対応する文書群の例を示す。
なお、文書インデックスの「記事種別」フィールドに記号「A」が付与されたエントリの文書IDに対応する文書の作者について、それに対応するユーザインデックス(図36参照)のエントリが参照され、そのエントリ内の「発言数(回答数)」フィールドの内容が更新される。
FIG. 46 and FIG. 47 show examples of the thread structure extracted by the above-described Q and A pattern determination processing and the corresponding document group.
Note that the entry of the user index (see FIG. 36) corresponding to the author of the document corresponding to the document ID of the entry assigned the symbol “A” in the “article type” field of the document index is referred to. The content of the “Number of utterances (number of responses)” field is updated.
図48は、図42のステップ4204のDiscussionパターンの判定処理の動作フローチャートである。この動作フローチャートでは、スレッド文書群内の各参照パス毎に、Discussionパターンが推測される。 FIG. 48 is an operation flowchart of the determination process of the Discussion pattern in step 4204 of FIG. In this operation flowchart, a Discusion pattern is estimated for each reference path in the thread document group.
まず、スレッドインデックス内の該当エントリの「スレッドの木構造」フィールドが参照されることによって、リーフ文書(パスの末端の文書)に対応する文書IDが検索される(ステップ4801)。 First, the document ID corresponding to the leaf document (the document at the end of the path) is searched by referring to the “thread tree structure” field of the corresponding entry in the thread index (step 4801).
次に、上記検索の結果、全てのリーフ文書に対応する文書IDに対する処理が試行されたか否かが判定される(ステップ4802)。
全てのリーフ文書に対応する文書IDに対する処理が試行されてはおらずステップ4802の判定がNOの場合には、文書インデックスにおいて、ステップ4801で検索された文書IDを「文書ID」フィールドに含むエントリ内の「ルートまでのパス」フィールドが参照され、上記リーフ文書に対応する文書IDからルート文書までの長さ(文書IDの数)が6以上であるか否かが判定される(ステップ4803)。
Next, as a result of the search, it is determined whether or not processing for document IDs corresponding to all leaf documents has been attempted (step 4802).
If processing for document IDs corresponding to all leaf documents has not been attempted and the determination in
上記長さが6以上ではなくステップ4803の判定がNOの場合には、その参照パスの話題パターンはDiscussionパターンではないと推測され、ステップ4801に戻って次のリーフ文書に対する処理が実行される。
If the length is not 6 or more and the determination in
上記長さが6以上であってステップ4803の判定がYESの場合には、ステップ4803で参照された「ルートまでのパス」フィールドに含まれる文書ID群に対応する文書群において、相異なるユーザIDの数がカウントされる(ステップ4804)。
If the length is 6 or more and the determination in
次に、{上記「ルートまでのパス」フィールドに含まれる文書IDの数(総文書数)}に対する{上記相異なるユーザIDの数}の割合が、0.3より小さいか否かが判定される(ステップ4805)。 Next, it is determined whether the ratio of {the number of different user IDs} to the number of document IDs (total number of documents) included in the “path to root” field is smaller than 0.3. (Step 4805).
この判定がNOの場合には、特定の少数のユーザによる論争が行われてはいないと推測され、ステップ4801に戻って次のリーフ文書に対する処理が実行される。
一方、ステップ4805の判定がYESの場合には、特定の少数のユーザによる論争が行われていると推測され、図40に示されるデータ構成を有するDISCUSSインデックスにおいて、{(そのインデックス内のDS_IDの最大値)+1}の値を「DS_ID」フィールドの値として有するエントリが作成される。そして、そのエントリ内の「記事ID」フィールドに、ステップ4803で参照された「ルートまでのパス」フィールドに含まれる文書ID群がリストとして登録され、その登録内容に基づいて、「UID」フィールド及び「ThreadID」フィールドの内容が登録される。また、図37に示されるデータ構成を有する文書インデックスにおいて、上記各文書ID群を各「文書ID」フィールドに含む各エントリ内の「記事種別」フィールドに、記号「D」が登録される(ステップ4806)。その後、ステップ4801に戻って次のリーフ文書に対する処理が実行される。
If this determination is NO, it is presumed that no disputes have been made by a specific small number of users, and the processing returns to step 4801 to execute processing for the next leaf document.
On the other hand, if the determination in
全てのリーフ文書に対応する文書IDに対する処理が試行されステップ4802の判定がYESとなった場合には、図42のステップ4204のDiscussionパターンの判定処理を終了する。
If processing for document IDs corresponding to all leaf documents is attempted and the determination in
図49に、上述のDiscussionパターンの判定処理によって抽出されるスレッド構造の例を示す。少数のユーザの頭文字のみが多く現れていることがわかり、このスレッドにおいては論争が行われていると推測できる。 FIG. 49 shows an example of a thread structure extracted by the above-described determination process of the Discus pattern. It can be seen that only a few user acronyms are appearing, and that this thread is controversial.
図50は、図42のステップ4205のChatパターンの判定処理の動作フローチャートである。この動作フローチャートでは、スレッド文書群内の各参照パス毎に、Chatパターンが推測される。 FIG. 50 is an operation flowchart of the Chat pattern determination process in step 4205 of FIG. In this operation flowchart, a Chat pattern is estimated for each reference path in the thread document group.
まず、スレッドインデックス内の該当エントリの「スレッドの木構造」フィールドが参照されることによって、リーフ文書(パスの末端の文書)に対応する文書IDが検索される(ステップ5001)。 First, the document ID corresponding to the leaf document (the document at the end of the path) is searched by referring to the “thread tree structure” field of the corresponding entry in the thread index (step 5001).
次に、上記検索の結果、全てのリーフ文書に対応する文書IDに対する処理が試行されたか否かが判定される(ステップ5002)。
全てのリーフ文書に対応する文書IDに対する処理が試行されてはおらずステップ5002の判定がNOの場合には、文書インデックスにおいて、ステップ5001で検索された文書IDを「文書ID」フィールドに含むエントリ内の「ルートまでのパス」フィールドが参照され、上記リーフ文書に対応する文書IDからルート文書までの長さ(文書IDの数)が6以上であるか否かが判定される(ステップ5003)。
Next, as a result of the search, it is determined whether or not processing for document IDs corresponding to all leaf documents has been attempted (step 5002).
If processing for document IDs corresponding to all leaf documents has not been attempted and the determination in
上記長さが6以上ではなくステップ5003の判定がNOの場合には、その参照パスの話題パターンはChatパターンではないと推測され、ステップ5001に戻って次のリーフ文書に対する処理が実行される。
If the length is not 6 or more and the determination in
上記長さが6以上であってステップ5003の判定がYESの場合には、ステップ5003で参照された「ルートまでのパス」フィールドに含まれる文書ID群に対応する文書群において、相異なるユーザIDの数がカウントされる(ステップ5004)。
If the length is 6 or more and the determination in
次に、{上記「ルートまでのパス」フィールドに含まれる文書IDの数(総文書数)}に対する{上記相異なるユーザIDの数}の割合が、0.6より大きいか否かが判定される(ステップ5005)。 Next, it is determined whether the ratio of {the number of different user IDs} to the number of document IDs (total number of documents) included in the “path to root” field is greater than 0.6. (Step 5005).
この判定がNOの場合には、多数のユーザによる雑談(チャット)が行われてはいないと推測され、ステップ5001に戻って次のリーフ文書に対する処理が実行される。
一方、ステップ5005の判定がYESの場合には、多数のユーザによる雑談が行われていると推測され、図41に示されるデータ構成を有するCHATインデックスにおいて、{(そのインデックス内のCT_IDの最大値)+1}の値を「CT_ID」フィールドの値として有するエントリが作成される。そして、そのエントリ内の「Chatリスト」フィールドに、ステップ5003で参照された「ルートまでのパス」フィールドに含まれる文書ID群がリストとして登録され、その登録内容に基づいて、「UID」フィールド及び「ThreadID」フィールドの内容が登録される(ステップ4806)。その後、ステップ5001に戻って次のリーフ文書に対する処理が実行される。
If this determination is NO, it is estimated that chatting (chatting) by a large number of users has not been performed, and the process returns to step 5001 to execute processing for the next leaf document.
On the other hand, if the determination in
全てのリーフ文書に対応する文書IDに対する処理が試行されステップ5002の判定がYESとなった場合には、図42のステップ4205のChatパターンの判定処理を終了する。
If processing for document IDs corresponding to all leaf documents is attempted and the determination in
図51に、上述のChatパターンの判定処理によって抽出されるスレッド構造の例を示す。多数のユーザの頭文字が雑多に現れていることがわかり、このスレッドにおいては雑談が行われていると推測できる。 FIG. 51 shows an example of a thread structure extracted by the above-described Chat pattern determination process. It turns out that the acronyms of many users appear in various ways, and it can be inferred that chatting is taking place in this thread.
〔スレッド木の縮退処理の原理〕
次に、第2の実施の形態におけるスレッド木の縮退処理の原理について説明する。
図52及び図53は、スレッド構造の表示例を示す図である。図52は、従来の伝統的なニュースリーダにおける表示例、図53は、前述した図14のスレッドビューの表示処理に基づく表示例である。
[Principle of thread tree degeneration processing]
Next, the principle of thread tree degeneration processing according to the second embodiment will be described.
52 and 53 are diagrams showing display examples of the thread structure. FIG. 52 is a display example of a conventional traditional news reader, and FIG. 53 is a display example based on the thread view display process of FIG. 14 described above.
わずか17本の記事からなるスレッドにおいても、図52に示されるように行数が増えたり、図53に示されるように横方向にはみだしたりして、スレッド全体を見るのに画面のスクロールが必要となり、全体構造の把握が難しいことがわかる。 Even in a thread consisting of only 17 articles, the number of lines increases as shown in FIG. 52, or it protrudes in the horizontal direction as shown in FIG. 53, and it is necessary to scroll the screen to see the whole thread. Thus, it is difficult to understand the overall structure.
図54は、スレッド内の上位n個の子孫ノード(図54の例ではn=6)に対する表示例である。行頭の“+”記号は子ノードが省略されていることを表し、行末のかっこ付き数字は子孫ノードの個数(図37に示される文書インデックスにおける参照子孫数)を表す。画面やウインドウサイズに合わせて値nを調整することにより、必要な部分のみを表示することが可能となる。 FIG. 54 is a display example for the top n descendant nodes (n = 6 in the example of FIG. 54) in the thread. The “+” symbol at the beginning of a line indicates that a child node is omitted, and the parenthesized number at the end of the line indicates the number of descendant nodes (the number of reference descendants in the document index shown in FIG. 37). By adjusting the value n in accordance with the screen or window size, it is possible to display only necessary portions.
図55は、子孫ノードのうち、同一タイトル(先頭の“Re: ”は除く)を持つノードが省略された表示例である。行頭の“+”記号は子ノードが省略されていることを表す。同一スレッドの文書においては、デフォルトではタイトルは、親ノードと同じであるか、又は、最初にフォローを表す“Re: ”が付加されるかである。作者が意図的にタイトルを変えたというのは、そこで話題が変わったことを明示している。このビューにより、スレッド内にどのような話題の変化があったかを容易に把握することができる。 FIG. 55 is a display example in which nodes having the same title (excluding the first “Re:”) among the descendant nodes are omitted. A “+” symbol at the beginning of a line indicates that a child node is omitted. In a document of the same thread, by default, the title is the same as that of the parent node, or “Re:” indicating follow is added first. The author's intentional change of title clearly indicates that the topic has changed. With this view, it is possible to easily grasp what topic has changed in the thread.
図56は、10/1から10/5という時間区間に作成された文書のスレッド構造の表示例である。ノードは、作者のイニシャルを表す。このビューでは、スレッドの時間的展開と一定区間内の情報だけを見ることができる。また、パソコンの画面上でスケジューラなどの時間的情報のあるアプリケーションと並べて見ることによって、自分のスケジュールや世の中の出来事と関連づけて文書情報を見ることができる。 FIG. 56 is a display example of the thread structure of a document created in the time interval from 10/1 to 10/5. The node represents the author's initials. In this view, you can see only the time evolution of threads and information within a certain interval. In addition, by viewing alongside an application with time information, such as a scheduler, on a personal computer screen, it is possible to view document information in association with one's own schedule and events in the world.
図57は、スレッドの作者をノードとしたグラフ構造である。ノードは、作者のイニシャルである。二重丸で表されたノードは、スレッドの最初の記事の発言者を表す。リンクの濃さにより作者間のやりとりの回数が表される。更に、図38に示されるスレッドインデックス中の該当エントリの最多発言UIDに登録されているユーザIDに対応するユーザのノードは、例えば強調表示される。このスレッドが、小川さん(小)とパーツィバルさん(パ)とのやりとりが中心であることが容易に理解できる。 FIG. 57 shows a graph structure in which the author of a thread is a node. The node is the author's initials. The node represented by a double circle represents the speaker of the first article in the thread. The number of interactions between authors is expressed by the strength of the link. Furthermore, the node of the user corresponding to the user ID registered in the most frequent UID of the corresponding entry in the thread index shown in FIG. 38 is highlighted, for example. It can be easily understood that this thread is centered on the exchange between Mr. Ogawa (small) and Mr. Partibar (pa).
〔検索フェーズの実行時の動作〕
次に、上述のスレッド木の縮退処理を含む検索フェーズの実行時の動作について説明する。
[Operation during search phase]
Next, an operation at the time of executing a search phase including the above-described thread tree degeneration processing will be described.
検索時には、利用者は、入力装置3509から検索要求を指示する。
図58は、検索要求の入力画面である。入力項目としては、下記に示されるものがある。
At the time of searching, the user instructs a search request from the input device 3509.
FIG. 58 is a search request input screen. The input items include the following items.
・探したい記事に含まれるキーワード列(必須)。
・探したい記事が含んではいけないキーワード列。
・検索対象の記事の種別として、全ての記事か、Qand Aパターンに相当する記事だけか。省略時は全ての記事。
・ Keyword string included in the article you want to find (required)
・ Keywords that should not contain the article you are looking for.
-As the types of articles to be searched, all articles or only articles corresponding to the Qand A pattern. The default is all articles.
・検索対象の記事の日付として、全区間か、一ヶ月以内か、一週間以内か。省略時は、全区間。
図58に示される入力画面の下部には、検索前の準備フェーズにおいて記事が二次記憶装置3503に格納(ダウンロード)された最新の日時が表示されている。
-Whether the date of the article to be searched is all sections, within a month, or within a week. The default is all sections.
In the lower part of the input screen shown in FIG. 58, the latest date and time when the article is stored (downloaded) in the
検索結果としては、下記に示されるものがある。
・スレッド一覧(図60参照)。
・スレッド構造表示(参照数による縮退表示、同一タイトルによる縮退表示を含む)(図61参照)。
Search results include those shown below.
・ Thread list (see FIG. 60).
Thread structure display (including a reduced display by the number of references and a reduced display by the same title) (see FIG. 61).
・時間区間スレッド表示(図62参照)。
・Q and A対照表示。
・作者ノードグラフ表示(図57参照)。
-Time interval thread display (see FIG. 62).
・ Q and A contrast display.
-Author node graph display (see FIG. 57).
・作者投稿一覧表示。
・記事本文表示。
これらの表示画面は、図59に示されるように相互に切り替えることができる。これらの表示画面のうち、代表的なものについて以下に説明する。
・ List of author posts.
-Article text display.
These display screens can be switched to each other as shown in FIG. Of these display screens, typical ones will be described below.
〔出力結果1:スレッド一覧〕
例えば、検索キーワードとして「エンジン」が入力された場合、図60に示されるようなスレッド一覧画面が表示される。図60で表示される検索結果は、下記に示されるものである。
[Output result 1: List of threads]
For example, when “engine” is input as a search keyword, a thread list screen as shown in FIG. 60 is displayed. The search results displayed in FIG. 60 are shown below.
・スレッドのトップ記事のタイトル。
・作者の名前。
・日付。
・ Title of the top article of the thread.
・ The author's name.
·date.
・サイズ(スレッドの記事数、全体の記事サイズ)。
・スレッドの内容(QA:Q and Aパターン、DC:Discussionパターン、CT:Chatパターン)。
-Size (number of articles in the thread, overall article size).
Thread contents (QA: Q and A pattern, DC: Discussion pattern, CT: Chat pattern).
検索時にはスレッドのサイズに基づくソーティング処理が実行され、上位10スレッドが表示される。ユーザが「次の10スレッド」をクリックすると、次の10スレッドが表示される。 When searching, sorting processing based on the thread size is executed, and the top 10 threads are displayed. When the user clicks on “next 10 threads”, the next 10 threads are displayed.
また、結果が多い場合には、更にキーワードを追加することにより絞り込み検索を実行させることも可能である。
他の画面へは、次の方法で移動することができる。
In addition, when there are many results, it is possible to execute a narrowing search by adding more keywords.
You can move to another screen in the following way.
・タイトルをクリックすると、スレッド構造が表示される。
・作者の名前をクリックすると、作者ノードグラフが表示される。
・日付をクリックすると、時間区間スレッド表示が表示される。
-Click on the title to display the thread structure.
・ Click on the author's name to display the author node graph.
-Click on the date to display the time interval thread display.
・スレッドの内容のQAをクリックすると、QAの対が表示される。
〔出力結果2:スレッド構造表示〕
図61は、スレッド構造の表示例である。
-Clicking on QA of the thread contents will display QA pairs.
[Output result 2: Thread structure display]
FIG. 61 is a display example of a thread structure.
図54に示されるように、スレッド構造が、参照ノード数に基づいて縮退された木構造として表示される。表示領域の行数(縦方向の長さ)に応じて、参照ノード数の少ないノードは省略して表示される。ノードの表示内容は、下記のとおりである。表示領域の桁数(横方向の長さ)に応じて、各ノードにおいて表示される項目も適宜省略される。 As shown in FIG. 54, the thread structure is displayed as a tree structure reduced based on the number of reference nodes. Depending on the number of lines in the display area (vertical length), nodes with a small number of reference nodes are omitted and displayed. The display contents of the node are as follows. Depending on the number of digits in the display area (the length in the horizontal direction), items displayed at each node are also omitted as appropriate.
・行頭の“+”記号は、省略された子ノードがある場合に付加される。
・ユーザが入力したキーワードを含む記事は、タイトルと作者部分が強調表示される(図61では、矩形によって囲まれた部分)。
-The "+" sign at the beginning of a line is added when there are omitted child nodes.
In the article including the keyword input by the user, the title and the author part are highlighted (in FIG. 61, a part surrounded by a rectangle).
・記事タイトル。フォロー記事には“Re: ”記号が付加される。
・記事の作者名。
・記事の種別。内容推定部3504(図35)によって推定された話題パターンに応じて、Q(質問)、A(答)、D(論争)が付加される。
-Article title. “Re:” symbol is added to the follow article.
-The author name of the article.
-Article type. Q (question), A (answer), and D (controversy) are added according to the topic pattern estimated by the content estimation unit 3504 (FIG. 35).
・自ノードの子孫ノードの数。“+”記号が付加されたノードに対してのみ付加される。
また、このスレッド内において、更にキーワードを指定して絞り込み検索を実行することも可能である。
-Number of descendant nodes of the current node. It is added only to nodes to which the “+” sign is added.
Further, it is also possible to execute a narrowing search by further specifying a keyword in this thread.
他の画面へは、次の方法で移動することができる。
・タイトルをクリックすると、記事本文が表示される。
・作者の名前をクリックすると、作者ノードグラフが表示される。
You can move to another screen in the following way.
-Click the title to display the article text.
・ Click on the author's name to display the author node graph.
・「タイトル一覧」をクリックすると、スレッド構造が、同一タイトルに基づいて縮退された木構造として表示される(図55参照)。
〔出力結果3:時間区間スレッド表示〕
図62(a) は、一定の時間区間におけるスレッドの表示例である。キーワードが含まれる記事は黒丸によって、そうでない記事は灰色の丸によって表示されている。また、作者のイニシャルが各ノードの下に付加される。
• When “Title List” is clicked, the thread structure is displayed as a tree structure reduced based on the same title (see FIG. 55).
[Output result 3: Time interval thread display]
FIG. 62 (a) is a display example of threads in a certain time interval. Articles that contain keywords are displayed with black circles, and articles that do not have keywords are displayed with gray circles. Also, the author's initials are added below each node.
この画面では、日付の表示区間、日付の縦横表示、ウインドウのサイズ、セルの幅などが可変である。そこで、例えば他のスケジューラとサイズを合わせることが可能である。例えば、図62(b) は、他のスケジューラであり、それと図62(a) に示される時間区間スレッド表示とで、各セル幅が合わせられている。 On this screen, the date display section, date vertical and horizontal display, window size, cell width, and the like are variable. Therefore, for example, it is possible to match the size with other schedulers. For example, FIG. 62 (b) shows another scheduler, and the cell widths are matched in this and the time interval thread display shown in FIG. 62 (a).
他の画面へは、次の方法で移動することができる。
・黒丸又は灰色の丸をクリックすると、記事本文が表示される。
・作者のイニシャルをクリックすると、作者ノードグラフが表示される。
You can move to another screen in the following way.
・ Click on the black circle or gray circle to display the article text.
・ Click the author's initial to display the author node graph.
〔出力結果4:QA対表示〕
QA対表示とは、内容推定部3504(図35)によって推測されたQ andAパターンに対応する質問と回答の対が、テーブルとして表示されたものである。テーブルの一行には、下記の情報が表示される。
[Output result 4: QA vs. display]
In the QA pair display, a question and answer pair corresponding to the Q and A pattern estimated by the content estimation unit 3504 (FIG. 35) is displayed as a table. The following information is displayed in one row of the table.
・タイトル。
・質問者。
・回答者(複数)。
他の画面へは、次の方法で移動することができる。
·title.
·Questioner.
-Respondents (multiple).
You can move to another screen in the following way.
・タイトルをクリックすると、スレッド構造が表示される。
・作者の名前をクリックすると、作者ノードグラフが表示される。
〔出力結果5:作者ノードグラフ〕
作者ノードグラフは、そのスレッド内の各記事の作者間の会話関係がグラフ化されたものである。前述の図57がその表示例である。
-Click on the title to display the thread structure.
・ Click on the author's name to display the author node graph.
[Output result 5: Author node graph]
The author node graph is a graph of the conversation relationship between the authors of each article in the thread. FIG. 57 is an example of the display.
他の画面へは、次の方法で移動することができる。
・作者をクリックすると、その作者の投稿一覧が表示される。
・リンクをクリックすると、スレッド構造が表示される。
You can move to another screen in the following way.
・ Clicking on the author will display the author's post list.
・ Click on the link to display the thread structure.
〔出力結果6:作者の投稿一覧〕
作者の投稿一覧は、各作者が投稿した記事の一覧を見るための画面である。日付、タイトル、記事の種別(Q、A、D)が日付順に表示される。
[Output result 6: Author's post list]
The author's post list is a screen for viewing a list of articles posted by each author. The date, title, and article type (Q, A, D) are displayed in date order.
他の画面へは、次の方法で移動することができる。
・タイトルをクリックすると、記事本文が表示される。
〔出力結果7:記事本文〕
これは、記事の本文である。他に、作者名、タイトル、日付、親記事へのリンクが表示される。
You can move to another screen in the following way.
-Click the title to display the article text.
[Output result 7: Article text]
This is the body of the article. In addition, the author name, title, date, and link to the parent article are displayed.
他の画面へは、次の方法で移動することができる。
・タイトルをクリックすると、スレッド構造が表示される。
・日付をクリックすると、時間区間スレッド表示が表示される。
You can move to another screen in the following way.
-Click on the title to display the thread structure.
-Click on the date to display the time interval thread display.
・作者の名前をクリックすると、作者ノードグラフが表示される。
〔時間区間スレッド表示の動作〕
図63は、ビュー生成部3508(図35)が実行する時間区間スレッド表示の動作フローチャートである。
・ Click on the author's name to display the author node graph.
[Time section thread display operation]
FIG. 63 is an operation flowchart of time interval thread display executed by the view generation unit 3508 (FIG. 35).
まず、図38に示されるデータ構成を有するスレッドインデックスにおいて、表示対象スレッドに対応するエントリ内の「スレッドの木構造」フィールドが参照されることにより、そのスレッドに含まれる文書IDが1つ選択される(ステップ6301)。 First, in the thread index having the data structure shown in FIG. 38, one “document ID” included in the thread is selected by referring to the “thread tree structure” field in the entry corresponding to the display target thread. (Step 6301).
次に、図37に示されるデータ構成を有する文書インデックスにおいて、上記選択された文書IDに対応するエントリ内の「日付」フィールドが参照され、その日付が図64に示されるデータ構成を有するカレンダインデックスに登録される(ステップ6302)。 Next, in the document index having the data structure shown in FIG. 37, the “date” field in the entry corresponding to the selected document ID is referred to, and the date is a calendar index having the data structure shown in FIG. (Step 6302).
次に、スレッドインデックスの表示対象スレッドに対応するエントリ内の「スレッドの木構造」フィールド内の全ての文書IDに対する処理が試行されたか否かが判定される(ステップ6303)。 Next, it is determined whether processing for all document IDs in the “thread tree structure” field in the entry corresponding to the thread index display target thread has been attempted (step 6303).
全ての文書IDに対する処理が試行されてはおらずステップ6303の判定がNOの場合には、ステップ6301に戻り、次の文書IDに対する処理が繰り返される。
全ての文書IDに対する処理が試行されステップ6303の判定がYESとなった場合には、図64に示されるデータ構成を有するカレンダインデックスが参照されることにより、カレンダに文書ノードがマッピングされる。参照関係のエッジは、スレッドインデックスを参照して表示される。
If the process for all document IDs has not been attempted and the determination in
If processing for all document IDs is attempted and the determination in
〔作者ノードグラフの表示動作〕
図65は、ビュー生成部3508(図35)が実行する作者ノードグラフの表示動作を示す動作フローチャートである。
[Author node graph display operation]
FIG. 65 is an operation flowchart showing the display operation of the author node graph executed by the view generation unit 3508 (FIG. 35).
まず、図38に示されるデータ構成を有するスレッドインデックスにおいて、表示対象スレッドに対応するエントリ内の「スレッドの木構造」フィールドが参照されることにより、そのスレッドに含まれる文書IDが1つ選択される。次に、図37に示されるデータ構成を有する文書インデックスと図36に示されるデータ構成を有するユーザインデックスとが参照されることにより、上記選択された文書IDに対応する文書の親文書(親発言)のユーザIDが取得される(ステップ6501)。 First, in the thread index having the data structure shown in FIG. 38, one “document ID” included in the thread is selected by referring to the “thread tree structure” field in the entry corresponding to the display target thread. The Next, by referring to the document index having the data structure shown in FIG. 37 and the user index having the data structure shown in FIG. 36, the parent document (parent message) of the document corresponding to the selected document ID is referred to. ) Is acquired (step 6501).
次に、図66に示されるデータ構成を有する発言者配列内に、上記親子関係に対応するエントリが存在するか否かが判定される(ステップ6502)。
そのエントリが存在するなら、ステップ6504の処理に進む。
Next, it is determined whether or not an entry corresponding to the parent-child relationship exists in the speaker array having the data structure shown in FIG. 66 (step 6502).
If the entry exists, the process proceeds to step 6504.
そのエントリが存在しないなら、発言者配列の横軸又は縦軸のエントリが追加される(ステップ6503)。
その後、上記エントリの数字が1だけインクリメントされる(ステップ6504)。
If the entry does not exist, an entry on the horizontal axis or vertical axis of the speaker array is added (step 6503).
Thereafter, the number of the entry is incremented by 1 (step 6504).
次に、スレッドインデックスの表示対象スレッドに対応するエントリ内の「スレッドの木構造」フィールド内の全ての文書IDに対する処理が試行されたか否かが判定される(ステップ6505)。 Next, it is determined whether or not processing for all document IDs in the “thread tree structure” field in the entry corresponding to the thread index display target thread has been attempted (step 6505).
全ての文書IDに対する処理が試行されてはおらずステップ6505の判定がNOの場合には、ステップ6501に戻り、次の文書IDに対する処理が繰り返される。
全ての文書IDに対する処理が試行されステップ6505の判定がYESとなった場合には、図67に示されるように、図66に示されるデータ構成を有する発言者配列のエントリの数だけノードが描画され、親から子供に向かって“→”線が描画される。この線の太さは、その親子間の会話の度数に応じて決定される(ステップ6506)。
If processing for all document IDs has not been attempted and the determination in
If processing for all document IDs is attempted and the determination in
以上説明した第2の実施の形態において、スレッドの木構造が縮退されることにより、画面の表示範囲に応じたスレッドの表示可能となる。
また、自動的に推定された話題と共に検索結果が表示されるため、検索結果のスレッド数が多い場合でも、利用者は検索結果の概要を容易に把握することが可能となる。
In the second embodiment described above, the thread tree can be displayed according to the display range of the screen by reducing the tree structure of the thread.
In addition, since the search result is displayed together with the automatically estimated topic, even when the number of threads of the search result is large, the user can easily grasp the outline of the search result.
更に、スレッド中の文書量が多くても、同じ作者が何度も投稿している場合がある。作者を中心に見せるビユーが提供されることにより、スレッド内のキーパーソンが把握可能となるだけでなく、スレッドの全体構造もコンパクトに表示することが可能となる。 Furthermore, even if the amount of documents in the thread is large, the same author may post many times. By providing a view that mainly shows the author, not only can the key person in the thread be grasped, but also the entire structure of the thread can be displayed in a compact manner.
〔各実施の形態を実現するプログラムが記録された記録媒体についての補足〕
本発明は、計算機により使用されたときに、上述の本発明の各実施の形態の各構成によって実現される機能と同様の機能を計算機に行わせるための計算機読出し可能記憶媒体として構成することもできる。
[Supplementary information about a recording medium on which a program for realizing each embodiment is recorded]
The present invention may also be configured as a computer-readable storage medium for causing a computer to perform the same function as the function realized by each configuration of the above-described embodiments of the present invention when used by a computer. it can.
この場合に、図68に示されるように、例えばフロッピィディスク、CD−ROMディスク、光ディスク、リムーバブルハードディスク等の可搬型記憶媒体6802や、ネットワーク回線6803経由で、本発明の好適実施例の各種機能を実現するプログラムが、コンピュータ6801の本体6804内のメモリ(RAM又はハードディスク等)6805にロードされて、実行される。 In this case, as shown in FIG. 68, various functions of the preferred embodiment of the present invention can be performed via a portable storage medium 6802 such as a floppy disk, a CD-ROM disk, an optical disk, a removable hard disk, and the network line 6803. A program to be realized is loaded into a memory (RAM or hard disk or the like) 6805 in the main body 6804 of the computer 6801 and executed.
301 文書群データベース
302 文書群解析装置
303 集計装置
304 メタインデックス
305 スレッドインデックス
306 表示装置
401 書式解析部
402 構造解析部
403 内容解析部
404 索引ファイル
405 文字列検索装置
3501 処理装置
3502 文書取得部
3503 二次記憶装置
3504 内容推定部
3505 表示用インデックス
3506 検索エンジン
3507 検索用インデックス
3508 ビュー生成部
3509 入力装置
3510 表示装置
301
Claims (12)
参照関係を有する文書群からなる文書データベースから、文書内容及び作者間の投稿パターンに基づいて前記文書群の内容を推定して、該内容の話題パターンに対応するインデックスを生成する内容推定手段と、
利用者からの前記文書データベースに対する検索要求を入力する入力手段と、
前記文書データベースの文書を検索する検索エンジン手段と、
該検索エンジン手段からの検索結果と前記インデックスを利用して1つ以上のビユーを生成し、該1つ以上のビューを切り替えて表示装置に表示するビュー生成手段と、
を含むことを特徴とする関連文書表示装置。 A related document display device for displaying a document group consisting of documents having a reference relationship,
Content estimation means for estimating the content of the document group based on the document content and a posting pattern between authors from a document database consisting of a document group having a reference relationship, and generating an index corresponding to the topic pattern of the content;
An input means for inputting a search request for the document database from a user;
Search engine means for searching for documents in the document database;
View generation means for generating one or more views using a search result from the search engine means and the index, and switching the one or more views to display on the display device;
A related document display device comprising:
参照関係を有する文書群からなる文書データベースから、文書内容及び作者間の投稿パターンに基づいて前記文書群の内容を推定して、該内容の話題パターンに対応するインデックスを生成する機能と、
利用者からの前記文書データベースに対する検索要求を入力する機能と、
前記文書データベースの文書を検索する機能と、
該検索結果と前記インデックスを利用して1つ以上のビユーを生成し、該1つ以上のビューを切り替えて表示装置に表示する機能と、
を前記コンピュータに行わせるためのプログラムを記録したコンピュータ読出し可能記録媒体。 A recording medium that records a program read by the computer when used,
A function that estimates the content of the document group based on the document content and a posting pattern between the authors from a document database including a document group having a reference relationship, and generates an index corresponding to the topic pattern of the content;
A function of inputting a search request for the document database from a user;
A function for searching for documents in the document database;
Generating one or more views using the search result and the index, and switching the one or more views to display on the display device;
A computer-readable recording medium on which a program for causing the computer to execute is recorded.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006315390A JP4348357B2 (en) | 1997-09-08 | 2006-11-22 | Related document display device |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP24224797 | 1997-09-08 | ||
JP2006315390A JP4348357B2 (en) | 1997-09-08 | 2006-11-22 | Related document display device |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP10082270A Division JPH11143912A (en) | 1997-09-08 | 1998-03-27 | Related document display device |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007073072A true JP2007073072A (en) | 2007-03-22 |
JP4348357B2 JP4348357B2 (en) | 2009-10-21 |
Family
ID=37934412
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006315390A Expired - Fee Related JP4348357B2 (en) | 1997-09-08 | 2006-11-22 | Related document display device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4348357B2 (en) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009211281A (en) * | 2008-03-03 | 2009-09-17 | Nippon Telegr & Teleph Corp <Ntt> | Propagation structure extraction device, method and program, and computer-readable recording medium |
JPWO2014103645A1 (en) * | 2012-12-28 | 2017-01-12 | 株式会社ユニバーサルエンターテインメント | Topic providing system, conversation control terminal device, and maintenance device |
CN113742292A (en) * | 2021-09-07 | 2021-12-03 | 六棱镜(杭州)科技有限公司 | Multi-thread data retrieval and retrieved data access method based on AI technology |
WO2022038662A1 (en) * | 2020-08-17 | 2022-02-24 | 日本電信電話株式会社 | Information processing method, information processing device, and program |
-
2006
- 2006-11-22 JP JP2006315390A patent/JP4348357B2/en not_active Expired - Fee Related
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009211281A (en) * | 2008-03-03 | 2009-09-17 | Nippon Telegr & Teleph Corp <Ntt> | Propagation structure extraction device, method and program, and computer-readable recording medium |
JPWO2014103645A1 (en) * | 2012-12-28 | 2017-01-12 | 株式会社ユニバーサルエンターテインメント | Topic providing system, conversation control terminal device, and maintenance device |
JP2019067433A (en) * | 2012-12-28 | 2019-04-25 | 株式会社ユニバーサルエンターテインメント | Subject provision system |
WO2022038662A1 (en) * | 2020-08-17 | 2022-02-24 | 日本電信電話株式会社 | Information processing method, information processing device, and program |
JP7485986B2 (en) | 2020-08-17 | 2024-05-17 | 日本電信電話株式会社 | Information processing method, information processing device, and program |
CN113742292A (en) * | 2021-09-07 | 2021-12-03 | 六棱镜(杭州)科技有限公司 | Multi-thread data retrieval and retrieved data access method based on AI technology |
CN113742292B (en) * | 2021-09-07 | 2023-11-10 | 六棱镜(杭州)科技有限公司 | Multithread data retrieval and access method of retrieved data based on AI technology |
Also Published As
Publication number | Publication date |
---|---|
JP4348357B2 (en) | 2009-10-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6865715B2 (en) | Statistical method for extracting, and displaying keywords in forum/message board documents | |
JPH11143912A (en) | Related document display device | |
US6327586B1 (en) | System method and computer program product to automate the management and analysis of heterogeneous data | |
US6598043B1 (en) | Classification of information sources using graph structures | |
US7340450B2 (en) | Data search system and data search method using a global unique identifier | |
US6990490B2 (en) | Information management method and information management device | |
US20060271526A1 (en) | Method and apparatus for sociological data analysis | |
US20080222511A1 (en) | Method and Apparatus for Annotating a Document | |
EP1910949A2 (en) | An improved method and apparatus for sociological data analysis | |
JP2005092889A (en) | Information block extraction apparatus and method for web page | |
JP2002230035A (en) | Information arranging method, information processor, information processing system, storage medium and program transmitting device | |
KR101007613B1 (en) | Data registration/search support device using a keyword | |
US20040015485A1 (en) | Method and apparatus for improved internet searching | |
JP3673111B2 (en) | Document management method, document management apparatus, and storage medium | |
JP2002351916A (en) | Device and method for retrieving web information and program making computer execute this method | |
JP4348357B2 (en) | Related document display device | |
JP4084647B2 (en) | Information search system, information search method, and information search program | |
CN114064913A (en) | Knowledge graph-based document retrieval method and system | |
KR101061392B1 (en) | Recording medium recording system, method and program source of auto complete search using object type of database | |
JP2000231570A (en) | Internet information processor, internet information processing method and computer readable recording medium with program making computer execute method recorded therein | |
JP2014102625A (en) | Information retrieval system, program, and method | |
JPH117452A (en) | Method and device for collecting information through network and recording medium recording program for executing the method | |
JP4408605B2 (en) | Knowledge data processing device | |
JP2007012100A (en) | Retrieval method and retrieval device or information providing system based on personal information | |
JP2004220177A (en) | Information sharing system, information sharing method, and program for information sharing method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090106 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090309 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090714 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090717 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120724 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120724 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130724 Year of fee payment: 4 |
|
LAPS | Cancellation because of no payment of annual fees |