JP2009217724A - Relevant document estimation device, relevant document estimation method, program and recording medium - Google Patents

Relevant document estimation device, relevant document estimation method, program and recording medium Download PDF

Info

Publication number
JP2009217724A
JP2009217724A JP2008062978A JP2008062978A JP2009217724A JP 2009217724 A JP2009217724 A JP 2009217724A JP 2008062978 A JP2008062978 A JP 2008062978A JP 2008062978 A JP2008062978 A JP 2008062978A JP 2009217724 A JP2009217724 A JP 2009217724A
Authority
JP
Japan
Prior art keywords
document
topic
importance
graph
relationship
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008062978A
Other languages
Japanese (ja)
Inventor
Takao Fukushige
貴雄 福重
Masako Nomoto
昌子 野本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Original Assignee
Panasonic Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp filed Critical Panasonic Corp
Priority to JP2008062978A priority Critical patent/JP2009217724A/en
Publication of JP2009217724A publication Critical patent/JP2009217724A/en
Pending legal-status Critical Current

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To provide a relevant document estimation device, enabling a user having no field knowledge or knowledge of inter-document structure to easily find out a relevant document, a relevant document estimation method, a program and a recording medium. <P>SOLUTION: In the relevant document estimation device 100, an importance propagation execution part 130 calculates importance for each of topics and documents in a topic/document graph by performing propagation of importance in the topic/document graph by use of importance propagation probability tables 131-133 showing a propagation probability of importance between adjacent topics or documents in the topic/document graph, and generates a topic/document graph with importance in which the calculation result of importance is assigned to the topics and documents. An importance adjustment part 140 adjusts the numerical values in the calculation result of importance for the topics or documents. A relevant document presentation part 150 presents a link group 220 to relevant documents on a display screen 200 based on the adjusted topic/document graph with importance. <P>COPYRIGHT: (C)2009,JPO&INPIT

Description

本発明は、ユーザに提示する関連文書を推定する関連文書推定装置、関連文書推定方法及びプログラム、並びに記録媒体に関し、特に、関連文書を推定してユーザに提示する技術の改良に関する。   The present invention relates to a related document estimation apparatus, a related document estimation method and a program, and a recording medium for estimating a related document to be presented to a user.

メタデータとは、コンテンツやデータに対して付与される情報である。文書に付与されるメタデータの例としては、例えば、文書のタイトル、トピック等の文書の内容に関する情報がある。オントロジー(Ontology)とは、事物に関する定義や、事物の間の関係に関する記述の集まり、また、それらを記述するための語彙の定義の集まりである。   Metadata is information given to content and data. As an example of metadata given to a document, for example, there is information on the content of the document such as a document title and a topic. Ontology is a collection of definitions related to things, descriptions of relationships between things, and vocabulary definitions for describing them.

文書のメタデータは、各文書のトピックをオントロジーで定義された語彙を用いて記述することにより、文書のトピックの関連度をオントロジーのグラフを用いて表現したり、関連するトピックをもつ文書を検索したりすることが可能になる。   Document metadata describes the topic of each document using the vocabulary defined in the ontology, and expresses the relevance of the topic of the document using an ontology graph, or searches for documents with related topics. It becomes possible to do.

特許文献1には、パタンマッチによる関連文書取得方法が記載されている。特許文献1記載の方法は、登録文書を記憶した後、登録文書毎に部分構造データを生成し、すべての文書の部分構造データから、文書内、文書間の関連箇所を抽出する。特許文献1記載の方法は、抽出した関連箇所に対して文法的連接関係取得規則を適用し、規則に合致した意味的関係を取得する。さらに、特許文献1記載の方法は、関連部分対を持つ文書又は文書対にリンク情報を付与し、リンク情報が付与された部分毎にユーザに提示される元データとしてのリンクリストを生成する。   Patent Document 1 describes a related document acquisition method by pattern matching. In the method described in Patent Document 1, after storing a registered document, partial structure data is generated for each registered document, and related portions in the document and between documents are extracted from the partial structure data of all documents. The method described in Patent Document 1 applies a grammatical connection relationship acquisition rule to the extracted related portion, and acquires a semantic relationship that matches the rule. Furthermore, in the method described in Patent Document 1, link information is assigned to a document having an associated part pair or a document pair, and a link list as original data presented to the user is generated for each part to which link information is assigned.

また、特許文献2には、リンク付けされた文書の集合体について求めた使用情報に基づき、その集合体における文書アクセスのモデリングを行う方法が記載されている。特許文献2記載の方法は、活性がネットワークを通して伝播するにつれて減衰させるための減衰関数を生成し、活性化伝播アルゴリズムを実行することにより、注目文書の集合に活性を付与する。その活性はすべての文書にわたって活性化の安定パタンに到達するまでネットワークを通して伝播する。そして、活性パタンから、目的とする使用情報を抽出する。   Patent Document 2 describes a method for modeling document access in a collection based on usage information obtained for a collection of linked documents. The method described in Patent Document 2 generates an attenuation function for attenuation as activity propagates through the network, and executes the activation propagation algorithm to add activity to a set of documents of interest. Its activity propagates through the network until it reaches the activation stability pattern across all documents. Then, target usage information is extracted from the active pattern.

図23は、従来のオントロジーを用いる関連文書推定装置の構成を示すブロック図である。   FIG. 23 is a block diagram showing a configuration of a related document estimation apparatus using a conventional ontology.

図23において、関連文書推定装置10は、注目トピック選択部11、トピック・文書グラフ作成部12、重要文書抽出部13、及び関連文書提示部14を備えて構成される。   In FIG. 23, the related document estimation device 10 is configured to include an attention topic selection unit 11, a topic / document graph creation unit 12, an important document extraction unit 13, and a related document presentation unit 14.

注目トピック選択部11は、ユーザからの指示により、注目トピックを選択する。ユーザからの指示は、ユーザのページ閲覧の動作(リンクをクリックする、ボタンを押す、入力フィールドに文字を入力する、など)により与えられる。注目トピック選択部11は、該当トピックを主題とする文書に対するハイパーリンクをユーザが選択したり、ユーザに示されるトピックのリストからユーザが該当トピックを選択する。注目トピック選択部11は、ユーザの選択により、ユーザが該当トピックに関する情報を求めて行う行動からユーザの注目トピックを推定する。   The attention topic selection unit 11 selects the attention topic according to an instruction from the user. The instruction from the user is given by the user's page browsing operation (clicking a link, pressing a button, inputting a character in an input field, etc.). In the attention topic selection unit 11, the user selects a hyperlink to a document whose subject is the corresponding topic, or the user selects the corresponding topic from a list of topics indicated to the user. The attention topic selection unit 11 estimates a user's attention topic from an action performed by the user in search of information related to the topic according to the user's selection.

ここで、トピックとは、事物、概念一般を指す。例えば、「ハイビジョンビデオカメラHDC−SD***」などの製品分類や機種名、「DVDへのダビング」などの機器の機能もトピックになりうる。トピック間関係は、トピックとトピックの間の関係をいう。例えば、トピック間関係は、ユーザが機器で実現したいこと(タスク)や機器の操作がトピックとして表現されている場合には、あるタスクが他のタスクの下位タスクになっているとか、ある操作があるタスクを実現するための操作等である。注目トピックは、現在ユーザが興味を持っているであろうと注目トピック選択部11が推定したトピックである。ユーザが入力フィールドに入力したり、トピックリストから特定のトピックを選んだりすることにより推定される。   Here, the topic refers to things and concepts in general. For example, product classifications such as “high-definition video camera HDC-SD ***”, model names, and device functions such as “dubbing to DVD” can also be topics. The relationship between topics refers to the relationship between topics. For example, when the relationship between topics is what the user wants to achieve on the device (task) or the operation of the device is expressed as a topic, a task is a subordinate task of another task, or a certain operation An operation for realizing a certain task. The attention topic is a topic estimated by the attention topic selection unit 11 that the user will be interested in at present. Inferred by the user entering in an input field or selecting a specific topic from a topic list.

トピック・文書グラフ作成部12は、メタデータ付き文書集合15、分野オントロジー16及びドキュメントオントロジー17を用いて、注目トピックからトピック・文書グラフを作成する。上記トピック・文書グラフは、トピック間関係、文書間関係、トピック・文書間関係をグラフで表したものである。また、トピック・文書間関係は、トピックと文書の間の関係をいう。例えば、あるトピックがある文書の主題になっている、などはトピック・文書間関係の一つである。   The topic / document graph creation unit 12 creates a topic / document graph from the topic of interest using the document set 15 with metadata, the field ontology 16 and the document ontology 17. The topic / document graph is a graph representing the relationship between topics, the relationship between documents, and the relationship between topics / documents. The topic / document relationship is a relationship between a topic and a document. For example, a topic being the subject of a document is one of topics / document relationships.

重要文書抽出部13は、作成されたトピック・文書グラフから重要文書抽出規則18を用いて重要文書を抽出し、重要度付きトピック・文書グラフを関連文書提示部14に出力する。重要度は、トピック又は文書が、ユーザにとってどの程度重要であるか並びに、どの程度ユーザに見せる必要があるか、を表す数値である。重要度は、システムによる推定の結果得られる。重要文書は、重要度が一定の閾値を超えている、あるいは文書集合中で、重要度の高い方から一定の順位以内の文書をいう。重要文書抽出規則18は、注目トピックあるいは注目文書が与えられたときに、どの文書を重要文書とするかに関するパタンを記した規則である。   The important document extraction unit 13 extracts an important document from the created topic / document graph using the important document extraction rule 18 and outputs the topic / document graph with importance to the related document presentation unit 14. The importance is a numerical value indicating how important a topic or document is for the user and how much the user needs to show to the user. The importance is obtained as a result of estimation by the system. An important document is a document whose importance exceeds a certain threshold or is within a certain order from the highest importance in a document set. The important document extraction rule 18 is a rule that describes a pattern regarding which document is to be an important document when a topic of interest or a document of interest is given.

関連文書提示部14は、抽出された重要度付きトピック・文書グラフを提示する。関連文書は、現在閲覧中の文書、あるいは現在注目中のトピックに関して、関連があるとシステムにより判定された文書である。   The related document presentation unit 14 presents the extracted topic / document graph with importance. The related document is a document that is currently being browsed or a document that has been determined by the system to be related to a topic that is currently focused on.

メタデータ付き文書集合15は、メタデータが付けられた文書の集合をいう。メタデータは、文書そのものに何らかのマークアップにより埋め込まれていてもよいし、メタデータを記述したファイルが文書とは別に作られたものでもよい。なお、マークアップ言語としては、Webの標準言語HTML(Hyper Text Markup Language)、及び、作成したコンテンツをコンピュータやTV、携帯電話機など多種多様な情報機器の間でやりとりできるXML(eXtensible Markup Language)などがある。   The document set 15 with metadata refers to a set of documents with metadata attached. The metadata may be embedded in the document itself by some markup, or a file describing the metadata may be created separately from the document. The markup language includes Web standard language HTML (Hyper Text Markup Language) and XML (eXtensible Markup Language) that can exchange created content between various information devices such as computers, TVs, and mobile phones. There is.

分野オントロジー16は、例えば、家電に関する情報など、特定の分野の知識を記述するためのオントロジーである。この場合の分野知識は、例えば、家電に関する情報など、特定の分野の知識である。   The field ontology 16 is an ontology for describing knowledge in a specific field such as information on home appliances. The field knowledge in this case is knowledge of a specific field such as information on home appliances.

ドキュメントオントロジー17は、文書に対して、文書タイプや、該当文書の主題、部分文書などに関する情報を記述するためのオントロジーである。この場合のドキュメントは、「文書」に同じである。文書には、テキストに限定されず、写真、動画、及びそれらの一部分(例えば、テキストファイル中の一段落)も含まれる。   The document ontology 17 is an ontology for describing information regarding a document type, a subject matter of a corresponding document, a partial document, and the like. The document in this case is the same as the “document”. The document is not limited to text, but also includes photographs, moving images, and parts thereof (for example, a paragraph in a text file).

また、図24は、パタンマッチによる関連文書取得を説明する図である。図中、タスクは、ユーザが機器で実現しようとすることである。また、タスクページは、タスクに関して記述したページである。   FIG. 24 is a diagram for explaining related document acquisition by pattern matching. In the figure, the task is that the user intends to realize with the device. The task page is a page describing a task.

図24(A)に示すように、タスクページ閲覧中に、タスクに関する注意ページを取得するパタンでは、図24(B)に示す操作の部分操作に関する注意ページを取得することはできない。すなわち、タスクから操作、操作から部分操作、部分操作から注意に至る経路をあらかじめ予測して記述しておかなければ、注意ページを取得することはできない。
特開2006−185334号公報 特開平11−328226号公報 J.Pearl: Probabilistic Reasoning in Intelligent Systems: Networks of Plausible Inference, Morgan Kaufmann, 1988
As shown in FIG. 24A, a pattern for acquiring a caution page related to a task during browsing of the task page cannot acquire a caution page related to a partial operation of the operation shown in FIG. That is, the attention page cannot be acquired unless the route from the task to the operation, the operation to the partial operation, and the partial operation to the attention is predicted and described in advance.
JP 2006-185334 A JP 11-328226 A J. Pearl: Probabilistic Reasoning in Intelligent Systems: Networks of Plausible Inference, Morgan Kaufmann, 1988

しかしながら、このような従来の関連文書表示装置にあっては、以下のような課題があった。   However, such related document display devices have the following problems.

(1)特許文献1記載のパタンマッチによる関連文書取得方法は、あらかじめ記述したパタンに合致する文書しか提示できない。重要な関連文書をもれなく提示できるという保証がない。   (1) The related document acquisition method based on pattern matching described in Patent Document 1 can only present documents that match a previously described pattern. There is no guarantee that all important relevant documents can be presented.

例えば、図24に示すパタンマッチによる関連文書取得では、あらかじめ、多様なグラフ構造を予測して十分なパタンを記述することは困難である。   For example, in the related document acquisition by the pattern matching shown in FIG. 24, it is difficult to describe a sufficient pattern by predicting various graph structures in advance.

(2)特許文献2記載のオントロジーを使わない関連ページ案内では、ページ間のリンクによる遷移のみを考慮しているため、リンクにより到達できない場合がある。また、ハイパーリンクをたどる回数であるホップ数の多いページは、推薦されないという欠点がある。   (2) In the related page guidance that does not use the ontology described in Patent Document 2, only transitions by links between pages are considered, so there are cases where it cannot be reached by links. Also, a page with a large number of hops, which is the number of times to follow a hyperlink, is not recommended.

(3)Webサイトによる使い方案内には下記の問題点がある。   (3) The usage guidance on the website has the following problems.

求める情報がどこにあるか分からないこと、またリンク先に求める情報が含まれているかどうか事前には分からないことである。したがって、求める情報があっても、到達できるとは限らない。そもそもユーザは、自分が何を知らなければならないかが分からない場合がある。分野知識とサイト構造知識が必要である。サイト構造知識は、インターネットのウェブサイト上の文書間にどのようなハイパーリンクが張られているかに関する知識であり、分野知識や文書間の構造の知識をもたないユーザが関連文書を見つけるのは困難であった。   It is impossible to know where the requested information is, and it is not known in advance whether the information to be requested is included in the link destination. Therefore, even if there is information to be sought, it cannot always be reached. In the first place, the user may not know what he has to know. Domain knowledge and site structure knowledge are required. Site structure knowledge is knowledge about what kind of hyperlinks are made between documents on the Internet website. Users who do not have domain knowledge or knowledge of the structure between documents find a related document. It was difficult.

従って、従来の技術では、分野知識や文書間の構造の知識をもたないユーザが関連文書を見つけるのは困難であるという課題を有していた。   Therefore, in the conventional technology, there is a problem that it is difficult for a user who does not have the domain knowledge or the knowledge of the structure between documents to find a related document.

本発明は、上記に鑑みてなされたものであり、分野知識や文書間の構造の知識をもたないユーザでも関連文書を容易に見つけることができる関連文書推定装置、関連文書推定方法及びプログラム、並びに記録媒体を提供することを目的とする。   The present invention has been made in view of the above, and a related document estimation device, a related document estimation method, and a program that can easily find a related document even by a user who does not have domain knowledge or knowledge of the structure between documents. It is another object of the present invention to provide a recording medium.

本発明の関連文書推定装置は、ユーザに提示する関連文書を推定する関連文書推定装置であって、ユーザが注目するトピックを選択する注目トピック選択部と、メタデータ付き文書集合、トピック間関係及び文書間関係を用いて、前記注目トピックからトピック・文書グラフを作成するトピック・文書グラフ作成部と、前記トピック・文書グラフにおいて、隣接するトピック又は文書の重要度の伝播確率を表す重要度伝播確率表と、前記重要度伝播確率表を用いて、前記トピック・文書グラフにおける重要度の伝播を行うことにより、前記トピック・文書グラフにおけるトピック及び文書の重要度を算出し、該算出結果を前記トピック及び文書に付与した重要度付きトピック・文書グラフを生成する重要度伝播実行部と、算出された重要度付きトピック・文書グラフを基に、関連文書を提示する関連文書提示部と、を備える構成を採る。   A related document estimation apparatus according to the present invention is a related document estimation apparatus that estimates a related document to be presented to a user, and includes an attention topic selection unit that selects a topic that a user is interested in, a document set with metadata, a relationship between topics, and A topic / document graph creation unit that creates a topic / document graph from the topic of interest using inter-document relationships, and an importance propagation probability that represents the propagation probability of the importance of adjacent topics or documents in the topic / document graph Using the table and the importance propagation probability table, the importance of the topic / document graph is propagated to calculate the importance of the topic and the document in the topic / document graph, and the calculated result is used as the topic. Importance propagation execution unit that generates topic / document graph with importance attached to document, and with calculated importance Based on the topic document graph employs a configuration and a related document presenting section for presenting the related document.

本発明の関連文書推定方法は、ユーザに提示する関連文書を推定する関連文書推定方法であって、ユーザが注目するトピックを選択するステップと、メタデータ付き文書集合、トピック間関係及び文書間関係を用いて、前記注目トピックからトピック・文書グラフを作成するステップと、隣接するトピック又は文書の重要度の伝播確率を表す重要度伝播確率表を用いて、前記トピック・文書グラフにおける重要度の伝播を行うことにより、前記トピック・文書グラフにおけるトピック及び文書の重要度を算出し、該算出結果を前記トピック及び文書に付与した重要度付きトピック・文書グラフを生成するステップとを有する。   The related document estimation method of the present invention is a related document estimation method for estimating a related document to be presented to a user, the step of selecting a topic to which the user is interested, a document set with metadata, a relationship between topics, and a relationship between documents Using the above, the step of creating a topic / document graph from the topic of interest and the importance propagation probability table representing the propagation probability of the importance of adjacent topics or documents are used to propagate the importance in the topic / document graph. To calculate the importance of the topic and the document in the topic / document graph, and generate a topic / document graph with importance by assigning the calculation result to the topic and the document.

また、本発明は、ユーザに提示する関連文書を推定する関連文書推定装置として実行させるためのプログラムであって、コンピュータに、ユーザが注目するトピックを選択するステップと、メタデータ付き文書集合、トピック間関係及び文書間関係を用いて、前記注目トピックからトピック・文書グラフを作成するステップと、隣接するトピック又は文書の重要度の伝播確率を表す重要度伝播確率表を用いて、前記トピック・文書グラフにおける重要度の伝播を行うことにより、前記トピック・文書グラフにおけるトピック及び文書の重要度を算出し、該算出結果を前記トピック及び文書に付与した重要度付きトピック・文書グラフを生成するステップとを関連文書推定装置として実行させるためのプログラムである。   In addition, the present invention is a program for causing a computer to execute a related document estimation apparatus that estimates a related document to be presented to a user. The computer selects a topic to be noticed by the user, a document set with metadata, a topic Using the inter-relationship and inter-document relation, creating a topic / document graph from the topic of interest, and using the importance propagation probability table representing the propagation probability of the importance of adjacent topics or documents, the topic / document Calculating importance of topics and documents in the topic / document graph by propagating importance in the graph, and generating a topic / document graph with importance by assigning the calculation result to the topics and documents; Is a program for executing the above as a related document estimation device.

また、本発明は、ユーザに提示する関連文書を推定する関連文書推定装置として実行させるためのプログラムであって、コンピュータに、ユーザが注目するトピックを選択するステップと、メタデータ付き文書集合、トピック間関係及び文書間関係を用いて、前記注目トピックからトピック・文書グラフを作成するステップと、隣接するトピック又は文書の重要度の伝播確率を表す重要度伝播確率表を用いて、前記トピック・文書グラフにおける重要度の伝播を行うことにより、前記トピック・文書グラフにおけるトピック及び文書の重要度を算出し、該算出結果を前記トピック及び文書に付与した重要度付きトピック・文書グラフを生成するステップと、前記算出されたトピック又は文書に対する重要度の推定結果の数値を調整するステップと、前記調整された重要度付きトピック・文書グラフを基に、関連文書を提示するステップとを関連文書推定装置として実行させるためのプログラムである。   In addition, the present invention is a program for causing a computer to execute a related document estimation apparatus that estimates a related document to be presented to a user. The computer selects a topic to be noticed by the user, a document set with metadata, a topic Using the inter-relationship and inter-document relation, creating a topic / document graph from the topic of interest, and using the importance propagation probability table representing the propagation probability of the importance of adjacent topics or documents, the topic / document Calculating importance of topics and documents in the topic / document graph by propagating importance in the graph, and generating a topic / document graph with importance by assigning the calculation result to the topics and documents; Adjusting the numerical value of the importance estimation result for the calculated topic or document. If, based on the adjusted with importance topic document graph is a program for executing a step of presenting the related document as related document estimator.

本発明によれば、トピック・文書グラフにおいて、各ノードが重要であるとされる確率を伝播し、算出された重要度付きトピック・文書グラフを基に、関連文書を提示することにより、分野知識や文書間の構造の知識をもたないユーザでも関連文書を容易に見つけることができる。   According to the present invention, in the topic / document graph, the probability that each node is important is propagated, and the related knowledge is presented based on the calculated topic / document graph with importance. Even users who do not have knowledge of the structure between documents can easily find related documents.

以下、本発明の実施の形態について図面を参照して詳細に説明する。   Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.

図1は、本発明の一実施の形態における関連文書推定装置の構成を示す図である。本実施の形態おける関連文書推定装置は、ユーザのパーソナルコンピュータにプラグインされ、ユーザがWebサイトにアクセスして関連文書を見つけるシステムに適用した例で説明する。   FIG. 1 is a diagram showing a configuration of a related document estimation apparatus according to an embodiment of the present invention. The related document estimation apparatus according to the present embodiment will be described as an example applied to a system that is plugged into a user's personal computer and that allows a user to access a website and find a related document.

図1において、関連文書推定装置100は、注目トピック選択部110、トピック・文書グラフ作成部120、メタデータ付き文書集合データベース(DB)121、トピック間関係DB122、文書間関係DB123、重要度伝播実行部130、トピック間重要度伝播確率表131、文書間重要度伝播確率表132、トピック・文書間重要度伝播確率表133、重要度調整部140、及び関連文書提示部150から構成される。   In FIG. 1, the related document estimation apparatus 100 includes an attention topic selection unit 110, a topic / document graph creation unit 120, a document set database (DB) 121 with metadata, a topic relationship DB 122, a document relationship DB 123, and importance propagation execution. Section 130, topic importance propagation probability table 131, document importance propagation probability table 132, topic / document importance propagation probability table 133, importance adjustment section 140, and related document presentation section 150.

注目トピック選択部110は、ユーザからの指示により、ユーザが注目するトピックを注目トピックとして選択する。ユーザからの指示は、ユーザのページ閲覧の動作(リンクをクリックする、ボタンを押す、入力フィールドに文字を入力する、など)をすることである。これは、ユーザによるトピックの選択でもある。ユーザによるトピックの選択は、該当トピックを主題とする文書に対するハイパーリンクの選択、又は、ユーザに示されるトピックのリストからユーザが該当トピックを選択する。   The attention topic selection unit 110 selects, as an attention topic, a topic that the user is interested in according to an instruction from the user. The instruction from the user is the user's page browsing operation (clicking a link, pressing a button, inputting a character in an input field, etc.). This is also the topic selection by the user. In the selection of a topic by the user, the user selects a corresponding topic from a selection of a hyperlink to a document whose subject is the corresponding topic or a list of topics shown to the user.

また、トピックは、事物、概念一般を指す。例えば、トピックは、「ハイビジョンビデオカメラHDC−***」、「DVDへのダビング」などである。トピック間関係は、トピックとトピックの間の関係をいう。例えば、トピック間関係は、あるタスクが他のタスクの下位タスクになっているとか、ある操作があるタスクを実現するための操作であるとか、である。か、ある操作があるタスクを実現するための操作であるとかは、トピック間関係である。下位タスクは、タスク1がタスク2の特殊な場合であるとき、タスク1はタスク2の下位タスクであるという。例えば、「DVDに録画する」というタスクは「録画する」というタスクの下位タスクである。上記タスクは、ユーザがしたいと思うことをいう。注目トピックは、現在ユーザが興味を持っているであろうと推定されるトピックである。ユーザが入力フィールドに入力したり、トピックリストから選んだりすることにより推定される。   Topics also refer to things and concepts in general. For example, topics include “high-definition video camera HDC-***”, “dubbing to DVD”, and the like. The relationship between topics refers to the relationship between topics. For example, the relationship between topics is that a certain task is a subordinate task of another task, or an operation for realizing a certain operation. An operation for realizing a task with a certain operation is a relationship between topics. When a task 1 is a special case of task 2, task 1 is said to be a task lower than task 2. For example, the task “Record to DVD” is a subordinate task of the task “Record”. The above tasks are what the user wants to do. The topic of interest is a topic that is presumed that the user is currently interested. It is estimated by the user inputting in the input field or selecting from the topic list.

本明細書において、操作は、ユーザが家電に対して行う行為をいう。ボタンを押す、ジョグダイヤルを回すといった基本的なものから、「DVDを再生する」といったいくつかの基本的な操作の連続まで、広く「操作」と呼ぶ。また、部分操作は、一連の操作を構成する操作をいう。「DVDを挿入する」は、「DVDを再生する」の部分操作である。   In this specification, an operation refers to an action that a user performs on a home appliance. From basics such as pressing a button and turning the jog dial to a series of basic operations such as “playing a DVD”, it is widely called “operation”. A partial operation refers to an operation that constitutes a series of operations. “Insert DVD” is a partial operation of “Play DVD”.

トピック・文書グラフ作成部120は、メタデータ付き文書集合DB121、トピック間関係DB122及び文書間関係DB123を用いて、注目トピックからトピック・文書グラフを作成する。ここで、各節点は、クラス(トピック・文書など)/識別子(タスクなど)を有する。トピック・文書グラフ作成部120は、クラス/識別子を用いて節点同士を結び付けると共に、各節点と重要度伝播確率表131〜133とをリンクして対応付ける。上記トピック・文書グラフは、トピック間関係、文書間関係、トピック・文書間関係をグラフで表したものである。また、トピック・文書間関係は、トピックと文書の間の関係をいう。例えば、あるトピックがある文書の主題になっている、などはトピック・文書間関係の一つである。グラフは、後述するように、節点と枝により構成される。節点は、枝と共にグラフを構成する基本要素の一つである。トピック・文書グラフにおいては、各トピック又は文書が節点となる。枝は、グラフにおいて、節点と節点を結ぶ線であり、該当節点同士の直接の関係を表す。上記関係に向きがある場合、外観系を表す枝にも向きがあるとする。これを有向枝であると呼ぶ。グラフにおいて、有向枝は、節点と節点を結ぶ矢印により表現する。なお、本実施形態の説明において、「トピック又は文書」は、「トピック及び/又は文書」の意味で用いている。記載上の煩雑さを避けるためのものである。したがって、「トピック又は文書」には、「トピック及び文書」も含まれる。また、トピック同士、あるいは文書同士も含まれる。   The topic / document graph creation unit 120 creates a topic / document graph from the topic of interest using the document set DB 121 with metadata, the inter-topic relationship DB 122, and the inter-document relationship DB 123. Here, each node has a class (topic, document, etc.) / Identifier (task, etc.). The topic / document graph creation unit 120 links nodes using classes / identifiers, and links and associates each node with the importance propagation probability tables 131 to 133. The topic / document graph is a graph representing the relationship between topics, the relationship between documents, and the relationship between topics / documents. The topic / document relationship is a relationship between a topic and a document. For example, a topic being the subject of a document is one of topics / document relationships. As will be described later, the graph is composed of nodes and branches. A node is one of the basic elements that make up a graph together with branches. In the topic / document graph, each topic or document is a node. A branch is a line connecting nodes in the graph, and represents a direct relationship between the nodes. When the above relationship has a direction, it is assumed that the branch representing the appearance system also has a direction. This is called a directional branch. In the graph, the directional branch is represented by an arrow connecting the nodes. In the description of this embodiment, “topic or document” means “topic and / or document”. This is to avoid complexity in description. Accordingly, “topic or document” includes “topic and document”. Also included are topics or documents.

本実施の形態では、すべての関係には向きがあるものとする。また、グラフにおいて、二つの節点を結ぶ一連の枝の列を、経路という。例えば、節点Aから節点Bに枝E1があり、節点Bから節点Cに枝E2があるとき、(E1,E2)という枝の列は、AからCに至る経路である。   In this embodiment, it is assumed that all relationships have a direction. In the graph, a series of branches connecting two nodes is called a path. For example, when there is a branch E1 from the node A to the node B, and there is a branch E2 from the node B to the node C, the row of branches (E1, E2) is a path from A to C.

メタデータ付き文書集合DB121は、メタデータがつけられた文書の集合を蓄積する。メタデータは、文書そのものに何らかのマークアップにより埋め込まれていてもよいし、メタデータを記述したファイルが文書とは別に作られていてもよい。なお、ハイパーリンクにつけられた文字列は、リンク文字列と呼ばれる。リンク文字列の典型的な例は、その文字が表示されている箇所をクリックすることにより、該当ハイパーリンクによって結び付けられている文書が表示される。   The metadata-added document set DB 121 stores a set of documents to which metadata is attached. The metadata may be embedded in the document itself by some markup, or a file describing the metadata may be created separately from the document. A character string attached to a hyperlink is called a link character string. In a typical example of a link character string, a document linked by a corresponding hyperlink is displayed by clicking a portion where the character is displayed.

トピック間関係DB122は、トピックとトピックの間の関係を蓄積する。例えば、トピック間関係は、あるタスクが他のタスクの下位タスクになっているとか、ある操作があるタスクを実現するための操作であるとか、である。下位タスクは、タスク1がタスク2の特殊な場合であるとき、タスク1はタスク2の下位タスクであるという。例えば、「DVDに録画する」というタスクは、「録画する」というタスクの下位タスクである。   The inter-topic relationship DB 122 accumulates relationships between topics. For example, the relationship between topics is that a certain task is a subordinate task of another task, or an operation for realizing a certain operation. When a task 1 is a special case of task 2, task 1 is said to be a task lower than task 2. For example, a task “record on DVD” is a subordinate task of a task “record”.

文書間関係DB123は、文書と文書との間の関係を蓄積する。文書間関係は、部分文書関係のほか、改訂版ともとの版との間の関係、写真と代替テキストとの間の関係などが含まれる。   The inter-document relationship DB 123 stores the relationship between documents. The inter-document relationship includes a partial document relationship, a relationship between the revised version and the original version, a relationship between the photograph and the alternative text, and the like.

重要度伝播実行部130は、トピック・文書グラフにおいて、隣接するトピック又は文書の重要度の伝播確率を表す重要度伝播確率を用いて、トピック・文書グラフにおける重要度の伝播を行う。重要度伝播実行部130は、トピック・文書グラフにおけるトピック及び文書の重要度を算出し、該重要度の算出結果を基に前記トピック及び文書に付与した重要度付きトピック・文書グラフを生成する。すなわち、重要度伝播実行部130は、注目トピック/文書の重要度を設定するとともに、節点間の伝播計算を行って重要度付きトピック・文書グラフを生成する。重要度伝播実行部130は、生成した重要度付きトピック・文書グラフを重要度調整部140に出力する。重要度は、トピック又は文書が、ユーザにとってどの程度重要であるか、どの程度ユーザに見せる必要があるか、を表す数値である。重要度は、システムによる推定の結果得られる。重要文書は、重要度が一定の閾値を超えている、あるいは文書集合中で、重要度の高い方から一定の順位以内の文書をいう。重要度伝播は、トピック・文書グラフにおいてトピック又は文書の重要度が、隣接するトピック又は文書の重要度に影響を与えること、並びに、それにより、トピック又は文書の重要度が変化することをいい、本実施形態の特徴の一つである。   The importance degree propagation execution unit 130 propagates the importance degree in the topic / document graph using the importance degree propagation probability representing the propagation probability of the importance degree of the adjacent topic or document in the topic / document graph. The importance level propagation execution unit 130 calculates the importance level of the topic and the document in the topic / document graph, and generates the topic / document graph with importance level assigned to the topic and the document based on the calculation result of the importance level. That is, the importance propagation executing unit 130 sets the importance of the topic / document of interest, and performs a propagation calculation between nodes to generate a topic / document graph with importance. The importance level propagation execution unit 130 outputs the generated topic / document graph with importance level to the importance level adjustment unit 140. The importance is a numerical value indicating how important a topic or document is to the user and how much the user needs to show the user. The importance is obtained as a result of estimation by the system. An important document is a document whose importance exceeds a certain threshold or is within a certain order from the highest importance in a document set. Importance of importance means that the importance of a topic or document in the topic / document graph affects the importance of adjacent topics or documents, and the importance of the topic or document changes accordingly. This is one of the features of this embodiment.

トピック間重要度伝播確率表131は、トピック間重要度伝播確率を格納し、文書間重要度伝播確率表132は、文書間重要度伝播確率を格納し、トピック・文書間重要度伝播確率表133は、トピック・文書間重要度伝播確確率を格納する。これら重要度伝播確率表131〜133を備えることは、本実施形態の特徴の一つである。重要度伝播確率表131〜133は、隣接するトピック又は文書が重要となる(あるいは重要とならない)確率を、トピック・文書グラフにおいて親となるトピック乃至、文書の重要度の組み合わせに対する条件付確率として示した表である。親は、グラフにおいて、節点Aから出て節点Bに入る有向枝があるとき、AはBの親であるという。「子」の反対の概念である。子は、グラフにおいて、節点Aから出て節点Bに入る有向枝があるとき、BはAの子であるという。有向枝については、枝の箇所で記述した。ここで、本実施の形態では、重要度伝播確率を、重要度伝播確率表として説明した。「トピック・文書グラフにおいて、隣接するトピック又は文書の重要度の伝播確率を表す重要度伝播確率」を示すものであればよく、「表」の形式は勿論のこと、「表」である必要もない。すなわち、前記重要度伝播確率が対応つけられるものであれば、すべて、本願の請求項に記載の重要度伝播確率表に含まれる。なお、重要度伝播確率表の合成については、図22により後述する。   The inter-topic importance propagation probability table 131 stores the inter-topic importance propagation probability, the inter-document importance propagation probability table 132 stores the inter-document importance propagation probability, and the inter-topic importance propagation probability table 133. Stores the topic-document importance propagation probability. It is one of the features of this embodiment that the importance propagation probability tables 131 to 133 are provided. The importance propagation probability tables 131 to 133 indicate the probability that an adjacent topic or document is important (or not important) as a conditional probability for a combination of a topic or a document importance that is a parent in a topic / document graph. It is the table shown. A parent is said to be the parent of B when there is a directed branch that leaves node A and enters node B in the graph. This is the opposite concept of “child”. A child is said to be a child of A when there is a directed branch that leaves node A and enters node B in the graph. The directional branch is described at the branch. Here, in the present embodiment, the importance propagation probability is described as the importance propagation probability table. It only needs to indicate “importance propagation probability indicating the propagation probability of the importance of adjacent topics or documents in the topic / document graph”, and it should be “table” as well as “table”. Absent. That is, any importance propagation probability that can be associated is included in the importance propagation probability table described in the claims of the present application. The synthesis of the importance propagation probability table will be described later with reference to FIG.

重要度調整部140は、トピック又は文書に対する重要度の推定結果の数値を調整する。重要度調整は、トピック又は文書に対する重要度の推定結果の数値を調整することであり、本実施形態の特徴の一つである。   The importance level adjustment unit 140 adjusts the numerical value of the importance level estimation result for the topic or document. The importance adjustment is to adjust the numerical value of the importance estimation result for the topic or document, and is one of the features of this embodiment.

関連文書提示部150は、算出された重要度付きトピック・文書グラフを基に、関連文書を提示する。関連文書は、現在閲覧中の文書、あるいは注目中のトピックに関して、関連があるとシステムにより判定された文書である。   The related document presentation unit 150 presents a related document based on the calculated topic / document graph with importance. The related document is a document that is currently being browsed or a document that is determined by the system to be related to a topic of interest.

関連文書推定装置100は、例えばサーバコンピュータにより構成される。また、ユーザが有するパーソナルコンピュータへのプラグイン(plug-in)プログラムにより実現される。ユーザが、パーソナルコンピュータにプラグインすることで、コンピュータは本関連文書提示を実現することができる。また、このプラグインは、インターネットを通じて提供してもよい。パーソナルコンピュータなどのコンピュータは、CPU、ROM・RAMなどの記憶装置、HDD等の外部記憶装置、入力装置、表示装置、入出力インターフェース、通信インターフェース等を有する。   The related document estimation apparatus 100 is configured by a server computer, for example. Further, it is realized by a plug-in program to a personal computer owned by the user. When the user plugs in the personal computer, the computer can realize the related document presentation. This plug-in may be provided through the Internet. A computer such as a personal computer includes a CPU, a storage device such as a ROM / RAM, an external storage device such as an HDD, an input device, a display device, an input / output interface, and a communication interface.

パーソナルコンピュータへプラグインした場合の関連文書推定装置100において、注目トピック選択部110、トピック・文書グラフ作成部120、重要度伝播実行部130及び重要度調整部140が、CPUによる関連文書提示処理により実現される。また、トピック間関係DB122、文書間関係DB123、重要度伝播実行部130、トピック間重要度伝播確率表131、文書間重要度伝播確率表132及びトピック・文書間重要度伝播確率表133が、記憶装置に対応又は格納される。また、関連文書提示部150は、表示装置に対応する。CPUは、関連文書推定装置100における他の構成部の動作を制御するとともに、関連文書推定装置100の構成部間のデータフローも必要に応じて制御する。また、関連文書推定装置100の機能を実装している必要なプログラム及び/又はデータは、記憶装置に格納され、各種の処理段階におけるデータはRAMに格納される。   In the related document estimation apparatus 100 when plugged in to a personal computer, the attention topic selection unit 110, the topic / document graph creation unit 120, the importance level propagation execution unit 130, and the importance level adjustment unit 140 are processed by a related document presentation process by the CPU. Realized. Further, the inter-topic relationship DB 122, the inter-document relationship DB 123, the importance level propagation execution unit 130, the inter-topic importance level propagation probability table 131, the inter-document level importance probability table 132, and the topic / inter-document importance level propagation probability table 133 are stored. Corresponds to or is stored in the device. The related document presentation unit 150 corresponds to a display device. The CPU controls the operation of other components in the related document estimation device 100 and also controls the data flow between the components of the related document estimation device 100 as necessary. In addition, necessary programs and / or data that implement the functions of the related document estimation apparatus 100 are stored in a storage device, and data in various processing stages are stored in a RAM.

以下、上述のように構成された関連文書推定装置100の動作を説明する。   Hereinafter, the operation of the related document estimation apparatus 100 configured as described above will be described.

図2は、関連文書推定装置100の全体動作を示すフローチャートである。上述したようにCPUにより関連文書提示プログラムとして実行される。図中、Sはフローの各ステップである。   FIG. 2 is a flowchart showing the overall operation of the related document estimation apparatus 100. As described above, it is executed by the CPU as a related document presentation program. In the figure, S is each step of the flow.

ステップS11では、トピック・文書グラフ作成部120において、メタデータ付き文書集合、トピック間関係及び文書間関係を用いて、注目トピックからトピック・文書グラフを作成する。   In step S11, the topic / document graph creation unit 120 creates a topic / document graph from the topic of interest using the document set with metadata, the relationship between topics, and the relationship between documents.

ステップS12では、注目トピック選択部110において、注目トピック又は注目文書を設定するとともに、重要度の初期値の設定を行う。注目トピックは、現在ユーザが興味を持っているであろうと推定されるトピックである。注目トピックは、ユーザが入力フィールドに入力したり、トピックリストから選んだりすることにより推定される。注目文書は、現在ユーザが閲覧しているであろうと推定される文書である。また、初期状態は、注目トピック又は注目文書が与えられていない状態である。   In step S12, the attention topic selection unit 110 sets the attention topic or the attention document and sets the initial value of the importance. The topic of interest is a topic that is presumed that the user is currently interested. The topic of interest is estimated by the user entering in the input field or selecting from the topic list. The document of interest is a document that is estimated to be viewed by the user at present. Further, the initial state is a state in which the topic of interest or the document of interest is not given.

ステップS13では、重要度伝播実行部130において、トピック間重要度伝播確率表131、文書間重要度伝播確率表132及びトピック・文書間重要度伝播確率表133を用いて重要度伝播を行う。具体的には、重要度伝播実行部130は、トピック間重要度伝播確率表131、文書間重要度伝播確率表132及びトピック・文書間重要度伝播確率表133を用いて、トピック・文書グラフにおける重要度を計算する。重要度伝播実行部130は、該推定結果を基に、注目トピックから該当文書までを伝播する重要度付きトピック・文書グラフを算出する。重要度伝搬の具体的な算出方法については後述する。   In step S <b> 13, the importance degree propagation execution unit 130 performs importance degree propagation using the inter-topic importance degree propagation probability table 131, the inter-document importance degree propagation probability table 132, and the topic-to-document importance degree propagation probability table 133. Specifically, the importance propagation execution unit 130 uses the inter-topic importance propagation probability table 131, the inter-document importance propagation probability table 132, and the topic / inter-document importance propagation probability table 133, in the topic / document graph. Calculate importance. The importance level propagation execution unit 130 calculates a topic / document graph with importance level that propagates from the topic of interest to the corresponding document based on the estimation result. A specific calculation method of importance propagation will be described later.

ステップS14において、重要度調整部140は、トピック又は文書に対する重要度の推定結果の数値を調整する重要度調整を行う。   In step S14, the importance level adjustment unit 140 performs importance level adjustment for adjusting the numerical value of the importance level estimation result for the topic or document.

ステップS15では、関連文書提示部150において、重要度調整部140により調整された重要度付きトピック・文書グラフを基に、関連文書を提示する。   In step S <b> 15, the related document presenting unit 150 presents the related document based on the topic / document graph with importance adjusted by the importance adjusting unit 140.

ステップS16では、注目トピック選択部110において、ユーザからの指示を受け付けたか否かを判別する。ユーザからの指示は、ユーザのページ閲覧動作、例えばリンクをクリックする、ボタンを押す、入力フィールドに文字を入力するなどである。ユーザからの指示を受け付けた場合は、上記ステップS12に戻って上記処理を繰り返し、ユーザからの指示を受け付けていない場合はユーザからの指示を待つ。   In step S16, the attention topic selection unit 110 determines whether or not an instruction from the user has been accepted. The instruction from the user is a user's page browsing operation, for example, clicking a link, pressing a button, or inputting a character in an input field. If an instruction from the user is accepted, the process returns to step S12 and the above process is repeated. If an instruction from the user is not accepted, the instruction from the user is waited.

図3は、トピック・文書グラフ作成部120によるトピック・文書グラフの作成例を説明する図である。図3(A)は、トピック間関係、図3(B)はトピック・文書間関係、図3(C)は文書間関係をそれぞれ示す。また、図3(D)は、上記トピック間関係、トピック・文書間関係、及び文書間関係をマージした後のトピック・文書グラフの作成例を示す。   FIG. 3 is a diagram for explaining an example of topic / document graph creation by the topic / document graph creation unit 120. 3A shows the relationship between topics, FIG. 3B shows the relationship between topics and documents, and FIG. 3C shows the relationship between documents. FIG. 3D shows an example of creating a topic / document graph after merging the above-described topic relationship, topic / document relationship, and document relationship.

なお、本図を含め後述する各図において、図中の楕円は、トピック、操作、タスク並びに節点であることを表し、図中の矩形は、文書並びにページであることを表す。楕円又は矩形を結ぶ線は、それぞれの関係を示す。   In each figure to be described later including this figure, an ellipse in the figure represents a topic, an operation, a task, and a node, and a rectangle in the figure represents a document and a page. Lines connecting ellipses or rectangles indicate the respective relationships.

図3(A)に示すトピック間関係は、トピック1乃至トピック2とトピック3の間の関係を示すものであり、トピック1とトピック3は関係TTa、トピック2とトピック3は関係TTbである。このトピック間関係は、トピック間関係DB122に蓄積される。   The relationship between topics shown in FIG. 3A indicates the relationship between topics 1 to 2 and topic 3, where topic 1 and topic 3 are relationship TTa, and topic 2 and topic 3 are relationship TTb. This inter-topic relationship is accumulated in the inter-topic relationship DB 122.

図3(B)に示すトピック・文書間関係は、文書1,2とトピック1,2間の関係を示すものである。文書1とトピック1の関係は、関係TDa、文書1とトピック2の関係は関係TDb、文書2とトピック2の関係は関係TDaである。このトピック・文書間関係は、あるトピックがある文書の主題になることを含むものとする。主題とは、文書DがトピックTについて述べているとき、TはDの主題であると表現する。本実施形態では、トピックが文書の主題となるために、文書のどのくらいの割合が、該トピックに関する記述でなければいけないかに関しては、制限はない。また、主題については、一つの文書が複数のトピックを主題として持ったり、一つのトピックが複数の文書の主題になっていたりしてもよい。トピック・文書関係はメタデータ付き文書集合DB121に蓄積される。   The topic / document relationship shown in FIG. 3B indicates the relationship between the documents 1 and 2 and the topics 1 and 2. The relationship between document 1 and topic 1 is relationship TDa, the relationship between document 1 and topic 2 is relationship TDb, and the relationship between document 2 and topic 2 is relationship TDa. This topic-document relationship includes that a topic becomes the subject of a document. A subject means that when document D describes topic T, T is the subject of D. In this embodiment, since a topic becomes the subject of a document, there is no limit as to what percentage of the document must be a description about the topic. As for the subject, one document may have a plurality of topics as a subject, or one topic may be the subject of a plurality of documents. The topic / document relationship is stored in the document set DB 121 with metadata.

図3(C)に示す文書間関係は、文書1と文書2との関係を示すものであり、文書1と文書2は関係DDaである。この文書間関係は、文書間関係DB123に蓄積される。   The inter-document relationship shown in FIG. 3C indicates the relationship between the document 1 and the document 2, and the document 1 and the document 2 are the relationship DDa. This inter-document relationship is accumulated in the inter-document relationship DB 123.

トピック・文書グラフ作成部120は、これらトピック間関係、トピック・文書間関係、及び文書間関係をマージし、トピック・文書グラフを作成する。図3(A)に示すトピック1及びトピック2は、図3(B)に示すトピック1及びトピック2に、また図3(B)に示す文書1及び文書2は、図3(C)に示す文書1及び文書2にそれぞれマージされ、図3(D)に示すトピック・文書グラフが作成される。   The topic / document graph creation unit 120 merges the topic relationship, the topic / document relationship, and the document relationship to create a topic / document graph. Topic 1 and topic 2 shown in FIG. 3 (A) are shown in topic 1 and topic 2 shown in FIG. 3 (B), and document 1 and document 2 shown in FIG. 3 (B) are shown in FIG. 3 (C). The topic / document graph shown in FIG. 3D is created by merging with document 1 and document 2 respectively.

図3(D)に示すように、作成されたトピック・文書グラフは、文書2から文書1へは関係DDaで枝が接続され、文書2からトピック2へは関係TDaで枝が接続される。図3(D)では、文書1からトピック1,2へはそれぞれ関係TDa,TDbで枝が接続される。そして、トピック1からトピック3へは関係TTaで枝が接続され、トピック2からトピック3へは関係TTbで枝が接続される。   As shown in FIG. 3D, in the created topic / document graph, branches from document 2 to document 1 are connected by a relationship DDa, and branches from document 2 to topic 2 are connected by a relationship TDa. In FIG. 3D, branches from document 1 to topics 1 and 2 are connected by relationships TDa and TDb, respectively. Then, branches from topic 1 to topic 3 are connected by the relationship TTa, and branches from topic 2 to topic 3 are connected by the relationship TTb.

次に、図4乃至図18を参照してトピック・文書グラフの具体例について説明する。   Next, a specific example of the topic / document graph will be described with reference to FIGS.

トピックは、ビデオカメラ又はDVDなどのAV機器を例に取り、例えば、「ビデオカメラHDC−***」、「DVDへのダビング」などである。   The topic is an AV device such as a video camera or a DVD, for example, “video camera HDC-***”, “dubbing to DVD”, or the like.

図4は、トピック・文書グラフの一例を説明する図である。なお、前述したように、図中の楕円は、トピック、操作、並びにタスク、並びに節点であることを表し、図中の矩形は、文書並びにページであることを表す。   FIG. 4 is a diagram for explaining an example of a topic / document graph. As described above, ellipses in the figure indicate topics, operations, tasks, and nodes, and rectangles in the figure indicate documents and pages.

図4のトピック・文書グラフは、図3(A)−(C)の各関係をマージして作成した図3(D)のトピック・文書グラフと同様の方法で作成されたものである。但し、図4では、各関係を明確にするため、経路を示す矢印の表示を変えている。すなわち、図4において、(A)トピック間関係は通常の矢印、(B)トピック・文書間関係は太ハッチング矢印、(C)文書間関係は細ハッチング矢印で表示している。後述する図5乃至図7についても同様である。   The topic / document graph in FIG. 4 is created by the same method as the topic / document graph in FIG. 3D created by merging the relationships in FIGS. However, in FIG. 4, in order to clarify each relationship, the display of the arrow indicating the route is changed. That is, in FIG. 4, (A) the relationship between topics is indicated by a normal arrow, (B) the relationship between topics and documents is indicated by a thick hatching arrow, and (C) the relationship between documents is indicated by a thin hatching arrow. The same applies to FIGS. 5 to 7 described later.

図4において、「DVDレコーダ電子マニュアル」を注目文書とする場合を例に取る。   In FIG. 4, a case where “DVD recorder electronic manual” is a document of interest is taken as an example.

「DVDレコーダ電子マニュアル」は、「DVDの互換性に関するページ」と「DVDの持ち方に関するページ」とを部分文書として持っている。ここで、部分文書とは、文書Aが文書Bに含まれる場合、文書Aは文書Bの部分文書であるという。例えば、部分文書は、文書BがWebページであり、文書Aがその中の一段落であるような場合である。ほかには、文書Bが複数のWebページからなる「マニュアル」であり、文書Aがその中の1ページを表すファイルであるように、文書間に成り立つ関係が抽象的な場合についても、部分文書という捉え方をする。   The “DVD recorder electronic manual” has “a page about DVD compatibility” and “a page about how to hold a DVD” as partial documents. Here, the partial document refers to the document A that is a partial document of the document B when the document A is included in the document B. For example, the partial document is a case where the document B is a Web page and the document A is one paragraph in the document B. In addition, even when the relationship between the documents is abstract such that the document B is a “manual” made up of a plurality of Web pages and the document A is a file representing one of the pages, the partial document I think that.

まず、「DVDの互換性に関する注意ページ」と「DVDの持ち方に関する注意ページ」は、「ご注意」を関係「文書タイプ」の値として持つ。文書タイプは、「マニュアル」「カタログ」「ご注意」「大事なお知らせ」などの文書の種類を示している。なお、ここまでが、文書間関係の説明である。   First, the “caution page regarding DVD compatibility” and the “caution page regarding how to hold a DVD” have “caution” as the value of the “document type”. The document type indicates the type of document such as “manual”, “catalog”, “attention”, “important notice”, and the like. Up to this point, the inter-document relationship has been described.

次いで、「DVDの互換性に関する注意ページ」と「DVDの持ち方に関する注意ページ」は、それぞれトピックを関係「主題」の値として持つ。ここで、主題とは、文書DがトピックTについて述べているとき、TはDの主題であるという。トピックが文書の主題となるために、文書のどのくらいの割合が、該トピックに関する記述でなければいけないかに関しては、制限はない。一つの文書が複数のトピックを主題として持ったり、一つのトピックが複数の文書の主題になっていたりしてもよい。図4の例では、「DVDの互換性に関する注意ページ」は、「DVDにハイビジョン画質で録画する」と「DVDを再生する」の2つのトピックを主題として持っている。また、「DVDの持ち方に関する注意ページ」は、「DVDを入れる」トピックを主題として持っている。なお、ここまでが、トピック・文書間関係の説明である。   Next, the “caution page regarding DVD compatibility” and the “caution page regarding how to hold a DVD” each have a topic as the value of the relationship “theme”. Here, when the document D describes the topic T, T is said to be the subject of D. There is no limit as to what percentage of a document must be a description about the topic in order for the topic to be the subject of the document. One document may have a plurality of topics as the subject, or one topic may be the subject of a plurality of documents. In the example of FIG. 4, the “DVD compatibility notice page” has two topics, “Record on DVD with high-definition image quality” and “Play DVD”. In addition, the “Caution page about how to hold a DVD” has the topic “insert DVD” as a subject. This is the end of the explanation of the topic / document relationship.

以下は、トピック間関係の説明である。トピック「DVDにハイビジョン画質で録画する」は、「DVDの互換性に関する注意ページ」の関係「主題」の値になっている一方、トピック「DVDに録画する」の下位タスクでもある。ここで、下位タスクとは、タスク1がタスク2の特殊な場合であるとき、タスク1はタスク2の下位タスクであるという。この場合、「DVDにハイビジョン画質で録画する」というタスクは、「DVDに録画する」というタスクの下位タスクである。   The following is a description of the relationship between topics. The topic “Recording on DVD with high-definition image quality” has the value of “theme” in the “caution page regarding DVD compatibility”, and is also a subordinate task of the topic “Recording on DVD”. Here, the subordinate task is said to be a subordinate task of task 2 when task 1 is a special case of task 2. In this case, the task “record on DVD with high-definition image quality” is a subordinate task of the task “record on DVD”.

「DVDにハイビジョン画質で録画する」は、関係「操作」の値として節点iを持ち、さらに関係「部分操作」の値として「DVDを入れる」タスクを持つ。ここで、操作とは、ユーザが家電に対して行う行為である。操作は、ボタンを押す、ジョグダイヤルを回すといった基本的なものから、「DVDを再生する」といったいくつかの基本的な操作の連続まで、広く「操作」と呼ぶものとする。また、部分操作とは、一連の操作を構成する部分的な操作である。「DVDを入れる」は、「DVDを再生する」の部分操作である。   “Record on DVD with high-definition image quality” has a node “i” as the value of the relation “operation”, and a “insert DVD” task as the value of the relation “partial operation”. Here, the operation is an action performed by the user on the home appliance. The operations are broadly referred to as “operations”, ranging from basic operations such as pressing a button and turning a jog dial to a series of basic operations such as “playing a DVD”. A partial operation is a partial operation that constitutes a series of operations. “Insert DVD” is a partial operation of “play DVD”.

「DVDに録画する」は、「DVD関連タスク」の下位タスクである一方、「DVDに通常画質で録画する」を下位タスクとして持っている。「DVDに通常画質で録画する」は、関係「操作」の値として節点jを持ち、さらに関係「部分操作」の値として「DVDを入れる」タスクを持つ。   “Record on DVD” is a subordinate task of “DVD-related tasks”, while “record on DVD with normal image quality” is a subordinate task. “Record on DVD with normal image quality” has a node j as the value of the relation “operation” and a task “insert DVD” as the value of the relation “partial operation”.

次に、「DVDの互換性に関する注意ページ」の主題のうち、もう一つの主題であるトピック「DVDを再生する」について説明する。「DVDを再生する」は、「DVDの互換性に関する注意ページ」の関係「主題」の値となっている一方、トピック「DVD関連タスク」の下位タスクでもある。「DVDを再生する」は、関係「操作」の値として節点kを持ち、さらに関係「部分操作」の値として「DVDを入れる」タスクを持つ。「DVDを入れる」はまた、「DVDの互換性に関する注意ページ」の関係「主題」の値にもなっている。   Next, the topic “play DVD”, which is the other subject of the “caution page regarding DVD compatibility”, will be described. “Play DVD” is a value of the “theme” relationship of “DVD compatibility caution page” and is also a subordinate task of the topic “DVD-related tasks”. “Play DVD” has a node k as the value of the relation “operation”, and further has a “insert DVD” task as the value of the relation “partial operation”. “Insert DVD” is also the value of the relationship “theme” in “Notes on DVD compatibility”.

図5は、分野オントロジーを使って記述されたトピック間関係の一例を説明する図であり、図4のトピック・文書グラフのうち、トピック間関係を抽出したものである。図4と同一構成部分には、対応する符号を付している。   FIG. 5 is a diagram for explaining an example of the relationship between topics described using the field ontology. The relationship between topics is extracted from the topic / document graph of FIG. The same components as those in FIG. 4 are denoted by corresponding reference numerals.

図6は、ドキュメントオントロジーを使って記述された文書間関係の一例を説明する図であり、図4のトピック・文書グラフのうち、文書間関係を抽出したものである。図4と同一構成部分には、対応する符号を付している。   FIG. 6 is a diagram for explaining an example of the relationship between documents described using the document ontology. The relationship between documents is extracted from the topic / document graph of FIG. The same components as those in FIG. 4 are denoted by corresponding reference numerals.

図7は、ドキュメントオントロジーを使って記述された文書間関係の一例を説明する図であり、図4のトピック・文書グラフのうち、トピック・文書間関係を抽出したものである。図4と同一構成部分には、対応する符号を付している。図7の主題は、文書がトピックについて書かれていることを表す関係として、ドキュメントオントロジーで定義する。   FIG. 7 is a diagram for explaining an example of the relationship between documents described using the document ontology. The topic / document relationship is extracted from the topic / document graph of FIG. The same components as those in FIG. 4 are denoted by corresponding reference numerals. The subject of FIG. 7 is defined by a document ontology as a relationship representing that a document is written about a topic.

次に、トピック・文書グラフの具体的な適用例について説明する。   Next, a specific application example of the topic / document graph will be described.

図8は、DVDなどの家電を対象にしたトピック・文書グラフの一例を説明する図である。図中の楕円は、トピック、操作、タスク並びに節点であることを表し、図中の矩形は、文書並びにページであることを表している。また、これらタスクやページには、重要度伝播確率表が付されている。重要度伝播確率表は、トピック又は文書が重要となる(あるいは重要とならない)確率を、トピック・文書グラフにおいて親となるトピック乃至文書の重要度の組み合わせに対する条件付確率として表した表である。他のタスクやページについても、同様の重要度伝播確率表が付されている。   FIG. 8 is a diagram for explaining an example of a topic / document graph for home appliances such as a DVD. Ellipses in the figure represent topics, operations, tasks, and nodes, and rectangles in the figure represent documents and pages. Also, an importance propagation probability table is attached to these tasks and pages. The importance propagation probability table is a table representing the probability that a topic or a document is important (or not important) as a conditional probability for a combination of the importance of a topic or a document that is a parent in a topic / document graph. Similar importance propagation probability tables are attached to other tasks and pages.

図9は、トピック・文書グラフ作成部120が実行する注目トピック又は注目文書の設定処理を示すフローチャートである。注目トピックは、ユーザが現在興味を持っていると推定されるトピックである。また、注目文書は、現在ユーザが閲覧しているであろうと推定される文書である。   FIG. 9 is a flowchart showing the setting process of the topic of interest or the document of interest executed by the topic / document graph creation unit 120. The topic of interest is a topic that is presumed that the user is currently interested. The document of interest is a document that is presumed that the user is currently browsing.

ステップS21では、直前のユーザ操作がトピックを指定しているか否かを判別する。直前のユーザ操作は、直前のシステムに対する行動(リンクをクリックする、リストから項目を選択する、入力フィールドに入力するなど)である。ここでは、家電に対する操作とは別の意味である。   In step S21, it is determined whether or not the previous user operation specifies a topic. The immediately preceding user operation is an action on the immediately preceding system (clicking a link, selecting an item from a list, inputting in an input field, etc.). Here, the meaning is different from the operation on the home appliance.

直前のユーザ操作により、トピックが直接指定された場合(質問が入力された場合など)、ステップS23では、指定されたトピックの重要度を1にするとともに、それ以外の表示中の文書の重要度を1にする。   When a topic is directly specified by the previous user operation (for example, when a question is input), in step S23, the importance of the designated topic is set to 1, and the importance of the other displayed document is displayed. Set to 1.

上記ステップS21で直前のユーザ操作がトピックを指定していない場合、ステップS22では、文書が表示中であるか否かを判別する。文書が表示中である場合、ステップS24では、表示中の文書の重要度を1にして本フローを終了する。   If the previous user operation does not specify a topic in step S21, it is determined in step S22 whether a document is being displayed. If the document is being displayed, in step S24, the importance level of the document being displayed is set to 1, and this flow ends.

文書が表示中でない場合、ステップS25では、デフォルトのトピックの重要度を1にして本フローを終了する。   If the document is not being displayed, the importance of the default topic is set to 1 in step S25, and this flow ends.

ここで、指定されたトピックが複数ある場合は、指定された各トピックの重要度を1とする。また、トピックの指定状況が推定により得られる場合は、推定結果に応じて、候補となるトピックの重要度として0〜1の値を設定する。   Here, when there are a plurality of designated topics, the importance of each designated topic is set to 1. Also, when the topic specification status is obtained by estimation, a value of 0 to 1 is set as the importance of the candidate topic according to the estimation result.

図10は、注目文書の設定例を説明する図である。図10に示すように、タスクやページには、重要度が付されている。図10は「ハイビジョン録画操作ページ」の重要度が100.0%に設定された状態を表している。   FIG. 10 is a diagram for explaining a setting example of a document of interest. As shown in FIG. 10, importance is given to tasks and pages. FIG. 10 shows a state where the importance of the “high-vision recording operation page” is set to 100.0%.

図11は、重要度伝播確率表(トピック・文書間関係)の一例を説明する図であり、図11(A)はトピック・文書間関係を示し、図11(B)はその重要度伝播確率表を示す。   FIG. 11 is a diagram for explaining an example of the importance degree propagation probability table (topic / document relationship), FIG. 11 (A) shows the topic / document relationship, and FIG. 11 (B) shows the importance degree propagation probability. A table is shown.

図11(A)に示すように、トピックと文書とは、関係「themeOf」で結ばれる。themeOfは、トピックTが文書Dの主題になっているとき、TthemeOfDとし、トピック・文書グラフにおいては、Tを表す節点から、Dを表す節点に向けて、ラベルthemeOfがついた枝を張る。図11(A)の場合、トピックが親であり、文書が子である。親は、グラフにおいて、節点Aから出て節点Bに入る有向枝があるとき、AはBの親であるといい、有向枝であれば親はいくつあってもよい。図11(B)の重要度伝播確率表(トピック・文書間関係)では、トピックが重要である/トピックが重要でない確率と、文書が重要である/文書が重要でない確率とを、親となるトピックと文書の重要度の組み合わせに対する条件付確率として表している。図11(B)の重要度伝搬確率表は、親であるトピックから、子である文書の、重要である/重要でない確率を足し合わせると1.0となる。   As shown in FIG. 11A, the topic and the document are connected by a relationship “themeOf”. The themeOf is TtheOfD when the topic T is the subject of the document D, and in the topic / document graph, a branch with the label theOfOf is stretched from the node representing T toward the node representing D. In the case of FIG. 11A, the topic is a parent and the document is a child. In the graph, when there is a directional branch that goes out from node A and enters node B in the graph, A is said to be the parent of B, and if it is a directional branch, there can be any number of parents. In the importance propagation probability table (topic / document relationship) in FIG. 11B, the probability that the topic is important / topic is not important and the probability that the document is important / document is not important are parents. It is expressed as a conditional probability for the combination of topic and document importance. The importance degree propagation probability table of FIG. 11B is 1.0 when the probabilities of importance / insignificance of a document that is a child are added from a topic that is a parent.

図12は、重要度伝播確率表(トピック・トピック間関係)の一例を説明する図であり、図12(A)はトピック・トピック間関係を示し、図12(B)はその重要度伝播確率表を示す。   FIG. 12 is a diagram for explaining an example of the importance degree propagation probability table (topic / topic relation), FIG. 12 (A) shows the topic / topic relation, and FIG. 12 (B) shows the importance degree propagation probability. A table is shown.

図12(A)に示すように、タスク1とタスク2は、関係「下位タスク」で結ばれる。下位タスクは、タスク1がタスク2の特殊な場合であるとき、タスク1はタスク2の下位タスクであるということにする。図12(A)の場合、タスク1が、親であり、タスク2が子である。図12(B)重要度伝播確率表(トピック・トピック間関係)では、タスク1が重要である/タスク1が重要でない確率と、タスク2が重要である/タスク2が重要でない確率とを、親となるトピックとトピックの重要度の組み合わせに対する条件付確率として表している。図12(B)重要度伝播確率表は、親であるタスク1から、子であるタスク2の、重要である/重要でない確率を足し合わせると1.0となる。   As shown in FIG. 12A, task 1 and task 2 are connected by the relationship “lower task”. When the task 1 is a special case of the task 2, the task 1 is assumed to be a task lower than the task 2. In the case of FIG. 12A, task 1 is a parent and task 2 is a child. In the importance propagation probability table (topic-topic relationship) in FIG. 12B, the probability that task 1 is important / task 1 is not important and the probability that task 2 is important / task 2 is not important are: It is expressed as a conditional probability for the combination of the topic and the importance of the topic. The importance propagation probability table in FIG. 12B is 1.0 when the probabilities of importance / insignificance of task 1 as a child and task 2 as a child are added.

次に、重要度伝播について、図13に示す説明図を用いて説明する。   Next, the importance level propagation will be described with reference to an explanatory diagram shown in FIG.

重要度伝播例の説明は、図8のDVDなどの家電を対象にしたトピック・文書グラフにおいて、ハイビジョン録画操作ページが注目文書とされたときの重要度伝播の例について述べる。これは、ハイビジョン録画操作、ハイビジョン録画タスク、ハイビジョン録画タスクページの重要度の計算方法の具体例である。また、重要度の伝播の計算に関しては、シミュレーションなどの手法、又はベイジアンネットワーク(Bayesian Network)における確率伝播の計算方法がある。ここでは、ベイジアンネットワークにおける確率伝播計算の方法に従うことにする。この方法で計算可能な条件としては、トピック・文書グラフがPoly Treeと呼ばれる種類のグラフになっている必要がある。そうでない場合は、シミュレーション法等の他のアルゴリズムを採る必要がある。例えば、非特許文献1に記載の方法が知られている。   The importance level propagation example will be described with respect to an example of importance level propagation when a high-definition recording operation page is set as a notable document in the topic / document graph for a home appliance such as a DVD shown in FIG. This is a specific example of a method for calculating the importance of a high-definition recording operation, a high-definition recording task, and a high-definition recording task page. Further, regarding the calculation of importance propagation, there is a method such as simulation, or a probability propagation calculation method in a Bayesian network. Here, the method of probability propagation calculation in a Bayesian network is followed. As a condition that can be calculated by this method, the topic / document graph needs to be a graph of a type called Poly Tree. If this is not the case, it is necessary to employ another algorithm such as a simulation method. For example, a method described in Non-Patent Document 1 is known.

まず、重要度伝播の説明のために、以下を定義する。   First, the following is defined to explain importance propagation.

(1)重要度ベクトルとは、(重要である確率/重要でない確率)である。重要である確率とは、重要度である。(2)メッセージとは、重要度の伝播において、節点間で交換される情報である。(3)節点に付随する伝播確率表の行列とは、節点に対応付けられた重要度伝播確率表を行列としてみなしたものをいう。(4)正規化とは、重要度ベクトルを計算する際、要素の和が1になるように調整することをいう。(5)正規化項とは、正規化のための定数である。   (1) The importance vector is (probability that is important / probability that is not important). Probability of importance is importance. (2) A message is information exchanged between nodes in the propagation of importance. (3) The matrix of the propagation probability table associated with the node means that the importance propagation probability table associated with the node is regarded as a matrix. (4) Normalization means adjusting the sum of elements to be 1 when calculating the importance vector. (5) The normalization term is a constant for normalization.

図13は、図8のトピック・文書グラフにおいて、ハイビジョン録画操作ページが注目文書である場合の説明図である。図13は、図8のトピック・文書グラフのうち、関連する部分のみを図示している。図13に示す実線矢印は、重要度ベクトルを、網掛け矢印は、親から子へのメッセージを、ハッチング矢印は、子から親へのメッセージをそれぞれ示す。また、Xnは、節点につけたIDである。このIDは、図8のトピック・文書グラフ全体を見て付したので、X2,X4,X8などと不連続になっている。   FIG. 13 is an explanatory diagram when the high-vision recording operation page is a document of interest in the topic / document graph of FIG. FIG. 13 illustrates only relevant portions of the topic / document graph of FIG. A solid line arrow shown in FIG. 13 indicates an importance vector, a shaded arrow indicates a message from a parent to a child, and a hatching arrow indicates a message from a child to a parent. Xn is an ID assigned to a node. Since this ID is attached to the entire topic / document graph of FIG. 8, it is discontinuous with X2, X4, X8, and the like.

〔X11の重要度が1と設定されたときの確率伝播によるX8の重要度の計算例〕
各節点に対して、該当節点のすべての親節点と子節点からのメッセージの成分ごとの積を正規化したベクトルを、当該節点の重要度ベクトルの値とする。
[Calculation example of importance of X8 by probability propagation when importance of X11 is set to 1]
For each node, a vector obtained by normalizing the products of the message components from all the parent nodes and child nodes of the corresponding node is set as the importance vector value of the node.

X8の重要度ベクトルは、X4からX8へのメッセージと、X11からX8へのメッセージの成分ごとの積を正規化したものとなる。   The importance vector of X8 is obtained by normalizing the product for each component of the message from X4 to X8 and the message from X11 to X8.

注目トピック/文書として重要度が設定される節点が、X11のみの場合、X11の重要度ベクトルを(1.0 0.0)に設定すると、X4からX8に対して、初期状態でX4からX8に送られるメッセージと等しいメッセージが送られる。これを、ここでは(35.8 64.2)とする。   When the node whose importance is set as the topic / document of interest is only X11, when the importance vector of X11 is set to (1.0 0.0), X4 to X8 in the initial state with respect to X4 to X8 A message equal to the message sent to is sent. This is (35.8 64.2) here.

また、このときX11からX8には、X11に付与されている重要度伝播確率表の「X11が重要である」となっている行、すなわち次式(1)で求めた(0.9 0.1)がメッセージとして送られる。
(1.0 0.0)*(0.9 0.1)=(0.9 0.1) …(1)
Further, at this time, X11 to X8 are obtained from the row where “X11 is important” in the importance propagation probability table assigned to X11, that is, the following equation (1) (0.9 0. 1) is sent as a message.
(1.0 0.0) * (0.9 0.1) = (0.9 0.1) (1)

これにより、X8の重要度ベクトルは、次式(2)で求めた値を正規化した(0.834 0.166)となる。   As a result, the importance vector of X8 is normalized (0.834 0.166) by the value obtained by the following equation (2).

(35.8 64.2)*(0.9 0.1)=(32.22 6.42) …(2)
したがって、X8の重要度は、正規化して0.834 (=83.4%)となる。
(35.8 64.2) * (0.9 0.1) = (32.22 6.42) (2)
Therefore, the importance of X8 is normalized to be 0.834 (= 83.4%).

〔X11の重要度が1と設定されたときの確率伝播によるX4の重要度の計算例〕
このとき、X8からX4には、X8に付随する確率表の行列に、X11からX8に送られたメッセージ(0.9 0.1)を左から掛けたメッセージ(0.74 0.14)が送られる。すなわち、X11からX8に送られるメッセージは、次式(3)で求められる。
[Calculation example of importance of X4 by probability propagation when importance of X11 is set to 1]
At this time, a message (0.74 0.14) obtained by multiplying the matrix of the probability table associated with X8 by the message (0.9 0.1) sent from X11 to X8 from the left is assigned to X8 to X4. Sent. That is, the message sent from X11 to X8 is obtained by the following equation (3).

Figure 2009217724
また、このとき、X2からX4へは初期状態におけるX2からX4へのメッセージと等しいメッセージが送られている。いま、このメッセージを(0.411 0.589)とする。
Figure 2009217724
At this time, a message equal to the message from X2 to X4 in the initial state is sent from X2 to X4. Now, let this message be (0.411 0.589).

また、X7からX4へのメッセージは、(1.0 1.0)が送られている。   Also, (1.0 1.0) is sent as the message from X7 to X4.

これにより、X4の重要度ベクトルは、次式(4)で求められる。   Thereby, the importance vector of X4 is calculated | required by following Formula (4).

(0.74 0.14)*(0.411 0.589)*(1.0 1.0)=(0.304 0.082) …(4)
X4の重要度は、正規化することにより(0.787 0.213)が求められる。
(0.74 0.14) * (0.411 0.589) * (1.0 1.0) = (0.304 0.082) (4)
The importance of X4 is obtained as (0.787 0.213) by normalization.

〔X11の重要度が1と設定されたときの確率伝播によるX7の重要度の計算例〕
X4からX7へのメッセージは、X2からX4へのメッセージ(0.411 0.589)と、X8からX4へのメッセージ(0.74 0.14)を成分ごとに掛けた(0.304 0.082)が、X4からX7へのメッセージとして送られる。
[Calculation example of importance of X7 by probability propagation when importance of X11 is set to 1]
The message from X4 to X7 is obtained by multiplying the message from X2 to X4 (0.411 0.589) and the message from X8 to X4 (0.74 0.14) for each component (0.304 0. 082) is sent as a message from X4 to X7.

Figure 2009217724
X7は葉節点(子を持たない節点)であるので、X7の重要度ベクトルは、X4からX7(0.304 0.082)にX7に付随する伝播確率表の行列に左から掛けて、正規化したものである。すなわち、X7の重要度ベクトルは、次式(5)のように(0.282 0.105)となる。X7の重要度ベクトルは、正規化することにより(0.729 0.271)となり、X7の重要度は、0.729(72.9%)となる。
Figure 2009217724
Since X7 is a leaf node (a node having no children), the importance vector of X7 is normalized by multiplying the matrix of the propagation probability table associated with X7 from X4 to X7 (0.304 0.082) from the left. It has become. That is, the importance vector of X7 is (0.282 0.105) as shown in the following equation (5). The importance vector of X7 becomes (0.729 0.271) by normalization, and the importance of X7 becomes 0.729 (72.9%).

図14は、図8のトピック・文書グラフの初期状態を説明する図である。   FIG. 14 is a diagram for explaining an initial state of the topic / document graph of FIG.

前述したように、初期状態とは、注目トピック又は注目文書が与えられていない状態である。換言すれば、システム的にユーザが何も注目していない状態である。また、注目トピックは、現在ユーザが興味を持っているであろうと推定されるトピックである。ユーザが入力フィールドに入力したり、トピックリストから選んだりすることにより推定される。注目文書は、現在ユーザが閲覧しているであろうと推定される文書である。   As described above, the initial state is a state in which an attention topic or an attention document is not given. In other words, the user is not paying attention to the system. Also, the topic of interest is a topic that is presumed that the user is currently interested. It is estimated by the user inputting in the input field or selecting from the topic list. The document of interest is a document that is estimated to be viewed by the user at present.

図14に示す初期状態のトピック・文書グラフは、図8のトピック・文書グラフと、トピック間関係、文書間関係、及びトピック・文書間関係、並びにこれらの関係を記述するトピック、操作、タスク、節点、枝、経路、文書、ページなどは同一である。   The topic / document graph in the initial state shown in FIG. 14 is the same as the topic / document graph of FIG. 8, the topic relationship, the document relationship, the topic / document relationship, and the topic, operation, task, Nodes, branches, paths, documents, pages, etc. are the same.

図15及び図16は、図8のトピック・文書グラフの重要度伝播結果を説明する図である。図15は、図8のトピック・文書グラフにおいて、「ハイビジョン録画操作ページ」を注目文書とした場合の重要度伝播結果を示す。また、図16は、図8のトピック・文書グラフにおいて、「DVD挿入操作ページ」を注目文書とした場合の重要度伝播結果を示す。次に、トピック・文書グラフにおいて、注目文書が変わると、同じトピック・文書グラフであっても重要度伝播結果が変化することを説明する。   15 and 16 are diagrams for explaining the importance level propagation results of the topic / document graph of FIG. FIG. 15 shows the importance level propagation result when “high-vision recording operation page” is the document of interest in the topic / document graph of FIG. FIG. 16 shows the importance level propagation result when “DVD insertion operation page” is the document of interest in the topic / document graph of FIG. Next, it will be described that when the document of interest changes in the topic / document graph, the importance propagation result changes even in the same topic / document graph.

図15において、トピック・文書グラフの文書のうち、注目文書以外で重要度が60.0%以上となっているものをブロックで囲み、これらを関連文書と呼ぶことにする。この関連文書が、ユーザに提示されることになる。   In FIG. 15, among the documents in the topic / document graph, those other than the document of interest that have an importance of 60.0% or more are enclosed in blocks, and these are referred to as related documents. This related document will be presented to the user.

「ハイビジョン録画操作ページ」を、現在ユーザが閲覧しているであろうと推定される注目文書とする。「ハイビジョン録画操作ページ」を、注目文書とした場合、重要度伝播実行部130(図1)が、「ハイビジョン録画操作ページ」の重要度を、100.0%とする。例えば、図8及び図14の初期状態のトピック・文書グラフの「ハイビジョン録画操作ページ」の重要度38.7%を、図15の「ハイビジョン録画操作ページ」のように重要度100.0%とする。これを初期値として重要度の伝播が実行される。重要度伝播の具体的方法については、図13により詳細に説明した。重要度の伝播の計算に関しては、シミュレーションなどの手法を用いてもよいし、ベイジアンネットワークにおける確率伝播の計算方法を用いてもよい。これにより、図15のトピック・文書グラフの重要度伝播例の関連文書は、「DVD関連タスクページ」、「DVD録画タスクページ」、「ハイビジョン録画タスクページ」、「互換性に関する注意ページ」及び「DVDの持ち方に関する注意ページ」となる。   The “high-definition recording operation page” is a document of interest that is estimated to be viewed by the user at present. When the “high-vision recording operation page” is the document of interest, the importance level propagation execution unit 130 (FIG. 1) sets the importance level of the “high-vision recording operation page” to 100.0%. For example, the importance level of 38.7% of the “high-definition recording operation page” of the topic / document graph in the initial state of FIGS. 8 and 14 is 100.0% as shown in the “high-vision recording operation page” of FIG. To do. Importance of importance is executed with this as an initial value. The specific method of importance propagation has been described in detail with reference to FIG. For calculation of importance propagation, a method such as simulation may be used, or a probability propagation calculation method in a Bayesian network may be used. Accordingly, the related documents of the importance propagation example of the topic / document graph of FIG. 15 are “DVD related task page”, “DVD recording task page”, “Hi-vision recording task page”, “compatibility caution page”, and “ “Notes on how to hold a DVD”.

例えば、図8及び図14の初期状態のトピック・文書グラフの「ハイビジョン録画タスクページ」の重要度は、42.9%であったが、重要度伝播実行部130(図1)による重要度伝播の結果72.9%となる。他の文書についても同様に、重要度が計算される。   For example, the importance level of the “high-definition recording task page” in the topic / document graph in the initial state of FIGS. 8 and 14 is 42.9%, but the importance level propagation by the importance level propagation execution unit 130 (FIG. 1). The result is 72.9%. Similarly, the importance is calculated for other documents.

図16において、トピック・文書グラフの文書のうち、注目文書以外で重要度が60.0%以上のものをブロックで囲み、関連文書と呼ぶことにする。   In FIG. 16, among the documents in the topic / document graph, those other than the document of interest with an importance of 60.0% or more are surrounded by blocks and referred to as related documents.

図15のトピック・文書グラフの重要度伝播例では、「ハイビジョン録画操作ページ」を注目文書としていたが、図16の重要度伝播例では、「DVD挿入操作ページ」を注目文書とする。   In the importance level propagation example of the topic / document graph in FIG. 15, the “high-definition recording operation page” is the target document. However, in the importance level propagation example of FIG. 16, the “DVD insertion operation page” is the target document.

「DVD挿入操作ページ」を、注目文書とした場合、重要度伝播実行部130は、「DVD挿入操作ページ」の重要度を、100.0%とする。例えば、図8及び図14の初期状態のトピック・文書グラフの「DVD挿入操作ページ」の重要度63.9%を、100.0%とする。これを初期値として重要度の伝播が実行される。その結果、図16のトピック・文書グラフの重要度伝播例の場合、関連文書は、「DVD関連タスクページ」「DVD録画タスクページ」、「DVD再生タスクページ」、「互換性に関する注意ページ」及び「DVDの持ち方に関する注意ページ」となる。これは、前記図15のトピック・文書グラフの重要度伝播例の場合のb.関連文書と一部内容が異なる。すなわち、前記図15のトピック・文書グラフの重要度伝播例の場合、関連文書であった「ハイビジョン録画タスクページ」の代わりに図16のトピック・文書グラフの重要度伝播例の場合では、「DVD再生タスクページ」が関連文書となる。   When the “DVD insertion operation page” is the document of interest, the importance propagation execution unit 130 sets the importance of the “DVD insertion operation page” to 100.0%. For example, the importance 63.9% of the “DVD insertion operation page” in the topic / document graph in the initial state of FIGS. 8 and 14 is set to 100.0%. Importance of importance is executed with this as an initial value. As a result, in the case of the importance propagation example of the topic / document graph in FIG. 16, the related documents are “DVD related task page”, “DVD recording task page”, “DVD playback task page”, “compatibility note page”, and This is a “Caution page about how to hold a DVD”. This is because b. In the case of the importance propagation example of the topic / document graph of FIG. Some contents are different from related documents. That is, in the case of the importance level propagation example of the topic / document graph of FIG. 15, in the case of the importance level propagation example of the topic / document graph of FIG. The “reproduction task page” becomes the related document.

図15と図16を比較して関連文書提示を具体的に説明する。   The related document presentation will be specifically described by comparing FIG. 15 and FIG.

図15に示すように、注目文書が「ハイビジョン録画操作ページ」である場合には、重要度の伝播により「DVD録画」と「ハイビジョン録画」に関連するページが関連文書となる。また、「互換性に関する注意」と「DVD操作」に関連するページも関連文書となる。   As shown in FIG. 15, when the document of interest is a “high-definition recording operation page”, pages related to “DVD recording” and “high-definition recording” become related documents due to the propagation of importance. In addition, pages related to “note regarding compatibility” and “DVD operation” are also related documents.

図16に示すように、注目文書が「DVD挿入操作ページ」に変更された場合には、重要度の伝播の再計算により「DVD操作」と「DVD再生」に関連するページが関連文書となる。また、「互換性に関する注意」と「DVD録画」に関連するページも関連文書となる。図15で注目文書であった「ハイビジョン録画操作ページ」と関連文書であった「ハイビジョン録画タスクページ」は、関連文書ではなくなる。   As shown in FIG. 16, when the document of interest is changed to “DVD insertion operation page”, the pages related to “DVD operation” and “DVD playback” become related documents by recalculation of the propagation of importance. . In addition, pages related to “notes regarding compatibility” and “DVD recording” are also related documents. In FIG. 15, the “high-definition recording operation page” that is the noticed document and the “high-definition recording task page” that is the related document are not related documents.

ここで、本実施の形態では、重要度伝播実行部130により、重要度伝播の結果として、図15及び図16に示すトピック/文書の重要度が算出された場合、算出された重要度が、所定の閾値(ここでは60.0%)以上のものを関連文書としている。この関連文書が、ユーザに提示されることになる。算出された重要度に基づいて関連文書を判定する上記閾値は、一例であり任意に設定できることは言うまでもない。また、判定に用いられる閾値は、ユーザの履歴、その他の利用状況に応じて、動的に変更するようにしてもよい。例えば、トピック・文書グラフにおいて、関連文書が、所定以上多く選択されてしまうような場合は、ユーザに有効な関連文書を提示する効果が少なくなることが考えられる。この場合は、上記閾値を上げることで、より重要な関連文書が、ユーザに提示されるようになる。   Here, in the present embodiment, when the importance propagation execution unit 130 calculates the importance of the topic / document shown in FIGS. 15 and 16 as a result of the importance propagation, the calculated importance is: Documents with a predetermined threshold value (here 60.0%) or more are used as related documents. This related document will be presented to the user. It goes without saying that the above threshold value for determining a related document based on the calculated importance is an example and can be arbitrarily set. Further, the threshold used for the determination may be dynamically changed according to the user's history and other usage situations. For example, when a related document is selected more than a predetermined number in a topic / document graph, it is conceivable that the effect of presenting an effective related document to the user is reduced. In this case, by raising the threshold value, a more important related document is presented to the user.

本実施の形態では、注目文書を設定することをトリガとして、トピック・文書グラフの重要度を変える例を示したが、トピック・文書グラフの重要度を、注目文書の設定とは連携させずに変える態様でもよい。   In the present embodiment, an example of changing the importance of a topic / document graph using the setting of a document of interest as a trigger has been shown. However, the importance of a topic / document graph is not linked to the setting of a document of interest. It may be changed.

また、過去の注目文書/トピックに関する重要度を残しておいてもよい。   In addition, the importance regarding the past attention document / topic may be left.

次に、重要度調整部140の重要度調整処理について説明する。   Next, the importance level adjustment process of the importance level adjustment unit 140 will be described.

まず、重要度調整の背景にある考え方について述べる。   First, the concept behind the importance adjustment is described.

ユーザがトピックを選択する際に、選択肢となるトピック群とグラフ構造において特定の関係にある文書は、選択に影響を与える重要な情報を含んでいる。また、別の関係にある文書は、選択に影響を与える情報を含んでいない。また、ユーザの選択に影響を与える文書は、そうでない文書より優先して提示されるべきである。   When a user selects a topic, a document having a specific relationship in a graph structure with a topic group as an option includes important information that affects the selection. Also, documents in different relationships do not contain information that affects selection. Also, documents that affect user selection should be presented in preference to documents that are not.

図17は、重要度調整部140による重要度調整を説明する図である。図中、○印はトピック、ハッチングの○印は注目トピック、ブロックは文書、ハッチングのブロックは有効範囲にある文書である。   FIG. 17 is a diagram for explaining importance adjustment by the importance adjustment unit 140. In the figure, a circle indicates a topic, a hatched circle indicates a topic of interest, a block indicates a document, and a hatched block indicates a document in an effective range.

分岐節点は、グラフにおいて、節点Aから出て節点Bに入るラベルRを持つ有向枝E1があり、かつ、節点Aから出て節点Cに入るラベルRを持つ有向枝E2があるとき、節点Aは、E1やE2を含む経路における分岐節点となる。本実施の形態の分岐節点は、一つ超えてもよいが二つ以上超えるときは重要度を下げることとする。   In the graph, when there is a directional branch E1 having a label R exiting from the node A and entering the node B and a directional branch E2 having a label R exiting from the node A and entering the node C in the graph, The node A becomes a branch node in a route including E1 and E2. The number of branch nodes in the present embodiment may exceed one, but the importance is lowered when it exceeds two or more.

各文書から注目トピック又は注目文書に至るまでに、分岐節点を2つ以上通過しなければならないなら、該当文書の重要度をC(Cは0以上、1未満の定数)倍する。   If two or more branch nodes must be passed from each document to the topic of interest or the document of interest, the importance of the document is multiplied by C (C is a constant greater than or equal to 0 and less than 1).

経路Pに含まれる枝E(X,Y)において、Eに対応する関係Rに関して、Xの兄弟であるようなYの子節点で、自身を含め子孫に文書が付随している節点がある場合に、Yは、経路Pにおける分岐節点であるとする。兄弟は、グラフにおいて、節点Aから、節点B,Cのそれぞれに有向枝があるとき、BとCは兄弟であるという。また、子孫は、グラフにおいて、節点Aから、いくつかの有向枝を枝の向きにしたがってたどることにより、節点Bに至ることができる場合、節点Bは節点Aの子孫であるという。   In the branch E (X, Y) included in the path P, with respect to the relation R corresponding to E, there is a child node of Y that is a sibling of X, and a node with a document attached to its descendants including itself In addition, Y is a branch node in the path P. Siblings are said to be siblings when there are directional branches from node A to each of nodes B and C in the graph. Also, if a descendant can reach node B by following some directed branches from node A in the graph according to the direction of the branch, node B is said to be a descendant of node A.

図17(A)において、トピックT1とトピックT2,T3,T4の間の関係がR1である場合、トピックT1は分岐節点となるが、文書A,Bは、共に分岐節点を一つしか超えていないので有効範囲に含まれる。   In FIG. 17A, when the relationship between the topic T1 and the topics T2, T3, and T4 is R1, the topic T1 is a branch node, but the documents A and B both exceed only one branch node. Because it is not included in the effective range.

図17(B)において、トピックT1とT2,T3との間の関係がR1、トピックT3とT4,T5との間の関係がR2ある場合、トピックT1,T3が分岐節点となる。文書Aは、分岐節点を一つしか超えていないので有効範囲に含まれるが、文書Bは、分岐節点を二つ超えるので有効範囲に含まれない。   In FIG. 17B, when the relationship between the topics T1 and T2 and T3 is R1, and the relationship between the topics T3 and T4 and T5 is R2, the topics T1 and T3 are branch nodes. Document A is included in the effective range because it exceeds only one branch node, but document B is not included in the effective range because it exceeds two branch nodes.

また、全部に関連する文書は、重要度を低くするようにしてもよい。例えば、図17(A)で文書AがトピックT2,T3,T4のすべてに関連していれば、その重要度を0.3倍するようにしてもよい。   Further, the document related to all may be made less important. For example, if the document A is related to all of the topics T2, T3, and T4 in FIG. 17A, the importance may be increased by 0.3.

図18は、図8のトピック・文書グラフの重要度の調整を説明する図である。   FIG. 18 is a diagram for explaining the adjustment of the importance of the topic / document graph of FIG.

図18において、トピック・文書グラフの文書のうち、注目文書以外で重要度が60.0%以上となるものをブロックで囲み、これらを関連文書と呼ぶことにする。また、分岐節点は、太実線楕円で表し、注目している有向枝は、太実線で表している。   In FIG. 18, among the documents in the topic / document graph, those other than the document of interest that have an importance of 60.0% or more are enclosed in blocks, and these are referred to as related documents. Further, the branch node is represented by a thick solid line ellipse, and the directed branch of interest is represented by a thick solid line.

「DVD録画タスクページ」を、現在ユーザが閲覧しているであろうと推定される注目文書とする。「DVD録画タスクページ」を、注目文書とした場合、重要度伝播実行部130が、「DVD録画タスクページ」の重要度を、100.0%とする。これによる重要度の伝播の結果、関連文書が判定される。図18のトピック・文書グラフの重要度伝播例の場合、関連文書は、「互換性に関する注意ページ」及び「DVDの持ち方に関する注意ページ」である。   The “DVD recording task page” is a document of interest estimated to be viewed by the user at present. When the “DVD recording task page” is the document of interest, the importance propagation executing unit 130 sets the importance of the “DVD recording task page” to 100.0%. As a result of the propagation of importance, related documents are determined. In the case of the importance propagation example of the topic / document graph of FIG. 18, the related documents are “a caution page regarding compatibility” and “a caution page regarding how to hold a DVD”.

「DVD録画タスク」は、分岐節点である。また、図には示さないが、他に部分操作があると仮定すると、「DVD挿入操作」も分岐節点となる。   The “DVD recording task” is a branch node. Although not shown in the figure, assuming that there are other partial operations, the “DVD insertion operation” is also a branch node.

重要度調整部140は、重要度付きトピック・文書グラフに対して重要度調整を行う。   The importance level adjustment unit 140 adjusts the importance level for the topic / document graph with importance.

関連文書である「互換性に関する注意ページ」は、分岐は一つしか超えていないので、重要度は据え置く。もう一つの関連文書である「DVDの持ち方に関する注意ページ」は、分岐節点を二つ超えており、有効範囲に入っていないので、この重要度を0.3倍する。   Since the related document “compatibility note page” has only one branch, the importance is left unchanged. Another related document, “Caution on how to hold a DVD”, exceeds two branch nodes and is not within the valid range, so this importance is multiplied by 0.3.

このように、重要度調整部140は、分岐節点を二つ以上超える場合に、重要度を下げる調整を行う。これにより、ユーザの目下の選択に影響を及ぼさない節点の重要度は低く調整される。   As described above, the importance level adjustment unit 140 performs adjustment to lower the importance level when two or more branch nodes are exceeded. As a result, the importance of the nodes that do not affect the current selection of the user is adjusted to be low.

図19及び図20は、関連文書推定装置100による関連文書表示画面の例を示す図であり、図示しない通信インターフェース等を介してインターネットに接続されたブラウザの表示例である。   19 and 20 are diagrams showing examples of related document display screens by the related document estimation apparatus 100, which are display examples of a browser connected to the Internet via a communication interface (not shown).

図19及び図20において、関連文書推定装置100の関連文書提示部150は、表示装置(図示略)を有し、表示装置の表示画面200に関連文書などの各種情報を表示する。表示画面200には、画面右半分にユーザが閲覧中の任意のWebページである注目文書210、画面左半分に推定された関連文書へのリンク集220及び、その上部にユーザが直接トピックを指定するための質問入力ボックス230が表示される。   19 and 20, the related document presentation unit 150 of the related document estimation apparatus 100 has a display device (not shown), and displays various information such as related documents on the display screen 200 of the display device. On the display screen 200, the target document 210, which is an arbitrary web page that the user is browsing on the right half of the screen, the link collection 220 to the related document estimated on the left half of the screen, and the user directly specifies the topic at the top A question input box 230 is displayed.

推定された関連文書へのリンク集220は、システムにより関連文書と推定された文書へのハイパーリンクの集まりとする。図19の注目文書210は、ハイビジョンビデオカメラページであるため、推定された関連文書へのリンク集220は、ビデオカメラ操作(例えば、撮る、見る、ダビングする、編集するなど)に関連する関連文書となっている。   The link collection 220 to the estimated related documents is a collection of hyperlinks to the documents estimated as related documents by the system. Since the document of interest 210 in FIG. 19 is a high-definition video camera page, the links 220 to the estimated related documents are related documents related to video camera operations (eg, taking, viewing, dubbing, editing, etc.). It has become.

また、図20の注目文書210は、ハイビジョン録画操作に関するページであるため、推定された関連文書へのリンク集220は、DVDの使用(例えば、DVDに録画する、ハイビジョンでDVDに録画する、DVDの互換性、DVDの入れ方、DVDの持ち方など)に関連する関連文書となっている。これら関連文書は、重要度伝播の結果として算出された重要度が、所定の閾値(例えば60.0%)以上のものである。したがって、ユーザが、注目トピックを任意に選択することにより、ユーザの意向に沿った関連文書が提示されることになる。   20 is a page related to a high-definition video recording operation, the link collection 220 to the estimated related document is used for DVD (for example, recording to DVD, recording to DVD with high-definition, DVD Compatibility, DVD insertion, DVD holding, etc.). In these related documents, the importance calculated as a result of the importance propagation is higher than a predetermined threshold (for example, 60.0%). Therefore, when the user arbitrarily selects a topic of interest, a related document in accordance with the user's intention is presented.

推定された関連文書へのリンク集220は、表示画面200の左側に表示され、ブラウザのプラグインにより生成される。また、リンク文字列は、ハイパーリンクにつけられた文字列である。典型的には、その文字が表示されている箇所をクリックすることにより、該当ハイパーリンクによって結び付けられている文書が表示される。   The link collection 220 to the estimated related document is displayed on the left side of the display screen 200 and is generated by a browser plug-in. The link character string is a character string attached to the hyperlink. Typically, a document linked by a corresponding hyperlink is displayed by clicking on a place where the character is displayed.

ユーザは、質問入力ボックス230に質問事項を入力し実行ボタン230aをクリックすることで直接トピックを指定することができる。   The user can directly specify a topic by inputting a question item in the question input box 230 and clicking the execution button 230a.

推定された関連文書へのリンク集220において、重要な関連文書は、色を変える/太文字にするなどで強調表示され、特に注意すべき項目(図19の「DVDの互換性について」は「ご注意」マークが表示されている。図19の場合は、「SDカードの互換性について」、「DVDの互換性について」が、また図20の場合は、「DVDの互換性に関するご注意」「DVDの持ち方に関するご注意」が、それぞれ強調表示されている。   In the link collection 220 to the estimated related document, the important related document is highlighted by changing a color / bold font or the like, and an item to be particularly noted (“DVD compatibility” in FIG. 19 is “ “Note” mark is displayed, in the case of FIG. 19, “SD card compatibility” and “DVD compatibility”, and in the case of FIG. “Notes on how to hold a DVD” is highlighted.

図21は、関連文書の提示時のリンク文字列を示す図である。   FIG. 21 is a diagram showing a link character string when a related document is presented.

図21に示すように、トピック・文書グラフのページは、メタデータ(title)の値が表示画面200でのリンク文字列として使用される。例えば、図18のトピック・文書グラフの「DVDの互換性に関する注意ページ」は、title“DVDの互換性に関するご注意”のリンク文字列となる。   As shown in FIG. 21, the value of metadata (title) is used as a link character string on the display screen 200 for the topic / document graph page. For example, the “caution page regarding DVD compatibility” in the topic / document graph of FIG. 18 is a link character string of the title “note regarding DVD compatibility”.

このように、関連文書を提示する際には、文書に対してメタデータ(title)の値として付けられている文字列をリンク文字列として使用する。   In this way, when presenting a related document, a character string attached as a metadata (title) value to the document is used as a link character string.

図1乃至図18で詳述した関連文書の提示結果が、図19及び図20の表示画面200の推定された関連文書へのリンク集220に反映される。   The related document presentation results described in detail with reference to FIGS. 1 to 18 are reflected in the link collection 220 to the estimated related documents on the display screen 200 of FIGS. 19 and 20.

図22は、重要度伝播確率表の合成例を説明する図である。図22(A)は、Zの親がXだけの時の重要度伝播確率表を、図22(B)は、Zの親がYだけの時の重要度伝播確率表を、図22(C)は、Zの親がX,Yの時の重要度伝播確率表をそれぞれ示している。   FIG. 22 is a diagram for explaining a synthesis example of the importance propagation probability table. 22A shows an importance propagation probability table when Z has only X parents, and FIG. 22B shows an importance propagation probability table when Z has only Y parents. FIG. ) Shows the importance propagation probability tables when the parents of Z are X and Y, respectively.

確率は、次式(5)に従って求める。   The probability is obtained according to the following equation (5).

p(z=非重要|X,Y)=p(z=非重要|X)×p(z=非重要|Y)
p(z=重要|X,Y)=1−p(z=非重要|X,Y) …(5)
図22(A)に示すZの親がYだけの時の重要度伝播確率表と、図22(B)に示すZの親がXだけの時の重要度伝播確率表とを合成する場合、子が重要となる条件付確率は、それぞれの親の値に対して、子が重要となる条件付確率をすべて掛けたものとする。また、子が重要となる条件付確率は、それを1から引いたものとする。
p (z = non-important | X, Y) = p (z = non-important | X) × p (z = non-important | Y)
p (z = important | X, Y) = 1-p (z = non-important | X, Y) (5)
When the importance propagation probability table when the parent of Z is only Y shown in FIG. 22A and the importance propagation probability table when the parent of Z is only X shown in FIG. The conditional probability that the child is important is obtained by multiplying each parent value by the conditional probability that the child is important. In addition, the conditional probability that the child is important is obtained by subtracting it from 1.

以上詳細に説明したように、関連文書推定装置100は、トピック・文書グラフにおいて、隣接するトピック又は文書の重要度の伝播確率を表す重要度伝播確率表131〜133を有する。重要度伝播実行部130は、重要度伝播確率表131〜133を用いて、トピック・文書グラフにおける重要度の伝播を行う。これにより、重要度伝播実行部130は、トピック・文書グラフにおけるトピック及び文書の重要度を算出し、重要度の算出結果をトピック及び文書に付与した重要度付きトピック・文書グラフを生成する。重要度調整部140は、トピック又は文書に対する重要度の算出結果の数値を調整する。そして、関連文書提示部150は、調整された重要度付きトピック・文書グラフに基づいて、関連文書へのリンク集220を表示画面200に提示する。これにより、有効なリンク集がユーザに提示される。この場合、従来例のように、多様なグラフ構造を予測して十分なパタンを記述したり、タスクから操作、操作から部分操作、部分操作から注意に至る経路をあらかじめ予測して記述しておく必要はない。   As described in detail above, the related document estimation device 100 includes the importance degree propagation probability tables 131 to 133 that represent the propagation probability of the importance degree of the adjacent topic or document in the topic / document graph. The importance degree propagation execution unit 130 propagates the importance degree in the topic / document graph using the importance degree propagation probability tables 131 to 133. Accordingly, the importance propagation execution unit 130 calculates the importance of the topic and the document in the topic / document graph, and generates a topic / document graph with the importance obtained by assigning the calculation result of the importance to the topic and the document. The importance level adjustment unit 140 adjusts the numerical value of the importance level calculation result for the topic or document. Then, the related document presentation unit 150 presents a link collection 220 to the related document on the display screen 200 based on the adjusted topic / document graph with importance. Thereby, an effective collection of links is presented to the user. In this case, as in the conventional example, a variety of graph structures are predicted and sufficient patterns are described, or a route from a task to an operation, an operation to a partial operation, and a partial operation to attention is predicted and described in advance. There is no need.

また、ページ間のリンクによる遷移ではないため、ユーザは確実に所望の関連文書に到達することができる。さらに、求める情報がどこにあるか分からない場合や、リンク先に求める情報が含まれているかどうか事前には分からない場合であっても関連文書を見つけることができる。   Further, since it is not a transition due to a link between pages, the user can surely reach a desired related document. Furthermore, it is possible to find a related document even when it is not known where the requested information is, or when it is not known in advance whether or not the requested information is included in the link destination.

このように、本発明は、各ノードが重要であるとされる確率が、伝播され、算出された重要度付きトピック・文書グラフに基づいて、関連文書を提示することにより、分野知識や文書間の構造の知識をもたないユーザでも関連文書を容易に見つけることができるという優れた効果がある。   In this way, the present invention presents related documents based on the topic / document graph with importance, in which the probabilities that each node is important are propagated and calculated. There is an excellent effect that even a user who does not have knowledge of the structure can easily find a related document.

以上の説明は、本発明の好適な実施の形態の例証であり、本発明の範囲はこれに限定されることはない。例えば、本実施の形態では、家電の関連文書の提示について説明したが、ユーザに提示する関連文書を推定する装置及び方法であればよく、関連文書の種類は限定されるものではない。   The above description is an illustration of a preferred embodiment of the present invention, and the scope of the present invention is not limited to this. For example, in the present embodiment, presentation of a related document for home appliances has been described. However, any device and method for estimating a related document to be presented to a user may be used, and the type of related document is not limited.

また、本実施の形態では関連文書推定装置、及び関連文書推定方法という名称を用いたが、これは説明の便宜上であり、関連文書推定装置は関連文書表示装置や情報提示装置、関連文書推定方法は関連文書表示方法等であってもよいことは勿論である。   In the present embodiment, the names of the related document estimation device and the related document estimation method are used. However, this is for convenience of explanation, and the related document estimation device includes a related document display device, an information presentation device, and a related document estimation method. Of course, the related document display method may be used.

さらに、上記関連文書推定装置及び方法を構成する各部、例えば関連文書提示部、DBの種類、その数及び接続方法などはどのようなものでもよい。   Furthermore, each part which comprises the said related document estimation apparatus and method, for example, a related document presentation part, the kind of DB, the number, the connection method, etc. may be what.

以上説明した関連文書推定装置及び関連文書推定方法は、この関連文書推定方法を機能させるためのプログラムでも実現される。このプログラムはコンピュータで読み取り可能な記録媒体に格納されている。   The related document estimation device and the related document estimation method described above are also realized by a program for causing the related document estimation method to function. This program is stored in a computer-readable recording medium.

本発明に係る関連文書推定装置は、分野知識や文書間の構造の知識をもたないユーザでも関連文書を容易に見つけることができるので、家電を始めとする各種製品のマニュアル等を提供する企業、又は行政サービスのWebページなどに適用することができる。   The related document estimation apparatus according to the present invention can easily find related documents even by users who do not have knowledge of the field or the structure between documents. It can also be applied to Web pages for administrative services.

本発明の実施の形態の関連文書推定装置の構成を示す図The figure which shows the structure of the related document estimation apparatus of embodiment of this invention. 上記実施の形態に係る関連文書推定装置の全体動作を示すフロー図The flowchart which shows the whole operation | movement of the related document estimation apparatus which concerns on the said embodiment. 上記実施の形態に係る関連文書推定装置のトピック・文書グラフ作成部によるトピック・文書グラフの作成例を説明する図The figure explaining the example of creation of the topic / document graph by the topic / document graph creation unit of the related document estimation apparatus according to the above embodiment 上記実施の形態に係る関連文書推定装置のトピック・文書グラフの一例を説明する図The figure explaining an example of the topic and document graph of the related document estimation apparatus which concerns on the said embodiment 上記実施の形態に係る関連文書推定装置の分野オントロジーを使って記述されたトピック間関係の一例を説明する図The figure explaining an example of the relationship between the topics described using the field ontology of the related document estimation apparatus which concerns on the said embodiment. 上記実施の形態に係る関連文書推定装置のドキュメントオントロジーを使って記述された文書間関係の一例を説明する図The figure explaining an example of the relationship between the documents described using the document ontology of the related document estimation apparatus which concerns on the said embodiment. 上記実施の形態に係る関連文書推定装置のドキュメントオントロジーを使って記述された文書間関係の一例を説明する図The figure explaining an example of the relationship between the documents described using the document ontology of the related document estimation apparatus which concerns on the said embodiment. 上記実施の形態に係る関連文書推定装置のDVDなどの家電を対象にしたトピック・文書グラフの一例を説明する図The figure explaining an example of the topic * document graph for household appliances, such as DVD of the related document estimation apparatus which concerns on the said embodiment 上記実施の形態に係る関連文書推定装置のトピック・文書グラフ作成部が実行する注目トピック又は注目文書の設定処理を示すフロー図The flowchart which shows the setting process of the attention topic or attention document which the topic and document graph preparation part of the related document estimation apparatus which concerns on the said embodiment performs 上記実施の形態に係る関連文書推定装置の注目文書の設定例を説明する図The figure explaining the example of a setting of the attention document of the related document estimation apparatus which concerns on the said embodiment. 上記実施の形態に係る関連文書推定装置の重要度伝播確率表(トピック・文書間関係)の一例を説明する図The figure explaining an example of the importance propagation probability table | surface (topic / document relationship) of the related document estimation apparatus which concerns on the said embodiment. 上記実施の形態に係る関連文書推定装置の重要度伝播確率表(トピック・トピック間関係)の一例を説明する図The figure explaining an example of the importance propagation probability table | surface (topic-topic relationship) of the related document estimation apparatus which concerns on the said embodiment. 上記実施の形態に係る関連文書推定装置のトピック・文書グラフにおいてハイビジョン録画操作ページが注目文書である場合の説明図Explanatory drawing when the HDTV recording operation page is the document of interest in the topic / document graph of the related document estimation apparatus according to the above embodiment 上記実施の形態に係る関連文書推定装置のトピック・文書グラフの初期状態を説明する図The figure explaining the initial state of the topic / document graph of the related document estimation apparatus according to the above embodiment 上記実施の形態に係る関連文書推定装置のトピック・文書グラフの重要度伝播例を説明する図The figure explaining the importance propagation example of the topic and document graph of the related document estimation apparatus according to the above embodiment 上記実施の形態に係る関連文書推定装置のトピック・文書グラフの重要度伝播例を説明する図The figure explaining the importance propagation example of the topic and document graph of the related document estimation apparatus according to the above embodiment 上記実施の形態に係る関連文書推定装置の重要度調整部による重要度調整を説明する図The figure explaining importance adjustment by the importance adjustment part of the related document estimation apparatus which concerns on the said embodiment 上記実施の形態に係る関連文書推定装置のトピック・文書グラフの重要度の調整を説明する図The figure explaining adjustment of the importance of the topic and document graph of the related document estimation apparatus according to the above embodiment 上記実施の形態に係る関連文書推定装置の関連文書推定装置による関連文書表示画面の例を示す図The figure which shows the example of the related document display screen by the related document estimation apparatus of the related document estimation apparatus which concerns on the said embodiment. 上記実施の形態に係る関連文書推定装置の関連文書推定装置による関連文書表示画面の例を示す図The figure which shows the example of the related document display screen by the related document estimation apparatus of the related document estimation apparatus which concerns on the said embodiment. 上記実施の形態に係る関連文書推定装置の関連文書の提示時のリンク文字列を示す図The figure which shows the link character string at the time of presentation of the related document of the related document estimation apparatus which concerns on the said embodiment. 上記実施の形態に係る関連文書推定装置の重要度伝播確率表の合成例を説明する図The figure explaining the example of a synthesis | combination of the importance propagation probability table of the related document estimation apparatus which concerns on the said embodiment. 従来のオントロジーを用いる関連文書推定装置の構成を示すブロック図The block diagram which shows the structure of the related document estimation apparatus which uses the conventional ontology 従来のパタンマッチによる関連文書取得を説明する図Diagram explaining related document acquisition by conventional pattern matching

符号の説明Explanation of symbols

100 関連文書推定装置
110 注目トピック選択部
120 トピック・文書グラフ作成部
121 メタデータ付き文書集合DB
122 トピック間関係DB
123 文書間関係DB
130 重要度伝播実行部
131 トピック間重要度伝播確率表
132 文書間重要度伝播確率表
133 トピック・文書間重要度伝播確率表
140 重要度調整部
150 関連文書提示部
200 表示画面
210 注目文書
220 推定された関連文書へのリンク集
230 質問入力ボックス

DESCRIPTION OF SYMBOLS 100 Related document estimation apparatus 110 Attention topic selection part 120 Topic and document graph creation part 121 Document collection DB with metadata
122 Topic relation DB
123 Inter-document relationship DB
130 Importance Propagation Execution Unit 131 Inter-topic Importance Propagation Probability Table 132 Inter-Document Importance Propagation Probability Table 133 Topic / Document Importance Propagation Probability Table 140 Importance Adjustment Unit 150 Related Document Presentation Unit 200 Display Screen 210 Attention Document 220 Estimation Links to related related documents 230 Question input box

Claims (10)

ユーザに提示する関連文書を推定する関連文書推定装置であって、
ユーザが注目するトピックを選択する注目トピック選択部と、
メタデータ付き文書集合、トピック間関係及び文書間関係を用いて、前記注目トピックからトピック・文書グラフを作成するトピック・文書グラフ作成部と、
前記トピック・文書グラフにおいて、隣接するトピック又は文書の重要度の伝播確率を表す重要度伝播確率表と、前記重要度伝播確率表を用いて、前記トピック・文書グラフにおける重要度の伝播を行うことにより、前記トピック・文書グラフにおけるトピック及び文書の重要度を算出し、該算出結果を前記トピック及び文書に付与した重要度付きトピック・文書グラフを生成する重要度伝播実行部と、
算出された重要度付きトピック・文書グラフを基に、関連文書を提示する関連文書提示部と、
を備える関連文書推定装置。
A related document estimation device for estimating a related document to be presented to a user,
A topic selection section for selecting a topic that the user is interested in;
A topic / document graph creation unit that creates a topic / document graph from the topic of interest using a document set with metadata, a relationship between topics, and a relationship between documents;
In the topic / document graph, the importance propagation probability table representing the propagation probability of the importance of adjacent topics or documents and the importance propagation probability table are used to propagate the importance in the topic / document graph. To calculate the importance of the topic and document in the topic / document graph, and generate an importance-weighted topic / document graph in which the calculation result is assigned to the topic and document,
A related document presentation unit for presenting a related document based on the calculated topic / document graph with importance,
Related document estimation device comprising:
前記重要度伝播確率表は、トピック間重要度伝播確率表、文書間重要度伝播確率表、及びトピック・文書間重要度伝播確率表である請求項1記載の関連文書推定装置。   2. The related document estimation apparatus according to claim 1, wherein the importance propagation probability table is a topic importance propagation probability table, a document importance propagation probability table, and a topic / document importance propagation probability table. 前記重要度伝播実行部により算出されたトピック又は文書に対する重要度の推定結果の数値を調整する重要度調整部をさらに備える請求項1記載の関連文書推定装置。   The related document estimation apparatus according to claim 1, further comprising an importance adjustment unit that adjusts a numerical value of an importance estimation result for the topic or document calculated by the importance propagation execution unit. 前記関連文書提示部は、生成された重要度付きトピック・文書グラフを基に、関連文書のリンク集を提示する請求項1記載の関連文書推定装置。   The related document estimation device according to claim 1, wherein the related document presentation unit presents a link collection of related documents based on the generated topic / document graph with importance. ユーザに提示する関連文書を推定する関連文書推定方法であって、
ユーザが注目するトピックを選択するステップと、
メタデータ付き文書集合、トピック間関係及び文書間関係を用いて、前記注目トピックからトピック・文書グラフを作成するステップと、
隣接するトピック又は文書の重要度の伝播確率を表す重要度伝播確率表を用いて、前記トピック・文書グラフにおける重要度の伝播を行うことにより、前記トピック・文書グラフにおけるトピック及び文書の重要度を算出し、該算出結果を前記トピック及び文書に付与した重要度付きトピック・文書グラフを生成するステップと
を有する関連文書推定方法。
A related document estimation method for estimating a related document to be presented to a user,
Selecting a topic that the user is interested in;
Creating a topic / document graph from the topic of interest using a document set with metadata, a topic relationship and a document relationship;
By using the importance propagation probability table representing the propagation probability of the importance of the adjacent topic or document, the importance of the topic and document in the topic / document graph is determined by propagating the importance in the topic / document graph. And generating a topic / document graph with importance by assigning the calculation result to the topic and the document.
生成された重要度付きトピック・文書グラフを基に、関連文書を提示するステップをさらに有する請求項5記載の関連文書推定方法。   6. The related document estimation method according to claim 5, further comprising a step of presenting a related document based on the generated topic / document graph with importance. 前記算出されたトピック又は文書に対する重要度の推定結果の数値を調整するステップをさらに有する請求項5記載の関連文書推定方法。   The related document estimation method according to claim 5, further comprising a step of adjusting a numerical value of an importance estimation result for the calculated topic or document. ユーザに提示する関連文書を推定する関連文書推定装置として実行させるためのプログラムであって、
コンピュータに、
ユーザが注目するトピックを選択するステップと、
メタデータ付き文書集合、トピック間関係及び文書間関係を用いて、前記注目トピックからトピック・文書グラフを作成するステップと、
隣接するトピック又は文書の重要度の伝播確率を表す重要度伝播確率表を用いて、前記トピック・文書グラフにおける重要度の伝播を行うことにより、前記トピック・文書グラフにおけるトピック及び文書の重要度を算出し、該算出結果を前記トピック及び文書に付与した重要度付きトピック・文書グラフを生成するステップと
を関連文書推定装置として実行させるためのプログラム。
A program for causing a related document estimation device to estimate a related document to be presented to a user,
On the computer,
Selecting a topic that the user is interested in;
Creating a topic / document graph from the topic of interest using a document set with metadata, a topic relationship and a document relationship;
By using the importance propagation probability table representing the propagation probability of the importance of the adjacent topic or document, the importance of the topic and the document in the topic / document graph is determined by propagating the importance in the topic / document graph. And a step of generating a topic / document graph with importance, in which the calculation result is assigned to the topic and the document.
ユーザに提示する関連文書を推定する関連文書推定装置として実行させるためのプログラムであって、
コンピュータに、
ユーザが注目するトピックを選択するステップと、
メタデータ付き文書集合、トピック間関係及び文書間関係を用いて、前記注目トピックからトピック・文書グラフを作成するステップと、
隣接するトピック又は文書の重要度の伝播確率を表す重要度伝播確率表を用いて、前記トピック・文書グラフにおける重要度の伝播を行うことにより、前記トピック・文書グラフにおけるトピック及び文書の重要度を算出し、該算出結果を前記トピック及び文書に付与した重要度付きトピック・文書グラフを生成するステップと、
前記算出されたトピック又は文書に対する重要度の推定結果の数値を調整するステップと、前記調整された重要度付きトピック・文書グラフを基に、関連文書を提示するステップと
を関連文書推定装置として実行させるためのプログラム。
A program for causing a related document estimation device to estimate a related document to be presented to a user,
On the computer,
Selecting a topic that the user is interested in;
Creating a topic / document graph from the topic of interest using a document set with metadata, a topic relationship and a document relationship;
By using the importance propagation probability table representing the propagation probability of the importance of the adjacent topic or document, the importance of the topic and the document in the topic / document graph is determined by propagating the importance in the topic / document graph. Generating a topic / document graph with importance, in which the calculation result is assigned to the topic and the document;
The step of adjusting the numerical value of the importance estimation result for the calculated topic or document and the step of presenting the related document based on the adjusted topic / document graph with importance are executed as a related document estimation device. Program to let you.
前記請求項8又は請求項9に記載のプログラムを記憶するコンピュータ読み取り可能な記録媒体。
A computer-readable recording medium storing the program according to claim 8 or 9.
JP2008062978A 2008-03-12 2008-03-12 Relevant document estimation device, relevant document estimation method, program and recording medium Pending JP2009217724A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008062978A JP2009217724A (en) 2008-03-12 2008-03-12 Relevant document estimation device, relevant document estimation method, program and recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008062978A JP2009217724A (en) 2008-03-12 2008-03-12 Relevant document estimation device, relevant document estimation method, program and recording medium

Publications (1)

Publication Number Publication Date
JP2009217724A true JP2009217724A (en) 2009-09-24

Family

ID=41189471

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008062978A Pending JP2009217724A (en) 2008-03-12 2008-03-12 Relevant document estimation device, relevant document estimation method, program and recording medium

Country Status (1)

Country Link
JP (1) JP2009217724A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012053889A (en) * 2010-02-10 2012-03-15 Panasonic Corp Image evaluation device, image evaluation method, program and integrated circuit
CN113453611A (en) * 2019-02-01 2021-09-28 西斯坦股份有限公司 System and method for organizing and locating data

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012053889A (en) * 2010-02-10 2012-03-15 Panasonic Corp Image evaluation device, image evaluation method, program and integrated circuit
CN113453611A (en) * 2019-02-01 2021-09-28 西斯坦股份有限公司 System and method for organizing and locating data
EP3917383A4 (en) * 2019-02-01 2022-03-30 System, Inc. Systems and methods for organizing and finding data
US11354587B2 (en) 2019-02-01 2022-06-07 System Inc. Systems and methods for organizing and finding data
CN113453611B (en) * 2019-02-01 2024-05-03 西斯坦股份有限公司 System and method for organizing and looking up data

Similar Documents

Publication Publication Date Title
Richardson et al. RESTful Web APIs: Services for a changing world
Akpınar et al. Vision based page segmentation algorithm: Extended and perceived success
US8332763B2 (en) Aggregating dynamic visual content
US8577900B2 (en) Method and apparatus for enhancing webpage browsing
US8375086B2 (en) Shared state manager and system and method for collaboration
WO2015051450A1 (en) Computer-implemented method and system for content creation
WO2006107529A2 (en) Method and system for aggregating rules for a property associated with a document element
JP5472118B2 (en) Operation support method, operation support system, operation support apparatus, and operation support program
CN108351889A (en) The group of enhancing finds
US20100023875A1 (en) Automatic rendering of user interface elements
JP2017073095A (en) Information display device, information display method, information display program, and distribution device
KR20140042537A (en) Apparatus for writing mash-up using templete and method thereof
JP2007011998A (en) Xpath expression processing method, xpath expression processor, xpath expression processing program, storage medium storing the program, and automaton
JP2009217724A (en) Relevant document estimation device, relevant document estimation method, program and recording medium
US20210390258A1 (en) Systems and methods for identification of repetitive language in document using linguistic analysis and correction thereof
JP4586652B2 (en) RSS document browsing method and apparatus, program, and storage medium storing program
JP4801555B2 (en) Document processing apparatus, document processing method, and document processing program
JP5366140B2 (en) Information processing apparatus, information processing method, and program
JP2009169596A (en) Genealogy image creating device, genealogy image creating method, and program
JP4213700B2 (en) Blog community analysis device and program
KR20090002316A (en) Method for selecting a part area of web document
CN112068826B (en) Text input control method, system, electronic device and storage medium
de Lange et al. Enhancing MDWE with collaborative live coding
KR20170129225A (en) Declarative cascade reordering of styles
Hostetler et al. Web accessibility trends and implementation in dynamic web applications