JP6144968B2 - Information presenting apparatus, method, and program - Google Patents

Information presenting apparatus, method, and program Download PDF

Info

Publication number
JP6144968B2
JP6144968B2 JP2013119310A JP2013119310A JP6144968B2 JP 6144968 B2 JP6144968 B2 JP 6144968B2 JP 2013119310 A JP2013119310 A JP 2013119310A JP 2013119310 A JP2013119310 A JP 2013119310A JP 6144968 B2 JP6144968 B2 JP 6144968B2
Authority
JP
Japan
Prior art keywords
nodes
information
object information
query
node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013119310A
Other languages
Japanese (ja)
Other versions
JP2014235723A (en
Inventor
正嗣 服部
正嗣 服部
一生 青山
一生 青山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2013119310A priority Critical patent/JP6144968B2/en
Publication of JP2014235723A publication Critical patent/JP2014235723A/en
Application granted granted Critical
Publication of JP6144968B2 publication Critical patent/JP6144968B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • User Interface Of Digital Computer (AREA)

Description

近年、ビッグデータ時代の到来といわれるように、データの量は爆発的に増えつつある。インターネットでは、従来から盛んであった企業やコンピュータに詳しい人々からの情報発信に加え、SNS(ソーシャルネットワークサービス)のように気軽かつ手軽に情報発信を可能とする媒体が数多く実用化されたことで、専門的な知識を有さない人も日常的に情報発信を行うようになった。このため、インターネット上に生み出される電子情報は膨大な量となっている。   In recent years, as the arrival of the big data era is said, the amount of data is increasing explosively. On the Internet, in addition to information transmission from companies and people familiar with computers that have been popular in the past, many other media such as SNS (social network service) that allow easy and easy information transmission have been put into practical use. Even those who do not have specialized knowledge began to send information on a daily basis. For this reason, the amount of electronic information generated on the Internet is enormous.

また、実世界においても、各種センサの廉価化、小型化、高性能化に伴い、多くの人が私的に所有する携帯電話、スマートフォン等の携帯端末には、標準的にGPSが搭載され、携帯端末の位置情報を用途に応じて取得できるようになっている。また、商用に農園、サーバ室等に配されたセンサノードで温度、湿度等のデータを常時取得し、運営に役立てることが行われている。このように、各種センサで取得されたセンサ情報が、逐次格納、蓄積、利用等されている。   Also, in the real world, as various sensors become cheaper, smaller, and more sophisticated, mobile terminals such as mobile phones and smartphones that are privately owned by many people are equipped with GPS as standard. The position information of the mobile terminal can be acquired according to the application. In addition, data such as temperature and humidity is constantly acquired by a sensor node provided for commercial use in a farm, a server room, etc., and is used for operation. As described above, sensor information acquired by various sensors is sequentially stored, accumulated, used, and the like.

このように日々生み出される膨大な情報を活用するためには、情報の検索は不可欠であり、検索結果をユーザが容易に理解できるように効果的に提示することが重要である。例えば、インターネット上の情報の検索及び提示を例に説明する。インターネットの検索エンジンは、Google(登録商標)社のウェブ検索、画像検索、Youtube(登録商標)の動画検索、Microsoft(登録商標)社の検索エンジンBing(登録商標)でのウェブ検索、画像検索等のように、検索対象となるオブジェクトがテキスト、画像、動画等と幅広いが、検索結果の出力はリスト形式で数十件程度を単位になされることが多い。リスト形式とは、検索エンジンがクエリと各オブジェクトとの関係に基づいて算出したスコアが高い順に、一次元的に検索結果を提示する方法であるといえる。ユーザは順位が高い検索結果から内容を吟味していき、所望の情報が得られたところで、検索結果の確認を打ち切ればよい。   Thus, in order to utilize the enormous amount of information generated every day, it is essential to search for information, and it is important to present the search results effectively so that the user can easily understand them. For example, search and presentation of information on the Internet will be described as an example. Internet search engine is Google (registered trademark) web search, image search, YouTube (registered trademark) video search, Microsoft (registered trademark) search engine Bing (registered trademark) web search, image search, etc. As described above, there are a wide range of objects to be searched, such as text, images, and moving images, but the output of search results is often made in units of several tens of cases in a list format. The list format can be said to be a method of presenting search results in a one-dimensional manner in descending order of the score calculated by the search engine based on the relationship between the query and each object. The user should examine the contents from the search results with higher ranks and cancel the confirmation of the search results when the desired information is obtained.

しかし、一次元的なリスト形式での検索結果の提示には、クエリに含まれるキーワード等の検索キーが所望の対象に関する情報だけではなく、他の対象に関する情報にも該当している場合に、所望の対象に対する検索結果と他の対象に対する検索結果とが混在してしまう、という問題がある。例えば、「人物Aに関する記述を含んだインターネット上のhtmlテキストの集合」を人物Aの氏名をキーワードにウェブから検索し、スコアが高い順にリスト形式で得たいとする。この際、人物Aと同姓同名の別人Bが存在し、その「人物Bに関する記述を含んだインターネット上のhtmlテキストの集合」中にスコアが高いものが存在する場合には、検索結果リストに、「人物Aに関する記述を含んだインターネット上のhtmlテキスト」と「人物Bに関する記述を含んだインターネット上のhtmlテキスト」とが混在してしまうことになる。   However, in the presentation of search results in a one-dimensional list format, when the search key such as a keyword included in the query corresponds to not only information related to a desired target but also information related to other targets, There is a problem that a search result for a desired target and a search result for another target are mixed. For example, it is assumed that “a set of html texts on the Internet including a description relating to the person A” is searched from the web using the name of the person A as a keyword, and the list is to be obtained in descending order of score. At this time, if there is another person B who has the same name as the person A, and the “collection of html texts on the Internet including the description about the person B” has a high score, the search result list includes: "The html text on the Internet including the description regarding the person A" and "the html text on the Internet including the description regarding the person B" are mixed.

この場合、検索結果から混在してしまった別人Bの情報を排するには、Aは有するがBは有さない情報を検索キーとしてクエリに追加する必要があるが、そのためにはA及びBの特性を分析する必要が生じる。ユーザがA及びBについて事前知識を有しない場合、特性の分析のためにリストで示されたテキストを複数読み比べることになり、多くの時間が消費されることになる。最悪の場合、適切でない追加の検索キーを選択してしまい、所望のAに関する情報まで検索結果のリストから排除してしまう可能性がある。   In this case, in order to eliminate the information of another person B who has been mixed from the search results, it is necessary to add information that has A but not B as a search key to the query. It becomes necessary to analyze the characteristics of If the user does not have prior knowledge about A and B, the text shown in the list will be read and compared for characteristic analysis, and a lot of time will be consumed. In the worst case, an additional search key that is not appropriate may be selected, and information about the desired A may be excluded from the search result list.

検索結果を一次元的なリストとして提示する場合の問題を解決するために、二次元的な情報提示を行う手法が提案されている。二次元的な情報提示とは、例えば、二次元グラフ形式で検索結果を出力する方法である。例えば、手書き数字画像を入力(クエリ)として与えたときに、mnistDB(手書き文字認識用データベース)内の画像のうち、クエリとの類似度が高いと判定された画像群と入力画像との近傍関係を、バネモデルに基づき二次元平面上にプロットした二次元グラフを提示する技術が提案されている(例えば、非特許文献1参照)。   In order to solve the problem of presenting search results as a one-dimensional list, a method of presenting two-dimensional information has been proposed. Two-dimensional information presentation is a method of outputting a search result in a two-dimensional graph format, for example. For example, when a handwritten numeral image is given as an input (query), among the images in mnistDB (handwritten character recognition database), the neighborhood relationship between an image group determined to have a high similarity to the query and the input image Has been proposed (see Non-Patent Document 1, for example).

非特許文献1の技術では、同一のラベルを持つ画像は互いに近く、異なるラベルを持つ画像は互いに遠くに配置することにより、結果的に、二次元グラフに同一のラベルを持つ画像のクラスタが形成される。従って、ラベルが異なる画像のクラスタは、二次元グラフ上で別れて配置されるため、同じクエリに対してスコアが同等となる異なるラベルを持つ画像が複数存在する場合でも、所望の検索結果の集合とそれ以外の検索結果の集合とが混在するという問題を解消することができる。   In the technique of Non-Patent Document 1, images having the same label are arranged close to each other, and images having different labels are arranged far from each other. As a result, a cluster of images having the same label is formed in the two-dimensional graph. Is done. Therefore, since clusters of images with different labels are arranged separately on the two-dimensional graph, a set of desired search results can be obtained even when there are multiple images with different labels that have the same score for the same query. And a set of other search results can be solved.

しかし、非特許文献1に記載の技術では、クエリが二次元グラフ上のどこに対応し、どういったクラスタに所属するか等のクエリと検索結果との関係を把握するためには、ユーザが検索結果に併記されている補助情報(非特許文献1の例の場合、手書き数字画像)とグラフ構造とを見比べながら自ら行う必要がある。   However, in the technique described in Non-Patent Document 1, in order to grasp the relationship between the query and the search result, such as where the query corresponds to on the two-dimensional graph and what cluster belongs to, the search is performed by the user. It is necessary to compare the auxiliary information (in the case of the non-patent document 1, in the case of the non-patent document 1) and the graph structure with the graph structure.

このようなクエリと検索結果との関係の把握を効率的に行えるようにユーザを支援する情報提示方法として、検索結果の二次元的な位置関係に加え、クエリによらない検索対象DB特有の絶対的な重要指標をオブジェクト毎に事前に算出しておき、その指標に基づいて、オブジェクトを表すノードの位置座標として高さ情報を追加することで、検索結果の三次元的な可視化を行う手法が提案されている(例えば、特許文献1〜3参照)。   As an information presentation method that supports the user so that the relationship between the query and the search result can be efficiently understood, in addition to the two-dimensional positional relationship of the search result, an absolute unique to the search target DB that does not depend on the query A method to perform a three-dimensional visualization of search results by preliminarily calculating an important index for each object in advance and adding height information as the position coordinates of the node representing the object based on the index. It has been proposed (see, for example, Patent Documents 1 to 3).

例えば、インターネット上の文書セット内の単語を例にとって説明すると、単語ノードの高さはその単語ノードが示す単語が登場する文書数を基に算出され、多くの文書に現れるメジャーな単語を示す単語ノード(「料理」のような抽象的な上位概念)の標高は高くなり、大きな文字フォントでノード名が記載された単語関係の標高図が作成される。このような標高図では、ある単語について、その概略をつかみたい場合には、その単語ノードが所属する山の頂上付近に位置する単語ノードのノード名を見れば、その単語ノードがどういった概念に類するものかを想像することができる。例えば、仮に「レシピ」という単語を知らないユーザが、上記のような標高図で表された単語関係を見ると、「レシピ」を示す単語ノードは、「料理」を示す単語ノードを頂点とする山脈のふもとに位置するので、「レシピ」は「料理」に関連する単語である、ということを把握することができる。   For example, taking a word in a document set on the Internet as an example, the height of a word node is calculated based on the number of documents in which the word indicated by the word node appears, and a word indicating a major word appearing in many documents. The altitude of the node (abstract superordinate concept such as “cooking”) is high, and a word-related altitude map in which the node name is described in a large character font is created. In an elevation map like this, if you want to get an overview of a word, look at the node name of the word node located near the top of the mountain to which the word node belongs. You can imagine what it is like. For example, if a user who does not know the word “recipe” sees the word relationship represented by the elevation map as described above, the word node indicating “recipe” has the word node indicating “dish” as a vertex. Since it is located at the foot of the mountain range, it can be understood that “recipe” is a word related to “cooking”.

上述の二次元グラフによる検索結果の可視化の例では、各クラスタの視認はユーザが併記された手書き画像情報との照らし合わせで自ら行う必要があったが、三次元的な可視化を行うことで、標高が高い地点のノードの持つ情報を手掛かりに、周囲ノードの情報の概略、すなわちノードの所属するクラスタの理解が容易になる。   In the example of the visualization of the search result by the above-described two-dimensional graph, it is necessary for the user to visually recognize each cluster in comparison with the handwritten image information written together, but by performing the three-dimensional visualization, By using the information held by the node at a high altitude as a clue, it becomes easy to understand the outline of the information of surrounding nodes, that is, the cluster to which the node belongs.

特開2009−86858号公報JP 2009-86858 A 特開2009−86859号公報JP 2009-86859 A 特開2009−288989号公報JP 2009-28889A

青山一生他、「ネットワーク索引構造を用いた類似探索と可視化」、FIT2008(第7回情報科学技術フォーラム)Aoyama Kazuo et al. “Similarity Search and Visualization Using Network Index Structure”, FIT2008 (7th Information Science and Technology Forum)

しかしながら、上述の従来手法による検索結果の三次元的な可視化による情報提示手法は、クエリの入力以前に、クエリとは無関係に各オブジェクトを示すノードの高さを決定して標高図が作成されており、クエリ毎の最適な情報提示とはなっていないため、ユーザに対する支援として十分な成果が期待できない、という問題がある。   However, in the information presentation method based on the three-dimensional visualization of the search results by the conventional method described above, the elevation map is created by determining the height of the node indicating each object regardless of the query before the input of the query. In addition, since it is not the optimum information presentation for each query, there is a problem that sufficient results cannot be expected as support for the user.

本発明は上記問題点に鑑みてなされたものであり、クエリ毎に最適な情報提示を行うことができる情報提示装置、方法、及びプログラムを提供することを目的とする。   The present invention has been made in view of the above problems, and an object of the present invention is to provide an information presentation apparatus, method, and program capable of performing optimum information presentation for each query.

上記目的を達成するために、第1の発明に係る情報提示装置は、オブジェクトに関する少なくとも一種類の特徴を含む複数のオブジェクト情報から、入力されたクエリとの類似度が第1所定値以上のオブジェクト情報を複数探索する探索部と、前記探索部により探索された複数のオブジェクト情報の各々を示すノードの各々の二次元平面座標を、各ノード間の距離が、該各ノードが示すオブジェクト情報間の関係のみに応じた距離となり、前記オブジェクト情報に含まれる特徴間の類似度が高いオブジェクト情報を示すノード同士が近く、類似度が低いオブジェクト情報を示すノード同士が遠く配置されるように算出すると共に、前記ノードの各々の高さ情報を、該ノードが示すオブジェクト情報と前記クエリとの関係のみに応じた高さとなるように算出する算出部と、前記算出部により算出された前記ノードの各々の二次元平面座標及び高さ情報が示す三次元座標で示される位置に前記ノードの各々をプロットし、前記ノードの各々が示すオブジェクト情報に含まれる特徴の少なくとも一つを前記ノードの各々に付与した探索結果を提示する提示部と、を含み、前記算出部は、各ノードが示すオブジェクト情報に含まれる特徴同士の類似度が第2所定値以上となるノード間をエッジで接続した部分ネットワーク構造をバネモデルで表し、エッジで接続されたノード同士は近くに配置し、エッジで接続されていないノード同士は遠くに配置し、前記部分ネットワーク構造に含まれる全てのノードが安定な配置となるように、前記ノードの各々の二次元平面座標を算出する。 In order to achieve the above object, an information presentation device according to a first aspect of the present invention provides an object whose similarity with an input query is greater than or equal to a first predetermined value from a plurality of object information including at least one type of feature related to an object. A search unit for searching for a plurality of information, and a two-dimensional plane coordinate of each of the nodes indicating each of the plurality of object information searched by the search unit, the distance between the nodes is between the object information indicated by each node While calculating the distance according to only the relationship, the nodes indicating the object information having high similarity between the features included in the object information are close to each other, and the nodes indicating the object information having a low similarity are arranged far from each other. The height information of each of the nodes is a height corresponding to only the relationship between the object information indicated by the node and the query. And calculating each of the nodes plotted at positions indicated by the two-dimensional plane coordinates and the three-dimensional coordinates indicated by the height information of each of the nodes calculated by the calculation unit, see containing and a presentation unit for presenting a search result at least one characteristic was applied to each of the nodes included in the object information indicated by the calculation unit, the feature between each node included in the object information indicating A partial network structure in which nodes with similarities greater than or equal to the second predetermined value are connected by edges is represented by a spring model, nodes connected by edges are placed close to each other, and nodes not connected by edges are placed far away. Then, the two-dimensional plane coordinates of each of the nodes are calculated so that all the nodes included in the partial network structure have a stable arrangement.

第1の発明に係る情報提示装置によれば、探索部が、オブジェクトに関する少なくとも一種類の特徴を含む複数のオブジェクト情報から、入力されたクエリとの類似度が第1所定値以上のオブジェクト情報を複数探索する。次に、算出部が、探索部により探索された複数のオブジェクト情報の各々を示すノードの各々の二次元平面座標を、各ノード間の距離が、各ノードが示すオブジェクト情報間の関係のみに応じた距離となり、オブジェクト情報に含まれる特徴間の類似度が高いオブジェクト情報を示すノード同士が近く、類似度が低いオブジェクト情報を示すノード同士が遠く配置されるように算出する。この際、算出部は、各ノードが示すオブジェクト情報に含まれる特徴同士の類似度が第2所定値以上となるノード間をエッジで接続した部分ネットワーク構造をバネモデルで表し、エッジで接続されたノード同士は近くに配置し、エッジで接続されていないノード同士は遠くに配置し、部分ネットワーク構造に含まれる全てのノードが安定な配置となるように、ノードの各々の二次元平面座標を算出する。また、算出部は、ノードの各々の高さ情報を、ノードが示すオブジェクト情報とクエリとの関係のみに応じた高さとなるように算出する。そして、提示部が、算出部により算出されたノードの各々の二次元平面座標及び高さ情報が示す三次元座標で示される位置にノードの各々をプロットし、ノードの各々が示すオブジェクト情報に含まれる特徴の少なくとも一つをノードの各々に付与した探索結果を提示する。 According to the information presentation device of the first invention, the search unit obtains object information whose similarity with the input query is greater than or equal to the first predetermined value from a plurality of pieces of object information including at least one type of feature related to the object. Search multiple times. Next, the calculation unit determines the two-dimensional plane coordinates of each of the nodes indicating each of the plurality of object information searched by the search unit, the distance between the nodes depends only on the relationship between the object information indicated by each node It is calculated that the nodes indicating the object information having high similarity between the features included in the object information are close to each other, and the nodes indicating the object information having a low similarity are arranged far from each other . At this time, the calculation unit represents a partial network structure in which nodes having similarities between features included in the object information indicated by each node are connected to each other by a second edge with a spring model, and the nodes connected by the edge. Place the nodes close to each other, place the nodes that are not connected by edges far away, and calculate the two-dimensional plane coordinates of each node so that all nodes in the partial network structure are stable. . In addition, the calculation unit calculates the height information of each node so that the height information corresponds to only the relationship between the object information indicated by the node and the query. Then, the presentation unit plots each of the nodes at the position indicated by the two-dimensional plane coordinates and the three-dimensional coordinates indicated by the height information of each of the nodes calculated by the calculation unit, and is included in the object information indicated by each of the nodes A search result in which at least one of the above-described features is assigned to each node is presented.

このように、クエリに対するオブジェクトの探索結果を、オブジェクト情報間の関係に応じた二次元平面座標と、クエリとオブジェクト情報との関係に応じた高さ情報とが示す三次元座標を用いて表すため、クエリ毎に最適な情報提示を行うことができる。   Thus, in order to express the search result of the object with respect to the query using the two-dimensional plane coordinates according to the relationship between the object information and the three-dimensional coordinates indicated by the height information according to the relationship between the query and the object information. Optimal information can be presented for each query.

また、前記算出部は、前記オブジェクト情報に含まれる特徴と前記クエリの特徴との類似度が高いほど高くなる高さ情報を算出することができる。これにより、クエリとオブジェクトとの関係を示す高さ情報を手掛かりに、オブジェクトのクラスタを把握することができる。   Further, the calculation unit can calculate height information that increases as the similarity between the feature included in the object information and the feature of the query increases. Thereby, the cluster of the object can be grasped by using the height information indicating the relationship between the query and the object as a clue.

また、前記算出部は、前記オブジェクト情報に含まれる特徴間の類似度が高いオブジェクト情報を示すノード同士が近く、類似度が低いオブジェクト情報を示すノード同士が遠く配置されるように、前記二次元平面座標を算出することにより、オブジェクトのクラスタをより明確に把握することができる。 In addition, the calculation unit may be arranged so that nodes indicating object information having high similarity between features included in the object information are close to each other and nodes indicating object information having low similarity are arranged far from each other. more plane coordinates in the calculation child can grasp the cluster object more clearly.

また、第1の発明に係る情報提示装置は、前記ノードの各々が示すオブジェクト情報間の関係に応じて、前記ノードの各々を複数のクラスタに分離するクラスタリング部を含んで構成することができる。これにより、ノードの位置関係やノードに付与されたオブジェクトの特徴を手掛かりに把握していたオブジェクトのクラスタの分離を、自動的に行うことができる。   Moreover, the information presentation apparatus according to the first aspect of the invention can be configured to include a clustering unit that separates each of the nodes into a plurality of clusters according to the relationship between the object information indicated by each of the nodes. As a result, it is possible to automatically perform the separation of the cluster of the objects that have grasped the positional relationship of the nodes and the characteristics of the objects given to the nodes.

また、前記クラスタリング部は、前記複数のクラスタの各々に属するノードの各々が示すオブジェクト情報に基づくクラスタ名を、前記複数のクラスタの各々に付与することができる。これにより、クラスタの内容を容易に把握することができる。   Further, the clustering unit can give each of the plurality of clusters a cluster name based on object information indicated by each of the nodes belonging to each of the plurality of clusters. Thereby, the contents of the cluster can be easily grasped.

また、第2の発明に係る情報提示装置は、三次元座標で示される探索結果において、第1のクエリに対する探索結果集合及び前記第1のクエリとは異なる第2のクエリに対する探索結果集合の双方に含まれ探索結果の高さを、前記第1のクエリに対する探索結果と、前記第2のクエリに対する探索結果とで各々異ならせて表示する。   In the information presentation device according to the second invention, in the search result indicated by the three-dimensional coordinates, both the search result set for the first query and the search result set for the second query different from the first query. The search results included in the search results are displayed differently for the search results for the first query and the search results for the second query.

これにより、同じオブジェクトであっても、異なるクエリに対する探索結果の各々において、高さが異なるノードとして表されるため、クエリ毎に最適な情報提示を行うことができる。   Thereby, even if it is the same object, since it represents as a node from which height differs in each of the search results with respect to a different query, optimal information presentation can be performed for every query.

また、第3の発明に係る情報提示方法は、探索部が、オブジェクトに関する少なくとも一種類の特徴を含む複数のオブジェクト情報から、入力されたクエリとの類似度が第1所定値以上のオブジェクト情報を複数探索するステップと、算出部が、前記探索部により探索された複数のオブジェクト情報の各々を示すノードの各々の二次元平面座標を、各ノード間の距離が、該各ノードが示すオブジェクト情報間の関係のみに応じた距離となり、前記オブジェクト情報に含まれる特徴間の類似度が高いオブジェクト情報を示すノード同士が近く、類似度が低いオブジェクト情報を示すノード同士が遠く配置されるように算出すると共に、前記ノードの各々の高さ情報を、該ノードが示すオブジェクト情報と前記クエリとの関係のみに応じた高さとなるように算出するステップと、提示部が、前記算出部により算出された前記ノードの各々の二次元平面座標及び高さ情報が示す三次元座標で示される位置に前記ノードの各々をプロットし、前記ノードの各々が示すオブジェクト情報に含まれる特徴の少なくとも一つを前記ノードの各々に付与した探索結果を提示するステップと、を含み、前記算出部が二次元平面座標を算出するステップにおいて、各ノードが示すオブジェクト情報に含まれる特徴同士の類似度が第2所定値以上となるノード間をエッジで接続した部分ネットワーク構造をバネモデルで表し、エッジで接続されたノード同士は近くに配置し、エッジで接続されていないノード同士は遠くに配置し、前記部分ネットワーク構造に含まれる全てのノードが安定な配置となるように、前記ノードの各々の二次元平面座標を算出する方法である。 Further, in the information presentation method according to the third invention, the search unit obtains object information whose similarity with the input query is greater than or equal to a first predetermined value from a plurality of pieces of object information including at least one type of feature related to the object. A plurality of search steps, and a calculation unit that calculates the two-dimensional plane coordinates of each of the nodes indicating each of the plurality of object information searched by the search unit, the distance between the nodes is the distance between the object information indicated by each node The distance is determined according to the relationship only, and the nodes indicating the object information having high similarity between the features included in the object information are close to each other, and the nodes indicating the object information having a low similarity are arranged to be distant from each other. In addition, the height information of each of the nodes is set to a height corresponding to only the relationship between the object information indicated by the node and the query. A step of calculating so that the presentation unit plots each of the nodes at a position indicated by the two-dimensional plane coordinates and the three-dimensional coordinates indicated by the height information of each of the nodes calculated by the calculation unit; in at least the steps of one presenting the search results given to each of the nodes, only including the step of the calculating unit calculates the two-dimensional plane coordinates of the features included in the object information indicated by each of said nodes, The partial network structure in which the nodes having similarities between the features included in the object information indicated by each node are connected to each other by an edge is represented by a spring model, and the nodes connected by the edge are arranged close to each other. Nodes that are not connected at the edge should be placed far away so that all nodes in the partial network structure will be stable. Is a method of calculating the two-dimensional plane coordinates of each of the nodes.

また、第4の発明に係る情報提示方法は、三次元座標で示される探索結果において、第1のクエリに対する探索結果集合及び前記第1のクエリとは異なる第2のクエリに対する探索結果集合の双方に含まれ探索結果の高さを、前記第1のクエリに対する探索結果と、前記第2のクエリに対する探索結果とで各々異ならせて表示する方法である。   In the information presentation method according to the fourth aspect of the present invention, in the search result indicated by the three-dimensional coordinates, both the search result set for the first query and the search result set for the second query different from the first query. The search results included in the search result are displayed differently for the search results for the first query and the search results for the second query.

また、第5の発明に係る情報提示プログラムは、コンピュータを、上記の情報提示装置を構成する各部として機能させるためのプログラムである。   Moreover, the information presentation program which concerns on 5th invention is a program for functioning a computer as each part which comprises said information presentation apparatus.

以上説明したように、本発明の情報提示装置、方法、及びプログラムによれば、クエリに対するオブジェクトの探索結果を、オブジェクト情報間の関係に応じた二次元平面座標と、クエリとオブジェクト情報との関係に応じた高さ情報とが示す三次元座標を用いて表すため、クエリ毎に最適な情報提示を行うことができる、という効果が得られる。   As described above, according to the information presentation apparatus, method, and program of the present invention, the search result of the object for the query, the two-dimensional plane coordinates according to the relationship between the object information, and the relationship between the query and the object information Since the information is expressed using the three-dimensional coordinates indicated by the height information corresponding to the information, an effect that the optimum information presentation can be performed for each query is obtained.

第1の実施の形態に係る情報提示装置の構成を示すブロック図である。It is a block diagram which shows the structure of the information presentation apparatus which concerns on 1st Embodiment. 探索対象オブジェクトDBに格納されたオブジェクト情報の一例を示すイメージ図である。It is an image figure which shows an example of the object information stored in search object DB. 探索結果の三次元可視化結果の一例を示すイメージ図である。It is an image figure which shows an example of the three-dimensional visualization result of a search result. コントロール画面の一例を示すイメージ図である。It is an image figure which shows an example of a control screen. 第1の実施の形態における情報提示処理ルーチンの内容を示すフローチャートである。It is a flowchart which shows the content of the information presentation process routine in 1st Embodiment. キーワード「α」に対する探索結果の三次元可視化結果の一例を示すイメージ図である。It is an image figure which shows an example of the three-dimensional visualization result of the search result with respect to keyword "(alpha)." キーワード「β」に対する探索結果の三次元可視化結果の一例を示すイメージ図である。It is an image figure which shows an example of the three-dimensional visualization result of the search result with respect to keyword "(beta)." 第2の実施の形態に係る情報提示装置の構成を示すブロック図である。It is a block diagram which shows the structure of the information presentation apparatus which concerns on 2nd Embodiment. グラフのエッジに関する媒介中心性を説明するための概略図である。It is the schematic for demonstrating the median centrality regarding the edge of a graph. クラスタの命名を説明するための概略図である。It is the schematic for demonstrating naming of a cluster. 第2の実施の形態における情報提示処理ルーチンの内容を示すフローチャートである。It is a flowchart which shows the content of the information presentation process routine in 2nd Embodiment.

以下、図面を参照して本発明の実施の形態を詳細に説明する。なお、以下では、探索対象オブジェクトを「絵本」とした場合を例示しながら、各実施の形態について説明する。また、以下の各実施の形態では、「検索」よりも広い概念として「探索」という用語を用いる。ここでは、「検索」とは、検索対象のオブジェクト群の中で、クエリとして与えた条件を全て満たすオブジェクトを見つけるタスクとする。一方で、「探索」とは、クエリとして与えた条件を全て満たすオブジェクトが存在しなかった場合には、最も多くの条件を満たしたオブジェクトを見つけるタスクとする。   Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings. In the following, each embodiment will be described with reference to a case where the search target object is “picture book”. In the following embodiments, the term “search” is used as a concept wider than “search”. Here, “search” is a task for finding an object that satisfies all the conditions given as a query in the object group to be searched. On the other hand, “search” is a task for finding an object that satisfies the most conditions when there is no object that satisfies all the conditions given as a query.

<第1の実施の形態>
第1の実施の形態に係る情報提示装置10は、CPU(Central Processing Unit)と、RAM(Random Access Memory)と、後述する情報提示処理ルーチンを実行するための情報提示プログラムを記憶したROM(Read Only Memory)とを備えたコンピュータで構成されている。CPUが情報提示プログラムを、内部記憶装置であるROMから読み込んで実行することにより、コンピュータが情報提示装置10として機能する。
<First Embodiment>
The information presentation apparatus 10 according to the first embodiment includes a CPU (Central Processing Unit), a RAM (Random Access Memory), and a ROM (Read Read) that stores an information presentation program for executing an information presentation processing routine described later. Only memory). The CPU functions as the information presentation device 10 by the CPU reading and executing the information presentation program from the ROM which is an internal storage device.

情報提示装置10には、所望の情報を探索するためのクリエが入力される。情報提示装置10は、入力されたクエリに応じた複数のオブジェクトを探索し、探索したオブジェクトを示す情報を三次元的に可視化した探索結果を出力する。   The information presentation apparatus 10 receives a query for searching for desired information. The information presentation device 10 searches for a plurality of objects corresponding to the input query, and outputs a search result obtained by three-dimensionally visualizing information indicating the searched object.

図1に示すように、情報提示装置10は、機能的には、クエリ特徴抽出部12、オブジェクト探索部14、二次元座標算出部16、標高算出部18、及び三次元可視化結果提示部20を含んだ構成で表すことができる。なお、オブジェクト探索部14は本発明の探索部の一例であり、二次元座標算出部16及び標高算出部18は本発明の算出部の一例であり、三次元可視化結果提示部20は本発明の提示部の一例である。   As shown in FIG. 1, the information presentation device 10 functionally includes a query feature extraction unit 12, an object search unit 14, a two-dimensional coordinate calculation unit 16, an elevation calculation unit 18, and a three-dimensional visualization result presentation unit 20. It can be expressed in a configuration that includes it. The object search unit 14 is an example of the search unit of the present invention, the two-dimensional coordinate calculation unit 16 and the elevation calculation unit 18 are examples of the calculation unit of the present invention, and the three-dimensional visualization result presentation unit 20 is the present invention. It is an example of a presentation part.

クエリ特徴抽出部12は、入力されたクエリを受け付け、クエリから特徴を抽出し、抽出したクエリの特徴を、オブジェクト探索部14へ受け渡す。   The query feature extraction unit 12 receives the input query, extracts features from the query, and passes the extracted query features to the object search unit 14.

例えば、クエリ特徴抽出部12は、クエリとして与えられたテキストデータに含まれる所定の単語のクエリ内での出現回数等を、クエリの特徴として抽出することができる。より具体的には、クエリ特徴抽出部12は、クエリとして与えられたテキストデータを形態素解析器によって単語単位に分割すると共に、各単語に品詞等の情報を付与した形態素解析結果を得る。クエリ特徴抽出部12は、形態素解析結果の品詞等の情報を参照して、例えば自立語を所定の単語として抽出する。なお、抽出する単語としては、自立語以外を採用してもよい。クエリ特徴抽出部12は、抽出した各自立語のクエリ内での出現回数をカウントし、各自立語とその出現回数との羅列をクエリの特徴とする。   For example, the query feature extraction unit 12 can extract the number of appearances of a predetermined word included in text data given as a query in the query as the feature of the query. More specifically, the query feature extraction unit 12 divides text data given as a query into words by a morphological analyzer, and obtains a morphological analysis result in which information such as part of speech is given to each word. The query feature extraction unit 12 refers to information such as the part of speech of the morphological analysis result, and extracts, for example, an independent word as a predetermined word. In addition, you may employ | adopt words other than an independent word as a word to extract. The query feature extraction unit 12 counts the number of appearances of each extracted independent word in the query, and uses the enumeration of each independent word and the number of appearances as a feature of the query.

例えば、クエリとして、「AAAとBBBは海で泳ぎました」(“AAA”及び“BBB”はある絵本に登場するキャラクタの名前)というテキストデータが入力された場合、クエリ特徴抽出部12は、入力されたクエリを形態素解析して得た形態素解析結果から、「AAA」、「BBB」、「海」、及び「泳ぐ」という自立語を抽出する。また、クエリ特徴抽出部12は、抽出した各自立語のクエリ内での出現回数をカウントし、「AAA 1回,BBB 1回,海 1回,泳ぐ 1回」という特徴を抽出する。   For example, when text data “AAA and BBB swims in the sea” (“AAA” and “BBB” are names of characters appearing in a picture book) is input as a query, the query feature extraction unit 12 The independent words “AAA”, “BBB”, “Sea”, and “Swimming” are extracted from the morphological analysis result obtained by morphological analysis of the input query. Further, the query feature extraction unit 12 counts the number of appearances of each extracted independent word in the query, and extracts a feature of “AAA once, BBB once, ocean once, swim once”.

なお、クエリは、後述する探索対象オブジェクトDB30に格納されたオブジェクト情報に含まれる特徴と比較できる特徴を有するものであればよく、探索対象オブジェクトDB30内のデータに存在するものであっても、存在しないものであってもよい。例えば、探索対象オブジェクトDB30に、オブジェクトの特徴として、探索対象である絵本に含まれるテキストに関する情報が格納されている場合には、入力されるクエリもテキストを有するものであればよく、そのテキストが、探索対象オブジェクトDB30に格納された絵本に出現する表現そのものでなくてもよい。   It should be noted that the query only needs to have a feature that can be compared with the feature included in the object information stored in the search target object DB 30 to be described later, and even if the query exists in the data in the search target object DB 30 It may not be. For example, if the search target object DB 30 stores information on text included in a picture book that is a search target as a feature of the object, the input query only needs to have text. The expression that appears in the picture book stored in the search target object DB 30 may not be used.

オブジェクト探索部14は、クエリ特徴抽出部12から受け渡されたクエリの特徴を用いて、探索対象オブジェクトDB30から、クエリとの類似度が高いオブジェクト情報を取得し、二次元座標算出部16へ受け渡す。   The object search unit 14 acquires object information having a high similarity to the query from the search target object DB 30 using the query features passed from the query feature extraction unit 12, and receives the object information to the two-dimensional coordinate calculation unit 16. hand over.

ここで、探索対象オブジェクトDB30には、図2に示すように、複数のオブジェクト情報が格納されている。ここで、オブジェクトとは、探索対象を示す実体であり、例えば、本、音楽、画像、映像、人物等である。また、オブジェクト情報とは、上記のようなオブジェクトに関する少なくとも一種類の特徴を含む情報であり、オブジェクトが示す性質、属性等の様々な情報を含むことができる。例えば、オブジェクトが画像の場合には、画像のタイトル、サイズ、作成日時等のメタデータに含まれる各項目が示す情報や、画像自体の内容を示す情報、すなわち画像データから抽出される画像特徴量等の各々を画像の特徴として、その画像を示すオブジェクト情報に含めることができる。   Here, the search target object DB 30 stores a plurality of pieces of object information as shown in FIG. Here, the object is an entity indicating a search target, such as a book, music, an image, a video, and a person. The object information is information including at least one type of feature related to the object as described above, and can include various information such as properties and attributes indicated by the object. For example, when the object is an image, information indicated by each item included in metadata such as the image title, size, creation date and time, information indicating the content of the image itself, that is, an image feature amount extracted from the image data Etc. can be included in the object information indicating the image as a feature of the image.

なお、ここでは「同じ種類の特徴」を持つことと「同じ特徴」を持つことを別の概念であることとする。例えば、二つのオブジェクトA及びBが、それぞれサイズが100×100画素の画像と、サイズが200×200画素の画像であったとする。両者は画像のタイトル、サイズ、画像特徴量等といった複数の「同じ種類の特徴」を持つ。しかし、「サイズ」に注目するとその値が異なるため、異なる特徴を有するオブジェクトであるといえる。   Here, “having the same type of feature” and “having the same feature” are different concepts. For example, it is assumed that the two objects A and B are an image having a size of 100 × 100 pixels and an image having a size of 200 × 200 pixels, respectively. Both have a plurality of “features of the same type” such as an image title, a size, and an image feature amount. However, when the “size” is focused on, the values are different, so it can be said that the object has different characteristics.

また、各オブジェクト情報には、探索対象となるオブジェクトを識別するための識別番号(ID)が付与されている。   Each object information is given an identification number (ID) for identifying an object to be searched.

図2の例は、探索対象オブジェクトが「絵本」の場合であり、例えば、絵本のタイトル、表紙画像、著者、挿絵の作者、出版社等の書誌情報の各々、及び各絵本に出現する自立語毎の出現回数のそれぞれを特徴として含むオブジェクト情報が格納されている。なお、ここでは、書誌情報以外のオブジェクトの特徴の一つとして、絵本に出現する自立語毎の出現回数を用いているが、例えば、絵本の中の挿絵を示す画像データから抽出された画像特徴量、絵本を朗読した音声データから抽出された音声特徴量等をオブジェクトの特徴としてもよい。また、書誌情報についても、他の書誌情報を特徴として含めてもよい。   The example of FIG. 2 is a case where the search target object is “picture book”. For example, the title of the picture book, the cover image, the author, the author of the illustration, the bibliographic information of the publisher, and the independent words appearing in each picture book. Object information including each number of appearances as a feature is stored. Here, as one of the object features other than bibliographic information, the number of appearances for each independent word appearing in the picture book is used. For example, the image feature extracted from the image data indicating the illustration in the picture book The volume, the voice feature amount extracted from the voice data read from the picture book, and the like may be used as the object feature. Also, bibliographic information may include other bibliographic information as a feature.

オブジェクト探索部14は、クエリ特徴抽出部12で抽出されたクエリの特徴と、探索対象オブジェクトDB30に格納された各オブジェクトのオブジェクト情報に含まれる特徴とを用いて、クエリと各オブジェクトとの類似度を算出し、探索対象オブジェクトDB30から、クエリとの類似度が高いオブジェクトのオブジェクト情報を、類似度が高い順に所定件数(例えば30件)取得する。   The object search unit 14 uses the query features extracted by the query feature extraction unit 12 and the features included in the object information of each object stored in the search target object DB 30 to use the similarity between the query and each object. And a predetermined number (for example, 30) of object information of objects having a high similarity with the query is acquired from the search target object DB 30 in descending order of the similarity.

クエリとオブジェクトとの類似度の算出について、探索対象オブジェクトが「絵本」の場合を例に説明する。まず、探索対象オブジェクトDB30に格納された各絵本のオブジェクト情報に含まれる特徴のうち、クエリ特徴抽出部12で抽出されたクエリの特徴と比較可能な特徴を用いて、各絵本の特徴ベクトルを作成する。ここでは、オブジェクトの特徴として、絵本に出現する自立語毎の出現回数を用いる。具体的には、探索対象オブジェクトDB30に格納されたオブジェクトの特徴としての各絵本に出現する自立語毎の出現回数を用いて、探索対象オブジェクトDB30にオブジェクト情報が格納された全ての絵本に出現した自立語の総種類数の次元を持ち、各次元に対応する要素が、ID順かつ各絵本の先頭ページからの出現順の自立語に対応するベクトルを、絵本一冊毎に作成する。そして、ベクトルの各要素に、その要素の次元に対応する自立語の各絵本における出現回数tf(term frequency)に、逆絵本出現頻度idf(inverse document frequency)を乗じた値tfidfを記入する。最後にベクトルの大きさを1に正規化して、各絵本の特徴ベクトルとする。tfidfは、例えば、下記(1)式〜(3)式に示すように算出することができる。   The calculation of the similarity between the query and the object will be described by taking a case where the search target object is “picture book” as an example. First, among the features included in the object information of each picture book stored in the search object DB 30, a feature vector of each picture book is created using features that can be compared with the query features extracted by the query feature extraction unit 12. To do. Here, the number of appearances of each independent word appearing in the picture book is used as the feature of the object. Specifically, using the number of appearances for each independent word appearing in each picture book as a feature of the object stored in the search target object DB 30, it appears in all picture books whose object information is stored in the search target object DB 30. For each picture book, a vector having dimensions of the total number of independent words, and elements corresponding to each dimension corresponding to the independent words in the order of ID and the order of appearance from the first page of each picture book. Then, a value tfidf obtained by multiplying the number of appearances tf (term frequency) in each picture book of an independent word corresponding to the dimension of the element by the inverse picture book appearance frequency idf (inverse document frequency) is written in each element of the vector. Finally, the size of the vector is normalized to 1 to obtain a feature vector for each picture book. tfidf can be calculated, for example, as shown in the following equations (1) to (3).

ここで、ni,jは自立語iの絵本jにおける出現回数である。Dは探索対象オブジェクトDB30にオブジェクト情報が格納されている絵本の総数、dは探索対象オブジェクトDB30にオブジェクト情報が格納されている絵本のうち、自立語iが出現する絵本の数である。 Here, n i, j is the number of appearances of the independent word i in the picture book j. D is the total number of picture books whose object information is stored in the search target object DB 30, and d is the number of picture books in which the independent word i appears among the picture books whose object information is stored in the search target object DB 30.

例えば、探索対象オブジェクトDB30に、総数3冊の絵本についてのオブジェクト情報が格納されており(D=3)、各絵本のオブジェクト情報に、下記のような自立語とその出現回数とで表された特徴が含まれているものとする。なお、IDがnの絵本を、以下では「絵本n」と表記する。
絵本1:A 3回, B 2回, C 2回
絵本2:A 1回, C 3回, D 2回
絵本3:A 2回, D 1回, E 2回
For example, object information about a total of three picture books is stored in the search target object DB 30 (D = 3), and the object information of each picture book is represented by the following independent words and the number of appearances thereof. Assume that features are included. Note that the picture book whose ID is n is hereinafter referred to as “picture book n”.
Picture Book 1: A 3 times, B 2 times, C 2 times Picture Book 2: A 1 time, C 3 times, D 2 times Picture Book 3: A 2 times, D 1 time, E 2 times

この場合、各自立語のidf(i=A,B,C,D,E)は下記(4)式となる。 In this case, idf i (i = A, B, C, D, E) of each independent word is expressed by the following equation (4).

また、絵本1についてのベクトルの各要素の値は、下記(5)式となる。 Further, the value of each element of the vector for the picture book 1 is expressed by the following equation (5).

最後にベクトルの大きさを1に正規化するために、各要素の二乗和の平方根で各要素を割る。結果得られる絵本1の特徴ベクトルvは下記(6)式となる。 Finally, in order to normalize the vector size to 1, each element is divided by the square root of the sum of squares of each element. The resulting feature vector v 1 of the picture book 1 is expressed by the following equation (6).

同様の手順で絵本2の特徴ベクトルv、及び絵本3の特徴ベクトルvを作成する。 The feature vector v 2 of the picture book 2 and the feature vector v 3 of the picture book 3 are created in the same procedure.

次に、クエリの特徴ベクトルを作成する。クエリ特徴抽出部12により、例えば、下記に示すような自立語とその出現回数とで表された特徴がクエリから抽出されたとする。
クエリ:A 2回, C 3回
Next, a feature vector of the query is created. Assume that the query feature extraction unit 12 extracts, for example, features represented by the following independent words and the number of appearances thereof from the query.
Query: A 2 times, C 3 times

クエリの特徴ベクトルの作成に当たり、tfidfを計算する際のidfの値は、探索対象オブジェクトDB30から求めた値、すなわち(4)式を利用する。その他については、下記(7)式に示すように絵本の特徴ベクトルと同様の手順で求める。 In preparing a feature vector of a query, the value of idf i in calculating tfidf utilizes values obtained from the search object DB 30, i.e., the expression (4). Others are obtained in the same procedure as the feature vector of the picture book as shown in the following equation (7).

最後にベクトルの大きさを1に正規化するために、各要素の二乗和の平方根で各要素を割り、クエリの特徴ベクトルvquery=(0,0,1,0,0)を作成する。なお、クエリに出現した自立語であって、探索対象オブジェクトDB30にオブジェクト情報が格納された絵本に出現しなかった自立語については無視すればよい。すなわち、その自立語についてはクエリの特徴ベクトルの要素として考慮しない。 Finally, in order to normalize the magnitude of the vector to 1, each element is divided by the square root of the sum of squares of each element to create a query feature vector v query = (0, 0, 1, 0, 0). Independent words that appear in the query and that do not appear in the picture book whose object information is stored in the search target object DB 30 may be ignored. That is, the independent word is not considered as an element of the query feature vector.

次に、作成したクエリの特徴ベクトルvqueryと、各絵本の特徴ベクトルv(n=1,2,3)の各々とのコサイン類似度を計算する。ここでは、特徴ベクトルはいずれも大きさが1に正規化されているので、コサイン類似度はvqueryとvとの内積と等価になる。また、自身との内積はコサイン類似度の最大値である1になる。 Next, the cosine similarity between the feature vector v query of the created query and each of the feature vectors v n (n = 1, 2, 3) of each picture book is calculated. Here, since the size one feature vector is normalized to 1, cosine similarity becomes the inner product equivalent to the v query and v n. Also, the inner product with itself becomes 1, which is the maximum value of cosine similarity.

オブジェクト探索部14は、探索対象オブジェクトDB30から、クエリの特徴との類似度が所定値以上の特徴を含むオブジェクト情報を取得する。ここでは、クエリの特徴ベクトルvqueryと各オブジェクトの特徴ベクトルvとのコサイン類似度が高い順に、予め指定された所定件数(例えば30件)のオブジェクト情報を取得する。なお、オブジェクトの取得件数は、類似度の上位所定件数に限らず、探索対象オブジェクトDB30に格納されたオブジェクト情報の総数を指定し、全てのオブジェクト情報を類似度順に取得してもよい。 The object search unit 14 acquires, from the search target object DB 30, object information including features whose similarity to the query features is a predetermined value or more. Here, the feature vector v query and cosine similarity between the feature vector v n of each object query in descending order, and acquires the object information of the pre-specified predetermined number (e.g., 30 cases). Note that the number of acquired objects is not limited to the upper predetermined number of similarities, and the total number of object information stored in the search target object DB 30 may be specified, and all object information may be acquired in order of similarity.

また、オブジェクト探索部14は、取得したオブジェクト情報に含まれる特徴の少なくとも一つに基づいて、各オブジェクト間の類似度を算出する。オブジェクト間の類似度は、例えば、上記で計算した各オブジェクトの特徴ベクトルのコサイン類似度により算出することができる。オブジェクト探索部14は、取得したオブジェクト情報、算出したオブジェクト間の類似度、及び算出したクエリと各オブジェクトとの類似度を、二次元座標算出部16へ受け渡す。   Moreover, the object search part 14 calculates the similarity between each object based on at least one of the features included in the acquired object information. The similarity between objects can be calculated by, for example, the cosine similarity of the feature vector of each object calculated above. The object search unit 14 passes the acquired object information, the calculated similarity between objects, and the calculated query and the similarity between each object to the two-dimensional coordinate calculation unit 16.

なお、各オブジェクト間の類似度、及びクエリと各オブジェクトとの類似度は、各々の特徴ベクトルの類似度から求める場合に限定されない。例えば、探索対象オブジェクトDB30にオブジェクト情報が格納された全ての2オブジェクトの組み合わせについて、主観的な類似度または非類似度を予め与えておくことができる。この場合、各オブジェクト間の類似度は、与えられた類似度または非類似度を直接用いることができる。また、クエリと各オブジェクトとの類似度は、クエリの特徴と一致する特徴を含むオブジェクト情報が示すオブジェクトと組み合わせたときの他のオブジェクトに与えられた類似度または非類似度を用いればよい。   In addition, the similarity between each object and the similarity between a query and each object are not limited to the case of obtaining from the similarity of each feature vector. For example, a subjective similarity or dissimilarity can be given in advance for all combinations of two objects whose object information is stored in the search target object DB 30. In this case, given similarity or dissimilarity can be directly used as the similarity between objects. The similarity between the query and each object may be the similarity or dissimilarity given to another object when combined with the object indicated by the object information including the feature that matches the feature of the query.

本実施の形態では、オブジェクト探索部14は、オブジェクト間の類似度を表す情報として、取得したオブジェクト情報を示すノードを設定し、各ノードが示すオブジェクト情報に含まれる特徴同士の類似度が所定値以上となるノード間をエッジで接続した部分ネットワーク構造を作成する(特開2008−293444号公報、及び特開2008−305072号公報参照)。オブジェクト探索部14は、取得したオブジェクト情報、及び算出したクエリと各オブジェクトとの類似度を、部分ネットワーク構造を構成する各ノードに保持させる。オブジェクト探索部14は、このようにして作成した部分ネットワーク構造を二次元座標算出部16へ受け渡す。   In the present embodiment, the object search unit 14 sets a node indicating acquired object information as information indicating the similarity between objects, and the similarity between features included in the object information indicated by each node is a predetermined value. A partial network structure in which the above nodes are connected by an edge is created (see Japanese Patent Laid-Open Nos. 2008-293444 and 2008-305072). The object search unit 14 stores the acquired object information and the similarity between the calculated query and each object in each node constituting the partial network structure. The object search unit 14 transfers the partial network structure thus created to the two-dimensional coordinate calculation unit 16.

二次元座標算出部16は、オブジェクト探索部14から受け渡されたオブジェクト情報、及び各オブジェクト間の類似度に基づいて、各オブジェクト情報を示すノードの二次元平面座標を算出する。この際、オブジェクト情報に含まれる特徴間の類似度が高いオブジェクト情報を示すノード同士は近くに配置され、類似度が低いオブジェクト情報を示すノード同士は遠くに配置されるような二次元平面座標を算出する。   The two-dimensional coordinate calculation unit 16 calculates the two-dimensional plane coordinates of the node indicating each object information based on the object information passed from the object search unit 14 and the similarity between the objects. At this time, two-dimensional plane coordinates are set such that nodes indicating object information having high similarity between features included in the object information are arranged close to each other, and nodes indicating object information having low similarity are arranged distant from each other. calculate.

本実施の形態では、オブジェクト探索部14から受け渡された部分ネットワーク構造を、バネ長固定のバネモデルとし、各オブジェクト情報を示すノードの二次元平面座標を算出する。具体的には、部分ネットワーク構造において、エッジで接続されたノード同士は近くに配置し、エッジで接続されていないノード同士は遠くに配置し、部分ネットワーク構造に含まれる全てのノードが安定な配置となるように、各ノードの二次元平面座標を求める。   In the present embodiment, the partial network structure delivered from the object search unit 14 is used as a spring model with a fixed spring length, and the two-dimensional plane coordinates of a node indicating each piece of object information are calculated. Specifically, in a partial network structure, nodes connected by edges are placed close to each other, nodes not connected by edges are placed far away, and all nodes included in the partial network structure are placed stably. The two-dimensional plane coordinates of each node are obtained so that

なお、オブジェクト情報に含まれる特徴間の類似度が高いオブジェクト情報を示すノード同士が近くに配置され、類似度が低いオブジェクト情報を示すノード同士が遠くに配置されるような二次元平面座標を算出することができる手法であれば、バネモデル以外の手法を用いてもよい。また、二次元平面座標は、上記のように、絵本に出現する自立語の出現回数で表されるオブジェクトの特徴を用いた特徴ベクトル間のコサイン類似度を用いて算出する場合に限らず、各ノードが示すオブジェクト情報間の関係に応じて算出すればよい。例えば、オブジェクト情報に含まれる特徴のいずれか(例えば「著者」)が一致するオブジェクトを示すノード同士は近く、特徴が異なるオブジェクトを示すノード同士は遠くに配置されるような二次元座標を算出してもよい。   Note that two-dimensional plane coordinates are calculated so that nodes indicating object information with high similarity between features included in the object information are arranged close to each other, and nodes indicating object information with low similarity are arranged far away. Any technique other than the spring model may be used as long as the technique can be used. In addition, as described above, the two-dimensional plane coordinates are not limited to the case where the two-dimensional plane coordinates are calculated using the cosine similarity between the feature vectors using the feature of the object represented by the number of times the independent word appears in the picture book. What is necessary is just to calculate according to the relationship between the object information which a node shows. For example, two-dimensional coordinates are calculated such that nodes indicating objects that match one of the features included in the object information (for example, “author”) are close to each other, and nodes indicating objects having different features are distant from each other. May be.

二次元座標算出部16は、算出した各ノードの二次元平面座標、及び各ノードが保持するオブジェクト情報及びクエリと各オブジェクトとの類似度を標高算出部18へ受け渡す。   The two-dimensional coordinate calculation unit 16 passes the calculated two-dimensional plane coordinates of each node, the object information held by each node, and the similarity between the query and each object to the elevation calculation unit 18.

標高算出部18は、オブジェクト探索部14で取得された各オブジェクト情報を示すノードについて、二次元座標算出部16から受け渡されたクエリと各オブジェクトとの類似度に応じた標高を算出する。標高とは、二次元座標算出部16により算出された各オブジェクト情報を示すノードの二次元平面座標に加えて三次元座標とするための高さ情報である。   The altitude calculation unit 18 calculates the altitude corresponding to the similarity between the query passed from the two-dimensional coordinate calculation unit 16 and each object for the node indicating each object information acquired by the object search unit 14. The altitude is height information for obtaining three-dimensional coordinates in addition to the two-dimensional plane coordinates of the node indicating each piece of object information calculated by the two-dimensional coordinate calculation unit 16.

標高としては、各オブジェクトの特徴ベクトルとクエリの特徴ベクトルとのコサイン類似度をそのまま用いてもよいし、コサイン類似度に所定の定数(例えば4)を乗算して、三次元座標における高さを強調するような標高を算出してもよい。高さを強調することにより、クエリに応じた所望のオブジェクトが属するクラスタが強調される。また、所望のオブジェクトが属するクラスタを強調するために、標高を、類似度の対数または平方根のような類似度の小さな値が強調される関数によって求めてもよいし、そのような関数により求めた値にさらに定数を乗じてもよい。   As the altitude, the cosine similarity between the feature vector of each object and the query feature vector may be used as it is, or the cosine similarity is multiplied by a predetermined constant (for example, 4) to obtain the height in three-dimensional coordinates. An elevation that emphasizes may be calculated. By emphasizing the height, a cluster to which a desired object corresponding to the query belongs is emphasized. Further, in order to emphasize the cluster to which the desired object belongs, the altitude may be obtained by a function that emphasizes a small value of similarity, such as the logarithm or square root of similarity, or by such a function. The value may be further multiplied by a constant.

なお、標高は、上記のように、絵本に出現する自立語の出現回数で表されるオブジェクトの特徴を用いた特徴ベクトル間のコサイン類似度を用いて算出する場合に限らず、オブジェクト情報とクエリとの関係に応じて算出すればよい。例えば、クエリに含まれる単語(例えば、自立語)が、オブジェクトの特徴のいずれか(例えば「タイトル」)に含まれる場合には、標高が高くなるように算出してもよい。   The elevation is not limited to the case where the altitude is calculated using the cosine similarity between the feature vectors using the feature of the object represented by the number of times the independent word appears in the picture book. What is necessary is just to calculate according to the relationship. For example, when a word (for example, an independent word) included in the query is included in any of the object characteristics (for example, “title”), the altitude may be calculated to be higher.

標高算出部18は、算出した各ノードの標高、並びに二次元座標算出部16から受け渡された各ノードの二次元平面座標、及び各ノードが保持するクエリと各オブジェクトとの類似度を三次元可視化結果提示部20へ受け渡す。   The altitude calculation unit 18 three-dimensionally calculates the altitude of each node, the two-dimensional plane coordinates of each node passed from the two-dimensional coordinate calculation unit 16, and the similarity between the query held by each node and each object. The result is transferred to the visualization result presentation unit 20.

三次元可視化結果提示部20は、二次元座標算出部16で算出された各ノードの二次元平面座標に、標高算出部18で算出された標高を加え、各オブジェクト情報を示すノードの三次元座標を求め、これを三次元グラフ上にプロットした三次元可視化結果を生成する。また、三次元可視化結果提示部20は、各ノードが示すオブジェクト情報に含まれる特徴の少なくとも一つを用いて、各ノードが示すオブジェクトが判別可能となるように編集する。図3に、探索対象オブジェクトを「絵本」とした場合の三次元可視化結果の一例を示す。図3では、オブジェクト情報に含まれる特徴の一つである絵本の表紙画像を、各ノードに貼り付けた例を示している。これにより、各ノードがどの絵本を表すかを表現することができる。また、表紙画像以外の他の特徴を用いてもよく、例えば、絵本のタイトルを示すテキストを用いてもよい。   The three-dimensional visualization result presentation unit 20 adds the elevation calculated by the elevation calculation unit 18 to the two-dimensional plane coordinate of each node calculated by the two-dimensional coordinate calculation unit 16, and the three-dimensional coordinates of the node indicating each object information , And a three-dimensional visualization result is generated by plotting it on a three-dimensional graph. In addition, the 3D visualization result presentation unit 20 edits the object indicated by each node so that the object indicated by each node can be identified using at least one of the features included in the object information indicated by each node. FIG. 3 shows an example of a three-dimensional visualization result when the search target object is “picture book”. FIG. 3 shows an example in which a cover image of a picture book that is one of the features included in the object information is pasted to each node. Thereby, it is possible to express which picture book each node represents. Moreover, you may use the characteristics other than a cover image, for example, you may use the text which shows the title of a picture book.

また、三次元可視化結果提示部20は、三次元可視化結果が表示された表示装置等において、各ノードの部分が選択された際に、選択されたノードが示すオブジェクト情報に関する補助情報を提示する。補助情報は、オブジェクトの特徴、特に書誌的事項を示す特徴、クエリと各オブジェクトとの類似度及び順位、寄与語等を含むことができる。寄与語とは、クエリとの類似度が高いオブジェクトとして選択されたことに対する寄与度が高い単語である。例えば、クエリの特徴ベクトルとオブジェクトの特徴ベクトルとのコサイン類似度を算出した際の各要素間の積が、他の要素より大きい要素に対応する自立語を寄与語とすることができる。   The 3D visualization result presentation unit 20 presents auxiliary information related to the object information indicated by the selected node when a portion of each node is selected on a display device or the like on which the 3D visualization result is displayed. The auxiliary information may include object characteristics, in particular, characteristics indicating bibliographic items, similarity and ranking between the query and each object, contributing words, and the like. A contribution word is a word with a high contribution with respect to having been selected as an object with a high similarity with a query. For example, an independent word corresponding to an element whose product between elements when a cosine similarity between a query feature vector and an object feature vector is calculated can be a contributing word.

また、三次元可視化結果提示部20は、クエリとの類似度が高いオブジェクトを示すノード、すなわち標高が高いノードほど表紙の枠に濃い色を付けるなどして、強調表示するようにしてもよい。また、提示した三次元グラフの視点、標高を算出した際の定数、バネモデルのバネ長や斥力などのパラメータの変更を、ユーザからのマウス操作やキーボードからの数値入力等により受け付けて、三次元可視化結果の表示を変更し、探索結果の三次元的な位置把握を助ける支援を行ってもよい。これにより、三次元可視化結果をユーザにとってより見易い状態で提示することができる。また、三次元可視化結果に、二次元平面に対応したグリッドであって、各グリッドの頂点付近に二次元平面座標を有するノードの標高(クエリと各オブジェクトとの類似度)に応じて頂点が決定されたグリッドを合わせて提示してもよい。これにより、三次元可視化結果に地形的な表現を加えることができ、各ノードの三次元座標位置をより直観的に把握し易くなる。   Further, the three-dimensional visualization result presentation unit 20 may highlight a node indicating an object having a high degree of similarity with the query, that is, a node having a higher altitude by adding a darker color to the cover frame. Also, changes in parameters such as the viewpoint of the presented 3D graph, the constants when calculating the altitude, and the spring length and repulsive force of the spring model are accepted by a user's mouse operation or numerical input from the keyboard, etc., for 3D visualization You may change the display of a result and may perform assistance which helps grasp the three-dimensional position of a search result. Thereby, a three-dimensional visualization result can be presented in a state that is easier for the user to see. In addition, the 3D visualization results indicate a grid corresponding to a 2D plane, and the vertex is determined according to the altitude (similarity between the query and each object) of a node having a 2D plane coordinate near the vertex of each grid. The displayed grid may be presented together. As a result, a topographical expression can be added to the three-dimensional visualization result, and the three-dimensional coordinate position of each node can be grasped more intuitively.

図4に、補助情報、及び三次元可視化結果の表示の変更を行うためのコントロール画面の一例を示す。図4の例では、コントロール画面の「インフォメーション」タブに、クエリとの類似度の順位、絵本のタイトル、表紙画像、著者等のオブジェクトの書誌情報、クエリとの類似度、及び寄与語等の補助情報を表示している。また、詳細な図示は省略するが、「表示設定」タブ及び「バネモデル設定」タブを、上述の各種パラメータを変更するための画面とすることができる。なお、上記の例以外にも補助情報や、探索結果の三次元的な位置把握を助ける支援を追加してもよい。   FIG. 4 shows an example of a control screen for changing the display of the auxiliary information and the three-dimensional visualization result. In the example of FIG. 4, on the “information” tab of the control screen, the order of similarity to a query, picture book title, cover image, bibliographic information of an object such as an author, similarity to a query, and contribution words are supported. Information is displayed. Although not shown in detail, the “display setting” tab and the “spring model setting” tab can be used as a screen for changing the various parameters described above. In addition to the above example, auxiliary information and support for helping to grasp the three-dimensional position of the search result may be added.

図3の三次元可視化結果の例は、より具体的には、探索対象オブジェクトを「絵本」とし、クエリ「AAAとBBBは海で泳ぎました」(“AAA”及び“BBB”は、「AAAとBBB」というシリーズものの絵本に登場するキャラクタの名前)に対して、探索対象オブジェクトDB30にオブジェクト情報が格納された絵本から、自立語の出現回数で表される特徴を用いた特徴ベクトル間のコサイン類似度が高い絵本を30件取得した探索結果を示すものである。   In the example of the 3D visualization result in FIG. 3, more specifically, the search target object is “picture book”, and the query “AAA and BBB swims in the sea” (“AAA” and “BBB” are “AAA”. CBB between feature vectors using features represented by the number of appearances of independent words from a picture book whose object information is stored in the search target object DB 30. The search result which acquired 30 picture books with high similarity is shown.

図3において、左の円に囲まれたノード群は、標高(クエリとの類似度)が他のノードと比較して高いが、これらは補助情報を参照すると、「AAA」及び「BBB」といった単語がキーとなって類似であると判定された絵本群であることがわかる。すなわち、「AAA」と「BBB」というキャラクタが登場する「AAAとBBB」とうシリーズものの絵本群を示すクラスタであるといえる。一方、右の円に囲まれたノード群は、標高は他のノードと比較して低いが、これらは「海」及び「泳ぐ」といった単語がキーとなって類似であると判定された絵本であることがわかる。すなわち、海での出来事に関する内容を含む絵本群を示すクラスタであるといえる。図3の例では、入力したクエリから、シリーズものの絵本と、海での出来事に関する内容を含む絵本との二通りの観点について、クエリとの類似度が高い探索結果を得ることができる。   In FIG. 3, the node group surrounded by the left circle has a higher altitude (similarity to the query) than other nodes, but these are referred to as “AAA” and “BBB” when referring to the auxiliary information. It can be seen that the word groups are picture book groups determined to be similar. That is, it can be said that it is a cluster indicating a picture book group of a series “AAA and BBB” in which characters “AAA” and “BBB” appear. On the other hand, the nodes surrounded by the circle on the right are lower in elevation than other nodes, but these are picture books that are determined to be similar with the words “sea” and “swim” as keys. I know that there is. That is, it can be said that it is a cluster indicating a picture book group including contents related to events at sea. In the example of FIG. 3, a search result having a high degree of similarity with a query can be obtained from the input query with respect to two viewpoints of a picture book of a series and a picture book including contents related to an event at sea.

従来の三次元可視化手法では、クエリに応じた結果の可視化は行われないため、上述のようなシリーズものの絵本のクラスタ、及び海での出来事に関する内容を含む絵本のクラスタの各々をクラスタとして把握できるような情報提示を行うことができるとは限らないが、本実施の形態では、クエリに応じた結果の可視化が行われるため、クエリの持つ特徴(ここでは、シリーズものの一冊で、かつ海が舞台、という特徴)が明確に把握できる効果的な可視化が行える。   The conventional 3D visualization method does not visualize the result according to the query, so it is possible to grasp each of the above-mentioned series of picture book clusters and picture book clusters including contents related to the events in the sea as clusters. However, in this embodiment, since the result is visualized according to the query, the characteristics of the query (in this case, one volume of the series and the ocean It is possible to effectively visualize the stage).

このような情報提示を行うことで、三次元可視化結果における各オブジェクトを示すノードの標高を手掛かりに、探索された複数のオブジェクトのクラスタを把握する手助けとなる。また、補助情報を参照することで、標高を手掛かりに把握したクラスタの意味付けを確認することができる。   By presenting such information, it is possible to help grasp a cluster of a plurality of searched objects by using the altitude of the node indicating each object in the three-dimensional visualization result as a clue. Also, by referring to the auxiliary information, it is possible to confirm the meaning of the cluster grasped by the altitude.

次に、第1の実施の形態に係る情報提示装置10の作用について説明する。情報提示装置10では、図5に示す情報提示処理ルーチンが実行される。   Next, the operation of the information presentation apparatus 10 according to the first embodiment will be described. In the information presentation device 10, an information presentation processing routine shown in FIG. 5 is executed.

ステップ100で、クエリ特徴抽出部12が、入力されたクエリを受け付け、クエリから特徴を抽出し、抽出したクエリの特徴を、オブジェクト探索部14へ受け渡す。例えば、クエリ特徴抽出部12は、クエリとして与えられたテキストデータを形態素解析器によって単語単位に分割すると共に、各単語に品詞等の情報を付与した形態素解析結果を得る。そして、クエリ特徴抽出部12は、形態素解析結果の品詞等の情報を参照して、例えば自立語を抽出し、各自立語のクエリ内での出現回数をカウントし、各自立語とその出現回数との羅列をクエリの特徴とする。   In step 100, the query feature extraction unit 12 receives the input query, extracts a feature from the query, and passes the extracted query feature to the object search unit 14. For example, the query feature extraction unit 12 divides text data given as a query into words by a morphological analyzer, and obtains a morphological analysis result in which information such as part of speech is added to each word. Then, the query feature extraction unit 12 refers to information such as the part of speech of the morphological analysis result, extracts, for example, independent words, counts the number of appearances of each independent word in the query, and each independent word and the number of appearances thereof. The characteristic of the query is the enumeration of

次に、ステップ102で、オブジェクト探索部14が、クエリ特徴抽出部12から受け渡されたクエリの特徴を用いて、探索対象オブジェクトDB30から、クエリとの類似度が高いオブジェクト情報を取得する。例えば、オブジェクト探索部14は、クエリ特徴抽出部12で抽出されたクエリの特徴から作成した特徴ベクトルと、探索対象オブジェクトDB30に格納された各オブジェクトのオブジェクト情報に含まれる特徴のうち、クエリの特徴と比較可能な特徴から作成した特徴ベクトルとのコサイン類似度を、クエリと各オブジェクトとの類似度として算出し、探索対象オブジェクトDB30から、クエリとの特徴ベクトル間の類似度が高いオブジェクト情報を、類似度が高い順に所定件数(例えば30件)取得する。   Next, in step 102, the object search unit 14 acquires object information having a high similarity to the query from the search target object DB 30 using the query features passed from the query feature extraction unit 12. For example, the object search unit 14 uses the feature of the query among the feature vectors created from the query features extracted by the query feature extraction unit 12 and the features included in the object information of each object stored in the search target object DB 30. The cosine similarity with the feature vector created from the features that can be compared with is calculated as the similarity between the query and each object, and the object information having a high similarity between the feature vectors with the query is obtained from the search target object DB 30. A predetermined number (for example, 30) is acquired in descending order of similarity.

そして、オブジェクト探索部14は、取得した各オブジェクト情報に含まれる特徴の少なくとも一つに基づいて、各オブジェクト間の類似度を算出し、取得したオブジェクト情報、算出したオブジェクト間の類似度、及び算出したクエリと各オブジェクトとの類似度を二次元座標算出部16へ受け渡す。例えば、オブジェクト探索部14は、取得したオブジェクトの特徴間の類似度に基づいて、取得したオブジェクト情報を示すノードを設定し、各ノードが示すオブジェクト情報に含まれる特徴同士の類似度が所定値以上となるノード間をエッジで接続し、各ノードにオブジェクト情報及びクエリと各オブジェクトとの類似度を保持させた部分ネットワーク構造を作成して、二次元座標算出部16へ受け渡す。   Then, the object search unit 14 calculates the similarity between the objects based on at least one of the features included in the acquired object information, and acquires the acquired object information, the calculated similarity between the objects, and the calculation. The degree of similarity between the query and each object is transferred to the two-dimensional coordinate calculation unit 16. For example, the object search unit 14 sets a node indicating the acquired object information based on the similarity between the acquired object features, and the similarity between the features included in the object information indicated by each node is equal to or greater than a predetermined value. The nodes to be connected are connected by edges, and a partial network structure in which the object information and the similarity between the query and each object are held in each node is created and transferred to the two-dimensional coordinate calculation unit 16.

次に、ステップ104で、二次元座標算出部16が、オブジェクト探索部14から受け渡されたオブジェクト情報及び各オブジェクト間の類似度に基づいて、各オブジェクト情報を示すノードの二次元位置平面座標を、オブジェクト情報に含まれる特徴間の類似度が高いオブジェクト情報を示すノード同士は近くに配置され、類似度が低いオブジェクト情報を示すノード同士は遠くに配置されるように算出する。例えば、二次元座標算出部16は、オブジェクト探索部14から受け渡された部分ネットワーク構造を、バネ長固定のバネモデルとし、エッジで接続されたノード同士は近くに配置し、エッジで接続されていないノード同士は遠くに配置し、部分ネットワーク構造に含まれる全てのノードが安定な配置となるように、各ノードの二次元平面座標を求める。そして、二次元座標算出部16は、算出した各ノードの二次元平面座標、各ノードが保持するオブジェクト情報、及びクエリと各オブジェクトとの類似度を標高算出部18へ受け渡す。   Next, in step 104, the two-dimensional coordinate calculation unit 16 calculates the two-dimensional position plane coordinates of the node indicating each object information based on the object information passed from the object search unit 14 and the similarity between the objects. The nodes indicating object information with high similarity between features included in the object information are arranged close to each other, and the nodes indicating object information with low similarity are arranged so as to be distant. For example, the two-dimensional coordinate calculation unit 16 uses the partial network structure delivered from the object search unit 14 as a spring model with a fixed spring length, and nodes connected by edges are arranged close to each other and are not connected by edges. The nodes are arranged far from each other, and the two-dimensional plane coordinates of each node are obtained so that all the nodes included in the partial network structure are stably arranged. Then, the two-dimensional coordinate calculation unit 16 passes the calculated two-dimensional plane coordinates of each node, the object information held by each node, and the similarity between the query and each object to the elevation calculation unit 18.

次に、ステップ106で、標高算出部18が、オブジェクト探索部14で取得された各オブジェクト情報を示すノードについて、二次元座標算出部16から受け渡されたクエリと各オブジェクトとの類似度に応じた標高を算出する。標高算出部18は、算出した各ノードの標高、並びに二次元座標算出部16から受け渡された各ノードの二次元平面座標、各ノードが保持するオブジェクト情報及びクエリと各オブジェクトとの類似度を三次元可視化結果提示部20へ受け渡す。   Next, in step 106, the altitude calculation unit 18 responds to the degree of similarity between the query passed from the two-dimensional coordinate calculation unit 16 and each object for the node indicating each object information acquired by the object search unit 14. Calculate the altitude. The elevation calculation unit 18 calculates the calculated elevation of each node, the two-dimensional plane coordinates of each node passed from the two-dimensional coordinate calculation unit 16, the object information held by each node, and the similarity between the query and each object. Passed to the three-dimensional visualization result presentation unit 20.

次に、ステップ108で、三次元可視化結果提示部20が、二次元座標算出部16で算出された各ノードの二次元平面座標に、標高算出部18で算出された標高を加え、各オブジェクト情報を示すノードの三次元座標を求め、これを三次元グラフ上にプロットした三次元可視化結果を生成する。そして、三次元可視化結果提示部20は、各ノードが示すオブジェクト情報に含まれる特徴の少なくとも一つを用いて、各ノードが示すオブジェクトが判別可能となるように編集する。例えば、探索対象オブジェクトが「絵本」の場合には、その絵本の表紙画像を各ノードに貼り付ける。また、三次元可視化結果提示部20は、その他の補助情報や、探索結果の三次元的な位置把握を助ける支援機能を追加して、三次元可視化結果が表示装置に提示されるように出力し、情報提示処理ルーチンを終了する。   Next, in step 108, the three-dimensional visualization result presentation unit 20 adds the elevation calculated by the elevation calculation unit 18 to the two-dimensional plane coordinates of each node calculated by the two-dimensional coordinate calculation unit 16, and each object information Is obtained, and a three-dimensional visualization result is generated by plotting it on a three-dimensional graph. Then, the three-dimensional visualization result presentation unit 20 edits the object indicated by each node so that the object indicated by each node can be determined using at least one of the features included in the object information indicated by each node. For example, when the search target object is “picture book”, the cover image of the picture book is pasted to each node. In addition, the 3D visualization result presentation unit 20 adds other auxiliary information and a support function that helps grasp the 3D position of the search result, and outputs the 3D visualization result to be presented on the display device. Then, the information presentation processing routine is terminated.

以上説明したように、第1の実施の形態に係る情報提示装置によれば、クエリに類似するオブジェクトの各々を示すノードの三次元座標を、オブジェクト間の類似度に基づく二次元平面座標、及びクエリとオブジェクトとの類似度に基づく標高で表現することにより、どのクエリにも画一的であった従来手法の三次元可視化に比して、各オブジェクト群がクエリに応じて分離されるため、クエリ毎に最適な情報提示を行うことができる。   As described above, according to the information presentation apparatus according to the first embodiment, the three-dimensional coordinates of the node indicating each of the objects similar to the query, the two-dimensional plane coordinates based on the similarity between the objects, and By expressing the altitude based on the similarity between the query and the object, each object group is separated according to the query compared to the 3D visualization of the conventional method that was uniform for any query. Optimal information can be presented for each query.

また、オブジェクトに関する複数の特徴をオブジェクト情報に含めることにより、例えば、オブジェクトの内容自体から抽出した特徴を用いて、探索結果に含まれる複数のオブジェクト間の類似関係、及びオブジェクトとクエリとの類似関係を表現すると共に、オブジェクトの書誌的事項を示す特徴を用いて、探索結果に含まれる複数のオブジェクトを識別する等のように、オブジェクトの複数の特徴を融合して、オブジェクト間及びオブジェクトとクエリとの類似関係を可視化することができる。   In addition, by including a plurality of features related to the object in the object information, for example, using the features extracted from the content of the object itself, the similarity between the plurality of objects included in the search result, and the similarity between the object and the query And by combining features of objects such as identifying a plurality of objects included in a search result using features indicating bibliographic items of the objects. Can be visualized.

図6及び図7に、探索対象オブジェクトを「絵本」とした場合のクエリ毎の探索結果の一例を示す。図6の例は、クエリとしてキーワード「α」を用いた場合の探索結果の一例である。「XXX」という絵本を示すノードの標高が高く、「YYY」という絵本を示すノードの標高が低い探索結果であることを示している。図7の例は、クエリとしてキーワード「β」を用いた場合の探索結果の一例である。図6の場合と同様に、「XXX」及び「YYY」という絵本が探索結果に含まれるが、「XXX」という絵本を示すノードの標高は図6の場合に比べ低く、「YYY」という絵本を示すノードの標高は図6の場合に比べて高くなっている。   FIG. 6 and FIG. 7 show an example of the search result for each query when the search target object is “picture book”. The example of FIG. 6 is an example of a search result when the keyword “α” is used as a query. This indicates that the search result is that the altitude of the node indicating the picture book “XXX” is high and the altitude of the node indicating the picture book “YYY” is low. The example of FIG. 7 is an example of a search result when the keyword “β” is used as a query. As in the case of FIG. 6, the search results include the picture books “XXX” and “YYY”, but the elevation of the node indicating the picture book “XXX” is lower than that in FIG. The altitude of the node shown is higher than in the case of FIG.

このように、異なるクエリに対する探索結果に同じオブジェクトが含まれる場合でも、クエリとオブジェクトとの関係に応じて、そのオブジェクトを示すノードの標高が異なり、クエリに応じた探索結果となる。   As described above, even when the same object is included in search results for different queries, the altitude of the node indicating the object differs depending on the relationship between the query and the object, and the search result corresponds to the query.

<第2の実施の形態>
次に、第2の実施の形態について説明する。第1の実施の形態では、例えば図3に示すような三次元可視化結果及び図4に示すような補助情報を観察することで、ユーザがクラスタの分離を把握する場合について説明したが、第2の実施の形態では、クラスタを自動的に分離する場合について説明する。なお、第2の実施の形態に係る情報提示装置において、第1の実施の形態に係る情報提示装置10と同一の部分については、同一符号を付して、詳細な説明を省略する。
<Second Embodiment>
Next, a second embodiment will be described. In the first embodiment, for example, the case where the user grasps the separation of the clusters by observing the three-dimensional visualization result as shown in FIG. 3 and the auxiliary information as shown in FIG. 4 has been described. In this embodiment, a case will be described in which clusters are automatically separated. In the information presentation device according to the second embodiment, the same parts as those of the information presentation device 10 according to the first embodiment are denoted by the same reference numerals, and detailed description thereof is omitted.

図8に示すように、第2の実施の形態に係る情報提示装置210は、機能的には、クエリ特徴抽出部12、オブジェクト探索部14、二次元座標算出部16、標高算出部18、クラスタリング部19、及び三次元可視化結果提示部20を含んだ構成で表すことができる。   As shown in FIG. 8, the information presentation apparatus 210 according to the second embodiment functionally includes a query feature extraction unit 12, an object search unit 14, a two-dimensional coordinate calculation unit 16, an altitude calculation unit 18, and a clustering. It can represent with the structure containing the part 19 and the three-dimensional visualization result presentation part 20. FIG.

クラスタリング部19は、二次元座標算出部16で算出された各ノードの二次元平面座標に、標高算出部18で算出された標高を加え、各オブジェクト情報を示すノードの三次元座標を求め、各オブジェクト情報を示すノードをクラスタに分離する。   The clustering unit 19 adds the elevation calculated by the elevation calculation unit 18 to the two-dimensional plane coordinates of each node calculated by the two-dimensional coordinate calculation unit 16, and obtains the three-dimensional coordinates of the node indicating each object information. A node indicating object information is separated into clusters.

具体的には、クラスタリング部19は、グラフのエッジに関する媒介中心性(betweenness centerality)という概念を導入する。グラフのエッジに関する媒介中心性とは、グラフ中の全ての2ノードの組み合わせについて、2ノード間の最短経路中に最も多く現れるエッジがそのグラフにおいて中心であるという考え方である。例えば、図9に示すグラフを例にとると、各2ノード間の最短経路は下記の通りである。   Specifically, the clustering unit 19 introduces the concept of betweenness centerality regarding the edges of the graph. The intermediary centrality regarding the edge of the graph is an idea that, for all combinations of two nodes in the graph, the edge that appears most frequently in the shortest path between the two nodes is the center in the graph. For example, taking the graph shown in FIG. 9 as an example, the shortest path between each two nodes is as follows.

AB: A→B
AC: A→C
AD: A→B→D
AE: A→B→D→E
AF: A→B→D→F
AG: A→B→D→F→G
BC: B→C
BD: B→D
BE: B→D→E
BF: B→D→F
BG: B→D→F→G
CD: C→B→D
CE: C→B→D→E
CF: C→B→D→F
CG: C→B→D→F→G
DE: D→E
DF: D→F
DG: D→F→G
EF: E→F
EG: E→G
FG: F→G
AB: A → B
AC: A → C
AD: A → B → D
AE: A → B → D → E
AF: A → B → D → F
AG: A → B → D → F → G
BC: B → C
BD: B → D
BE: B → D → E
BF: B → D → F
BG: B → D → F → G
CD: C → B → D
CE: C → B → D → E
CF: C → B → D → F
CG: C → B → D → F → G
DE: D → E
DF: D → F
DG: D → F → G
EF: E → F
EG: E → G
FG: F → G

これら最短経路の中で、最も多く現れるのは、B→Dのエッジで、12回現れる。このエッジを枝刈りすることで、図9に示すグラフを、A、B、及びCのノード群とD、E、F、及びGのノード群との二つのクラスタに分離できる。   Of these shortest paths, the most frequently appearing edge is B → D and appears 12 times. By pruning this edge, the graph shown in FIG. 9 can be separated into two clusters of A, B, and C node groups and D, E, F, and G node groups.

しかし、一本のエッジを取り除いてもクラスタに分かれない場合がある。この場合、エッジを取り除いた後で、再度各クラスタにおいて最短経路に現れるエッジの出現回数を調べ、媒介中心性が最大のエッジを枝刈りする。それでもクラスタに分かれない場合は、媒介中心性が最大のエッジを、クラスタに分かれるまで枝刈りし続ける。   However, even if one edge is removed, it may not be divided into clusters. In this case, after removing the edge, the number of appearances of the edge appearing in the shortest path in each cluster is checked again, and the edge having the maximum mediation centrality is pruned. If it still does not divide into clusters, it continues pruning the edge with the greatest median centrality until it is divided into clusters.

実際には、いくつのクラスタに別れるまで枝刈りすればよいかの判断は難しく、また、極論すれば全てのエッジを枝刈りすればノード数分のクラスタに分かれたということもできる。そこで、例えば、modularity maximizationという手法(参照非特許文献1「Newman, M. E. J. “Modularity and community structure in networks”. PROCEEDINGS- NATIONAL ACADEMY OF SCIENCES USA 103 (23), 2006」)を用いることができる。この手法では、直感的に「あるノードから同じクラスタに所属されているノードへのエッジが別のクラスタに所属しているノードへのエッジに比べて多いときに大きくなる」関数、例えば、下記(8)式に示すような、良いクラスタ分離ができているであろう期待値といえる指標であるモジュラリティQを導入して、エッジを枝刈りする度にQを調べ、Qが最大値を取る回数だけ媒介中心性が最大のエッジを枝刈りしている。   Actually, it is difficult to determine how many clusters are to be pruned until they are separated, and it can be said that if all the edges are pruned, it is divided into clusters corresponding to the number of nodes. Therefore, for example, a technique called modularity maximization (Reference Non-Patent Document 1 “Newman, M. E. J.“ Modularity and community structure in networks ”. PROCEEDINGS-NATIONAL ACADEMY OF SCIENCES USA 103 (23), 2006”) can be used. In this method, an intuitively “function that increases when there are more edges from one node to a node belonging to the same cluster than an edge to a node belonging to another cluster”, for example ( 8) Modularity Q, which is an index that can be said to be a good cluster separation, is introduced as shown in equation (8), and Q is examined every time an edge is pruned, and Q takes the maximum value. The pruning edge is pruned as many times as the median centrality.

ここで、Nはノード総数、Aはグラフの隣接行列で、Ai,jはi番目のノードとj番目のノードとの隣接行列の値、kはi番目のノードに接合するエッジ数、Mはグラフの総エッジ数である。 Here, N is the total number of nodes, A is the adjacency matrix of the graph, A i, j is the value of the adjacency matrix between the i-th node and the j-th node, k i is the number of edges joined to the i-th node, M is the total number of edges in the graph.

また、クラスタリング部19は、自動アノテーションを行い、例えばクラスタ内のノードが示すオブジェクト情報が共通して持っている情報をクラスタ名とする。具体的には、クラスタリング部19は、オブジェクト探索部14でクエリと各オブジェクトとの類似度を算出する際に用いた特徴のうち、クエリ及びオブジェクトの双方に存在した特徴を取得する。例えば、上述のように、探索対象オブジェクトを「絵本」とした場合であって、特徴として自立語の出現回数を用いた場合には、クエリの特徴ベクトルと探索対象オブジェクトDB30にオブジェクト情報が格納された絵本の各々の特徴ベクトルとの双方に要素として共通して含まれる自立語を取得する。そして、各クラスタに所属する全てのノードの各々が示すオブジェクト情報の各々に含まれる特徴において、取得した共通の自立語の出現回数を積算し、最も出現回数が多い共通の自立語を、そのクラスタの名前とする。   Further, the clustering unit 19 performs automatic annotation, and uses, for example, information that is shared by the object information indicated by the nodes in the cluster as the cluster name. Specifically, the clustering unit 19 acquires features that exist in both the query and the object among the features used when the object search unit 14 calculates the similarity between the query and each object. For example, as described above, when the search target object is a “picture book” and the number of independent words appears as a feature, object information is stored in the query feature vector and the search target object DB 30. Independent words included in common as elements in both feature vectors of the picture book are acquired. Then, in the features included in each of the object information shown by each of all the nodes belonging to each cluster, the number of appearances of the acquired common independent words is accumulated, and the common independent word having the highest number of appearances is The name of

例えば、クラスタ分離を行った各ノードが示すオブジェクト情報に含まれる特徴に、図10及び下記に示すように、クエリ及び絵本(オブジェクト)の双方に共通の自立語が存在したとする。
A:α,γ
B:α,λ
C:α,Δ
D:α,β,Δ
E:β,Δ
F:β,η
G:η,ν
For example, as shown in FIG. 10 and the following, it is assumed that a common independent word exists in both the query and the picture book (object) in the feature included in the object information indicated by each node subjected to cluster separation.
A: α, γ
B: α, λ
C: α, Δ
D: α, β, Δ
E: β, Δ
F: β, η
G: η, ν

この場合、A、B、及びCのノード群のクラスタは、出現回数が最も多い自立語「α」と命名される。ユーザは、A、B、及びCのノード群のクラスタについて、クラスタ名「α」を見ることで、そのクラスタが「α」に関連したクラスタだと認識することが容易になる。一方、D、E、F、及びGのノード群のクラスタは、出現回数が最も多い自立語「β」と命名される。ノードGが示す絵本には自立語「β」は現れないが、自立語「β」を有するノードE及びFが示す絵本と同一のクラスタに所属していることから、ユーザはノードGが示す絵本は自立語「β」に関連した絵本であると理解することができる。   In this case, the cluster of the node group of A, B, and C is named as an independent word “α” having the highest number of appearances. By viewing the cluster name “α” for the clusters of the node groups A, B, and C, the user can easily recognize that the cluster is related to “α”. On the other hand, the cluster of the node group of D, E, F, and G is named as an independent word “β” having the highest number of appearances. Although the self-supporting word “β” does not appear in the picture book indicated by the node G, it belongs to the same cluster as the picture book indicated by the nodes E and F having the self-supporting word “β”. Can be understood as a picture book related to the independent word “β”.

なお、クラスタ名に用いる情報は、上記のように、クエリと各オブジェクトとの共通の自立語に限らず、クエリとオブジェクト情報に含まれる他の特徴とで共通する情報を取得してもよい。例えば、クエリに含まれる単語と、特徴の一つである絵本のタイトルに含まれる単語とで共通する単語を取得し、上記のようにクラスタ内で最も出現回数が多い共通の単語を、そのクラスタのクラスタ名としてもよい。   As described above, the information used for the cluster name is not limited to a common independent word between the query and each object, and information common to the query and other features included in the object information may be acquired. For example, a word that is common to a word included in a query and a word included in the title of a picture book that is one of the features is acquired, and the common word that appears the most in the cluster as described above It may be a cluster name.

なお、上記では、modularity maximizationという手法を用いてクラスタの分離を行う場合について説明したが、min cut(参照非特許文献2「FORD, L. R., AND FULKERSON, D. R. “Maximal flow through a network.” Can. J. Math. 8, 399 − 404, 1956.」、spectral clustering(参照非特許文献3「U Von Luxburg, “A tutorial on spectral clustering,” Statistics and computing, 2007」、トピックモデル「参照非特許文献4「DM Blei, AY Ng, MI Jordan, “Latent dirichlet allocation,” the Journal of machine Learning research, 2003」等の手法を用いてもよい。クラスタの分離は、分野によってgraph portioning、block modeling、hierarchical clustering、community structure detectionなど様々な文脈で語られることがあるが、本実施の形態でいうクラスタの分離は、これら全てを意味する。   In the above description, the case where the separation of clusters is performed using the technique called modularity maximization has been described. J. Math. 8, 399−404, 1956 ”, spectral clustering (reference non-patent document 3“ U Von Luxburg, “A tutorial on spectral clustering,” Statistics and computing, 2007 ”, topic model“ reference non-patent document 4 “DM Blei, AY Ng, MI Jordan,“ Latent dirichlet allocation, ”the Journal of machine Learning research, 2003” etc. may be used. Although it may be said in various contexts such as community structure detection, the separation of clusters in this embodiment means all of them.

次に、第2の実施の形態に係る情報提示装置210の作用について説明する。情報提示装置210では、図11に示す情報提示処理ルーチンが実行される。なお、図5に示す第1の実施の形態における情報提示処理ルーチンと同一の処理については、同一符号を付して、詳細な説明を省略する。   Next, the operation of the information presentation device 210 according to the second embodiment will be described. In the information presentation device 210, an information presentation processing routine shown in FIG. 11 is executed. In addition, about the process same as the information presentation process routine in 1st Embodiment shown in FIG. 5, the same code | symbol is attached | subjected and detailed description is abbreviate | omitted.

ステップ100〜106で、クエリに類似するオブジェクト情報群を取得し、各オブジェクト情報を示すノードの二次元平面座標及び標高を算出する。   In steps 100 to 106, an object information group similar to the query is acquired, and the two-dimensional plane coordinates and altitude of the node indicating each object information are calculated.

次に、ステップ200で、クラスタリング部19が、二次元座標算出部16で算出された各ノードの二次元平面座標に、標高算出部18で算出された標高を加え、各オブジェクトを示すノードの三次元座標を求める。そして、例えばグラフのエッジに関する媒介中心性(betweenness centerality)という概念を導入し、エッジの枝刈りを行うことで、各ノードをクラスタに分離する。   Next, in step 200, the clustering unit 19 adds the elevation calculated by the elevation calculation unit 18 to the two-dimensional plane coordinates of each node calculated by the two-dimensional coordinate calculation unit 16, and the tertiary of the node indicating each object. Find original coordinates. Then, for example, by introducing the concept of betweenness centerality regarding the edges of the graph and pruning the edges, each node is separated into clusters.

次に、ステップ202で、クラスタリング部19が、クラスタ内のノードが示すオブジェクト情報が共通して持っている情報、例えば、クエリとオブジェクトとに共通して出現する自立語のうち、クラスタに所属するノードが示すオブジェクト情報に含まれる特徴における出現回数が最も多い共通の自立語を取得し、そのクラスタのクラスタ名として命名する。   Next, in step 202, the clustering unit 19 belongs to the cluster among the information that the object information indicated by the nodes in the cluster has in common, for example, independent words that appear in common in the query and the object. A common independent word having the highest number of appearances in the feature included in the object information indicated by the node is acquired and named as the cluster name of the cluster.

次に、ステップ108で、上記ステップ200で分離したクラスタ、及び上記ステップ202で命名したクラスタ名と共に、三次元可視化結果を提示して、情報提示処理ルーチンを終了する。   Next, in step 108, the three-dimensional visualization result is presented together with the cluster separated in step 200 and the cluster name named in step 202, and the information presentation processing routine is terminated.

以上説明したように、第2の実施の形態に係る情報提示装置によれば、オブジェクト情報のクラスタ分離及びクラスタの命名を自動的に行うことができるため、ユーザによるクラスタの分離の把握を容易にすることができる。   As described above, according to the information presentation apparatus according to the second embodiment, it is possible to automatically perform cluster separation of object information and cluster naming, so that the user can easily grasp the separation of clusters. can do.

なお、本発明は、上記実施の形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。   The present invention is not limited to the above embodiment, and various modifications and applications can be made without departing from the gist of the present invention.

また、本願明細書中において、プログラムが予めインストールされている実施の形態として説明したが、外部の記憶装置や記録媒体等に格納されたプログラムを随時読み込んで、またインターネットを介してダウンロードして実行するようにしてもよい。また、当該プログラムを、コンピュータ読み取り可能な記録媒体に格納して提供することも可能である。   In the specification of the present application, the program has been described as an embodiment in which the program is installed in advance. However, the program stored in an external storage device or recording medium is read as needed, and is downloaded and executed via the Internet. You may make it do. In addition, the program can be provided by being stored in a computer-readable recording medium.

10、210 情報提示装置
12 クエリ特徴抽出部
14 オブジェクト探索部
16 二次元座標算出部
18 標高算出部
19 クラスタリング部
20 三次元可視化結果提示部
DESCRIPTION OF SYMBOLS 10,210 Information presentation apparatus 12 Query feature extraction part 14 Object search part 16 Two-dimensional coordinate calculation part 18 Elevation calculation part 19 Clustering part 20 Three-dimensional visualization result presentation part

Claims (6)

オブジェクトに関する少なくとも一種類の特徴を含む複数のオブジェクト情報から、入力されたクエリとの類似度が第1所定値以上のオブジェクト情報を複数探索する探索部と、
前記探索部により探索された複数のオブジェクト情報の各々を示すノードの各々の二次元平面座標を、各ノード間の距離が、該各ノードが示すオブジェクト情報間の関係のみに応じた距離となり、前記オブジェクト情報に含まれる特徴間の類似度が高いオブジェクト情報を示すノード同士が近く、類似度が低いオブジェクト情報を示すノード同士が遠く配置されるように算出すると共に、前記ノードの各々の高さ情報を、該ノードが示すオブジェクト情報と前記クエリとの関係のみに応じた高さとなるように算出する算出部と、
前記算出部により算出された前記ノードの各々の二次元平面座標及び高さ情報が示す三次元座標で示される位置に前記ノードの各々をプロットし、前記ノードの各々が示すオブジェクト情報に含まれる特徴の少なくとも一つを前記ノードの各々に付与した探索結果を提示する提示部と、を含み、
前記算出部は、各ノードが示すオブジェクト情報に含まれる特徴同士の類似度が第2所定値以上となるノード間をエッジで接続した部分ネットワーク構造をバネモデルで表し、エッジで接続されたノード同士は近くに配置し、エッジで接続されていないノード同士は遠くに配置し、前記部分ネットワーク構造に含まれる全てのノードが安定な配置となるように、前記ノードの各々の二次元平面座標を算出する
報提示装置。
A search unit that searches a plurality of object information having a similarity with the input query from a plurality of object information including at least one type of feature related to the object, the first predetermined value or more;
The two-dimensional plane coordinates of each of the nodes indicating each of the plurality of object information searched by the search unit, the distance between each node is a distance according to only the relationship between the object information indicated by each node, Calculation is performed so that nodes indicating object information with high similarity between features included in the object information are close to each other and nodes indicating object information with low similarity are arranged far apart, and height information of each of the nodes A calculation unit that calculates the height according to only the relationship between the object information indicated by the node and the query;
Each of the nodes is plotted at a position indicated by the three-dimensional coordinates indicated by the two-dimensional plane coordinates and height information of each of the nodes calculated by the calculation unit, and is included in the object information indicated by each of the nodes A presentation unit for presenting a search result obtained by assigning at least one of the nodes to each of the nodes ,
The calculation unit represents a partial network structure in which nodes having similarities between features included in the object information indicated by each node are connected to each other by an edge with a spring model, and the nodes connected by the edge are Nodes that are arranged close to each other and not connected by edges are arranged far from each other, and two-dimensional plane coordinates of each of the nodes are calculated so that all the nodes included in the partial network structure are stably arranged.
Information presentation device.
前記算出部は、前記オブジェクト情報に含まれる特徴と前記クエリの特徴との類似度が高いほど高くなる高さ情報を算出する請求項1記載の情報提示装置。   The information presentation apparatus according to claim 1, wherein the calculation unit calculates height information that increases as a similarity between the feature included in the object information and the feature of the query increases. 前記ノードの各々が示すオブジェクト情報間の関係に応じて、前記ノードの各々を複数のクラスタに分離するクラスタリング部を含む請求項1又は請求項2記載の情報提示装置。   The information presentation device according to claim 1, further comprising a clustering unit that separates each of the nodes into a plurality of clusters according to a relationship between the object information indicated by each of the nodes. 前記クラスタリング部は、前記複数のクラスタの各々に属するノードの各々が示すオブジェクト情報に基づくクラスタ名を、前記複数のクラスタの各々に付与する請求項3記載の情報提示装置。   The information presenting apparatus according to claim 3, wherein the clustering unit assigns to each of the plurality of clusters a cluster name based on object information indicated by each of the nodes belonging to each of the plurality of clusters. 探索部が、オブジェクトに関する少なくとも一種類の特徴を含む複数のオブジェクト情報から、入力されたクエリとの類似度が第1所定値以上のオブジェクト情報を複数探索するステップと、
算出部が、前記探索部により探索された複数のオブジェクト情報の各々を示すノードの各々の二次元平面座標を、各ノード間の距離が、該各ノードが示すオブジェクト情報間の関係のみに応じた距離となり、前記オブジェクト情報に含まれる特徴間の類似度が高いオブジェクト情報を示すノード同士が近く、類似度が低いオブジェクト情報を示すノード同士が遠く配置されるように算出すると共に、前記ノードの各々の高さ情報を、該ノードが示すオブジェクト情報と前記クエリとの関係のみに応じた高さとなるように算出するステップと、
提示部が、前記算出部により算出された前記ノードの各々の二次元平面座標及び高さ情報が示す三次元座標で示される位置に前記ノードの各々をプロットし、前記ノードの各々が示すオブジェクト情報に含まれる特徴の少なくとも一つを前記ノードの各々に付与した探索結果を提示するステップと、を含み、
前記算出部が二次元平面座標を算出するステップにおいて、各ノードが示すオブジェクト情報に含まれる特徴同士の類似度が第2所定値以上となるノード間をエッジで接続した部分ネットワーク構造をバネモデルで表し、エッジで接続されたノード同士は近くに配置し、エッジで接続されていないノード同士は遠くに配置し、前記部分ネットワーク構造に含まれる全てのノードが安定な配置となるように、前記ノードの各々の二次元平面座標を算出する
報提示方法。
A step of searching for a plurality of object information whose similarity with the input query is a first predetermined value or more from a plurality of object information including at least one type of feature related to the object;
The calculation unit corresponds to the two-dimensional plane coordinates of each of the nodes indicating each of the plurality of object information searched by the search unit, and the distance between the nodes depends only on the relationship between the object information indicated by the nodes. The distance is calculated so that nodes indicating object information having high similarity between features included in the object information are close to each other, and nodes indicating object information having low similarity are arranged far from each other, and each of the nodes Calculating the height information so that the height information depends only on the relationship between the object information indicated by the node and the query;
The presentation unit plots each of the nodes at the position indicated by the two-dimensional plane coordinates and the three-dimensional coordinates indicated by the height information of each of the nodes calculated by the calculation unit, and the object information indicated by each of the nodes Presenting a search result obtained by assigning at least one of the features included in each of the nodes ,
In the step of calculating the two-dimensional plane coordinates by the calculation unit, a partial network structure in which nodes having similarities between features included in the object information indicated by each node are connected to each other by an edge is represented by a spring model. The nodes connected at the edge are arranged close to each other, the nodes not connected at the edge are arranged far from each other, and all the nodes included in the partial network structure are arranged stably. Calculate each two-dimensional plane coordinate
Information presentation method.
コンピュータを、請求項1〜請求項4のいずれか1項記載の情報提示装置を構成する各部として機能させるための情報提示プログラム。   The information presentation program for functioning a computer as each part which comprises the information presentation apparatus of any one of Claims 1-4.
JP2013119310A 2013-06-05 2013-06-05 Information presenting apparatus, method, and program Active JP6144968B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013119310A JP6144968B2 (en) 2013-06-05 2013-06-05 Information presenting apparatus, method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013119310A JP6144968B2 (en) 2013-06-05 2013-06-05 Information presenting apparatus, method, and program

Publications (2)

Publication Number Publication Date
JP2014235723A JP2014235723A (en) 2014-12-15
JP6144968B2 true JP6144968B2 (en) 2017-06-07

Family

ID=52138337

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013119310A Active JP6144968B2 (en) 2013-06-05 2013-06-05 Information presenting apparatus, method, and program

Country Status (1)

Country Link
JP (1) JP6144968B2 (en)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6828335B2 (en) 2016-09-15 2021-02-10 富士通株式会社 Search program, search device and search method
JP2020107265A (en) * 2018-12-28 2020-07-09 真理 浅田 Information processor, information processing method, and program
JP7380078B2 (en) * 2019-10-24 2023-11-15 富士通株式会社 Name extraction program, information processing device and name extraction method
JP7189581B1 (en) 2021-09-29 2022-12-14 株式会社Fronteo Information processing system, information processing method and program

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001031502A1 (en) * 1999-10-27 2001-05-03 Fujitsu Limited Multimedia information classifying/arranging device and method
JP2003016078A (en) * 2001-06-29 2003-01-17 Hitachi Ltd Method for data classification, retrieval and display
JP2008210024A (en) * 2007-02-23 2008-09-11 Nippon Telegr & Teleph Corp <Ntt> Apparatus for analyzing set of documents, method for analyzing set of documents, program implementing this method, and recording medium storing this program
JP2009080580A (en) * 2007-09-25 2009-04-16 Toshiba Corp Image display device and display method
JP4979528B2 (en) * 2007-09-28 2012-07-18 日本電信電話株式会社 Content display device, content display method, program, and recording medium
JP2012027793A (en) * 2010-07-26 2012-02-09 Canon Inc Image processing system and image processing system control method and program
JP2012064200A (en) * 2010-08-16 2012-03-29 Canon Inc Display controller, control method of display controller, program and recording medium
JP2012048474A (en) * 2010-08-26 2012-03-08 Canon Inc Information processor, information processing method and program

Also Published As

Publication number Publication date
JP2014235723A (en) 2014-12-15

Similar Documents

Publication Publication Date Title
CN105824959B (en) Public opinion monitoring method and system
JP4972358B2 (en) Document search apparatus, document search method, document search program, and recording medium.
JP6381775B2 (en) Information processing system and information processing method
US20170228654A1 (en) Methods and systems for base map and inference mapping
KR20100113423A (en) Method for representing keyword using an inversed vector space model and apparatus thereof
Li et al. Interactive multimodal visual search on mobile device
Baralis et al. Analysis of twitter data using a multiple-level clustering strategy
CN112131472A (en) Information recommendation method and device, electronic equipment and storage medium
KR20200141388A (en) System, method and program for obtaining abstract data from image data
JP6144968B2 (en) Information presenting apparatus, method, and program
Zubiaga et al. Content-based clustering for tag cloud visualization
JP2017157193A (en) Method of selecting image that matches with content based on metadata of image and content
CN106909684A (en) Panoramic picture is retrieved and methods of exhibiting
US20120317117A1 (en) Information Visualization System
Han et al. Tree-based visualization and optimization for image collection
RU2698405C2 (en) Method of search in database
JP6572746B2 (en) Information processing apparatus and program
CN107908749B (en) Character retrieval system and method based on search engine
KR101934108B1 (en) Method for clustering and sharing images, and system and application implementing the same method
JP2010224625A (en) Method and program for visualizing keyword two-dimensional
JP6186476B2 (en) Information presenting apparatus, method, and program
JP2011100208A (en) Action estimation device, action estimation method, and action estimation program
KR101794137B1 (en) Data visualization method and system using reference semantic map
JP5989157B2 (en) Information presenting apparatus, method, and program
JP6696344B2 (en) Information processing device and program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150626

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160526

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160531

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160725

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170131

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170329

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170509

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170512

R150 Certificate of patent or registration of utility model

Ref document number: 6144968

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150