JP6993913B2 - Information processing equipment, information processing methods, and programs - Google Patents

Information processing equipment, information processing methods, and programs Download PDF

Info

Publication number
JP6993913B2
JP6993913B2 JP2018050672A JP2018050672A JP6993913B2 JP 6993913 B2 JP6993913 B2 JP 6993913B2 JP 2018050672 A JP2018050672 A JP 2018050672A JP 2018050672 A JP2018050672 A JP 2018050672A JP 6993913 B2 JP6993913 B2 JP 6993913B2
Authority
JP
Japan
Prior art keywords
entity
information
content
type
determined
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018050672A
Other languages
Japanese (ja)
Other versions
JP2019164424A (en
Inventor
真也 夜久
樹生 豊田
智輝 齋藤
正樹 野口
宏希 岩澤
健 萩原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2018050672A priority Critical patent/JP6993913B2/en
Publication of JP2019164424A publication Critical patent/JP2019164424A/en
Application granted granted Critical
Publication of JP6993913B2 publication Critical patent/JP6993913B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、情報処理装置、情報処理方法、およびプログラムに関する。 The present invention relates to an information processing apparatus, an information processing method, and a program.

従来、所与の事実エンティティを照会するクエリをクライアントデバイスから受信し、受信したクエリに関連する電子リソースを識別し、所与の事実エンティティに関連する電子リソースから、前記所与の事実エンティティに対する知識パネル中に表示するためのコンテンツを選択する方法が開示されている(例えば、特許文献1参照)。 Traditionally, a query querying a given fact entity is received from a client device, the electronic resource associated with the received query is identified, and knowledge of the given fact entity from the electronic resource associated with the given fact entity. A method of selecting content to be displayed in a panel is disclosed (see, for example, Patent Document 1).

特開2016-139438号公報Japanese Unexamined Patent Publication No. 2016-139438

従来の技術では、複数のエンティティが入力されたクエリと関連する場合に、適切なエンティティを選択できない場合があった。このため、入力されたクエリに基づいて適切なエンティティが選択されるように、エンティティとキーワードとの関係を、適切に評価することが望ましい。 In the conventional technique, when multiple entities are related to the input query, it may not be possible to select the appropriate entity. For this reason, it is desirable to properly evaluate the relationship between the entity and the keyword so that the appropriate entity is selected based on the entered query.

本発明は、このような事情が考慮されたものであり、エンティティとキーワードとの関係を、適切に評価することができる情報処理装置、情報処理方法、およびプログラムを提供することを目的の一つとする。 The present invention has taken such circumstances into consideration, and one of the objects of the present invention is to provide an information processing device, an information processing method, and a program capable of appropriately evaluating the relationship between an entity and a keyword. do.

本発明の一態様は、エンティティに対応付けられた属性情報を参照し、前記エンティティが第1基準の適用対象であるか、前記エンティティが第2基準の適用対象であるかを判定する判定部と、前記第1基準の適用対象であると判定された場合、前記第1基準に基づいて、前記エンティティとキーワードとの組み合わせに対する評価を行い、前記第2基準の適用対象であると判定された場合、前記第2基準に基づいて、前記組み合わせに対する評価を行う評価部とを備える情報処理装置である。 One aspect of the present invention is a determination unit that refers to the attribute information associated with the entity and determines whether the entity is the application target of the first criterion or the entity is the application target of the second criterion. , When it is determined that the first criterion is applied, the combination of the entity and the keyword is evaluated based on the first criterion, and it is determined that the second criterion is applied. , An information processing apparatus including an evaluation unit that evaluates the combination based on the second criterion.

本発明の一態様によれば、エンティティとキーワードとの関係を、適切に評価することができる。ひいては、適切なエンティティが選択し、より適切な情報をユーザに提供することができる。 According to one aspect of the present invention, the relationship between the entity and the keyword can be appropriately evaluated. As a result, the appropriate entity can be selected and provide the user with more appropriate information.

ナレッジデータサーバが使用される使用環境の一例を示す図である。It is a figure which shows an example of the usage environment in which a knowledge data server is used. ナレッジグラフ72の一部を模式的に示す図である。It is a figure which shows a part of the knowledge graph 72 schematically. エンティティ「野球選手A」に対応付けられた所在情報を辿ることで参照可能なコンテンツの一例を示す図である。It is a figure which shows an example of the content which can be referred by tracing the location information associated with the entity "baseball player A". ナレッジデータサーバ50により実行される処理の流れの一例を示すフローチャートである。It is a flowchart which shows an example of the flow of the process executed by the knowledge data server 50. スコアが付与される前の第2スコア情報76に含まれる内容の一例を示す図である。It is a figure which shows an example of the contents included in the 2nd score information 76 before the score is given. 第2基準の適用対象となるエンティティに対応付けられた複数の所在情報の一例を示す図である。It is a figure which shows an example of the plurality of location information associated with the entity to which the 2nd standard is applied. 複数の特定コンテンツに対するアクセス数の情報の内容の一例を示す図である。It is a figure which shows an example of the content of the information of the number of accesses to a plurality of specific contents. スコアが付与された第2スコア情報76の内容の一例を示す図である。It is a figure which shows an example of the content of the 2nd score information 76 to which the score was given. ナレッジパネルをユーザに提供する処理の流れの一例を示すフローチャートである。It is a flowchart which shows an example of the flow of the process which provides a knowledge panel to a user. ナレッジパネルをユーザに提供する処理の流れの概念図である。It is a conceptual diagram of the process flow which provides a knowledge panel to a user. ユーザに提供されるナレッジパネルの一例を示す図である。It is a figure which shows an example of the knowledge panel provided to a user. 補助情報が付与された第2スコア情報76Aの内容の一例を示す図である。It is a figure which shows an example of the content of the 2nd score information 76A to which auxiliary information is attached. 基準情報78の内容の一例を示す図である。It is a figure which shows an example of the content of the reference information 78.

以下、図面を参照し、本発明の情報処理装置、情報処理方法、およびプログラムの実施形態について説明する。 Hereinafter, embodiments of the information processing apparatus, information processing method, and program of the present invention will be described with reference to the drawings.

情報処理装置は、一以上のプロセッサにより実現される。情報処理装置は、エンティティとキーワードとの組み合わせを評価する装置である。エンティティとは、対象事物の実体または概念を表すものであり、エンティティ間の対応関係を記述したナレッジグラフの一部である。ナレッジグラフには、エンティティの属性情報が対応付けられている。例えば、あるクエリが入力された場合において、そのクエリがエンティティに該当するものであれば、単なるキーワード検索よりも豊富な情報をユーザに返すことができる。ところが、ナレッジグラフには、同じキーワードを含む異なるエンティティも存在するため、クエリとして入力されたキーワードから、直ちに該当するエンティティを特定するのが困難な場合がある。 The information processing device is realized by one or more processors. An information processing device is a device that evaluates a combination of an entity and a keyword. An entity represents an entity or concept of an object and is a part of a knowledge graph that describes the correspondence between the entities. The knowledge graph is associated with the attribute information of the entity. For example, when a query is entered, if the query corresponds to an entity, it is possible to return a wealth of information to the user rather than a simple keyword search. However, since there are different entities in the Knowledge Graph that contain the same keyword, it may be difficult to immediately identify the relevant entity from the keywords entered as a query.

情報処理装置は、エンティティに対応付けられた属性情報を参照し、エンティティが第1基準の適用対象であるか、エンティティが第2基準の適用対象であるかを判定し、第1基準の適用対象であると判定された場合、第1基準に基づいて、エンティティとキーワードとの組み合わせに対する評価を行い、第2基準の適用対象であると判定された場合、第2基準に基づいて、上記の組み合わせに対する評価を行う。第2基準は、第2基準の適用対象であると判定されたエンティティを、第1基準に比して、より適切に評価できる基準である。これによって、情報処理装置は、エンティティとキーワードとの関係を、適切に評価することができる。 The information processing device refers to the attribute information associated with the entity, determines whether the entity is the application target of the first standard or the entity is the application target of the second standard, and applies the first standard. If it is determined that the combination is based on the first criterion, the combination of the entity and the keyword is evaluated, and if it is determined that the second criterion is applied, the above combination is based on the second criterion. To evaluate. The second criterion is a criterion that can more appropriately evaluate the entity determined to be the target of the application of the second criterion as compared with the first criterion. As a result, the information processing apparatus can appropriately evaluate the relationship between the entity and the keyword.

例えば、第2基準に基づく評価の対象となるエンティティは、例えば、そのエンティティと同一、類似、またはエンティティの一部を含む概念が、複数のメディア(媒体)で共通して使用されているエンティティである。例えば、エンターテインメント(例えば、漫画や、アニメ、映画、テレビ(例えばテレビドラマ)、小説、音楽など)に関するエンティティが、第2基準に基づく評価の対象となる。メディアとは、例えば、漫画、アニメ、映画、テレビドラマ、小説、音楽などである。具体的には、例えば、原作が「〇〇マン」という漫画であり、この漫画が、アニメや、ドラマ、映画、小説として展開されているような場合、「〇〇マン 漫画」、「〇〇マン アニメ」・・・「○○マン 小説」などのエンティティや、「〇〇マン 漫画」~「○○マン 小説」をまとめたエンティティが、第2基準に基づく評価の対象となる。 For example, an entity to be evaluated based on the second criterion is, for example, an entity in which a concept that is the same as, similar to, or includes a part of the entity is commonly used in a plurality of media (mediums). be. For example, entities related to entertainment (eg, comics, anime, movies, television (eg, TV dramas), novels, music, etc.) are subject to evaluation based on the second criterion. The media is, for example, comics, anime, movies, television dramas, novels, music, and the like. Specifically, for example, if the original is a manga called "OO Man" and this manga is developed as an anime, drama, movie, or novel, "OO Man Manga" or "OO Man" Entities such as "Man Anime" ... "○○ Man Novel" and entities that summarize "○○ Man Manga" to "○○ Man Novel" are subject to evaluation based on the second criterion.

<第1実施形態>
図1は、ナレッジデータサーバが使用される使用環境の一例を示す図である。ナレッジデータサーバの使用環境には、例えば、一以上の端末装置10と、一以上の検索サーバ20と、クロール対象装置30と、ナレッジデータサーバ50とが含まれる。なお、検索サーバ20と、ナレッジデータサーバ50とは一体として構成されてもよい。
<First Embodiment>
FIG. 1 is a diagram showing an example of a usage environment in which a knowledge data server is used. The usage environment of the knowledge data server includes, for example, one or more terminal devices 10, one or more search servers 20, a crawl target device 30, and a knowledge data server 50. The search server 20 and the knowledge data server 50 may be configured as one.

これらの装置等は、ネットワークNWを介して互いに通信する。ネットワークNWは、例えば、WAN(Wide Area Network)やLAN(Local Area Network)、インターネット、専用回線、無線基地局、プロバイダなどを含む。 These devices and the like communicate with each other via the network NW. The network NW includes, for example, a WAN (Wide Area Network), a LAN (Local Area Network), the Internet, a dedicated line, a wireless base station, a provider, and the like.

[端末装置]
端末装置10は、例えば、ユーザによって使用される装置であり、例えば、スマートフォンなどの携帯電話、タブレット型コンピュータ、ノート型コンピュータ、デスクトップ型コンピュータなどである。ユーザは、端末装置10を操作して、クエリを入力し、入力したクエリを検索サーバ20に送信する。
[Terminal device]
The terminal device 10 is, for example, a device used by a user, for example, a mobile phone such as a smartphone, a tablet computer, a notebook computer, a desktop computer, or the like. The user operates the terminal device 10, inputs a query, and sends the input query to the search server 20.

[検索サーバ]
検索サーバ20は、端末装置10からクエリを取得し、取得したクエリに応じた情報を端末装置10に提供する。検索サーバ20は、取得したクエリに関連する情報を、検索エンジンを用いて検索する。また、検索サーバ20は、取得したクエリに関連する情報をナレッジデータサーバ50から取得する。検索サーバ20は、検索エンジンの検索結果と、ナレッジデータサーバ50から取得した情報とを端末装置10に提供する。
[Search server]
The search server 20 acquires a query from the terminal device 10 and provides the terminal device 10 with information corresponding to the acquired query. The search server 20 searches for information related to the acquired query by using a search engine. Further, the search server 20 acquires information related to the acquired query from the knowledge data server 50. The search server 20 provides the search result of the search engine and the information acquired from the knowledge data server 50 to the terminal device 10.

[クロール対象装置]
クロール対象装置30は、ナレッジデータサーバ50の求めに応じて、ナレッジデータサーバ50に情報を提供する装置である。
[Crawling target device]
The crawl target device 30 is a device that provides information to the knowledge data server 50 in response to a request from the knowledge data server 50.

[ナレッジデータサーバ]
ナレッジデータサーバ50は、例えば、クロール対象装置30などから提供されるデータに基づいてナレッジグラフ72を生成する。
[Knowledge Data Server]
The knowledge data server 50 generates a knowledge graph 72 based on data provided by, for example, a crawl target device 30 or the like.

ナレッジデータサーバ50は、例えば、通信部52と、収集部54と、判定部56と、評価部58と、応答部60と、記憶部70とを備える。判定部56、収集部54、評価部58、および応答部60は、例えば、CPU(Central Processing Unit)等のハードウェアプロセッサが、記憶装置に記憶されたプログラムを実行することにより実現される。また、これらの機能部は、LSI(Large Scale Integration)、ASIC(Application Specific Integrated Circuit)、FPGA(Field-Programmable Gate Array)、GPU(Graphics Processing Unit)等のハードウェアによって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。また、上記のプログラムは、予め記憶装置に格納されていてもよいし、DVDやCD-ROMなどの着脱可能な記憶媒体に格納されており、記憶媒体がナレッジデータサーバ50のドライブ装置に装着されることで記憶装置にインストールされてもよい。 The knowledge data server 50 includes, for example, a communication unit 52, a collection unit 54, a determination unit 56, an evaluation unit 58, a response unit 60, and a storage unit 70. The determination unit 56, the collection unit 54, the evaluation unit 58, and the response unit 60 are realized by, for example, a hardware processor such as a CPU (Central Processing Unit) executing a program stored in the storage device. Further, these functional units may be realized by hardware such as LSI (Large Scale Integration), ASIC (Application Specific Integrated Circuit), FPGA (Field-Programmable Gate Array), GPU (Graphics Processing Unit), etc. It may be realized by the collaboration of software and hardware. Further, the above program may be stored in a storage device in advance, or is stored in a removable storage medium such as a DVD or a CD-ROM, and the storage medium is attached to the drive device of the knowledge data server 50. It may be installed in the storage device.

記憶部70は、例えば、ROM(Read Only Memory)、フラッシュメモリ、SDカード、RAM(Random Access Memory)、HDD(Hard Disc Drive)、レジスタ等によって実現される。また、記憶部70の一部または全部は、NAS(Network Attached Storage)や外部ストレージサーバ装置等であってもよい。記憶部70には、例えば、ナレッジグラフ72と、第1スコア情報74と、第2スコア情報76が記憶されている。これらの情報の詳細については後述する。 The storage unit 70 is realized by, for example, a ROM (Read Only Memory), a flash memory, an SD card, a RAM (Random Access Memory), an HDD (Hard Disc Drive), a register, or the like. Further, a part or all of the storage unit 70 may be NAS (Network Attached Storage), an external storage server device, or the like. For example, the knowledge graph 72, the first score information 74, and the second score information 76 are stored in the storage unit 70. Details of this information will be described later.

ナレッジグラフ72は、エンティティ、クラス、プロパティ、およびエンティティに関連するコンテンツの所在情報が対応付けられた情報である。図2は、ナレッジグラフ72の一部を模式的に示す図である。 The knowledge graph 72 is information associated with the location information of the entity, the class, the property, and the content related to the entity. FIG. 2 is a diagram schematically showing a part of the Knowledge Graph 72.

図2に示すように、エンティティには、各エンティティを識別することが可能な情報(以下、エンティティ識別情報)と、エンティティ名と、当該エンティティに関連するコンテンツの所在情報と、クラスとが対応付けられている。所在情報とは、ウェブ上の位置を特定するための情報であり、例えば、URL(Uniform Resource Locator)である。ナレッジグラフ72のエンティティE1には、エンティティ識別情報EIDの「0001」と、エンティティ名の「野球選手A」と、エンティティに関連するコンテンツの所在情報である「http://百科事典コンテンツ/野球選手A」というURLと、クラス「01」とが対応付けられている。図2の例では、エンティティE1と、エンティティE2とが、「所属チーム」というプロパティ名のクラスに属する。 As shown in FIG. 2, in an entity, information that can identify each entity (hereinafter referred to as entity identification information), an entity name, location information of contents related to the entity, and a class are associated with each other. Has been done. The location information is information for specifying a position on the Web, and is, for example, a URL (Uniform Resource Locator). The entity E1 of the knowledge graph 72 includes the entity identification information EID "0001", the entity name "baseball player A", and the location information of the content related to the entity "http: // encyclopedia content / baseball player". The URL "A" is associated with the class "01". In the example of FIG. 2, the entity E1 and the entity E2 belong to the class with the property name "affiliated team".

エンティティは、例えば、ある対象事物の実体(例えば実世界で存在している物体)を表していてもよいし、ある対象事物の概念(例えば実世界または仮想世界の中で定義された概念)を表していてもよい。例えば、対象事物が「建物」という概念である場合、エンティティは、「○○塔」や「○○ビルディング」などといった実体を表してよい。また、例えば、対象事物が「経済学」という概念である場合、エンティティは、「ミクロ経済学」や「マクロ経済学」などといった実体のない抽象的な概念を表してよい。 An entity may represent, for example, an entity of an object (eg, an object that exists in the real world), or a concept of an object (eg, a concept defined in the real world or virtual world). It may be represented. For example, when the object is the concept of "building", the entity may represent an entity such as "○○ tower" or "○○ building". Further, for example, when the object is the concept of "economics", the entity may represent an insubstantial abstract concept such as "microeconomics" or "macroeconomics".

ナレッジグラフ72において記述された事物は、オントロジーによって定義される。オントロジーとは、事物のクラスおよびプロパティを定義したものであり、クラスとプロパティとの間に成り立つ制約を集めたものである。 The things described in Knowledge Graph 72 are defined by the ontology. An ontology is a definition of a class and a property of an object, and is a collection of constraints that hold between the class and the property.

クラスとは、オントロジーにおいて、同じ性質を持つ事物同士を一つのグループにしたものである。事物の性質がどういったものであるのか、すなわち事物がどのクラスに属するのかは、後述するプロパティにより決定される。クラスは、エンティティの属性情報の一例である。 A class is a group of things that have the same properties in an ontology. What the nature of an object is, that is, which class the object belongs to, is determined by the properties described below. A class is an example of attribute information of an entity.

例えば、くちばしを持ち、卵生の脊椎動物であり、前肢が翼になっている、という性質を持つ事物は、「鳥」というクラスに分類される。また、「鳥」というクラスの中で、飛べない、という性質を持つ事物は、例えば、「ペンギン」や「ダチョウ」という、より下位のクラスに分類される。このように、クラスの体系は、上位と下位の関係を有する階層構造となっていてよい。上位のクラスの性質は、下位のクラスに継承される。上述した例では、「鳥」というクラスの、「くちばしを持ち、卵生の脊椎動物であり、前肢が翼になっている」という性質は、「ペンギン」や「ダチョウ」という下位のクラスの性質にも含まれることになる。クラスを識別するためのクラス名は、例えば、「鳥」というクラスであれば、そのクラス名は「鳥」という文字列によって表されてよい。なお、クラス名は、必ずしも意味を表している必要はなく、例えば、「鳥」というクラスであっても、「情報1」や「C1」といった単なる識別情報を示す文字列が割り当てられてもよい。上述したエンティティ、すなわち事物は、オントロジーにより定義されたクラス体系の中に含まれる、いずれかのクラスに属するものとする。 For example, things that have a beak, an oviparous vertebrate, and forelimbs that are wings are classified in the "bird" class. Also, in the class of "birds", things that have the property of not being able to fly are classified into lower classes such as "penguins" and "ostriches". In this way, the class system may have a hierarchical structure having a higher-lower relationship. The nature of the upper class is inherited by the lower class. In the example above, the "bird" class's "beak-bearing, oviparous vertebrate with winged forelimbs" property is a lower class property of "penguins" and "ostriches". Will also be included. For example, if the class name for identifying the class is a class "bird", the class name may be represented by the character string "bird". The class name does not necessarily have to represent a meaning, and for example, even in the class "bird", a character string indicating mere identification information such as "information 1" or "C1" may be assigned. .. The above-mentioned entity, that is, an entity, belongs to one of the classes included in the class system defined by the ontology.

プロパティとは、事物の性質や特徴、クラス間の関係を記述する属性である。例えば、プロパティは、「~を体の構成要素としてもつ」という性質や、「~に生息する」という性質を示す属性であってもよいし、「あるクラスが上位クラスであり、あるクラスが下位クラスである」というクラス間の上位下位の関係を示す属性であってもよい。プロパティを識別するためのプロパティ名は、上述したクラス名と同様に、そのプロパティ名自体が意味を表していてもよいし、意味を表していなくてもよい。 Properties are attributes that describe the nature and characteristics of things and the relationships between classes. For example, a property may be an attribute that has the property of "having ... as a component of the body" or the property of "living in", or "a class is a higher class and a certain class is a lower class". It may be an attribute indicating the relationship between the upper and lower levels of "class". As for the property name for identifying the property, the property name itself may or may not represent the meaning, as in the class name described above.

ナレッジグラフ72は、上述したクラスがノードとして表され、上述したプロパティがラベル付き、且つ方向性のあるエッジとして表された有向グラフである。このようなグラフ構造によって、事物についての情報がノードにより、事物間の関係がエッジによって判別可能となる。 The Knowledge Graph 72 is a directed graph in which the above-mentioned classes are represented as nodes and the above-mentioned properties are represented as labeled and directional edges. With such a graph structure, information about things can be discriminated by nodes, and relationships between things can be discriminated by edges.

図3は、エンティティ「野球選手A」に対応付けられた所在情報を辿ることで参照可能なコンテンツの一例を示す図である。この所在情報のコンテンツは、ユーザによって編集可能な百科事典のサービスを提供しているサーバ装置(不図示)により提供されている情報である。この所在情報は、上記の百科事典において、「野球選手A」の情報が含まれている「野球選手A」の項目の所在を示している。 FIG. 3 is a diagram showing an example of content that can be referred to by tracing the location information associated with the entity “baseball player A”. The content of this location information is information provided by a server device (not shown) that provides a service of an encyclopedia that can be edited by a user. This location information indicates the location of the item of "baseball player A" including the information of "baseball player A" in the above encyclopedia.

図1の説明に戻る。通信部52は、ネットワークインターフェースカード(Network Interface Card)等の通信インターフェースを含む。収集部54は、いわゆるクローラプログラムにより実現される。収集部54により収集される情報は、例えば、ネットワークNW上(クロール対象機器30の記憶領域内)にあり、ブラウザで閲覧可能なデータである。収集部54は、ナレッジグラフ72を構築のためのコンテンツを収集する。また、収集部54は、ユーザの検索ログなどネットワークNWにおけるサービスについて、ユーザの利用状況に関する情報を取得する。なお、ナレッジグラフ72の構築は、収集部54が収集するコンテンツに代えて(或いは加えて)、所定のサーバが提供しているデータが用いられてもよい。例えば、ナレッジデータサーバ50は、データの提供元からナレッジグラフ72の構築に用いるデータをダウンロードし、ダウンロードしたデータを用いて、ナレッジグラフ72を構築してもよい。 Returning to the description of FIG. The communication unit 52 includes a communication interface such as a network interface card. The collecting unit 54 is realized by a so-called crawler program. The information collected by the collecting unit 54 is, for example, data that is on the network NW (in the storage area of the crawling target device 30) and can be viewed by a browser. The collecting unit 54 collects the content for constructing the Knowledge Graph 72. Further, the collecting unit 54 acquires information on the user's usage status for services in the network NW such as the user's search log. In addition, in the construction of the knowledge graph 72, the data provided by the predetermined server may be used instead of (or in addition to) the content collected by the collecting unit 54. For example, the knowledge data server 50 may download the data used for constructing the knowledge graph 72 from the data provider and construct the knowledge graph 72 using the downloaded data.

以下、検索サーバ20からの問い合わせに応答するための準備処理について説明する。検索サーバ20は、端末装置10から入力されたクエリをナレッジデータサーバ50に転送し、該当するエンティティがあるか否かを問い合わせる場合がある。ナレッジデータサーバ50は、これに応答するために、以下の準備処理を行う。 Hereinafter, the preparatory process for responding to the inquiry from the search server 20 will be described. The search server 20 may transfer the query input from the terminal device 10 to the knowledge data server 50 and inquire whether or not there is a corresponding entity. The knowledge data server 50 performs the following preparatory processing in order to respond to this.

判定部56は、例えば、ナレッジグラフ72に登録されているすべてのエンティティについて、エンティティに対応付けられたクラスを参照し、エンティティが第1基準の適用対象であるか、第2基準の適用対象であるかを判定する。 For example, the determination unit 56 refers to the class associated with the entity for all the entities registered in the Knowledge Graph 72, and whether the entity is the application target of the first criterion or the application target of the second criterion. Determine if there is.

評価部58は、エンティティが判定部56により第1基準の適用対象であると判定された場合、第1基準に基づいて、エンティティとキーワードとの組み合わせに対する評価を行い、エンティティが判定部56により第2基準の適用対象であると判定された場合、第2基準に基づいて、エンティティとキーワードとの組み合わせに対する評価を行う。キーワードは、例えば、検索サーバ20の検索ログの中から抽出されたり、収集部54により収集されたコンテンツから抽出されたりする。以下、評価部58により評価の対象となるキーワードを、対象キーワードと称する。 When the determination unit 56 determines that the entity is the target of application of the first criterion, the evaluation unit 58 evaluates the combination of the entity and the keyword based on the first criterion, and the determination unit 56 evaluates the entity. If it is determined that the two criteria are applicable, the combination of the entity and the keyword is evaluated based on the second criterion. The keyword is, for example, extracted from the search log of the search server 20 or extracted from the content collected by the collecting unit 54. Hereinafter, the keyword to be evaluated by the evaluation unit 58 will be referred to as a target keyword.

[フローチャート]
図4は、ナレッジデータサーバ50により実行される処理の流れの一例を示すフローチャートである。本フローチャートは、例えば、所定間隔ごとに実行される。まず、判定部56が、処理対象のエンティティを一つ選ぶ(S10)。処理対象のエンティティとは、ナレッジグラフ72に含まれるエンティティである。次に、判定部56は、選択したエンティティのクラスを参照する(S12)。次に、判定部56は、クラスが特定クラスであるか否かを判定する(S14)。特定クラスとは、第2基準に基づく評価の対象となるエンティティを示すクラスである。
[flowchart]
FIG. 4 is a flowchart showing an example of the flow of processing executed by the knowledge data server 50. This flowchart is executed, for example, at predetermined intervals. First, the determination unit 56 selects one entity to be processed (S10). The entity to be processed is an entity included in Knowledge Graph 72. Next, the determination unit 56 refers to the class of the selected entity (S12). Next, the determination unit 56 determines whether or not the class is a specific class (S14). The specific class is a class indicating an entity to be evaluated based on the second criterion.

評価部58は、クラスが特定クラスでない場合、第1基準に基づく処理を実行し(S16)、クラスが特定クラスである場合、第2基準に基づく処理を実行する(S18)。第1基準に基づく処理および第2基準に基づく処理については後述する。 If the class is not a specific class, the evaluation unit 58 executes a process based on the first criterion (S16), and if the class is a specific class, executes a process based on the second criterion (S18). The processing based on the first standard and the processing based on the second standard will be described later.

次に、判定部56が、処理対象の全てのエンティティを選択したか否かを判定する(S20)。全てのエンティティが選択されていない場合、ステップS10の処理に戻る。全てのエンティティが選択された場合、本フローチャートの処理は終了する。 Next, the determination unit 56 determines whether or not all the entities to be processed have been selected (S20). If all the entities are not selected, the process returns to step S10. When all the entities are selected, the processing of this flowchart ends.

[第1基準に基づく処理]
第1基準は、ネットワークNWにより提供される第1サービスの利用状況に関する情報を用いた基準である。第1サービスは、例えば、ユーザによって編集可能な百科事典を提供するサービスである。
[Processing based on the first standard]
The first standard is a standard using information on the usage status of the first service provided by the network NW. The first service is, for example, a service that provides an encyclopedia that can be edited by a user.

例えば、収集部54は、図4のS10で選択されたエンティティに対応付けられた所在情報に対応するコンテンツを収集する。なお、既に収集して記憶部70に格納されている場合、その情報が参照される。例えば、第1基準に基づく処理が行わるクラスのエンティティに対応付けられている所在情報には、例えば、百科事典のコンテンツを示す所在情報が含まれる。収集部54は、例えば、百科事典のコンテンツのHTML(Hyper Text Markup Language)データや、その百科事典のコンテンツに対するアクセス数などを含む収集対象データを、ネットワークNWを介してクロール対象機器30から収集する。 For example, the collecting unit 54 collects the content corresponding to the location information associated with the entity selected in S10 of FIG. If it has already been collected and stored in the storage unit 70, the information is referred to. For example, the location information associated with the entity of the class to be processed based on the first criterion includes, for example, the location information indicating the contents of the encyclopedia. The collection unit 54 collects data to be collected, including HTML (Hyper Text Markup Language) data of the contents of the encyclopedia and the number of accesses to the contents of the encyclopedia, from the crawl target device 30 via the network NW. ..

評価部58は、第1基準として、例えば、百科事典のコンテンツに対するアクセス数(またはクリック数)と、百科事典のコンテンツに含まれるキーワードとのうち、キーワードと関連付けられたエンティティを示すキーワードが、リンク先を示すテキスト(アンカーテキスト)として含まれる確率とに基づいて、スコアを導出する。これに限らず、評価部58は、第1基準として、百科事典のコンテンツに関する種々の情報に基づいてスコアを導出してよい。 As the first criterion, the evaluation unit 58 links, for example, the number of accesses (or clicks) to the content of the encyclopedia and the keyword indicating the entity associated with the keyword among the keywords included in the content of the encyclopedia. The score is derived based on the probability of being included as the text (anchor text) indicating the destination. Not limited to this, the evaluation unit 58 may derive the score based on various information regarding the contents of the encyclopedia as the first criterion.

[第2基準に基づく処理]
第2基準は、少なくとも、ネットワークNWにより提供される第2サービスの利用状況に関する情報を用いた基準である。第2サービスは、例えば、ユーザによって編集可能な百科事典を提供するサービスとは異なるサービスである。第2サービスは、例えば、ユーザに商品またはサービス(以下、商品等)を販売するサービスや、エンティティに対応する商品等に対する評価に関する情報を提供するサービス(例えば映画に関する情報を提供するサービス)である。
[Processing based on the second standard]
The second standard is a standard using at least information on the usage status of the second service provided by the network NW. The second service is, for example, a service different from the service that provides an encyclopedia that can be edited by a user. The second service is, for example, a service for selling a product or service (hereinafter, product, etc.) to a user, or a service for providing information on evaluation of a product or the like corresponding to an entity (for example, a service for providing information on a movie). ..

評価部58は、エンティティと対象キーワードの組み合わせのそれぞれについて、スコアを導出する。エンティティと対象キーワードの組み合わせとは、第2スコア情報76におけるエンティティと対象キーワードとの組み合わせである。図5は、スコアが付与される前の第2スコア情報76に含まれる内容の一例を示す図である。第2スコア情報76には、エンティティに対して、エンティティに関連すると推定されるキーワードが対応付けられた情報である。例えば、エンティティ「C-D-E 漫画」に対応付けられたキーワードは、「C-D-E 漫画」の一部や全部を含むものであったり、社会において認知されている「C-D-E 漫画」の名称や略称、別名などであったりする。 The evaluation unit 58 derives a score for each combination of the entity and the target keyword. The combination of the entity and the target keyword is the combination of the entity and the target keyword in the second score information 76. FIG. 5 is a diagram showing an example of the contents included in the second score information 76 before the score is given. The second score information 76 is information in which a keyword presumed to be related to the entity is associated with the entity. For example, the keyword associated with the entity "CDE Manga" includes a part or all of "CDE Manga" or is recognized in society as "CD-". It may be the name, abbreviation, or alias of "E-manga".

評価部58は、第2サービスの利用状況に関する情報に基づいてスコアを導出する。そのために収集部54は、第2サービスの利用状況に関する情報を収集する。第2サービスの利用状況とは、第2サービスにおける特定コンテンツへのアクセス数、または特定コンテンツに画面を遷移させるためのクリック数である。特定コンテンツとは、第2サービスに含まれるエンティティに対応する商品等に関する情報を含むコンテンツである。図6に示すように、第2基準の適用対象となるエンティティには複数の所在情報が対応付けられている場合がある。所在情報には、例えば、少なくとも百科事典のコンテンツの所在情報とは異なる所在情報が含まれる。すなわち、特定コンテンツの所在情報が含まれている。 The evaluation unit 58 derives the score based on the information regarding the usage status of the second service. Therefore, the collecting unit 54 collects information on the usage status of the second service. The usage status of the second service is the number of accesses to the specific content in the second service, or the number of clicks for transitioning the screen to the specific content. The specific content is content that includes information about a product or the like corresponding to an entity included in the second service. As shown in FIG. 6, a plurality of location information may be associated with the entity to which the second criterion is applied. The location information includes, for example, location information that is different from the location information of at least the contents of the encyclopedia. That is, the location information of the specific content is included.

例えば、エンティティが「C-D-E 漫画」である場合、C-D-Eの漫画を販売している特定コンテンツ(例えば商品詳細ページ)に対するアクセス数がスコアの導出に用いられる。また、例えば、エンティティが「C-D-E 映画」である場合、C-D-Eの映画を評価している特定コンテンツに対するアクセス数がスコアの導出に用いられる。評価部58は、所定のサービスにおけるアクセス数、またはクリック数を統計的に処理してスコアを導出する。なお、「クリック」とは、選択することの一例であり、タッチ、タップその他の態様で選択されてもよい。 For example, when the entity is a "CDE cartoon", the number of accesses to a specific content (for example, a product detail page) that sells the CDE cartoon is used for deriving the score. Further, for example, when the entity is a "CDE movie", the number of accesses to the specific content evaluating the CDE movie is used for deriving the score. The evaluation unit 58 statistically processes the number of accesses or the number of clicks in a predetermined service to derive a score. The "click" is an example of selection, and may be selected by touch, tap, or other modes.

(スコアを導出する手法)
評価部58は、少なくとも特定コンテンツに対するアクセス数に基づきスコアを導出する。評価部58は、更に、百科事典のコンテンツに対するアクセス数を加味してスコアを導出してもよい。以下の説明では、アクセス数を用いる例について説明するが、これに代えて(または加えて)クリック数が用いられてもよい。
(Method of deriving the score)
The evaluation unit 58 derives the score based on at least the number of accesses to the specific content. The evaluation unit 58 may further derive the score by adding the number of accesses to the contents of the encyclopedia. In the following description, an example using the number of accesses will be described, but the number of clicks may be used instead (or in addition).

(例1)
例えば、評価部58は、百科事典のコンテンツに対するアクセス数と、特定コンテンツに対するアクセス数とのうち、多い方のアクセス数に基づいて、スコアを導出する。また、評価部58は、百科事典のコンテンツに対するアクセス数と、特定コンテンツに対するアクセス数とを加算したアクセス数に基づいて、スコアを導出してもよい。これらの場合、アクセス数が多いほど、スコアは高く導出される。
(Example 1)
For example, the evaluation unit 58 derives a score based on the number of accesses to the contents of the encyclopedia and the number of accesses to the specific contents, whichever is greater. Further, the evaluation unit 58 may derive a score based on the number of accesses obtained by adding the number of accesses to the contents of the encyclopedia and the number of accesses to the specific contents. In these cases, the higher the number of accesses, the higher the score is derived.

(例2)
例えば、評価部58は、複数の特定コンテンツの情報に基づいてスコアを導出してもよい。例えば、評価部58は、複数の特定コンテンツに対するアクセス数を合計したアクセス数に基づいて、スコアを導出する。この場合、アクセス数が多いほど、スコアは高く導出される。図7は、複数の特定コンテンツに対するアクセス数の情報の内容の一例を示す図である。評価部58は、複数の特定コンテンツのうち、アクセス数の少ない(または多い)特定コンテンツのアクセス数を除外して、スコアを導出してもよい。
(Example 2)
For example, the evaluation unit 58 may derive a score based on information of a plurality of specific contents. For example, the evaluation unit 58 derives a score based on the total number of accesses to a plurality of specific contents. In this case, the higher the number of accesses, the higher the score is derived. FIG. 7 is a diagram showing an example of the content of the information on the number of accesses to a plurality of specific contents. The evaluation unit 58 may derive the score by excluding the number of accesses of the specific content having a small (or high) number of accesses from the plurality of specific contents.

(例3)
特定コンテンツごとにアクセスされやすさを示す指標が設定され、その指標がスコアの導出に利用されてもよい。例えば、第1の特定コンテンツと、第2の特定コンテンツとが存在し、第1の特定コンテンツは、第2の特定コンテンツよりもアクセスされやすい場合、第2の特定コンテンツのアクセス数に、第2の特定コンテンツのアクセスされにくさを打ち消すような係数を乗算し、アクセス数が補正されてもよい。第1の特定コンテンツは、例えばAショッピングサイトのコンテンツであり、第2の特定コンテンツは、例えばBショッピングサイトのコンテンツである。
(Example 3)
An index indicating accessibility may be set for each specific content, and the index may be used for deriving the score. For example, if there is a first specific content and a second specific content, and the first specific content is more accessible than the second specific content, the number of accesses to the second specific content is the second. The number of accesses may be corrected by multiplying by a coefficient that negates the inaccessibility of the specific content of. The first specific content is, for example, the content of the A shopping site, and the second specific content is, for example, the content of the B shopping site.

例えば、第1の特定コンテンツのアクセスされやすさは、第2の特定コンテンツのアクセスされやすさの半分程度である場合、第1の特定コンテンツのアクセス数は2倍され、スコアの導出に用いられる。 For example, if the accessibility of the first specific content is about half the accessibility of the second specific content, the number of accesses of the first specific content is doubled and used for deriving the score. ..

評価部58は、ネットワークNWにおいて取得可能なアクセス数やクリック数などの情報を用いて係数やスコアを導出する。係数は、第1の特定コンテンツを提供している第1サービスに対するアクセス数と、第1の特定コンテンツに対するアクセス数との比、および第2の特定コンテンツを提供している第2サービスに対するアクセス数と、第2の特定コンテンツに対するアクセス数との比に基づいて導出されてもよい。 The evaluation unit 58 derives a coefficient and a score using information such as the number of accesses and the number of clicks that can be acquired in the network NW. The coefficient is the ratio of the number of accesses to the first service providing the first specific content to the number of accesses to the first specific content, and the number of accesses to the second service providing the second specific content. And may be derived based on the ratio of the number of accesses to the second specific content.

上述した処理をエンティティごとに行うことにより、第2スコア情報76においてエンティティとキーワードとの組み合わせに対してスコアが付与される。そして、スコアが付与された第2スコア情報76は、記憶部70に記憶される。 By performing the above-mentioned processing for each entity, a score is given to the combination of the entity and the keyword in the second score information 76. Then, the second score information 76 to which the score is given is stored in the storage unit 70.

図8は、スコアが付与された第2スコア情報76の内容の一例を示す図である。スコアは、エンティティとキーワードとの組み合わせごとに付与される。例えば、複数のエンティティに対して、同一のキーワードが対応づけられている場合、その組み合わせごとにスコアが付与される。このように、スコアが付与されることにより、例えば、複数のエンティティに対応付けられたクエリが入力され、そのクエリに対するエンティティが選択される場合、後述する図9で説明するようにクエリ(キーワード)とエンティティとの組み合わせに付与されたスコアを参照して、適切なエンティティが選択される。 FIG. 8 is a diagram showing an example of the contents of the second score information 76 to which a score is given. The score is given for each combination of the entity and the keyword. For example, when the same keyword is associated with a plurality of entities, a score is given for each combination. By giving a score in this way, for example, when a query associated with a plurality of entities is input and an entity for the query is selected, the query (keyword) is as described with reference to FIG. 9 described later. The appropriate entity is selected by referring to the score given to the combination of and the entity.

[ナレッジパネルの提供]
応答部60は、検索サーバ20からクエリを取得し、取得したクエリに応じた情報を検索サーバ20に提供する。図9は、ナレッジパネルをユーザに提供する処理の流れの一例を示すフローチャートである。まず、応答部60は、検索サーバ20からクエリを受信したか否かを判定する(S100)。クエリを受信すると、応答部60は、スコアが付与された、第1スコア情報74および第2スコア情報76を参照し、クエリと合致するキーワードに対応付けられているエンティティをエンティティ候補として抽出し、更にエンティティ候補のスコアを取得する(S102)。
[Providing a knowledge panel]
The response unit 60 acquires a query from the search server 20 and provides the search server 20 with information corresponding to the acquired query. FIG. 9 is a flowchart showing an example of the flow of processing for providing the knowledge panel to the user. First, the response unit 60 determines whether or not a query has been received from the search server 20 (S100). Upon receiving the query, the response unit 60 refers to the first score information 74 and the second score information 76 to which the score is given, extracts the entity associated with the keyword matching the query as an entity candidate, and extracts the entity. Further, the score of the entity candidate is acquired (S102).

次に、応答部60は、エンティティ候補のうち、最も高いスコアが付与されたエンティティ候補をエンティティとして決定する(S104)。次に、応答部60は、ナレッジグラフ72においてキーワードに関連付けられているエンティティの所在情報を検索サーバ20に送信する(S106)。なお、S104において応答部60は、閾値以上のスコアが付与されたエンティティ候補が存在しない場合、所在情報を送信しなかったり、基準を満たすエンティティが存在しないことを示す情報を検索サーバ20に送信したりしてもよい。これにより、本フローチャートの処理は終了する。 Next, the response unit 60 determines the entity candidate to which the highest score is given among the entity candidates as an entity (S104). Next, the response unit 60 transmits the location information of the entity associated with the keyword in the knowledge graph 72 to the search server 20 (S106). In S104, when the entity candidate with the score equal to or higher than the threshold value does not exist, the response unit 60 does not transmit the location information or transmits information indicating that there is no entity satisfying the criteria to the search server 20. You may do it. This ends the processing of this flowchart.

図10は、ナレッジパネルをユーザに提供する処理の流れの概念図である。例えば、「C-D-E」というクエリが入力された場合、エンティティ「C-D-E 漫画」、「C-D-E アニメ」、「C-D-E 映画」のそれぞれと、キーワード「C-D-E」との組み合わせに対して付与されたスコアのうち、最も高いスコアを有するエンティティ「C-D-E 漫画」が、入力されたクエリに対するエンティティとして決定される。そして、図11に示すようなコンテンツがクエリを入力したユーザに提供される。 FIG. 10 is a conceptual diagram of a process flow for providing a knowledge panel to a user. For example, when the query "CDE" is entered, each of the entities "CDE cartoon", "CDE animation", "CDE movie" and the keyword "CDE movie" are entered. Among the scores given to the combination with "CDE", the entity "CDE cartoon" having the highest score is determined as the entity for the input query. Then, the content as shown in FIG. 11 is provided to the user who has input the query.

[ナレッジパネルの一例]
図11は、ユーザに提供されるナレッジパネルの一例を示す図である。図11に示す端末装置10の表示部12には、クエリ入力領域13と、ナレッジパネル14と、検索結果15とが含まれるコンテンツが表示される。ナレッジパネル14には、クエリに対応するエンティティ16と、エンティティ16に関連する画像17と、エンティティ16に関連する関連情報18とが含まれる。検索サーバ20は、ナレッジデータサーバ50により送信された所在情報が示すコンテンツのうち、エンティティに関連する情報を抽出する。検索サーバ20は、抽出したエンティティに関連する情報(例えばナレッジパネル14に含まれる情報)を含めたコンテンツを生成し、生成したコンテンツをユーザの端末装置10に提供する。これにより、図11に示すような情報が、端末装置10の表示部12に表示される。
[Example of knowledge panel]
FIG. 11 is a diagram showing an example of a knowledge panel provided to a user. The display unit 12 of the terminal device 10 shown in FIG. 11 displays the content including the query input area 13, the knowledge panel 14, and the search result 15. The knowledge panel 14 includes the entity 16 corresponding to the query, the image 17 related to the entity 16, and the related information 18 related to the entity 16. The search server 20 extracts information related to the entity from the contents indicated by the location information transmitted by the knowledge data server 50. The search server 20 generates content including information related to the extracted entity (for example, information included in the knowledge panel 14), and provides the generated content to the user's terminal device 10. As a result, the information shown in FIG. 11 is displayed on the display unit 12 of the terminal device 10.

[比較]
例えば、比較例のナレッジデータサーバは、「第2基準」を適用せずに、画一的に「第1基準」を適用して処理を行っている場合がある。例えば、キャラクター「C-D-E」を題材にした漫画や、アニメ、映画、小説などが存在し、エンティティとして「C-D-E 漫画」、「C-D-E アニメ」、「C-D-E 映画」、「C-D-E 小説」が存在するものとする。この場合に、クエリ「C-D-E]が入力された場合、百科事典のコンテンツの情報に基づいて、エンティティが選択されるため、多くのユーザが望んでいると思わる情報を提供できない場合があった。なぜなら、百科事典のコンテンツの情報と、多くのユーザが望んでいると思われるエンティティとの結びつきが弱く、逆に少数のユーザが望んでいると思われるエンティティとの結びつきが強い場合があるためである。また、各エンティティが有する概念が社会の中でどのように使用されているか、浸透しているか、流行しているかなどが加味されていないためである。
[Comparison]
For example, the knowledge data server of the comparative example may perform processing by uniformly applying the "first standard" without applying the "second standard". For example, there are manga, anime, movies, novels, etc. based on the character "CDE", and the entities are "CDE manga", "CDE animation", and "C-". It is assumed that "DE movie" and "CDE novel" exist. In this case, if the query "CDE" is entered, the entity is selected based on the information in the encyclopedia content, so it is not possible to provide the information that many users think they want. There was a weak connection between the information in the encyclopedia content and the entity that many users would want, and conversely the strong connection with the entity that a few users would want. Also, it does not take into account how the concepts of each entity are used in society, whether they are pervasive, or whether they are popular.

これに対し、本実施形態のナレッジデータサーバ50は、所定のエンティティに対しては「第2基準」を適用して、エンティティとキーワードとの組み合わせに対してスコアを付与し、このスコアに基づいてエンティティを選択することにより、多くのユーザが望んでいると思わる情報を提供することができる。例えば、第2基準において、スコアが付与される際に、より積極的に、各エンティティが有する概念が社会の中でどのように使用されているか、浸透しているか、流行しているかなどが加味されるため、よりユーザが望んでいる情報をユーザに提供することができる。 On the other hand, the knowledge data server 50 of the present embodiment applies the "second criterion" to a predetermined entity, gives a score to the combination of the entity and the keyword, and based on this score. By selecting an entity, it is possible to provide the information that many users think they want. For example, in the second criterion, when a score is given, how the concept of each entity is used, permeated, or popular in society is added more positively. Therefore, it is possible to provide the user with the information that the user wants more.

以上説明した第1実施形態によれば、ナレッジデータサーバ50が、エンティティに対応付けられた属性情報を参照し、エンティティが第2基準の適用対象であると判定した場合、第2基準に基づいて、エンティティとキーワードとの組み合わせに対する評価を行うことにより、エンティティとキーワードとの関係を、適切に評価することができる。 According to the first embodiment described above, when the knowledge data server 50 refers to the attribute information associated with the entity and determines that the entity is the target of application of the second criterion, it is based on the second criterion. , By evaluating the combination of the entity and the keyword, the relationship between the entity and the keyword can be appropriately evaluated.

<第2実施形態>
以下、第2実施形態について説明する。第2実施形態では、第2基準を適用する処理において、特定コンテンツに関する情報に加えて、補助情報がスコアの導出に用いられる。
以下、第1実施形態との相違点について説明する。
<Second Embodiment>
Hereinafter, the second embodiment will be described. In the second embodiment, in the process of applying the second criterion, auxiliary information is used for deriving the score in addition to the information about the specific content.
Hereinafter, the differences from the first embodiment will be described.

補助情報とは、例えば、社会におけるエンティティの関心度に関する情報(例えば関心度の変動要因を示す情報)である。変動要因とは、例えば、人気度を示す指標や、書籍の発行部数、映画の観客動員数、書籍の発行日、アニメ(またはテレビドラマ)の放送日、映画の上映日などである。人気度を示す指標とは、例えば、ナレッジパネル14に含まれる情報に対するクリック数に基づいて導出された指標(補正値)である。例えば、ナレッジパネル14に「C-D-E 漫画」を示す情報、「C-D-E アニメ」を示す情報、「C-D-E 映画」を示す情報を示す情報が含まれ、「C-D-E 映画」を示す情報に対するクリック数が他の情報に対するクリック数よりも高い場合、「C-D-E 映画」の人気度が、「C-D-E 漫画」および「C-D-E アニメ」よりも高いものとされる。この場合。クリック数が高い情報に対応するエンティティに対して大きい補正値が設定される。 The auxiliary information is, for example, information regarding the degree of interest of an entity in society (for example, information indicating a variable factor of the degree of interest). Fluctuation factors include, for example, an index showing popularity, the number of copies of a book, the number of spectators in a movie, the date of publication of a book, the date of broadcasting an animation (or TV drama), the date of showing a movie, and the like. The index indicating the popularity is, for example, an index (correction value) derived based on the number of clicks on the information contained in the knowledge panel 14. For example, the knowledge panel 14 contains information indicating "CDE cartoon", information indicating "CDE animation", information indicating "CDE movie", and "C". When the number of clicks on the information indicating "DE movie" is higher than the number of clicks on other information, the popularity of "CDE movie" is "CDE cartoon" and "CD". -It is considered to be higher than "E Anime". in this case. A large correction value is set for the entity corresponding to the information with a high number of clicks.

また、漫画の発行部数が所定数以上である場合や、漫画の発行が所定期間内にされた場合、「C-D-E 漫画」の人気度は、他のエンティティよりも高い補正値が設定されてもよい。また、アニメの放送が所定期間内にされた場合、「C-D-E アニメ」の人気度は、他のエンティティよりも高い補正値が設定されてもよい。 In addition, if the circulation of manga is more than the specified number, or if the manga is issued within the specified period, the popularity of "CDE Manga" is set to a higher correction value than other entities. May be done. Further, when the animation is broadcast within a predetermined period, the popularity of the "CDE animation" may be set to a higher correction value than that of other entities.

図12は、補助情報が付与された第2スコア情報76Aの内容の一例を示す図である。
第2スコア情報76Aには、例えば、第2スコア情報76の内容に加え、更に補正値が対応付けられている。この補正値は、例えば、エンティティごとに対応付けられている。例えば、「C-D-E 映画」が、他のエンティティよりも関心度が高いと推定される場合、「C-D-E 映画」には、他のエンティティよりも高い補正値が付与されている。そして、導出されたスコアは、補正値によって補正され、補正後のスコアが、エンティティが選択される際の比較対象となる。
FIG. 12 is a diagram showing an example of the contents of the second score information 76A to which the auxiliary information is added.
The second score information 76A is associated with, for example, a correction value in addition to the content of the second score information 76. This correction value is associated with each entity, for example. For example, if the "CDE movie" is presumed to be more interested than the other entities, the "CDE movie" is given a higher correction value than the other entities. There is. Then, the derived score is corrected by the correction value, and the corrected score becomes a comparison target when the entity is selected.

以上説明した第2実施形態によれば、エンティティの関心度の変動要因に基づいて、スコアが調整されるため、エンティティとキーワードとの関係を、より適切に評価することができる。ひいては、より適切なエンティティが選択され、より適切な情報をユーザに提供される。 According to the second embodiment described above, since the score is adjusted based on the variable factor of the degree of interest of the entity, the relationship between the entity and the keyword can be evaluated more appropriately. As a result, a more appropriate entity is selected and more appropriate information is provided to the user.

<第3実施形態>
以下、第3実施形態について説明する。第1実施形態では、評価部58が、エンティティのクラスに基づいて第1基準または第2基準を適用してスコアを導出するものとした。これに対して、第2実施形態では、評価部58は、エンティティのクラスに対応付けられた基準に基づいてスコアを導出する。以下、第1実施形態との相違点について説明する。
<Third Embodiment>
Hereinafter, the third embodiment will be described. In the first embodiment, the evaluation unit 58 applies the first criterion or the second criterion based on the class of the entity to derive the score. On the other hand, in the second embodiment, the evaluation unit 58 derives the score based on the criteria associated with the class of the entity. Hereinafter, the differences from the first embodiment will be described.

評価部58は、例えば、記憶部70に記憶された基準情報78に基づいて、スコアを導出する。図13は、基準情報78の内容の一例を示す図である。基準情報78は、クラスと、スコアを導出する際の基準とが互いに対応付けられた情報である。スコアを導出する際の基準は、例えば、百科事典のコンテンツのアクセス数を用いる基準や、百科事典のコンテンツおよび所定のショッピングサイトのコンテンツに対するアクセス数を用いる基準、複数のショッピングサイトのコンテンツに対するアクセス数を用いる基準等である。評価部58は、例えば、基準情報78を参照し、エンティティに対応付けられたクラスに対応する基準を抽出し、抽出した基準に応じた情報に基づいてスコアを導出する。 The evaluation unit 58 derives a score based on, for example, the reference information 78 stored in the storage unit 70. FIG. 13 is a diagram showing an example of the contents of the reference information 78. The reference information 78 is information in which the class and the criteria for deriving the score are associated with each other. The criteria for deriving the score are, for example, the criteria for using the number of accesses to the contents of the encyclopedia, the criteria for using the number of accesses to the contents of the encyclopedia and the contents of a predetermined shopping site, and the criteria for the number of accesses to the contents of multiple shopping sites. It is a standard etc. to use. For example, the evaluation unit 58 refers to the reference information 78, extracts the criteria corresponding to the class associated with the entity, and derives the score based on the information according to the extracted criteria.

以上説明した第3実施形態によれば、クラスごとに対応付けられた基準に基づいて、スコアが導出されるため、エンティティとキーワードとの関係を、より適切に評価することができる。ひいては、より適切なエンティティが選択され、より適切な情報をユーザに提供される。 According to the third embodiment described above, since the score is derived based on the criteria associated with each class, the relationship between the entity and the keyword can be evaluated more appropriately. As a result, a more appropriate entity is selected and more appropriate information is provided to the user.

以上説明した各実施形態は、エンティティに対応付けられた属性情報を参照し、エンティティが第1基準の適用対象であるか、エンティティが第2基準の適用対象であるかを判定する判定部56と、第1基準の適用対象であると判定された場合、第1基準に基づいて、エンティティとキーワードとの組み合わせに対する評価を行い、第2基準の適用対象であると判定された場合、第2基準に基づいて、組み合わせに対する評価を行う評価部58とを備えることにより、エンティティとキーワードとの関係を、適切に評価することができる。ひいては、適切なエンティティが選択し、より適切な情報をユーザに提供することができる。 In each of the embodiments described above, the determination unit 56 that refers to the attribute information associated with the entity and determines whether the entity is the application target of the first criterion or the entity is the application target of the second criterion. , If it is determined that the first criterion is applied, the combination of the entity and the keyword is evaluated based on the first criterion, and if it is determined that the second criterion is applied, the second criterion is applied. By providing the evaluation unit 58 that evaluates the combination based on the above, the relationship between the entity and the keyword can be appropriately evaluated. As a result, the appropriate entity can be selected and provide the user with more appropriate information.

以上、本発明を実施するための形態について実施形態を用いて説明したが、本発明はこうした実施形態に何等限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々の変形及び置換を加えることができる。 Although the embodiments for carrying out the present invention have been described above using the embodiments, the present invention is not limited to these embodiments, and various modifications and substitutions are made without departing from the gist of the present invention. Can be added.

10‥端末装置、20‥検索サーバ、30‥クロール対象装置、50‥ナレッジデータサーバ、52‥通信部、54‥収集部、56‥判定部、58‥評価部、60‥応答部、70‥記憶部、72‥ナレッジグラフ、74‥第1スコア情報、76‥第2スコア情報 10 ... Terminal device, 20 ... Search server, 30 ... Crawling target device, 50 ... Knowledge data server, 52 ... Communication unit, 54 ... Collection unit, 56 ... Judgment unit, 58 ... Evaluation unit, 60 ... Response unit, 70 ... Memory Department, 72 ... Knowledge Graph, 74 ... 1st Score Information, 76 ... 2nd Score Information

Claims (10)

エンティティに対応付けられた属性情報を参照し、前記エンティティが第1種別であるか、前記エンティティが第2種別であるかを判定する判定部と、
前記第1種別であると判定された場合、ネットワークにより提供されるユーザによって編集可能な前記エンティティに対応する百科事典の第1コンテンツに関する情報に基づいて、前記エンティティとクエリとの組み合わせに対する評価を行い、
前記第2種別であると判定された場合、前記エンティティに関する商品またはサービス(以下、商品等)を販売するコンテンツ、またはユーザに商品等に対する評価に関する情報を提供するコンテンツである第2コンテンツの利用状況に基づいて、前記組み合わせに対する評価を行い、
前記評価の結果を用いて、入力されたクエリに応じたエンティティを決定するための情報を生成する評価部と、
を備える情報処理装置。
A determination unit that refers to the attribute information associated with the entity and determines whether the entity is the first type or the entity is the second type .
If it is determined to be the first type, the combination of the entity and the query is evaluated based on the information about the first content of the encyclopedia corresponding to the entity provided by the network and editable by the user. ,
When it is determined to be the second type, the usage status of the second content, which is the content for selling the product or service (hereinafter, product, etc.) related to the entity, or the content for providing the user with information regarding the evaluation of the product, etc. Based on, the above combination is evaluated and
An evaluation unit that generates information for determining an entity according to an input query using the evaluation result, and an evaluation unit.
Information processing device equipped with.
前記評価部は、前記第2種別であると判定された場合、前記第2コンテンツへのアクセス数、前記第2コンテンツに画面を遷移させるためのクリック数、または前記クリック数が統計的に処理した結果に基づいて、前記組み合わせに対する評価を行う、
請求項1に記載の情報処理装置。
When the evaluation unit determines that the second type is used, the number of accesses to the second content, the number of clicks for transitioning the screen to the second content, or the number of clicks is statistically processed. Based on the result, the above combination is evaluated.
The information processing apparatus according to claim 1.
前記評価部は、前記第2種別であると判定された場合、更に、前記エンティティに対応する媒体が発売、放映または上映された日を加味して、前記組み合わせに対する評価を行う、
請求項2に記載の情報処理装置。
When the evaluation unit is determined to be the second type, the evaluation unit further evaluates the combination in consideration of the date when the medium corresponding to the entity is released, aired, or screened.
The information processing apparatus according to claim 2.
前記第2種別であると判定される属性情報が対応付けられたエンティティは、複数のメディアで同一の表現によって共通して用いられている概念を含むものである、
請求項1から3のうちいずれか1項に記載の情報処理装置。
The entity to which the attribute information determined to be the second type is associated includes the concept commonly used by the same expression in a plurality of media.
The information processing apparatus according to any one of claims 1 to 3.
前記メディアは、漫画、アニメ、映画、テレビ、小説、または音楽である、
請求項4に記載の情報処理装置。
The media may be cartoons, anime, movies, television, novels, or music.
The information processing apparatus according to claim 4.
入力されたクエリと、前記評価部の評価結果とに基づいて、エンティティを選択し、選択したエンティティに関する情報をユーザに提供する応答部を更に備える、
請求項1から5のうちいずれか1項に記載の情報処理装置。
It further includes a response unit that selects an entity based on the input query and the evaluation result of the evaluation unit and provides the user with information about the selected entity.
The information processing apparatus according to any one of claims 1 to 5.
前記評価部は、
前記第1種別であると判定された場合、ネットワークにより提供されるユーザによって編集可能な前記エンティティに対応する百科事典の第1コンテンツにおいて、エンティティに関連付けられ且つ前記エンティティを示す対象クエリがリンク先を示すアンカーテキストとして含まれる度合に基づいて、前記組み合わせに対する第1指標を導出し、
前記第2種別であると判定された場合、少なくとも前記第2コンテンツの利用状況に基づいて、前記組み合わせに対する第2指標を導出し、
前記第1指標または前記第2指標に基づいて、入力されたクエリに応じたエンティティを決定するための情報を生成する、
請求項1から6のうちいずれか1項に記載の情報処理装置。
The evaluation unit
When it is determined to be the first type, in the first content of the encyclopedia corresponding to the entity provided by the network and editable by the user, the target query associated with the entity and indicating the entity links to the link destination. A first index for the combination is derived based on the degree to which it is included as the indicated anchor text.
When it is determined that the second type is used, a second index for the combination is derived based on at least the usage status of the second content.
Generates information to determine the entity according to the entered query based on the first metric or the second metric.
The information processing apparatus according to any one of claims 1 to 6.
エンティティを決定するための情報に基づいて決定されたエンティティに関連付けられた第3コンテンツを前記ユーザに提供する提供部を備える、
請求項1から7のうちいずれか1項に記載の情報処理装置。
A provision unit that provides the user with a third content associated with the entity determined based on the information for determining the entity.
The information processing apparatus according to any one of claims 1 to 7.
コンピュータが、
エンティティに対応付けられた属性情報を参照し、前記エンティティが第1種別であるか、前記エンティティが第2種別であるかを判定し
前記第1種別であると判定された場合、ネットワークにより提供されるユーザによって編集可能な前記エンティティに対応する百科事典の第1コンテンツに関する情報に基づいて、前記エンティティとクエリとの組み合わせに対する評価を行い、
前記第2種別であると判定された場合、前記エンティティに関する商品またはサービス(以下、商品等)を販売するコンテンツ、またはユーザに商品等に対する評価に関する情報を提供するコンテンツである第2コンテンツの利用状況に基づいて、前記組み合わせに対する評価を行い、
前記評価の結果を用いて、入力されたクエリに応じたエンティティを決定するための情報を生成する、
情報処理方法。
The computer
With reference to the attribute information associated with the entity, it is determined whether the entity is the first type or the entity is the second type .
If it is determined to be the first type, the combination of the entity and the query is evaluated based on the information about the first content of the encyclopedia corresponding to the entity provided by the network and editable by the user. ,
When it is determined to be the second type, the usage status of the second content, which is the content for selling the product or service (hereinafter, product, etc.) related to the entity, or the content for providing the user with information regarding the evaluation of the product, etc. Based on, the above combination is evaluated and
Using the result of the evaluation, information for determining the entity according to the input query is generated.
Information processing method.
コンピュータに、
エンティティに対応付けられた属性情報を参照し、前記エンティティが第1種別であるか、前記エンティティが第2種別であるかを判定させ
前記第1種別であると判定された場合、ネットワークにより提供されるユーザによって編集可能な前記エンティティに対応する百科事典の第1コンテンツに関する情報に基づいて、前記エンティティとクエリとの組み合わせに対する評価を行わせ、
前記第2種別であると判定された場合、前記エンティティに関する商品またはサービス(以下、商品等)を販売するコンテンツ、またはユーザに商品等に対する評価に関する情報を提供するコンテンツである第2コンテンツの利用状況に基づいて、前記組み合わせに対する評価を行わせ、
前記評価の結果を用いて、入力されたクエリに応じたエンティティを決定するための情報を生成させる、
プログラム。
On the computer
With reference to the attribute information associated with the entity, it is determined whether the entity is the first type or the entity is the second type .
If it is determined to be the first type, the combination of the entity and the query is evaluated based on the information about the first content of the encyclopedia corresponding to the entity provided by the network and editable by the user. Let me,
When it is determined to be the second type, the usage status of the second content, which is the content for selling the product or service (hereinafter, product, etc.) related to the entity, or the content for providing the user with information regarding the evaluation of the product, etc. To evaluate the combination based on
Using the result of the evaluation, the information for determining the entity according to the input query is generated.
program.
JP2018050672A 2018-03-19 2018-03-19 Information processing equipment, information processing methods, and programs Active JP6993913B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018050672A JP6993913B2 (en) 2018-03-19 2018-03-19 Information processing equipment, information processing methods, and programs

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018050672A JP6993913B2 (en) 2018-03-19 2018-03-19 Information processing equipment, information processing methods, and programs

Publications (2)

Publication Number Publication Date
JP2019164424A JP2019164424A (en) 2019-09-26
JP6993913B2 true JP6993913B2 (en) 2022-01-14

Family

ID=68065620

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018050672A Active JP6993913B2 (en) 2018-03-19 2018-03-19 Information processing equipment, information processing methods, and programs

Country Status (1)

Country Link
JP (1) JP6993913B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7354019B2 (en) * 2020-03-02 2023-10-02 ヤフー株式会社 Information processing device, information processing method, and program
JP7323484B2 (en) * 2020-03-19 2023-08-08 ヤフー株式会社 Information processing device, information processing method, and program

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004362019A (en) 2003-06-02 2004-12-24 Sharp Corp Information recommendation device, information recommendation method, information recommendation program and recording medium
JP2013178831A (en) 2013-06-04 2013-09-09 Jamu:Kk Information search device, information search program, and program storage medium
JP2015032254A (en) 2013-08-06 2015-02-16 ソニー株式会社 Information processing apparatus, information processing method, and program
JP2016062275A (en) 2014-09-17 2016-04-25 ヤフー株式会社 Extractor, and method and program for extraction

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004362019A (en) 2003-06-02 2004-12-24 Sharp Corp Information recommendation device, information recommendation method, information recommendation program and recording medium
JP2013178831A (en) 2013-06-04 2013-09-09 Jamu:Kk Information search device, information search program, and program storage medium
JP2015032254A (en) 2013-08-06 2015-02-16 ソニー株式会社 Information processing apparatus, information processing method, and program
JP2016062275A (en) 2014-09-17 2016-04-25 ヤフー株式会社 Extractor, and method and program for extraction

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
齋藤 智輝,ウェブ検索クエリに対する教師なしエンティティリンキング,言語処理学会第24回年次大会 発表論文集 [online],言語処理学会,2018年03月05日,[2018年4月16日検索]Internet<URL:http://www.anlp.jp/proceedings/annual_meeting/2018/pdf_dir/B3-5.pdf>

Also Published As

Publication number Publication date
JP2019164424A (en) 2019-09-26

Similar Documents

Publication Publication Date Title
US8301728B2 (en) Technique for providing a reliable trust indicator to a webpage
US7953736B2 (en) Relevancy rating of tags
RU2693323C2 (en) Recommendations for the user elements selection method and server
US9396485B2 (en) Systems and methods for presenting content
US20090287645A1 (en) Search results with most clicked next objects
JP5623516B2 (en) Open search support
CN105706083A (en) Structured user graph to support querying and predictions
US20100042615A1 (en) Systems and methods for aggregating content on a user-content driven website
JP2005092881A (en) Improved system and method for ranking document based upon structurally interrelated information
CN106156244A (en) A kind of information search air navigation aid and device
JP7448613B2 (en) Serving different content pages based on varying user interactions with a single content item
US20210109989A1 (en) Systems and methods for automatically generating and optimizing web pages
CN109804368A (en) For providing the system and method for contextual information
WO2014108038A1 (en) Frequently-used website generation client terminal, server, system and method
US10404816B2 (en) Determining browsing activities
KR100856916B1 (en) Information providing method and system of extracting a personalized issue
US20200394194A1 (en) Multi-vertical entity-based search system
JP6993913B2 (en) Information processing equipment, information processing methods, and programs
US20120203865A1 (en) Apparatus and methods for providing behavioral retargeting of content from partner websites
JP6162134B2 (en) Social page trigger
CN109074401B (en) Extraction of primary content of a linked list
JP6515736B2 (en) INFORMATION PROCESSING APPARATUS AND INFORMATION PROCESSING PROGRAM
JP6971209B2 (en) Information processing equipment, information processing methods, and programs
JP7078569B2 (en) Information processing equipment, information processing methods, and programs
Hatab Improve website rank using search engine optimization (SEO)

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20191101

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20191108

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200312

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210309

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210323

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210521

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20211116

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20211210

R150 Certificate of patent or registration of utility model

Ref document number: 6993913

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350