JP2019057022A - 情報処理装置、情報処理方法、およびプログラム - Google Patents

情報処理装置、情報処理方法、およびプログラム Download PDF

Info

Publication number
JP2019057022A
JP2019057022A JP2017180066A JP2017180066A JP2019057022A JP 2019057022 A JP2019057022 A JP 2019057022A JP 2017180066 A JP2017180066 A JP 2017180066A JP 2017180066 A JP2017180066 A JP 2017180066A JP 2019057022 A JP2019057022 A JP 2019057022A
Authority
JP
Japan
Prior art keywords
text data
web page
entity
target text
probability
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017180066A
Other languages
English (en)
Other versions
JP6971104B2 (ja
Inventor
智輝 齋藤
Tomoki Saito
智輝 齋藤
樹生 豊田
Mikio Toyoda
樹生 豊田
真也 夜久
Shinya Yaku
真也 夜久
宏希 岩澤
Hiroki Iwasawa
宏希 岩澤
健 萩原
Takeshi Hagiwara
健 萩原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2017180066A priority Critical patent/JP6971104B2/ja
Publication of JP2019057022A publication Critical patent/JP2019057022A/ja
Application granted granted Critical
Publication of JP6971104B2 publication Critical patent/JP6971104B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】不適切な情報が検索結果とともに出力されるのを抑制すること。【解決手段】コンテンツ情報において対象テキストデータに関連付けられたエンティティ毎に、第1種類の関連ウェブページにおいて、対象テキストデータがリンク先を示すテキストとして含まれる第1確率と、第2種類の関連ウェブページにおいて、コンテンツ情報において対象テキストデータと関連付けられたエンティティをテキストとして含むリンク先が選択された第2確率とのうち、少なくとも1つと、第1種類の関連ウェブページまたは第2種類の関連ウェブページにおけるテキストにより示されるリンク先にあるウェブページが、コンテンツ情報において対象テキストデータと関連付けられるエンティティのウェブページである第3の確率とに基づいて、対象テキストデータに対応するエンティティとしての評価を行う評価部と、を備える情報処理装置。【選択図】図1

Description

本発明は、情報処理装置、情報処理方法、およびプログラムに関する。
従来、ウェブからデータ(文書や画像など)を収集し、収集したデータを自動的にデータベース化するクローラが知られている(特許文献1参照)。クローラは、ウェブページ中のリンクを辿って、様々なIPアドレスのウェブページからデータを収集する。クローラによって収集されたデータは、ウェブ情報データベースに蓄積される。
一方、検索エンジンは、ユーザによって入力された検索ワードを受信すると、受信した検索ワードに関連するウェブページやアプリページの情報(例えばURL:Uniform Resource Locator)をデータベースから取得し、取得した情報の一覧を検索結果として出力する。
特開2012−69171号公報
検索エンジンは、ユーザ満足度を向上させるため、ユーザによって入力された検索ワード(クエリ)に関連するデータを検索結果とともに出力するように運用されている場合がある。これを実現するために、テキストデータとエンティティとを互いに対応付けて記憶したデータベースが用いられる場合がある。ここで、データベースにおいて、ある特定のエンティティにのみ対応付けられているテキストデータがクエリとして入力されると、自ずと、その特定のエンティティが検索結果とともに出力されることになる。しかしながら、このテキストデータが、エンティティに関する情報として誤りである又は適切ではない場合、不適切な情報が検索結果とともに出力される可能性がある。
本発明は、このような事情を考慮してなされたものであり、不適切な情報が検索結果とともに出力されるのを抑制することができる情報処理装置を提供することを目的の一つとする。
本発明の一態様は、エンティティとテキストデータとが関連付けられたコンテンツ情報のうち、任意の対象のテキストデータを選択する選択部と、前記選択部によって選択された対象テキストデータに関連する一以上の関連ウェブページを収集する収集部と、前記コンテンツ情報において前記対象テキストデータに関連付けられたエンティティ毎に、前記収集部によって収集された一以上の関連ウェブページのうち第1種類の関連ウェブページにおいて、前記対象テキストデータがリンク先を示すテキストとして含まれる第1確率と、前記一以上の関連ウェブページのうち第2種類の関連ウェブページにおいて、前記コンテンツ情報において前記対象テキストデータと関連付けられたエンティティをテキストとして含むリンク先が選択された第2確率とのうち、少なくとも1つと、前記第1種類の関連ウェブページまたは前記第2種類の関連ウェブページにおける前記テキストにより示されるリンク先にあるウェブページが、前記コンテンツ情報において前記対象テキストデータと関連付けられるエンティティのウェブページである第3の確率とに基づいて、前記対象テキストデータに対応するエンティティとしての評価を行う評価部と、を備える情報処理装置である。
本発明の一態様によれば、不適切な情報が検索結果とともに出力されるのを抑制することができる。
本実施形態に係るナレッジデータサーバの使用環境及び構成を示す図である。 本実施形態に係るナレッジグラフの一例を示す図である。 本実施形態に係る「野球選手A」のウェブページの一例を示す図である。 本実施形態に係る「野球チームB」のウェブページの一例を示す図である。 本実施形態に係るコンテンツ情報の一例を示す図である。 本実施形態に係る検索結果ウェブページの一例を示す図である。 本実施形態に係るコンテンツ情報の他の一例を示す図である。 本実施形態に係る検索結果ウェブページの他の一例を示す図である。 本実施形態に係る収集部が収集した関連ウェブページの一例を示す図である。 本実施形態に係る収集部が収集した関連ウェブページの他の一例を示す図である。 本実施形態に係る同一のエンティティの一例を示す図である。 本実施形態に係る「野球選手A」のウェブページの他の一例を示す図である。 本実施形態に係るコンテンツ情報及び得点の一例を示す図である。 本実施形態のナレッジデータサーバの得点を算出する動作の一例を示す流れ図である。 本実施形態のナレッジデータサーバ得点に基づく動作の一例を示す流れ図である。
以下、図面を参照し、本発明の情報処理装置、情報処理方法、及びプログラムの実施形態について説明する。本実施形態においては、情報処理装置が、ナレッジデータサーバの一部を構成するものとして説明する。ナレッジデータサーバは、例えば、収集対象データ(例えば、画像やテキストデータ)を収集し、収集したデータに基づいてナレッジグラフを生成するサーバである。本実施形態において、ナレッジグラフは、エンティティやクラス、プロパティと、エンティティに関連する関連データが記載されているウェブページの所在情報とが関連付けられたデータである。エンティティとは、例えば、ある対象事物の実体(例えば、実世界で存在している物体)を表していてもよいし、ある対象事物の概念(例えば、実世界または仮想世界の中で定義された概念)を表していてもよい。例えば、対象事物が「建物」という概念である場合、エンティティは、「○○塔」や「○○ビルディング」などといった実体を表してよい。また、例えば、対象事物が「経済学」という概念である場合、エンティティは、「ミクロ経済学」や「マクロ経済学」などといった実体のない抽象的な概念を表してよい。以下、実施形態について詳細に説明する。
<実施形態>
<1−1.ナレッジデータサーバの使用環境>
図1は、本実施形態に係るナレッジデータサーバ100の使用環境及び構成を示す図である。ナレッジデータサーバ100は、端末装置200と、ウェブサーバ300と、クロール対象機器DVと、ネットワークNWを介して通信可能に接続される。ネットワークNWは、ワールドワイドウェブ(World Wide Web)を意味し、インターネットやイントラネットで標準的に用いられるHTML文書などを利用したシステムである。ネットワークNWは、無線基地局やプロバイダ装置、専用回線などを更に含んでよい。
端末装置200は、ユーザによって使用される装置であり、例えば、スマートフォンなどの携帯電話、タブレット型コンピュータ、ノート型コンピュータ、デスクトップ型コンピュータなどである。ウェブサーバ300は、検索エンジンを用いて検索結果を表示するためのウェブページを生成し、端末装置200に提供するサーバである。
ナレッジデータサーバ100は、例えば、制御部110と、記憶部120とを備える。記憶部120は、例えば、RAM(Random Access Memory)、HDD(Hard Disk Drive)、フラッシュメモリ、またはこれらのうち複数が組み合わされたハイブリッド型記憶装置などにより実現される。また、記憶部120の一部または全部は、NAS(Network Attached Storage)や外部のストレージサーバなど、ナレッジデータサーバ100がアクセス可能な外部装置であってもよい。記憶部120には、ナレッジグラフ(以下、ナレッジグラフD1)と、コンテンツ情報D2とが記憶される。
図2は、本実施形態に係るナレッジグラフD1の一例を示す図である。ナレッジグラフD1において記述された事物は、オントロジーによって定義される。オントロジーとは、事物のクラスおよびプロパティを定義したものであり、クラスとプロパティとの間に成り立つ制約を集めたものである。
クラスとは、オントロジーにおいて、同じ性質を持つ事物同士を一つのグループにしたものである。事物の性質がどういったものであるのか、すなわち事物がどのクラスに属するのかは、後述するプロパティにより決定される。
例えば、くちばしを持ち、卵生の脊椎動物であり、前肢が翼になっている、という性質を持つ事物は、「鳥」というクラスに分類される。また、「鳥」というクラスの中で、飛べない、という性質を持つ事物は、例えば、「ペンギン」や「ダチョウ」という、より下位のクラスに分類される。このように、クラスの体系は、上位と下位の関係を有する階層構造となっていてよい。上位のクラスの性質は、下位のクラスに継承される。上述した例では、「鳥」というクラスの、「くちばしを持ち、卵生の脊椎動物であり、前肢が翼になっている」という性質は、「ペンギン」や「ダチョウ」という下位のクラスの性質にも含まれることになる。クラスを識別するためのクラス名は、例えば、「鳥」というクラスであれば、そのクラス名は「鳥」という文字列によって表されてよい。なお、クラス名は、必ずしも意味を表している必要はなく、例えば、「鳥」というクラスであっても、「情報1」や「C1」といった単なる識別情報を示す文字列が割り当てられてもよい。上述したエンティティ、すなわち事物は、オントロジーにより定義されたクラス体系の中に含まれる、いずれかのクラスに属するものとする。
プロパティとは、事物の性質や特徴、クラス間の関係を記述する属性である。例えば、プロパティは、「〜を体の構成要素としてもつ」という性質や、「〜に生息する」という性質を示す属性であってもよいし、「あるクラスが上位クラスであり、あるクラスが下位クラスである」というクラス間の上位下位の関係を示す属性であってもよい。プロパティを識別するためのプロパティ名は、上述したクラス名と同様に、そのプロパティ名自体が意味を表していてもよいし、意味を表していなくてもよい。
ナレッジグラフD1は、上述したクラスがノードとして表され、上述したプロパティがラベル付き、且つ方向性のあるエッジとして表された有向グラフである。このようなグラフ構造によって、事物についての情報がノードにより、事物間の関係がエッジによって判別可能となる。
図2示される例のナレッジグラフD1は、エンティティE1と、エンティティE2とが、「所属チーム」というプロパティ名のクラスに属する。本実施形態において、各エンティティには、各エンティティを識別することが可能な情報(以下、エンティティ識別情報EID)と、エンティティ名と、当該エンティティのウェブページの所在情報とが関連付けられる。所在情報とは、ウェブ上の位置を特定するための情報であり、例えば、URL(Uniform Resource Locator)である。所在情報が示すウェブページには、当該エンティティの関連データが記載されている。図2に示すナレッジグラフD1において、エンティティE1には、エンティティ識別情報EIDの「0001」と、エンティティ名の「野球選手A」と、当該エンティティに関連する関連データが記載されているウェブページの所在情報である「http://百科事典ウェブページ/野球選手A」というURLとが対応付けられている。また、エンティティE2には、エンティティ識別情報EIDの「0002」と、エンティティ名「野球チームB」と、当該エンティティに関連する関連データが記載されているウェブページの所在情報である「http://百科事典ウェブページ/野球チームB」というURLとが対応付けられている。以降の説明において、エンティティに関連する関連データをエンティティの関連データと記載する。また、エンティティの関連データが記載されているウェブページを、エンティティのウェブページとも記載する。
図3は、本実施形態に係る「野球選手A」のウェブページの一例を示す図である。「野球選手A」のウェブページには、「野球選手A」の関連データが記載されている。また、図4は、本実施形態に係る「野球チームB」のウェブページの一例を示す図である。「野球チームB」のウェブページには、「野球チームB」の関連データが記載されている。
図5は、本実施形態に係るコンテンツ情報D2の一例を示す図である。コンテンツ情報D2とは、エンティティと、テキストデータとが関連付けられた情報である。コンテンツ情報D2は、ウェブページに含まれる関連データを収集した収集結果又は検索エンジンの検索ログに基づいて生成される。コンテンツ情報D2は、例えば、エンティティのウェブページに含まれるテキストデータが収集され、収集されたテキストデータと、エンティティとが関連付けられた情報である。また、コンテンツ情報D2は、例えば、エンティティがクエリとして入力された際、当該エンティティと共に入力されたテキストデータと、エンティティとが関連付けられた情報である。図5に示される一例のコンテンツ情報D2において、「野球選手A」というエンティティには、「3000本安打」というテキストデータが関連付けられ、「野球チームB」というエンティティには、「2017年優勝」というテキストデータが関連付けられる。
<1−2.検索結果をウェブページ>
図6は、本実施形態に係る検索結果ウェブページの一例を示す図である。図6に示されるように、表示部210には、クエリ入力領域211と、ナレッジパネル220と、検索結果230とが含まれる検索結果ウェブページが表示される。ナレッジパネル220には、クエリに対応するエンティティ221と、エンティティ221に関連する画像222と、エンティティ221に関連する関連情報223とが含まれる。ユーザは、端末装置200を用いて、端末装置200の表示部210に表示された検索ページにクエリを入力する。クエリとは、一つの検索ワードまたは複数の検索ワードの組み合わせである。端末装置200は、ユーザによって入力されたクエリをウェブサーバ300に送信する。
ウェブサーバ300は、端末装置200から受信したクエリをナレッジデータサーバ100に送信する。ナレッジデータサーバ100は、受信したクエリに対応するエンティティに関連する情報をウェブサーバ300に送信する。ナレッジデータサーバ100は、例えば、コンテンツ情報D2に基づいて、受信したクエリ(テキストデータ)に関連付けられたエンティティを判定する。また、ナレッジデータサーバ100は、ナレッジグラフD1に基づいて、判定したエンティティに対応付けられた所在情報をウェブサーバ300に送信する。ウェブサーバ300は、受信した所在情報に基づいて、当該所在情報が示すウェブページのうち、エンティティの関連データを抽出する。ウェブサーバ300は、抽出したエンティティの関連データ(この一例では、ナレッジパネル220に示す情報)を含めた検索結果ウェブページ(例えば、図6)を生成する。
図6に示される例においては、クエリとして「3000本安打」が入力され、ナレッジパネル220には「3000本安打」に関連する画像や様々な情報が表示されている。ナレッジパネル220には、例えば、「3000本安打」を達成した「野球選手A」の画像222や、「野球選手A」の生年月日や出身地等の関連情報223が表示される。このように、検索結果230だけでなく、ナレッジパネル220を表示部210に表示することで、検索結果に対するユーザ満足度を向上させることができる。
<1−3.少数派のテキストデータが関連付けられたコンテンツ情報D2>
図7は、本実施形態に係るコンテンツ情報D2の他の一例であるコンテンツ情報D2aを示す図である。ここで、コンテンツ情報D2において異なる複数のエンティティに同一のテキストデータが関連付けられる場合がある。例えば、人物を示すエンティティには、人物の性別を示す「男性」のテキストデータや「女性」のテキストデータが対応付けられる。このため、エンティティがそれぞれ異なる人物を示す場合であっても、同一のテキストデータ(例えば、「男性」や「女性」)が対応付けられる。これに対して、エンティティには、他のエンティティにあまり対応付けられないテキストデータが対応付けられる場合がある。図7は、エンティティに少数派のテキストデータが対応付けられたコンテンツ情報D2(以下、コンテンツ情報D2a)を示す図である。
図7に示される例において、コンテンツ情報D2aは、「野球選手A」というエンティティに対し、「暴力男」という少数派のテキストデータが関連付けられている。ここで、コンテンツ情報D2の生成する時点では、エンティティに関連付けられるテキストデータが一般的な意見であるか(多数派であるか)又は少数派の意見であるかについては検証されない。例えば、「野球選手A」に対して少数派の内容(例えば、「暴力男」)を記載したウェブページがネットワークNWに存在する場合、当該ウェブページに基づいて、図7に示されるようなコンテンツ情報D2aが生成される。
<1−4.少数派の意見に基づくナレッジパネル220>
図8は、本実施形態に係る検索結果ウェブページの他の一例を示す図である。クエリ入力領域211に少数派の意見であるテキストデータが入力されることに伴って、表示部210には、当該テキストデータに関連付けられているエンティティの情報を、例えば、ナレッジパネル220に表示した検索結果ウェブページが表示される。図8に示される例においては、クエリ入力領域211に「暴力男」というテキストデータが入力された場合、ナレッジデータサーバ100は、「暴力男」に関連付けられているエンティティが、「野球選手A」であると判定する。そして、ナレッジデータサーバ100は、クエリに応じたエンティティの情報として、「野球選手A」のウェブページの所在情報をウェブサーバ300に供給する。ウェブサーバ300は、「暴力男」に関連する関連データとして「野球選手A」の画像222や、「野球選手A」の生年月日や出身地等の関連情報223を含むナレッジパネル220を表示する検索結果ウェブページを生成する。この場合、ユーザは、検索結果ウェブページを参照し、「野球選手A」が「暴力男」であるという印象を受ける。また、悪意あるユーザは、「野球選手A」が「暴力男」であるという悪い印象を与えたい場合、「野球選手A」が「暴力男」であるという内容をウェブページに記載することにより、ナレッジグラフD1にこの関係が登録されるように誘導し、図8に示されるような検索結果ウェブページを表示させることができる。
このような処理が行われることを抑制するため、エンティティに関連付けられたテキストデータは、当該テキストデータが多数派であるか又は少数派であるかを示す指標が取得されることが好ましい。本実施形態のナレッジデータサーバ100は、エンティティに関連付けられるテキストデータが適切であるかを示す指標(以下、得点)を導出する。以下、ナレッジデータサーバ100の詳細な構成について説明する。
<1−5.ナレッジデータサーバ100の構成>
図1に戻り、制御部110は、例えば、CPU(Central Processing Unit)などのハードウェアプロセッサがプログラム(ソフトウェア)を実行することにより実現される。制御部110は、例えば、選択部111と、収集部112と、得点算出部113と、所在情報取得部114と、通信I/F(Interface)115を備える。また、これらの構成要素のうち一部または全部(内包する記憶部を除く)は、LSI(Large Scale Integration)やASIC(Application Specific Integrated Circuit)、FPGA(Field-Programmable Gate Array)、GPU(Graphics Processing Unit)などのハードウェア(回路部;circuitryを含む)によって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。通信I/F115は、ネットワークNWを介した各機能部と、他の機器(例えば、クロールの対象機器(以下、クロール対象機器DV)、端末装置200、及びウェブサーバ300)との通信を仲介する。
選択部111は、コンテンツ情報D2から得点算出対象の任意のテキストデータ(以下、対象テキストデータ)を選択する。収集部112は、選択部111によって選択された対象テキストデータに関連するウェブページ(以下、関連ウェブページ)を、ネットワークNWを介して収集する。収集部112が収集するウェブページとは、例えば、利用者によって編集可能な百科事典のウェブページや、対象テキストデータをクエリとした場合の検索結果ウェブページである。以下、利用者によって編集可能な百科事典のウェブページを、百科事典ウェブページと記載する。ここで、百科事典ウェブページとは、第1種類の関連ウェブページの一例である。また、検索結果ウェブページとは、第2種類の関連ウェブページの一例である。
図9は、収集部112が収集した百科事典ウェブページの一例を示す図である。図9に示される例においては、収集部112は、百科事典ウェブページのうち、コンテンツ情報D2が示す「野球選手A」のエンティティに関連付けられる「3000本安打」という対象テキストデータが記載された関連ウェブページを収集する。収集部112は、例えば、百科事典ウェブページのHTML(HyperText Markup Language)データを含む収集対象データを、ネットワークNWを介してクロール対象機器DVから収集する。収集部112は、いわゆるクローラプログラムにより実現される。ここで、収集対象データは、ネットワークNW上(クロール対象機器DVの記憶領域内)にあり、ブラウザで閲覧可能なデータである。なお、収集対象データは、ブラウザに限らず、アプリケーションプログラムによって再生されるデータであってもよい。ネットワークNWは、ワールドワイドウェブ(World Wide Web)を意味し、インターネットやイントラネットで標準的に用いられるHTML文書などを利用したシステムである。収集対象データは、例えば、HTMLのソースを示すテキストデータを含む関連ウェブページである。収集部112は、百科事典ウェブページのうち、対象テキストデータが記載された関連ウェブページが存在する場合、そのすべてを収集する。
また、図10は、収集部112が収集した検索結果ウェブページの一例を示す図である。図10に示される例においては、検索結果ウェブページは、コンテンツ情報D2が示すエンティティ「野球選手A」が検索結果として表示される、「3000本安打」というクエリ(図示するテキストTX21)が入力された場合の検索結果を示している。クエリは、対象テキストデータの一例である。
図1に戻り、得点算出部113は、収集部112によって収集された関連ウェブページに基づいて、対象テキストデータとエンティティとの組の得点を算出する。収集部112は、例えば、式(1)が示すP(e|s)の値を得点として算出する。式(1)における各種要素については、後述する式(2)、(3)並びに関連ウェブページの種類ごとに説明する。
Figure 2019057022
以下、関連ウェブページが百科事典ウェブページである場合の得点算出処理の詳細について説明し、次に、関連ウェブページが検索結果ウェブページである場合の得点算出処理の詳細について説明する。
<1−6.関連ウェブページが百科事典ウェブページの場合>
得点算出部113は、百科事典ウェブページに含まれるテキストデータのうち、対象テキストデータと関連付けられたエンティティを示すテキストデータが、リンク先を示すテキスト(アンカーテキスト)として含まれる確率を算出する。関連ウェブページには、対象テキストデータ(この一例では、「3000本安打」(図示するテキストTX11)と関連付けられたエンティティ(この一例では、「野球選手A」)を示すテキストデータ(図示するテキストTX12〜14)が含まれる。また、テキストTX12〜14のうち、テキストTX12は、アンカーテキストである。また、テキストTX12に付与された他のウェブページのリンクは、ナレッジグラフD1において、対象テキストデータに関連付けられたエンティティ(この一例では、「野球選手A」)に対応付けられた所在情報である。
ここで、得点算出部113は、以下の式(2)によって、対象テキストデータを含むすべての百科事典ウェブページにおける対象テキストの数に対して、アンカーテキストである対象テキストデータの数によって求められる確率(以下、アンカーテキスト確率)を算出する。式(2)におけるaは、アンカーテキスト確率を示している。ここで、アンカーテキスト確率とは、第1確率の一例である。
Figure 2019057022
また、得点算出部113は、以下の式(3)によって、当該アンカーテキストのリンク先が、ナレッジグラフD1において対象テキストデータと関連付けられた所在情報に対応するエンティティのウェブページ(以下、特定のウェブページ)である確率(以下、第1エンティティ確率)を算出する。式(3)におけるeとは、第1エンティティ確率を示している。ここで、第1エンティティ確率とは、第3確率の一例である。
Figure 2019057022
収集部112が収集した関連ウェブページが図9に示すウェブページのみである場合、得点算出部113は、すべての関連ウェブページに含まれる対象テキストデータのうち、当該対象テキストデータがアンカーテキストである確率(つまり、アンカーテキスト確率)を「1/3」と算出する。図示する対象テキストデータの中で、リンクが付与されるのは一つだからである(二つ以上付与されている場合も一つとカウントしてよい)。また、得点算出部113は、当該アンカーテキストのリンク先が、対象テキストデータと関連付けられるエンティティの特定のウェブページである確率(第1エンティティ確率)を「1」と算出する。
<1−7.関連ウェブページが検索結果ウェブページの場合>
得点算出部113は、検索結果ウェブページに含まれる対象テキストデータと関連付けられたエンティティをテキストとして含むリンク先が選択された確率を算出する。対象テキストデータは、「3000本安打」(図示するテキストTX21)であり、対象テキストデータと対応け付られたエンティティは、「野球選手A」である。以降の説明において、対象テキストデータと関連付けられたエンティティに係るテキストを、対象エンティティテキストデータと記載する。図10の例では、関連ウェブページには、対象テキストデータの関連ウェブページのリンクが付与されたテキストデータ(図示するテキストTX22〜24)が含まれる。このうち、対象エンティティテキストデータ(この一例では、「野球選手A」)が含まれるのは、テキストTX22である。テキストTX22に付与されたリンク先は、例えば、ナレッジグラフD1において、対象テキストデータに関連付けられたエンティティ(この一例では、「野球選手A」)に対応付けられた所在情報である。つまり、テキストTX22が有する他のウェブページのリンクは、特定のウェブページであり、一例として百科事典ウェブページである。なお、検索結果ウェブページには、リンクを有さないテキストであって、エンティティを示すテキストTX25が含まれてよい。
得点算出部113は、式(2)によって、すべての検索結果ウェブページに含まれるそれぞれのリンク先がクリックされた回数に対して、対象エンティティテキストデータを含むリンク先がクリックされた回数の比として求められる確率(以下、エンティティテキストクリック確率)を算出する。なお、「クリック」とは、選択することの一例であり、タッチ、タップその他の態様で選択されてもよい。以下の説明では代表してクリックと称する。式(2)におけるaは、エンティティテキストクリック確率を示している。ここで、エンティティテキストクリック確率とは、第2確率の一例である。
また、得点算出部113は、式(3)によって、対象エンティティテキストデータを含むリンク先が、エンティティに関する特定のウェブページである確率(以下、第2エンティティ確率)を算出する。式(3)におけるeは、第2エンティティ確率を示している。ここで、第2エンティティ確率とは、第3確率の他の一例である。
<1−8.異なる事物を指す同一のエンティティが含まれる場合>
ここで、エンティティは、同一の文言であっても異なる事物を指す場合がある。図11は、同一の文言によって異なるエンティティのウェブページにリンクしている例を示す図である。図11に示される一例において、テキストTX22は、「野球選手A」のウェブページ(例えば、図3)のリンク先を示す。これに対し、テキストTX26は、「野球選手A」同姓同名の野球選手であって、「野球選手A」とは異なる野球チームCに所属する選手のウェブページのリンク先を示す。得点算出部113は、式(2)において、テキストTX26がクリックされた場合もエンティティクリック確率に算入する。
図12は、エンティティを示す文言からリンクした、別のエンティティに関するウェブページの一例を示す図である。図12に示される「野球選手A」のウェブページには、「3000本安打」というテキストデータに関連付けられる「野球選手A」(図3に示される「野球選手A」)とは異なる野球選手である「野球選手A」に関連する関連データが記載されている。
得点算出部113は、第1エンティティ確率を算出する際、当該リンク先が図12に示されるウェブページの場合には、当該ウェブページをエンティティのウェブページとしてカウントしない。
また、得点算出部113は、第2エンティティ確率を算出する際も、当該リンク先が図12に示されるウェブページの場合には、当該ウェブページをエンティティのウェブページとしてカウントしない。
<1−9.関連ウェブページ毎の重み付け>
また、得点算出部113は、関連ウェブページが百科事典ウェブページである場合において算出されたアンカーテキスト確率に対して第1エンティティ確率を乗じた値に対して、以下の式(4)を更に乗じてもよい。また、得点算出部113は、関連ウェブページが検索結果ウェブページである場合において算出されたエンティティテキストクリック確率に対して第2エンティティ確率を乗じた値に対して、以下の式(4)を更に乗じてもよい。そして、得点算出部113は、例えば、両者を加算して対数を求めることで、スコアを算出する。
Figure 2019057022
式(4)は、百科事典ウェブページを用いて式(2)および式(3)を計算したサンプル数と、検索結果ウェブページを用いて式(2)および式(3)を計算したサンプル数との割合を示す。
得点算出部113は、百科事典ウェブページを用いて式(2)および式(3)を計算したサンプル数の割合を、アンカーテキスト確率と、第1エンティティ確率とを乗じた値に更に乗じ、検索結果ウェブページを用いて式(2)および式(3)を計算したサンプル数の割合を、エンティティテキストクリック確率と、第2エンティティ確率とを乗じた値に更に乗じ、両者を加算することで、得点に重み付けを行う。
得点算出部113は、算出した得点をコンテンツ情報D2に対応付けて記憶させる。図13は、本実施形態に係るコンテンツ情報D2及び得点の一例を示す図である。
図1に戻り、所在情報取得部114は、記憶部120に記憶されたコンテンツ情報D2を参照して、ウェブサーバ300から受信したクエリに対応するエンティティを取得する。所在情報取得部114は、受信したクエリと合致するテキストデータに所定の閾値以上の得点が対応付けられている場合、当該テキストデータに対応付けられているエンティティを、当該クエリに対応するエンティティとして判定する。所在情報取得部114は、ナレッジグラフD1に基づいて、判定したエンティティに対応付けられている所在情報を取得する。その後、所在情報取得部114は、取得した所在情報をウェブサーバ300に送信する。ここで、所在情報取得部114は、判定部の一例である。
このように、所在情報取得部114は、ウェブサーバ300からクエリを受信した場合、クエリに対応するテキストデータを特定する。このとき、クエリとテキストデータとが完全一致する場合だけでなく、部分一致または意味的に同一とみなされる程度の相違がある場合も、対応するテキストデータとみなしてよい。
<1−10.ナレッジデータサーバ100の動作>
以下、ナレッジデータサーバ100の動作について説明する。図14は、本実施形態のナレッジデータサーバ100の得点を算出する動作の一例を示す流れ図である。選択部111は、コンテンツ情報D2のうち、得点算出対象の対象テキストデータを選択する(S110)。次に、収集部112は、対象テキストデータに基づいて、関連ウェブページ(百科事典ウェブページ及び検索結果ウェブページ)を収集する(S120)。次に、得点算出部113は、アンカーテキスト確率及びエンティティテキストクリック確率を算出する(S130)。
次に、得点算出部113は、第1エンティティ確率及び第2エンティティ確率を算出する(S140)。そして、得点算出部113は、百科事典ウェブページに基づくアンカーテキスト確率、第1エンティティ確率、及び第1コンテンツ割合を乗じた値と、検索結果ウェブページに基づくエンティティテキストクリック確率、第2エンティティ確率、及び第2コンテンツ割合を乗じた値との乗を得点として算出し(S150)算出した得点をコンテンツ情報D2に対応付けて記憶部120に記憶させる(S160)。
図15は、本実施形態のナレッジデータサーバ100の得点に基づく動作の一例を示す流れ図である。所在情報取得部114は、ウェブサーバ300からクエリを受信する(S210)。次に、所在情報取得部114は、コンテンツ情報D2のうち、クエリと合致するテキストデータに対応付けられている得点を読み出す(S220)。次に、所在情報取得部114は、得点が所定の閾値以上であるかを判定する(S230)。所在情報取得部114は、得点が所定の閾値以上である場合、ナレッジグラフD1においてテキストデータに関連付けられているエンティティの所在情報をウェブサーバ300に送信する(S240)。また、所在情報取得部114は、特定が所定の閾値未満である場合、ウェブサーバ300に所在情報を送信しない(S250)。
<1−11.得点算出のバリエーション>
なお、上述では、得点算出部113が、アンカーテキスト確率、エンティティテキストクリック確率、第1エンティティ確率、第2エンティティ確率、第1コンテンツ割合及び第2コンテンツ割合に基づいて、得点を算出する場合について説明したが、これに限られない。例えば、関連ウェブページのうち、収集された百科事典ウェブページの数が少ない場合、百科事典ウェブページに関する各種値(例えば、アンカーテキスト確率、第1エンティティ確率、及び第1コンテンツ割合)が得点の算出に与える影響は、少ない可能性がある。したがって、得点算出部113は、アンカーテキスト確率、第1エンティティ確率、及び第1コンテンツ割合を得点の算出に用いなくてもよい。また、関連ウェブページのうち、収集された検索結果ウェブページの数が少ない場合、検索結果ウェブページに関する各種値(例えば、エンティティテキストクリック確率、第2エンティティ確率及び第2コンテンツ割合)が得点の算出に与える影響は、少ない可能性がある。したがって、得点算出部113は、エンティティテキストクリック確率、第2エンティティ確率及び第2コンテンツ割合を得点の算出に用いなくてよい。
<1−12.得点以外の評価方法>
また、上述では、コンテンツ情報D2のテキストデータは、得点算出部113が算出した得点によって評価される場合について説明したが、これに限られない。得点算出部113は、例えば、算出した得点に基づいて、対象テキストデータを「適当」及び「不適当」の2段階によって評価する構成であってもよい。この場合、得点算出部113は、算出した得点が所定の閾値以上である場合、対象テキストデータに「適当」を示す情報を対応付ける。また、得点算出部113は、算出した得点が所定の閾値未満である場合、対象テキストデータに「不適当」を示す情報を対応付ける。所在情報取得部114は、取得したクエリが「不適当」が対応付けられているテキストデータと合致する場合、テキストデータに関連付けられているエンティティの所在情報を供給することが「不適当」であると判定し、当該所在情報をウェブサーバ300に供給しない。なお、得点算出部113は、対象テキストデータを2段階評価する構成に代えて、3段階以上の評価を行ってもよい。
以上、説明したように、本実施形態のナレッジデータサーバ100は、エンティティとテキストデータとが関連付けられたコンテンツ情報D2のうち、任意の対象のテキストデータを選択する選択部111と、選択部111によって選択された対象テキストデータに関連する一以上の関連ウェブページを収集する収集部112と、コンテンツ情報D2において対象テキストデータに関連付けられたエンティティ毎に、収集部112によって収集された一以上の関連ウェブページのうち第1種類の関連ウェブページにおいて、対象テキストデータがリンク先を示すテキストとして含まれる第1確率と、一以上の関連ウェブページのうち第2種類の関連ウェブページにおいて、コンテンツ情報D2において対象テキストデータと関連付けられたエンティティをテキストとして含むリンク先が選択された第2確率とのうち、少なくとも1つと、第1種類の関連ウェブページまたは第2種類の関連ウェブページにおけるテキストにより示されるリンク先にあるウェブページがコンテンツ情報D2において対象テキストデータと関連付けられるエンティティのウェブページである第3の確率とに基づいて、対象テキストデータに対応するエンティティとしての評価を行う評価部(得点算出部113)と、を備える。これによって、本実施形態のナレッジデータサーバ100は、不適切な情報が検索結果とともに出力されるのを抑制することができる。
ここで、ネットワークNWに存在するウェブページには、エンティティに関連するワードとして適切ではない説明がなされたウェブページが存在する場合がある。しかしながら、適切ではない説明がなされたウェブページの数は、適切な説明がなされたウェブページの数と比較して少ない可能性がある。本実施形態のナレッジデータサーバ100は、ネットワークNWに存在するウェブページ(百科事典ウェブページや検索結果ウェブページ)において、コンテンツ情報D2のテキストデータの出現確率が低い場合、当該テキストデータには、低い得点を付す。また、本実施形態のナレッジデータサーバ100は、ネットワークNWに存在するウェブページにおいて、コンテンツ情報D2のテキストデータの出現確率が高い場合、当該テキストデータには、高い得点を付す。これにより、本実施形態のナレッジデータサーバ100は、エンティティに関連するワードとして適切であるかの指標として得点を算出することができる。
また、本実施形態のナレッジデータサーバ100において、得点算出部113は、検索結果ウェブページからコンテンツ情報D2において対象テキストデータと関連付けられるエンティティのウェブページに遷移した事象と、百科事典ウェブページから前記コンテンツ情報において対象テキストデータと関連付けられるエンティティのウェブページに遷移した事象との発生確率の割合に応じて、第1確率と、第2確率とに重み付けをする。本実施形態のナレッジデータサーバ100によれば、エンティティに関連するワードとして適切であるかの指標として得点をより精度高く算出することができる。
また、本実施形態のナレッジデータサーバ100において収集部112は、関連ウェブページ(この一例では、百科事典ウェブページ)を、少なくとも利用者によって編集可能な百科事典から収集する。また、本実施形態のナレッジデータサーバ100において、収集部112は、少なくとも対象テキストデータをクエリとして用いた場合の検索結果を表示するためのウェブページ(この一例では、検索結果ウェブページ)を、関連ウェブページとして収集する。ここで、ネットワークNWに存在る検索対象を検索する際、検索対象範囲を定めずに検索する場合、検索に係る処理の負荷が膨大になる可能性がある。本実施形態のナレッジデータサーバ100によれば、関連ウェブページとして百科事典ウェブページ及び検索結果ウェブページを収集する。したがって、本実施形態のナレッジデータサーバ100は、簡便な処理によって関連ウェブページを収集することができる。
また、本実施形態のナレッジデータサーバ100において、所在情報取得部114は、入力されたクエリに対して、得点算出部113による評価結果(この一例では、得点又は2段階の評価)を参照し、検索結果に付加して出力すべきか否かを判定する。具体的には、本実施形態のナレッジデータサーバ100は、評価部(この一例では、得点算出部113)は、対象テキストデータに対応するエンティティの得点を算出し、判定部(この一例では、所在情報取得部114)は、得点が所定の閾値以上である場合、当該得点が関連付けられたエンティティの情報を出力させ、前記得点が所定の閾値より少ない場合、当該得点が関連付けられたエンティティの情報を出力させない。これにより、本実施形態のナレッジデータサーバ100は、クエリがエンティティに対応付けられたテキストデータとして適切である場合当該エンティティ関連データをウェブサーバ300に出力する。したがって、本実施形態のナレッジデータサーバ100は、ナレッジパネル220を表示部210に表示することで、検索結果に対するユーザ満足度を向上させつつ、適切なナレッジパネル220を提供することができる。
<1−13.テキストデータのブラックリストについて>
なお、上述では、ナレッジデータサーバ100は、得点が所定の閾値以上である場合、ウェブサーバ300にエンティティの所在情報を送信する場合について説明したが、これに限られない。ここで、クエリ入力領域211には、ナレッジパネル220を表示することに適さないクエリが入力される場合がある。ナレッジパネル220を表示することに適さないクエリとは、例えば、人物の名誉棄損となるワード、公序良俗を乱すワード及び商品の評判を貶めるワード等である。この場合、得点算出部113は、コンテンツ情報D2のうち、ウェブサーバ300にエンティティの所在情報を提供しないコンテンツ情報D2を示す情報(以下、テキストデータブラックリスト)を生成する構成であってもよい。得点算出部113は、例えば、人物の名誉棄損となるワード、公序良俗を乱すワード及び商品の評判を貶めるワード等の辞書を参照し、コンテンツ情報D2のうち、当該辞書に含まれるワードと合致するテキストデータをテキストデータブラックリストに含める。この場合、所在情報取得部114は、クエリと合致するテキストデータがテキストデータブラックリストに含まれる場合、当該テキストデータの得点に関わらず、ウェブサーバ300にエンティティの所在情報を送信しない。また、ウェブサーバ300は、テキストデータブラックリストに含まれるクエリがクエリ入力領域211に入力されたことに応じて、エンティティの所在情報を受信しないため、ナレッジパネル220を表示しない。
以上説明したように、本実施形態のナレッジデータサーバ100において、得点算出部113は、エンティティの情報(この一例では、所在情報)を出力しない対象テキストデータと、当該テキストデータに関連付けられたエンティティを示す非出力コンテンツ情報(この一例では、テキストデータブラックリスト)を生成し、テキストデータブラックリストを参照し、入力されたクエリに対する検索結果に付加してエンティティの情報を出力すべきか否かを判定する判定部(この一例では、所在情報取得部114)を備える。これにより、本実施形態のナレッジデータサーバ100は、ナレッジパネル220を表示することに適さないクエリに応じて、ナレッジパネル220が表示されることを抑制することができる。
以上、本発明を実施するための形態について実施形態を用いて説明したが、本発明はこうした実施形態に何等限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々の変形及び置換を加えることができる。
100…ナレッジデータサーバ
110…制御部
111…選択部
112…収集部
113…得点算出部
114…所在情報取得部
120…記憶部
200…端末装置
210…表示部
211…クエリ入力領域
220…ナレッジパネル
221…エンティティ
222…画像
223…関連情報
230…検索結果
300…ウェブサーバ
D1…ナレッジグラフ
D2、D2a…コンテンツ情報

Claims (9)

  1. エンティティとテキストデータとが関連付けられたコンテンツ情報のうち、任意の対象のテキストデータを選択する選択部と、
    前記選択部によって選択された対象テキストデータに関連する一以上の関連ウェブページを収集する収集部と、
    前記コンテンツ情報において前記対象テキストデータに関連付けられたエンティティ毎に、
    前記収集部によって収集された一以上の関連ウェブページのうち第1種類の関連ウェブページにおいて、前記対象テキストデータがリンク先を示すテキストとして含まれる第1確率と、
    前記一以上の関連ウェブページのうち第2種類の関連ウェブページにおいて、前記コンテンツ情報において前記対象テキストデータと関連付けられたエンティティをテキストとして含むリンク先が選択された第2確率とのうち、少なくとも1つと、
    前記第1種類の関連ウェブページまたは前記第2種類の関連ウェブページにおける前記テキストにより示されるリンク先にあるウェブページが、前記コンテンツ情報において前記対象テキストデータと関連付けられるエンティティのウェブページである第3の確率とに基づいて、
    前記対象テキストデータに対応するエンティティとしての評価を行う評価部と、
    を備える情報処理装置。
  2. 前記評価部は、前記第1種類の関連ウェブページから前記コンテンツ情報において前記対象テキストデータと関連付けられるエンティティのウェブページに遷移した事象と、前記第2種類の関連ウェブページから前記コンテンツ情報において前記対象テキストデータと関連付けられるエンティティのウェブページに遷移した事象との発生確率の割合に応じて、前記第1確率と前記第2確率とに重み付けをする、
    請求項1に記載の情報処理装置。
  3. 前記第1種類の関連ウェブページは、利用者によって編集可能な百科事典のウェブページである、
    請求項1又は請求項2に記載の情報処理装置。
  4. 前記第2種類の関連ウェブページは、前記対象テキストデータをクエリとして用いた場合の検索結果を表示するウェブページである、
    請求項1から請求項3のいずれか一項に記載の情報処理装置。
  5. 入力されたクエリに対して、前記評価部による評価結果を参照し、前記エンティティに関する情報を検索結果に付加して出力すべきか否かを判定する判定部を更に備える、
    請求項1から請求項4のいずれか一項に記載の情報処理装置。
  6. 前記評価部は、前記対象テキストデータに対応するエンティティの得点を算出し、
    前記判定部は、前記得点が所定の閾値以上である場合、当該得点が関連付けられたエンティティの情報を出力し、前記得点が所定の閾値より少ない場合、ナレッジデータに当該得点が関連付けられたエンティティの情報を出力しないと決定する、
    請求項5に記載の情報処理装置。
  7. 前記判定部は、エンティティの情報を出力しない前記対象テキストデータと、当該テキストデータに関連付けられたエンティティを示す非出力コンテンツ情報を生成しておき、前記非出力コンテンツ情報を参照し、入力されたクエリに対する検索結果に付加して前記エンティティの情報を出力すべきか否かを判定する、
    請求項5または6に記載の情報処理装置。
  8. コンピュータが、
    エンティティとテキストデータとが関連付けられたコンテンツ情報のうち、任意の対象のテキストデータを選択し、
    選択された対象テキストデータに関連する一以上の関連ウェブページを収集し、
    前記コンテンツ情報において前記対象テキストデータに関連付けられたエンティティ毎に、
    収集された一以上の関連ウェブページのうち第1種類の関連ウェブページにおいて、前記対象テキストデータがリンク先を示すテキストとして含まれる第1確率と、
    前記一以上の関連ウェブページのうち第2種類の関連ウェブページにおいて、前記コンテンツ情報において前記対象テキストデータと関連付けられたエンティティをテキストとして含むリンク先が選択された第2確率と、のうち、少なくとも1つと、
    前記テキストにより示されるリンク先にあるウェブページが前記コンテンツ情報において前記対象テキストデータと関連付けられるエンティティのウェブページである第3の確率とに基づいて、
    前記対象テキストデータに対応するエンティティとしての評価を行う、
    情報処理方法。
  9. コンピュータに、
    エンティティとテキストデータとが関連付けられたコンテンツ情報のうち、任意の対象のテキストデータを選択させ、
    選択された対象テキストデータに関連する一以上の関連ウェブページを収集させ、
    前記コンテンツ情報において前記対象テキストデータに関連付けられたエンティティ毎に、
    収集された一以上の関連ウェブページのうち第1種類の関連ウェブページにおいて、前記対象テキストデータがリンク先を示すテキストとして含まれる第1確率と、
    前記一以上の関連ウェブページのうち第2種類の関連ウェブページにおいて、前記コンテンツ情報において前記対象テキストデータと関連付けられたエンティティをテキストとして含むリンク先が選択された第2確率と、のうち、少なくとも1つと、
    前記テキストにより示されるリンク先にあるウェブページが前記コンテンツ情報において前記対象テキストデータと関連付けられるエンティティのウェブページである第3の確率とに基づいて、
    前記対象テキストデータに対応するエンティティとしての評価を行わせる、
    プログラム。
JP2017180066A 2017-09-20 2017-09-20 情報処理装置、情報処理方法、およびプログラム Active JP6971104B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017180066A JP6971104B2 (ja) 2017-09-20 2017-09-20 情報処理装置、情報処理方法、およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017180066A JP6971104B2 (ja) 2017-09-20 2017-09-20 情報処理装置、情報処理方法、およびプログラム

Publications (2)

Publication Number Publication Date
JP2019057022A true JP2019057022A (ja) 2019-04-11
JP6971104B2 JP6971104B2 (ja) 2021-11-24

Family

ID=66107340

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017180066A Active JP6971104B2 (ja) 2017-09-20 2017-09-20 情報処理装置、情報処理方法、およびプログラム

Country Status (1)

Country Link
JP (1) JP6971104B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020042707A (ja) * 2018-09-13 2020-03-19 Zホールディングス株式会社 情報処理装置、情報処理方法、およびプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020042707A (ja) * 2018-09-13 2020-03-19 Zホールディングス株式会社 情報処理装置、情報処理方法、およびプログラム

Also Published As

Publication number Publication date
JP6971104B2 (ja) 2021-11-24

Similar Documents

Publication Publication Date Title
JP5997350B2 (ja) ソーシャルグラフ情報に基づく構造化検索クエリ
JP6906419B2 (ja) 情報提供装置、情報提供方法、およびプログラム
JP6415619B2 (ja) 解析装置、解析方法、およびプログラム
US20100306166A1 (en) Automatic fact validation
US20180268307A1 (en) Analysis device, analysis method, and computer readable storage medium
US20190026361A1 (en) Method and apparatus for providing information by using degree of association between reserved word and attribute language
JP6924571B2 (ja) 情報処理装置、情報処理方法、および情報処理プログラム
JP2008176511A (ja) コンピュータネットワークにおける情報処理方法および情報処理装置
JP6971104B2 (ja) 情報処理装置、情報処理方法、およびプログラム
RU2632126C1 (ru) Способ и система предоставления контекстуальной информации
US20200279000A1 (en) Information processing apparatus and non-transitory computer readable medium storing program
JP5368900B2 (ja) 情報提示装置、情報提示方法およびプログラム
JP7003020B2 (ja) 情報処理装置、情報処理方法、およびプログラム
JP6971210B2 (ja) 情報処理装置、情報処理方法、およびプログラム
JP6676699B2 (ja) 予約語及び属性言語間の関連度を用いた情報提供方法及び装置
JP7354019B2 (ja) 情報処理装置、情報処理方法、およびプログラム
JP7078569B2 (ja) 情報処理装置、情報処理方法、およびプログラム
JP7183077B2 (ja) 情報処理装置、情報処理方法、およびプログラム
JP6971209B2 (ja) 情報処理装置、情報処理方法、およびプログラム
JP2019153024A (ja) 情報処理装置、情報処理方法、およびプログラム
JP2019159404A (ja) 情報処理装置、情報処理方法、およびプログラム
JP5827449B2 (ja) オンラインソーシャルネットワークのためのパーソナライズされた構造化検索クエリ
JP5394512B2 (ja) 教師データ生成装置、方法及びプログラム
JP2019053682A (ja) 情報処理装置、情報処理方法、およびプログラム
JP6131983B2 (ja) 情報検索装置、情報検索方法およびそのプログラム

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20191101

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20191108

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200306

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210129

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210209

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210406

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20211005

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20211101

R150 Certificate of patent or registration of utility model

Ref document number: 6971104

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350