JP6321845B1 - 付与装置、付与方法および付与プログラム - Google Patents
付与装置、付与方法および付与プログラム Download PDFInfo
- Publication number
- JP6321845B1 JP6321845B1 JP2017046800A JP2017046800A JP6321845B1 JP 6321845 B1 JP6321845 B1 JP 6321845B1 JP 2017046800 A JP2017046800 A JP 2017046800A JP 2017046800 A JP2017046800 A JP 2017046800A JP 6321845 B1 JP6321845 B1 JP 6321845B1
- Authority
- JP
- Japan
- Prior art keywords
- triple
- predetermined
- entity
- distributed representation
- distributed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 48
- 230000014509 gene expression Effects 0.000 claims abstract description 100
- 230000008569 process Effects 0.000 claims description 29
- 238000004364 calculation method Methods 0.000 claims description 16
- 238000000605 extraction Methods 0.000 claims description 15
- 238000009826 distribution Methods 0.000 claims description 9
- 239000006185 dispersion Substances 0.000 claims description 6
- 239000000284 extract Substances 0.000 abstract description 15
- 238000012545 processing Methods 0.000 description 27
- 238000003860 storage Methods 0.000 description 19
- 238000010586 diagram Methods 0.000 description 16
- 230000008859 change Effects 0.000 description 7
- 238000010606 normalization Methods 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- PCTMTFRHKVHKIS-BMFZQQSSSA-N (1s,3r,4e,6e,8e,10e,12e,14e,16e,18s,19r,20r,21s,25r,27r,30r,31r,33s,35r,37s,38r)-3-[(2r,3s,4s,5s,6r)-4-amino-3,5-dihydroxy-6-methyloxan-2-yl]oxy-19,25,27,30,31,33,35,37-octahydroxy-18,20,21-trimethyl-23-oxo-22,39-dioxabicyclo[33.3.1]nonatriaconta-4,6,8,10 Chemical compound C1C=C2C[C@@H](OS(O)(=O)=O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2.O[C@H]1[C@@H](N)[C@H](O)[C@@H](C)O[C@H]1O[C@H]1/C=C/C=C/C=C/C=C/C=C/C=C/C=C/[C@H](C)[C@@H](O)[C@@H](C)[C@H](C)OC(=O)C[C@H](O)C[C@H](O)CC[C@@H](O)[C@H](O)C[C@H](O)C[C@](O)(C[C@H](O)[C@H]2C(O)=O)O[C@H]2C1 PCTMTFRHKVHKIS-BMFZQQSSSA-N 0.000 description 3
- 230000010365 information processing Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000008094 contradictory effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000037213 diet Effects 0.000 description 1
- 235000005911 diet Nutrition 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 229910010272 inorganic material Inorganic materials 0.000 description 1
- 239000011147 inorganic material Substances 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000011368 organic material Substances 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
〔1.情報提供装置が提供する処理について〕
まず、図1を用いて、付与装置の一例となる情報提供装置が実行する付与処理の一例について説明する。図1は、実施形態に係る情報提供装置が実行する処理の一例を示す図である。なお、以下の説明では、情報提供装置10が実行する処理として、知識を体系化、組織化した情報が登録されるナレッジデータベースの検索を行う検索処理と、利用者の意図を検索処理に反映させるためのスコアをナレッジデータベースの情報に付与する付与処理とについて説明する。
情報提供装置10は、インターネット等の所定のネットワークN(例えば、図2を参照。)を介して、利用者端末100と通信可能な情報処理装置であり、例えば、サーバ装置やクラウドシステム等により実現される。なお、情報提供装置10は、ネットワークNを介して、任意の数の利用者端末100と通信可能であってよい。
ここで、ナレッジデータベースにおいては、1つのエンティティに対して、複数のエンティティが同一種別の関係情報によって対応付けられている場合がある。すなわち、ナレッジデーターベースには、同一のエンティティと、同一種別の関係情報とを含む複数のトリプルが登録されている場合がある。例えば、人物#Aが俳優でもあるが書籍を出版したこともある場合、人物#AのエンティティE11には、俳優に対応するエンティティE21と、作家に対応するエンティティE22とが、職業を示す関係情報C1、C2によって対応付けられることとなる。
次に、図1を用いて、付与処理の一例について説明する。なお、図1に示す例では、エンティティE11〜E14は、人物と対応するエンティティであるものとする。また、図1に示す例では、ノードI111、I121、I131、I141は、エンティティE11〜E14に対応する人物の人名#1〜#4を示すものとする。また、図1に示す例では、エンティティE21〜E22は、職業を示すエンティティであるものとする。また、図1に示す例では、関係情報C1〜C5は、エンティティ間の関係として「職業」を示す情報であるものとする。また、以下の説明では、トリプルを構成する第1要素として、人物のエンティティが登録され、第2要素として、職業のエンティティが登録されている例について説明する。
上述した説明では、情報提供装置10は、第1要素の分散表現をw2vで生成し、生成した第1要素の分散表現を用いて、第2要素の分散表現を生成した。しかしながら、実施形態は、これに限定されるものではない。例えば、情報提供装置10は、ある主語とその主語に関連性が高い目的語との分散表現が類似することが保証される手法により、単語を分散表現へと変換することができるのであれば、第2要素の分散表現についても、第1要素と同様に、w2vで生成してもよい。また、例えば、情報提供装置10は、バグオブワーズ等の各種文字解析技術を用いて、分散表現の生成を行ってもよい。また、情報提供装置10は、TF−IDF(Term Frequency - Inverse Document Frequency)を用いて、分散表現の生成を行ってもよい。
また、情報提供装置10は、分散表現を生成する際に各種の正規化を行ってもよい。例えば、情報提供装置10は、第1要素の分散表現を生成する際、文章中に含まれる単語のうち、第1要素を示す複数の単語を所定の単語に変換し、変換後の文章から、第1要素の分散表現を生成してもよい。例えば、情報提供装置10は、ある人物を示す文字列として、複数種類の文字列が文章中に含まれている場合、各文字列をナレッジデータベースに登録されたその人物の人名に変換し、変換後の文章を用いて、その人物のエンティティを示す分散表現を生成してもよい。
ここで、情報提供装置10は、トリプルを構成するエンティティの分散表現同士の類似度に基づいて、トリプルのスコアを算出するのであれば、任意の手法でスコアの算出を行ってよい。例えば、情報提供装置10は、分散表現のコサイン類似度の値をそのままスコアとして採用してもよい。
上述した処理では、情報提供装置10は、人物を示す第1要素と、その人物の職業を示す第2要素とを有するトリプルについて、スコアの付与を行った。しかしながら、実施形態は、これに限定されるものではない。例えば、情報提供装置10は、人物の職業のみならず、国籍や趣味等といったその人物の属性を示す任意のエンティティを第2要素としてもよい。すなわち、情報提供装置10は、人物を示す第1要素と、その人物の属性を示す第2要素と、属性の種別を示す関係情報(例えば、「職業」、「国籍」、「趣味」等)とを有する複数のトリプルから、第1要素と第2要素とを抽出し、抽出した各要素の分散表現から、トリプルのスコアを算出してもよい。
また、情報提供装置10は、スコアを検索以外の処理に用いてもよい。例えば、あるトリプルについて付与されたスコアが他のトリプルについて付与されたスコアよりも著しく低い場合や、所定の閾値よりも低い場合等は、そのトリプルが誤りである可能性がある。そこで、情報提供装置10は、スコアを用いてトリプルが誤りであるか否かを判定することで、ナレッジデータベースの精査を行ってもよい。
以下、上記した情報提供装置10が有する機能構成の一例について説明する。図2は、実施形態に係る情報提供装置の構成例を示す図である。図2に示すように、情報提供装置10は、通信部20、記憶部30、および制御部40を有する。
続いて、図8を用いて、情報提供装置10が実行する付与処理の流れについて説明する。図8は、実施形態に係る情報提供装置が実行する付与処理の流れの一例を示すフローチャートである。なお、情報提供装置10は、図8に示す処理を、任意の単位で、任意のタイミングにより実行可能である。
上記では、情報提供装置10による提供処理や付与処理の一例について説明した。しかしながら、実施形態は、これに限定されるものではない。以下、情報提供装置10が実行する提供処理や付与処理のバリエーションについて説明する。
上述した例では、情報提供装置10は、人物と人物の職業とを関連付けたトリプルが登録されるナレッジデータベースを参照した。しかしながら、実施形態は、これに限定されるものではない。すなわち、情報提供装置10は、任意の事象を示すエンティティが関連づけられたトリプルについて、上述した付与処理を実行することで、トリプルの確度を示すスコアの算出を行ってもよい。
情報提供装置10は、自装置でナレッジデータベースを管理せずともよい。例えば、記憶部30に登録された各データベース31〜34は、外部のストレージサーバに保持されていてもよい。また、情報提供装置10は、検索処理を実現するフロントエンドサーバと、付与処理を実現するバックエンドサーバとで実現されてもよい。このような場合、フロントエンドサーバには、図2に示す検索部45が配置され、バックエンドサーバには、抽出部41、生成部42、算出部43、および付与部44が配置される。
また、上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、逆に、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
また、上述した実施形態に係る情報提供装置10は、例えば図10に示すような構成のコンピュータ1000によって実現される。図10は、ハードウェア構成の一例を示す図である。コンピュータ1000は、出力装置1010、入力装置1020と接続され、演算装置1030、一次記憶装置1040、二次記憶装置1050、出力IF(Interface)1060、入力IF1070、ネットワークIF1080がバス1090により接続された形態を有する。
上述したように、情報提供装置10は、第1要素と第2要素と要素間の関係を示す関係情報とを有する複数のトリプルを参照し、第1要素と第2要素とを抽出する。そして、情報提供装置10は、第1要素を示す単語を含む文章から、第1要素の分散表現と第2要素の分散表現とをそれぞれ生成する。そして、情報提供装置10は、トリプルに対し、第1要素の分散表現と第2要素の分散表現との類似度に応じたスコアを付与する。このため、情報提供装置10は、トリプルに含まれる第1要素と第2要素との関係性の確度を示すスコアを付与することができるので、利用者の意図に沿ったナレッジベースの検索を実現することができる。
20 通信部
30 記憶部
31 エンティティデータベース
32 トリプルデータベース
33 分散表現データベース
34 スコアデータベース
40 制御部
41 抽出部
42 生成部
43 算出部
44 付与部
45 検索部
100 利用者端末
Claims (14)
- 第1要素と第2要素と要素間の関係を示す関係情報とを有する複数のトリプルを参照し、所定の第2要素と、当該所定の第2要素とともにトリプルに含まれる複数の第1要素とを抽出する抽出部と、
抽出された各第1要素を示す単語を含む文章から、各第1要素の分散表現を生成し、生成された各第1要素の分散表現から、前記所定の第2要素の分散表現を生成する生成部と、
前記所定の第2要素を含むトリプルに対し、当該トリプルに含まれる第1要素の分散表現と前記所定の第2要素の分散表現との類似度に応じたスコアを付与する付与部と
を有することを特徴とする付与装置。 - 前記生成部は、前記所定の第2要素とともにトリプルに含まれる第1要素の分散表現の平均値を算出し、算出した平均値を当該所定の第2要素の分散表現とする
ことを特徴とする請求項1に記載の付与装置。 - 前記生成部は、前記所定の第2要素と共にトリプルに含まれる第1要素であって、他の第2要素と共にトリプルに含まれていない第1要素を特定し、特定した第1要素の分散表現の平均値を前記所定の第2要素の分散表現とする
ことを特徴とする請求項2に記載の付与装置。 - 前記生成部は、前記所定の第2要素を含むトリプルを特定し、特定したトリプルに含まれる前記第1要素を示す単語と前記所定の第2要素を示す単語とが同一の文章中に出現する頻度に応じた重みづけを用いて、特定したトリプルに含まれる第1要素の分散表現の平均値を算出する
ことを特徴とする請求項2に記載の付与装置。 - 前記生成部は、前記第1要素を示す単語を含む複数の文章において、当該単語と共に出現する他の単語の出現頻度に基づいて、当該第1要素の分散表現を生成する
ことを特徴とする請求項1〜4のうちいずれか1つに記載の付与装置。 - 前記生成部は、文章中に含まれる単語のうち、前記第1要素を示す複数の単語を所定の単語に変換し、変換後の文章から、当該第1要素の分散表現を生成する
ことを特徴とする請求項1〜5のうちいずれか1つに記載の付与装置。 - 前記第1要素のうち所定の種別に属する第1要素を特定し、特定した第1要素の分散表現の平均値である分散平均値を算出する算出部
を有し、
前記付与部は、所定のトリプルに含まれる第1要素の分散表現から前記分散平均値を減算した値と、当該所定のトリプルに含まれる第2要素の分散表現から前記分散平均値を減算した値との類似度に応じたスコアを算出し、算出したスコアを当該所定のトリプルに付与する
ことを特徴とする請求項1〜6のうちいずれか1つに記載の付与装置。 - 前記付与部は、所定の第1要素を含む全てのトリプルについて前記類似度を算出し、算出した類似度の最低値と最大値との範囲に応じたスコアを各トリプルに付与する
ことを特徴とする請求項1〜7のうちいずれか1つに記載の付与装置。 - 前記付与部は、所定の第1要素を含むトリプルのうち、前記類似度が最も大きいトリプルに対し、所定の値のスコアを付与する
ことを特徴とする請求項8に記載の付与装置。 - 前記抽出部は、人物を示す第1要素と、当該人物の属性を示す第2要素と、当該属性の種別を示す関係情報とを有する複数のトリプルから、前記第1要素と前記第2要素とを抽出する
ことを特徴とする請求項1〜9のうちいずれか1つに記載の付与装置。 - 前記抽出部は、前記人物の職業または国籍を示す第2要素を抽出する
ことを特徴とする請求項10に記載の付与装置。 - 検索クエリとして第1要素と関係情報との組を受付けた場合は、当該第1要素と関係情報との組を含むトリプルのうち、付与されたスコアが所定の条件を満たすトリプルを検索する検索部
を有することを特徴とする請求項1〜11のうちいずれか1つに記載の付与装置。 - 付与装置が実行する付与方法であって、
第1要素と第2要素と要素間の関係を示す関係情報とを有する複数のトリプルを参照し、所定の第2要素と、当該所定の第2要素とともにトリプルに含まれる複数の第1要素とを抽出する抽出工程と、
抽出された各第1要素を示す単語を含む文章から、各第1要素の分散表現を生成し、生成された各第1要素の分散表現から、前記所定の第2要素の分散表現を生成する生成工程と、
前記所定の第2要素を含むトリプルに対し、当該トリプルに含まれる第1要素の分散表現と前記所定の第2要素の分散表現との類似度に応じたスコアを付与する付与工程と
を含むことを特徴とする付与方法。 - 第1要素と第2要素と要素間の関係を示す関係情報とを有する複数のトリプルを参照し、所定の第2要素と、当該所定の第2要素とともにトリプルに含まれる複数の第1要素とを抽出する抽出手順と、
抽出された各第1要素を示す単語を含む文章から、各第1要素の分散表現を生成し、生成された各第1要素の分散表現から、前記所定の第2要素の分散表現を生成する生成手順と、
前記所定の第2要素を含むトリプルに対し、当該トリプルに含まれる第1要素の分散表現と前記所定の第2要素の分散表現との類似度に応じたスコアを付与する付与手順と
をコンピュータに実行させるための付与プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017046800A JP6321845B1 (ja) | 2017-03-10 | 2017-03-10 | 付与装置、付与方法および付与プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017046800A JP6321845B1 (ja) | 2017-03-10 | 2017-03-10 | 付与装置、付与方法および付与プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP6321845B1 true JP6321845B1 (ja) | 2018-05-09 |
JP2018151800A JP2018151800A (ja) | 2018-09-27 |
Family
ID=62106138
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017046800A Active JP6321845B1 (ja) | 2017-03-10 | 2017-03-10 | 付与装置、付与方法および付与プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6321845B1 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7044729B2 (ja) * | 2019-02-07 | 2022-03-30 | ヤフー株式会社 | 情報処理装置、情報処理方法及び情報処理プログラム |
JP6882372B2 (ja) * | 2019-05-23 | 2021-06-02 | ヤフー株式会社 | 決定装置、決定方法、および決定プログラム |
JP7270188B2 (ja) * | 2019-05-23 | 2023-05-10 | 本田技研工業株式会社 | 知識グラフ補完装置、および知識グラフ補完方法 |
CN112199960B (zh) * | 2020-11-12 | 2021-05-25 | 北京三维天地科技股份有限公司 | 一种标准知识元粒度解析系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015179516A (ja) * | 2014-03-18 | 2015-10-08 | 株式会社Nttドコモ | 大量の複雑な構造化データを管理するための知識エンジン |
JP2016207141A (ja) * | 2015-04-28 | 2016-12-08 | ヤフー株式会社 | 要約生成装置、要約生成方法、及び要約生成プログラム |
JP2017076403A (ja) * | 2015-10-16 | 2017-04-20 | バイドゥ・ユーエスエイ・リミテッド・ライアビリティ・カンパニーBaidu USA LLC | 人間から示唆を得た簡単質問応答(hisqa)システム及び方法 |
-
2017
- 2017-03-10 JP JP2017046800A patent/JP6321845B1/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015179516A (ja) * | 2014-03-18 | 2015-10-08 | 株式会社Nttドコモ | 大量の複雑な構造化データを管理するための知識エンジン |
JP2016207141A (ja) * | 2015-04-28 | 2016-12-08 | ヤフー株式会社 | 要約生成装置、要約生成方法、及び要約生成プログラム |
JP2017076403A (ja) * | 2015-10-16 | 2017-04-20 | バイドゥ・ユーエスエイ・リミテッド・ライアビリティ・カンパニーBaidu USA LLC | 人間から示唆を得た簡単質問応答(hisqa)システム及び方法 |
Also Published As
Publication number | Publication date |
---|---|
JP2018151800A (ja) | 2018-09-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10552488B2 (en) | Social media user recommendation system and method | |
JP6321845B1 (ja) | 付与装置、付与方法および付与プログラム | |
US9501503B2 (en) | Inferring entity attribute values | |
JP7136752B2 (ja) | 受信したデータ入力に基づいて過少データに関連するデータを生成する方法、デバイス、および非一時的コンピュータ可読媒体 | |
US9251292B2 (en) | Search result ranking using query clustering | |
US9128988B2 (en) | Search result ranking by department | |
JP2009070133A (ja) | オントロジー構築支援装置、プログラムおよびオントロジー構築支援方法 | |
WO2014141976A1 (ja) | ソーシャル・メデイアにおけるユーザの分類方法、コンピュータ・プログラム及びコンピュータ | |
CN110096697A (zh) | 词向量矩阵压缩方法和装置、及获取词向量的方法和装置 | |
JPWO2016067396A1 (ja) | 文の並び替え方法および計算機 | |
JP6705763B2 (ja) | 生成装置、生成方法および生成プログラム | |
US11055345B2 (en) | Constructing, evaluating, and improving a search string for retrieving images indicating item use | |
CN111090760A (zh) | 数据存储方法和装置、计算机可读存储介质、电子设备 | |
JP6145562B2 (ja) | 情報構造化システム及び情報構造化方法 | |
JP6680655B2 (ja) | 学習装置および学習方法 | |
JP6789755B2 (ja) | 抽出装置、抽出方法および抽出プログラム | |
JP6680472B2 (ja) | 情報処理装置、情報処理方法及び情報処理プログラム | |
US11645329B2 (en) | Constructing, evaluating, and improving a search string for retrieving images indicating item use | |
JP7273888B2 (ja) | 決定装置、決定方法、および決定プログラム | |
JP6756648B2 (ja) | 生成装置、生成方法および生成プログラム | |
JP6326940B2 (ja) | 中間言語の語句を評価する方法及び装置並びに機械翻訳方法及び装置 | |
US10664517B2 (en) | Constructing, evaluating, and improving a search string for retrieving images indicating item use | |
JP2021162997A (ja) | 情報処理装置及び情報処理方法 | |
JP6942028B2 (ja) | 比較装置、比較方法および比較プログラム | |
JP6160018B1 (ja) | 情報解析装置、情報解析方法、および情報解析プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180306 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180405 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6321845 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |