JP6705763B2 - 生成装置、生成方法および生成プログラム - Google Patents
生成装置、生成方法および生成プログラム Download PDFInfo
- Publication number
- JP6705763B2 JP6705763B2 JP2017051952A JP2017051952A JP6705763B2 JP 6705763 B2 JP6705763 B2 JP 6705763B2 JP 2017051952 A JP2017051952 A JP 2017051952A JP 2017051952 A JP2017051952 A JP 2017051952A JP 6705763 B2 JP6705763 B2 JP 6705763B2
- Authority
- JP
- Japan
- Prior art keywords
- triple
- information
- predetermined
- selection
- distributed expression
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 53
- 230000014509 gene expression Effects 0.000 claims description 165
- 238000000605 extraction Methods 0.000 claims description 16
- 239000000284 extract Substances 0.000 claims description 12
- 230000008859 change Effects 0.000 claims description 6
- 238000004519 manufacturing process Methods 0.000 claims 3
- 238000010187 selection method Methods 0.000 claims 1
- 230000008569 process Effects 0.000 description 35
- 238000012545 processing Methods 0.000 description 17
- 238000010586 diagram Methods 0.000 description 14
- 238000005070 sampling Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 4
- 238000007796 conventional method Methods 0.000 description 4
- 230000010365 information processing Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000003111 delayed effect Effects 0.000 description 1
- 230000002542 deteriorative effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000001815 facial effect Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
〔1.情報提供装置が提供する処理について〕
まず、図1を用いて、生成装置の一例となる情報提供装置が実行する生成処理の一例について説明する。図1は、実施形態に係る情報提供装置が実行する処理の一例を示す図である。なお、以下の説明では、情報提供装置10が実行する処理として、トリプルとして登録された情報の分散表現を生成する生成処理と、生成処理によって生成した分散表現を用いて、情報の検索を行う検索処理とについて説明する。なお、以下の説明では、情報提供装置10が各情報の分散表現を「生成」する処理について説明するが、かかる処理は、各データに対応する適切な分散表現の値を適宜「学習」することで、分散表現を「生成」する処理であるものとする。
情報提供装置10は、インターネット等の所定のネットワークN(例えば、図2を参照。)を介して、利用者端末100と通信可能な情報処理装置であり、例えば、サーバ装置やクラウドシステム等により実現される。なお、情報提供装置10は、ネットワークNを介して、任意の数の利用者端末100と通信可能であってよい。
ここで、トリプルの検索を容易にするため、第1要素の分散表現と関係情報の分散表現との和が第2要素の分散表現となるように、各要素および関係情報の分散表現を生成し、第1要素と関係情報とを検索クエリとして受付けた場合に、分散表現の和を算出することでトリプルを構成する第2要素を検索する技術が知られている。このような分散表現を生成した場合、情報提供装置10は、第1要素と関係情報とを検索クエリとして受付けた場合に、第1要素の分散表現と関係情報の分散表現との和を算出し、算出した分散表現と類似する分散表現を検索することで、検索クエリとして受付けた第1要素および関係情報を含むトリプルの第2要素を近傍検索により検索することができる。
続いて、図1を用いて、情報提供装置10が実行する生成処理の一例について説明する。なお、以下の説明では、正解データとなる第2要素を含むトリプル、すなわち、処理対象となる所定のトリプルを正解トリプルと記載する。
上述した説明では、情報提供装置10は、不正解データの選択元となる分野を限定するか否かを所定の確率「β」で決定した。ここで、情報提供装置10は、確率「β」の値を学習の進捗に応じて動的に変更してもよい。例えば、情報提供装置10は、所定の回数、分散表現の学習を行うまでは、「β」の値を「0」に設定し、所定の回数だけ学習を行った後は、「β」の値を上昇させてもよい。すなわち、情報提供装置10は、学習回数が所定の閾値を超えた際に、不正解データの選択元となる分野を限定するか否かを確率的に決定してもよい。また、情報提供装置10は、学習回数が増えるにつれて、「β」の値を上昇させてもよい。
また、上述した説明では、情報提供装置10は、不正解データの選択元となる分野を限定する場合に、正解データとの確度が所定の閾値よりも高い第2要素を不正解データとして選択した。しかしながら、実施形態は、これに限定されるものではない。例えば、情報提供装置10は、正解データとなる第2要素と同じ種別の第2要素(例えば、名前や顔写真等のエンティティ)から不正解データを選択してもよい。
以下、上記した情報提供装置10が有する機能構成の一例について説明する。図2は、実施形態に係る情報提供装置の構成例を示す図である。図2に示すように、情報提供装置10は、通信部20、記憶部30、および制御部40を有する。
続いて、図7を用いて、情報提供装置10が実行する生成処理の流れについて説明する。図7は、実施形態に係る情報提供装置が実行する生成処理の流れの一例を示すフローチャートである。なお、情報提供装置10は、図7に示す処理を、任意の単位で、任意のタイミングにより実行可能である。
上記では、情報提供装置10による生成処理や検索処理の一例について説明した。しかしながら、実施形態は、これに限定されるものではない。以下、情報提供装置10が実行する生成処理や検索処理のバリエーションについて説明する。
上述した例では、情報提供装置10は、人物と人物の名前とを関連付けたトリプルについて説明した。しかしながら、実施形態は、これに限定されるものではない。すなわち、情報提供装置10は、任意の事象を示すエンティティが関連づけられたトリプルについて、上述した生成処理を実行することで、分散表現の生成を行ってよい。
記憶部30に登録された各データベース31〜33は、外部のストレージサーバに保持されていてもよい。また、情報提供装置10は、検索処理を実現するフロントエンドサーバと、生成処理を実現するバックエンドサーバとで実現されてもよい。このような場合、フロントエンドサーバには、図2に示す検索部46が配置され、バックエンドサーバには、算出部41、抽出部42、決定部43、選択部44、および生成部45が配置される。
また、上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、逆に、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
また、上述した実施形態に係る情報提供装置10は、例えば図8に示すような構成のコンピュータ1000によって実現される。図8は、ハードウェア構成の一例を示す図である。コンピュータ1000は、出力装置1010、入力装置1020と接続され、演算装置1030、一次記憶装置1040、二次記憶装置1050、出力IF(Interface)1060、入力IF1070、ネットワークIF1080がバス1090により接続された形態を有する。
上述したように、情報提供装置10は、正解トリプルに含まれる第1要素と関係情報とを抽出する。また、情報提供装置10は、不正解データとなる第2要素の選択元を限定するか否かを確率的に決定する。そして、情報提供装置10は、決定結果に基づいて、任意のトリプルに含まれる第2要素のうち所定のトリプルに含まれない第2要素を少なくとも選択し、抽出した第1要素の分散表現と関係情報の分散表現との和と、選択された第2要素の分散表現とが類似しないように、各分散表現を生成する。
20 通信部
30 記憶部
31 エンティティデータベース
32 関係情報データベース
33 分散表現データベース
40 制御部
41 算出部
42 抽出部
43 決定部
44 選択部
45 生成部
46 検索部
100 利用者端末
Claims (15)
- 所定のトリプルに含まれる第1要素と関係情報とを抽出する抽出部と、
第2要素の選択元を限定するか否かを確率的に決定する決定部と、
前記決定結果に基づいて、任意のトリプルに含まれる第2要素のうち前記所定のトリプルに含まれない第2要素を少なくとも選択する選択部と、
抽出した第1要素の分散表現と関係情報の分散表現との和と、選択された第2要素の分散表現とが類似しないように、各分散表現を生成する生成部と
を有することを特徴とする生成装置。 - 前記選択部は、前記第2要素の選択元を限定すると決定した場合は、任意のトリプルに含まれる第2要素のうち前記所定のトリプルに含まれない第2要素であって、所定の分野に属する第2要素を選択する
ことを特徴とする請求項1に記載の生成装置。 - 前記選択部は、前記第2要素の選択元を限定すると決定した場合は、任意のトリプルに含まれる第2要素のうち、前記所定のトリプルに含まれる第2要素と同一または類似する分野に属する第2要素であって、前記所定のトリプルに含まれない第2要素を選択する
ことを特徴とする請求項2に記載の生成装置。 - 前記選択部は、前記第2要素の選択元を限定しないと決定した場合は、任意のトリプルに含まれる第2要素のうち前記所定のトリプルに含まれない第2要素を選択する
ことを特徴とする請求項1〜3のうちいずれか1つに記載の生成装置。 - 前記決定部は、前記分散表現の精度が所定の条件を満たす場合は、前記選択元を限定するか否かを確率的に決定し、前記分散表現の精度が所定の条件を満たさない場合は、前記選択元を限定しないと決定する
ことを特徴とする請求項1〜4のうちいずれか1つに記載の生成装置。 - 前記決定部は、前記分散表現の精度の上昇率が所定の期間だけ変化しない場合は、前記選択元を限定するか否かを確率的に決定する
ことを特徴とする請求項5に記載の生成装置。 - 前記決定部は、前記分散表現の精度が所定の閾値を超えた場合は、前記選択元を限定するか否かを確率的に決定する
ことを特徴とする請求項5または6に記載の生成装置。 - トリプルに含まれる第2要素同士の類似度を示す確度を算出する算出部
を有し、
前記選択部は、前記第2要素の選択元を限定すると決定した場合は、任意のトリプルに含まれる第2要素のうち前記所定のトリプルに含まれない第2要素であって、前記所定のトリプルに含まれる第2要素との間の確度が所定の範囲に含まれる第2要素を選択する
ことを特徴とする請求項1〜7のうちいずれか1つに記載の生成装置。 - 前記算出部は、前記第2要素同士の意味的な類似度を示す確度を算出する
ことを特徴とする請求項8に記載の生成装置。 - 前記選択部は、前記分散表現の精度が上昇するにつれて前記所定のトリプルに含まれる第2要素が属する分野とより類似する分野に属する第2要素を選択する
ことを特徴とする請求項1〜9のうちいずれか1つに記載の生成装置。 - 前記選択部は、属する第2要素の数が他の分野よりも少ない分野に属する第2要素を選択する
ことを特徴とする請求項1〜10のうちいずれか1つに記載の生成装置。 - 前記抽出部は、前記第1要素として、前記トリプルに主語と対応する情報として含まれる要素を抽出し、前記関係情報として、前記トリプルに述語と対応する情報として含まれる要素を抽出し、
前記選択部は、前記第2要素として、前記トリプルに目的と対応する情報として含まれる要素を選択する
ことを特徴とする請求項1〜11のうちいずれか1つに記載の生成装置。 - 前記選択部は、前記第2要素の選択元を限定すると決定した場合は、前記抽出部が抽出した関係情報を含む任意のトリプルに含まれる第2要素のうち前記所定のトリプルに含まれない第2要素を選択する
ことを特徴とする請求項1〜12のうちいずれか1つに記載の生成装置。 - 生成装置が実行する生成方法であって、
所定のトリプルに含まれる第1要素と関係情報とを抽出する抽出工程と、
第2要素の選択元を限定するか否かを確率的に決定する決定工程と、
前記決定結果に基づいて、任意のトリプルに含まれる第2要素のうち前記所定のトリプルに含まれない第2要素を少なくとも選択する選択工程と、
抽出した第1要素の分散表現と関係情報の分散表現との和と、選択された第2要素の分散表現とが類似しないように、各分散表現を生成する生成工程と
を含むことを特徴とする生成方法。 - 所定のトリプルに含まれる第1要素と関係情報とを抽出する抽出手順と、
第2要素の選択元を限定するか否かを確率的に決定する決定手順と、
前記決定結果に基づいて、任意のトリプルに含まれる第2要素のうち前記所定のトリプルに含まれない第2要素を少なくとも選択する選択手順と、
抽出した第1要素の分散表現と関係情報の分散表現との和と、選択された第2要素の分散表現とが類似しないように、各分散表現を生成する生成手順と
をコンピュータに実行させるための生成プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017051952A JP6705763B2 (ja) | 2017-03-16 | 2017-03-16 | 生成装置、生成方法および生成プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017051952A JP6705763B2 (ja) | 2017-03-16 | 2017-03-16 | 生成装置、生成方法および生成プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018156332A JP2018156332A (ja) | 2018-10-04 |
JP6705763B2 true JP6705763B2 (ja) | 2020-06-03 |
Family
ID=63716809
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017051952A Active JP6705763B2 (ja) | 2017-03-16 | 2017-03-16 | 生成装置、生成方法および生成プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6705763B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109815343B (zh) * | 2019-01-28 | 2021-01-22 | 北京百度网讯科技有限公司 | 获得知识图谱中的数据模型的方法、装置、设备和介质 |
JP7416082B2 (ja) * | 2019-10-01 | 2024-01-17 | 富士通株式会社 | 学習方法、学習装置、学習プログラム、予測方法、予測装置および予測プログラム |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07334477A (ja) * | 1994-06-10 | 1995-12-22 | Matsushita Electric Ind Co Ltd | 統合型学習システム |
US20150095017A1 (en) * | 2013-09-27 | 2015-04-02 | Google Inc. | System and method for learning word embeddings using neural language models |
US10339440B2 (en) * | 2015-02-19 | 2019-07-02 | Digital Reasoning Systems, Inc. | Systems and methods for neural language modeling |
-
2017
- 2017-03-16 JP JP2017051952A patent/JP6705763B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2018156332A (ja) | 2018-10-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2022151649A1 (zh) | 基于深度兴趣网络的专题推荐方法及装置 | |
WO2020048084A1 (zh) | 资源推荐方法、装置、计算机设备及计算机可读存储介质 | |
WO2022179384A1 (zh) | 一种社交群体的划分方法、划分系统及相关装置 | |
JP2013003635A (ja) | 情報処理装置、情報処理方法及びプログラム | |
JP6767342B2 (ja) | 検索装置、検索方法および検索プログラム | |
WO2022222942A1 (zh) | 问答记录生成方法、装置、电子设备及存储介质 | |
WO2020073526A1 (zh) | 基于信任网络的推送方法、装置、计算机设备及存储介质 | |
JP6705763B2 (ja) | 生成装置、生成方法および生成プログラム | |
JP6377917B2 (ja) | 画像検索装置及び画像検索プログラム | |
JP2018151800A (ja) | 付与装置、付与方法および付与プログラム | |
WO2017028791A1 (zh) | 一种公众号推荐方法及系统 | |
JP5952441B2 (ja) | 秘密データを識別する方法、電子装置及びコンピュータ読み取り可能な記録媒体 | |
JP5929532B2 (ja) | イベント検出装置、イベント検出方法およびイベント検出プログラム | |
JP7307607B2 (ja) | メディアベースのコンテンツシェアを容易にする方法、コンピュータプログラム及びコンピューティングデバイス | |
JP6318980B2 (ja) | データ配置プログラム、データ配置方法およびデータ配置装置 | |
JP6310529B1 (ja) | 検索装置、検索方法および検索プログラム | |
EP2953063A1 (en) | Learning method, information conversion device, and learning program | |
JP6541737B2 (ja) | 選択装置、選択方法、選択プログラム、モデルおよび学習データ | |
JP6756648B2 (ja) | 生成装置、生成方法および生成プログラム | |
CN113254650A (zh) | 一种基于知识图谱的评估推送方法、系统、设备和介质 | |
JP2020013395A (ja) | 公開装置、公開方法および公開プログラム | |
JP2020004054A (ja) | 出力装置、出力方法および出力プログラム | |
EP3432154A1 (en) | Method and apparatus for providing search recommendation information | |
JP2004206355A (ja) | テキスト自動分類方法及び装置並びにプログラム及び記録媒体 | |
JP2020038557A (ja) | 判定装置、判定方法、および判定プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A80 | Written request to apply exceptions to lack of novelty of invention |
Free format text: JAPANESE INTERMEDIATE CODE: A80 Effective date: 20170417 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190325 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20191101 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20191108 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200324 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200421 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200514 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6705763 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |