JP7058556B2 - Judgment device, judgment method, and judgment program - Google Patents
Judgment device, judgment method, and judgment program Download PDFInfo
- Publication number
- JP7058556B2 JP7058556B2 JP2018099912A JP2018099912A JP7058556B2 JP 7058556 B2 JP7058556 B2 JP 7058556B2 JP 2018099912 A JP2018099912 A JP 2018099912A JP 2018099912 A JP2018099912 A JP 2018099912A JP 7058556 B2 JP7058556 B2 JP 7058556B2
- Authority
- JP
- Japan
- Prior art keywords
- space
- information group
- distributed
- model
- hyperbolic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 66
- 230000014509 gene expression Effects 0.000 claims description 153
- 230000008569 process Effects 0.000 claims description 39
- 238000013528 artificial neural network Methods 0.000 claims description 8
- 230000000306 recurrent effect Effects 0.000 claims description 3
- 230000006870 function Effects 0.000 description 13
- 238000010586 diagram Methods 0.000 description 12
- 238000012545 processing Methods 0.000 description 12
- 230000010365 information processing Effects 0.000 description 11
- 239000006185 dispersion Substances 0.000 description 5
- 238000005259 measurement Methods 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 239000013598 vector Substances 0.000 description 4
- 238000013527 convolutional neural network Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Description
本発明は、判定装置、判定方法、および判定プログラムに関する。 The present invention relates to a determination device, a determination method, and a determination program .
従来、入力された情報の分散表現を生成し、生成した分散表現同士の比較結果に基づいて、情報の類似性を判定する技術が知られている。このような技術の一例として、類似若しくは関連性を有するテキストの分散表現同士がユークリッド空間上で近くなり、非類似若しくは関連性を有しないテキストの分散表現同士がユークリッド空間上で離れるように、DSSM(Deep Semantic Similarity Model)やRNN(Reccurent Neural Network)といったモデルの学習を行う技術が知られている。 Conventionally, there is known a technique of generating a distributed representation of input information and determining the similarity of information based on the comparison result between the generated distributed representations. As an example of such a technique, the DSSM is such that distributed representations of similar or related texts are close to each other in Euclidean space, and distributed representations of dissimilar or dissimilar texts are separated from each other in Euclidean space. Techniques for learning models such as (Deep Semantic Similarity Model) and RNN (Reccurent Neural Network) are known.
しかしながら、上述した技術では、分散表現の比較精度を向上させる余地がある。 However, in the above-mentioned technique, there is room for improving the comparison accuracy of the distributed representation.
例えば、上述した技術では、モデルがテキストをユークリッド空間上の分散表現へと変換させる。しかしながら、このような技術では、学習データとなったテキストとは異なる字面のテキストであるが、学習データとなったテキストと意味が類似するテキストが入力された場合に、ユークリッド空間上で類似しない分散表現を生成する恐れがある。 For example, in the technique described above, the model transforms the text into a distributed representation in Euclidean space. However, in such a technique, although the text has a different character from the text used as the learning data, when the text having a similar meaning to the text used as the learning data is input, the dispersion is not similar in the Euclidean space. May produce expressions.
本願は、上記に鑑みてなされたものであって、分散表現の比較精度を改善することを目的とする。 The present application has been made in view of the above, and an object thereof is to improve the comparison accuracy of the distributed representation.
本願に係る判定装置は、複数の情報を含む情報群の分散表現であって、当該情報群の概念を双曲幾何学上の空間である双曲空間上で示す分散表現を生成する生成部と、前記双曲空間上の距離に基づいて、情報群同士の類似性を判定する判定部とを有することを特徴とする。 The determination device according to the present application is a distributed representation of an information group containing a plurality of information, and is a generator that generates a distributed representation showing the concept of the information group on a hyperbolic space, which is a space on hyperbolic geometry. It is characterized by having a determination unit for determining similarity between information groups based on the distance on the hyperbolic space.
実施形態の一態様によれば、分散表現の比較精度を改善することができる。 According to one aspect of the embodiment, the comparative accuracy of the distributed representation can be improved.
以下に、本願に係る判定装置、判定方法、および判定プログラムを実施するための形態(以下、「実施形態」と記載する。)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る判定装置、判定方法、および判定プログラムが限定されるものではない。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。 Hereinafter, a determination device according to the present application, a determination method, and an embodiment for implementing the determination program (hereinafter, referred to as “embodiment”) will be described in detail with reference to the drawings. It should be noted that this embodiment does not limit the determination device, determination method, and determination program according to the present application. Further, in each of the following embodiments, the same parts are designated by the same reference numerals, and duplicate description is omitted.
[実施形態]
〔1-1.判定装置の一例〕
まず、図1を用いて、判定装置が実行する処理の一例について説明する。なお、以下の説明では、判定装置が実行する処理の一例として、文章同士の概念が類似するか否かを判定する処理の一例について記載するが、実施形態は、これに限定されるものではない。例えば、以下に説明する判定装置10は、文章以外にも、音声データ等、複数の情報(以下、「情報群」と記載する場合がある。)により構成される情報であれば、任意の情報同士が類似するか否かを判定して良い。
[Embodiment]
[1-1. Example of judgment device]
First, an example of the process executed by the determination device will be described with reference to FIG. In the following description, as an example of the process executed by the determination device, an example of the process of determining whether or not the concepts of sentences are similar is described, but the embodiment is not limited to this. .. For example, the
図1は、実施形態に係る判定装置が実行する処理の一例を示す図である。図1では、判定装置10は、以下に説明する判定処理を実行する情報処理装置であり、例えば、サーバ装置やクラウドシステム等により実現される。
FIG. 1 is a diagram showing an example of processing executed by the determination device according to the embodiment. In FIG. 1, the
より具体的には、判定装置10は、インターネット等の所定のネットワークNを介して、入出力装置100(例えば、図2を参照)や情報管理装置110といった任意の装置と通信が可能である。
More specifically, the
入出力装置100は、マイクなどの音声を取得する音声取得装置を用いて、利用者の発言を取得する。そして、入出力装置100は、任意の音声認識技術を用いて、発言をテキストデータに変換し、変換後のテキストデータを判定装置10へと送信する。また、入出力装置100は、スピーカ等の音声を出力する装置を用いて、判定装置10から受信したテキストデータの読み上げを行う。なお、入出力装置100は、判定装置10から受信したテキストデータを所定の表示装置に表示してもよい。
The input / output device 100 acquires a user's remark by using a voice acquisition device such as a microphone that acquires voice. Then, the input / output device 100 converts the remark into text data by using an arbitrary voice recognition technique, and transmits the converted text data to the
なお、入出力装置100は、スマートフォンやタブレット等のスマートデバイス、デスクトップPC(Personal Computer)やノートPC等、サーバ装置等の情報処理装置により実現される。なお、入出力装置100は、例えば、同一の情報処理装置によって実現されてもよく、例えば、ロボット等の装置によって実現されてもよい。 The input / output device 100 is realized by an information processing device such as a smart device such as a smartphone or tablet, a desktop PC (Personal Computer), a notebook PC, or a server device. The input / output device 100 may be realized by, for example, the same information processing device, or may be realized by, for example, a device such as a robot.
情報管理装置110は、各種の情報を管理する情報処理装置であり、例えば、サーバ装置やクラウドシステム等により実現される。例えば、情報管理装置110は、学習データとして利用可能な各種の文章データを保持している。より具体的な例を挙げると、情報管理装置110は、文章のテキストデータと、各文章の概念が類似するか否かを示すラベルとを対応付けた学習データを管理しており、判定装置10の要求に応じて学習データを判定装置10に提供する。
The
〔1-2.従来の分散表現の生成について〕
ここで、比較対象となる情報を分散表現に変換し、分散表現同士の比較結果に基づいて情報の類似性を判断する従来技術の一例について説明する。また、以下の説明では、文章の分散表現を生成する従来技術の一例について説明する。
[1-2. About the generation of conventional distributed representation]
Here, an example of a conventional technique for converting information to be compared into a distributed expression and determining the similarity of the information based on the comparison result between the distributed expressions will be described. Further, in the following description, an example of a conventional technique for generating a distributed expression of sentences will be described.
例えば、従来の情報処理装置は、RNNやDSSMといったモデルに対して、文章に含まれる各単語を順に入力し、モデルが出力した分散表現を得る。そして、情報処理装置は、複数の文章から生成した分散表現同士を比較し、類似する概念を有する文章同士の分散表現が類似し、類似しない概念を有する文章同士の分散表現が類似しないように、モデルの学習を進めることで、文章が示す概念を分散表現へと変換するモデルを実現する。また、従来の情報処理装置は、上述した学習を行ったモデルを用いて、入力された文章を分散表現へと変換し、変換後の分散表現を他の文章から生成した分散表現と比較することで、入力された文章と概念が類似する他の文章を検索していた。 For example, in a conventional information processing device, each word included in a sentence is input in order to a model such as RNN or DSSM, and a distributed expression output by the model is obtained. Then, the information processing device compares the distributed expressions generated from a plurality of sentences so that the distributed expressions of the sentences having similar concepts are similar and the distributed expressions of sentences having dissimilar concepts are not similar. By advancing the learning of the model, we will realize a model that transforms the concept shown by the sentence into a distributed expression. In addition, the conventional information processing device converts the input sentence into a distributed expression by using the model obtained by the above-mentioned learning, and compares the converted distributed expression with the distributed expression generated from other sentences. So, I was searching for other sentences that have similar concepts to the entered sentences.
ここで、従来の情報処理装置は、モデルの学習時やモデルを用いた処理の実行時(以下、「測定時」と記載する。)において、ユークリッド空間上における分散表現同士の距離を算出し、算出した距離に基づいて、分散表現が示す概念同士の類似性を判定していた。より具体的には、情報処理装置は、類似する文章の分散表現同士については、ユークリッド空間上における距離が短くなり、類似しない文章の分散表現同士については、ユークリッド空間上における距離が長くなるように、文章から分散表現を生成するモデルの学習を行った。この結果、情報処理装置は、各文章が示す概念をユークリッド空間上に投影し、ユークリッド空間上で各概念の類似性を判定していた。 Here, the conventional information processing apparatus calculates the distance between the distributed expressions in the Euclidean space at the time of learning the model or executing the process using the model (hereinafter, referred to as “measurement time”). Based on the calculated distance, the similarity between the concepts shown by the distributed expression was determined. More specifically, the information processing device makes the distance between distributed expressions of similar sentences shorter in Euclidean space, and the distance between distributed expressions of dissimilar sentences becomes longer in Euclidean space. , We learned a model to generate distributed expressions from sentences. As a result, the information processing apparatus projected the concept shown by each sentence onto the Euclidean space, and determined the similarity of each concept on the Euclidean space.
しかしながら、このような手法においては、分散表現の精度を向上させる余地がある。例えば、上述したモデルは、学習データに含まれる文章に含まれる単語の語順を変更した文章が入力された場合に、ユークリッド空間上において類似しない分散表現を生成する恐れがある。また、多くの文章をユークリッド空間上に投影するには、あらかじめ多くの次元を設定する必要があり、計算コストが増大してしまう。 However, in such a method, there is room for improving the accuracy of the distributed representation. For example, the above-mentioned model may generate dissimilar distributed expressions in Euclidean space when a sentence in which the word order of words included in the sentence included in the learning data is changed is input. Moreover, in order to project many sentences on the Euclidean space, it is necessary to set many dimensions in advance, which increases the calculation cost.
一方で、非ユークリッド空間の一例である双曲空間上に分散表現を投影することで、単語の分散表現の精度を向上させる技術が知られている(例えば、非特許文献1)。例えば、非特許文献1においては、ある単語の前後に来る単語を予測するタスクにおいて、単語の分散表現を双曲空間であるポアンカレ空間上で学習する。このようなポアンカレ空間においては、空間の端に近づけば近づくほど、距離の尺度が指数関数的に増加していくため、有限の空間内に無限の情報(空間上の点)を投影することができる。
On the other hand, there is known a technique for improving the accuracy of distributed expression of words by projecting a distributed expression on a hyperbolic space, which is an example of a non-Euclidean space (for example, Non-Patent Document 1). For example, in
例えば、このようなポアンカレ空間の一例であるポアンカレディスクに、枝分かれしていく情報を埋め込む処理を考える。このようなポアンカレディスクにおいては、中心から円周上に向かうにつれ、距離の尺度が指数関数的に増加してく。このため、ポアンカレディスクの中心から円周方向に、枝分かれしていくツリーを埋め込んだ場合、ポアンカレディスク上においては、各枝の角度および長さを一定に保ったまま、任意の数の枝分かれを有するツリーを自然に埋め込むことができる。このようなポアンカレディスクの特徴は、さらに高次元なポアンカレ空間においても保持される。 For example, consider a process of embedding branching information in a Poincare disk, which is an example of such a Poincare space. In such a Poincare disc, the measure of distance increases exponentially from the center to the circumference. For this reason, when a tree that branches in the circumferential direction from the center of the Poincare disc is embedded, it has an arbitrary number of branches on the Poincare disc while keeping the angle and length of each branch constant. You can embed the tree naturally. Such characteristics of the Poincare disc are retained even in a higher-dimensional Poincare space.
一方で、知識データベースや各種の分類体系、語彙等の情報は、階層構造、すなわち、ツリー構造を有すると考えられる。このため、単語をポアンカレ空間上の分散表現へと変換した場合、各単語が有する階層構造を自然に埋め込むことができる。また、ポアンカレ空間上においては、円周方向に近づく程距離の尺度が増加する。このため、ポアンカレ空間上で単語の分散表現を学習した場合は、多くの階層関係を分散表現に反映させることができるので、分散表現を用いたクラスタリングの精度向上や、分散表現の次元数の削減を実現することが知られている。 On the other hand, information such as a knowledge database, various classification systems, and vocabulary is considered to have a hierarchical structure, that is, a tree structure. Therefore, when a word is converted into a distributed expression on the Poincare space, the hierarchical structure of each word can be naturally embedded. Further, in the Poincare space, the scale of the distance increases as it approaches the circumferential direction. Therefore, when learning the distributed expression of words in Poincare space, many hierarchical relationships can be reflected in the distributed expression, so the accuracy of clustering using the distributed expression can be improved and the number of dimensions of the distributed expression can be reduced. Is known to achieve.
〔1-3.判定装置が実行する処理について〕
ここで、文章の概念を考えると、文章に含まれる単語によりツリー状に分岐していく体系を有しているとも考えられる。このため、文章の分散表現を双曲空間上で学習した場合、文章の概念を精度良く学習することができると考えられる。また、双曲空間上で分散表現同士を比較した場合、文章の概念を精度良く比較することができると考えられる。
[1-3. About the processing executed by the judgment device]
Here, considering the concept of a sentence, it can be considered that it has a system of branching in a tree shape according to the words contained in the sentence. Therefore, when the distributed expression of a sentence is learned on the hyperbolic space, it is considered that the concept of the sentence can be learned accurately. In addition, when the distributed expressions are compared on the hyperbolic space, it is considered that the concepts of sentences can be compared accurately.
そこで、判定装置10は、以下の判定処理を実行する。例えば、判定装置10は、複数の情報を含む情報群の分散表現であって、情報群の概念を双曲幾何学上の空間である双曲空間上で示す分散表現を生成する。そして、判定装置10は、双曲空間上の距離に基づいて、情報群同士の類似性を判定する。
Therefore, the
例えば、判定装置10は、情報群として、複数の単語を含む文章の分散表現を生成し、分散表現の双曲空間上の距離に基づいて、文章同士の類似性を判定する。そして、判定装置10は、生成された分散表現を用いて、学習処理や測定処理を実行する。例えば、判定装置10は、学習データから生成された分散表現を用いて、情報群を分散表現に変換するモデルの学習を学習する。また、判定装置10は、利用者から取得した情報群の分散表現を生成し、生成した分散表現と他の情報群の分散表現とを双曲空間上で比較することで、取得した情報群と類似する他の情報群を特定する。そして、判定装置10は、特定された他の情報群を利用者に提供する。
For example, the
〔1-4.判定装置が実行する処理の一例について〕
以下、図1を用いて、判定装置10が実行する処理の一例を説明する。まず、判定装置10は、情報管理装置110から学習データとなる文章を取得する(ステップS1)。例えば、判定装置10は、複数の単語からなる複数の文章と、各文章の類似性を示すラベル情報とを取得する。このような場合、判定装置10は、RNNやDSSMといったモデルを用いて、文章を分散表現に変換する(ステップS2)。
[1-4. About an example of the processing executed by the judgment device]
Hereinafter, an example of the process executed by the
例えば、判定装置10は、形態素解析等の技術を用いて、「明日は晴れるでしょう」といった文章を「明日」、「は」、「晴れ」、「る」、「でしょう」というように、文章を構成する複数の単語に分解する。そして、判定装置10は、単語を出現順にモデルに入力することで、単語群(すなわち、情報群)である文章の分散表現を生成する。より具体的には、判定装置10は、再帰型ニューラルネットワークに対して情報群に含まれる複数の単語を順次入力することで、情報群の分散表現を生成する。
For example, the
なお、図1に示す例においては、判定装置10は、文章をユークリッド空間上の分散表現に変換するように学習が行われたモデル、すなわち、既存のモデルを用いて、文章を分散表現に変換する。なお、判定装置10は、RNN以外にも、例えば、畳み込みニューラルネットワークを用いて、文章を分散表現に変換してもよい。また、例えば、判定装置10は、同一の文章に含まれる単語をランダムな順序で入力した際に、出現順に入力した場合の分散表現と類似する分散表現を出力するように学習が行われたモデルを用いてもよい。すなわち、判定装置10は、入力された文章の概念をユークリッド空間上で示す分散表現を生成する。なお、以下の説明では、入力された文章の概念をユークリッド空間上で示す分散表現を「ユークリッド空間上の分散表現」と記載する場合がある。また、以下の説明では、文章をユークリッド空間上の分散表現へと変換するモデルを第1モデルと記載する。
In the example shown in FIG. 1, the
続いて、判定装置10は、分散表現を双曲空間上に投影する(ステップS3)。例えば、判定装置10は、双曲空間として、ミンコフスキー空間上に分散表現を投影する。より具体的には、判定装置10は、ミンコフスキー空間の二葉双曲面(Hyperboloid of two sheets)が有する2つの超平面のうち、焦点軸上の座標が正となる超平面上の分散表現を生成する。
Subsequently, the
例えば、判定装置10は、x軸、y軸およびz軸により構成される3次元空間を設定し、この3次元空間においてz軸を焦点軸とする二葉双曲面を設定する。また、判定装置10は、第1モデルを用いて、x軸成分およびy軸成分からなる2次元のユークリッド空間上の分散表現を生成する。そして、判定装置10は、設定した3次元空間において、生成した分散表現が示す位置から、xy平面に対する垂線を設定し、二葉双曲面のうちz軸方向の成分が正となる曲面と垂線との交点を分散表現の投影先とする。すなわち、判定装置10は、文章の概念を示す双曲空間上の分散表現を生成する。
For example, the
そして、判定装置10は、双曲空間上における分散表現同士の距離を判定する(ステップS4)。例えば、判定装置10は、文章#1からユークリッド空間上の分散表現uを生成し、文章#2からユークリッド空間上の分散表現vを生成する。そして、判定装置10は、分散表現uと分散表現vとの間の双曲空間上における距離を算出する。なお、双曲空間上における距離の算出手法については、後述する。
Then, the
そして、判定装置10は、判定結果に基づいて、モデルの学習を行う(ステップS5)。例えば、判定装置10は、文章#1と文章#2とが類似する場合には、分散表現uと分散表現vとの間の双曲空間上における距離がより小さくなるようにモデルを学習し、文章#1と文章#2とが類似しない場合には、分散表現uと分散表現vとの間の双曲空間上における距離がより大きくなるようにモデルを学習する。
Then, the
なお、判定装置10は、分散表現uと分散表現vとの間の双曲空間上における距離が、文章#1と文章#2との類似度を反映するように、モデルの学習を行ってもよい。例えば、判定装置10は、文章#1と文章#3との類似度が、文章#1と文章#2との類似度よりも高い場合は、分散表現uと文章#3の双曲空間上における分散表現との双曲空間上における距離が、分散表現uと分散表現vとの間の双曲空間上における距離よりも短くなるように、モデルの学習を行う。すなわち、判定装置10は、各文章が有する概念の類似性を、双曲空間上に落とし込むように、文章の分散表現を生成するモデルの学習を行う。
Even if the
例えば、判定装置10は、第1モデルが生成したユークリッド空間上の分散表現を双曲空間上に投影する関数fを固定し、バックプロパゲーション等の学習手法を用いて、第1モデルのノード間を接続する接続係数を修正してもよい。また、判定装置10は、第1モデルが生成したユークリッド空間上の分散表現を双曲空間上に投影する関数fを修正してもよい。すなわち、判定装置10は、文章が有する概念の類似性を双曲空間上における距離へと投影することができるモデル(以下、「第2モデル」と記載する。)を学習するのであれば、任意の学習を行ってよい。換言すると、判定装置10は、第1モデルと関数fとからなる第2モデルの学習を、第1モデルの修正を行うことで実現してもよく、関数fの修正を行うことで実現してもよい。また、判定装置10は、第1モデルと関数fの両方を修正してもよい。また、判定装置10は、新規なモデルを準備し、準備したモデルの学習を行うことで、第2モデルの学習を行ってもよい。
For example, the
続いて、判定装置10は、利用者から判定対象となる文章を取得する(ステップS6)。このような場合、判定装置10は、第2モデルを用いて、取得した文章の分散表現を双曲空間上に投影し、双曲空間上で、他の文章の分散表現との距離を算出する。そして、判定装置10は、算出した距離が所定の条件を満たす文章を特定する。例えば、判定装置10は、算出した距離が最も短い文章、すなわち、利用者から取得した文章と概念が類似する文章を特定する。そして、判定装置10は、特定した文章を利用者に提供する(ステップS8)。
Subsequently, the
このように、判定装置10は、文章をユークリッド空間上の分散表現ではなく、双曲空間上の分散表現に変換する。そして、判定装置10は、双曲空間上の距離に基づいて、文章の概念同士を比較する。このような処理を実行した場合、判定装置10は、文章の概念が有するツリー条の体系を比較することができるので、文章が有する概念の比較精度を向上させることができる。すなわち、判定装置10は、分散表現が概念を示す精度を向上させることができる。また、判定装置10は、分散表現が概念を示す精度を保持したまま、分散表現の次元数を削減できるので、計算コストを削減することができる。
In this way, the
〔1-5.モデルについて〕
ここで、図1に示す例では、文章をユークリッド空間上の分散表現に変換する第1モデルを用いて、ユークリッド空間上の分散表現を取得し、関数fを用いて、ユークリッド空間上の分散表現を双曲空間上に投影した。しかしながら、実施形態は、これに限定されるものではない。
[1-5. About the model]
Here, in the example shown in FIG. 1, the distributed representation on the Euclidean space is acquired by using the first model that transforms the sentence into the distributed representation on the Euclidean space, and the distributed representation on the Euclidean space is used by using the function f. Was projected onto the hyperbolic space. However, the embodiments are not limited to this.
例えば、判定装置10は、新規なCNN(Convolutional Neural Network)やRNNを統合モデルとして準備じ、準備した統合モデルを用いて文章の分散表現を生成する。そして、判定装置10は、生成した分散表現が所定の双曲空間上の分散表現であるものとして、各文章から生成した分散表現の距離を算出し、算出した距離に基づいて、統合モデルの学習を行ってもよい。また、判定装置10は、このような学習処理により学習が行われた統合モデルを用いて、文章が有する概念同士の比較を実現してもよい。
For example, the
また、判定装置10は、RNNを用いて文章の分散表現を生成する場合、各単語の概念と、各単語の出現順序とに基づいて、文章の分散表現を生成してもよい。例えば、判定装置10は、文章に含まれる各単語を出現順に入力した場合の分散表現と、文章に含まれる各単語を出現順とは異なる順で入力した場合の分散表現とが異なるように、第2モデルや統合モデルの学習を行ってもよい。
Further, when the
〔1-6.双曲空間について〕
ここで、判定装置10は、双曲空間上の分散表現を生成するのであれば、任意の空間を双曲空間として採用可能である。例えば、判定装置10は、任意の次元数を有するミンコフスキー空間上の分散表現を生成してもよい。また、判定装置10は、二葉双曲面の任意の面上の分散表現を生成してよい。
[1-6. About hyperbolic space]
Here, the
また、判定装置10は、ポアンカレ円板模型(所謂ポアンカレディスク)における任意の次元の円板上、若しくは、ポアンカレ球体模型における任意の次元の球面上の分散表現を生成してもよい。すなわち、判定装置10は、双曲幾何学が適用可能な空間上の分散表現を生成し、このような空間上において双曲幾何学を用いた距離に基づいて、情報が有する概念の類似性を判定するのであれば、任意の双曲空間を採用してよい。
Further, the
〔1-7.判定対象となる情報について〕
上述した例では、判定装置10は、文章が有する概念を分散表現へと変換した。しかしながら、実施形態は、これに限定されるものではない。例えば、判定装置10は、音声を複数の部分音声に分割し、分割した各部分音声を順次第1モデルに入力し、第1モデルが出力した分散表現を双曲空間上に投影してもよい。また、判定装置10は、動画像の各フレームの画像を順次第1モデルに入力し、第1モデルが出力した分散表現を双曲空間上に投影してもよい。
[1-7. Information to be judged]
In the above-mentioned example, the
すなわち、判定装置10は、複数の情報からなる情報群を、情報群が有する概念を示す分散表現であって、双曲空間上の分散表現へと変換するのであれば、任意の種別の情報群が有する概念を、双曲空間上の分散表現へと変換し、分散表現の双曲空間上における距離を算出することで、情報群が有する概念同士を比較してよい。また、例えば、判定装置10は、文章と動画像等、異なる種別の情報群の概念同士を比較してもよい。
That is, if the
〔2.判定装置の構成〕
以下、上記した提供処理を実現する判定装置10が有する機能構成の一例について説明する。図2は、実施形態に係る判定装置の構成例を示す図である。図2に示すように、判定装置10は、通信部20、記憶部30、および制御部40を有する。
[2. Judgment device configuration]
Hereinafter, an example of the functional configuration of the
通信部20は、例えば、NIC(Network Interface Card)等によって実現される。そして、通信部20は、ネットワークNと有線または無線で接続され、入出力装置100との間で情報の送受信を行う。
The
記憶部30は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。また、記憶部30は、分散表現データベース31およびモデル32を記憶する。 The storage unit 30 is realized by, for example, a semiconductor memory element such as a RAM (Random Access Memory) or a flash memory (Flash Memory), or a storage device such as a hard disk or an optical disk. Further, the storage unit 30 stores the distributed representation database 31 and the model 32.
分散表現データベース31には、文章の分散表現が登録される。例えば、図3は、実施形態に係る分散表現データベースに登録される情報の一例を示す図である。図3に示すように、分散表現データベース31には、「文章ID」、「文章データ」、「ユークリッド分散表現」、および「双曲空間分散表現」といった情報が対応付けて登録されている。 The distributed representation of sentences is registered in the distributed representation database 31. For example, FIG. 3 is a diagram showing an example of information registered in the distributed representation database according to the embodiment. As shown in FIG. 3, information such as "sentence ID", "sentence data", "Euclid distributed representation", and "hyperbolic space distributed representation" are registered in association with each other in the distributed representation database 31.
ここで、「文章ID」とは、文章を示す識別子である。また、「文章データ」とは、文章の文字列、すなわち、文章のデータである。また、「ユークリッド分散表現」とは、対応付けられた文章のユークリッド空間上における分散表現である。また、「双曲空間分散表現」とは、対応付けられた文章の双曲空間上における分散表現である。 Here, the "sentence ID" is an identifier indicating a sentence. Further, the "text data" is a character string of a text, that is, text data. Further, the "Euclidean distributed expression" is a distributed expression on the Euclidean space of the associated sentences. Further, the "hyperbolic space distributed expression" is a distributed expression on the hyperbolic space of the associated sentences.
例えば、図3に示す例では、文章ID「文章#1」、文章データ「データ#1」、ユークリッド分散表現「分散表現#1-1」、および双曲空間分散表現「分散表現#1-2」が対応付けて登録されている。このような情報は、文章ID「文章#1」が示す文章の文章データが「データ#1」であり、「データ#1」のユークリッド分散表現が「分散表現#1-1」であり、双曲空間分散表現が「分散表現#1-2」である旨を示す。
For example, in the example shown in FIG. 3, the sentence ID “
なお、図3に示す例では、「文章#1」、「データ#1」、「分散表現#1-1」等といった概念的な値について記載したが、実際には、文章を識別する文字列や数値、文章を構成する文字列、分散表現となる多次元量等が登録されることとなる。また、図3に示す情報は、あくまで一例であり、分散表現データベース31には、図3に示す情報以外にも任意の情報が登録されていてよい。
In the example shown in FIG. 3, conceptual values such as "
図2に戻り、説明を続ける。モデル32は、判定装置10が用いるモデルであり、例えば、文章からユークリッド空間上における分散表現を生成する第1モデルのデータである。より具体的には、記憶部30には、第1モデルを構成するノードの接続関係や、ノード間の重みである接続係数が登録される。ここで、モデル32は、例えば、人工知能ソフトウエアの一部であるプログラムモジュールとしての利用が想定される。
Returning to FIG. 2, the explanation will be continued. The model 32 is a model used by the
例えば、モデル32は、複数の情報を含む情報群の分散表現であって、情報群の概念を双曲幾何学上の空間である双曲空間上で示す分散表現を生成し、双曲空間上の距離に基づいて、情報群同士の類似性を判定し、判定結果に基づいて、情報群を分散表現に変換するモデルを学習する学習方法で学習されるモデルの情報を含むプログラムパラメータである。例えば、モデル32は、第1モデルと関数fとの組合せにより実現される。 For example, the model 32 is a distributed representation of an information group containing a plurality of information, and generates a distributed representation that shows the concept of the information group on the hyperbolic space, which is a space on hyperbolic geometry, and generates a distributed representation on the hyperbolic space. It is a program parameter including information of a model learned by a learning method of learning a model that determines the similarity between information groups based on the distance of and converts the information group into a distributed representation based on the determination result. For example, the model 32 is realized by a combination of the first model and the function f.
また、モデル32がDNN(Deep Neural Network)等、1つまたは複数の中間層を有するニューラルネットワークで実現されるとする。この場合、モデル32が含む第1要素は、入力層または中間層が有するいずれかのノードに対応する。また、第2要素は、第1要素と対応するノードから値が伝達されるノードである次段のノードに対応する。また、第1要素の重みは、第1要素と対応するノードから第2要素と対応するノードに伝達される値に対して考慮される重みである接続係数に対応する。 Further, it is assumed that the model 32 is realized by a neural network having one or a plurality of intermediate layers such as a DNN (Deep Neural Network). In this case, the first element included in the model 32 corresponds to either the node of the input layer or the intermediate layer. Further, the second element corresponds to a node in the next stage, which is a node to which a value is transmitted from a node corresponding to the first element. Further, the weight of the first element corresponds to a connection coefficient which is a weight considered for the value transmitted from the node corresponding to the first element to the node corresponding to the second element.
判定装置10は、上述した回帰モデルやニューラルネットワーク等、任意の構造を有するモデルを用いて、分散表現の算出を行う。具体的には、モデル32は、情報群が入力された場合に、情報群が示す概念を示す分散表現を出力するように係数が設定される。
The
なお、上記例では、モデル32が、情報群が入力された場合に、情報群が示す概念を示す分散表現を出力するモデル(モデルXとする)である例を示した。しかし、実施形態に係るモデル32は、モデルXにデータの入出力を繰り返すことで得られる結果に基づいて生成されるモデルであってもよい。例えば、モデル32は、情報群を入力とし、モデルXが出力する分散表現を出力とするよう学習されたモデル(モデルY)であってもよい。または、モデル32は、情報群を入力とし、モデルYの出力値を出力とするよう学習されたモデルであってもよい。また、判定装置10がGAN(Generative Adversarial Networks)を用いた処理を行う場合、モデル32は、GANの一部を構成するモデルであってもよい。
In the above example, the model 32 is a model (referred to as model X) that outputs a distributed representation indicating the concept indicated by the information group when the information group is input. However, the model 32 according to the embodiment may be a model generated based on the result obtained by repeatedly inputting / outputting data to the model X. For example, the model 32 may be a model (model Y) trained to input a group of information and output a distributed representation output by the model X. Alternatively, the model 32 may be a model trained to use the information group as an input and the output value of the model Y as an output. Further, when the
制御部40は、コントローラ(controller)であり、例えば、CPU(Central Processing Unit)、MPU(Micro Processing Unit)等のプロセッサによって、判定装置10内部の記憶装置に記憶されている各種プログラムがRAM等を作業領域として実行されることにより実現される。また、制御部40は、コントローラ(controller)であり、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現されてもよい。また、例えば、制御部40は、プログラムモジュールであるモデル32、もしくは、モデル32を含むプログラムモジュールが有する指示に従って、判定処理を実行することとなる。
The
図2に示すように、制御部40は、生成部41、判定部42、学習部43、および提供部44を有する。生成部41は、複数の情報を含む情報群の分散表現であって、情報群の概念を双曲幾何学上の空間である双曲空間上で示す分散表現を生成する。
As shown in FIG. 2, the
例えば、生成部41は、モデルの学習処理においては、情報管理装置110から学習データとなる文章およびラベルを取得する。このような場合、生成部41は、モデル32に含まれる第1モデルを用いて、文章が有する概念をユークリッド空間上で示す分散表現を生成する。例えば、生成部41は、RNNである第1モデル対して文章に含まれる各単語、すなわち、情報群に含まれる複数の情報を順次入力することで、情報群である文章の分散表現を生成する。換言すると、生成部41は、情報群に含まれる各情報の概念と、各情報の出現順序とに基づいて、情報群の分散表現を生成する。
For example, the generation unit 41 acquires sentences and labels to be learning data from the
そして、生成部41は、関数fを用いて、生成した分散表現を双曲空間上に投影することで、文章が有する概念を双曲空間上で示す分散表現を生成する。例えば、生成部41は、双曲空間として、ポアンカレ円板模型における任意の次元の円板上、若しくは、ポアンカレ球体模型における任意の次元の球面上の分散表現を生成する。また、例えば、生成部41は、双曲空間として、ミンコフスキー空間上の分散表現を生成する。より具体的な例を挙げると、生成部41は、双曲空間として、ミンコフスキー空間の二葉双曲面が有する2つの超平面のうち、焦点軸上の座標が正となる超平面上の分散表現を生成する。そして、生成部41は、取得した文章と、生成したユークリッド空間上の分散表現と、双曲空間上の分散表現とを分散表現データベース31に登録する。 Then, the generation unit 41 uses the function f to project the generated distributed expression onto the hyperbolic space to generate a distributed expression that shows the concept of the sentence on the hyperbolic space. For example, the generation unit 41 generates a distributed representation as a hyperbolic space on a disk of any dimension in the Poincare disk model or on a spherical surface of any dimension in the Poincare sphere model. Further, for example, the generation unit 41 generates a distributed representation on the Minkowski space as a hyperbolic space. To give a more specific example, as a hyperbolic space, the generation unit 41 expresses a dispersion on the hyperplane in which the coordinates on the focal axis are positive among the two hyperplanes of the bilobed hyperboloid in the Minkowski space. Generate. Then, the generation unit 41 registers the acquired sentence, the generated distributed expression on the Euclidean space, and the distributed expression on the hyperbolic space in the distributed expression database 31.
また、生成部41は、モデルの測定処理においては、入出力装置100から利用者が入力した文章を受付ける。このような場合、生成部41は、受付けた文章に含まれる単語を順に第1モデルに入力し、第1モデルが出力したユークリッド空間上の分散表現を、関数fを用いて双曲空間上の分散表現へと変換する。なお、以下の説明では、双曲空間上の分散表現を双曲表現と記載し、利用者が入力した文章の双曲空間上の分散表現を、取得双曲表現と記載する。 Further, the generation unit 41 receives the text input by the user from the input / output device 100 in the measurement process of the model. In such a case, the generation unit 41 inputs the words included in the received sentence into the first model in order, and uses the function f to express the distributed representation on the Euclidean space output by the first model on the hyperbolic space. Convert to a distributed representation. In the following description, the distributed expression on the hyperbolic space is described as the hyperbolic expression, and the distributed expression on the hyperbolic space of the sentence input by the user is described as the acquired hyperbolic expression.
判定部42は、双曲空間上の距離に基づいて、情報群同士の類似性を判定する。例えば、判定部42は、分散表現の双曲空間上の距離に基づいて、文章同士の類似性を判定する。例えば、判定部42は、学習時においては、学習データから文章のペアを選択し、選択選択した各文章の双曲空間上の分散表現を分散表現データベース31から読出し、読み出した分散表現同士の双曲空間上の距離を算出する。そして、判定部42は、算出した距離が所定の閾値を超える場合は、選択したペアが類似しないと判定し、算出した距離が所定の閾値以下となる場合は、選択したペアが類似すると判定する。
The
また、判定部42は、測定時においては、取得双曲表現と、分散表現データベース31に登録された双曲表現との双曲空間上の距離をそれぞれ算出する。そして、判定部42は、算出した距離が最も短い双曲表現と対応する文章、すなわち、利用者から取得した文章と最も類似する文章を特定する。
Further, the
学習部43は、生成された分散表現を用いて、情報群を分散表現に変換するモデルを学習する。すなわち、学習部43は、情報群が有する概念を双曲空間上で示す分散表現を用いて、モデルを学習する。
The
例えば、学習部43は、判定部42から選択された文章のペアと、双曲空間上の距離に基づく判定結果、すなわち、ペアが類似するか否かの判定結果を受付ける。このような場合、学習部43は、学習データのラベルに基づいて、ペアが類似する文章であるか否かを判定する。そして、学習部43は、学習データのラベルに基づく判定結果と、双曲空間上の距離に基づく判定結果とが一致するように、モデル32の学習を行う。
For example, the
例えば、学習部43は、学習データのラベルに基づく判定結果と、双曲空間上の距離に基づく判定結果とが一致しない場合は、以下の処理を実行する。例えば、学習部43は、文章のペアが類似する旨を学習データのラベルが示す場合は、各ペアの双曲表現が類似するように(双曲表現同士の距離が短くなるように)、モデル32を修正する。一方、学習部43は、文章のペアが類似しない旨を学習データのラベルが示す場合は、各ペアの双曲表現が類似するように(双曲表現同士の距離が離れるように)、モデル32を修正する。
For example, when the determination result based on the label of the learning data and the determination result based on the distance on the hyperbolic space do not match, the
すなわち、学習部43は、複数の情報を含む情報群の分散表現であって、情報群の概念を双曲幾何学上の空間である双曲空間上で示す分散表現を生成する処理と、双曲空間上の距離に基づいて、情報群同士の類似性を判定する判定処理と、判定結果に基づいて、情報群を分散表現に変換するモデルを学習する処理とにより学習が行われたモデル32を生成する。このようなモデル32は、測定時における各種の処理を制御部40に実行させるプログラムモジュールに含まれる情報として利用される。
That is, the
なお、学習部43は、いかなる学習アルゴリズムを用いてモデル32を学習してもよい。例えば、学習部43は、ニューラルネットワーク(neural network)、サポートベクターマシン(support vector machine)、クラスタリング、強化学習等の学習アルゴリズムを用いてモデル32を学習してよい。
The
提供部44は、判定結果に基づいて、利用者から取得した情報群と類似する他の情報群を特定し、特定した他の情報群を利用者に提供する。例えば、提供部44は、利用者から取得した文章と最も類似する文章の通知を判定部42から受付ける。このような場合、提供部44は、分散表現データベース31から、通知された文章の文章データを読出し、読み出した文章データを入出力装置100から出力させる。
Based on the determination result, the providing
〔3.数式の一例について〕
続いて、数式を用いて、判定装置10が実行する処理の一例について説明する。なお、以下の説明では、ユークリッド空間上の分散表現をv=(v1,v2)およびu=(u1,u2)で示し、双曲空間上に投影した分散表現を、チルダ付のvまたはuで示す。
[3. About an example of a formula]
Subsequently, an example of the process executed by the
例えば、2次元のポアンカレディスク上における分散表現を生成する例について説明する。例えば、図4は、双曲空間としてポアンカレディスクを採用する例を説明する図である。例えば、第1モデルを用いて生成された分散表現をvとすると、ポアンカレディスク上に投影された分散表現vは、以下の式(1)で表すことができる。 For example, an example of generating a distributed representation on a two-dimensional Poincare disk will be described. For example, FIG. 4 is a diagram illustrating an example of adopting a Poincare disc as a hyperbolic space. For example, assuming that the distributed representation generated by using the first model is v, the distributed representation v projected on the Poincare disk can be expressed by the following equation (1).
なお、式(1)では、ポアンカレディスク上に投影された分散表現vをチルダ付のvで示した。また、式(1)のaは、スケーリングファクターであり、任意の数値が採用可能である。なお、aを2分の1に設定した場合、原点と分散表現との距離が、投影前のユークリッド空間上とポアンカレディスク上とで一致することとなる(例えば、非特許文献2、p32を参照)。
In the equation (1), the distributed expression v projected on the Poincare disk is represented by v with a tilde. Further, a in the equation (1) is a scaling factor, and any numerical value can be adopted. When a is set to 1/2, the distance between the origin and the distributed representation will be the same on the Euclidean space before projection and on the Poincare disk (see, for example,
ここで、ポアンカレディスク上に投影した分散表現vおよび分散表現uの距離dは、以下の式(2)で示すことができる。 Here, the distance d between the distributed expression v and the distributed expression u projected onto the Poincare disk can be expressed by the following equation (2).
ここで、式(1)より、式(2)は、式(3)で示すように変形することができる。すなわち、ポアンカレディスク上に投影した分散表現vおよび分散表現uの距離dは、ユークリッド空間上の分散表現vおよび分散表現uを用いて、以下の式(3)で示すことができる。 Here, from the equation (1), the equation (2) can be transformed as shown by the equation (3). That is, the distance d between the distributed expression v and the distributed expression u projected on the Poincare disk can be expressed by the following equation (3) using the distributed expression v and the distributed expression u on the Euclidean space.
このような式(3)を用いることで、判定装置10は、第1モデルにより生成されたユークリッド空間上の分散表現を用いて、双曲空間上の距離を算出することができる。
By using such an equation (3), the
ここで、理論上はポアンカレディスク上に無限の情報を埋め込むことができるが、各種の情報処理装置により実際の計算を行った場合、精度的な問題が生じてしまう。例えば、ポアンカレディスク上に投影された分散表現は、ポアンカレディスクの円周よりも外側に投影されることが許されない(すなわち、単位円からはみ出すことが許されない)が、単精度で分散表現の数値を算出した場合、投影対象となる分散表現の数によっては、分散表現がポアンカレディスクの円周よりも外側に投影されてしまう恐れがある。また、ポアンカレディスクの原点には、情報を埋め込むことができない。 Here, in theory, infinite information can be embedded in the Poincare disk, but when the actual calculation is performed by various information processing devices, an accuracy problem arises. For example, a distributed representation projected onto a Poincare disk is not allowed to be projected outside the circumference of the Poincare disk (ie, it is not allowed to extend beyond the unit circle), but it is a single-precision, distributed representation of the numerical value. When calculated, the distributed representation may be projected outside the circumference of the Poincare disk, depending on the number of distributed representations to be projected. In addition, information cannot be embedded in the origin of the Poincare disc.
一方で、ミンコフスキー空間における二葉双曲面が有する2つの超平面のうち、焦点軸上の座標が正となる超平面上においては、ポアンカレディスクと同様の性質を性質を持ちながら単位円上への閉じ込めが不要となることが知られている。そこで、判定装置10は、ミンコフスキー空間における二葉双曲面が有する2つの超平面のうち、焦点軸上の座標が正となる超平面上に、分散表現の投影を行ってもよい。
On the other hand, of the two hyperplanes of the Futaba hyperboloid in the Minkowski space, on the hyperplane where the coordinates on the focal axis are positive, the confinement on the unit circle has the same properties as the Poincare disk. Is known to be unnecessary. Therefore, the
例えば、図5は、双曲空間として二葉双曲面を採用する例を説明する図である。例えば、焦点軸をz軸とした場合、図5に示すように、二葉双曲面が有する2つの超平面のうち焦点軸上の座標が正となる超平面、すなわち、z>0となる超平面(以下、「ミンコフスキー平面」と記載する。)は、以下の式(4)を満たす点の集合で示すことができる。 For example, FIG. 5 is a diagram illustrating an example of adopting a hyperbolic bicurved surface as a hyperbolic space. For example, when the focal axis is the z-axis, as shown in FIG. 5, of the two hyperplanes of the Futaba hyperboloid, the hyperplane whose coordinates on the focal axis are positive, that is, the hyperplane where z> 0. (Hereinafter referred to as "Minkowski plane") can be represented by a set of points satisfying the following equation (4).
このようなミンコフスキー平面上に2次元のユークリッド空間上の分散表現を投影する処理の一例について説明する。例えば、ミンコフスキー平面上の点をチルダ付のvで表し、焦点軸方向の成分をチルダ付きのv0とすると、以下の式(5)で示すことができる。また、式(5)に示す各成分は、以下の式(6)を満たす。 An example of the process of projecting a distributed representation on a two-dimensional Euclidean space on such a Minkowski plane will be described. For example, if a point on the Minkowski plane is represented by v with a tilde and the component in the focal axis direction is v 0 with a tilde, it can be expressed by the following equation (5). Further, each component represented by the formula (5) satisfies the following formula (6).
このような式(6)を変形すると、以下の式(7)を得ることができる。 By modifying such an equation (6), the following equation (7) can be obtained.
このような式(7)を用いると、ミンコフスキー平面上の点の座標は、以下の式(8)で示すことができる。 Using such an equation (7), the coordinates of points on the Minkowski plane can be expressed by the following equation (8).
ここで、図1に示したように、2次元のユークリッド空間上の分散表現をミンコフスキー平面上へと投影する関数fは、以下の式(9)で示すことができる。 Here, as shown in FIG. 1, the function f that projects the distributed representation on the two-dimensional Euclidean space onto the Minkowski plane can be shown by the following equation (9).
また、ミンコフスキー平面上における分散表現uおよび分散表現vは、以下の式(10)、(11)で示すことができる。 Further, the dispersion expression u and the dispersion expression v on the Minkowski plane can be represented by the following equations (10) and (11).
この結果、分散表現uおよび分散表現vの擬内積は、以下の式(12)で示すことができる。ここで、数式におけるドット積の・記号は、ユークリッド空間なベクトル同士のものは普通の内積、双曲空間上のベクトル同士のものは擬内積、という使い分けを暗黙で行っている。 As a result, the pseudo-inner product of the distributed expression u and the distributed expression v can be expressed by the following equation (12). Here, the dot product symbol in the mathematical formula is implicitly used as an ordinary inner product for vectors in Euclidean space and a pseudo-inner product for vectors in hyperbolic space.
このため、擬内積と逆双曲線関数(arcosh)とを用いてミンコフスキー平面のベクトルである チルダ付きu、vを用いた距離として表すと、以下の式(13)で示すことができる。また、ユークリッド平面のベクトル u、vを用いた距離は、(14)で示すことができる。 Therefore, if it is expressed as a distance using tilded u and v, which are vectors of the Minkowski plane, using the pseudo-inner product and the inverse hyperbolic function (arcosh), it can be expressed by the following equation (13). Further, the distance using the vectors u and v of the Euclidean plane can be shown by (14).
判定装置10は、このような式(14)を用いて、分散表現同士のミンコフスキー平面上における距離を算出すればよい。なお、上述した式(14)は、任意の次元のミンコフスキー超平面上における距離に適用可能である。
The
〔4.判定装置が実行する処理の流れの一例〕
次に、図6を用いて、判定装置10が実行する提供処理の流れの一例について説明する。図6は、実施形態に係る判定処理の流れの一例を説明するフローチャートである。まず、判定装置10は、文章を取得し(ステップS101)、文章に含まれる各単語を順に第1モデルに入力し、ユークリッド空間上の分散表現を生成する(ステップS102)。続いて、判定装置10は、分散表現を双曲空間上の分散表現に変換(投影)し(ステップS103)、双曲空間上における分散表現同士の距離を判定する(ステップS104)。そして、判定装置10は、判定結果に基づいて、モデルの学習若しくは類似文章の抽出を行い(ステップS105)、処理を終了する。
[4. An example of the flow of processing executed by the judgment device]
Next, an example of the flow of the provision process executed by the
〔5.変形例〕
上記では、判定装置10による提供処理の一例について説明した。しかしながら、実施形態は、これに限定されるものではない。以下、判定装置10が実行する判定処理のバリエーションについて説明する。
[5. Modification example]
In the above, an example of the provision process by the
〔5-1.装置構成〕
上述した例では、判定装置10は、判定装置10内で判定処理を実行した。しかしながら、実施形態は、これに限定されるものではない。例えば、判定装置10は、情報群の双曲表現を生成する生成装置により生成された双曲表現を用いて、判定処理を実行してもよい。また、判定装置10は、学習処理を実行する学習装置や、提供処理を実行する提供処理と連動することで、上述した各処理を実現してもよい。例えば、生成装置は、図2に示す生成部41を有し、判定装置10は、図2に示す判定部42のみを有し、学習装置は、図2に示す学習部43のみを有し、提供装置は、図2に示す提供部44のみを有してもよい。また、判定装置10は、分散表現データベース31を外部のストレージサーバに記憶させてもよい。
[5-1. Device configuration〕
In the above-mentioned example, the
〔5-2.その他〕
また、上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文章中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
[5-2. others〕
Further, among the processes described in the above-described embodiment, all or a part of the processes described as being automatically performed can be manually performed, or the processes described as being manually performed can be performed. All or part of it can be done automatically by a known method. In addition, the processing procedure, specific name, and information including various data and parameters shown in the above text and drawings can be arbitrarily changed unless otherwise specified. For example, the various information shown in each figure is not limited to the information shown in the figure.
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。 Further, each component of each of the illustrated devices is a functional concept, and does not necessarily have to be physically configured as shown in the figure. That is, the specific form of distribution / integration of each device is not limited to the one shown in the figure, and all or part of them may be functionally or physically distributed / physically in any unit according to various loads and usage conditions. Can be integrated and configured.
また、上記してきた各実施形態は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。 In addition, the above-described embodiments can be appropriately combined as long as the processing contents do not contradict each other.
〔5-3.プログラム〕
また、上述してきた実施形態に係る判定装置10は、例えば図7に示すような構成のコンピュータ1000によって実現される。図7は、ハードウェア構成の一例を示す図である。コンピュータ1000は、出力装置1010、入力装置1020と接続され、演算装置1030、一次記憶装置1040、二次記憶装置1050、出力IF(Interface)1060、入力IF1070、ネットワークIF1080がバス1090により接続された形態を有する。
[5-3. program〕
Further, the
演算装置1030は、一次記憶装置1040や二次記憶装置1050に格納されたプログラムや入力装置1020から読み出したプログラム等に基づいて動作し、各種の処理を実行する。一次記憶装置1040は、RAM等、演算装置1030が各種の演算に用いるデータを一次的に記憶するメモリ装置である。また、二次記憶装置1050は、演算装置1030が各種の演算に用いるデータや、各種のデータベースが登録される記憶装置であり、ROM(Read Only Memory)、HDD、フラッシュメモリ等により実現される。
The
出力IF1060は、モニタやプリンタといった各種の情報を出力する出力装置1010に対し、出力対象となる情報を送信するためのインタフェースであり、例えば、USB(Universal Serial Bus)やDVI(Digital Visual Interface)、HDMI(登録商標)(High Definition Multimedia Interface)といった規格のコネクタにより実現される。また、入力IF1070は、マウス、キーボード、およびスキャナ等といった各種の入力装置1020から情報を受信するためのインタフェースであり、例えば、USB等により実現される。
The output IF 1060 is an interface for transmitting information to be output to an
なお、入力装置1020は、例えば、CD(Compact Disc)、DVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等から情報を読み出す装置であってもよい。また、入力装置1020は、USBメモリ等の外付け記憶媒体であってもよい。
The
ネットワークIF1080は、ネットワークNを介して他の機器からデータを受信して演算装置1030へ送り、また、ネットワークNを介して演算装置1030が生成したデータを他の機器へ送信する。
The network IF 1080 receives data from another device via the network N and sends it to the
演算装置1030は、出力IF1060や入力IF1070を介して、出力装置1010や入力装置1020の制御を行う。例えば、演算装置1030は、入力装置1020や二次記憶装置1050からプログラムを一次記憶装置1040上にロードし、ロードしたプログラムを実行する。
The
例えば、コンピュータ1000が判定装置10として機能する場合、コンピュータ1000の演算装置1030は、一次記憶装置1040上にロードされたプログラムまたはデータ(例えば、モデル32)を実行することにより、制御部40の機能を実現する。コンピュータ1000のCPU1100は、これらのプログラムまたはデータ(例えば、モデル32)を記録媒体1800から読み取って実行するが、他の例として、他の装置からネットワークNを介してこれらのプログラムを取得してもよい。
For example, when the
〔6.効果〕
上述したように、判定装置10は、複数の情報を含む情報群の分散表現であって、その情報群の概念を双曲幾何学上の空間である双曲空間上で示す分散表現を生成する。そして、判定装置10は、双曲空間上の距離に基づいて、情報群同士の類似性を判定する。このように、判定装置10は、ユークリッド空間ではなく双曲空間上の距離に基づいて、複数の情報からなる情報群、すなわち、ツリー形式の概念を有すると推定されうる情報群が示す概念同士を比較する。このため、判定装置10は、分散表現の比較精度を向上させることができる。
[6. effect〕
As described above, the
また、判定装置10は、生成された分散表現を用いて、情報群を分散表現に変換するモデルを学習する。例えば、判定装置10は、モデルを用いて、情報群が有する概念をユークリッド空間上で示す分散表現を生成し、生成した分散表現を双曲空間上に投影することで、その情報群が有する概念を双曲空間上で示す分散表現を生成し、情報群が有する概念を双曲空間上で示す分散表現を用いて、モデルを学習する。このため、判定装置10は、情報群の双曲表現を適切に生成することができるので、分散表現の比較精度を向上させることができる。
Further, the
また、判定装置10は、判定結果に基づいて、利用者から取得した情報群と類似する他の情報群を特定し、特定された他の情報群を利用者に提供する。このため、判定装置10は、利用者から取得した情報群と概念が類似する他の情報群を利用者に提供することができる。
Further, the
また、判定装置10は、再帰型ニューラルネットワークに対して情報群に含まれる複数の情報を順次入力することで、情報群の分散表現を生成する。このため、判定装置10は、情報群が有する概念を示す分散表現の比較精度を向上させることができる。
Further, the
また、判定装置10は、双曲空間として、ポアンカレ円板模型における任意の次元の円板上、若しくは、ポアンカレ球体模型における任意の次元の球面上の分散表現を生成する。また、判定装置10は、双曲空間として、ミンコフスキー空間上の分散表現を生成する。例えば、判定装置10は、双曲空間として、ミンコフスキー空間の二葉双曲面が有する2つの超平面のうち、焦点軸上の座標が正となる超平面上の分散表現を生成する。このため、判定装置10は、情報群の双曲表現を適切に生成することができる。
Further, the
また、判定装置10は、情報群に含まれる各情報の概念と、各情報の出現順序とに基づいて、その情報群の分散表現を生成する。このため、判定装置10は、複数の情報により構成される情報群の概念、すなわち、ツリー形式の情報群の概念を示す双曲表現を適切に生成できる。
Further, the
また、判定装置10は、情報群として、複数の単語を含む文章の分散表現を生成し、分散表現の双曲空間上の距離に基づいて、文章同士の類似性を判定する。このため、判定装置10は、文章の概念の比較精度を向上させることができる。
Further, the
以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。 Although some of the embodiments of the present application have been described in detail with reference to the drawings, these are examples, and various modifications are made based on the knowledge of those skilled in the art, including the embodiments described in the disclosure column of the invention. It is possible to carry out the present invention in other modified forms.
また、上記してきた「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、生成部は、生成手段や生成回路に読み替えることができる。 Further, the above-mentioned "section, module, unit" can be read as "means" or "circuit". For example, the generation unit can be read as a generation means or a generation circuit.
10 判定装置
20 通信部
30 記憶部
31 分散表現データベース
32 モデル
40 制御部
41 生成部
42 判定部
43 学習部
44 提供部
100 入出力装置
110 情報管理装置
10
Claims (10)
前記双曲空間上の距離に基づいて、情報群同士の類似性を判定する判定部と
前記生成部により生成された分散表現を用いて、前記情報群を分散表現に変換するモデルを学習する学習部
を有し、
前記生成部は、前記モデルを用いて、前記情報群が有する概念をユークリッド空間上で示す分散表現を生成し、生成した分散表現を前記双曲空間上に投影することで、当該情報群が有する概念を双曲空間上で示す分散表現を生成し、
前記学習部は、前記情報群が有する概念を双曲空間上で示す分散表現を用いて、前記モデルを学習する
ことを特徴とする判定装置。 A generator that generates a distributed representation of an information group containing a plurality of information and that shows the concept of the information group in a hyperbolic space, which is a hyperbolic space.
A determination unit that determines the similarity between information groups based on the distance on the hyperbolic space.
A learning unit that learns a model that converts the information group into a distributed representation using the distributed representation generated by the generation unit.
Have,
The generation unit uses the model to generate a distributed expression that shows the concept of the information group on the Euclidean space, and projects the generated distributed expression onto the hyperbolic space, so that the information group has the information group. Generate a distributed representation that shows the concept in hyperbolic space,
The learning unit learns the model by using a distributed representation that shows the concept of the information group on the hyperbolic space.
A judgment device characterized by the fact that.
前記特定部により特定された他の情報群を前記利用者に提供する提供部と
を有することを特徴とする請求項1に記載の判定装置。 A specific unit that identifies another information group similar to the information group acquired from the user based on the determination result by the determination unit.
The determination device according to claim 1, further comprising a providing unit that provides the user with another information group specified by the specific unit.
ことを特徴とする請求項1または請求項2に記載の判定装置。 The generation unit according to claim 1 or 2 , wherein a plurality of information included in the information group is sequentially input to the recurrent neural network to generate a distributed representation of the information group. The determination device described.
ことを特徴とする請求項1~3のうちいずれか1つに記載の判定装置。 The generation unit is characterized in that, as the hyperbolic space, a distributed representation on a disk of any dimension in the Poincare disk model or on a spherical surface of any dimension in the Poincare sphere model is generated. The determination device according to any one of 3 to 3 .
ことを特徴とする請求項1~4のうちいずれか1つに記載の判定装置。 The determination device according to any one of claims 1 to 4 , wherein the generation unit generates a distributed representation on a Minkowski space as the hyperbolic space.
ことを特徴とする請求項5に記載の判定装置。 The generation unit is characterized in that, as the hyperbolic space, it generates a distributed representation on a hyperplane in which the coordinates on the focal axis are positive among the two hyperplanes of the bilobed hyperboloid in the Minkowski space. Item 5. The determination device according to Item 5.
ことを特徴とする請求項1~6のうちいずれか1つに記載の判定装置。 Any one of claims 1 to 6 , wherein the generation unit generates a distributed representation of the information group based on the concept of each information included in the information group and the appearance order of each information. The determination device according to one.
前記判定部は、前記分散表現の前記双曲空間上の距離に基づいて、文章同士の類似性を判定する
ことを特徴とする請求項1~7のうちいずれか1つに記載の判定装置。 The generation unit generates a distributed expression of a sentence including a plurality of words as the information group.
The determination device according to any one of claims 1 to 7 , wherein the determination unit determines similarity between sentences based on the distance of the distributed expression on the hyperbolic space.
複数の情報を含む情報群の分散表現であって、当該情報群の概念を双曲幾何学上の空間である双曲空間上で示す分散表現を生成する生成工程と、
前記双曲空間上の距離に基づいて、情報群同士の類似性を判定する判定工程と
前記生成工程により生成された分散表現を用いて、前記情報群を分散表現に変換するモデルを学習する学習工程
を有し、
前記生成工程は、前記モデルを用いて、前記情報群が有する概念をユークリッド空間上で示す分散表現を生成し、生成した分散表現を前記双曲空間上に投影することで、当該情報群が有する概念を双曲空間上で示す分散表現を生成し、
前記学習工程は、前記情報群が有する概念を双曲空間上で示す分散表現を用いて、前記モデルを学習する
ことを特徴とする判定方法。 It is a judgment method executed by the judgment device.
A generation process for generating a distributed representation of an information group containing a plurality of information and showing the concept of the information group on a hyperbolic space, which is a space on hyperbolic geometry.
A determination step for determining similarity between information groups based on the distance on the hyperbolic space.
A learning process for learning a model that converts the information group into a distributed representation using the distributed representation generated by the generation step.
Have,
The generation step uses the model to generate a distributed expression that shows the concept of the information group on the Euclidean space, and projects the generated distributed expression onto the hyperbolic space, so that the information group has the information group. Generate a distributed representation that shows the concept in hyperbolic space,
In the learning step, the model is learned using a distributed representation that shows the concept of the information group on the hyperbolic space.
Judgment method characterized by that.
前記双曲空間上の距離に基づいて、情報群同士の類似性を判定する判定手順と
前記生成手順により生成された分散表現を用いて、前記情報群を分散表現に変換するモデルを学習する学習手順
を有し、
前記生成手順は、前記モデルを用いて、前記情報群が有する概念をユークリッド空間上で示す分散表現を生成し、生成した分散表現を前記双曲空間上に投影することで、当該情報群が有する概念を双曲空間上で示す分散表現を生成し、
前記学習手順は、前記情報群が有する概念を双曲空間上で示す分散表現を用いて、前記モデルを学習する
ことをコンピュータに実行させるための判定プログラム。 A generation procedure for generating a distributed representation of an information group containing a plurality of information and showing the concept of the information group on a hyperbolic space, which is a space on hyperbolic geometry.
Judgment procedure for determining similarity between information groups based on the distance on the hyperbolic space
A learning procedure for learning a model that converts the information group into a distributed representation using the distributed representation generated by the generation procedure.
Have,
The generation procedure uses the model to generate a distributed expression that shows the concept of the information group on the Euclidean space, and projects the generated distributed expression onto the hyperbolic space, so that the information group has the information group. Generate a distributed representation that shows the concept in hyperbolic space,
In the learning procedure, the model is learned using a distributed representation that shows the concept of the information group on the hyperbolic space.
A judgment program that lets a computer do things .
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018099912A JP7058556B2 (en) | 2018-05-24 | 2018-05-24 | Judgment device, judgment method, and judgment program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018099912A JP7058556B2 (en) | 2018-05-24 | 2018-05-24 | Judgment device, judgment method, and judgment program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019204362A JP2019204362A (en) | 2019-11-28 |
JP7058556B2 true JP7058556B2 (en) | 2022-04-22 |
Family
ID=68727006
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018099912A Active JP7058556B2 (en) | 2018-05-24 | 2018-05-24 | Judgment device, judgment method, and judgment program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7058556B2 (en) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7425755B2 (en) | 2019-02-07 | 2024-01-31 | 株式会社Preferred Networks | Conversion method, training device and inference device |
JP7342972B2 (en) * | 2019-12-19 | 2023-09-12 | 富士通株式会社 | Information processing program, information processing method, and information processing device |
CN115668385A (en) * | 2020-06-05 | 2023-01-31 | 富士通株式会社 | Information processing program, information processing method, and information processing apparatus |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015169951A (en) | 2014-03-04 | 2015-09-28 | 株式会社デンソーアイティーラボラトリ | information processing apparatus, information processing method, and program |
US20160196258A1 (en) | 2015-01-04 | 2016-07-07 | Huawei Technologies Co., Ltd. | Semantic Similarity Evaluation Method, Apparatus, and System |
JP2016207141A (en) | 2015-04-28 | 2016-12-08 | ヤフー株式会社 | Summary generation device, summary generation method, and summary generation program |
JP2018045505A (en) | 2016-09-15 | 2018-03-22 | ヤフー株式会社 | Determination device, determination method, and determination program |
-
2018
- 2018-05-24 JP JP2018099912A patent/JP7058556B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015169951A (en) | 2014-03-04 | 2015-09-28 | 株式会社デンソーアイティーラボラトリ | information processing apparatus, information processing method, and program |
US20160196258A1 (en) | 2015-01-04 | 2016-07-07 | Huawei Technologies Co., Ltd. | Semantic Similarity Evaluation Method, Apparatus, and System |
JP2016207141A (en) | 2015-04-28 | 2016-12-08 | ヤフー株式会社 | Summary generation device, summary generation method, and summary generation program |
JP2018045505A (en) | 2016-09-15 | 2018-03-22 | ヤフー株式会社 | Determination device, determination method, and determination program |
Non-Patent Citations (2)
Title |
---|
橋本 隼人,外1名,「Poincare Embeddingを用いた単語の埋め込みベクトルの獲得」,言語処理学会第24回年次大会 発表論文集 [online],言語処理学会,2018年03月05日,p.1187-1190,[令和3年9月6日検索],インターネット<URL:http://www.anlp.jp/proceedings/annual_meeting/2018/pdf_dir/C6-2.pdf> |
白川 達也,「実ユークリッド空間を超えた埋込み手法の新展開」,人工知能,一般社団法人 人工知能学会,2018年03月01日,第33巻 第2号,p.163-169 |
Also Published As
Publication number | Publication date |
---|---|
JP2019204362A (en) | 2019-11-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11521110B2 (en) | Learning apparatus, learning method, and non-transitory computer readable storage medium | |
JP7058556B2 (en) | Judgment device, judgment method, and judgment program | |
CA2902015C (en) | Method and system for solving an optimization problem involving graph similarity | |
KR102264234B1 (en) | A document classification method with an explanation that provides words and sentences with high contribution in document classification | |
JP6199517B1 (en) | Determination apparatus, determination method, and determination program | |
US11669687B1 (en) | Systems and methods for natural language processing (NLP) model robustness determination | |
CN115244587A (en) | Efficient ground truth annotation | |
JP7032233B2 (en) | Information processing equipment, information processing methods, and information processing programs | |
Kong et al. | On the performance of oversampling techniques for class imbalance problems | |
US20190164083A1 (en) | Categorical Data Transformation and Clustering for Machine Learning using Natural Language Processing | |
JP6975610B2 (en) | Learning device and learning method | |
JP2022088540A (en) | Method for generating user interest image, device, electronic apparatus and storage medium | |
JP6964481B2 (en) | Learning equipment, programs and learning methods | |
JP6680655B2 (en) | Learning device and learning method | |
JP6910873B2 (en) | Specific device and specific method | |
JP2019021218A (en) | Learning device, program parameter, learning method and model | |
JP6705506B2 (en) | Learning program, information processing apparatus, and learning method | |
JP7071213B2 (en) | Information processing equipment, information processing methods, and information processing programs | |
JP7017478B2 (en) | Output device, output method and output program | |
JP2022185799A (en) | Information processing program, information processing method and information processing device | |
JP6979899B2 (en) | Generator, learning device, generation method, learning method, generation program, and learning program | |
JP7265837B2 (en) | Learning device and learning method | |
JP6963988B2 (en) | Providing equipment, providing method and providing program | |
JP6680656B2 (en) | Judgment device and judgment method | |
JP7054645B2 (en) | Generator, generation method, generation program and program parameters |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20191101 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20191108 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200917 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210820 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210914 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20211108 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220329 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220412 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7058556 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |