JP7058556B2 - Judgment device, judgment method, and judgment program - Google Patents

Judgment device, judgment method, and judgment program Download PDF

Info

Publication number
JP7058556B2
JP7058556B2 JP2018099912A JP2018099912A JP7058556B2 JP 7058556 B2 JP7058556 B2 JP 7058556B2 JP 2018099912 A JP2018099912 A JP 2018099912A JP 2018099912 A JP2018099912 A JP 2018099912A JP 7058556 B2 JP7058556 B2 JP 7058556B2
Authority
JP
Japan
Prior art keywords
space
information group
distributed
model
hyperbolic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018099912A
Other languages
Japanese (ja)
Other versions
JP2019204362A (en
Inventor
徹 清水
伸幸 清水
隼人 小林
カウステューブ クルカルニ
潤二 宰川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2018099912A priority Critical patent/JP7058556B2/en
Publication of JP2019204362A publication Critical patent/JP2019204362A/en
Application granted granted Critical
Publication of JP7058556B2 publication Critical patent/JP7058556B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Description

本発明は、判定装置、判定方法、および判定プログラムに関する。 The present invention relates to a determination device, a determination method, and a determination program .

従来、入力された情報の分散表現を生成し、生成した分散表現同士の比較結果に基づいて、情報の類似性を判定する技術が知られている。このような技術の一例として、類似若しくは関連性を有するテキストの分散表現同士がユークリッド空間上で近くなり、非類似若しくは関連性を有しないテキストの分散表現同士がユークリッド空間上で離れるように、DSSM(Deep Semantic Similarity Model)やRNN(Reccurent Neural Network)といったモデルの学習を行う技術が知られている。 Conventionally, there is known a technique of generating a distributed representation of input information and determining the similarity of information based on the comparison result between the generated distributed representations. As an example of such a technique, the DSSM is such that distributed representations of similar or related texts are close to each other in Euclidean space, and distributed representations of dissimilar or dissimilar texts are separated from each other in Euclidean space. Techniques for learning models such as (Deep Semantic Similarity Model) and RNN (Reccurent Neural Network) are known.

“Poincare Embeddings for Learning Hierarchical Representations”,Maximilian Nickel, Douwe Kiela <インターネット>https://arxiv.org/pdf/1705.08039.pdf(平成30年5月1日検索)"Poincare Embeddings for Learning Hierarchical Representations", Maximilian Nickel, Douwe Kiela <Internet> https://arxiv.org/pdf/1705.08039.pdf (Searched May 1, 2018)

“Hyperbolic geometry MA 448”,p32, Caroline Series <インターネット>https://homepages.warwick.ac.uk/~masbb/Papers/MA448.pdf平成30年5月1日検索)"Hyperbolic geometry MA 448", p32, Caroline Series <Internet> https://homepages.warwick.ac.uk/~masbb/Papers/MA448.pdf Searched May 1, 2018)

“DSSM”,Jianfeng Gao, Po-Sen Huang, Hamid Palangi, Yelong Shen <インターネット>https://www.microsoft.com/en-us/research/project/dssm/ 平成30年5月1日検索)“DSSM”, Jianfeng Gao, Po-Sen Huang, Hamid Palangi, Yelong Shen <Internet> https://www.microsoft.com/en-us/research/project/dssm/ Searched May 1, 2018)

しかしながら、上述した技術では、分散表現の比較精度を向上させる余地がある。 However, in the above-mentioned technique, there is room for improving the comparison accuracy of the distributed representation.

例えば、上述した技術では、モデルがテキストをユークリッド空間上の分散表現へと変換させる。しかしながら、このような技術では、学習データとなったテキストとは異なる字面のテキストであるが、学習データとなったテキストと意味が類似するテキストが入力された場合に、ユークリッド空間上で類似しない分散表現を生成する恐れがある。 For example, in the technique described above, the model transforms the text into a distributed representation in Euclidean space. However, in such a technique, although the text has a different character from the text used as the learning data, when the text having a similar meaning to the text used as the learning data is input, the dispersion is not similar in the Euclidean space. May produce expressions.

本願は、上記に鑑みてなされたものであって、分散表現の比較精度を改善することを目的とする。 The present application has been made in view of the above, and an object thereof is to improve the comparison accuracy of the distributed representation.

本願に係る判定装置は、複数の情報を含む情報群の分散表現であって、当該情報群の概念を双曲幾何学上の空間である双曲空間上で示す分散表現を生成する生成部と、前記双曲空間上の距離に基づいて、情報群同士の類似性を判定する判定部とを有することを特徴とする。 The determination device according to the present application is a distributed representation of an information group containing a plurality of information, and is a generator that generates a distributed representation showing the concept of the information group on a hyperbolic space, which is a space on hyperbolic geometry. It is characterized by having a determination unit for determining similarity between information groups based on the distance on the hyperbolic space.

実施形態の一態様によれば、分散表現の比較精度を改善することができる。 According to one aspect of the embodiment, the comparative accuracy of the distributed representation can be improved.

図1は、実施形態に係る判定装置が実行する処理の一例を示す図である。FIG. 1 is a diagram showing an example of processing executed by the determination device according to the embodiment. 図2は、実施形態に係る判定装置の構成例を示す図である。FIG. 2 is a diagram showing a configuration example of the determination device according to the embodiment. 図3は、実施形態に係る分散表現データベースに登録される情報の一例を示す図である。FIG. 3 is a diagram showing an example of information registered in the distributed representation database according to the embodiment. 図4は、双曲空間としてポアンカレディスクを採用する例を説明する図である。FIG. 4 is a diagram illustrating an example of adopting a Poincare disc as a hyperbolic space. 図5は、双曲空間として二葉双曲面を採用する例を説明する図である。FIG. 5 is a diagram illustrating an example of adopting a hyperbolic space as a hyperbolic space. 図6は、実施形態に係る判定処理の流れの一例を説明するフローチャートである。FIG. 6 is a flowchart illustrating an example of the flow of the determination process according to the embodiment. 図7は、ハードウェア構成の一例を示す図である。FIG. 7 is a diagram showing an example of a hardware configuration.

以下に、本願に係る判定装置、判定方法、および判定プログラムを実施するための形態(以下、「実施形態」と記載する。)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る判定装置、判定方法、および判定プログラムが限定されるものではない。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。 Hereinafter, a determination device according to the present application, a determination method, and an embodiment for implementing the determination program (hereinafter, referred to as “embodiment”) will be described in detail with reference to the drawings. It should be noted that this embodiment does not limit the determination device, determination method, and determination program according to the present application. Further, in each of the following embodiments, the same parts are designated by the same reference numerals, and duplicate description is omitted.

[実施形態]
〔1-1.判定装置の一例〕
まず、図1を用いて、判定装置が実行する処理の一例について説明する。なお、以下の説明では、判定装置が実行する処理の一例として、文章同士の概念が類似するか否かを判定する処理の一例について記載するが、実施形態は、これに限定されるものではない。例えば、以下に説明する判定装置10は、文章以外にも、音声データ等、複数の情報(以下、「情報群」と記載する場合がある。)により構成される情報であれば、任意の情報同士が類似するか否かを判定して良い。
[Embodiment]
[1-1. Example of judgment device]
First, an example of the process executed by the determination device will be described with reference to FIG. In the following description, as an example of the process executed by the determination device, an example of the process of determining whether or not the concepts of sentences are similar is described, but the embodiment is not limited to this. .. For example, the determination device 10 described below is arbitrary information as long as it is information composed of a plurality of information (hereinafter, may be referred to as "information group") such as voice data in addition to sentences. It may be determined whether or not they are similar to each other.

図1は、実施形態に係る判定装置が実行する処理の一例を示す図である。図1では、判定装置10は、以下に説明する判定処理を実行する情報処理装置であり、例えば、サーバ装置やクラウドシステム等により実現される。 FIG. 1 is a diagram showing an example of processing executed by the determination device according to the embodiment. In FIG. 1, the determination device 10 is an information processing device that executes the determination process described below, and is realized by, for example, a server device, a cloud system, or the like.

より具体的には、判定装置10は、インターネット等の所定のネットワークNを介して、入出力装置100(例えば、図2を参照)や情報管理装置110といった任意の装置と通信が可能である。 More specifically, the determination device 10 can communicate with any device such as the input / output device 100 (see, for example, FIG. 2) and the information management device 110 via a predetermined network N such as the Internet.

入出力装置100は、マイクなどの音声を取得する音声取得装置を用いて、利用者の発言を取得する。そして、入出力装置100は、任意の音声認識技術を用いて、発言をテキストデータに変換し、変換後のテキストデータを判定装置10へと送信する。また、入出力装置100は、スピーカ等の音声を出力する装置を用いて、判定装置10から受信したテキストデータの読み上げを行う。なお、入出力装置100は、判定装置10から受信したテキストデータを所定の表示装置に表示してもよい。 The input / output device 100 acquires a user's remark by using a voice acquisition device such as a microphone that acquires voice. Then, the input / output device 100 converts the remark into text data by using an arbitrary voice recognition technique, and transmits the converted text data to the determination device 10. Further, the input / output device 100 reads out the text data received from the determination device 10 by using a device such as a speaker that outputs voice. The input / output device 100 may display the text data received from the determination device 10 on a predetermined display device.

なお、入出力装置100は、スマートフォンやタブレット等のスマートデバイス、デスクトップPC(Personal Computer)やノートPC等、サーバ装置等の情報処理装置により実現される。なお、入出力装置100は、例えば、同一の情報処理装置によって実現されてもよく、例えば、ロボット等の装置によって実現されてもよい。 The input / output device 100 is realized by an information processing device such as a smart device such as a smartphone or tablet, a desktop PC (Personal Computer), a notebook PC, or a server device. The input / output device 100 may be realized by, for example, the same information processing device, or may be realized by, for example, a device such as a robot.

情報管理装置110は、各種の情報を管理する情報処理装置であり、例えば、サーバ装置やクラウドシステム等により実現される。例えば、情報管理装置110は、学習データとして利用可能な各種の文章データを保持している。より具体的な例を挙げると、情報管理装置110は、文章のテキストデータと、各文章の概念が類似するか否かを示すラベルとを対応付けた学習データを管理しており、判定装置10の要求に応じて学習データを判定装置10に提供する。 The information management device 110 is an information processing device that manages various types of information, and is realized by, for example, a server device, a cloud system, or the like. For example, the information management device 110 holds various text data that can be used as learning data. To give a more specific example, the information management device 110 manages learning data in which text data of sentences and labels indicating whether or not the concepts of each sentence are similar are associated with each other, and the determination device 10 manages the learning data. The learning data is provided to the determination device 10 in response to the request of.

〔1-2.従来の分散表現の生成について〕
ここで、比較対象となる情報を分散表現に変換し、分散表現同士の比較結果に基づいて情報の類似性を判断する従来技術の一例について説明する。また、以下の説明では、文章の分散表現を生成する従来技術の一例について説明する。
[1-2. About the generation of conventional distributed representation]
Here, an example of a conventional technique for converting information to be compared into a distributed expression and determining the similarity of the information based on the comparison result between the distributed expressions will be described. Further, in the following description, an example of a conventional technique for generating a distributed expression of sentences will be described.

例えば、従来の情報処理装置は、RNNやDSSMといったモデルに対して、文章に含まれる各単語を順に入力し、モデルが出力した分散表現を得る。そして、情報処理装置は、複数の文章から生成した分散表現同士を比較し、類似する概念を有する文章同士の分散表現が類似し、類似しない概念を有する文章同士の分散表現が類似しないように、モデルの学習を進めることで、文章が示す概念を分散表現へと変換するモデルを実現する。また、従来の情報処理装置は、上述した学習を行ったモデルを用いて、入力された文章を分散表現へと変換し、変換後の分散表現を他の文章から生成した分散表現と比較することで、入力された文章と概念が類似する他の文章を検索していた。 For example, in a conventional information processing device, each word included in a sentence is input in order to a model such as RNN or DSSM, and a distributed expression output by the model is obtained. Then, the information processing device compares the distributed expressions generated from a plurality of sentences so that the distributed expressions of the sentences having similar concepts are similar and the distributed expressions of sentences having dissimilar concepts are not similar. By advancing the learning of the model, we will realize a model that transforms the concept shown by the sentence into a distributed expression. In addition, the conventional information processing device converts the input sentence into a distributed expression by using the model obtained by the above-mentioned learning, and compares the converted distributed expression with the distributed expression generated from other sentences. So, I was searching for other sentences that have similar concepts to the entered sentences.

ここで、従来の情報処理装置は、モデルの学習時やモデルを用いた処理の実行時(以下、「測定時」と記載する。)において、ユークリッド空間上における分散表現同士の距離を算出し、算出した距離に基づいて、分散表現が示す概念同士の類似性を判定していた。より具体的には、情報処理装置は、類似する文章の分散表現同士については、ユークリッド空間上における距離が短くなり、類似しない文章の分散表現同士については、ユークリッド空間上における距離が長くなるように、文章から分散表現を生成するモデルの学習を行った。この結果、情報処理装置は、各文章が示す概念をユークリッド空間上に投影し、ユークリッド空間上で各概念の類似性を判定していた。 Here, the conventional information processing apparatus calculates the distance between the distributed expressions in the Euclidean space at the time of learning the model or executing the process using the model (hereinafter, referred to as “measurement time”). Based on the calculated distance, the similarity between the concepts shown by the distributed expression was determined. More specifically, the information processing device makes the distance between distributed expressions of similar sentences shorter in Euclidean space, and the distance between distributed expressions of dissimilar sentences becomes longer in Euclidean space. , We learned a model to generate distributed expressions from sentences. As a result, the information processing apparatus projected the concept shown by each sentence onto the Euclidean space, and determined the similarity of each concept on the Euclidean space.

しかしながら、このような手法においては、分散表現の精度を向上させる余地がある。例えば、上述したモデルは、学習データに含まれる文章に含まれる単語の語順を変更した文章が入力された場合に、ユークリッド空間上において類似しない分散表現を生成する恐れがある。また、多くの文章をユークリッド空間上に投影するには、あらかじめ多くの次元を設定する必要があり、計算コストが増大してしまう。 However, in such a method, there is room for improving the accuracy of the distributed representation. For example, the above-mentioned model may generate dissimilar distributed expressions in Euclidean space when a sentence in which the word order of words included in the sentence included in the learning data is changed is input. Moreover, in order to project many sentences on the Euclidean space, it is necessary to set many dimensions in advance, which increases the calculation cost.

一方で、非ユークリッド空間の一例である双曲空間上に分散表現を投影することで、単語の分散表現の精度を向上させる技術が知られている(例えば、非特許文献1)。例えば、非特許文献1においては、ある単語の前後に来る単語を予測するタスクにおいて、単語の分散表現を双曲空間であるポアンカレ空間上で学習する。このようなポアンカレ空間においては、空間の端に近づけば近づくほど、距離の尺度が指数関数的に増加していくため、有限の空間内に無限の情報(空間上の点)を投影することができる。 On the other hand, there is known a technique for improving the accuracy of distributed expression of words by projecting a distributed expression on a hyperbolic space, which is an example of a non-Euclidean space (for example, Non-Patent Document 1). For example, in Non-Patent Document 1, in the task of predicting words that come before and after a certain word, the distributed expression of the words is learned on the Poincare space, which is a hyperbolic space. In such a Poincare space, the closer to the edge of the space, the more the scale of distance increases exponentially, so it is possible to project infinite information (points in space) in a finite space. can.

例えば、このようなポアンカレ空間の一例であるポアンカレディスクに、枝分かれしていく情報を埋め込む処理を考える。このようなポアンカレディスクにおいては、中心から円周上に向かうにつれ、距離の尺度が指数関数的に増加してく。このため、ポアンカレディスクの中心から円周方向に、枝分かれしていくツリーを埋め込んだ場合、ポアンカレディスク上においては、各枝の角度および長さを一定に保ったまま、任意の数の枝分かれを有するツリーを自然に埋め込むことができる。このようなポアンカレディスクの特徴は、さらに高次元なポアンカレ空間においても保持される。 For example, consider a process of embedding branching information in a Poincare disk, which is an example of such a Poincare space. In such a Poincare disc, the measure of distance increases exponentially from the center to the circumference. For this reason, when a tree that branches in the circumferential direction from the center of the Poincare disc is embedded, it has an arbitrary number of branches on the Poincare disc while keeping the angle and length of each branch constant. You can embed the tree naturally. Such characteristics of the Poincare disc are retained even in a higher-dimensional Poincare space.

一方で、知識データベースや各種の分類体系、語彙等の情報は、階層構造、すなわち、ツリー構造を有すると考えられる。このため、単語をポアンカレ空間上の分散表現へと変換した場合、各単語が有する階層構造を自然に埋め込むことができる。また、ポアンカレ空間上においては、円周方向に近づく程距離の尺度が増加する。このため、ポアンカレ空間上で単語の分散表現を学習した場合は、多くの階層関係を分散表現に反映させることができるので、分散表現を用いたクラスタリングの精度向上や、分散表現の次元数の削減を実現することが知られている。 On the other hand, information such as a knowledge database, various classification systems, and vocabulary is considered to have a hierarchical structure, that is, a tree structure. Therefore, when a word is converted into a distributed expression on the Poincare space, the hierarchical structure of each word can be naturally embedded. Further, in the Poincare space, the scale of the distance increases as it approaches the circumferential direction. Therefore, when learning the distributed expression of words in Poincare space, many hierarchical relationships can be reflected in the distributed expression, so the accuracy of clustering using the distributed expression can be improved and the number of dimensions of the distributed expression can be reduced. Is known to achieve.

〔1-3.判定装置が実行する処理について〕
ここで、文章の概念を考えると、文章に含まれる単語によりツリー状に分岐していく体系を有しているとも考えられる。このため、文章の分散表現を双曲空間上で学習した場合、文章の概念を精度良く学習することができると考えられる。また、双曲空間上で分散表現同士を比較した場合、文章の概念を精度良く比較することができると考えられる。
[1-3. About the processing executed by the judgment device]
Here, considering the concept of a sentence, it can be considered that it has a system of branching in a tree shape according to the words contained in the sentence. Therefore, when the distributed expression of a sentence is learned on the hyperbolic space, it is considered that the concept of the sentence can be learned accurately. In addition, when the distributed expressions are compared on the hyperbolic space, it is considered that the concepts of sentences can be compared accurately.

そこで、判定装置10は、以下の判定処理を実行する。例えば、判定装置10は、複数の情報を含む情報群の分散表現であって、情報群の概念を双曲幾何学上の空間である双曲空間上で示す分散表現を生成する。そして、判定装置10は、双曲空間上の距離に基づいて、情報群同士の類似性を判定する。 Therefore, the determination device 10 executes the following determination process. For example, the determination device 10 generates a distributed representation of an information group including a plurality of information, and shows the concept of the information group on a hyperbolic space, which is a space on hyperbolic geometry. Then, the determination device 10 determines the similarity between the information groups based on the distance on the hyperbolic space.

例えば、判定装置10は、情報群として、複数の単語を含む文章の分散表現を生成し、分散表現の双曲空間上の距離に基づいて、文章同士の類似性を判定する。そして、判定装置10は、生成された分散表現を用いて、学習処理や測定処理を実行する。例えば、判定装置10は、学習データから生成された分散表現を用いて、情報群を分散表現に変換するモデルの学習を学習する。また、判定装置10は、利用者から取得した情報群の分散表現を生成し、生成した分散表現と他の情報群の分散表現とを双曲空間上で比較することで、取得した情報群と類似する他の情報群を特定する。そして、判定装置10は、特定された他の情報群を利用者に提供する。 For example, the determination device 10 generates a distributed expression of a sentence including a plurality of words as an information group, and determines the similarity between the sentences based on the distance in the hyperbolic space of the distributed expression. Then, the determination device 10 executes the learning process and the measurement process using the generated distributed representation. For example, the determination device 10 learns to learn a model that converts an information group into a distributed expression by using the distributed expression generated from the learning data. Further, the determination device 10 generates a distributed representation of the information group acquired from the user, and compares the generated distributed representation with the distributed representation of another information group on the hyperbolic space to obtain the information group. Identify other similar sources of information. Then, the determination device 10 provides the user with another specified group of information.

〔1-4.判定装置が実行する処理の一例について〕
以下、図1を用いて、判定装置10が実行する処理の一例を説明する。まず、判定装置10は、情報管理装置110から学習データとなる文章を取得する(ステップS1)。例えば、判定装置10は、複数の単語からなる複数の文章と、各文章の類似性を示すラベル情報とを取得する。このような場合、判定装置10は、RNNやDSSMといったモデルを用いて、文章を分散表現に変換する(ステップS2)。
[1-4. About an example of the processing executed by the judgment device]
Hereinafter, an example of the process executed by the determination device 10 will be described with reference to FIG. First, the determination device 10 acquires a sentence to be learning data from the information management device 110 (step S1). For example, the determination device 10 acquires a plurality of sentences composed of a plurality of words and label information indicating the similarity of each sentence. In such a case, the determination device 10 converts the text into a distributed representation using a model such as RNN or DSSM (step S2).

例えば、判定装置10は、形態素解析等の技術を用いて、「明日は晴れるでしょう」といった文章を「明日」、「は」、「晴れ」、「る」、「でしょう」というように、文章を構成する複数の単語に分解する。そして、判定装置10は、単語を出現順にモデルに入力することで、単語群(すなわち、情報群)である文章の分散表現を生成する。より具体的には、判定装置10は、再帰型ニューラルネットワークに対して情報群に含まれる複数の単語を順次入力することで、情報群の分散表現を生成する。 For example, the determination device 10 uses techniques such as morphological analysis to change sentences such as "tomorrow will be fine" to "tomorrow", "ha", "sunny", "ru", and "may". Break down into multiple words that make up a sentence. Then, the determination device 10 inputs words into the model in the order of appearance to generate a distributed expression of sentences that are word groups (that is, information groups). More specifically, the determination device 10 generates a distributed representation of the information group by sequentially inputting a plurality of words included in the information group into the recurrent neural network.

なお、図1に示す例においては、判定装置10は、文章をユークリッド空間上の分散表現に変換するように学習が行われたモデル、すなわち、既存のモデルを用いて、文章を分散表現に変換する。なお、判定装置10は、RNN以外にも、例えば、畳み込みニューラルネットワークを用いて、文章を分散表現に変換してもよい。また、例えば、判定装置10は、同一の文章に含まれる単語をランダムな順序で入力した際に、出現順に入力した場合の分散表現と類似する分散表現を出力するように学習が行われたモデルを用いてもよい。すなわち、判定装置10は、入力された文章の概念をユークリッド空間上で示す分散表現を生成する。なお、以下の説明では、入力された文章の概念をユークリッド空間上で示す分散表現を「ユークリッド空間上の分散表現」と記載する場合がある。また、以下の説明では、文章をユークリッド空間上の分散表現へと変換するモデルを第1モデルと記載する。 In the example shown in FIG. 1, the determination device 10 converts a sentence into a distributed expression using a model trained to convert the sentence into a distributed expression in Euclidean space, that is, an existing model. do. In addition to the RNN, the determination device 10 may convert a sentence into a distributed expression by using, for example, a convolutional neural network. Further, for example, the determination device 10 is a model in which learning is performed so that when words included in the same sentence are input in a random order, a distributed expression similar to the distributed expression when the words are input in the order of appearance is output. May be used. That is, the determination device 10 generates a distributed representation that shows the concept of the input sentence on the Euclidean space. In the following description, the distributed expression showing the concept of the input sentence in the Euclidean space may be described as "distributed expression in the Euclidean space". Further, in the following description, a model for converting a sentence into a distributed representation on Euclidean space is described as a first model.

続いて、判定装置10は、分散表現を双曲空間上に投影する(ステップS3)。例えば、判定装置10は、双曲空間として、ミンコフスキー空間上に分散表現を投影する。より具体的には、判定装置10は、ミンコフスキー空間の二葉双曲面(Hyperboloid of two sheets)が有する2つの超平面のうち、焦点軸上の座標が正となる超平面上の分散表現を生成する。 Subsequently, the determination device 10 projects the distributed expression onto the hyperbolic space (step S3). For example, the determination device 10 projects a distributed expression on the Minkowski space as a hyperbolic space. More specifically, the determination device 10 generates a distributed representation on a hyperplane whose coordinates on the focal axis are positive among the two hyperplanes of the Hyperboloid of two sheets in Minkowski space. ..

例えば、判定装置10は、x軸、y軸およびz軸により構成される3次元空間を設定し、この3次元空間においてz軸を焦点軸とする二葉双曲面を設定する。また、判定装置10は、第1モデルを用いて、x軸成分およびy軸成分からなる2次元のユークリッド空間上の分散表現を生成する。そして、判定装置10は、設定した3次元空間において、生成した分散表現が示す位置から、xy平面に対する垂線を設定し、二葉双曲面のうちz軸方向の成分が正となる曲面と垂線との交点を分散表現の投影先とする。すなわち、判定装置10は、文章の概念を示す双曲空間上の分散表現を生成する。 For example, the determination device 10 sets a three-dimensional space composed of the x-axis, the y-axis, and the z-axis, and sets a two-leaf hyperboloid with the z-axis as the focal axis in the three-dimensional space. Further, the determination device 10 uses the first model to generate a distributed representation on a two-dimensional Euclidean space composed of an x-axis component and a y-axis component. Then, the determination device 10 sets a perpendicular line with respect to the xy plane from the position indicated by the generated dispersion expression in the set three-dimensional space, and the curved surface and the perpendicular line whose z-axis direction component is positive among the two-leaf hyperboloids. The intersection is the projection destination of the distributed expression. That is, the determination device 10 generates a distributed representation on the hyperbolic space showing the concept of sentences.

そして、判定装置10は、双曲空間上における分散表現同士の距離を判定する(ステップS4)。例えば、判定装置10は、文章#1からユークリッド空間上の分散表現uを生成し、文章#2からユークリッド空間上の分散表現vを生成する。そして、判定装置10は、分散表現uと分散表現vとの間の双曲空間上における距離を算出する。なお、双曲空間上における距離の算出手法については、後述する。 Then, the determination device 10 determines the distance between the distributed expressions on the hyperbolic space (step S4). For example, the determination device 10 generates the distributed expression u on the Euclidean space from the sentence # 1 and the distributed expression v on the Euclidean space from the sentence # 2. Then, the determination device 10 calculates the distance in the hyperbolic space between the distributed expression u and the distributed expression v. The method of calculating the distance in the hyperbolic space will be described later.

そして、判定装置10は、判定結果に基づいて、モデルの学習を行う(ステップS5)。例えば、判定装置10は、文章#1と文章#2とが類似する場合には、分散表現uと分散表現vとの間の双曲空間上における距離がより小さくなるようにモデルを学習し、文章#1と文章#2とが類似しない場合には、分散表現uと分散表現vとの間の双曲空間上における距離がより大きくなるようにモデルを学習する。 Then, the determination device 10 learns the model based on the determination result (step S5). For example, when the sentence # 1 and the sentence # 2 are similar, the determination device 10 learns the model so that the distance between the distributed expression u and the distributed expression v on the hyperbolic space becomes smaller. When sentence # 1 and sentence # 2 are not similar, the model is learned so that the distance between the distributed expression u and the distributed expression v on the hyperbolic space becomes larger.

なお、判定装置10は、分散表現uと分散表現vとの間の双曲空間上における距離が、文章#1と文章#2との類似度を反映するように、モデルの学習を行ってもよい。例えば、判定装置10は、文章#1と文章#3との類似度が、文章#1と文章#2との類似度よりも高い場合は、分散表現uと文章#3の双曲空間上における分散表現との双曲空間上における距離が、分散表現uと分散表現vとの間の双曲空間上における距離よりも短くなるように、モデルの学習を行う。すなわち、判定装置10は、各文章が有する概念の類似性を、双曲空間上に落とし込むように、文章の分散表現を生成するモデルの学習を行う。 Even if the determination device 10 learns the model so that the distance between the distributed expression u and the distributed expression v on the hyperbolic space reflects the degree of similarity between the sentence # 1 and the sentence # 2. good. For example, when the similarity between the sentence # 1 and the sentence # 3 is higher than the similarity between the sentence # 1 and the sentence # 2, the determination device 10 is in the hyperbolic space of the distributed expression u and the sentence # 3. The model is trained so that the distance on the hyperbolic space with the distributed expression is shorter than the distance on the hyperbolic space between the distributed expression u and the distributed expression v. That is, the determination device 10 learns a model that generates a distributed expression of sentences so that the similarity of the concepts of each sentence is dropped on the hyperbolic space.

例えば、判定装置10は、第1モデルが生成したユークリッド空間上の分散表現を双曲空間上に投影する関数fを固定し、バックプロパゲーション等の学習手法を用いて、第1モデルのノード間を接続する接続係数を修正してもよい。また、判定装置10は、第1モデルが生成したユークリッド空間上の分散表現を双曲空間上に投影する関数fを修正してもよい。すなわち、判定装置10は、文章が有する概念の類似性を双曲空間上における距離へと投影することができるモデル(以下、「第2モデル」と記載する。)を学習するのであれば、任意の学習を行ってよい。換言すると、判定装置10は、第1モデルと関数fとからなる第2モデルの学習を、第1モデルの修正を行うことで実現してもよく、関数fの修正を行うことで実現してもよい。また、判定装置10は、第1モデルと関数fの両方を修正してもよい。また、判定装置10は、新規なモデルを準備し、準備したモデルの学習を行うことで、第2モデルの学習を行ってもよい。 For example, the determination device 10 fixes a function f that projects a distributed expression on the Euclidean space generated by the first model onto the hyperbolic space, and uses a learning method such as backpropagation between the nodes of the first model. You may modify the connection factor to connect. Further, the determination device 10 may modify the function f that projects the distributed representation on the Euclidean space generated by the first model onto the hyperbolic space. That is, the determination device 10 is arbitrary as long as it learns a model (hereinafter, referred to as "second model") capable of projecting the similarity of concepts of sentences onto a distance in hyperbolic space. You may study. In other words, the determination device 10 may realize the learning of the second model including the first model and the function f by modifying the first model, or by modifying the function f. May be good. Further, the determination device 10 may modify both the first model and the function f. Further, the determination device 10 may learn the second model by preparing a new model and learning the prepared model.

続いて、判定装置10は、利用者から判定対象となる文章を取得する(ステップS6)。このような場合、判定装置10は、第2モデルを用いて、取得した文章の分散表現を双曲空間上に投影し、双曲空間上で、他の文章の分散表現との距離を算出する。そして、判定装置10は、算出した距離が所定の条件を満たす文章を特定する。例えば、判定装置10は、算出した距離が最も短い文章、すなわち、利用者から取得した文章と概念が類似する文章を特定する。そして、判定装置10は、特定した文章を利用者に提供する(ステップS8)。 Subsequently, the determination device 10 acquires a sentence to be determined from the user (step S6). In such a case, the determination device 10 projects the distributed expression of the acquired sentence on the hyperbolic space using the second model, and calculates the distance from the distributed expression of other sentences on the hyperbolic space. .. Then, the determination device 10 identifies a sentence in which the calculated distance satisfies a predetermined condition. For example, the determination device 10 identifies a sentence having the shortest calculated distance, that is, a sentence having a similar concept to the sentence acquired from the user. Then, the determination device 10 provides the specified sentence to the user (step S8).

このように、判定装置10は、文章をユークリッド空間上の分散表現ではなく、双曲空間上の分散表現に変換する。そして、判定装置10は、双曲空間上の距離に基づいて、文章の概念同士を比較する。このような処理を実行した場合、判定装置10は、文章の概念が有するツリー条の体系を比較することができるので、文章が有する概念の比較精度を向上させることができる。すなわち、判定装置10は、分散表現が概念を示す精度を向上させることができる。また、判定装置10は、分散表現が概念を示す精度を保持したまま、分散表現の次元数を削減できるので、計算コストを削減することができる。 In this way, the determination device 10 converts the sentence into a distributed representation on the hyperbolic space instead of the distributed representation on the Euclidean space. Then, the determination device 10 compares the concepts of sentences with each other based on the distance on the hyperbolic space. When such a process is executed, the determination device 10 can compare the tree-row system of the concept of the text, so that the comparison accuracy of the concept of the text can be improved. That is, the determination device 10 can improve the accuracy with which the distributed expression shows the concept. Further, the determination device 10 can reduce the number of dimensions of the distributed representation while maintaining the accuracy of the distributed representation, so that the calculation cost can be reduced.

〔1-5.モデルについて〕
ここで、図1に示す例では、文章をユークリッド空間上の分散表現に変換する第1モデルを用いて、ユークリッド空間上の分散表現を取得し、関数fを用いて、ユークリッド空間上の分散表現を双曲空間上に投影した。しかしながら、実施形態は、これに限定されるものではない。
[1-5. About the model]
Here, in the example shown in FIG. 1, the distributed representation on the Euclidean space is acquired by using the first model that transforms the sentence into the distributed representation on the Euclidean space, and the distributed representation on the Euclidean space is used by using the function f. Was projected onto the hyperbolic space. However, the embodiments are not limited to this.

例えば、判定装置10は、新規なCNN(Convolutional Neural Network)やRNNを統合モデルとして準備じ、準備した統合モデルを用いて文章の分散表現を生成する。そして、判定装置10は、生成した分散表現が所定の双曲空間上の分散表現であるものとして、各文章から生成した分散表現の距離を算出し、算出した距離に基づいて、統合モデルの学習を行ってもよい。また、判定装置10は、このような学習処理により学習が行われた統合モデルを用いて、文章が有する概念同士の比較を実現してもよい。 For example, the determination device 10 prepares a new CNN (Convolutional Neural Network) or RNN as an integrated model, and generates a distributed representation of sentences using the prepared integrated model. Then, the determination device 10 calculates the distance of the distributed expression generated from each sentence, assuming that the generated distributed expression is a distributed expression on a predetermined hyperbolic space, and learns the integrated model based on the calculated distance. May be done. Further, the determination device 10 may realize the comparison between the concepts of the sentences by using the integrated model in which the learning is performed by such a learning process.

また、判定装置10は、RNNを用いて文章の分散表現を生成する場合、各単語の概念と、各単語の出現順序とに基づいて、文章の分散表現を生成してもよい。例えば、判定装置10は、文章に含まれる各単語を出現順に入力した場合の分散表現と、文章に含まれる各単語を出現順とは異なる順で入力した場合の分散表現とが異なるように、第2モデルや統合モデルの学習を行ってもよい。 Further, when the determination device 10 uses RNN to generate a distributed expression of a sentence, the determination device 10 may generate a distributed expression of the sentence based on the concept of each word and the order of appearance of each word. For example, in the determination device 10, the distributed expression when each word included in the sentence is input in the order of appearance is different from the distributed expression when each word included in the sentence is input in an order different from the order of appearance. The second model or the integrated model may be trained.

〔1-6.双曲空間について〕
ここで、判定装置10は、双曲空間上の分散表現を生成するのであれば、任意の空間を双曲空間として採用可能である。例えば、判定装置10は、任意の次元数を有するミンコフスキー空間上の分散表現を生成してもよい。また、判定装置10は、二葉双曲面の任意の面上の分散表現を生成してよい。
[1-6. About hyperbolic space]
Here, the determination device 10 can adopt any space as the hyperbolic space as long as it generates a distributed expression on the hyperbolic space. For example, the determination device 10 may generate a distributed representation on a Minkowski space having an arbitrary number of dimensions. Further, the determination device 10 may generate a distributed representation on any surface of the bilobed hyperboloid.

また、判定装置10は、ポアンカレ円板模型(所謂ポアンカレディスク)における任意の次元の円板上、若しくは、ポアンカレ球体模型における任意の次元の球面上の分散表現を生成してもよい。すなわち、判定装置10は、双曲幾何学が適用可能な空間上の分散表現を生成し、このような空間上において双曲幾何学を用いた距離に基づいて、情報が有する概念の類似性を判定するのであれば、任意の双曲空間を採用してよい。 Further, the determination device 10 may generate a distributed representation on a disk of any dimension in the Poincare disk model (so-called Poincare disk) or on a spherical surface of any dimension in the Poincare sphere model. That is, the determination device 10 generates a distributed representation in space to which hyperbolic geometry is applicable, and based on the distance using hyperbolic geometry in such a space, the similarity of the concepts of the information is obtained. If it is determined, any hyperbolic space may be adopted.

〔1-7.判定対象となる情報について〕
上述した例では、判定装置10は、文章が有する概念を分散表現へと変換した。しかしながら、実施形態は、これに限定されるものではない。例えば、判定装置10は、音声を複数の部分音声に分割し、分割した各部分音声を順次第1モデルに入力し、第1モデルが出力した分散表現を双曲空間上に投影してもよい。また、判定装置10は、動画像の各フレームの画像を順次第1モデルに入力し、第1モデルが出力した分散表現を双曲空間上に投影してもよい。
[1-7. Information to be judged]
In the above-mentioned example, the determination device 10 has converted the concept of the text into a distributed expression. However, the embodiments are not limited to this. For example, the determination device 10 may divide the voice into a plurality of partial voices, sequentially input each divided partial voice into the first model, and project the distributed expression output by the first model onto the hyperbolic space. .. Further, the determination device 10 may sequentially input the images of each frame of the moving image into the first model and project the distributed expression output by the first model onto the hyperbolic space.

すなわち、判定装置10は、複数の情報からなる情報群を、情報群が有する概念を示す分散表現であって、双曲空間上の分散表現へと変換するのであれば、任意の種別の情報群が有する概念を、双曲空間上の分散表現へと変換し、分散表現の双曲空間上における距離を算出することで、情報群が有する概念同士を比較してよい。また、例えば、判定装置10は、文章と動画像等、異なる種別の情報群の概念同士を比較してもよい。 That is, if the determination device 10 is a distributed representation showing the concept of the information group and is to be converted into a distributed representation on the hyperbolic space, the determination device 10 is an information group of any kind. By converting the concept possessed by the above into a distributed expression on the hyperbolic space and calculating the distance of the distributed expression on the hyperbolic space, the concepts possessed by the information groups may be compared with each other. Further, for example, the determination device 10 may compare the concepts of different types of information groups such as sentences and moving images.

〔2.判定装置の構成〕
以下、上記した提供処理を実現する判定装置10が有する機能構成の一例について説明する。図2は、実施形態に係る判定装置の構成例を示す図である。図2に示すように、判定装置10は、通信部20、記憶部30、および制御部40を有する。
[2. Judgment device configuration]
Hereinafter, an example of the functional configuration of the determination device 10 that realizes the above-mentioned provision processing will be described. FIG. 2 is a diagram showing a configuration example of the determination device according to the embodiment. As shown in FIG. 2, the determination device 10 includes a communication unit 20, a storage unit 30, and a control unit 40.

通信部20は、例えば、NIC(Network Interface Card)等によって実現される。そして、通信部20は、ネットワークNと有線または無線で接続され、入出力装置100との間で情報の送受信を行う。 The communication unit 20 is realized by, for example, a NIC (Network Interface Card) or the like. Then, the communication unit 20 is connected to the network N by wire or wirelessly, and transmits / receives information to / from the input / output device 100.

記憶部30は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。また、記憶部30は、分散表現データベース31およびモデル32を記憶する。 The storage unit 30 is realized by, for example, a semiconductor memory element such as a RAM (Random Access Memory) or a flash memory (Flash Memory), or a storage device such as a hard disk or an optical disk. Further, the storage unit 30 stores the distributed representation database 31 and the model 32.

分散表現データベース31には、文章の分散表現が登録される。例えば、図3は、実施形態に係る分散表現データベースに登録される情報の一例を示す図である。図3に示すように、分散表現データベース31には、「文章ID」、「文章データ」、「ユークリッド分散表現」、および「双曲空間分散表現」といった情報が対応付けて登録されている。 The distributed representation of sentences is registered in the distributed representation database 31. For example, FIG. 3 is a diagram showing an example of information registered in the distributed representation database according to the embodiment. As shown in FIG. 3, information such as "sentence ID", "sentence data", "Euclid distributed representation", and "hyperbolic space distributed representation" are registered in association with each other in the distributed representation database 31.

ここで、「文章ID」とは、文章を示す識別子である。また、「文章データ」とは、文章の文字列、すなわち、文章のデータである。また、「ユークリッド分散表現」とは、対応付けられた文章のユークリッド空間上における分散表現である。また、「双曲空間分散表現」とは、対応付けられた文章の双曲空間上における分散表現である。 Here, the "sentence ID" is an identifier indicating a sentence. Further, the "text data" is a character string of a text, that is, text data. Further, the "Euclidean distributed expression" is a distributed expression on the Euclidean space of the associated sentences. Further, the "hyperbolic space distributed expression" is a distributed expression on the hyperbolic space of the associated sentences.

例えば、図3に示す例では、文章ID「文章#1」、文章データ「データ#1」、ユークリッド分散表現「分散表現#1-1」、および双曲空間分散表現「分散表現#1-2」が対応付けて登録されている。このような情報は、文章ID「文章#1」が示す文章の文章データが「データ#1」であり、「データ#1」のユークリッド分散表現が「分散表現#1-1」であり、双曲空間分散表現が「分散表現#1-2」である旨を示す。 For example, in the example shown in FIG. 3, the sentence ID “sentence # 1”, the sentence data “data # 1”, the Euclidean distributed expression “distributed expression # 1-1”, and the hyperbolic space distributed expression “distributed expression # 1-2”. "Is registered in association with each other. For such information, the sentence data of the sentence indicated by the sentence ID "sentence # 1" is "data # 1", and the Euclidean distributed expression of "data # 1" is "distributed expression # 1-1". Indicates that the music space distributed expression is "distributed expression # 1-2".

なお、図3に示す例では、「文章#1」、「データ#1」、「分散表現#1-1」等といった概念的な値について記載したが、実際には、文章を識別する文字列や数値、文章を構成する文字列、分散表現となる多次元量等が登録されることとなる。また、図3に示す情報は、あくまで一例であり、分散表現データベース31には、図3に示す情報以外にも任意の情報が登録されていてよい。 In the example shown in FIG. 3, conceptual values such as "sentence # 1", "data # 1", and "distributed expression # 1-1" are described, but in reality, a character string for identifying a sentence is described. , Numerical values, character strings that make up sentences, multidimensional quantities that are distributed expressions, etc. will be registered. Further, the information shown in FIG. 3 is merely an example, and arbitrary information other than the information shown in FIG. 3 may be registered in the distributed representation database 31.

図2に戻り、説明を続ける。モデル32は、判定装置10が用いるモデルであり、例えば、文章からユークリッド空間上における分散表現を生成する第1モデルのデータである。より具体的には、記憶部30には、第1モデルを構成するノードの接続関係や、ノード間の重みである接続係数が登録される。ここで、モデル32は、例えば、人工知能ソフトウエアの一部であるプログラムモジュールとしての利用が想定される。 Returning to FIG. 2, the explanation will be continued. The model 32 is a model used by the determination device 10, and is, for example, data of a first model that generates a distributed representation on the Euclidean space from a sentence. More specifically, in the storage unit 30, the connection relationship of the nodes constituting the first model and the connection coefficient which is the weight between the nodes are registered. Here, the model 32 is assumed to be used as a program module which is a part of artificial intelligence software, for example.

例えば、モデル32は、複数の情報を含む情報群の分散表現であって、情報群の概念を双曲幾何学上の空間である双曲空間上で示す分散表現を生成し、双曲空間上の距離に基づいて、情報群同士の類似性を判定し、判定結果に基づいて、情報群を分散表現に変換するモデルを学習する学習方法で学習されるモデルの情報を含むプログラムパラメータである。例えば、モデル32は、第1モデルと関数fとの組合せにより実現される。 For example, the model 32 is a distributed representation of an information group containing a plurality of information, and generates a distributed representation that shows the concept of the information group on the hyperbolic space, which is a space on hyperbolic geometry, and generates a distributed representation on the hyperbolic space. It is a program parameter including information of a model learned by a learning method of learning a model that determines the similarity between information groups based on the distance of and converts the information group into a distributed representation based on the determination result. For example, the model 32 is realized by a combination of the first model and the function f.

また、モデル32がDNN(Deep Neural Network)等、1つまたは複数の中間層を有するニューラルネットワークで実現されるとする。この場合、モデル32が含む第1要素は、入力層または中間層が有するいずれかのノードに対応する。また、第2要素は、第1要素と対応するノードから値が伝達されるノードである次段のノードに対応する。また、第1要素の重みは、第1要素と対応するノードから第2要素と対応するノードに伝達される値に対して考慮される重みである接続係数に対応する。 Further, it is assumed that the model 32 is realized by a neural network having one or a plurality of intermediate layers such as a DNN (Deep Neural Network). In this case, the first element included in the model 32 corresponds to either the node of the input layer or the intermediate layer. Further, the second element corresponds to a node in the next stage, which is a node to which a value is transmitted from a node corresponding to the first element. Further, the weight of the first element corresponds to a connection coefficient which is a weight considered for the value transmitted from the node corresponding to the first element to the node corresponding to the second element.

判定装置10は、上述した回帰モデルやニューラルネットワーク等、任意の構造を有するモデルを用いて、分散表現の算出を行う。具体的には、モデル32は、情報群が入力された場合に、情報群が示す概念を示す分散表現を出力するように係数が設定される。 The determination device 10 calculates the distributed representation using a model having an arbitrary structure such as the regression model and the neural network described above. Specifically, in the model 32, when the information group is input, the coefficient is set so as to output a distributed representation indicating the concept indicated by the information group.

なお、上記例では、モデル32が、情報群が入力された場合に、情報群が示す概念を示す分散表現を出力するモデル(モデルXとする)である例を示した。しかし、実施形態に係るモデル32は、モデルXにデータの入出力を繰り返すことで得られる結果に基づいて生成されるモデルであってもよい。例えば、モデル32は、情報群を入力とし、モデルXが出力する分散表現を出力とするよう学習されたモデル(モデルY)であってもよい。または、モデル32は、情報群を入力とし、モデルYの出力値を出力とするよう学習されたモデルであってもよい。また、判定装置10がGAN(Generative Adversarial Networks)を用いた処理を行う場合、モデル32は、GANの一部を構成するモデルであってもよい。 In the above example, the model 32 is a model (referred to as model X) that outputs a distributed representation indicating the concept indicated by the information group when the information group is input. However, the model 32 according to the embodiment may be a model generated based on the result obtained by repeatedly inputting / outputting data to the model X. For example, the model 32 may be a model (model Y) trained to input a group of information and output a distributed representation output by the model X. Alternatively, the model 32 may be a model trained to use the information group as an input and the output value of the model Y as an output. Further, when the determination device 10 performs processing using GAN (Generative Adversarial Networks), the model 32 may be a model constituting a part of GAN.

制御部40は、コントローラ(controller)であり、例えば、CPU(Central Processing Unit)、MPU(Micro Processing Unit)等のプロセッサによって、判定装置10内部の記憶装置に記憶されている各種プログラムがRAM等を作業領域として実行されることにより実現される。また、制御部40は、コントローラ(controller)であり、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現されてもよい。また、例えば、制御部40は、プログラムモジュールであるモデル32、もしくは、モデル32を含むプログラムモジュールが有する指示に従って、判定処理を実行することとなる。 The control unit 40 is a controller, and for example, various programs stored in a storage device inside the determination device 10 by a processor such as a CPU (Central Processing Unit) or an MPU (Micro Processing Unit) store a RAM or the like. It is realized by being executed as a work area. Further, the control unit 40 is a controller, and may be realized by, for example, an integrated circuit such as an ASIC (Application Specific Integrated Circuit) or an FPGA (Field Programmable Gate Array). Further, for example, the control unit 40 will execute the determination process according to the instruction of the model 32 which is a program module or the program module including the model 32.

図2に示すように、制御部40は、生成部41、判定部42、学習部43、および提供部44を有する。生成部41は、複数の情報を含む情報群の分散表現であって、情報群の概念を双曲幾何学上の空間である双曲空間上で示す分散表現を生成する。 As shown in FIG. 2, the control unit 40 includes a generation unit 41, a determination unit 42, a learning unit 43, and a providing unit 44. The generation unit 41 generates a distributed representation of an information group including a plurality of information, and shows the concept of the information group in a hyperbolic space, which is a space on hyperbolic geometry.

例えば、生成部41は、モデルの学習処理においては、情報管理装置110から学習データとなる文章およびラベルを取得する。このような場合、生成部41は、モデル32に含まれる第1モデルを用いて、文章が有する概念をユークリッド空間上で示す分散表現を生成する。例えば、生成部41は、RNNである第1モデル対して文章に含まれる各単語、すなわち、情報群に含まれる複数の情報を順次入力することで、情報群である文章の分散表現を生成する。換言すると、生成部41は、情報群に含まれる各情報の概念と、各情報の出現順序とに基づいて、情報群の分散表現を生成する。 For example, the generation unit 41 acquires sentences and labels to be learning data from the information management device 110 in the learning process of the model. In such a case, the generation unit 41 uses the first model included in the model 32 to generate a distributed representation that shows the concept of the sentence on the Euclidean space. For example, the generation unit 41 sequentially inputs each word included in the sentence to the first model which is the RNN, that is, a plurality of information included in the information group, thereby generating a distributed expression of the sentence which is the information group. .. In other words, the generation unit 41 generates a distributed representation of the information group based on the concept of each information included in the information group and the appearance order of each information.

そして、生成部41は、関数fを用いて、生成した分散表現を双曲空間上に投影することで、文章が有する概念を双曲空間上で示す分散表現を生成する。例えば、生成部41は、双曲空間として、ポアンカレ円板模型における任意の次元の円板上、若しくは、ポアンカレ球体模型における任意の次元の球面上の分散表現を生成する。また、例えば、生成部41は、双曲空間として、ミンコフスキー空間上の分散表現を生成する。より具体的な例を挙げると、生成部41は、双曲空間として、ミンコフスキー空間の二葉双曲面が有する2つの超平面のうち、焦点軸上の座標が正となる超平面上の分散表現を生成する。そして、生成部41は、取得した文章と、生成したユークリッド空間上の分散表現と、双曲空間上の分散表現とを分散表現データベース31に登録する。 Then, the generation unit 41 uses the function f to project the generated distributed expression onto the hyperbolic space to generate a distributed expression that shows the concept of the sentence on the hyperbolic space. For example, the generation unit 41 generates a distributed representation as a hyperbolic space on a disk of any dimension in the Poincare disk model or on a spherical surface of any dimension in the Poincare sphere model. Further, for example, the generation unit 41 generates a distributed representation on the Minkowski space as a hyperbolic space. To give a more specific example, as a hyperbolic space, the generation unit 41 expresses a dispersion on the hyperplane in which the coordinates on the focal axis are positive among the two hyperplanes of the bilobed hyperboloid in the Minkowski space. Generate. Then, the generation unit 41 registers the acquired sentence, the generated distributed expression on the Euclidean space, and the distributed expression on the hyperbolic space in the distributed expression database 31.

また、生成部41は、モデルの測定処理においては、入出力装置100から利用者が入力した文章を受付ける。このような場合、生成部41は、受付けた文章に含まれる単語を順に第1モデルに入力し、第1モデルが出力したユークリッド空間上の分散表現を、関数fを用いて双曲空間上の分散表現へと変換する。なお、以下の説明では、双曲空間上の分散表現を双曲表現と記載し、利用者が入力した文章の双曲空間上の分散表現を、取得双曲表現と記載する。 Further, the generation unit 41 receives the text input by the user from the input / output device 100 in the measurement process of the model. In such a case, the generation unit 41 inputs the words included in the received sentence into the first model in order, and uses the function f to express the distributed representation on the Euclidean space output by the first model on the hyperbolic space. Convert to a distributed representation. In the following description, the distributed expression on the hyperbolic space is described as the hyperbolic expression, and the distributed expression on the hyperbolic space of the sentence input by the user is described as the acquired hyperbolic expression.

判定部42は、双曲空間上の距離に基づいて、情報群同士の類似性を判定する。例えば、判定部42は、分散表現の双曲空間上の距離に基づいて、文章同士の類似性を判定する。例えば、判定部42は、学習時においては、学習データから文章のペアを選択し、選択選択した各文章の双曲空間上の分散表現を分散表現データベース31から読出し、読み出した分散表現同士の双曲空間上の距離を算出する。そして、判定部42は、算出した距離が所定の閾値を超える場合は、選択したペアが類似しないと判定し、算出した距離が所定の閾値以下となる場合は、選択したペアが類似すると判定する。 The determination unit 42 determines the similarity between the information groups based on the distance on the hyperbolic space. For example, the determination unit 42 determines the similarity between sentences based on the distance on the hyperbolic space of the distributed expression. For example, at the time of learning, the determination unit 42 selects a pair of sentences from the learning data, reads the distributed expression on the hyperbolic space of each selected sentence from the distributed expression database 31, and reads out the distributed expressions. Calculate the distance on the music space. Then, the determination unit 42 determines that the selected pairs are not similar when the calculated distance exceeds a predetermined threshold value, and determines that the selected pairs are similar when the calculated distance is equal to or less than the predetermined threshold value. ..

また、判定部42は、測定時においては、取得双曲表現と、分散表現データベース31に登録された双曲表現との双曲空間上の距離をそれぞれ算出する。そして、判定部42は、算出した距離が最も短い双曲表現と対応する文章、すなわち、利用者から取得した文章と最も類似する文章を特定する。 Further, the determination unit 42 calculates the distance between the acquired hyperbolic expression and the hyperbolic expression registered in the distributed expression database 31 in the hyperbolic space at the time of measurement. Then, the determination unit 42 identifies a sentence corresponding to the hyperbolic expression having the shortest calculated distance, that is, a sentence most similar to the sentence acquired from the user.

学習部43は、生成された分散表現を用いて、情報群を分散表現に変換するモデルを学習する。すなわち、学習部43は、情報群が有する概念を双曲空間上で示す分散表現を用いて、モデルを学習する。 The learning unit 43 learns a model for converting an information group into a distributed representation by using the generated distributed representation. That is, the learning unit 43 learns the model by using the distributed representation that shows the concept of the information group on the hyperbolic space.

例えば、学習部43は、判定部42から選択された文章のペアと、双曲空間上の距離に基づく判定結果、すなわち、ペアが類似するか否かの判定結果を受付ける。このような場合、学習部43は、学習データのラベルに基づいて、ペアが類似する文章であるか否かを判定する。そして、学習部43は、学習データのラベルに基づく判定結果と、双曲空間上の距離に基づく判定結果とが一致するように、モデル32の学習を行う。 For example, the learning unit 43 receives a pair of sentences selected from the determination unit 42 and a determination result based on the distance in the hyperbolic space, that is, a determination result of whether or not the pairs are similar. In such a case, the learning unit 43 determines whether or not the pair is a similar sentence based on the label of the learning data. Then, the learning unit 43 learns the model 32 so that the determination result based on the label of the learning data and the determination result based on the distance on the hyperbolic space match.

例えば、学習部43は、学習データのラベルに基づく判定結果と、双曲空間上の距離に基づく判定結果とが一致しない場合は、以下の処理を実行する。例えば、学習部43は、文章のペアが類似する旨を学習データのラベルが示す場合は、各ペアの双曲表現が類似するように(双曲表現同士の距離が短くなるように)、モデル32を修正する。一方、学習部43は、文章のペアが類似しない旨を学習データのラベルが示す場合は、各ペアの双曲表現が類似するように(双曲表現同士の距離が離れるように)、モデル32を修正する。 For example, when the determination result based on the label of the learning data and the determination result based on the distance on the hyperbolic space do not match, the learning unit 43 executes the following processing. For example, when the label of the learning data indicates that the pair of sentences is similar, the learning unit 43 makes the model so that the hyperbolic expressions of each pair are similar (so that the distance between the hyperbolic expressions becomes short). Modify 32. On the other hand, when the label of the learning data indicates that the pair of sentences is not similar, the learning unit 43 sets the model 32 so that the hyperbolic expressions of each pair are similar (so that the hyperbolic expressions are separated from each other). To fix.

すなわち、学習部43は、複数の情報を含む情報群の分散表現であって、情報群の概念を双曲幾何学上の空間である双曲空間上で示す分散表現を生成する処理と、双曲空間上の距離に基づいて、情報群同士の類似性を判定する判定処理と、判定結果に基づいて、情報群を分散表現に変換するモデルを学習する処理とにより学習が行われたモデル32を生成する。このようなモデル32は、測定時における各種の処理を制御部40に実行させるプログラムモジュールに含まれる情報として利用される。 That is, the learning unit 43 is a process of generating a distributed expression that is a distributed expression of an information group containing a plurality of information and that shows the concept of the information group in a hyperbolic space that is a hyperbolic geometric space. Model 32 learned by a determination process that determines the similarity between information groups based on the distance in the hyperbolic space, and a process that learns a model that converts the information groups into a distributed representation based on the determination result. To generate. Such a model 32 is used as information included in a program module that causes the control unit 40 to execute various processes at the time of measurement.

なお、学習部43は、いかなる学習アルゴリズムを用いてモデル32を学習してもよい。例えば、学習部43は、ニューラルネットワーク(neural network)、サポートベクターマシン(support vector machine)、クラスタリング、強化学習等の学習アルゴリズムを用いてモデル32を学習してよい。 The learning unit 43 may learn the model 32 using any learning algorithm. For example, the learning unit 43 may learn the model 32 by using a learning algorithm such as a neural network, a support vector machine, clustering, or reinforcement learning.

提供部44は、判定結果に基づいて、利用者から取得した情報群と類似する他の情報群を特定し、特定した他の情報群を利用者に提供する。例えば、提供部44は、利用者から取得した文章と最も類似する文章の通知を判定部42から受付ける。このような場合、提供部44は、分散表現データベース31から、通知された文章の文章データを読出し、読み出した文章データを入出力装置100から出力させる。 Based on the determination result, the providing unit 44 identifies another information group similar to the information group acquired from the user, and provides the specified other information group to the user. For example, the providing unit 44 receives a notification of a sentence most similar to the sentence acquired from the user from the determination unit 42. In such a case, the providing unit 44 reads the text data of the notified text from the distributed expression database 31, and outputs the read text data from the input / output device 100.

〔3.数式の一例について〕
続いて、数式を用いて、判定装置10が実行する処理の一例について説明する。なお、以下の説明では、ユークリッド空間上の分散表現をv=(v,v)およびu=(u,u)で示し、双曲空間上に投影した分散表現を、チルダ付のvまたはuで示す。
[3. About an example of a formula]
Subsequently, an example of the process executed by the determination device 10 will be described using a mathematical formula. In the following description, the distributed representation on the Euclidean space is shown by v = (v 1 , v 2 ) and u = (u 1 , u 2 ), and the distributed representation projected on the hyperbolic space is shown with a tilde. Indicated by v or u.

例えば、2次元のポアンカレディスク上における分散表現を生成する例について説明する。例えば、図4は、双曲空間としてポアンカレディスクを採用する例を説明する図である。例えば、第1モデルを用いて生成された分散表現をvとすると、ポアンカレディスク上に投影された分散表現vは、以下の式(1)で表すことができる。 For example, an example of generating a distributed representation on a two-dimensional Poincare disk will be described. For example, FIG. 4 is a diagram illustrating an example of adopting a Poincare disc as a hyperbolic space. For example, assuming that the distributed representation generated by using the first model is v, the distributed representation v projected on the Poincare disk can be expressed by the following equation (1).

Figure 0007058556000001
Figure 0007058556000001

なお、式(1)では、ポアンカレディスク上に投影された分散表現vをチルダ付のvで示した。また、式(1)のaは、スケーリングファクターであり、任意の数値が採用可能である。なお、aを2分の1に設定した場合、原点と分散表現との距離が、投影前のユークリッド空間上とポアンカレディスク上とで一致することとなる(例えば、非特許文献2、p32を参照)。 In the equation (1), the distributed expression v projected on the Poincare disk is represented by v with a tilde. Further, a in the equation (1) is a scaling factor, and any numerical value can be adopted. When a is set to 1/2, the distance between the origin and the distributed representation will be the same on the Euclidean space before projection and on the Poincare disk (see, for example, Non-Patent Document 2, p32). ).

ここで、ポアンカレディスク上に投影した分散表現vおよび分散表現uの距離dは、以下の式(2)で示すことができる。 Here, the distance d between the distributed expression v and the distributed expression u projected onto the Poincare disk can be expressed by the following equation (2).

Figure 0007058556000002
Figure 0007058556000002

ここで、式(1)より、式(2)は、式(3)で示すように変形することができる。すなわち、ポアンカレディスク上に投影した分散表現vおよび分散表現uの距離dは、ユークリッド空間上の分散表現vおよび分散表現uを用いて、以下の式(3)で示すことができる。 Here, from the equation (1), the equation (2) can be transformed as shown by the equation (3). That is, the distance d between the distributed expression v and the distributed expression u projected on the Poincare disk can be expressed by the following equation (3) using the distributed expression v and the distributed expression u on the Euclidean space.

Figure 0007058556000003
Figure 0007058556000003

このような式(3)を用いることで、判定装置10は、第1モデルにより生成されたユークリッド空間上の分散表現を用いて、双曲空間上の距離を算出することができる。 By using such an equation (3), the determination device 10 can calculate the distance on the hyperbolic space by using the distributed representation on the Euclidean space generated by the first model.

ここで、理論上はポアンカレディスク上に無限の情報を埋め込むことができるが、各種の情報処理装置により実際の計算を行った場合、精度的な問題が生じてしまう。例えば、ポアンカレディスク上に投影された分散表現は、ポアンカレディスクの円周よりも外側に投影されることが許されない(すなわち、単位円からはみ出すことが許されない)が、単精度で分散表現の数値を算出した場合、投影対象となる分散表現の数によっては、分散表現がポアンカレディスクの円周よりも外側に投影されてしまう恐れがある。また、ポアンカレディスクの原点には、情報を埋め込むことができない。 Here, in theory, infinite information can be embedded in the Poincare disk, but when the actual calculation is performed by various information processing devices, an accuracy problem arises. For example, a distributed representation projected onto a Poincare disk is not allowed to be projected outside the circumference of the Poincare disk (ie, it is not allowed to extend beyond the unit circle), but it is a single-precision, distributed representation of the numerical value. When calculated, the distributed representation may be projected outside the circumference of the Poincare disk, depending on the number of distributed representations to be projected. In addition, information cannot be embedded in the origin of the Poincare disc.

一方で、ミンコフスキー空間における二葉双曲面が有する2つの超平面のうち、焦点軸上の座標が正となる超平面上においては、ポアンカレディスクと同様の性質を性質を持ちながら単位円上への閉じ込めが不要となることが知られている。そこで、判定装置10は、ミンコフスキー空間における二葉双曲面が有する2つの超平面のうち、焦点軸上の座標が正となる超平面上に、分散表現の投影を行ってもよい。 On the other hand, of the two hyperplanes of the Futaba hyperboloid in the Minkowski space, on the hyperplane where the coordinates on the focal axis are positive, the confinement on the unit circle has the same properties as the Poincare disk. Is known to be unnecessary. Therefore, the determination device 10 may project the distributed expression on the hyperplane whose coordinates on the focal axis are positive among the two hyperplanes of the two-leaf hyperboloid in the Minkowski space.

例えば、図5は、双曲空間として二葉双曲面を採用する例を説明する図である。例えば、焦点軸をz軸とした場合、図5に示すように、二葉双曲面が有する2つの超平面のうち焦点軸上の座標が正となる超平面、すなわち、z>0となる超平面(以下、「ミンコフスキー平面」と記載する。)は、以下の式(4)を満たす点の集合で示すことができる。 For example, FIG. 5 is a diagram illustrating an example of adopting a hyperbolic bicurved surface as a hyperbolic space. For example, when the focal axis is the z-axis, as shown in FIG. 5, of the two hyperplanes of the Futaba hyperboloid, the hyperplane whose coordinates on the focal axis are positive, that is, the hyperplane where z> 0. (Hereinafter referred to as "Minkowski plane") can be represented by a set of points satisfying the following equation (4).

Figure 0007058556000004
Figure 0007058556000004

このようなミンコフスキー平面上に2次元のユークリッド空間上の分散表現を投影する処理の一例について説明する。例えば、ミンコフスキー平面上の点をチルダ付のvで表し、焦点軸方向の成分をチルダ付きのvとすると、以下の式(5)で示すことができる。また、式(5)に示す各成分は、以下の式(6)を満たす。 An example of the process of projecting a distributed representation on a two-dimensional Euclidean space on such a Minkowski plane will be described. For example, if a point on the Minkowski plane is represented by v with a tilde and the component in the focal axis direction is v 0 with a tilde, it can be expressed by the following equation (5). Further, each component represented by the formula (5) satisfies the following formula (6).

Figure 0007058556000005
Figure 0007058556000005

Figure 0007058556000006
Figure 0007058556000006

このような式(6)を変形すると、以下の式(7)を得ることができる。 By modifying such an equation (6), the following equation (7) can be obtained.

Figure 0007058556000007
Figure 0007058556000007

このような式(7)を用いると、ミンコフスキー平面上の点の座標は、以下の式(8)で示すことができる。 Using such an equation (7), the coordinates of points on the Minkowski plane can be expressed by the following equation (8).

Figure 0007058556000008
Figure 0007058556000008

ここで、図1に示したように、2次元のユークリッド空間上の分散表現をミンコフスキー平面上へと投影する関数fは、以下の式(9)で示すことができる。 Here, as shown in FIG. 1, the function f that projects the distributed representation on the two-dimensional Euclidean space onto the Minkowski plane can be shown by the following equation (9).

Figure 0007058556000009
Figure 0007058556000009

また、ミンコフスキー平面上における分散表現uおよび分散表現vは、以下の式(10)、(11)で示すことができる。 Further, the dispersion expression u and the dispersion expression v on the Minkowski plane can be represented by the following equations (10) and (11).

Figure 0007058556000010
Figure 0007058556000010

Figure 0007058556000011
Figure 0007058556000011

この結果、分散表現uおよび分散表現vの擬内積は、以下の式(12)で示すことができる。ここで、数式におけるドット積の・記号は、ユークリッド空間なベクトル同士のものは普通の内積、双曲空間上のベクトル同士のものは擬内積、という使い分けを暗黙で行っている。 As a result, the pseudo-inner product of the distributed expression u and the distributed expression v can be expressed by the following equation (12). Here, the dot product symbol in the mathematical formula is implicitly used as an ordinary inner product for vectors in Euclidean space and a pseudo-inner product for vectors in hyperbolic space.

Figure 0007058556000012
Figure 0007058556000012

このため、擬内積と逆双曲線関数(arcosh)とを用いてミンコフスキー平面のベクトルである チルダ付きu、vを用いた距離として表すと、以下の式(13)で示すことができる。また、ユークリッド平面のベクトル u、vを用いた距離は、(14)で示すことができる。 Therefore, if it is expressed as a distance using tilded u and v, which are vectors of the Minkowski plane, using the pseudo-inner product and the inverse hyperbolic function (arcosh), it can be expressed by the following equation (13). Further, the distance using the vectors u and v of the Euclidean plane can be shown by (14).

Figure 0007058556000013
Figure 0007058556000013

Figure 0007058556000014
Figure 0007058556000014

判定装置10は、このような式(14)を用いて、分散表現同士のミンコフスキー平面上における距離を算出すればよい。なお、上述した式(14)は、任意の次元のミンコフスキー超平面上における距離に適用可能である。 The determination device 10 may calculate the distance between the distributed expressions on the Minkowski plane using such an equation (14). The above equation (14) can be applied to a distance on the Minkowski hyperplane of any dimension.

〔4.判定装置が実行する処理の流れの一例〕
次に、図6を用いて、判定装置10が実行する提供処理の流れの一例について説明する。図6は、実施形態に係る判定処理の流れの一例を説明するフローチャートである。まず、判定装置10は、文章を取得し(ステップS101)、文章に含まれる各単語を順に第1モデルに入力し、ユークリッド空間上の分散表現を生成する(ステップS102)。続いて、判定装置10は、分散表現を双曲空間上の分散表現に変換(投影)し(ステップS103)、双曲空間上における分散表現同士の距離を判定する(ステップS104)。そして、判定装置10は、判定結果に基づいて、モデルの学習若しくは類似文章の抽出を行い(ステップS105)、処理を終了する。
[4. An example of the flow of processing executed by the judgment device]
Next, an example of the flow of the provision process executed by the determination device 10 will be described with reference to FIG. FIG. 6 is a flowchart illustrating an example of the flow of the determination process according to the embodiment. First, the determination device 10 acquires a sentence (step S101), inputs each word included in the sentence into the first model in order, and generates a distributed expression on the Euclidean space (step S102). Subsequently, the determination device 10 converts (projects) the distributed expression into the distributed expression on the hyperbolic space (step S103), and determines the distance between the distributed expressions on the hyperbolic space (step S104). Then, the determination device 10 learns the model or extracts similar sentences based on the determination result (step S105), and ends the process.

〔5.変形例〕
上記では、判定装置10による提供処理の一例について説明した。しかしながら、実施形態は、これに限定されるものではない。以下、判定装置10が実行する判定処理のバリエーションについて説明する。
[5. Modification example]
In the above, an example of the provision process by the determination device 10 has been described. However, the embodiments are not limited to this. Hereinafter, variations of the determination process executed by the determination device 10 will be described.

〔5-1.装置構成〕
上述した例では、判定装置10は、判定装置10内で判定処理を実行した。しかしながら、実施形態は、これに限定されるものではない。例えば、判定装置10は、情報群の双曲表現を生成する生成装置により生成された双曲表現を用いて、判定処理を実行してもよい。また、判定装置10は、学習処理を実行する学習装置や、提供処理を実行する提供処理と連動することで、上述した各処理を実現してもよい。例えば、生成装置は、図2に示す生成部41を有し、判定装置10は、図2に示す判定部42のみを有し、学習装置は、図2に示す学習部43のみを有し、提供装置は、図2に示す提供部44のみを有してもよい。また、判定装置10は、分散表現データベース31を外部のストレージサーバに記憶させてもよい。
[5-1. Device configuration〕
In the above-mentioned example, the determination device 10 executes the determination process in the determination device 10. However, the embodiments are not limited to this. For example, the determination device 10 may execute the determination process using the hyperbolic expression generated by the generation device that generates the hyperbolic expression of the information group. Further, the determination device 10 may realize each of the above-mentioned processes by interlocking with the learning device that executes the learning process and the providing process that executes the providing process. For example, the generation device has the generation unit 41 shown in FIG. 2, the determination device 10 has only the determination unit 42 shown in FIG. 2, and the learning device has only the learning unit 43 shown in FIG. The providing device may have only the providing unit 44 shown in FIG. Further, the determination device 10 may store the distributed representation database 31 in an external storage server.

〔5-2.その他〕
また、上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文章中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
[5-2. others〕
Further, among the processes described in the above-described embodiment, all or a part of the processes described as being automatically performed can be manually performed, or the processes described as being manually performed can be performed. All or part of it can be done automatically by a known method. In addition, the processing procedure, specific name, and information including various data and parameters shown in the above text and drawings can be arbitrarily changed unless otherwise specified. For example, the various information shown in each figure is not limited to the information shown in the figure.

また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。 Further, each component of each of the illustrated devices is a functional concept, and does not necessarily have to be physically configured as shown in the figure. That is, the specific form of distribution / integration of each device is not limited to the one shown in the figure, and all or part of them may be functionally or physically distributed / physically in any unit according to various loads and usage conditions. Can be integrated and configured.

また、上記してきた各実施形態は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。 In addition, the above-described embodiments can be appropriately combined as long as the processing contents do not contradict each other.

〔5-3.プログラム〕
また、上述してきた実施形態に係る判定装置10は、例えば図7に示すような構成のコンピュータ1000によって実現される。図7は、ハードウェア構成の一例を示す図である。コンピュータ1000は、出力装置1010、入力装置1020と接続され、演算装置1030、一次記憶装置1040、二次記憶装置1050、出力IF(Interface)1060、入力IF1070、ネットワークIF1080がバス1090により接続された形態を有する。
[5-3. program〕
Further, the determination device 10 according to the above-described embodiment is realized by, for example, a computer 1000 having a configuration as shown in FIG. 7. FIG. 7 is a diagram showing an example of a hardware configuration. The computer 1000 is connected to the output device 1010 and the input device 1020, and the arithmetic unit 1030, the primary storage device 1040, the secondary storage device 1050, the output IF (Interface) 1060, the input IF 1070, and the network IF 1080 are connected by the bus 1090. Have.

演算装置1030は、一次記憶装置1040や二次記憶装置1050に格納されたプログラムや入力装置1020から読み出したプログラム等に基づいて動作し、各種の処理を実行する。一次記憶装置1040は、RAM等、演算装置1030が各種の演算に用いるデータを一次的に記憶するメモリ装置である。また、二次記憶装置1050は、演算装置1030が各種の演算に用いるデータや、各種のデータベースが登録される記憶装置であり、ROM(Read Only Memory)、HDD、フラッシュメモリ等により実現される。 The arithmetic unit 1030 operates based on a program stored in the primary storage device 1040 or the secondary storage device 1050, a program read from the input device 1020, or the like, and executes various processes. The primary storage device 1040 is a memory device that temporarily stores data used by the arithmetic unit 1030 for various operations such as RAM. Further, the secondary storage device 1050 is a storage device in which data used by the arithmetic unit 1030 for various calculations and various databases are registered, and is realized by a ROM (Read Only Memory), an HDD, a flash memory, or the like.

出力IF1060は、モニタやプリンタといった各種の情報を出力する出力装置1010に対し、出力対象となる情報を送信するためのインタフェースであり、例えば、USB(Universal Serial Bus)やDVI(Digital Visual Interface)、HDMI(登録商標)(High Definition Multimedia Interface)といった規格のコネクタにより実現される。また、入力IF1070は、マウス、キーボード、およびスキャナ等といった各種の入力装置1020から情報を受信するためのインタフェースであり、例えば、USB等により実現される。 The output IF 1060 is an interface for transmitting information to be output to an output device 1010 that outputs various information such as a monitor and a printer. For example, USB (Universal Serial Bus), DVI (Digital Visual Interface), and the like. It is realized by a connector of a standard such as HDMI (registered trademark) (High Definition Multimedia Interface). Further, the input IF 1070 is an interface for receiving information from various input devices 1020 such as a mouse, a keyboard, a scanner, and the like, and is realized by, for example, USB.

なお、入力装置1020は、例えば、CD(Compact Disc)、DVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等から情報を読み出す装置であってもよい。また、入力装置1020は、USBメモリ等の外付け記憶媒体であってもよい。 The input device 1020 is, for example, an optical recording medium such as a CD (Compact Disc), a DVD (Digital Versatile Disc), a PD (Phase change rewritable Disk), a magneto-optical recording medium such as an MO (Magneto-Optical disk), or a tape. It may be a device that reads information from a medium, a magnetic recording medium, a semiconductor memory, or the like. Further, the input device 1020 may be an external storage medium such as a USB memory.

ネットワークIF1080は、ネットワークNを介して他の機器からデータを受信して演算装置1030へ送り、また、ネットワークNを介して演算装置1030が生成したデータを他の機器へ送信する。 The network IF 1080 receives data from another device via the network N and sends it to the arithmetic unit 1030, and also transmits the data generated by the arithmetic unit 1030 to the other device via the network N.

演算装置1030は、出力IF1060や入力IF1070を介して、出力装置1010や入力装置1020の制御を行う。例えば、演算装置1030は、入力装置1020や二次記憶装置1050からプログラムを一次記憶装置1040上にロードし、ロードしたプログラムを実行する。 The arithmetic unit 1030 controls the output device 1010 and the input device 1020 via the output IF 1060 and the input IF 1070. For example, the arithmetic unit 1030 loads a program from the input device 1020 or the secondary storage device 1050 onto the primary storage device 1040, and executes the loaded program.

例えば、コンピュータ1000が判定装置10として機能する場合、コンピュータ1000の演算装置1030は、一次記憶装置1040上にロードされたプログラムまたはデータ(例えば、モデル32)を実行することにより、制御部40の機能を実現する。コンピュータ1000のCPU1100は、これらのプログラムまたはデータ(例えば、モデル32)を記録媒体1800から読み取って実行するが、他の例として、他の装置からネットワークNを介してこれらのプログラムを取得してもよい。 For example, when the computer 1000 functions as the determination device 10, the arithmetic unit 1030 of the computer 1000 functions as a control unit 40 by executing a program or data (for example, a model 32) loaded on the primary storage device 1040. To realize. The CPU 1100 of the computer 1000 reads these programs or data (eg, model 32) from the recording medium 1800 and executes them, but as another example, even if these programs are acquired from another device via the network N. good.

〔6.効果〕
上述したように、判定装置10は、複数の情報を含む情報群の分散表現であって、その情報群の概念を双曲幾何学上の空間である双曲空間上で示す分散表現を生成する。そして、判定装置10は、双曲空間上の距離に基づいて、情報群同士の類似性を判定する。このように、判定装置10は、ユークリッド空間ではなく双曲空間上の距離に基づいて、複数の情報からなる情報群、すなわち、ツリー形式の概念を有すると推定されうる情報群が示す概念同士を比較する。このため、判定装置10は、分散表現の比較精度を向上させることができる。
[6. effect〕
As described above, the determination device 10 generates a distributed representation of an information group containing a plurality of information, and shows the concept of the information group on the hyperbolic space, which is a space on hyperbolic geometry. .. Then, the determination device 10 determines the similarity between the information groups based on the distance on the hyperbolic space. As described above, the determination device 10 transfers the concepts indicated by the information group consisting of a plurality of information, that is, the information group presumed to have a tree-type concept, based on the distance on the hyperbolic space instead of the Euclidean space. Compare. Therefore, the determination device 10 can improve the comparison accuracy of the distributed expression.

また、判定装置10は、生成された分散表現を用いて、情報群を分散表現に変換するモデルを学習する。例えば、判定装置10は、モデルを用いて、情報群が有する概念をユークリッド空間上で示す分散表現を生成し、生成した分散表現を双曲空間上に投影することで、その情報群が有する概念を双曲空間上で示す分散表現を生成し、情報群が有する概念を双曲空間上で示す分散表現を用いて、モデルを学習する。このため、判定装置10は、情報群の双曲表現を適切に生成することができるので、分散表現の比較精度を向上させることができる。 Further, the determination device 10 learns a model for converting the information group into the distributed representation by using the generated distributed representation. For example, the determination device 10 uses a model to generate a distributed expression that shows the concept of the information group on the Euclidean space, and projects the generated distributed expression onto the hyperbolic space, so that the concept of the information group has the concept. Is generated on the hyperbolic space, and the model is trained using the distributed expression that shows the concept of the information group on the hyperbolic space. Therefore, since the determination device 10 can appropriately generate the hyperbolic expression of the information group, the comparison accuracy of the distributed expression can be improved.

また、判定装置10は、判定結果に基づいて、利用者から取得した情報群と類似する他の情報群を特定し、特定された他の情報群を利用者に提供する。このため、判定装置10は、利用者から取得した情報群と概念が類似する他の情報群を利用者に提供することができる。 Further, the determination device 10 identifies another information group similar to the information group acquired from the user based on the determination result, and provides the specified other information group to the user. Therefore, the determination device 10 can provide the user with another information group having a similar concept to the information group acquired from the user.

また、判定装置10は、再帰型ニューラルネットワークに対して情報群に含まれる複数の情報を順次入力することで、情報群の分散表現を生成する。このため、判定装置10は、情報群が有する概念を示す分散表現の比較精度を向上させることができる。 Further, the determination device 10 sequentially inputs a plurality of information included in the information group to the recurrent neural network to generate a distributed representation of the information group. Therefore, the determination device 10 can improve the comparison accuracy of the distributed representation showing the concept of the information group.

また、判定装置10は、双曲空間として、ポアンカレ円板模型における任意の次元の円板上、若しくは、ポアンカレ球体模型における任意の次元の球面上の分散表現を生成する。また、判定装置10は、双曲空間として、ミンコフスキー空間上の分散表現を生成する。例えば、判定装置10は、双曲空間として、ミンコフスキー空間の二葉双曲面が有する2つの超平面のうち、焦点軸上の座標が正となる超平面上の分散表現を生成する。このため、判定装置10は、情報群の双曲表現を適切に生成することができる。 Further, the determination device 10 generates a distributed representation as a hyperbolic space on a disk of any dimension in the Poincare disk model or on a spherical surface of any dimension in the Poincare sphere model. Further, the determination device 10 generates a distributed representation on the Minkowski space as a hyperbolic space. For example, the determination device 10 generates a distributed representation on the hyperplane in which the coordinates on the focal axis are positive among the two hyperplanes of the bilobed hyperboloid in the Minkowski space as the hyperbolic space. Therefore, the determination device 10 can appropriately generate a hyperbolic expression of the information group.

また、判定装置10は、情報群に含まれる各情報の概念と、各情報の出現順序とに基づいて、その情報群の分散表現を生成する。このため、判定装置10は、複数の情報により構成される情報群の概念、すなわち、ツリー形式の情報群の概念を示す双曲表現を適切に生成できる。 Further, the determination device 10 generates a distributed representation of the information group based on the concept of each information included in the information group and the appearance order of each information. Therefore, the determination device 10 can appropriately generate a hyperbolic expression showing the concept of an information group composed of a plurality of information, that is, the concept of a tree-type information group.

また、判定装置10は、情報群として、複数の単語を含む文章の分散表現を生成し、分散表現の双曲空間上の距離に基づいて、文章同士の類似性を判定する。このため、判定装置10は、文章の概念の比較精度を向上させることができる。 Further, the determination device 10 generates a distributed expression of a sentence including a plurality of words as an information group, and determines the similarity between the sentences based on the distance in the hyperbolic space of the distributed expression. Therefore, the determination device 10 can improve the comparison accuracy of the concept of sentences.

以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。 Although some of the embodiments of the present application have been described in detail with reference to the drawings, these are examples, and various modifications are made based on the knowledge of those skilled in the art, including the embodiments described in the disclosure column of the invention. It is possible to carry out the present invention in other modified forms.

また、上記してきた「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、生成部は、生成手段や生成回路に読み替えることができる。 Further, the above-mentioned "section, module, unit" can be read as "means" or "circuit". For example, the generation unit can be read as a generation means or a generation circuit.

10 判定装置
20 通信部
30 記憶部
31 分散表現データベース
32 モデル
40 制御部
41 生成部
42 判定部
43 学習部
44 提供部
100 入出力装置
110 情報管理装置
10 Judgment device 20 Communication unit 30 Storage unit 31 Distributed representation database 32 Model 40 Control unit 41 Generation unit 42 Judgment unit 43 Learning unit 44 Providing unit 100 Input / output device 110 Information management device

Claims (10)

複数の情報を含む情報群の分散表現であって、当該情報群の概念を双曲幾何学上の空間である双曲空間上で示す分散表現を生成する生成部と、
前記双曲空間上の距離に基づいて、情報群同士の類似性を判定する判定部と
前記生成部により生成された分散表現を用いて、前記情報群を分散表現に変換するモデルを学習する学習部
を有し、
前記生成部は、前記モデルを用いて、前記情報群が有する概念をユークリッド空間上で示す分散表現を生成し、生成した分散表現を前記双曲空間上に投影することで、当該情報群が有する概念を双曲空間上で示す分散表現を生成し、
前記学習部は、前記情報群が有する概念を双曲空間上で示す分散表現を用いて、前記モデルを学習する
ことを特徴とする判定装置。
A generator that generates a distributed representation of an information group containing a plurality of information and that shows the concept of the information group in a hyperbolic space, which is a hyperbolic space.
A determination unit that determines the similarity between information groups based on the distance on the hyperbolic space.
A learning unit that learns a model that converts the information group into a distributed representation using the distributed representation generated by the generation unit.
Have,
The generation unit uses the model to generate a distributed expression that shows the concept of the information group on the Euclidean space, and projects the generated distributed expression onto the hyperbolic space, so that the information group has the information group. Generate a distributed representation that shows the concept in hyperbolic space,
The learning unit learns the model by using a distributed representation that shows the concept of the information group on the hyperbolic space.
A judgment device characterized by the fact that.
前記判定部による判定結果に基づいて、利用者から取得した情報群と類似する他の情報群を特定する特定部と、
前記特定部により特定された他の情報群を前記利用者に提供する提供部と
を有することを特徴とする請求項1に記載の判定装置。
A specific unit that identifies another information group similar to the information group acquired from the user based on the determination result by the determination unit.
The determination device according to claim 1, further comprising a providing unit that provides the user with another information group specified by the specific unit.
前記生成部は、再帰型ニューラルネットワークに対して前記情報群に含まれる複数の情報を順次入力することで、前記情報群の分散表現を生成する
ことを特徴とする請求項1または請求項2に記載の判定装置。
The generation unit according to claim 1 or 2 , wherein a plurality of information included in the information group is sequentially input to the recurrent neural network to generate a distributed representation of the information group. The determination device described.
前記生成部は、前記双曲空間として、ポアンカレ円板模型における任意の次元の円板上、若しくは、ポアンカレ球体模型における任意の次元の球面上の分散表現を生成する
ことを特徴とする請求項1~のうちいずれか1つに記載の判定装置。
The generation unit is characterized in that, as the hyperbolic space, a distributed representation on a disk of any dimension in the Poincare disk model or on a spherical surface of any dimension in the Poincare sphere model is generated. The determination device according to any one of 3 to 3 .
前記生成部は、前記双曲空間として、ミンコフスキー空間上の分散表現を生成する
ことを特徴とする請求項1~のうちいずれか1つに記載の判定装置。
The determination device according to any one of claims 1 to 4 , wherein the generation unit generates a distributed representation on a Minkowski space as the hyperbolic space.
前記生成部は、前記双曲空間として、ミンコフスキー空間の二葉双曲面が有する2つの超平面のうち、焦点軸上の座標が正となる超平面上の分散表現を生成する
ことを特徴とする請求項に記載の判定装置。
The generation unit is characterized in that, as the hyperbolic space, it generates a distributed representation on a hyperplane in which the coordinates on the focal axis are positive among the two hyperplanes of the bilobed hyperboloid in the Minkowski space. Item 5. The determination device according to Item 5.
前記生成部は、前記情報群に含まれる各情報の概念と、各情報の出現順序とに基づいて、当該情報群の分散表現を生成する
ことを特徴とする請求項1~のうちいずれか1つに記載の判定装置。
Any one of claims 1 to 6 , wherein the generation unit generates a distributed representation of the information group based on the concept of each information included in the information group and the appearance order of each information. The determination device according to one.
前記生成部は、前記情報群として、複数の単語を含む文章の分散表現を生成し、
前記判定部は、前記分散表現の前記双曲空間上の距離に基づいて、文章同士の類似性を判定する
ことを特徴とする請求項1~のうちいずれか1つに記載の判定装置。
The generation unit generates a distributed expression of a sentence including a plurality of words as the information group.
The determination device according to any one of claims 1 to 7 , wherein the determination unit determines similarity between sentences based on the distance of the distributed expression on the hyperbolic space.
判定装置が実行する判定方法であって、
複数の情報を含む情報群の分散表現であって、当該情報群の概念を双曲幾何学上の空間である双曲空間上で示す分散表現を生成する生成工程と、
前記双曲空間上の距離に基づいて、情報群同士の類似性を判定する判定工程と
前記生成工程により生成された分散表現を用いて、前記情報群を分散表現に変換するモデルを学習する学習工程
を有し、
前記生成工程は、前記モデルを用いて、前記情報群が有する概念をユークリッド空間上で示す分散表現を生成し、生成した分散表現を前記双曲空間上に投影することで、当該情報群が有する概念を双曲空間上で示す分散表現を生成し、
前記学習工程は、前記情報群が有する概念を双曲空間上で示す分散表現を用いて、前記モデルを学習する
ことを特徴とする判定方法。
It is a judgment method executed by the judgment device.
A generation process for generating a distributed representation of an information group containing a plurality of information and showing the concept of the information group on a hyperbolic space, which is a space on hyperbolic geometry.
A determination step for determining similarity between information groups based on the distance on the hyperbolic space.
A learning process for learning a model that converts the information group into a distributed representation using the distributed representation generated by the generation step.
Have,
The generation step uses the model to generate a distributed expression that shows the concept of the information group on the Euclidean space, and projects the generated distributed expression onto the hyperbolic space, so that the information group has the information group. Generate a distributed representation that shows the concept in hyperbolic space,
In the learning step, the model is learned using a distributed representation that shows the concept of the information group on the hyperbolic space.
Judgment method characterized by that.
複数の情報を含む情報群の分散表現であって、当該情報群の概念を双曲幾何学上の空間である双曲空間上で示す分散表現を生成する生成手順と、
前記双曲空間上の距離に基づいて、情報群同士の類似性を判定する判定手順と
前記生成手順により生成された分散表現を用いて、前記情報群を分散表現に変換するモデルを学習する学習手順
を有し、
前記生成手順は、前記モデルを用いて、前記情報群が有する概念をユークリッド空間上で示す分散表現を生成し、生成した分散表現を前記双曲空間上に投影することで、当該情報群が有する概念を双曲空間上で示す分散表現を生成し、
前記学習手順は、前記情報群が有する概念を双曲空間上で示す分散表現を用いて、前記モデルを学習する
ことをコンピュータに実行させるための判定プログラム。
A generation procedure for generating a distributed representation of an information group containing a plurality of information and showing the concept of the information group on a hyperbolic space, which is a space on hyperbolic geometry.
Judgment procedure for determining similarity between information groups based on the distance on the hyperbolic space
A learning procedure for learning a model that converts the information group into a distributed representation using the distributed representation generated by the generation procedure.
Have,
The generation procedure uses the model to generate a distributed expression that shows the concept of the information group on the Euclidean space, and projects the generated distributed expression onto the hyperbolic space, so that the information group has the information group. Generate a distributed representation that shows the concept in hyperbolic space,
In the learning procedure, the model is learned using a distributed representation that shows the concept of the information group on the hyperbolic space.
A judgment program that lets a computer do things .
JP2018099912A 2018-05-24 2018-05-24 Judgment device, judgment method, and judgment program Active JP7058556B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018099912A JP7058556B2 (en) 2018-05-24 2018-05-24 Judgment device, judgment method, and judgment program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018099912A JP7058556B2 (en) 2018-05-24 2018-05-24 Judgment device, judgment method, and judgment program

Publications (2)

Publication Number Publication Date
JP2019204362A JP2019204362A (en) 2019-11-28
JP7058556B2 true JP7058556B2 (en) 2022-04-22

Family

ID=68727006

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018099912A Active JP7058556B2 (en) 2018-05-24 2018-05-24 Judgment device, judgment method, and judgment program

Country Status (1)

Country Link
JP (1) JP7058556B2 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7425755B2 (en) 2019-02-07 2024-01-31 株式会社Preferred Networks Conversion method, training device and inference device
JP7342972B2 (en) * 2019-12-19 2023-09-12 富士通株式会社 Information processing program, information processing method, and information processing device
CN115668385A (en) * 2020-06-05 2023-01-31 富士通株式会社 Information processing program, information processing method, and information processing apparatus

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015169951A (en) 2014-03-04 2015-09-28 株式会社デンソーアイティーラボラトリ information processing apparatus, information processing method, and program
US20160196258A1 (en) 2015-01-04 2016-07-07 Huawei Technologies Co., Ltd. Semantic Similarity Evaluation Method, Apparatus, and System
JP2016207141A (en) 2015-04-28 2016-12-08 ヤフー株式会社 Summary generation device, summary generation method, and summary generation program
JP2018045505A (en) 2016-09-15 2018-03-22 ヤフー株式会社 Determination device, determination method, and determination program

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015169951A (en) 2014-03-04 2015-09-28 株式会社デンソーアイティーラボラトリ information processing apparatus, information processing method, and program
US20160196258A1 (en) 2015-01-04 2016-07-07 Huawei Technologies Co., Ltd. Semantic Similarity Evaluation Method, Apparatus, and System
JP2016207141A (en) 2015-04-28 2016-12-08 ヤフー株式会社 Summary generation device, summary generation method, and summary generation program
JP2018045505A (en) 2016-09-15 2018-03-22 ヤフー株式会社 Determination device, determination method, and determination program

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
橋本 隼人,外1名,「Poincare Embeddingを用いた単語の埋め込みベクトルの獲得」,言語処理学会第24回年次大会 発表論文集 [online],言語処理学会,2018年03月05日,p.1187-1190,[令和3年9月6日検索],インターネット<URL:http://www.anlp.jp/proceedings/annual_meeting/2018/pdf_dir/C6-2.pdf>
白川 達也,「実ユークリッド空間を超えた埋込み手法の新展開」,人工知能,一般社団法人 人工知能学会,2018年03月01日,第33巻 第2号,p.163-169

Also Published As

Publication number Publication date
JP2019204362A (en) 2019-11-28

Similar Documents

Publication Publication Date Title
US11521110B2 (en) Learning apparatus, learning method, and non-transitory computer readable storage medium
JP7058556B2 (en) Judgment device, judgment method, and judgment program
CA2902015C (en) Method and system for solving an optimization problem involving graph similarity
KR102264234B1 (en) A document classification method with an explanation that provides words and sentences with high contribution in document classification
JP6199517B1 (en) Determination apparatus, determination method, and determination program
US11669687B1 (en) Systems and methods for natural language processing (NLP) model robustness determination
CN115244587A (en) Efficient ground truth annotation
JP7032233B2 (en) Information processing equipment, information processing methods, and information processing programs
Kong et al. On the performance of oversampling techniques for class imbalance problems
US20190164083A1 (en) Categorical Data Transformation and Clustering for Machine Learning using Natural Language Processing
JP6975610B2 (en) Learning device and learning method
JP2022088540A (en) Method for generating user interest image, device, electronic apparatus and storage medium
JP6964481B2 (en) Learning equipment, programs and learning methods
JP6680655B2 (en) Learning device and learning method
JP6910873B2 (en) Specific device and specific method
JP2019021218A (en) Learning device, program parameter, learning method and model
JP6705506B2 (en) Learning program, information processing apparatus, and learning method
JP7071213B2 (en) Information processing equipment, information processing methods, and information processing programs
JP7017478B2 (en) Output device, output method and output program
JP2022185799A (en) Information processing program, information processing method and information processing device
JP6979899B2 (en) Generator, learning device, generation method, learning method, generation program, and learning program
JP7265837B2 (en) Learning device and learning method
JP6963988B2 (en) Providing equipment, providing method and providing program
JP6680656B2 (en) Judgment device and judgment method
JP7054645B2 (en) Generator, generation method, generation program and program parameters

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20191101

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20191108

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200917

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210820

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210914

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211108

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220329

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220412

R150 Certificate of patent or registration of utility model

Ref document number: 7058556

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350