JP2019204362A - 判定装置、判定方法、判定プログラムおよびプログラムパラメータ - Google Patents
判定装置、判定方法、判定プログラムおよびプログラムパラメータ Download PDFInfo
- Publication number
- JP2019204362A JP2019204362A JP2018099912A JP2018099912A JP2019204362A JP 2019204362 A JP2019204362 A JP 2019204362A JP 2018099912 A JP2018099912 A JP 2018099912A JP 2018099912 A JP2018099912 A JP 2018099912A JP 2019204362 A JP2019204362 A JP 2019204362A
- Authority
- JP
- Japan
- Prior art keywords
- information
- space
- determination
- distributed
- hyperbolic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 53
- 230000014509 gene expression Effects 0.000 claims abstract description 151
- 239000006185 dispersion Substances 0.000 claims description 14
- 238000013528 artificial neural network Methods 0.000 claims description 8
- 238000009826 distribution Methods 0.000 claims description 2
- 230000008569 process Effects 0.000 description 30
- 238000003860 storage Methods 0.000 description 19
- 238000012545 processing Methods 0.000 description 18
- 238000010586 diagram Methods 0.000 description 12
- 230000006870 function Effects 0.000 description 12
- 230000010365 information processing Effects 0.000 description 11
- 238000004364 calculation method Methods 0.000 description 5
- 238000005259 measurement Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 239000013598 vector Substances 0.000 description 4
- 238000013527 convolutional neural network Methods 0.000 description 3
- 238000007796 conventional method Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Landscapes
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
〔1−1.判定装置の一例〕
まず、図1を用いて、判定装置が実行する処理の一例について説明する。なお、以下の説明では、判定装置が実行する処理の一例として、文章同士の概念が類似するか否かを判定する処理の一例について記載するが、実施形態は、これに限定されるものではない。例えば、以下に説明する判定装置10は、文章以外にも、音声データ等、複数の情報(以下、「情報群」と記載する場合がある。)により構成される情報であれば、任意の情報同士が類似するか否かを判定して良い。
ここで、比較対象となる情報を分散表現に変換し、分散表現同士の比較結果に基づいて情報の類似性を判断する従来技術の一例について説明する。また、以下の説明では、文章の分散表現を生成する従来技術の一例について説明する。
ここで、文章の概念を考えると、文章に含まれる単語によりツリー状に分岐していく体系を有しているとも考えられる。このため、文章の分散表現を双曲空間上で学習した場合、文章の概念を精度良く学習することができると考えられる。また、双曲空間上で分散表現同士を比較した場合、文章の概念を精度良く比較することができると考えられる。
以下、図1を用いて、判定装置10が実行する処理の一例を説明する。まず、判定装置10は、情報管理装置110から学習データとなる文章を取得する(ステップS1)。例えば、判定装置10は、複数の単語からなる複数の文章と、各文章の類似性を示すラベル情報とを取得する。このような場合、判定装置10は、RNNやDSSMといったモデルを用いて、文章を分散表現に変換する(ステップS2)。
ここで、図1に示す例では、文章をユークリッド空間上の分散表現に変換する第1モデルを用いて、ユークリッド空間上の分散表現を取得し、関数fを用いて、ユークリッド空間上の分散表現を双曲空間上に投影した。しかしながら、実施形態は、これに限定されるものではない。
ここで、判定装置10は、双曲空間上の分散表現を生成するのであれば、任意の空間を双曲空間として採用可能である。例えば、判定装置10は、任意の次元数を有するミンコフスキー空間上の分散表現を生成してもよい。また、判定装置10は、二葉双曲面の任意の面上の分散表現を生成してよい。
上述した例では、判定装置10は、文章が有する概念を分散表現へと変換した。しかしながら、実施形態は、これに限定されるものではない。例えば、判定装置10は、音声を複数の部分音声に分割し、分割した各部分音声を順次第1モデルに入力し、第1モデルが出力した分散表現を双曲空間上に投影してもよい。また、判定装置10は、動画像の各フレームの画像を順次第1モデルに入力し、第1モデルが出力した分散表現を双曲空間上に投影してもよい。
以下、上記した提供処理を実現する判定装置10が有する機能構成の一例について説明する。図2は、実施形態に係る判定装置の構成例を示す図である。図2に示すように、判定装置10は、通信部20、記憶部30、および制御部40を有する。
続いて、数式を用いて、判定装置10が実行する処理の一例について説明する。なお、以下の説明では、ユークリッド空間上の分散表現をv=(v1,v2)およびu=(u1,u2)で示し、双曲空間上に投影した分散表現を、チルダ付のvまたはuで示す。
次に、図6を用いて、判定装置10が実行する提供処理の流れの一例について説明する。図6は、実施形態に係る判定処理の流れの一例を説明するフローチャートである。まず、判定装置10は、文章を取得し(ステップS101)、文章に含まれる各単語を順に第1モデルに入力し、ユークリッド空間上の分散表現を生成する(ステップS102)。続いて、判定装置10は、分散表現を双曲空間上の分散表現に変換(投影)し(ステップS103)、双曲空間上における分散表現同士の距離を判定する(ステップS104)。そして、判定装置10は、判定結果に基づいて、モデルの学習若しくは類似文章の抽出を行い(ステップS105)、処理を終了する。
上記では、判定装置10による提供処理の一例について説明した。しかしながら、実施形態は、これに限定されるものではない。以下、判定装置10が実行する判定処理のバリエーションについて説明する。
上述した例では、判定装置10は、判定装置10内で判定処理を実行した。しかしながら、実施形態は、これに限定されるものではない。例えば、判定装置10は、情報群の双曲表現を生成する生成装置により生成された双曲表現を用いて、判定処理を実行してもよい。また、判定装置10は、学習処理を実行する学習装置や、提供処理を実行する提供処理と連動することで、上述した各処理を実現してもよい。例えば、生成装置は、図2に示す生成部41を有し、判定装置10は、図2に示す判定部42のみを有し、学習装置は、図2に示す学習部43のみを有し、提供装置は、図2に示す提供部44のみを有してもよい。また、判定装置10は、分散表現データベース31を外部のストレージサーバに記憶させてもよい。
また、上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文章中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
また、上述してきた実施形態に係る判定装置10は、例えば図7に示すような構成のコンピュータ1000によって実現される。図7は、ハードウェア構成の一例を示す図である。コンピュータ1000は、出力装置1010、入力装置1020と接続され、演算装置1030、一次記憶装置1040、二次記憶装置1050、出力IF(Interface)1060、入力IF1070、ネットワークIF1080がバス1090により接続された形態を有する。
上述したように、判定装置10は、複数の情報を含む情報群の分散表現であって、その情報群の概念を双曲幾何学上の空間である双曲空間上で示す分散表現を生成する。そして、判定装置10は、双曲空間上の距離に基づいて、情報群同士の類似性を判定する。このように、判定装置10は、ユークリッド空間ではなく双曲空間上の距離に基づいて、複数の情報からなる情報群、すなわち、ツリー形式の概念を有すると推定されうる情報群が示す概念同士を比較する。このため、判定装置10は、分散表現の比較精度を向上させることができる。
20 通信部
30 記憶部
31 分散表現データベース
32 モデル
40 制御部
41 生成部
42 判定部
43 学習部
44 提供部
100 入出力装置
110 情報管理装置
Claims (13)
- 複数の情報を含む情報群の分散表現であって、当該情報群の概念を双曲幾何学上の空間である双曲空間上で示す分散表現を生成する生成部と、
前記双曲空間上の距離に基づいて、情報群同士の類似性を判定する判定部と
を有することを特徴とする判定装置。 - 前記生成部により生成された分散表現を用いて、前記情報群を分散表現に変換するモデルを学習する学習部
を有することを特徴とする請求項1に記載の判定装置。 - 前記生成部は、前記モデルを用いて、前記情報群が有する概念をユークリッド空間上で示す分散表現を生成し、生成した分散表現を前記双曲空間上に投影することで、当該情報群が有する概念を双曲空間上で示す分散表現を生成し、
前記学習部は、前記情報群が有する概念を双曲空間上で示す分散表現を用いて、前記モデルを学習する
ことを特徴とする請求項2に記載の判定装置。 - 前記判定部による判定結果に基づいて、利用者から取得した情報群と類似する他の情報群を特定する特定部と、
前記特定部により特定された他の情報群を前記利用者に提供する提供部と
を有することを特徴とする請求項1〜3のうちいずれか1つに記載の判定装置。 - 前記生成部は、再帰型ニューラルネットワークに対して前記情報群に含まれる複数の情報を順次入力することで、前記情報群の分散表現を生成する
ことを特徴とする請求項1〜4のうちいずれか1つに記載の判定装置。 - 前記生成部は、前記双曲空間として、ポアンカレ円板模型における任意の次元の円板上、若しくは、ポアンカレ球体模型における任意の次元の球面上の分散表現を生成する
ことを特徴とする請求項1〜5のうちいずれか1つに記載の判定装置。 - 前記生成部は、前記双曲空間として、ミンコフスキー空間上の分散表現を生成する
ことを特徴とする請求項1〜6のうちいずれか1つに記載の判定装置。 - 前記生成部は、前記双曲空間として、ミンコフスキー空間の二葉双曲面が有する2つの超平面のうち、焦点軸上の座標が正となる超平面上の分散表現を生成する
ことを特徴とする請求項7に記載の判定装置。 - 前記生成部は、前記情報群に含まれる各情報の概念と、各情報の出現順序とに基づいて、当該情報群の分散表現を生成する
ことを特徴とする請求項1〜8のうちいずれか1つに記載の判定装置。 - 前記生成部は、前記情報群として、複数の単語を含む文章の分散表現を生成し、
前記判定部は、前記分散表現の前記双曲空間上の距離に基づいて、文章同士の類似性を判定する
ことを特徴とする請求項1〜9のうちいずれか1つに記載の判定装置。 - 判定装置が実行する判定方法であって、
複数の情報を含む情報群の分散表現であって、当該情報群の概念を双曲幾何学上の空間である双曲空間上で示す分散表現を生成する生成工程と、
前記双曲空間上の距離に基づいて、情報群同士の類似性を判定する判定工程と
を含むことを特徴とする判定方法。 - 複数の情報を含む情報群の分散表現であって、当該情報群の概念を双曲幾何学上の空間である双曲空間上で示す分散表現を生成する生成手順と、
前記双曲空間上の距離に基づいて、情報群同士の類似性を判定する判定手順と
をコンピュータに実行させるための判定プログラム。 - 複数の情報を含む情報群の分散表現であって、当該情報群の概念を双曲幾何学上の空間である双曲空間上で示す分散表現を生成する生成工程と、
前記双曲空間上の距離に基づいて、情報群同士の類似性を判定する判定工程と、
前記判定工程による判定結果に基づいて、前記情報群を分散表現に変換するモデルを学習する学習工程と
を含むことを特徴とする学習方法で学習されるモデルの情報を含むプログラムパラメータ。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018099912A JP7058556B2 (ja) | 2018-05-24 | 2018-05-24 | 判定装置、判定方法、および判定プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018099912A JP7058556B2 (ja) | 2018-05-24 | 2018-05-24 | 判定装置、判定方法、および判定プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019204362A true JP2019204362A (ja) | 2019-11-28 |
JP7058556B2 JP7058556B2 (ja) | 2022-04-22 |
Family
ID=68727006
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018099912A Active JP7058556B2 (ja) | 2018-05-24 | 2018-05-24 | 判定装置、判定方法、および判定プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7058556B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021124535A1 (ja) * | 2019-12-19 | 2021-06-24 | 富士通株式会社 | 情報処理プログラム、情報処理方法および情報処理装置 |
WO2021245926A1 (ja) | 2020-06-05 | 2021-12-09 | 富士通株式会社 | 情報処理プログラム、情報処理方法および情報処理装置 |
JP7425755B2 (ja) | 2019-02-07 | 2024-01-31 | 株式会社Preferred Networks | 変換方法、訓練装置及び推論装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015169951A (ja) * | 2014-03-04 | 2015-09-28 | 株式会社デンソーアイティーラボラトリ | 情報処理装置、情報処理方法、およびプログラム |
US20160196258A1 (en) * | 2015-01-04 | 2016-07-07 | Huawei Technologies Co., Ltd. | Semantic Similarity Evaluation Method, Apparatus, and System |
JP2016207141A (ja) * | 2015-04-28 | 2016-12-08 | ヤフー株式会社 | 要約生成装置、要約生成方法、及び要約生成プログラム |
JP2018045505A (ja) * | 2016-09-15 | 2018-03-22 | ヤフー株式会社 | 判定装置、判定方法および判定プログラム |
-
2018
- 2018-05-24 JP JP2018099912A patent/JP7058556B2/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015169951A (ja) * | 2014-03-04 | 2015-09-28 | 株式会社デンソーアイティーラボラトリ | 情報処理装置、情報処理方法、およびプログラム |
US20160196258A1 (en) * | 2015-01-04 | 2016-07-07 | Huawei Technologies Co., Ltd. | Semantic Similarity Evaluation Method, Apparatus, and System |
JP2016207141A (ja) * | 2015-04-28 | 2016-12-08 | ヤフー株式会社 | 要約生成装置、要約生成方法、及び要約生成プログラム |
JP2018045505A (ja) * | 2016-09-15 | 2018-03-22 | ヤフー株式会社 | 判定装置、判定方法および判定プログラム |
Non-Patent Citations (2)
Title |
---|
橋本 隼人,外1名: "「Poincare Embeddingを用いた単語の埋め込みベクトルの獲得」", 言語処理学会第24回年次大会 発表論文集 [ONLINE], JPN6021035942, 5 March 2018 (2018-03-05), pages 1187 - 1190, ISSN: 0004592893 * |
白川 達也: "「実ユークリッド空間を超えた埋込み手法の新展開」", 人工知能, vol. 第33巻 第2号, JPN6021035941, 1 March 2018 (2018-03-01), pages 163 - 169, ISSN: 0004592892 * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7425755B2 (ja) | 2019-02-07 | 2024-01-31 | 株式会社Preferred Networks | 変換方法、訓練装置及び推論装置 |
WO2021124535A1 (ja) * | 2019-12-19 | 2021-06-24 | 富士通株式会社 | 情報処理プログラム、情報処理方法および情報処理装置 |
JPWO2021124535A1 (ja) * | 2019-12-19 | 2021-06-24 | ||
JP7342972B2 (ja) | 2019-12-19 | 2023-09-12 | 富士通株式会社 | 情報処理プログラム、情報処理方法および情報処理装置 |
WO2021245926A1 (ja) | 2020-06-05 | 2021-12-09 | 富士通株式会社 | 情報処理プログラム、情報処理方法および情報処理装置 |
CN115668385A (zh) * | 2020-06-05 | 2023-01-31 | 富士通株式会社 | 信息处理程序、信息处理方法以及信息处理装置 |
JP7371779B2 (ja) | 2020-06-05 | 2023-10-31 | 富士通株式会社 | 情報処理プログラム、情報処理方法および情報処理装置 |
Also Published As
Publication number | Publication date |
---|---|
JP7058556B2 (ja) | 2022-04-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11521110B2 (en) | Learning apparatus, learning method, and non-transitory computer readable storage medium | |
WO2020182122A1 (zh) | 用于生成文本匹配模型的方法和装置 | |
JP2019008742A (ja) | 学習装置、生成装置、学習方法、生成方法、学習プログラム、および生成プログラム | |
JP7058556B2 (ja) | 判定装置、判定方法、および判定プログラム | |
JP7032233B2 (ja) | 情報処理装置、情報処理方法、および情報処理プログラム | |
Kong et al. | On the performance of oversampling techniques for class imbalance problems | |
US20190164083A1 (en) | Categorical Data Transformation and Clustering for Machine Learning using Natural Language Processing | |
JP6975610B2 (ja) | 学習装置および学習方法 | |
JP2022088540A (ja) | ユーザ興味画像の生成方法、装置、電子機器及び記憶媒体 | |
JP2018156418A (ja) | 修正装置、修正方法および修正プログラム | |
WO2022174499A1 (zh) | 文本韵律边界预测的方法、装置、设备及存储介质 | |
JP6964481B2 (ja) | 学習装置、プログラムおよび学習方法 | |
JP6680655B2 (ja) | 学習装置および学習方法 | |
JP6910873B2 (ja) | 特定装置および特定方法 | |
JP2019021218A (ja) | 学習装置、プログラムパラメータ、学習方法およびモデル | |
JP6705506B2 (ja) | 学習プログラム、情報処理装置および学習方法 | |
JP7265837B2 (ja) | 学習装置および学習方法 | |
WO2006106740A1 (ja) | 情報処理装置および方法、並びにプログラム記録媒体 | |
JP2022185799A (ja) | 情報処理プログラム、情報処理方法および情報処理装置 | |
JP6979899B2 (ja) | 生成装置、学習装置、生成方法、学習方法、生成プログラム、及び学習プログラム | |
JP2018045630A (ja) | 情報処理装置、情報処理方法、およびプログラム | |
JP7054645B2 (ja) | 生成装置、生成方法、生成プログラムおよびプログラムパラメータ | |
JP6529559B2 (ja) | 学習装置、生成装置、学習方法、生成方法、学習プログラム、生成プログラム、及びモデル | |
JP2017167986A (ja) | 判定装置、および判定方法 | |
JP2019200738A (ja) | 情報処理装置、情報処理方法、および情報処理プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20191101 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20191108 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200917 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210820 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210914 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20211108 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220329 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220412 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7058556 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |