JP7265837B2 - 学習装置および学習方法 - Google Patents
学習装置および学習方法 Download PDFInfo
- Publication number
- JP7265837B2 JP7265837B2 JP2017141170A JP2017141170A JP7265837B2 JP 7265837 B2 JP7265837 B2 JP 7265837B2 JP 2017141170 A JP2017141170 A JP 2017141170A JP 2017141170 A JP2017141170 A JP 2017141170A JP 7265837 B2 JP7265837 B2 JP 7265837B2
- Authority
- JP
- Japan
- Prior art keywords
- sentence
- word
- vector
- geodesic
- learning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 46
- 239000013598 vector Substances 0.000 claims description 212
- 230000008569 process Effects 0.000 claims description 34
- 239000000284 extract Substances 0.000 claims description 16
- 239000011159 matrix material Substances 0.000 claims description 13
- 238000000605 extraction Methods 0.000 claims description 10
- 238000012545 processing Methods 0.000 description 27
- 238000005259 measurement Methods 0.000 description 15
- 238000010586 diagram Methods 0.000 description 14
- 230000010365 information processing Effects 0.000 description 13
- 230000006870 function Effects 0.000 description 11
- 230000004044 response Effects 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000000877 morphologic effect Effects 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000013179 statistical model Methods 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Images
Landscapes
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
〔1-1.学習装置の一例〕
まず、図1を用いて、学習装置が実行する処理の一例について説明する。図1は、実施形態に係る学習装置が実行する学習処理の一例を示す図である。図1では、学習装置10は、以下に説明する学習処理を実行する情報処理装置であり、例えば、サーバ装置やクラウドシステム等により実現される。
ここで、ある事柄についてたとえ話を生成することができるのであれば、その事柄の概念を理解しているとも考えられる。また、かかる事柄の抽象化度が高い程、事柄をより良く理解しているとも考えられる。このため、学習装置10が事柄をより高度に抽象化できるのであれば、その事柄の概念を理解している(事柄の概念を学習している)と言うことができる。また、学習装置10が、ある事柄の概念をたとえ話にすることができるのであれば、利用者にその事柄をより容易に理解させることができるとも考えられる。
ここで、学習装置10は、上述したたとえ話を出力する処理を任意の目的で実行してよい。例えば、学習装置10は、利用者に概念を教示するために、上述した学習処理や測定処理を利用してもよい。より具体的な例を挙げると、学習装置10は、利用者が知識を有する分野でのたとえ話を生成することで、効率的に人に概念を理解させてもよい。
なお、学習装置10は、任意の数の単語を含む文章を測地線空間上に落とし込んでよい。例えば、学習装置10は、モデルを用いて、文章に含まれるn個の単語のベクトルを算出する。そして、学習装置10は、2~nまでの自然数をiとおいた場合に、i-1番目に出現する単語のベクトルの先にその単語のベクトルを移動したベクトルがi番目に出現する単語のベクトルとなるように、モデルの学習を行えばよい。
ここで、学習装置10は、フィッシャー情報行列を用いて、測地線同士の比較を行ってもよい。より具体的には、学習装置10は、利用者から受付けた文章の測地線をパラメータとするフィッシャー情報行列と、他の文章の測地線をパラメータとするフィッシャー情報行列との類似性に基づいて、利用者から受付けた文章と同様の構造を有する文章を特定してもよい。すなわち、学習装置10は、測地線ξを有する確率密度関数の統計モデルにおける統計的不変性同士の比較結果に基づいて、測地線の比較を行ってもよい。
ここで、上述した学習処理や測地線同士の比較は、以下の数式によって表すことができる。例えば、情報幾何学において、測地線ξの点pと点p’とをつなぐ接続は、以下の式(1)で表すことができる。ここで、式(1)では、点p’のダッシュをチルダで示した。
次に、図1を用いて、学習装置10が実行する学習処理および測定処理の一例について説明する。まず、学習装置10は、正解データとなる文章を用いた学習処理を実行する。具体的には、学習装置10は、所定のモデルを用いて、文章に含まれる各単語をベクトル化する(ステップS1)。例えば、学習装置10は、文章#1から単語#1-1、単語#1-2、単語#1-3を抽出した場合は、各単語をベクトル#1-1、ベクトル#1-2、ベクトル#1-3へとベクトル化する。
以下、上記した学習処理を実現する学習装置10が有する機能構成の一例について説明する。図2は、実施形態に係る学習装置の構成例を示す図である。図2に示すように、学習装置10は、通信部20、記憶部30、および制御部40を有する。
次に、図7を用いて、学習装置10が実行する学習処理の流れの一例について説明する。図7は、実施形態に係る学習処理の流れの一例を説明するフローチャートである。まず、学習装置10は、正解データとなる文章を取得すると(ステップS101)、取得した文章から単語群を抽出する(ステップS102)。そして、学習装置10は、単語群の各単語をベクトル化し(ステップS103)、各単語のベクトルが同じ測地線の接ベクトルとなるように、モデルの学習を行い(ステップS104)、処理を終了する。
上記では、学習装置10による学習処理および測定処理の一例について説明した。しかしながら、実施形態は、これに限定されるものではない。以下、学習装置10が実行する学習処理のバリエーションについて説明する。
上述した例では、学習装置10は、正解データとして受付けた文章の各単語をベクトル化し、各単語のベクトルを接ベクトルとする測地線を算出した。ここで、学習装置10は、所定の構造を有する文章であれば、任意の文章を正解データとして採用してよい。
上述した例では、学習装置10は、学習装置10内で学習処理および測定処理を実行した。しかしながら、実施形態は、これに限定されるものではない。例えば、学習装置10は、学習処理のみを実行し、測定処理については、他の装置が実行してもよい。例えば、学習装置10が上述した学習処理によって生成した測地線空間をプログラムパラメータとして用いるプログラムを実行することで、学習装置10以外の情報処理装置が、上述した測定処理を実現してもよい。また、学習装置10は、正解データデータベース31や測地線データベース33を外部のストレージサーバに記憶させてもよい。
また、上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文章中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
また、上述してきた実施形態に係る学習装置10は、例えば図9に示すような構成のコンピュータ1000によって実現される。図9は、ハードウェア構成の一例を示す図である。コンピュータ1000は、出力装置1010、入力装置1020と接続され、演算装置1030、一次記憶装置1040、二次記憶装置1050、出力IF(Interface)1060、入力IF1070、ネットワークIF1080がバス1090により接続された形態を有する。
上述したように、学習装置10は、所定の構造を有する文章に含まれる単語群を抽出する。そして、学習装置10は、同一の文章から抽出された単語群に含まれる各単語の概念を示すベクトルが、その文章と対応するベクトルの合成を構成するように、単語から単語の概念を示すベクトルを生成するモデルを学習する。例えば、学習装置10は、文章と対応するベクトルとして、文章と対応する測地線の接ベクトルを構成するように、各単語の概念を示すベクトルを生成するモデルを学習する。このため、学習装置10は、文章に含まれる各単語の関係性の構造同士を比較可能な測地線空間空間を生成することができるので、例えば、たとえ話等、利用者の理解を援助する情報を出力することができる。
30 記憶部
31 正解データデータベース
32 ベクトルデータベース
33 測地線データベース
34 モデルデータベース
40 制御部
41 抽出部
42 学習部
43 生成部
44 特定部
45 出力部
100 入力装置
200 情報処理装置
Claims (3)
- 所定の文章に含まれる単語群を抽出する抽出部と、
単語の特徴に基づいて当該単語をベクトル化するモデルを用いて、前記所定の文章から抽出された単語群に含まれる各単語をそれぞれベクトル化し、各単語と対応するベクトルを前記所定の文章に出現する順序で、ある単語と対応するベクトルの始点を当該単語の直前に出現する単語と対応するベクトルの終点となるように並べた際に、各単語と対応するベクトルのそれぞれが前記所定の文章が属する分野として前記所定の文章とともに指定された分野に対応する測地線に対する接線ベクトルとなるように前記モデルを再学習させることで、前記所定の文章が属する分野として前記所定の文章とともに指定された分野の文章が有する概念および構造を前記モデルに学習させる学習部と、
比較対象となる文章ごとに、当該文章と対応する分野として指定された分野に基づき、当該文章に含まれる単語と対応するベクトルを前記学習部により学習されたモデルを用いて生成し、当該文章に出現する順に、ある単語と対応するベクトルの始点を当該単語の直前に出現する単語と対応するベクトルの終点となるように並べた際に、各ベクトルが連続する接ベクトルとなる測地線を前記比較対象となる文章ごとに生成する生成部と、
前記測地線の類似性に基づいて、前記比較対象となる文章の類似性を特定する特定部と
を有することを特徴とする学習装置。 - 前記特定部は、比較対象となる文章から生成された測地線をパラメータとするフィッシャー情報行列の類似性に基づいて、前記比較対象となる文章の類似性を特定する
ことを特徴とする請求項1に記載の学習装置。 - 学習装置が実行する学習方法であって、
所定の文章に含まれる単語群を抽出する抽出工程と、
単語の特徴に基づいて当該単語をベクトル化するモデルを用いて、前記所定の文章から抽出された単語群に含まれる各単語をそれぞれベクトル化し、各単語と対応するベクトルを前記所定の文章に出現する順序で、ある単語と対応するベクトルの始点を当該単語の直前に出現する単語と対応するベクトルの終点となるように並べた際に、各単語と対応するベクトルのそれぞれが前記所定の文章が属する分野として前記所定の文章とともに指定された分野に対応する測地線に対する接線ベクトルとなるように前記モデルを再学習させることで、前記所定の文章が属する分野として前記所定の文章とともに指定された分野の文章が有する概念および構造を前記モデルに学習させる学習工程と、
比較対象となる文章ごとに、当該文章と対応する分野として指定された分野に基づき、当該文章に含まれる単語と対応するベクトルを前記学習工程により学習されたモデルを用いて生成し、当該文章に出現する順に、ある単語と対応するベクトルの始点を当該単語の直前に出現する単語と対応するベクトルの終点となるように並べた際に、各ベクトルが連続する接ベクトルとなる測地線を前記比較対象となる文章ごとに生成する生成工程と、
前記測地線の類似性に基づいて、前記比較対象となる文章の類似性を特定する特定工程と
を含むことを特徴とする学習方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017141170A JP7265837B2 (ja) | 2017-07-20 | 2017-07-20 | 学習装置および学習方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017141170A JP7265837B2 (ja) | 2017-07-20 | 2017-07-20 | 学習装置および学習方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019021206A JP2019021206A (ja) | 2019-02-07 |
JP7265837B2 true JP7265837B2 (ja) | 2023-04-27 |
Family
ID=65353565
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017141170A Active JP7265837B2 (ja) | 2017-07-20 | 2017-07-20 | 学習装置および学習方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7265837B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102227939B1 (ko) * | 2019-04-02 | 2021-03-15 | 성균관대학교산학협력단 | 단어의 문맥 정보와 형태론적 정보를 고려한 단어 임베딩 방법 및 장치 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008287437A (ja) | 2007-05-16 | 2008-11-27 | Canon Inc | 情報処理方法、情報処理装置 |
JP2008310796A (ja) | 2007-06-15 | 2008-12-25 | Mitsubishi Electric Research Laboratories Inc | コンピュータにより実施される、訓練データから分類器を構築し、前記分類器を用いてテストデータ中の移動物体を検出する方法 |
JP2009523270A (ja) | 2005-12-09 | 2009-06-18 | フラウンホファー‐ゲゼルシャフト・ツア・フェルダルング ・デア・アンゲバンテン・フォルシュング・エー・ファウ. | データ列の自動比較に用いられる方法およびその装置 |
-
2017
- 2017-07-20 JP JP2017141170A patent/JP7265837B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009523270A (ja) | 2005-12-09 | 2009-06-18 | フラウンホファー‐ゲゼルシャフト・ツア・フェルダルング ・デア・アンゲバンテン・フォルシュング・エー・ファウ. | データ列の自動比較に用いられる方法およびその装置 |
JP2008287437A (ja) | 2007-05-16 | 2008-11-27 | Canon Inc | 情報処理方法、情報処理装置 |
JP2008310796A (ja) | 2007-06-15 | 2008-12-25 | Mitsubishi Electric Research Laboratories Inc | コンピュータにより実施される、訓練データから分類器を構築し、前記分類器を用いてテストデータ中の移動物体を検出する方法 |
Also Published As
Publication number | Publication date |
---|---|
JP2019021206A (ja) | 2019-02-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5749279B2 (ja) | アイテム関連付けのための結合埋込 | |
US20190005399A1 (en) | Learning device, generation device, learning method, generation method, and non-transitory computer readable storage medium | |
US11675975B2 (en) | Word classification based on phonetic features | |
US11282501B2 (en) | Speech recognition method and apparatus | |
CN105989067B (zh) | 从图片生成文本摘要的方法、用户设备及训练服务器 | |
JP6975610B2 (ja) | 学習装置および学習方法 | |
JP6195542B2 (ja) | 学習装置、学習方法及び学習プログラム | |
JP5638503B2 (ja) | テキスト要約装置、方法及びプログラム | |
JP2017199149A (ja) | 学習装置、学習方法および学習プログラム | |
CN114443899A (zh) | 视频分类方法、装置、设备及介质 | |
US20190354533A1 (en) | Information processing device, information processing method, and non-transitory computer-readable recording medium | |
KR20180137168A (ko) | 신경망 기반의 텍스트의 카테고리를 분류하기 위한 장치, 이를 위한 방법 및 이 방법을 수행하기 위한 프로그램이 기록된 컴퓨터 판독 가능한 기록매체 | |
JP2020027609A (ja) | 応答推論方法及び装置 | |
JP2017199383A (ja) | モデル | |
EP3625705A1 (en) | Content access and storage | |
US20190122099A1 (en) | Learning apparatus, generation apparatus, classification apparatus, learning method, and non-transitory computer readable storage medium | |
JP7058556B2 (ja) | 判定装置、判定方法、および判定プログラム | |
JP6775366B2 (ja) | 選択装置、および選択方法 | |
JP6963988B2 (ja) | 提供装置、提供方法および提供プログラム | |
JP7265837B2 (ja) | 学習装置および学習方法 | |
JP5355483B2 (ja) | 略語完全語復元装置とその方法と、プログラム | |
JP2019021218A (ja) | 学習装置、プログラムパラメータ、学習方法およびモデル | |
JP6964481B2 (ja) | 学習装置、プログラムおよび学習方法 | |
JP6680655B2 (ja) | 学習装置および学習方法 | |
JP2023021946A (ja) | データ検索方法及びシステム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20191101 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20191108 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200309 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210224 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210330 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210531 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20211109 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220209 |
|
C60 | Trial request (containing other claim documents, opposition documents) |
Free format text: JAPANESE INTERMEDIATE CODE: C60 Effective date: 20220209 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20220217 |
|
C21 | Notice of transfer of a case for reconsideration by examiners before appeal proceedings |
Free format text: JAPANESE INTERMEDIATE CODE: C21 Effective date: 20220222 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20220428 |
|
C211 | Notice of termination of reconsideration by examiners before appeal proceedings |
Free format text: JAPANESE INTERMEDIATE CODE: C211 Effective date: 20220510 |
|
C22 | Notice of designation (change) of administrative judge |
Free format text: JAPANESE INTERMEDIATE CODE: C22 Effective date: 20220614 |
|
C22 | Notice of designation (change) of administrative judge |
Free format text: JAPANESE INTERMEDIATE CODE: C22 Effective date: 20220705 |
|
C13 | Notice of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: C13 Effective date: 20220913 |
|
C22 | Notice of designation (change) of administrative judge |
Free format text: JAPANESE INTERMEDIATE CODE: C22 Effective date: 20221011 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221114 |
|
C13 | Notice of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: C13 Effective date: 20221213 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230213 |
|
C23 | Notice of termination of proceedings |
Free format text: JAPANESE INTERMEDIATE CODE: C23 Effective date: 20230221 |
|
C03 | Trial/appeal decision taken |
Free format text: JAPANESE INTERMEDIATE CODE: C03 Effective date: 20230328 |
|
C30A | Notification sent |
Free format text: JAPANESE INTERMEDIATE CODE: C3012 Effective date: 20230328 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230417 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7265837 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |