JP2021099713A - 変換装置およびプログラム - Google Patents
変換装置およびプログラム Download PDFInfo
- Publication number
- JP2021099713A JP2021099713A JP2019231754A JP2019231754A JP2021099713A JP 2021099713 A JP2021099713 A JP 2021099713A JP 2019231754 A JP2019231754 A JP 2019231754A JP 2019231754 A JP2019231754 A JP 2019231754A JP 2021099713 A JP2021099713 A JP 2021099713A
- Authority
- JP
- Japan
- Prior art keywords
- data
- unit
- learning
- encoder
- encoder unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000006243 chemical reaction Methods 0.000 claims description 65
- 238000004364 calculation method Methods 0.000 claims description 55
- 238000000034 method Methods 0.000 claims description 52
- 238000013528 artificial neural network Methods 0.000 claims description 38
- 230000008569 process Effects 0.000 claims description 32
- 230000006870 function Effects 0.000 claims description 11
- 230000004044 response Effects 0.000 claims description 5
- 238000012545 processing Methods 0.000 abstract description 18
- 238000010801 machine learning Methods 0.000 abstract description 15
- 239000013598 vector Substances 0.000 description 39
- 238000010586 diagram Methods 0.000 description 9
- 239000011159 matrix material Substances 0.000 description 7
- 238000011156 evaluation Methods 0.000 description 6
- 238000002474 experimental method Methods 0.000 description 6
- 238000012549 training Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 208000032041 Hearing impaired Diseases 0.000 description 4
- 238000013527 convolutional neural network Methods 0.000 description 4
- 230000000306 recurrent effect Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000002123 temporal effect Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 241000282412 Homo Species 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Landscapes
- Image Analysis (AREA)
Abstract
Description
上記の実施形態による変換装置の評価実験を行った。その結果を次に記す。
10 入力部
20 エンコーダー部
30 デコーダー部
40 出力部
50 ロス算出部
60 第2エンコーダー部
70 第2ロス算出部
80 学習データ供給部
90 制御部
201,301,601 ニューラルネットワーク
Claims (6)
- 入力データを基に状態データを生成するエンコーダー部と、
前記状態データを基に出力データを生成するデコーダー部と、
前記エンコーダー部への入力となる学習用入力データと、前記学習用入力データに対応する前記出力データの正解である正解データとの対を供給する学習データ供給部と、
前記学習用入力データに基づいて前記エンコーダー部が生成する状態データ、に基づいて前記デコーダー部が生成する学習用出力データと、前記学習用入力データに対応して前記学習データ供給部が供給する前記正解データと、の差を表すロスを算出するロス算出部と、
前記正解データを基に推定される状態データである推定状態データを生成する第2エンコーダー部と、
前記学習用入力データに基づいて前記エンコーダー部が生成する前記状態データと、前記学習用入力データに対応して前記学習データ供給部が供給する前記正解データに基づいて前記第2エンコーダー部が生成する前記推定状態データと、の差を表す第2ロスを算出する第2ロス算出部と、
第1学習モードと、第2学習モードと、変換実行モードとを適宜切り替えて動作させるように制御する制御部と、
を備え、
前記第1学習モードにおいては、学習データ供給部が供給する前記学習用入力データと前記正解データとに基づいて前記ロス算出部が算出した前記ロス、に基づいて前記エンコーダー部および前記デコーダー部の内部パラメーターを調整し、
前記第2学習モードにおいては、学習データ供給部が供給する前記学習用入力データと前記正解データとに基づいて前記第2ロス算出部が算出した前記第2ロス、に基づいて前記エンコーダー部および前記第2エンコーダー部の内部パラメーターを調整し、
前記変換実行モードにおいては、前記エンコーダー部が入力データを基に状態データを生成し、前記エンコーダー部が生成した前記状態データを基に、前記デコーダー部が、出力データを生成する、
変換装置。 - 前記エンコーダー部と、前記デコーダー部と、前記第2エンコーダー部との各々は、内部にニューラルネットワークを備え、
前記第1学習モードにおいては、前記ロスに基づいて前記エンコーダー部および前記デコーダー部のそれぞれのニューラルネットワークの誤差逆伝播を行うことによって前記エンコーダー部および前記デコーダー部の内部パラメーターを調整し、
前記第2学習モードにおいては、前記第2ロスに基づいて前記エンコーダー部および前記第2エンコーダー部のそれぞれのニューラルネットワークの誤差逆伝播を行うことによって前記エンコーダー部および前記第2エンコーダー部の内部パラメーターを調整する、
請求項1に記載の変換装置。 - 前記制御部は、学習処理の際に、学習データ供給部が供給する前記学習用入力データと前記正解データとの対ごとに、前記第1学習モードと前記第2学習モードとを繰り返して実行するよう制御する、
請求項1または2に記載の変換装置。 - 前記入力データは、画像の系列であり、
前記出力データは、所定の記号の系列である、
請求項1から3までのいずれか一項に記載の変換装置。 - 前記画像の系列は、手話を表す画像の系列であり、
前記記号の系列は、前記手話に対応する、グロス表記による語の列である、
請求項4に記載の変換装置。 - 入力データを基に状態データを生成するエンコーダー部と、
前記状態データを基に出力データを生成するデコーダー部と、
前記エンコーダー部への入力となる学習用入力データと、前記学習用入力データに対応する前記出力データの正解である正解データとの対を供給する学習データ供給部と、
前記学習用入力データに基づいて前記エンコーダー部が生成する状態データ、に基づいて前記デコーダー部が生成する学習用出力データと、前記学習用入力データに対応して前記学習データ供給部が供給する前記正解データと、の差を表すロスを算出するロス算出部と、
前記正解データを基に推定される状態データである推定状態データを生成する第2エンコーダー部と、
前記学習用入力データに基づいて前記エンコーダー部が生成する前記状態データと、前記学習用入力データに対応して前記学習データ供給部が供給する前記正解データに基づいて前記第2エンコーダー部が生成する前記推定状態データと、の差を表す第2ロスを算出する第2ロス算出部と、
第1学習モードと、第2学習モードと、変換実行モードとを適宜切り替えて動作させるように制御する制御部と、
を備え、
前記第1学習モードにおいては、学習データ供給部が供給する前記学習用入力データと前記正解データとに基づいて前記ロス算出部が算出した前記ロス、に基づいて前記エンコーダー部および前記デコーダー部の内部パラメーターを調整し、
前記第2学習モードにおいては、学習データ供給部が供給する前記学習用入力データと前記正解データとに基づいて前記第2ロス算出部が算出した前記第2ロス、に基づいて前記エンコーダー部および前記第2エンコーダー部の内部パラメーターを調整し、
前記変換実行モードにおいては、前記エンコーダー部が入力データを基に状態データを生成し、前記エンコーダー部が生成した前記状態データを基に、前記デコーダー部が、出力データを生成する、
変換装置としてコンピューターを機能させるプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019231754A JP7422535B2 (ja) | 2019-12-23 | 2019-12-23 | 変換装置およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019231754A JP7422535B2 (ja) | 2019-12-23 | 2019-12-23 | 変換装置およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021099713A true JP2021099713A (ja) | 2021-07-01 |
JP7422535B2 JP7422535B2 (ja) | 2024-01-26 |
Family
ID=76541278
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019231754A Active JP7422535B2 (ja) | 2019-12-23 | 2019-12-23 | 変換装置およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7422535B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023047843A1 (ja) * | 2021-09-27 | 2023-03-30 | オムロン株式会社 | モデル生成方法、データ提示方法、データ生成方法、推定方法、モデル生成装置、データ提示装置、データ生成装置、及び推定装置 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10558750B2 (en) | 2016-11-18 | 2020-02-11 | Salesforce.Com, Inc. | Spatial attention model for image captioning |
US11035227B2 (en) | 2017-07-14 | 2021-06-15 | The Board Of Regents Of The University Of Oklahoma | Generating spectral responses of materials |
JP7020156B2 (ja) | 2018-02-06 | 2022-02-16 | オムロン株式会社 | 評価装置、動作制御装置、評価方法、及び評価プログラム |
-
2019
- 2019-12-23 JP JP2019231754A patent/JP7422535B2/ja active Active
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023047843A1 (ja) * | 2021-09-27 | 2023-03-30 | オムロン株式会社 | モデル生成方法、データ提示方法、データ生成方法、推定方法、モデル生成装置、データ提示装置、データ生成装置、及び推定装置 |
Also Published As
Publication number | Publication date |
---|---|
JP7422535B2 (ja) | 2024-01-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7490804B2 (ja) | 非同期デコーダでエンド・ツー・エンド音声認識をストリーミングするためのシステムおよび方法 | |
EP3857459B1 (en) | Method and system for training a dialogue response generation system | |
JP7170920B2 (ja) | トリガードアテンションを用いたエンドツーエンド音声認識のためのシステムおよび方法 | |
JP2019535063A (ja) | マルチモーダルフュージョンモデルのための方法及びシステム | |
CN111459450A (zh) | 交互对象的驱动方法、装置、设备以及存储介质 | |
KR20190061488A (ko) | 음성인식을 통한 인공지능 프로그램코딩 시스템 및 그 방법 | |
CN107766319B (zh) | 序列转换方法及装置 | |
CN113537024A (zh) | 多层时序注意力融合机制的弱监督神经网络手语识别方法 | |
KR20240068704A (ko) | 준지도 스피치 인식을 위한 대조 샴 네트워크 | |
KR20230158613A (ko) | 자기-적응형 증류 | |
JP7422535B2 (ja) | 変換装置およびプログラム | |
CN116597857A (zh) | 一种语音驱动图像的方法、系统、装置及存储介质 | |
CN113779224A (zh) | 一种基于用户对话历史的个性化对话生成方法与系统 | |
Rastgoo et al. | A survey on recent advances in Sign Language Production | |
CN113948060A (zh) | 一种网络训练方法、数据处理方法及相关设备 | |
WO2023183680A1 (en) | Alignment prediction to inject text into automatic speech recognition training | |
CN115659959A (zh) | 图像的文本纠错方法、装置、电子设备及存储介质 | |
JP7455000B2 (ja) | 変換装置、学習装置、およびプログラム | |
JP7437983B2 (ja) | 変換装置およびプログラム | |
JP7493398B2 (ja) | 変換装置、学習装置、およびプログラム | |
KR102370993B1 (ko) | 신경망 기반의 실시간 수어 통역 및 대화를 지원하는 인공지능 시스템 | |
KR102261411B1 (ko) | 채팅 모델 학습 방법 및 장치 | |
EP4121910B1 (en) | An artificial intelligence system for capturing context by dilated self-attention | |
CN116453508A (zh) | 语音模型处理方法、装置及计算机设备 | |
KR20230043605A (ko) | 도메인별 최적화를 위한 생성 신경망의 에너지 효율적인 재학습 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20221122 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20231121 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231219 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240116 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7422535 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |