JP2019078857A - 音響モデルの学習方法及びコンピュータプログラム - Google Patents

音響モデルの学習方法及びコンピュータプログラム Download PDF

Info

Publication number
JP2019078857A
JP2019078857A JP2017204873A JP2017204873A JP2019078857A JP 2019078857 A JP2019078857 A JP 2019078857A JP 2017204873 A JP2017204873 A JP 2017204873A JP 2017204873 A JP2017204873 A JP 2017204873A JP 2019078857 A JP2019078857 A JP 2019078857A
Authority
JP
Japan
Prior art keywords
ctc
learning
loss function
rnn
computer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2017204873A
Other languages
English (en)
Japanese (ja)
Other versions
JP2019078857A5 (https=
Inventor
遼一 高島
Ryoichi Takashima
遼一 高島
勝 李
Sheng Li
勝 李
恒 河井
Hisashi Kawai
恒 河井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National Institute of Information and Communications Technology
Original Assignee
National Institute of Information and Communications Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National Institute of Information and Communications Technology filed Critical National Institute of Information and Communications Technology
Priority to JP2017204873A priority Critical patent/JP2019078857A/ja
Publication of JP2019078857A publication Critical patent/JP2019078857A/ja
Publication of JP2019078857A5 publication Critical patent/JP2019078857A5/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)
JP2017204873A 2017-10-24 2017-10-24 音響モデルの学習方法及びコンピュータプログラム Pending JP2019078857A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017204873A JP2019078857A (ja) 2017-10-24 2017-10-24 音響モデルの学習方法及びコンピュータプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017204873A JP2019078857A (ja) 2017-10-24 2017-10-24 音響モデルの学習方法及びコンピュータプログラム

Publications (2)

Publication Number Publication Date
JP2019078857A true JP2019078857A (ja) 2019-05-23
JP2019078857A5 JP2019078857A5 (https=) 2020-12-10

Family

ID=66627776

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017204873A Pending JP2019078857A (ja) 2017-10-24 2017-10-24 音響モデルの学習方法及びコンピュータプログラム

Country Status (1)

Country Link
JP (1) JP2019078857A (https=)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022530726A (ja) * 2020-03-31 2022-07-01 北京市商▲湯▼科技▲開▼▲發▼有限公司 インタラクティブ対象駆動方法、装置、デバイス、及び記録媒体
JPWO2022153504A1 (https=) * 2021-01-15 2022-07-21
JP2022551068A (ja) * 2020-01-16 2022-12-07 ▲騰▼▲訊▼科技(深▲セン▼)有限公司 音声認識方法、装置及びコンピュータプログラム
WO2024180682A1 (ja) * 2023-02-28 2024-09-06 富士通株式会社 機械学習プログラム、方法、及び装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016212273A (ja) * 2015-05-11 2016-12-15 国立研究開発法人情報通信研究機構 リカレント型ニューラルネットワークの学習方法及びそのためのコンピュータプログラム、並びに音声認識装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016212273A (ja) * 2015-05-11 2016-12-15 国立研究開発法人情報通信研究機構 リカレント型ニューラルネットワークの学習方法及びそのためのコンピュータプログラム、並びに音声認識装置
US20180121800A1 (en) * 2015-05-11 2018-05-03 National Institute Of Information And Communications Technology Recurrent neural network training method, computer program therefor and speech recognition device

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
高島 遼一: ""Connectionist temporal classificationの損失関数におけるサブワ", 日本音響学会 2017年 秋季研究発表会講演論文集CD−ROM [CD−ROM] (2017-09-11), JPN6021030051, 11 September 2017 (2017-09-11), ISSN: 0004700560 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022551068A (ja) * 2020-01-16 2022-12-07 ▲騰▼▲訊▼科技(深▲セン▼)有限公司 音声認識方法、装置及びコンピュータプログラム
JP7282442B2 (ja) 2020-01-16 2023-05-29 ▲騰▼▲訊▼科技(深▲セン▼)有限公司 音声認識方法、装置及びコンピュータプログラム
US12609109B2 (en) 2020-01-16 2026-04-21 Tencent Technology (Shenzhen) Company Limited Speech recognition method and apparatus, and computer-readable storage medium
JP2022530726A (ja) * 2020-03-31 2022-07-01 北京市商▲湯▼科技▲開▼▲發▼有限公司 インタラクティブ対象駆動方法、装置、デバイス、及び記録媒体
JPWO2022153504A1 (https=) * 2021-01-15 2022-07-21
WO2024180682A1 (ja) * 2023-02-28 2024-09-06 富士通株式会社 機械学習プログラム、方法、及び装置

Similar Documents

Publication Publication Date Title
JP5777178B2 (ja) 統計的音響モデルの適応方法、統計的音響モデルの適応に適した音響モデルの学習方法、ディープ・ニューラル・ネットワークを構築するためのパラメータを記憶した記憶媒体、及び統計的音響モデルの適応を行なうためのコンピュータプログラム
Liu et al. Reinforcement learning for emotional text-to-speech synthesis with improved emotion discriminability
US9576582B2 (en) System and method for adapting automatic speech recognition pronunciation by acoustic model restructuring
CN102411931B (zh) 用于大词汇量连续语音识别的深度信任网络
JP6509694B2 (ja) 学習装置、音声検出装置、学習方法およびプログラム
Morgan et al. An introduction to hybrid HMM/connectionist continuous speech recognition
JP6884946B2 (ja) 音響モデルの学習装置及びそのためのコンピュータプログラム
JP2019159654A (ja) 時系列情報の学習システム、方法およびニューラルネットワークモデル
JP2016212273A (ja) リカレント型ニューラルネットワークの学習方法及びそのためのコンピュータプログラム、並びに音声認識装置
KR20180038707A (ko) 동적 가중치 값과 토픽 정보를 이용하는 음성인식 방법
CN105654940A (zh) 一种语音合成方法和装置
Demuynck et al. Extracting, modelling and combining information in speech recognition
JP2019078857A (ja) 音響モデルの学習方法及びコンピュータプログラム
JPWO2007105409A1 (ja) 標準パタン適応装置、標準パタン適応方法および標準パタン適応プログラム
JP2751856B2 (ja) 木構造を用いたパターン適応化方式
JP2022147397A (ja) 感情分類器の訓練装置及び訓練方法
Li et al. Bidirectional LSTM Network with Ordered Neurons for Speech Enhancement.
JP3920749B2 (ja) 音声認識用音響モデル作成方法、その装置、そのプログラムおよびその記録媒体、上記音響モデルを用いる音声認識装置
JP6027754B2 (ja) 適応化装置、音声認識装置、およびそのプログラム
CN113160801B (zh) 语音识别方法、装置以及计算机可读存储介质
JP2013117683A (ja) 音声認識装置、誤り傾向学習方法、及びプログラム
JP4964194B2 (ja) 音声認識モデル作成装置とその方法、音声認識装置とその方法、プログラムとその記録媒体
JP6158105B2 (ja) 言語モデル作成装置、音声認識装置、その方法及びプログラム
JP6235922B2 (ja) 重み付き有限状態オートマトン作成装置、記号列変換装置、音声認識装置、それらの方法、及びプログラム
Heigold et al. Investigations on convex optimization using log-linear HMMs for digit string recognition.

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200925

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201028

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210714

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210803

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20220208