JP2020013008A - 音声処理装置、音声処理プログラムおよび音声処理方法 - Google Patents
音声処理装置、音声処理プログラムおよび音声処理方法 Download PDFInfo
- Publication number
- JP2020013008A JP2020013008A JP2018135609A JP2018135609A JP2020013008A JP 2020013008 A JP2020013008 A JP 2020013008A JP 2018135609 A JP2018135609 A JP 2018135609A JP 2018135609 A JP2018135609 A JP 2018135609A JP 2020013008 A JP2020013008 A JP 2020013008A
- Authority
- JP
- Japan
- Prior art keywords
- data
- speech
- voice
- learning
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012545 processing Methods 0.000 title claims abstract description 30
- 238000003672 processing method Methods 0.000 title claims abstract description 12
- 238000006243 chemical reaction Methods 0.000 claims abstract description 51
- 239000000203 mixture Substances 0.000 claims abstract description 30
- 230000006870 function Effects 0.000 claims description 10
- 230000014509 gene expression Effects 0.000 abstract description 9
- 238000000034 method Methods 0.000 description 26
- 230000008569 process Effects 0.000 description 12
- 238000013500 data storage Methods 0.000 description 11
- 239000013598 vector Substances 0.000 description 8
- 230000008451 emotion Effects 0.000 description 7
- 238000001228 spectrum Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 3
- 230000002996 emotional effect Effects 0.000 description 3
- 238000000513 principal component analysis Methods 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
Landscapes
- Electrically Operated Instructional Devices (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
Abstract
Description
12 …CPU
18 …メモリ
20 …HDD
22 …スピーカ
24 …プログラム記憶領域
26 …データ記憶領域
Claims (5)
- 平静音声および少なくとも1つの発話スタイル音声の音声データに基づく特徴量データを含む音声コーパス、
前記平静音声と前記少なくとも1つの発話スタイル音声の混合割合である第1混合割合を含む制御パラメータを設定する制御パラメータ生成部、
前記制御パラメータを用いて入力データの学習データおよび出力データの学習データを生成する学習データ生成部、および
前記入力データの学習データおよび前記出力データの学習データに基づいて入力‐出力変換モデルを学習する学習部を備える、音声処理装置。 - 前記音声コーパスは異なる複数の発話者のそれぞれについて前記平静音声および少なくとも1つの発話スタイル音声の音声データに基づく特徴量データを含み、
前記制御パラメータは前記複数の発話者の混合割合である第2混合割合を含み、
前記学習データ生成部は前記発話スタイルおよび前記発話者のそれぞれの第1混合割合および第2混合割合を含む前記制御データに従って前記学習データを生成する、請求項1記載の音声処理装置。 - 請求項1または請求項2の音声処理装置で学習した入力‐出力変換モデルを用いて変換フィルタを予測する変換フィルタ予測部、および
前記変換フィルタを用いて入力波形を変換する波形変換部を備える、音声処理装置。 - コンピュータによって実行され、平静音声および少なくとも1つの発話スタイル音声の音声データに基づく特徴量データを含む音声コーパスを用いる音声処理プログラムであって、前記コンピュータのプロセサを、
前記平静音声と前記少なくとも1つの発話スタイル音声の混合割合である第1混合割合を含む制御パラメータを設定する制御パラメータ生成部、
前記制御パラメータを用いて入力データの学習データおよび出力データの学習データを生成する学習データ生成部、および
前記入力データの学習データおよび前記出力データの学習データに基づいて入力‐出力変換モデルを学習する学習部として機能させる、音声処理プログラム。 - コンピュータによって実行され、平静音声および少なくとも1つの発話スタイル音声の音声データに基づく特徴量データを含む音声コーパスを用いる音声処理方法であって、
前記平静音声と前記少なくとも1つの発話スタイル音声の混合割合である第1混合割合を含む制御パラメータを設定する制御パラメータ生成ステップ、
前記制御パラメータを用いて入力データの学習データおよび出力データの学習データを生成する学習データ生成ステップ、および
前記入力データの学習データおよび前記出力データの学習データに基づいて入力‐出力変換モデルを学習する学習ステップを含む、音声処理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018135609A JP6864322B2 (ja) | 2018-07-19 | 2018-07-19 | 音声処理装置、音声処理プログラムおよび音声処理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018135609A JP6864322B2 (ja) | 2018-07-19 | 2018-07-19 | 音声処理装置、音声処理プログラムおよび音声処理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020013008A true JP2020013008A (ja) | 2020-01-23 |
JP6864322B2 JP6864322B2 (ja) | 2021-04-28 |
Family
ID=69169582
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018135609A Active JP6864322B2 (ja) | 2018-07-19 | 2018-07-19 | 音声処理装置、音声処理プログラムおよび音声処理方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6864322B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023017582A1 (ja) * | 2021-08-11 | 2023-02-16 | 日本電信電話株式会社 | 音声生成方法、音声生成装置および音声生成プログラム |
WO2023238339A1 (ja) * | 2022-06-09 | 2023-12-14 | 日本電信電話株式会社 | 音声生成方法、音声生成装置及びプログラム |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017538137A (ja) * | 2014-12-15 | 2017-12-21 | バイドゥ・ユーエスエイ・リミテッド・ライアビリティ・カンパニーBaidu USA LLC | 音声転写用のシステム及び方法 |
-
2018
- 2018-07-19 JP JP2018135609A patent/JP6864322B2/ja active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017538137A (ja) * | 2014-12-15 | 2017-12-21 | バイドゥ・ユーエスエイ・リミテッド・ライアビリティ・カンパニーBaidu USA LLC | 音声転写用のシステム及び方法 |
Non-Patent Citations (2)
Title |
---|
栗原清 他: ""話者の特徴と感情表現を制御可能なDNN音声合成方式の検討"", 電子情報通信学会2017年総合大会講演論文集 情報・システム1, JPN6020045204, 7 March 2017 (2017-03-07), pages 150, ISSN: 0004393139 * |
間瀬絢美 他: ""音高シフトによる疑似学習データを用いたHMM歌声合成の高精度化"", 日本音響学会2010年春季研究発表会講演論文集CD-ROM, JPN6020045205, 1 March 2010 (2010-03-01), pages 345 - 346, ISSN: 0004393140 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023017582A1 (ja) * | 2021-08-11 | 2023-02-16 | 日本電信電話株式会社 | 音声生成方法、音声生成装置および音声生成プログラム |
WO2023238339A1 (ja) * | 2022-06-09 | 2023-12-14 | 日本電信電話株式会社 | 音声生成方法、音声生成装置及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP6864322B2 (ja) | 2021-04-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4296231B2 (ja) | 声質編集装置および声質編集方法 | |
WO2020073944A1 (zh) | 语音合成方法及设备 | |
CN111276120B (zh) | 语音合成方法、装置和计算机可读存储介质 | |
JP4125362B2 (ja) | 音声合成装置 | |
Robinson et al. | Sequence-to-sequence modelling of f0 for speech emotion conversion | |
WO2007063827A1 (ja) | 声質変換システム | |
JPWO2018159612A1 (ja) | 声質変換装置、声質変換方法およびプログラム | |
CN112102811B (zh) | 一种合成语音的优化方法、装置及电子设备 | |
JP2020034883A (ja) | 音声合成装置及びプログラム | |
EP4266306A1 (en) | A speech processing system and a method of processing a speech signal | |
KR102272554B1 (ko) | 텍스트- 다중 음성 변환 방법 및 시스템 | |
WO2020145353A1 (ja) | コンピュータプログラム、サーバ装置、端末装置及び音声信号処理方法 | |
JP7192882B2 (ja) | 発話リズム変換装置、モデル学習装置、それらの方法、およびプログラム | |
JP2016151736A (ja) | 音声加工装置、及びプログラム | |
JP6864322B2 (ja) | 音声処理装置、音声処理プログラムおよび音声処理方法 | |
Sheikhan | Generation of suprasegmental information for speech using a recurrent neural network and binary gravitational search algorithm for feature selection | |
JPH08248994A (ja) | 声質変換音声合成装置 | |
CN116994553A (zh) | 语音合成模型的训练方法、语音合成方法、装置及设备 | |
JP7339151B2 (ja) | 音声合成装置、音声合成プログラム及び音声合成方法 | |
WO2021033629A1 (ja) | 音響モデル学習装置、音声合成装置、方法およびプログラム | |
CN114464163A (zh) | 语音合成模型的训练方法、装置、设备、存储介质和产品 | |
CN114495896A (zh) | 一种语音播放方法及计算机设备 | |
JP2011197124A (ja) | データ作成システム及びプログラム | |
TW200935399A (en) | Chinese-speech phonologic transformation system and method thereof | |
Matsumoto et al. | Speech-like emotional sound generation using wavenet |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200214 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20201106 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20201124 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210121 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210316 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210325 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6864322 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |