JP6664670B2 - 声質変換システム - Google Patents
声質変換システム Download PDFInfo
- Publication number
- JP6664670B2 JP6664670B2 JP2016133530A JP2016133530A JP6664670B2 JP 6664670 B2 JP6664670 B2 JP 6664670B2 JP 2016133530 A JP2016133530 A JP 2016133530A JP 2016133530 A JP2016133530 A JP 2016133530A JP 6664670 B2 JP6664670 B2 JP 6664670B2
- Authority
- JP
- Japan
- Prior art keywords
- voice
- actor
- voice quality
- conversion
- audio signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000006243 chemical reaction Methods 0.000 title claims description 208
- 230000005236 sound signal Effects 0.000 claims description 75
- 238000000605 extraction Methods 0.000 claims description 6
- 238000000034 method Methods 0.000 description 63
- 230000008569 process Effects 0.000 description 48
- 230000003595 spectral effect Effects 0.000 description 30
- 238000004458 analytical method Methods 0.000 description 28
- 238000001228 spectrum Methods 0.000 description 16
- 239000011295 pitch Substances 0.000 description 14
- 230000015572 biosynthetic process Effects 0.000 description 8
- 230000008859 change Effects 0.000 description 8
- 238000003786 synthesis reaction Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 6
- 239000000284 extract Substances 0.000 description 6
- 230000006870 function Effects 0.000 description 4
- 230000004044 response Effects 0.000 description 3
- 238000003860 storage Methods 0.000 description 3
- 239000000470 constituent Substances 0.000 description 2
- 230000008602 contraction Effects 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 230000000737 periodic effect Effects 0.000 description 2
- 238000012952 Resampling Methods 0.000 description 1
- 208000027418 Wounds and injury Diseases 0.000 description 1
- 230000032683 aging Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 208000014674 injury Diseases 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000010183 spectrum analysis Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 201000009032 substance abuse Diseases 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Telephonic Communication Services (AREA)
Description
Claims (1)
- 声質学習装置及び声質変換装置を備え、アクターの声質をターゲットの声質に変換する声質変換システムにおいて、
前記声質学習装置は、
前記ターゲットの第1の音声信号を入力する第1の入力手段と、
前記入力された第1の音声信号から第1の特徴量を抽出する第1の抽出手段と、
前記第1の音声信号に対応する前記アクターの第2の音声信号を入力する第2の入力手段と、
前記入力された第2の音声信号に含まれる基本周波数を所定の倍率で変換する第1の変換手段と、
前記基本周波数が変換された第2の音声信号から第2の特徴量を抽出する第2の抽出手段と、
前記抽出された第1の特徴量及び第2の特徴量間の対応関係をモデル化することによって得られるモデルデータを格納するデータベースと
を含み、
前記声質変換装置は、
前記アクターの第3の音声信号を入力する第3の入力手段と、
前記入力された第3の音声信号に含まれる基本周波数を前記所定の倍率で変換する第2の変換手段と、
前記基本周波数が変換された第3の音声信号から第3の特徴量を抽出する第3の抽出手段と、
前記データベースに格納されたモデルデータ及び前記抽出された第3の特徴量に基づいて、前記アクターの声質が前記ターゲットの声質に変換された第4の音声信号を生成する生成手段と、
前記生成された第4の音声信号を出力する出力手段と
を含む
ことを特徴とする声質変換システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016133530A JP6664670B2 (ja) | 2016-07-05 | 2016-07-05 | 声質変換システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016133530A JP6664670B2 (ja) | 2016-07-05 | 2016-07-05 | 声質変換システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018005048A JP2018005048A (ja) | 2018-01-11 |
JP6664670B2 true JP6664670B2 (ja) | 2020-03-13 |
Family
ID=60949228
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016133530A Active JP6664670B2 (ja) | 2016-07-05 | 2016-07-05 | 声質変換システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6664670B2 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6876642B2 (ja) * | 2018-02-20 | 2021-05-26 | 日本電信電話株式会社 | 音声変換学習装置、音声変換装置、方法、及びプログラム |
CN109147804B (zh) | 2018-06-05 | 2024-08-20 | 安克创新科技股份有限公司 | 一种基于深度学习的音质特性处理方法及系统 |
WO2020145353A1 (ja) * | 2019-01-10 | 2020-07-16 | グリー株式会社 | コンピュータプログラム、サーバ装置、端末装置及び音声信号処理方法 |
KR102035448B1 (ko) * | 2019-02-08 | 2019-11-15 | 세명대학교 산학협력단 | 음성 악기 |
JP7334942B2 (ja) * | 2019-08-19 | 2023-08-29 | 国立大学法人 東京大学 | 音声変換装置、音声変換方法及び音声変換プログラム |
WO2023276234A1 (ja) | 2021-06-29 | 2023-01-05 | ソニーグループ株式会社 | 情報処理装置、情報処理方法およびプログラム |
JP7069386B1 (ja) * | 2021-06-30 | 2022-05-17 | 株式会社ドワンゴ | 音声変換装置、音声変換方法、プログラム、および記録媒体 |
JP7503870B1 (ja) | 2023-10-12 | 2024-06-21 | ギャラクシー・ネット株式会社 | 楽曲制作支援プログラム、楽曲制作支援装置、楽曲制作支援方法、及び音楽再生装置 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3555490B2 (ja) * | 1999-03-26 | 2004-08-18 | 松下電工株式会社 | 声質変換システム |
JP2008085421A (ja) * | 2006-09-26 | 2008-04-10 | Asahi Kasei Corp | テレビ電話機、通話方法、プログラム、声質変換・画像編集サービス提供システム、および、サーバ |
JP4705203B2 (ja) * | 2009-07-06 | 2011-06-22 | パナソニック株式会社 | 声質変換装置、音高変換装置および声質変換方法 |
-
2016
- 2016-07-05 JP JP2016133530A patent/JP6664670B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2018005048A (ja) | 2018-01-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6664670B2 (ja) | 声質変換システム | |
JP4296231B2 (ja) | 声質編集装置および声質編集方法 | |
US12027165B2 (en) | Computer program, server, terminal, and speech signal processing method | |
US20160365087A1 (en) | High end speech synthesis | |
KR20150016225A (ko) | 타겟 운율 또는 리듬이 있는 노래, 랩 또는 다른 가청 표현으로의 스피치 자동 변환 | |
US10553240B2 (en) | Conversation evaluation device and method | |
JPWO2018084305A1 (ja) | 音声合成方法、音声合成装置およびプログラム | |
CN114999441B (zh) | 虚拟形象生成方法、装置、设备、存储介质以及程序产品 | |
CN105957515A (zh) | 声音合成方法、声音合成装置和存储声音合成程序的介质 | |
US20220157329A1 (en) | Method of converting voice feature of voice | |
US20240105160A1 (en) | Method and system for generating synthesis voice using style tag represented by natural language | |
CN112735454A (zh) | 音频处理方法、装置、电子设备和可读存储介质 | |
Aryal et al. | Articulatory-based conversion of foreign accents with deep neural networks | |
WO2023116243A1 (zh) | 数据转换方法及计算机存储介质 | |
Obin et al. | On the generalization of Shannon entropy for speech recognition | |
CN112216293A (zh) | 一种音色转换方法和装置 | |
CN114999440B (zh) | 虚拟形象生成方法、装置、设备、存储介质以及程序产品 | |
Aso et al. | Speakbysinging: Converting singing voices to speaking voices while retaining voice timbre | |
JP6424419B2 (ja) | 音声制御装置、音声制御方法およびプログラム | |
CN112164387A (zh) | 音频合成方法、装置及电子设备和计算机可读存储介质 | |
Khadka et al. | Nepali Text-to-Speech Synthesis using Tacotron2 for Melspectrogram Generation | |
JPWO2019044534A1 (ja) | 情報処理装置、及び情報処理方法 | |
Bous | A neural voice transformation framework for modification of pitch and intensity | |
JP6163454B2 (ja) | 音声合成装置、その方法及びプログラム | |
Wu et al. | VStyclone: Real-time Chinese voice style clone |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20170614 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20170614 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190423 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200108 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200121 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200203 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6664670 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |