JP2014157331A - 話速変換装置、方法及びプログラム - Google Patents
話速変換装置、方法及びプログラム Download PDFInfo
- Publication number
- JP2014157331A JP2014157331A JP2013029111A JP2013029111A JP2014157331A JP 2014157331 A JP2014157331 A JP 2014157331A JP 2013029111 A JP2013029111 A JP 2013029111A JP 2013029111 A JP2013029111 A JP 2013029111A JP 2014157331 A JP2014157331 A JP 2014157331A
- Authority
- JP
- Japan
- Prior art keywords
- contraction
- expansion
- speech
- function
- time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Telephone Function (AREA)
- Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
Abstract
【解決手段】話速変換装置1−1の特徴量算出部11は、観測期間毎に、音声信号の基本周波数Pt及びパワーPoを用いて音響特徴量Sを算出する。波形伸縮関数決定部12は、音響特徴量Sの特性として、呼気段落毎の回帰直線の傾きa1,a2,a3を算出し、テーブル21を参照して傾きa1,a2,a3の条件を満たす波形伸縮関数Yを決定し、決定した波形伸縮関数Y及び時間データTをDB13から読み出し、波形伸縮関数Yを用いて伸縮倍率r(t)を算出する。話速変換部14は、観測期間の開始時点から時間データTの示す時間が経過するまでの間、直前の観測期間において波形伸縮関数決定部12により算出された伸縮倍率r(t)を用いて、音声信号を話速変換する。
【選択図】図1
Description
まず、実施例1による話速変換装置について説明する。図1は、実施例1による話速変換装置の構成を示すブロック図である。この話速変換装置1−1は、音声信号分析部10、特徴量算出部11、波形伸縮関数決定部12、DB13及び話速変換部14を備えている。
〔数式1〕
S=Pt0.5×Po0.5 ・・・(1)
特徴量算出部11により算出された音響特徴量Sは、波形伸縮関数決定部12に出力される。この音響特徴量Sは、観測期間毎に更新される。
次に、図1に示した実施例1による話速変換装置1−1の波形伸縮関数決定部12について詳細に説明する。図5は、波形伸縮関数決定部12の構成を示すブロック図であり、図7は、波形伸縮関数決定部12の処理を示すフローチャートである。波形伸縮関数決定部12は、前述のとおり、特徴量算出部11から入力した音響特徴量Sに基づいてその特性を算出し、算出した音響特徴量Sの特性に基づいて波形伸縮関数Yを決定し、決定した波形伸縮関数Y及び時間データTをDB13から読み出し、波形伸縮関数Yから算出した伸縮倍率r(t)及び時間データTを話速変換部14に出力する。
次に、図1に示した実施例1による話速変換装置1−1の話速変換部14について詳細に説明する。図8は、話速変換部14の構成を示すブロック図であり、図9は、話速変換部14の処理を示すフローチャートである。話速変換部14は、前述のとおり、音声信号分析部10から各種区間の時系列の音声信号を入力すると共に、波形伸縮関数決定部12から伸縮倍率r(t)及び時間データTを入力し、観測期間の開始時点から時間データTの示す時間が経過するまでの間、直前の観測期間において算出された伸縮倍率r(t)を用いて音声信号の話速変換を行い、観測期間の開始時点から時間データTの示す時間が経過した後、発話が継続している場合、音声信号の話速変換を行うことなくそのまま出力するか、または、伸縮倍率r(t)の代わりに所定の伸縮倍率を用いて話速変換を行う。この場合、話速変換部14は、音声信号の話速変換を行うことなくそのまま出力することにより、または、音声信号を伸縮倍率1.0にて話速変換を行って出力することにより、結果として、入力した音声信号と同じ速度の音声信号が出力されることになる。
次に、実施例2による話速変換装置について説明する。図11は、実施例2による話速変換装置の構成を示すブロック図である。この話速変換装置1−2は、音声信号分析部10、特徴量算出部11、波形伸縮関数決定部15、DB13及び話速変換部16を備えている。図1に示した実施例1による話速変換装置1−1と図11に示す実施例2による話速変換装置1−2とを比較すると、両話速変換装置1−1,1−2は、音声信号分析部10、特徴量算出部11、DB13を備えている点で同一である。一方、話速変換装置1−2は、話速変換装置1−1の波形伸縮関数決定部12及び話速変換部14とは異なる波形伸縮関数決定部15及び話速変換部16を備えている点で相違する。音声信号分析部10、特徴量算出部11及びDB13については、図1に示した実施例1による話速変換装置1−1にて説明済みであるから、ここでは説明を省略する。
次に、図11に示した実施例2による話速変換装置1−2の波形伸縮関数決定部15について詳細に説明する。図12は、波形伸縮関数決定部15の構成を示すブロック図であり、図13は、波形伸縮関数決定部15の処理を示すフローチャートである。この波形伸縮関数決定部15は、特性算出部20、テーブル21、関数決定部22、関数修正部24及び伸縮倍率出力部23を備えている。図5に示した波形伸縮関数決定部12と図12に示す波形伸縮関数決定部15とを比較すると、両波形伸縮関数決定部12,15は、特性算出部20、テーブル21、関数決定部22及び伸縮倍率出力部23を備えている点で同一である。一方、波形伸縮関数決定部15は、波形伸縮関数決定部12の各構成部に加え、さらに関数修正部24を備えている点で相違する。
10 音声信号分析部
11 特徴量算出部
12,15 波形伸縮関数決定部
13 DB
14,16 話速変換部
20 特性算出部
21 テーブル
22 関数決定部
23 伸縮倍率出力部
24 関数修正部
30,31 変換部
Claims (7)
- 時系列の音声信号を入力し、所定の波形伸縮ルールによって前記音声信号の話速を変換する話速変換装置において、
前記入力した時系列の音声信号から、音響的な特徴を示す特徴量を算出する特徴量算出部と、
前記特徴量算出部により算出された特徴量に基づいて、話速変換の際に用いる音声波形の伸縮倍率を定める関数を決定する波形伸縮関数決定部と、
前記波形伸縮関数決定部により決定された関数による伸縮倍率を用いて、前記音声信号の話速を変換する話速変換部と、を備え、
所定時間毎に、前記特徴量算出部が特徴量を算出し、前記波形伸縮関数決定部が関数を決定し、
前記話速変換部は、前記波形伸縮関数決定部により直前の所定時間にて決定された関数による伸縮倍率を用いて、現在の所定時間における音声信号の話速を変換する、ことを特徴とする話速変換装置。 - 請求項1に記載の話速変換装置において、
前記波形伸縮関数決定部は、
前記入力した時系列の音声信号と、前記話速変換部により話速が変換された時系列の音声信号との間の時間遅れを算出し、前記時間遅れが所定のしきい値以下になるように、前記決定した関数を修正して新たな関数を決定する、ことを特徴とする話速変換装置。 - 請求項1または2に記載の話速変換装置において、
前記所定時間を、予め設定された一定時間とするか、または、発声音の息継ぎ区間に相当する休止区間に挟まれた呼気段落を単位として、予め設定された整数倍の数の呼気段落を含む期間とする、ことを特徴とする話速変換装置。 - 請求項1から3までのいずれか一項に記載の話速変換装置において、
前記波形伸縮関数決定部は、
前記特徴量算出部により算出された特徴量の回帰直線を求め、前記回帰直線の傾きを、前記音声信号の特性として算出する特性算出部と、
前記回帰直線の傾きの条件と関数とが対応して格納されたテーブルと、
前記特性算出部により算出された傾きの条件を満たす関数を前記テーブルから読み出し、前記読み出した関数を、前記話速変換の際に用いる音声波形の伸縮倍率を定める関数として決定する関数決定部と、
を備えたことを特徴とする話速変換装置。 - 請求項1から4までのいずれか一項に記載の話速変換装置において、
前記波形伸縮関数決定部により決定される関数を、発声音の息継ぎ区間に相当する休止区間に挟まれた呼気段落の開始時点から予め設定された時間までの間で定義される関数とし、
前記話速変換部は、
前記所定時間の開始時点から前記予め設定された時間が経過するまでの間、前記波形伸縮関数決定部により決定された関数による伸縮倍率を用いて前記音声信号の話速を変換し、前記所定時間の開始時点から前記予め設定された時間が経過した後、予め設定された新たな伸縮倍率を用いて前記音声信号の話速を変換する、ことを特徴とする話速変換装置。 - 時系列の音声信号を入力し、所定の波形伸縮ルールによって前記音声信号の話速を変換する話速変換方法において、
前記入力した時系列の音声信号の時系列データから、音響的な特徴を示す特徴量を算出する第1のステップと、
前記算出した特徴量に基づいて、話速変換の際に用いる音声波形の伸縮倍率を定める関数を決定する第2のステップと、
前記決定した関数による伸縮倍率を用いて、前記音声信号の話速を変換する第3のステップと、を有し、
前記第1及び第2のステップは所定時間毎に行われ、
前記第3のステップは、前記第2のステップにて直前の所定時間にて決定した関数による伸縮倍率を用いて、現在の所定時間における音声信号の話速を変換するステップである、ことを特徴とする話速変換方法。 - コンピュータを、請求項1から5までのいずれか一項に記載の話速変換装置として機能させるための話速変換プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013029111A JP6224325B2 (ja) | 2013-02-18 | 2013-02-18 | 話速変換装置、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013029111A JP6224325B2 (ja) | 2013-02-18 | 2013-02-18 | 話速変換装置、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014157331A true JP2014157331A (ja) | 2014-08-28 |
JP6224325B2 JP6224325B2 (ja) | 2017-11-01 |
Family
ID=51578214
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013029111A Active JP6224325B2 (ja) | 2013-02-18 | 2013-02-18 | 話速変換装置、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6224325B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112908302A (zh) * | 2021-01-26 | 2021-06-04 | 腾讯音乐娱乐科技(深圳)有限公司 | 一种音频处理方法、装置、设备及可读存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10301598A (ja) * | 1997-04-30 | 1998-11-13 | Nippon Hoso Kyokai <Nhk> | 話速変換方法およびその装置 |
JP2003223200A (ja) * | 2002-01-28 | 2003-08-08 | Telecommunication Advancement Organization Of Japan | 話速変換による書き起こし支援システム及び半自動型字幕番組制作システム |
WO2006077626A1 (ja) * | 2005-01-18 | 2006-07-27 | Fujitsu Limited | 話速変換方法及び話速変換装置 |
JP2010026243A (ja) * | 2008-07-18 | 2010-02-04 | Panasonic Electric Works Co Ltd | 自動話速変換装置 |
JP2011033789A (ja) * | 2009-07-31 | 2011-02-17 | Nippon Hoso Kyokai <Nhk> | 適応的な話速変換装置及びプログラム |
-
2013
- 2013-02-18 JP JP2013029111A patent/JP6224325B2/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10301598A (ja) * | 1997-04-30 | 1998-11-13 | Nippon Hoso Kyokai <Nhk> | 話速変換方法およびその装置 |
JP2003223200A (ja) * | 2002-01-28 | 2003-08-08 | Telecommunication Advancement Organization Of Japan | 話速変換による書き起こし支援システム及び半自動型字幕番組制作システム |
WO2006077626A1 (ja) * | 2005-01-18 | 2006-07-27 | Fujitsu Limited | 話速変換方法及び話速変換装置 |
JP2010026243A (ja) * | 2008-07-18 | 2010-02-04 | Panasonic Electric Works Co Ltd | 自動話速変換装置 |
JP2011033789A (ja) * | 2009-07-31 | 2011-02-17 | Nippon Hoso Kyokai <Nhk> | 適応的な話速変換装置及びプログラム |
Non-Patent Citations (1)
Title |
---|
今井 篤: "ゆっくり話せば話がはやい 話速変換技術", 電子情報通信学会技術研究報告, vol. Vol.107 No.134, JPN6017004290, 5 July 2007 (2007-07-05), JP, pages 85 - 89 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112908302A (zh) * | 2021-01-26 | 2021-06-04 | 腾讯音乐娱乐科技(深圳)有限公司 | 一种音频处理方法、装置、设备及可读存储介质 |
CN112908302B (zh) * | 2021-01-26 | 2024-03-15 | 腾讯音乐娱乐科技(深圳)有限公司 | 一种音频处理方法、装置、设备及可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
JP6224325B2 (ja) | 2017-11-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5593244B2 (ja) | 話速変換倍率決定装置、話速変換装置、プログラム、及び記録媒体 | |
US8484035B2 (en) | Modification of voice waveforms to change social signaling | |
JP6263868B2 (ja) | 音声処理装置、音声処理方法および音声処理プログラム | |
US20210335364A1 (en) | Computer program, server, terminal, and speech signal processing method | |
JP6758890B2 (ja) | 音声判別装置、音声判別方法、コンピュータプログラム | |
JP6224325B2 (ja) | 話速変換装置、及びプログラム | |
Matassini et al. | Analysis of vocal disorders in a feature space | |
JP6433063B2 (ja) | 音声加工装置、及びプログラム | |
JP6343895B2 (ja) | 音声制御装置、音声制御方法およびプログラム | |
JP5412204B2 (ja) | 適応的な話速変換装置及びプログラム | |
JP5830364B2 (ja) | 韻律変換装置およびそのプログラム | |
JPWO2011077924A1 (ja) | 音声検出装置、音声検出方法、および音声検出プログラム | |
JP6314879B2 (ja) | 音読評価装置、音読評価方法、及びプログラム | |
JP2018072368A (ja) | 音響解析方法および音響解析装置 | |
JP2015064480A (ja) | 音声合成装置およびプログラム | |
JP2015069037A (ja) | 音声合成装置およびプログラム | |
JP5954348B2 (ja) | 音声合成装置および音声合成方法 | |
JP6784137B2 (ja) | 音響解析方法および音響解析装置 | |
JP5272141B2 (ja) | 音声処理装置およびプログラム | |
JP2018180482A (ja) | 音声検出装置及び音声検出プログラム | |
JP5677137B2 (ja) | 韻律変換装置およびプログラム | |
JP2006038956A (ja) | 音声速度遅延装置及び方法 | |
JP6371531B2 (ja) | 音声信号処理装置及びプログラム | |
JP6232892B2 (ja) | 音声合成装置およびプログラム | |
JP5863472B2 (ja) | 話速変換装置およびそのプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160104 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170124 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170214 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170413 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170911 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20171005 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6224325 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |