JP6224325B2 - 話速変換装置、及びプログラム - Google Patents
話速変換装置、及びプログラム Download PDFInfo
- Publication number
- JP6224325B2 JP6224325B2 JP2013029111A JP2013029111A JP6224325B2 JP 6224325 B2 JP6224325 B2 JP 6224325B2 JP 2013029111 A JP2013029111 A JP 2013029111A JP 2013029111 A JP2013029111 A JP 2013029111A JP 6224325 B2 JP6224325 B2 JP 6224325B2
- Authority
- JP
- Japan
- Prior art keywords
- contraction
- expansion
- function
- speech
- time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000006243 chemical reaction Methods 0.000 title claims description 144
- 230000008602 contraction Effects 0.000 claims description 284
- 230000005236 sound signal Effects 0.000 claims description 73
- 230000029058 respiratory gaseous exchange Effects 0.000 claims description 7
- 230000001755 vocal effect Effects 0.000 claims 1
- 230000006870 function Effects 0.000 description 260
- 238000004458 analytical method Methods 0.000 description 32
- 238000000034 method Methods 0.000 description 26
- 238000010586 diagram Methods 0.000 description 16
- 230000003068 static effect Effects 0.000 description 7
- 230000007423 decrease Effects 0.000 description 4
- 230000006399 behavior Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000002123 temporal effect Effects 0.000 description 2
- 230000001934 delay Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Landscapes
- Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
- Telephone Function (AREA)
Description
まず、実施例1による話速変換装置について説明する。図1は、実施例1による話速変換装置の構成を示すブロック図である。この話速変換装置1−1は、音声信号分析部10、特徴量算出部11、波形伸縮関数決定部12、DB13及び話速変換部14を備えている。
〔数式1〕
S=Pt0.5×Po0.5 ・・・(1)
特徴量算出部11により算出された音響特徴量Sは、波形伸縮関数決定部12に出力される。この音響特徴量Sは、観測期間毎に更新される。
次に、図1に示した実施例1による話速変換装置1−1の波形伸縮関数決定部12について詳細に説明する。図5は、波形伸縮関数決定部12の構成を示すブロック図であり、図7は、波形伸縮関数決定部12の処理を示すフローチャートである。波形伸縮関数決定部12は、前述のとおり、特徴量算出部11から入力した音響特徴量Sに基づいてその特性を算出し、算出した音響特徴量Sの特性に基づいて波形伸縮関数Yを決定し、決定した波形伸縮関数Y及び時間データTをDB13から読み出し、波形伸縮関数Yから算出した伸縮倍率r(t)及び時間データTを話速変換部14に出力する。
次に、図1に示した実施例1による話速変換装置1−1の話速変換部14について詳細に説明する。図8は、話速変換部14の構成を示すブロック図であり、図9は、話速変換部14の処理を示すフローチャートである。話速変換部14は、前述のとおり、音声信号分析部10から各種区間の時系列の音声信号を入力すると共に、波形伸縮関数決定部12から伸縮倍率r(t)及び時間データTを入力し、観測期間の開始時点から時間データTの示す時間が経過するまでの間、直前の観測期間において算出された伸縮倍率r(t)を用いて音声信号の話速変換を行い、観測期間の開始時点から時間データTの示す時間が経過した後、発話が継続している場合、音声信号の話速変換を行うことなくそのまま出力するか、または、伸縮倍率r(t)の代わりに所定の伸縮倍率を用いて話速変換を行う。この場合、話速変換部14は、音声信号の話速変換を行うことなくそのまま出力することにより、または、音声信号を伸縮倍率1.0にて話速変換を行って出力することにより、結果として、入力した音声信号と同じ速度の音声信号が出力されることになる。
次に、実施例2による話速変換装置について説明する。図11は、実施例2による話速変換装置の構成を示すブロック図である。この話速変換装置1−2は、音声信号分析部10、特徴量算出部11、波形伸縮関数決定部15、DB13及び話速変換部16を備えている。図1に示した実施例1による話速変換装置1−1と図11に示す実施例2による話速変換装置1−2とを比較すると、両話速変換装置1−1,1−2は、音声信号分析部10、特徴量算出部11、DB13を備えている点で同一である。一方、話速変換装置1−2は、話速変換装置1−1の波形伸縮関数決定部12及び話速変換部14とは異なる波形伸縮関数決定部15及び話速変換部16を備えている点で相違する。音声信号分析部10、特徴量算出部11及びDB13については、図1に示した実施例1による話速変換装置1−1にて説明済みであるから、ここでは説明を省略する。
次に、図11に示した実施例2による話速変換装置1−2の波形伸縮関数決定部15について詳細に説明する。図12は、波形伸縮関数決定部15の構成を示すブロック図であり、図13は、波形伸縮関数決定部15の処理を示すフローチャートである。この波形伸縮関数決定部15は、特性算出部20、テーブル21、関数決定部22、関数修正部24及び伸縮倍率出力部23を備えている。図5に示した波形伸縮関数決定部12と図12に示す波形伸縮関数決定部15とを比較すると、両波形伸縮関数決定部12,15は、特性算出部20、テーブル21、関数決定部22及び伸縮倍率出力部23を備えている点で同一である。一方、波形伸縮関数決定部15は、波形伸縮関数決定部12の各構成部に加え、さらに関数修正部24を備えている点で相違する。
10 音声信号分析部
11 特徴量算出部
12,15 波形伸縮関数決定部
13 DB
14,16 話速変換部
20 特性算出部
21 テーブル
22 関数決定部
23 伸縮倍率出力部
24 関数修正部
30,31 変換部
Claims (5)
- 時系列の音声信号を入力し、所定の波形伸縮ルールによって前記音声信号の話速を変換する話速変換装置において、
前記入力した時系列の音声信号から、音響的な特徴を示す特徴量を算出する特徴量算出部と、
前記特徴量算出部により算出された特徴量に基づいて、話速変換の際に用いる音声波形の伸縮倍率を定める関数を決定する波形伸縮関数決定部と、
前記波形伸縮関数決定部により決定された関数による伸縮倍率を用いて、前記音声信号の話速を変換する話速変換部と、を備え、
前記波形伸縮関数決定部は、
前記特徴量算出部により算出された特徴量の回帰直線を求め、前記回帰直線の傾きを、前記音声信号の特性として算出する特性算出部と、
前記回帰直線の傾きの条件と関数とが対応して格納されたテーブルと、
前記特性算出部により算出された傾きの条件を満たす関数を前記テーブルから読み出し、前記読み出した関数を、前記話速変換の際に用いる音声波形の伸縮倍率を定める関数として決定する関数決定部と、を有し、
所定時間毎に、前記特徴量算出部が特徴量を算出し、前記波形伸縮関数決定部が関数を決定し、
前記話速変換部は、前記波形伸縮関数決定部により直前の所定時間にて決定された関数による伸縮倍率を用いて、現在の所定時間における音声信号の話速を変換する、ことを特徴とする話速変換装置。 - 請求項1に記載の話速変換装置において、
前記波形伸縮関数決定部は、
前記入力した時系列の音声信号と、前記話速変換部により話速が変換された時系列の音声信号との間の時間遅れを算出し、前記時間遅れが所定のしきい値以下になるように、前記決定した関数を修正して新たな関数を決定する、ことを特徴とする話速変換装置。 - 請求項1または2に記載の話速変換装置において、
前記所定時間を、予め設定された一定時間とするか、または、発声音の息継ぎ区間に相当する休止区間に挟まれた呼気段落を単位として、予め設定された整数倍の数の呼気段落を含む期間とする、ことを特徴とする話速変換装置。 - 請求項1から3までのいずれか一項に記載の話速変換装置において、
前記波形伸縮関数決定部により決定される関数を、発声音の息継ぎ区間に相当する休止区間に挟まれた呼気段落の開始時点から予め設定された時間までの間で定義される関数とし、
前記話速変換部は、
前記所定時間の開始時点から前記予め設定された時間が経過するまでの間、前記波形伸縮関数決定部により決定された関数による伸縮倍率を用いて前記音声信号の話速を変換し、前記所定時間の開始時点から前記予め設定された時間が経過した後、予め設定された新たな伸縮倍率を用いて前記音声信号の話速を変換する、ことを特徴とする話速変換装置。 - コンピュータを、請求項1から4までのいずれか一項に記載の話速変換装置として機能させるための話速変換プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013029111A JP6224325B2 (ja) | 2013-02-18 | 2013-02-18 | 話速変換装置、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013029111A JP6224325B2 (ja) | 2013-02-18 | 2013-02-18 | 話速変換装置、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014157331A JP2014157331A (ja) | 2014-08-28 |
JP6224325B2 true JP6224325B2 (ja) | 2017-11-01 |
Family
ID=51578214
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013029111A Active JP6224325B2 (ja) | 2013-02-18 | 2013-02-18 | 話速変換装置、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6224325B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112908302B (zh) * | 2021-01-26 | 2024-03-15 | 腾讯音乐娱乐科技(深圳)有限公司 | 一种音频处理方法、装置、设备及可读存储介质 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3220043B2 (ja) * | 1997-04-30 | 2001-10-22 | 日本放送協会 | 話速変換方法およびその装置 |
JP2003223200A (ja) * | 2002-01-28 | 2003-08-08 | Telecommunication Advancement Organization Of Japan | 話速変換による書き起こし支援システム及び半自動型字幕番組制作システム |
JP4630876B2 (ja) * | 2005-01-18 | 2011-02-09 | 富士通株式会社 | 話速変換方法及び話速変換装置 |
JP2010026243A (ja) * | 2008-07-18 | 2010-02-04 | Panasonic Electric Works Co Ltd | 自動話速変換装置 |
JP5412204B2 (ja) * | 2009-07-31 | 2014-02-12 | 日本放送協会 | 適応的な話速変換装置及びプログラム |
-
2013
- 2013-02-18 JP JP2013029111A patent/JP6224325B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2014157331A (ja) | 2014-08-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8484035B2 (en) | Modification of voice waveforms to change social signaling | |
JP5593244B2 (ja) | 話速変換倍率決定装置、話速変換装置、プログラム、及び記録媒体 | |
JP6758890B2 (ja) | 音声判別装置、音声判別方法、コンピュータプログラム | |
JP6224325B2 (ja) | 話速変換装置、及びプログラム | |
JP5621786B2 (ja) | 音声検出装置、音声検出方法、および音声検出プログラム | |
JP6433063B2 (ja) | 音声加工装置、及びプログラム | |
KR101674597B1 (ko) | 음성 인식 시스템 및 방법 | |
JP6314879B2 (ja) | 音読評価装置、音読評価方法、及びプログラム | |
JP6343895B2 (ja) | 音声制御装置、音声制御方法およびプログラム | |
JP5412204B2 (ja) | 適応的な話速変換装置及びプログラム | |
JP2013117556A (ja) | 韻律変換装置およびそのプログラム | |
JP2018072368A (ja) | 音響解析方法および音響解析装置 | |
JP5131130B2 (ja) | 追従性評価システム,カラオケシステムおよびプログラム | |
JP2015064480A (ja) | 音声合成装置およびプログラム | |
JP2015069037A (ja) | 音声合成装置およびプログラム | |
JP5954348B2 (ja) | 音声合成装置および音声合成方法 | |
JP5272141B2 (ja) | 音声処理装置およびプログラム | |
JP6784137B2 (ja) | 音響解析方法および音響解析装置 | |
JPH08254992A (ja) | 話速変換装置 | |
JP6343896B2 (ja) | 音声制御装置、音声制御方法およびプログラム | |
JP2005266098A (ja) | 音声信号セグメント方法、音声ピッチ検出方法及び音声区間検出処理方法 | |
JP5677137B2 (ja) | 韻律変換装置およびプログラム | |
JP6371531B2 (ja) | 音声信号処理装置及びプログラム | |
JP2006038956A (ja) | 音声速度遅延装置及び方法 | |
JP5863472B2 (ja) | 話速変換装置およびそのプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160104 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170124 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170214 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170413 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170911 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20171005 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6224325 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |