JP5262464B2 - 音声処理装置およびプログラム - Google Patents
音声処理装置およびプログラム Download PDFInfo
- Publication number
- JP5262464B2 JP5262464B2 JP2008226915A JP2008226915A JP5262464B2 JP 5262464 B2 JP5262464 B2 JP 5262464B2 JP 2008226915 A JP2008226915 A JP 2008226915A JP 2008226915 A JP2008226915 A JP 2008226915A JP 5262464 B2 JP5262464 B2 JP 5262464B2
- Authority
- JP
- Japan
- Prior art keywords
- value
- relative
- time series
- values
- relative value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- User Interface Of Digital Computer (AREA)
Description
図1は、本発明の第1実施形態に係る音声処理装置のブロック図である。図1に示すように、音声処理装置100は、演算処理装置10と記憶装置12とを含むコンピュータシステムで実現される。記憶装置12は、演算処理装置10が実行するプログラムや演算処理装置10が使用するデータを記憶する。例えば、音声の時間軸上の波形を表す音声信号S1が記憶装置12に格納される。半導体記録媒体や磁気記録媒体などの公知の記録媒体が記憶装置12として任意に採用される。
B(t)=A(t)+C(t) ……(1)
以上のように、領域66には、編集の前後における特徴量(音高)の絶対的な数値が表示されるのに対し、領域67には、編集前の特徴量に対する編集後の特徴量の相対的な数値が表示される。
次に、本発明の第2実施形態について説明する。なお、以下の各形態において作用や機能が第1実施形態と同等である要素については、以上と同じ符号を付して各々の詳細な説明を適宜に省略する。
図8は、本発明の第3実施形態に係る表示制御部46が表示装置24に表示させる編集画像60の模式図である。図8に示すように、本形態の編集画像60は、図2に例示した要素(例えば編集領域65)に加えて、既定値適用部81と変数適用部83と仮記憶部85とを含んで構成される。
以上に例示した各形態には様々な変形が加えられる。具体的な変形の態様を例示すれば以下の通りである。なお、以下の例示から2以上の態様を任意に選択して組合せてもよい。
以上の各形態においては、制御点設定部52が移動または新規に設定した制御点PC[i]の両側の制御点PC[i-1]と制御点PC[i+1]との間の区間内の各相対値Cを制御点PC[i]の相対値Cに連動して設定したが、制御点PC[i]の設定または移動に連動して相対値Cが設定される範囲は適宜に変更される。例えば、制御点PC[i]を中点または端点(始点または終点)とする所定長の範囲内の各時点の相対値Cが制御点PC[i]の相対値Cに応じて設定される構成も好適である。編集値B(抽出値A)を1個ずつ個別に編集する対比例と比較して作業の負担を軽減するという観点からすると、制御点PC[i]の近傍に位置する複数の時点の各々の相対値Cが当該制御点PC[i]の位置(相対値C)に応じて設定される構成が格別に好適である。
編集領域65に表示される要素や表示の態様は以上の例示に限定されない。例えば、第1実施形態において、第2実施形態と同様に、抽出値画像GAを相対値画像GCとともに領域67に配置してもよいし、第2実施形態において、抽出値Aの時系列を表す抽出値画像GAを抽出値画像Gaの代わりに表示してもよい。また、編集領域65を領域66と領域67とに区分する必要はない。例えば、抽出値画像GA(または抽出値画像Ga)と編集値画像GBと相対値画像GCとを単一の領域内に配置した構成も好適である。なお、利用者による相対値Cの編集を容易化するという観点からすると、相対値Cの時系列を表す相対値画像GCを表示装置24に表示する構成が好適であり、抽出値画像GA(または抽出値画像Ga)や編集値画像GBは適宜に省略され得る。
以上の各形態においては、利用者が指定した任意の時点や抽出値Aの時系列の特徴点Qの時点を相対値画像GCの制御点PCとして設定したが、制御点PCの設定の方法は以上の例示に限定されない。例えば、時間軸上の所定の間隔毎に制御点PCを設定する構成も採用される。
編集の対象となる特徴量は音高に限定されない。例えば、音声信号S1の音量(強度)を特徴量として音声信号S1から抽出する構成や、音声信号S1の周波数スペクトルのうち強度が最大となるピークの頂点からみて高域側の成分を近似する直線の傾きを特徴量として音声信号S1から抽出する構成も採用される。以上の説明から理解されるように、音声の韻律に関連する(韻律を特徴づける)数値が特徴量として好適である。また、複数種の特徴量を並列に編集する構成も採用される。例えば、特徴量の種類の変更が利用者から指示されるたびに、当該特徴量に対応する画像(例えば抽出値画像GAまたは抽出値画像Ga,編集値画像GB,相対値画像GC)が、利用者による編集のために編集領域65に表示される。以上の構成によれば、音声信号S2の韻律を多面的に編集することが可能となる。
以上の各形態においては利用者からの指示に応じて相対値Cの時系列を編集し、相対値Cの編集の結果から編集値Bの時系列を算定したが、例えば、利用者からの指示に応じて編集値Bを編集し、編集値Bの編集の結果から相対値C(C(t)=A(t)−B(t))の時系列を算定する構成も採用される。編集値Bの編集には、以上の各形態にて例示した相対値Cの編集と同様の方法が適用される。
以上の各形態においては音声信号S1を分析することで抽出値Aの時系列を抽出値取得部42が算定する構成を例示したが、音声信号S1から事前に抽出された抽出値Aの時系列を抽出値取得部42が記憶装置12から取得する構成も採用される。抽出値Aの時系列は、音声処理装置100が音声信号S1から抽出した数値でもよいし、音声処理装置100とは別個の装置が音声信号S1から抽出した数値でもよい。すなわち、音声信号S1の分析で抽出値Aを抽出する処理は、抽出値Aの時系列を取得する方法の一例であり、本発明の必須の要件ではない。
Claims (8)
- 音声の韻律に関連する特徴量の抽出値の時系列を取得する抽出値取得手段と、
前記抽出値を基準とした相対値の時系列を設定する相対値制御手段と、
前記抽出値を前記相対値に応じて変化させた編集値の時系列を算定する編集値算定手段と、
前記相対値の時系列を表す相対値画像を表示装置に表示させる表示制御手段と、
前記抽出値の時系列における特徴点に応じた時間軸上の位置に制御点を設定し、前記相対値画像のうち前記相対値の数値軸の方向における前記制御点の位置を利用者からの指示に応じて可変に設定する制御点設定手段とを具備し、
前記相対値制御手段は、前記制御点の近傍の複数の時点の各々の相対値を、前記数値軸の方向における当該制御点の位置に応じて設定する
音声処理装置。 - 前記表示制御手段は、前記抽出値の時系列を表す抽出値画像と前記編集値の時系列を表す編集値画像とを前記相対値画像とともに前記表示装置に表示させる
請求項1の音声処理装置。 - 前記表示制御手段は、前記抽出値画像と前記相対値画像と前記編集値画像とを共通の時間軸上に配置する
請求項2の音声処理装置。 - 前記相対値制御手段は、前記制御点に対応する時点から他の時点にかけて相対値が連続的に変化するように、前記制御点に対応する時点と前記他の時点との間の各時点における相対値を設定する
請求項1から請求項3の何れかの音声処理装置。 - 前記制御点設定手段は、時間軸の方向における前記制御点の位置を利用者からの指示に応じて可変に設定する
請求項1から請求項4の何れかの音声処理装置。 - 音声の韻律に関連する特徴量の抽出値の時系列を取得する抽出値取得手段と、
前記抽出値を基準とした相対値の時系列を設定する相対値制御手段と、
前記抽出値を前記相対値に応じて変化させた編集値の時系列を算定する編集値算定手段と、
前記編集値の時系列に応じて前記音声を加工する音声処理手段と、
前記抽出値の時系列を表す抽出値画像と、前記編集値の時系列を表す編集値画像と、前記相対値の時系列を表す相対値画像と、前記音声処理手段による処理前の音声波形と、前記音声処理手段による処理後の音声波形とを、共通の時間軸のもとで表示装置に表示させる表示制御手段と、
前記相対値画像のうち前記相対値の数値軸の方向における制御点の位置を利用者からの指示に応じて可変に設定する制御点設定手段とを具備し、
前記相対値制御手段は、前記制御点の近傍の複数の時点の各々の相対値を、前記数値軸の方向における当該制御点の位置に応じて設定する
音声処理装置。 - 音声の韻律に関連する特徴量の抽出値の時系列を取得する抽出値取得処理と、
前記抽出値を基準とした相対値の時系列を設定する相対値制御処理と、
前記抽出値を前記相対値に応じて変化させた編集値の時系列を算定する編集値算定処理と、
前記相対値の時系列を表す相対値画像を表示装置に表示させる表示制御処理と、
前記抽出値の時系列における特徴点に応じた時間軸上の位置に制御点を設定し、前記相対値画像のうち前記相対値の数値軸の方向における前記制御点の位置を利用者からの指示に応じて可変に設定する制御点設定処理とをコンピュータに実行させるプログラムであって、
前記相対値制御処理においては、前記制御点の近傍の複数の時点の各々の相対値を、前記数値軸の方向における当該制御点の位置に応じて設定する
プログラム。 - 音声の韻律に関連する特徴量の抽出値の時系列を取得する抽出値取得処理と、
前記抽出値を基準とした相対値の時系列を設定する相対値制御処理と、
前記抽出値を前記相対値に応じて変化させた編集値の時系列を算定する編集値算定処理と、
前記編集値の時系列に応じて前記音声を加工する音声処理と、
前記抽出値の時系列を表す抽出値画像と、前記編集値の時系列を表す編集値画像と、前記相対値の時系列を表す相対値画像と、前記音声処理手段による処理前の音声波形と、前記音声処理手段による処理後の音声波形とを、共通の時間軸のもとで表示装置に表示させる表示制御処理と、
前記相対値画像のうち前記相対値の数値軸の方向における制御点の位置を利用者からの指示に応じて可変に設定する制御点設定処理とをコンピュータに実行させるプログラムであって、
前記相対値制御処理においては、前記制御点の近傍の複数の時点の各々の相対値を、前記数値軸の方向における当該制御点の位置に応じて設定する
プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008226915A JP5262464B2 (ja) | 2008-09-04 | 2008-09-04 | 音声処理装置およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008226915A JP5262464B2 (ja) | 2008-09-04 | 2008-09-04 | 音声処理装置およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010060886A JP2010060886A (ja) | 2010-03-18 |
JP5262464B2 true JP5262464B2 (ja) | 2013-08-14 |
Family
ID=42187749
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008226915A Active JP5262464B2 (ja) | 2008-09-04 | 2008-09-04 | 音声処理装置およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5262464B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5743625B2 (ja) * | 2011-03-17 | 2015-07-01 | 株式会社東芝 | 音声合成編集装置および音声合成編集方法 |
JP6035785B2 (ja) * | 2012-03-08 | 2016-11-30 | ヤマハ株式会社 | 音響解析装置および音響解析方法 |
JP2014038282A (ja) * | 2012-08-20 | 2014-02-27 | Toshiba Corp | 韻律編集装置、方法およびプログラム |
JP6261924B2 (ja) * | 2013-09-17 | 2018-01-17 | 株式会社東芝 | 韻律編集装置、方法およびプログラム |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01120598A (ja) * | 1987-11-04 | 1989-05-12 | Fujitsu Ltd | 音声波形表示装置 |
JPH07282227A (ja) * | 1994-04-08 | 1995-10-27 | Toshiba Corp | 人物顔領域検出装置 |
JP3303835B2 (ja) * | 1999-04-30 | 2002-07-22 | 日本電気株式会社 | 音声の規則合成のためのピッチパタン生成装置及び方法 |
JP2001147691A (ja) * | 1999-11-19 | 2001-05-29 | Roland Corp | オーディオ波形処理方法、オーディオ波形処理装置およびオーディオ波形処理方法のプログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP2004226505A (ja) * | 2003-01-20 | 2004-08-12 | Toshiba Corp | ピッチパタン生成方法、音声合成方法とシステム及びプログラム |
JP2005283788A (ja) * | 2004-03-29 | 2005-10-13 | Yamaha Corp | 表示制御装置およびプログラム |
JP2005345699A (ja) * | 2004-06-02 | 2005-12-15 | Toshiba Corp | 音声編集装置、音声編集方法および音声編集プログラム |
JP4858173B2 (ja) * | 2007-01-05 | 2012-01-18 | ヤマハ株式会社 | 歌唱音合成装置およびプログラム |
JP2008268477A (ja) * | 2007-04-19 | 2008-11-06 | Hitachi Business Solution Kk | 韻律調整可能な音声合成装置 |
-
2008
- 2008-09-04 JP JP2008226915A patent/JP5262464B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2010060886A (ja) | 2010-03-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP2017822B1 (en) | Music piece processing apparatus and method | |
JP5262464B2 (ja) | 音声処理装置およびプログラム | |
TWI471855B (zh) | 語音合成資訊編輯裝置、儲存媒體及方法 | |
CN102473415B (zh) | 声音控制装置及声音控制方法 | |
KR20180063227A (ko) | 오디오 컨텐츠의 동적 변경 | |
US10453478B2 (en) | Sound quality determination device, method for the sound quality determination and recording medium | |
JP6152753B2 (ja) | 音声合成管理装置 | |
JP2016514335A (ja) | マルチチャネルメディアファイルとのやり取りを可能にするためのシステムおよび方法 | |
US20080212667A1 (en) | Graphical user interface for multi-tap delay | |
JP5168014B2 (ja) | 話速変換装置およびプログラム | |
JP2019057889A5 (ja) | ||
JP4876645B2 (ja) | 波形編集装置 | |
KR101142925B1 (ko) | 제어 파라미터들의 조합을 조정하기 위한 시스템 | |
EP2148324B1 (en) | Voice processing apparatus and method | |
JP5251381B2 (ja) | 音処理装置およびプログラム | |
Berndt | Musical tempo curves | |
JP4687517B2 (ja) | 波形編集装置 | |
JP6018141B2 (ja) | オーディオ信号処理装置、オーディオ信号処理方法およびオーディオ信号処理プログラム | |
US20120117373A1 (en) | Method for controlling a second modality based on a first modality | |
JP2008233505A (ja) | 曲編集装置およびプログラム | |
Kreković et al. | Controlling dynamic stochastic synthesis with an audio signal | |
JP6286946B2 (ja) | 音声合成装置および音声合成方法 | |
JP2007171100A (ja) | 信号パターン作成装置 | |
JP6729311B2 (ja) | 音響信号処理装置およびその制御方法ならびにコンピュータプログラム | |
JP3972912B2 (ja) | 波形編集プログラム及び波形編集装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110823 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120712 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120724 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120921 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130402 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130415 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 5262464 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |