JP4419486B2 - 音声分析生成装置、及びプログラム - Google Patents
音声分析生成装置、及びプログラム Download PDFInfo
- Publication number
- JP4419486B2 JP4419486B2 JP2003320312A JP2003320312A JP4419486B2 JP 4419486 B2 JP4419486 B2 JP 4419486B2 JP 2003320312 A JP2003320312 A JP 2003320312A JP 2003320312 A JP2003320312 A JP 2003320312A JP 4419486 B2 JP4419486 B2 JP 4419486B2
- Authority
- JP
- Japan
- Prior art keywords
- frequency amplitude
- amplitude component
- frequency
- component
- shift
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Electrophonic Musical Instruments (AREA)
Description
その声質の変化は、例えば音声(例えば人声)のフォルマントを操作したり、或いは音声をバンドパスフィルタ(BPF)に通してバンド別に振幅値を特定し、特定した振幅値から構成したフィルタに音声を通すことで行われる。前者の方式を採用した音声分析生成装置としては、例えば特許文献1に記載されたものがある。
第1の態様の音声分析生成装置は、第1の音声波形を分析して第1の周波数振幅成分、及び位相成分を抽出する分析手段と、高域周波数振幅成分のフィルタリングを行う低域通過フィルタ手段と、第1の周波数振幅成分に対するフォルマントのシフト量を指示する指示手段と、指示手段により指示されたシフト量に従いシフトを行うシフト手段と、第1の周波数振幅成分に対し低域通過フィルタ手段がフィルタリングすることで得られる第2の周波数振幅成分で該第1の周波数振幅成分を除算することにより周波数振幅残差を算出する算出手段と、シフト手段がシフトした第1の周波数振幅成分に対する低域通過フィルタ手段によるフィルタリング、及び第2の周波数振幅成分に対するシフト手段によるシフトのうちの一方を行うことで得られる第3の周波数振幅成分に周波数振幅残差を乗算する乗算手段と、乗算手段が乗算を行うことで得られる第4の周波数振幅成分、及び位相成分を用いて第2の音声波形を生成する音声波形生成手段と、を具備する。
本発明の第1及び第2の態様のプログラムは、上記第1及び第2の態様の音声分析生成装置をそれぞれ実現させるための機能を搭載している。
<第1の実施例>
図1は、本実施例による音声分析生成装置を搭載した電子楽器の構成図である。
その電子楽器は、図1に示すように、楽器全体の制御を行うCPU1と、複数の鍵を備えた鍵盤2と、各種スイッチを備えたスイッチ部3と、CPU1が実行するプログラムや各種制御用データ等を格納したROM4と、CPU1のワーク用のRAM5と、例えば液晶表示装置(LCD)や複数のLEDなどを備えた表示部6と、特には図示しない端子に接続されたマイク7から入力されるアナログの音声信号のA/D変換を行いその音声データを出力するA/D変換器8と、CPU1の指示に従い楽音発音用の波形データを生成する楽音生成部9と、その生成部9が生成した波形データのD/A変換を行い、アナログのオーディオ信号を出力するD/A変換器10と、そのオーディオ信号の増幅を行うアンプ11と、そのアンプ11が増幅を行った後のオーディオ信号を音声に変換するスピーカ12と、各種スライダを備えたスライダ部13と、を備えて構成されている。それらの構成において、CPU1、鍵盤2、スイッチ部3、ROM4、RAM5、表示部6、A/D変換器8、楽音生成部9、及びスライダ部13の間はバスによって接続されている。
マイク7から出力されたアナログの音声信号は、A/D変換器(ADC)8によってデジタルの音声データに変換される。そのA/D変換器8は、例えばサンプリング周波数22,052HzでAD変換(サンプリング)を行う。以降、それがAD変換して得られる音声データについては便宜的に「元音声データ」、或いは「元波形データ」と呼び、マイク7に入力された音声については「元音声」と呼ぶことにする。音声の入力は、CD−ROMやDVD、或いは光磁気ディスク等の記憶媒体を介して行っても良く、LAN、或いは公衆網等の通信ネットワークを介して行っても良い。
A/D変換器(ADC)8が出力する元音声データは、例えばRAM5に確保された領域である入力バッファ301に格納される。フレーム抽出・窓かけ部302は、入力バッファ301から1フレーム分の元音声データを切り出し、それに窓関数、例えばハニング窓(Hanning Window)を乗算する。
フォルマント移動部305のシフト部305aは、FFT部303から受け取った周波数振幅成分をシフト(周波数領域上のシフトである)する。この操作は、音声のピッチをシフトする操作に相当し、そのシフトに伴い、元音声のフォルマント位置もシフトすることになる。しかし、位相成分の操作は行わないので、厳密にはピッチシフトとはならない。それにより、実質的にはフォルマント位置のみが操作されることとなる。
操作パネル311は、図2に示すスライダ21、22のつまみの位置に応じて、フォルマント位置、及びピッチのそれぞれのシフト量を指示するものである。例えばスライダ部13、CPU1、ROM4、及びRAM5により実現される。本実施例では、それらのシフト量は、元音声のフォルマント位置、ピッチを基準として表す比率で指示するようにしている。以降「フォルマント位置、及びピッチのシフト量を表す比率はそれぞれ「フォルマントシフト比率」及び「ピッチシフト比率」と呼ぶことにする。
乗算器312は、フォルマント移動部305からの周波数振幅成分概形をシフト後の周波数振幅残差と乗算し、その乗算結果を出力する。その乗算結果として算出される周波数振幅成分は、ユーザが指定したピッチシフト、フォルマントシフトを施したものに相当する。
ピッチ移動部310のシフト部310aは、ピッチシフト比率に応じて、瞬時周波数のシフトを行う。周波数位相差変換部313は、ソフト後の瞬時周波数を位相差に変換する。位相差積算部314は、その位相差を積分することで位相成分を生成する。
図4は、全体処理のフローチャートである。始めに図4を参照して、その全体処理について詳細に説明する。なお、その全体処理は、CPU1が、ROM4に格納されたプログラムを実行して電子楽器のリソースを使用することにより実現される。
ステップ404では、図2に示すスライダ21、22への操作に対応するためのスライダ処理を実行する。続くステップ405では、表示部6を構成するLCD、或いはLEDを駆動してユーザに提供すべき情報を提供するといったことを実現するためのその他処理を実行する。その実行後は上記ステップ402に戻る。それにより、電源がオンされている間、ステップ402〜405で形成される処理ループを繰り返し実行する。
ステップ603では、入力バッファ301から1フレームサイズの元音声データを抽出し、窓関数(例えばハニング窓)を乗算する。次のステップ604では、乗算後のフレームを対象にFFTを行い、周波数信号成分と位相成分に分ける。その次に移行するステップ605では、周波数信号成分のフィルタリング処理を行い、そのフィルタリング処理前後の周波数振幅成分の比(=フィルタリング処理前/フィルタリング処理後)である周波数振幅残差を算出する。ステップ606にはその後に移行する。
図7は、上記ステップ606として実行されるフォルマントシフト処理のフローチャートである。始めに図7を参照して、そのシフト処理について詳細に説明する。
ステップ704では、配列変数ShiftMagの変数ShiftIdxの値で指定される要素ShiftMag[ShiftIdx]に、配列変数Magの変数iの値で指定される要素Mag[i]の値を代入し、変数ShiftIdxの値をインクリメントする。その次に移行するステップ705では、変数ShiftIdxの値が変数Nextの値より小さいか否か判定する。前者が後者より小さい場合、判定はYESとなって上記ステップ703に戻る。そうでない場合には、判定はNOとなってステップ706に移行する。
図6に示す楽音タイマインタラプト処理において、ステップ605で算出した周波数振幅残差は1次元の配列変数ResMagの各要素に代入され、ステップ608で算出した瞬時周波数は1次元の配列変数Freqの各要素に代入される。それらの要素を指定する添字の値はインデクス値に対応する。このことから、それらのシフトはフォルマントシフト処理における周波数振幅成分のシフトと同様に行われる。シフト後の周波数振幅残差、瞬時周波数は、1次元の配列変数ShiftResMagの要素、1次元の配列変数ShiftFreqの要素にそれぞれ代入される。
<第2の実施例>
上記第1の実施例では、ピッチをシフトするために周波数振幅残差のシフトを行っている。これに対し、第2の実施例は、そのピッチのシフトを他の方法で実現させるようにしたものである。
上述したような音声分析生成装置、或いはその変形例を実現させるようなプログラムは、CD−ROM、DVD、或いは光磁気ディスク等の記録媒体に記録させて配布しても良い。或いは、公衆網等で用いられる伝送媒体を介して、そのプログラムの一部、若しくは全部を配信するようにしても良い。そのようにした場合には、ユーザーはプログラムを取得してコンピュータなどのデータ処理装置にロードすることにより、そのデータ処理装置を用いて本発明を適用させた音声分析生成装置を実現させることができる。このことから、記録媒体は、プログラムを配信する装置がアクセスできるものであっても良い。
3 スイッチ部
4 ROM
5 RAM
7 マイク
8 A/D変換器
9 楽音生成部
10 D/A変換器
11 アンプ
12 スピーカ
13 スライダ部
Claims (7)
- 第1の音声波形を分析し、該分析結果を用いて第2の音声波形の生成を行う音声分析生成装置において、
前記第1の音声波形を分析して第1の周波数振幅成分、及び位相成分を抽出する分析手段と、
高域周波数振幅成分のフィルタリングを行う低域通過フィルタ手段と、
前記第1の周波数振幅成分に対するフォルマントのシフト量を指示する指示手段と、
前記指示手段により指示されたシフト量に従いシフトを行うシフト手段と、
前記第1の周波数振幅成分に対し前記低域通過フィルタ手段がフィルタリングすることで得られる第2の周波数振幅成分で該第1の周波数振幅成分を除算することにより周波数振幅残差を算出する算出手段と、
前記シフト手段がシフトした第1の周波数振幅成分に対する前記低域通過フィルタ手段によるフィルタリング、及び前記第2の周波数振幅成分に対する前記シフト手段によるシフトのうちの一方を行うことで得られる第3の周波数振幅成分に前記周波数振幅残差を乗算する乗算手段と、
前記乗算手段が乗算を行うことで得られる第4の周波数振幅成分、及び前記位相成分を用いて前記第2の音声波形を生成する音声波形生成手段と、
を具備することを特徴とする音声分析生成装置。 - 第1の音声波形を分析し、該分析結果を用いて第2の音声波形の生成を行う音声分析生成装置において、
前記第1の音声波形を分析して第1の周波数振幅成分、及び第1の位相成分を抽出する分析手段と、
高域周波数振幅成分のフィルタリングを行う低域通過フィルタ手段と、
前記周波数振幅成分に対しフォルマントのシフトを行う第1のシフト手段と、
前記第1の周波数振幅成分に対し前記低域通過フィルタ手段がフィルタリングすることで得られた第2の周波数振幅成分で該第1の周波数振幅成分を除算して得られる周波数振幅残差を算出する残差算出手段と、
前記第1の位相成分から瞬時周波数を算出する瞬時周波数算出手段と、
ピッチのシフト量を指示するピッチ指示手段と、
前記ピッチ指示手段が指示したシフト量に従って、前記瞬時周波数、及び周波数振幅残差をシフトする第2のシフト手段と、
前記第1のシフト手段がシフトした第1の周波数振幅成分に対する前記低域通過フィルタ手段によるフィルタリング、及び前記第2の周波数振幅成分に対する前記第1のシフト手段によるシフトのうちの一方を行うことで得られる第3の周波数振幅成分に、前記第2のシフト手段によりシフトされた周波数振幅残差を乗算して第4の周波数振幅成分を算出する振幅成分算出手段と、
前記第2のシフト手段によりシフトされた瞬時周波数から第2の位相成分を算出する位相成分算出手段と、
前記第4の周波数振幅成分、及び前記第2の位相成分を用いて前記第2の音声波形を生成する音声波形生成手段と、
を具備することを特徴とする音声分析生成装置。 - 前記分析手段は、高速フーリエ変換を用いて前記第1の音声波形の分析を行い、
前記音声波形生成手段は、逆高速フーリエ変換を用いて前記第2の音声波形を生成する、
ことを特徴とする請求項1または2記載の音声分析生成装置。 - 前記低域通過フィルタ手段は、移動平均フィルタとして機能するものである、
ことを特徴とする請求項1〜3の何れか1項に記載の音声分析生成装置。 - 前記第2の音声波形を前記第1の音声波形に重畳して出力できる、
ことを特徴とする請求項1〜4の何れか1項に記載の音声分析生成装置。 - 第1の音声波形を分析し、該分析結果を用いて第2の音声波形の生成を行う音声分析生成装置に実行させるプログラムであって、
前記第1の音声波形を分析して第1の周波数振幅成分、及び位相成分を抽出する分析機能と、
高域周波数振幅成分のフィルタリングを行う低域通過フィルタ機能と、
前記第1の周波数振幅成分に対するフォルマントのシフト量を指示する指示機能と、
前記指示機能により指示されたシフト量に従いシフトを行うシフト機能と、
前記第1の周波数振幅成分に対し前記低域通過フィルタ機能によりフィルタリングすることで得られる第2の周波数振幅成分で該第1の周波数振幅成分を除算して得られる周波数振幅残差を算出する算出機能と、
前記シフト機能によりシフトした第1の周波数振幅成分に対する前記低域通過フィルタ機能によるフィルタリング、及び前記第2の周波数振幅成分に対する前記シフト機能によるシフトのうちの一方を行うことで得られる第3の周波数振幅成分に前記周波数振幅残差を乗算する乗算機能と、
前記乗算機能により乗算を行うことで得られる第4の周波数振幅成分、及び前記位相成分を用いて前記第2の音声波形を生成する音声波形生成機能と、
を実現させるためのプログラム。 - 第1の音声波形を分析し、該分析結果を用いて第2の音声波形の生成を行う音声分析生成装置に実行させるプログラムであって、
前記第1の音声波形を分析して第1の周波数振幅成分、及び第1の位相成分を抽出する分析機能と、
高域周波数振幅成分のフィルタリングを行う低域通過フィルタ機能と、
前記周波数振幅成分に対しフォルマントのシフトを行う第1のシフト機能と、
前記第1の周波数振幅成分に対し前記低域通過フィルタ機能によりフィルタリングすることで得られる第2の周波数振幅成分で該第1の周波数振幅成分を除算して得られる周波数振幅残差を算出する残差算出機能と、
前記第1の位相成分から瞬時周波数を算出する瞬時周波数算出機能と、
ピッチのシフト量を指示するピッチ指示機能と、
前記ピッチ指示機能により指示したシフト量に従って、前記瞬時周波数、及び周波数振幅残差をシフトする第2のシフト機能と、
前記第1のシフト機能によりシフトした第1の周波数振幅成分に対する前記低域通過フィルタ機能によるフィルタリング、及び前記第2の周波数振幅成分に対する前記第1のシフト機能によるシフトのうちの一方を行うことで得られる第3の周波数振幅成分に、前記第2のシフト機能によりシフトされた周波数振幅残差を乗算して第4の周波数振幅成分を算出する振幅成分算出機能と、
前記第2のシフト機能によりシフトされた瞬時周波数から第2の位相成分を算出する位相成分算出機能と、
前記第4の周波数振幅成分、及び前記第2の位相成分を用いて前記第2の音声波形を生成する音声波形生成機能と、
を実現させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003320312A JP4419486B2 (ja) | 2003-09-11 | 2003-09-11 | 音声分析生成装置、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003320312A JP4419486B2 (ja) | 2003-09-11 | 2003-09-11 | 音声分析生成装置、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005084661A JP2005084661A (ja) | 2005-03-31 |
JP4419486B2 true JP4419486B2 (ja) | 2010-02-24 |
Family
ID=34418980
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003320312A Expired - Fee Related JP4419486B2 (ja) | 2003-09-11 | 2003-09-11 | 音声分析生成装置、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4419486B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7417273B2 (ja) | 2018-10-05 | 2024-01-18 | 知明 高田 | トルク変換装置 |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8809560B2 (en) | 2011-05-17 | 2014-08-19 | Board Of Trustees Of The University Of Arkansas | Trans-, trans-conjugated linoleic acid compositions and use thereof |
KR102601072B1 (ko) * | 2021-10-21 | 2023-11-09 | 서울대학교산학협력단 | 모터 고장 진단을 위한 이미지 생성 방법 및 장치, 상기 이미지를 이용한 모터 고장 진단 방법 및 장치 |
-
2003
- 2003-09-11 JP JP2003320312A patent/JP4419486B2/ja not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7417273B2 (ja) | 2018-10-05 | 2024-01-18 | 知明 高田 | トルク変換装置 |
Also Published As
Publication number | Publication date |
---|---|
JP2005084661A (ja) | 2005-03-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zölzer et al. | DAFX-Digital audio effects | |
Verfaille et al. | Adaptive digital audio effects (A-DAFx): A new class of sound transformations | |
RU2487426C2 (ru) | Устройство и способ преобразования звукового сигнала в параметрическое представление, устройство и способ модификации параметрического представления, устройство и способ синтеза параметрического представления звукового сигнала | |
Park | Introduction to digital signal processing: Computer musically speaking | |
JP5283757B2 (ja) | オーディオ信号のスペクトルの複数の局部重心周波数を決定するための装置及び方法 | |
JP5057535B1 (ja) | ミキシング装置、ミキシング信号処理装置、ミキシングプログラム及びミキシング方法 | |
JP4645241B2 (ja) | 音声処理装置およびプログラム | |
CN111418005B (zh) | 声音合成方法、声音合成装置及存储介质 | |
CN108269579B (zh) | 语音数据处理方法、装置、电子设备及可读存储介质 | |
Creasey | Audio Processes: Musical Analysis, Modification, Synthesis, and Control | |
JP3430985B2 (ja) | 合成音生成装置 | |
Välimäki et al. | Creating endless sounds | |
JP2018077283A (ja) | 音声合成方法 | |
JP4419486B2 (ja) | 音声分析生成装置、及びプログラム | |
JP4433734B2 (ja) | 音声分析合成装置、音声分析装置、及びプログラム | |
CN112908351A (zh) | 一种音频变调方法、装置、设备及存储介质 | |
Hanna et al. | Time scale modification of noises using a spectral and statistical model | |
JP5251381B2 (ja) | 音処理装置およびプログラム | |
JP4245114B2 (ja) | 音色制御装置 | |
JP5211437B2 (ja) | 音声処理装置およびプログラム | |
O’Donovan et al. | Perceptually motivated time-frequency analysis | |
JP2019074580A (ja) | 音声認識方法、装置およびプログラム | |
JP2009237590A (ja) | 音声効果付与装置 | |
JP2018077281A (ja) | 音声合成方法 | |
JP4729859B2 (ja) | 音響効果装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060405 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090424 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090519 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090528 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090804 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090820 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20091110 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20091123 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121211 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4419486 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121211 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131211 Year of fee payment: 4 |
|
LAPS | Cancellation because of no payment of annual fees |