JP2012042722A - 音声生成装置およびその制御プログラム - Google Patents
音声生成装置およびその制御プログラム Download PDFInfo
- Publication number
- JP2012042722A JP2012042722A JP2010183923A JP2010183923A JP2012042722A JP 2012042722 A JP2012042722 A JP 2012042722A JP 2010183923 A JP2010183923 A JP 2010183923A JP 2010183923 A JP2010183923 A JP 2010183923A JP 2012042722 A JP2012042722 A JP 2012042722A
- Authority
- JP
- Japan
- Prior art keywords
- coordinate value
- formant
- frequency
- sound
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000009826 distribution Methods 0.000 claims abstract description 4
- 238000001514 detection method Methods 0.000 claims description 30
- 238000000034 method Methods 0.000 description 13
- 230000008569 process Effects 0.000 description 12
- 238000004519 manufacturing process Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 10
- 230000001755 vocal effect Effects 0.000 description 9
- 230000006870 function Effects 0.000 description 5
- 238000003860 storage Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 3
- 210000004072 lung Anatomy 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 210000001260 vocal cord Anatomy 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 210000000867 larynx Anatomy 0.000 description 2
- 210000000214 mouth Anatomy 0.000 description 2
- 210000003928 nasal cavity Anatomy 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 210000003800 pharynx Anatomy 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- 208000021642 Muscular disease Diseases 0.000 description 1
- 208000012902 Nervous system disease Diseases 0.000 description 1
- 208000018737 Parkinson disease Diseases 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 206010008129 cerebral palsy Diseases 0.000 description 1
- 208000026106 cerebrovascular disease Diseases 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 230000008921 facial expression Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000003387 muscular Effects 0.000 description 1
- 201000006938 muscular dystrophy Diseases 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
- 230000000241 respiratory effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Abstract
【解決手段】表示部12には、第1ホルマント周波数と第2ホルマント周波数の2次元平面上における分布が音声生成GUIとして表示されており、そのGUI上には、母音a,i,u,e,oを発したときの第1ホルマント周波数と第2ホルマント周波数が、「a」、「i」、「u、「e」、「o」としてそれぞれ示されている。ユーザは、発話内容を、マウス11Aを用いて音声生成GUI上で操作する。音声生成装置1は、マウス11Aの動作に追随するポインタPが描いた軌跡から、第1ホルマント周波数と第2ホルマント周波数の2次元平面上におけるXY座標位置を検出し、検出したX座標値で規定されている第1ホルマント周波数の音声と、Y座標値で規定されている第2ホルマント周波数の音声とを合成し、合成した疑似的な音声をスピーカ13から発声させる。
【選択図】図2
Description
図1は、母音の発声の仕組みについて説明するための図である。
図2は、本発明の第1の実施の形態としての音声生成装置1の構成例を示す図である。
以上のように、第1の実施の形態によれば、マウス11Aやタッチパッド11Bなどを用いて、直感的な操作で、疑似的な音声をリアルタイムに生成することが可能となる。
次に、本発明の第2の実施の形態について、図6および図7を参照して説明する。
以上のように、第2の実施の形態によれば、操作バー51を用いて、直感的な操作で、疑似的な音声をリアルタイムに生成することが可能となる。
1.以上においては、入力デバイスとして、マウス11A、タッチパッド11B、および操作バー51を用いる場合を例に説明したが、他にも、タッチペンやジョイスティックなどを利用することも勿論可能である。つまり、ユーザの症例に合わせて入力デバイスを切り替えるようにすることが好ましい。
11 入力デバイス
12 表示部
13 スピーカ
21 音源生成部
22 音声生成部
Claims (5)
- 基本周波数の音声データを生成する音源生成手段と、
入力手段の操作に基づいて座標値を検出する座標値検出手段と、
前記音源生成手段で生成された前記基本周波数の音声データを、前記座標値検出手段により検出された前記座標値に対応する第1の周波数で共振させる第1の共振手段と、
前記第1の共振手段により共振された前記音声データを、前記座標値検出手段により検出された前記座標値に対応する第2の周波数で共振させる第2の共振手段と
を備えることを特徴とする音声生成装置。 - 前記第1の周波数と前記第2の周波数の2次元平面上における分布を表示する表示手段をさらに備え、
前記座標値検出手段は、前記表示手段上で行われた前記入力手段の操作に基づく座標値を検出する
ことを特徴とする請求項1に記載の音声生成装置。 - 前記第1の周波数は、第1ホルマント周波数であり、前記第2の周波数は、第2ホルマント周波数であり、
前記座標値検出手段は、前記第1ホルマント周波数と前記第2ホルマント周波数の2次元平面上におけるX座標値とY座標値を検出する
ことを特徴とする請求項1または請求項2に記載の音声生成装置。 - 前記第2の共振手段により共振された前記音声データを出力する出力手段をさらに備える
ことを特徴とする請求項1乃至請求項3のいずれかに記載の音声生成装置。 - 基本周波数の音声データを生成する音源生成ステップと、
入力手段の操作に基づいて座標値を検出する座標値検出ステップと、
前記音源生成ステップで生成された前記基本周波数の音声データを、前記座標値検出ステップにより検出された前記座標値に対応する第1の周波数で共振させる第1の共振ステップと、
前記第1の共振ステップにより共振された前記音声データを、前記座標値検出ステップにより検出された前記座標値に対応する第2の周波数で共振させる第2の共振ステップと
を含む処理をコンピュータに実行させることを特徴とするプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010183923A JP5224552B2 (ja) | 2010-08-19 | 2010-08-19 | 音声生成装置およびその制御プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010183923A JP5224552B2 (ja) | 2010-08-19 | 2010-08-19 | 音声生成装置およびその制御プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012042722A true JP2012042722A (ja) | 2012-03-01 |
JP5224552B2 JP5224552B2 (ja) | 2013-07-03 |
Family
ID=45899114
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010183923A Active JP5224552B2 (ja) | 2010-08-19 | 2010-08-19 | 音声生成装置およびその制御プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5224552B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106057192A (zh) * | 2016-07-07 | 2016-10-26 | Tcl集团股份有限公司 | 一种实时语音转换方法和装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000503412A (ja) * | 1996-01-15 | 2000-03-21 | ブリティッシュ・テレコミュニケーションズ・パブリック・リミテッド・カンパニー | 波形の合成 |
JP2009258366A (ja) * | 2008-04-16 | 2009-11-05 | Arcadia:Kk | 音声制御装置 |
-
2010
- 2010-08-19 JP JP2010183923A patent/JP5224552B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000503412A (ja) * | 1996-01-15 | 2000-03-21 | ブリティッシュ・テレコミュニケーションズ・パブリック・リミテッド・カンパニー | 波形の合成 |
JP2009258366A (ja) * | 2008-04-16 | 2009-11-05 | Arcadia:Kk | 音声制御装置 |
Non-Patent Citations (2)
Title |
---|
CSNG200600579011; 藪謙一郎他: '"発話障害者支援のための音声合成器の基礎的設計"' 電子情報通信学会技術研究報告 Vol.105,No.686(2006-03), pp.59-64 * |
JPN6012031994; 藪謙一郎他: '"発話障害者支援のための音声合成器の基礎的設計"' 電子情報通信学会技術研究報告 Vol.105,No.686(2006-03), pp.59-64 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106057192A (zh) * | 2016-07-07 | 2016-10-26 | Tcl集团股份有限公司 | 一种实时语音转换方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
JP5224552B2 (ja) | 2013-07-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Heidemann | A System for Describing Vocal Timbre in Popular Song. | |
Stylianou | Voice transformation: a survey | |
Tran et al. | Improvement to a NAM-captured whisper-to-speech system | |
JP4363590B2 (ja) | 音声合成 | |
Arimoto et al. | Naturalistic emotional speech collection paradigm with online game and its psychological and acoustical assessment | |
CN111418006B (zh) | 声音合成方法、声音合成装置及记录介质 | |
Hansen et al. | On the issues of intra-speaker variability and realism in speech, speaker, and language recognition tasks | |
JPWO2020145353A1 (ja) | コンピュータプログラム、サーバ装置、端末装置及び音声信号処理方法 | |
Barkana et al. | Analysis of vowel production in Mandarin/Hindi/American-accented English for accent recognition systems | |
JP2018005048A (ja) | 声質変換システム | |
Fine et al. | Making myself understood: perceived factors affecting the intelligibility of sung text | |
Potamianos et al. | A review of the acoustic and linguistic properties of children's speech | |
JP5224552B2 (ja) | 音声生成装置およびその制御プログラム | |
Rilliard et al. | Paradigmatic variation of vowels in expressive speech: Acoustic description and dimensional analysis | |
JP6291808B2 (ja) | 音声合成装置及び方法 | |
JP6044284B2 (ja) | 音声合成装置 | |
JP7069386B1 (ja) | 音声変換装置、音声変換方法、プログラム、および記録媒体 | |
JP2020003762A (ja) | 簡易操作声質変換システム | |
Oh et al. | LOLOL: Laugh Out Loud On Laptop. | |
Story | TubeTalker: An airway modulation model of human sound production | |
Yoshimura et al. | A" voice" instrument based on vocal tract models by using soft material for a 3D printer and an electrolarynx. | |
Howard | The vocal tract organ and the vox humana organ stop | |
Jones | Compositional control of phonetic/nonphonetic perception | |
JP6274470B1 (ja) | 上下発声母音表記方法 | |
Saiteja | Towards building controllable Text to Speech systems |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120615 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120626 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120822 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130219 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130308 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5224552 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160322 Year of fee payment: 3 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313117 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |