JP2014095856A - 音声処理装置 - Google Patents
音声処理装置 Download PDFInfo
- Publication number
- JP2014095856A JP2014095856A JP2012248265A JP2012248265A JP2014095856A JP 2014095856 A JP2014095856 A JP 2014095856A JP 2012248265 A JP2012248265 A JP 2012248265A JP 2012248265 A JP2012248265 A JP 2012248265A JP 2014095856 A JP2014095856 A JP 2014095856A
- Authority
- JP
- Japan
- Prior art keywords
- pronunciation
- phoneme
- recognition
- time
- syllable
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012545 processing Methods 0.000 title claims description 42
- 230000005236 sound signal Effects 0.000 claims description 34
- 238000012423 maintenance Methods 0.000 claims description 12
- 230000015572 biosynthetic process Effects 0.000 abstract description 12
- 238000003786 synthesis reaction Methods 0.000 abstract description 12
- 238000000034 method Methods 0.000 description 22
- 230000008569 process Effects 0.000 description 12
- 230000008901 benefit Effects 0.000 description 8
- 230000006870 function Effects 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 230000010365 information processing Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000002940 repellent Effects 0.000 description 2
- 239000005871 repellent Substances 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- MQJKPEGWNLWLTK-UHFFFAOYSA-N Dapsone Chemical compound C1=CC(N)=CC=C1S(=O)(=O)C1=CC=C(N)C=C1 MQJKPEGWNLWLTK-UHFFFAOYSA-N 0.000 description 1
- 206010011878 Deafness Diseases 0.000 description 1
- 101100088247 Picea mariana RPL13A gene Proteins 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
Images
Landscapes
- Electrophonic Musical Instruments (AREA)
Abstract
【解決手段】音声取得部22は、利用者が発音した音声の音声信号V1を音声入力装置14から取得する。指示取得部24は、利用者が指示した各音符の発音時点を指定する指示情報Uを指示入力装置16から取得する。音声認識部32は、音声信号V1に対する音声認識で発音内容Zを特定する。具体的には、音声認識部32は、音素の配列または各音素の開始時点が相違する複数の認識候補の各々について、当該認識候補の各音素の開始時点と指示情報Uが指定する各発音時点との時間軸上の関係に応じて当該認識候補の棄却/維持を判別し、維持された複数の認識候補から音声信号V1の発音内容を特定する。情報生成部34は、音声認識部32が特定した発音内容Zと指示情報Uが発音時点を指定する各音符との関係を示す発音情報Sを生成する。
【選択図】図1
Description
図1は、本発明の第1実施形態に係る音声処理装置100のブロック図である。音声処理装置100は、利用者が指定した旋律(複数の音符の時系列)を利用者が指定した歌詞で歌唱した音声の音声信号V2を生成する音声合成装置(信号処理装置)であり、演算処理装置10と記憶装置12と音声入力装置14と指示入力装置16と放音装置18とを具備するコンピュータシステムで実現される。
本発明の第2実施形態を以下に説明する。なお、以下に例示する各形態において作用や機能が第1実施形態と同様である要素については、第1実施形態の説明で参照した符号を流用して各々の詳細な説明を適宜に省略する。
第1実施形態では、指示入力装置16に対する利用者からの指示に応じて各音符の音高XAを設定した。第3実施形態では、音声入力装置14が生成した音声信号V1の音高(ピッチ)を音声信号V2の各音符の音高に反映させる。したがって、利用者は、指示入力装置16に指示する旋律に対応する音高の音声を音声入力装置14に対して発音する。
以上の各形態は多様に変形され得る。具体的な変形の態様を以下に例示する。以下の例示から任意に選択された2以上の態様は適宜に併合され得る。
Claims (5)
- 音声信号を取得する音声取得手段と、
利用者が指示した各音符の発音時点を指定する指示情報を取得する指示取得手段と、
音素の配列または各音素の開始時点が相違する複数の認識候補の各々について、当該認識候補の各音素の開始時点と前記指示情報が指定する各発音時点との時間軸上の関係に応じて当該認識候補の棄却/維持を判別し、維持された複数の認識候補から音声信号の発音内容を特定する音声認識手段と、
前記音声認識手段が特定した発音内容と前記指示情報が発音時点を指定する各音符との関係を示す発音情報を生成する情報生成手段と
を具備する音声処理装置。 - 前記音声認識手段は、前記認識候補の複数の音素のうち持続的に発音可能な各音節内核音素の開始時点の最近傍に位置する発音時点を、前記指示情報が指定する複数の発音時点から特定し、何れかの発音時点に複数の音節内核音素が対応する場合に当該認識候補を棄却する
請求項1の音声処理装置。 - 前記情報生成手段は、前記指示情報が指定する各発音時点の音符に、前記音声認識手段が特定した発音内容の複数の音節のうち当該発音時点を最近傍とする音節内核音素を含む音節を割当て、何れの音節内核音素にとっても最近傍に該当しない発音時点の音符には、前記発音内容の複数の音節のうち当該発音時点に対応する音節を割当てる
請求項2の音声処理装置。 - 前記音声認識手段は、
前記認識候補の複数の音素のうち持続的に発音可能な各音節内核音素の開始時点の最近傍に位置する発音時点を、前記指示情報が指定する複数の発音時点から特定し、
前記認識候補の各音節内核音素を、当該認識候補内で母音の直後に位置する結合候補音素と前記結合候補音素以外の優先割当音素とに選別し、
前記指示情報が指定する何れかの発音時点に複数の優先割当音素が対応する場合に当該認識候補を棄却し、
前記指示情報が指定する何れかの発音時点に1個の音節内核音素が対応する場合の当該音節内核音素と、何れかの発音時点に1個の優先割当音素と1個以上の結合候補音素とが対応する場合の当該優先割当音素とを確定音素としたとき、前記認識候補内で相前後する各確定音素の間に、M個(Mは2以上の自然数)を上回る結合候補音素が存在する場合に、当該認識候補を棄却する
請求項1の音声処理装置。 - 前記情報生成手段は、前記指示情報が指定する各発音時点の音符に、前記音声認識手段が特定した発音内容の複数の音節のうち当該発音時点を最近傍とする確定音素を含む音節を割当て、各確定音素の間の結合候補音素を直前の音節と共通の音符に割当てる
請求項4の音声処理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012248265A JP6056394B2 (ja) | 2012-11-12 | 2012-11-12 | 音声処理装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012248265A JP6056394B2 (ja) | 2012-11-12 | 2012-11-12 | 音声処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014095856A true JP2014095856A (ja) | 2014-05-22 |
JP6056394B2 JP6056394B2 (ja) | 2017-01-11 |
Family
ID=50938938
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012248265A Active JP6056394B2 (ja) | 2012-11-12 | 2012-11-12 | 音声処理装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6056394B2 (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105446123A (zh) * | 2016-01-04 | 2016-03-30 | 阿亦睿机器人科技(上海)有限公司 | 一种语音智能闹钟 |
CN114078464A (zh) * | 2022-01-19 | 2022-02-22 | 腾讯科技(深圳)有限公司 | 音频处理方法、装置及设备 |
US11854521B2 (en) | 2019-12-23 | 2023-12-26 | Casio Computer Co., Ltd. | Electronic musical instruments, method and storage media |
US11996082B2 (en) | 2019-12-23 | 2024-05-28 | Casio Computer Co., Ltd. | Electronic musical instruments, method and storage media |
US12106745B2 (en) | 2020-03-23 | 2024-10-01 | Casio Computer Co., Ltd. | Electronic musical instrument and control method for electronic musical instrument |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6283799A (ja) * | 1985-10-08 | 1987-04-17 | 松下電器産業株式会社 | 音声認識装置 |
JPH0527771A (ja) * | 1991-07-23 | 1993-02-05 | Yamaha Corp | 電子楽器 |
JPH09179572A (ja) * | 1995-12-25 | 1997-07-11 | Taito Corp | 音声変換回路とカラオケ装置 |
JPH11133990A (ja) * | 1997-10-31 | 1999-05-21 | Yamaha Corp | 音声信号または楽音信号の処理装置および音声信号または楽音信号の処理プログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP2002221978A (ja) * | 2001-01-26 | 2002-08-09 | Yamaha Corp | ボーカルデータ生成装置、ボーカルデータ生成方法および歌唱音合成装置 |
JP2005084660A (ja) * | 2003-09-11 | 2005-03-31 | Casio Comput Co Ltd | 音声分析合成装置、音声分析装置、音声合成装置、及びプログラム |
JP2006258846A (ja) * | 2005-03-15 | 2006-09-28 | Yamaha Corp | 歌データ入力プログラム |
JP2011128186A (ja) * | 2009-12-15 | 2011-06-30 | Yamaha Corp | 音声合成装置 |
JP2012022121A (ja) * | 2010-07-14 | 2012-02-02 | Yamaha Corp | 音声合成装置 |
-
2012
- 2012-11-12 JP JP2012248265A patent/JP6056394B2/ja active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6283799A (ja) * | 1985-10-08 | 1987-04-17 | 松下電器産業株式会社 | 音声認識装置 |
JPH0527771A (ja) * | 1991-07-23 | 1993-02-05 | Yamaha Corp | 電子楽器 |
JPH09179572A (ja) * | 1995-12-25 | 1997-07-11 | Taito Corp | 音声変換回路とカラオケ装置 |
JPH11133990A (ja) * | 1997-10-31 | 1999-05-21 | Yamaha Corp | 音声信号または楽音信号の処理装置および音声信号または楽音信号の処理プログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP2002221978A (ja) * | 2001-01-26 | 2002-08-09 | Yamaha Corp | ボーカルデータ生成装置、ボーカルデータ生成方法および歌唱音合成装置 |
JP2005084660A (ja) * | 2003-09-11 | 2005-03-31 | Casio Comput Co Ltd | 音声分析合成装置、音声分析装置、音声合成装置、及びプログラム |
JP2006258846A (ja) * | 2005-03-15 | 2006-09-28 | Yamaha Corp | 歌データ入力プログラム |
JP2011128186A (ja) * | 2009-12-15 | 2011-06-30 | Yamaha Corp | 音声合成装置 |
JP2012022121A (ja) * | 2010-07-14 | 2012-02-02 | Yamaha Corp | 音声合成装置 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105446123A (zh) * | 2016-01-04 | 2016-03-30 | 阿亦睿机器人科技(上海)有限公司 | 一种语音智能闹钟 |
US11854521B2 (en) | 2019-12-23 | 2023-12-26 | Casio Computer Co., Ltd. | Electronic musical instruments, method and storage media |
US11996082B2 (en) | 2019-12-23 | 2024-05-28 | Casio Computer Co., Ltd. | Electronic musical instruments, method and storage media |
US12106745B2 (en) | 2020-03-23 | 2024-10-01 | Casio Computer Co., Ltd. | Electronic musical instrument and control method for electronic musical instrument |
CN114078464A (zh) * | 2022-01-19 | 2022-02-22 | 腾讯科技(深圳)有限公司 | 音频处理方法、装置及设备 |
CN114078464B (zh) * | 2022-01-19 | 2022-03-22 | 腾讯科技(深圳)有限公司 | 音频处理方法、装置及设备 |
Also Published As
Publication number | Publication date |
---|---|
JP6056394B2 (ja) | 2017-01-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP2733696B1 (en) | Voice synthesizing method and voice synthesizing apparatus | |
CN110390922B (zh) | 电子乐器、电子乐器的控制方法以及存储介质 | |
JP6587008B1 (ja) | 電子楽器、電子楽器の制御方法、及びプログラム | |
US5521324A (en) | Automated musical accompaniment with multiple input sensors | |
JP7143816B2 (ja) | 電子楽器、電子楽器の制御方法、及びプログラム | |
CN111696498B (zh) | 键盘乐器以及键盘乐器的计算机执行的方法 | |
JP6056394B2 (ja) | 音声処理装置 | |
US9711133B2 (en) | Estimation of target character train | |
CN113506554A (zh) | 电子乐器、电子乐器的控制方法 | |
CN110310615A (zh) | 唱歌练习装置、唱歌练习方法及存储介质 | |
JP2001117568A (ja) | 歌唱評価装置およびカラオケ装置 | |
JP6766935B2 (ja) | 電子楽器、電子楽器の制御方法、及びプログラム | |
JP6760457B2 (ja) | 電子楽器、電子楽器の制御方法、及びプログラム | |
JP6252420B2 (ja) | 音声合成装置、及び音声合成システム | |
JP6098422B2 (ja) | 情報処理装置、及びプログラム | |
US20220044662A1 (en) | Audio Information Playback Method, Audio Information Playback Device, Audio Information Generation Method and Audio Information Generation Device | |
JP2013210501A (ja) | 素片登録装置,音声合成装置,及びプログラム | |
JP6578544B1 (ja) | 音声処理装置、および音声処理方法 | |
JP2001117598A (ja) | 音声変換装置及び方法 | |
JP5810947B2 (ja) | 発声区間特定装置、音声パラメータ生成装置、及びプログラム | |
Gu et al. | Singing-voice synthesis using demi-syllable unit selection | |
JP2022065554A (ja) | 音声合成方法およびプログラム | |
JP2022047167A (ja) | 電子楽器、電子楽器の制御方法、及びプログラム | |
JP7158331B2 (ja) | カラオケ装置 | |
JP2022038903A (ja) | 電子楽器、電子楽器の制御方法、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20150410 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150917 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20161024 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20161108 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20161121 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6056394 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313532 |