JP4906776B2 - 音声制御装置 - Google Patents
音声制御装置 Download PDFInfo
- Publication number
- JP4906776B2 JP4906776B2 JP2008106923A JP2008106923A JP4906776B2 JP 4906776 B2 JP4906776 B2 JP 4906776B2 JP 2008106923 A JP2008106923 A JP 2008106923A JP 2008106923 A JP2008106923 A JP 2008106923A JP 4906776 B2 JP4906776 B2 JP 4906776B2
- Authority
- JP
- Japan
- Prior art keywords
- vowel
- feature amount
- similarity
- vector
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000013507 mapping Methods 0.000 claims description 18
- 230000005236 sound signal Effects 0.000 claims description 14
- 230000002123 temporal effect Effects 0.000 claims description 9
- 230000001133 acceleration Effects 0.000 claims description 3
- 238000000034 method Methods 0.000 description 6
- 239000006185 dispersion Substances 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
Images
Description
1.1全体構成
図1にこの発明の一実施形態による音声制御装置の機能ブロック図を示す。音声取得部2は、音声を取得し電気信号に変換する。特徴量算出手段4は、音声電気信号を周波数解析し、特徴量を算出する。母音判定手段6は、算出した特徴量に基づいて、予め登録された母音との類似度に基づいて母音の判定を行う。制御手段8は、各母音を異なる方向に対応づけた平面または空間において、母音判定手段6によって判定された母音に対応する方向に、その類似度に対応する大きさのベクトルを想定する。制御手段8は、このようにして想定したベクトルに基づいて制御信号を出力する。このようにして、音声に基づいた制御を行うことができる。
図1の音声制御装置のハードウエア構成を図2に示す。CPU18には、ディスプレイ12、操作部14、A/D変換器16、メモリ20、フラッシュメモリ22が接続されている。操作部14は、キーボードやポインティングデバイスなどである。マイク24は、A/D変換器16を介してCPU18に接続されている。フラッシュメモリ22には、音声制御プログラム、MFCCパラメータの基準値・分散値やアプリケーションプログラムが記録されている。
図3に、フラッシュメモリ22に記録された音声制御プログラムのフローチャートを示す。ユーザがマイクに発話すると、この音声信号はA/D変換器16によってディジタルデータに変換され、メモリ20に記録される。CPU18は、メモリ20に記録された音声データを、所定時間分(たとえば5秒)取り込む(ステップS1)。次に、CPU18は、取り込んだ音声データを周波数解析し、MFCCパラメータを算出する(ステップS2)。具体的には、音声データをケプストラム解析し、フィルタバンク分析によって12次までのスペクトル成分を算出する。図5にこのようにして算出したMFCCパラメータの例を示す。この実施形態では1次から12次までのパラメータを算出している。
(1)上記実施形態では、各母音を2次元平面の軸に配置しているが、図10Aに示すように、三次元以上の空間軸に配置し、これにしたがってマッピングし制御を行うようにしてもよい。
2.1全体構成
図12に、この発明の一実施形態による歌唱力判定装置の機能ブロック図を示す。音声取得部2、特徴量算出手段4、母音判定手段6は、第一の実施形態と同様である。この実施形態では、制御手段8は、比較手段81、読出手段82、計数手段84を備えている。読出手段82は、カラオケデータ83を読み出し表示部10a、音声出力部10bに与える。これにより音声出力部10bから、カラオケ演奏が出力され、表示部10aには演奏に合わせて歌詞が表示される。ユーザは、これに合わせて歌を歌う。
図13に、図12の歌唱力判定装置のハードウエア構成を示す。この実施形態では、携帯電話装置に歌唱力判定プログラムを組み込んだものを例として示している。
図14に、歌唱力判定プログラムのフローチャートを示す。CPU18は、フラッシュメモリ22からカラオケデータを読み出す(ステップS51)。このカラオケデータには、伴奏データ、歌詞データと母音変化正解データが含まれている。母音変化正解データは、伴奏の進行に合致した歌の母音変化のタイミングを示すものである。
(1)上記実施形態では、母音変化のタイミングによって歌唱力の判定を行った。しかし、声の大きさについて正解データとの比較を行い、上記のタイミングと大きさの双方によって得点を付けるようにしてもよい。
4・・・特徴量算出手段
6・・・母音判定手段
8・・・制御手段
10・・・出力部
Claims (8)
- 音声を取得し音声信号に変換する音声取得部と、
音声取得部からの音声信号を周波数解析して特徴量を算出する特徴量算出手段と、
前記特徴量算出手段によって算出した特徴量に基づいて、予め登録された母音との類似度に基づいて母音の判定を行う母音判定手段と、
原点からの4方向それぞれに各母音を対応づけ、原点からの距離が大きいほど類似度が高くなるように設定した平面または空間において、前記母音判定手段によって判定された母音の類似度をマッピングし、原点からのベクトルを想定して、当該ベクトルの方向に基づいてカーソルの移動方向を制御し、当該ベクトルの大きさに基づいてカーソルの移動速度または移動加速度を制御する制御手段と、
を備えた音声制御装置。 - コンピュータによって音声制御装置を実現するための音声制御プログラムであって、
音声取得部からの音声信号を周波数解析して特徴量を算出する特徴量算出手段と、
前記特徴量算出手段によって算出した特徴量に基づいて、予め登録された母音との類似度に基づいて母音の判定を行う母音判定手段と、
原点からの4方向それぞれに各母音を対応づけ、原点からの距離が大きいほど類似度が高くなるように設定した平面または空間において、前記母音判定手段によって判定された母音の類似度をマッピングし、原点からのベクトルを想定して、当該ベクトルの方向に基づいてカーソルの移動方向を制御し、当該ベクトルの大きさに基づいてカーソルの移動速度または移動加速度を制御する制御手段と、
をコンピュータによって実現するための音声制御プログラム。 - 請求項2の音声制御プログラムにおいて、
前記移動制御手段は、前記母音定手段が前記4方向に対応付けられた母音以外の母音であると判定した場合には、その時のカーソルの位置においてクリックがなされたものとして制御を行うことを特徴とする音声制御プログラム。 - 音声を取得し音声信号に変換する音声取得部と、
音声取得部からの音声信号を周波数解析して特徴量を算出する特徴量算出手段と、
前記特徴量算出手段によって算出した特徴量に基づいて、予め登録された母音との類似度に基づいて母音の判定を行う母音判定手段と、
原点からの4方向それぞれに各母音を対応づけ、原点からの距離が大きいほど類似度が高くなるように設定した平面または空間において、前記母音判定手段によって判定された母音の類似度をマッピングし、原点からのベクトルを想定して、当該ベクトルの方向およおび大きさの時間的変化を、予め記録されたベクトルの方向及び大きさの時間的変化と比較し、その類似度に基づいて得点を算出する制御手段と、
を備えた音声処理装置。 - コンピュータによって音声処理装置を実現するための音声処理プログラムであって、
音声取得部からの音声信号を周波数解析して特徴量を算出する特徴量算出手段と、
前記特徴量算出手段によって算出した特徴量に基づいて、予め登録された母音との類似度に基づいて母音の判定を行う母音判定手段と、
原点からの4方向それぞれに各母音を対応づけ、原点からの距離が大きいほど類似度が高くなるように設定した平面または空間において、前記母音判定手段によって判定された母音の類似度をマッピングし、原点からのベクトルを想定して、当該ベクトルの方向およおび大きさの時間的変化を、予め記録されたベクトルの方向及び大きさの時間的変化と比較し、その類似度に基づいて得点を算出する制御手段と、
をコンピュータによって実現するための音声処理プログラム。 - 請求項5の音声処理プログラムにおいて、
前記声取得部から取得される音声信号は、ユーザが歌唱を行った音声信号であり、
前記予め記録されたベクトルの方向及び大きさの時間的変化は、歌唱力を判定するための正解母音変化タイミングであることを特徴とする音声処理プログラム。 - 音声を取得し音声信号に変換する音声取得部と、
音声取得部からの音声信号を周波数解析して第一フォルマント周波数成分と第二フォルマント周波数成分を特徴量として算出する特徴量算出手段と、
第一の軸を第一フォルマント周波数成分とし、第二の軸を第二フォルマント成分とした平面において、前記特徴量算出手段によって算出された第一フォルマント周波数成分と第二フォルマント成分をマッピングし、時間的に変化する当該マッピング点が移動した跡を表示する制御手段と、
を備えた音声制御装置。 - コンピュータによって音声制御装置を実現するための音声制御プログラムであって、
音声取得部からの音声信号を周波数解析して第一フォルマント周波数成分と第二フォルマント周波数成分を特徴量として算出する特徴量算出手段と、
第一の軸を第一フォルマント周波数成分とし、第二の軸を第二フォルマント成分とした平面において、前記特徴量算出手段によって算出された第一フォルマント周波数成分と第二フォルマント成分をマッピングし、時間的に変化する当該マッピング点が移動した跡を表示する制御手段と、
をコンピュータによって実現するための音声制御プログラム。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2008106923A JP4906776B2 (ja) | 2008-04-16 | 2008-04-16 | 音声制御装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2008106923A JP4906776B2 (ja) | 2008-04-16 | 2008-04-16 | 音声制御装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2009258366A JP2009258366A (ja) | 2009-11-05 |
| JP4906776B2 true JP4906776B2 (ja) | 2012-03-28 |
Family
ID=41385884
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2008106923A Expired - Fee Related JP4906776B2 (ja) | 2008-04-16 | 2008-04-16 | 音声制御装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP4906776B2 (ja) |
Families Citing this family (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP5224552B2 (ja) * | 2010-08-19 | 2013-07-03 | 達 伊福部 | 音声生成装置およびその制御プログラム |
| JP6024130B2 (ja) * | 2012-03-13 | 2016-11-09 | ヤマハ株式会社 | 音声評価装置 |
| JP6263868B2 (ja) | 2013-06-17 | 2018-01-24 | 富士通株式会社 | 音声処理装置、音声処理方法および音声処理プログラム |
| JP6090043B2 (ja) * | 2013-07-31 | 2017-03-08 | ブラザー工業株式会社 | 情報処理装置、及びプログラム |
| JP6098422B2 (ja) * | 2013-07-31 | 2017-03-22 | ブラザー工業株式会社 | 情報処理装置、及びプログラム |
| JP6304650B2 (ja) * | 2014-01-23 | 2018-04-04 | ヤマハ株式会社 | 歌唱評価装置 |
| JP6524674B2 (ja) | 2015-01-22 | 2019-06-05 | 富士通株式会社 | 音声処理装置、音声処理方法および音声処理プログラム |
Family Cites Families (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS6255700A (ja) * | 1985-09-04 | 1987-03-11 | 木村 正行 | 音声母音認識方法 |
| JPS62157938A (ja) * | 1985-12-28 | 1987-07-13 | Fujitsu Ltd | 音声によるカ−ソル位置制御方式 |
| JPH0387921A (ja) * | 1986-09-19 | 1991-04-12 | Fujitsu Ltd | 音声によるカ−ソル位置制御装置 |
| JP3353334B2 (ja) * | 1992-06-24 | 2002-12-03 | 富士通株式会社 | 音声認識装置 |
| JP2001195231A (ja) * | 2000-01-12 | 2001-07-19 | Ricoh Co Ltd | 音声入力装置 |
| JP4134921B2 (ja) * | 2004-02-27 | 2008-08-20 | ヤマハ株式会社 | カラオケ装置 |
| JP4367437B2 (ja) * | 2005-05-26 | 2009-11-18 | ヤマハ株式会社 | 音声信号処理装置、音声信号処理方法および音声信号処理プログラム |
| JP5028599B2 (ja) * | 2005-12-26 | 2012-09-19 | 株式会社国際電気通信基礎技術研究所 | 音声処理装置、およびプログラム |
| FR2905510B1 (fr) * | 2006-09-01 | 2009-04-10 | Voxler Soc Par Actions Simplif | Procede d'analyse en temps reel de la voix pour le controle en temps reel d'un organe numerique et dispositif associe |
-
2008
- 2008-04-16 JP JP2008106923A patent/JP4906776B2/ja not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| JP2009258366A (ja) | 2009-11-05 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Sahidullah et al. | Introduction to voice presentation attack detection and recent advances | |
| US11887582B2 (en) | Training and testing utterance-based frameworks | |
| US10789290B2 (en) | Audio data processing method and apparatus, and computer storage medium | |
| EP3614377B1 (en) | Object recognition method, computer device and computer readable storage medium | |
| JP4906776B2 (ja) | 音声制御装置 | |
| TWI590228B (zh) | 語音控制系統、電子裝置及語音控制方法 | |
| JP5200712B2 (ja) | 音声認識装置、音声認識方法及びコンピュータプログラム | |
| US11495235B2 (en) | System for creating speaker model based on vocal sounds for a speaker recognition system, computer program product, and controller, using two neural networks | |
| WO2017204843A1 (en) | Unit-selection text-to-speech synthesis based on predicted concatenation parameters | |
| KR102495888B1 (ko) | 사운드를 출력하기 위한 전자 장치 및 그의 동작 방법 | |
| JP2016206660A (ja) | 話者識別方法及び話者識別装置 | |
| CN112992109B (zh) | 辅助歌唱系统、辅助歌唱方法及其非瞬时计算机可读取记录媒体 | |
| CN113327620A (zh) | 声纹识别的方法和装置 | |
| CN112908308B (zh) | 一种音频处理方法、装置、设备及介质 | |
| CN112185342A (zh) | 语音转换与模型训练方法、装置和系统及存储介质 | |
| EP3255904A1 (en) | Distributed audio mixing | |
| JP2009210790A (ja) | 選曲歌手分析推薦装置、その方法及びプログラム | |
| Dong et al. | I2r speech2singing perfects everyone's singing. | |
| CN114242108A (zh) | 一种信息处理方法及相关设备 | |
| JP2004251998A (ja) | 対話理解装置 | |
| KR20120079342A (ko) | 위치 기반의 음향 처리 장치 및 방법 | |
| JP6150276B2 (ja) | 発声評価装置、発声評価方法、及びプログラム | |
| JP4839970B2 (ja) | 韻律識別装置及び方法、並びに音声認識装置及び方法 | |
| JP6003352B2 (ja) | データ生成装置、及びデータ生成方法 | |
| JP4604424B2 (ja) | 音声認識装置及び方法、並びにプログラム |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100105 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110512 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110523 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110623 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110822 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110912 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120105 |
|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120110 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150120 Year of fee payment: 3 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 4906776 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| LAPS | Cancellation because of no payment of annual fees |
