JP2008145940A - 音声評価装置及び音声評価方法 - Google Patents
音声評価装置及び音声評価方法 Download PDFInfo
- Publication number
- JP2008145940A JP2008145940A JP2006335807A JP2006335807A JP2008145940A JP 2008145940 A JP2008145940 A JP 2008145940A JP 2006335807 A JP2006335807 A JP 2006335807A JP 2006335807 A JP2006335807 A JP 2006335807A JP 2008145940 A JP2008145940 A JP 2008145940A
- Authority
- JP
- Japan
- Prior art keywords
- level
- voice
- clarity
- voice quality
- intelligibility
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Reverberation, Karaoke And Other Acoustics (AREA)
Abstract
【解決手段】カラオケ装置1の制御部11は、マイクロフォン15が収音した音声のスペクトルを検出する。次いで、制御部11は、検出されたスペクトルに基づいてフォルマントレベルを特定するとともに、スペクトルの谷のレベルを特定する。次いで、制御部11は、谷のレベルに対するフォルマントレベルの比率が大きくなるほど明瞭度が高くなるように、フォルマントレベルと谷のレベルとに基づいて音声の明瞭度を算出する。そして、制御部11は、算出した明瞭度を表す画像を表示部13に表示させる。
【選択図】図1
Description
本発明は上述した背景の下になされたものであり、利用者が音声の明瞭度を把握することのできる技術を提供することを目的とする。
また、上述した態様において、前記音声信号のレベルを算出する第2のレベル算出手段と、前記音声信号において予め定められた周波数帯域のレベルを算出する第3のレベル算出手段と、前記第2のレベル算出手段が算出したレベルに対する前記第3のレベル算出手段が算出したレベルの比率が大きくなるほど評価が高くなるように、前記第2のレベル算出手段が算出したレベルと前記第3のレベル算出手段が算出したレベルとに基づいて、前記音声の声質を評価する声質評価手段と、前記声質評価手段の評価結果を示す声質評価情報を出力する声質評価情報出力手段とを具備してもよい。
また、上述した態様において、前記声質評価情報出力手段が出力した声質評価情報に基づいて、当該声質評価情報の示す声質評価結果を報知する声質評価結果報知手段を備えてもよい。
<A:構成>
図1は、この発明の一実施形態であるカラオケ装置1のハードウェア構成を示すブロック図である。図において、制御部11は、CPU(Central Processing Unit)やROM(Read Only Memory)、RAM(Random Access Memory)を備え、ROM又は記憶部12に記憶されているコンピュータプログラムを読み出して実行することにより、バスBUSを介してカラオケ装置1の各部を制御する。記憶部12は、制御部11によって実行されるプログラムやその実行時に使用されるデータを記憶するための記憶手段であり、例えばハードディスク装置である。表示部13は、液晶パネルなどを備え、制御部11の制御の下で、カラオケ装置1を操作するためのメニュー画面や、背景画像に歌詞テロップを重ねたカラオケ画面などの各種画面を表示する。操作部14は、利用者による操作に応じた信号を制御部11に出力する。マイクロフォン15は、利用者が発音した音声を収音し、収音した音声を表す音声信号(アナログ信号)を出力する。音声処理部16は、マイクロフォン15が出力する音声信号(アナログ信号)をデジタルデータに変換する。また、音声処理部16は、デジタルデータをアナログ信号に変換してスピーカ17に出力する。スピーカ17は、音声処理部16でデジタルデータからアナログ信号に変換され出力される音声信号に応じた強度で放音する放音手段である。
次に、カラオケ装置1が行う処理の流れについて、図2に示すフローチャートを参照しつつ説明する。まず、利用者は、カラオケ装置1の操作部14を操作して、歌唱したい楽曲を選択する操作を行う。操作部14は、操作された内容に応じた信号を制御部11へ出力する。制御部11は、操作部14から出力される操作信号に応じて楽曲を選択する(ステップS1)。
制御部11は、選択した楽曲の背景画と歌詞テロップを表示部13に表示させるとともに、カラオケ伴奏を開始する(ステップS2)。すなわち、制御部11は、伴奏データ記憶領域121から伴奏データを読み出して音声処理部16に供給し、音声処理部16は、伴奏データをアナログ信号に変換し、スピーカ17に供給する。スピーカ17は、供給されるアナログ信号に応じて、伴奏音を放音する。また、制御部11は、歌詞データ記憶領域123から歌詞データ読み出すとともに、背景画データ記憶領域122から背景画データを読み出して、歌詞テロップと背景画を表示部13に表示させる。
図3は、スペクトルの検出結果を示す図である。図3において、横軸は周波数を示し、縦軸はレベルを示す。図3においては、音声信号S1と音声信号S2の2つの音声信号のスペクトルを示している。
ここで、この実施形態において制御部11が行うステップS5に示すレベル特定処理について説明する。まず、制御部11は、ステップS4において算出した周波数成分毎のレベルを、当該レベルの降順に整列する。図4は、図3に示したスペクトル検出結果について、レベルの降順にソートした内容を示す図である。図4において、横軸は要素の数を示し、縦軸はレベルを示す。この実施形態では、ソートされたレベルの列において先頭から1/4に位置する周波数成分のレベルを山レベルとみなし、一方、3/4に位置するレベルを谷レベルとみなす。すなわち、制御部11は、ソートされたレベルの列において、先頭から1/4に位置するレベルをフォルマントレベルとして特定する。また、制御部11は、ソートされたレベルの列において、先頭から3/4番目に位置するレベルを谷レベルとして特定する。図4に示す例においては、レベルL1がフォルマントレベルとして特定され、レベルL2が谷レベルとして特定される。このように、先頭から全体の総数に対する1/4番目のレベルと全体の総数に対する3/4番目のレベルを特定することで、フォルマントレベルと谷レベルに近い値を特定することができる。
C=20*log(A/B)…(式1)
D=20*log(E/F)…(式2)
このように、この実施形態では、制御部11は、音声に含まれる高域の周波数成分が多いほど声質の評価を高くする。
また、この実施形態では、カラオケ装置1が、利用者の歌唱音声に応じて声質の評価結果を報知する。これにより、利用者は、自身の声質がどのようなものであるかを把握することができる。また、この実施形態では、利用者が歌唱を行っている最中に、利用者が良い声(声質、明瞭度等)で歌ったかどうかが即座に画面に表示されるため、利用者は、より良い声で歌うことを意識することができる。
以上、本発明の実施形態について説明したが、本発明は上述した実施形態に限定されることなく、他の様々な形態で実施可能である。以下にその一例を示す。
(1)上述の実施形態では、音声信号にFFTを施してスペクトルを検出することによって音声信号を周波数成分毎に分析した。音声信号を分析する方法はこれに限らず、例えば、複数のバンドパスフィルタの出力を用いて分析を行ってもよい。この場合は、例えば、複数のバンドパスフィルタの出力に基づいて所定の周波数帯域のレベルを算出し、算出した所定の周波数帯域のレベルと全体のレベルとの比に応じて声質を評価すればよい。
また、上述の実施形態では、制御部11が、図4に示すように、周波数成分毎のレベルをレベルの降順に整列したが、昇順に整列してもよい。
その一例として、フォルマントを用いた算出方法を以下に示す。まず、制御部11は、音声信号にFFTを施してスペクトルを算出する。次いで、制御部11は、その分析の結果得られた周波数スペクトルから、第1、第2、及び第3フォルマントと夫々対応するフォルマントレベルを抽出する。フォルマントとは、音声のスペクトル上の優勢な周波数成分であり、周波数の低い順に第1フォルマント、第2フォルマント、第3フォルマント、第4フォルマント…と呼ばれる。制御部11は、フォルマントレベルを抽出すると、今度は、第1フォルマントと第2フォルマントとの間の谷の位置におけるレベルを谷レベルとして特定する。
このように、特定する山の位置は、1番目に現れる山(第1フォルマント)であってもよく、また、2番目に現れる山(第2フォルマント)であってもよく、第n番目に現れる山(第nフォルマント:nは自然数)であればよい。同様に、特定する谷の位置は、第n番目(nは自然数)に現れる谷の位置であればよい
また、例えば、明瞭度に応じて背景色を変更することによって、明瞭度を報知してもよい。この場合は、例えば、明瞭度が高いほど、図8(b)に示すように、背景色を明るくする一方、明瞭度が低いほど、図8(a)に示すように、背景色を暗くしてもよい。また、例えば、図9に示すように、明瞭度の度合いを示すメータA5を表示部13に表示させることによって報知してもよい。図9においては、メータA5における針A51の位置によって明瞭度が報知される。また、明瞭度の報知の態様は表示に限らず、例えば、明瞭度を表す音声メッセージを放音することによって報知してもよい。要するに、制御部11が算出した明瞭度を報知するものであればどのような態様であってもよい。
例えば、利用者が、子音を伸ばして発音するといったように歌唱を不真面目に歌唱したとする。従来の装置では、このように利用者が不真面目に歌唱した場合であっても声質が高く評価される場合があったが、この実施形態では、明瞭度を評価に反映させることで、不真面目な歌唱を低く評価することができ、不真面目な歌唱が高く評価されるのを防ぐことができる。
H=k×G…(式3)
Claims (7)
- 音声を表す音声信号を予め定められた複数の周波数成分毎に分析し、周波数成分毎のレベルを算出するレベル算出手段と、
前記レベル算出手段により算出された周波数成分毎のレベルを周波数の昇順又は降順に整列したときにそのレベルの変化が山となって現れる位置を特定するとともに、そのレベルの変化が谷となって現れる位置を特定する位置特定手段と、
前記位置特定手段が特定した山の位置のレベルを第1のレベルとして特定するとともに、前記位置特定手段が特定した谷の位置のレベルを第2のレベルとして特定するレベル特定手段と、
前記レベル特定手段が特定した第1のレベルと第2のレベルとに基づいて前記音声の明瞭度を算出する算出手段であって、前記第2のレベルに対する前記第1のレベルの比率が大きくなるほど明瞭度が高くなるように当該明瞭度を算出する明瞭度算出手段と、
前記明瞭度算出手段が算出した明瞭度を示す明瞭度情報を出力する明瞭度情報出力手段と
を具備することを特徴とする音声評価装置。 - 音声を表す音声信号を予め定められた複数の周波数成分毎に分析し、周波数成分毎のレベルを算出するレベル算出手段と、
前記レベル算出手段が算出した周波数成分毎のレベルを、当該レベルの降順に整列する整列手段と、
前記整列手段によって整列されたレベルの列において予め定められた第1の順位のレベルを前記第1のレベルとして特定するとともに、前記整列手段によって整列されたレベルの列において前記第1の順位よりも低い予め定められた第2の順位のレベルを前記第2のレベルとして特定するレベル特定手段と、
前記レベル特定手段が特定した第1のレベルと第2のレベルとに基づいて前記音声の明瞭度を算出する算出手段であって、前記第2のレベルに対する前記第1のレベルの比率が大きくなるほど明瞭度が高くなるように当該明瞭度を算出する明瞭度算出手段と、
前記明瞭度算出手段が算出した明瞭度を示す明瞭度情報を出力する明瞭度情報出力手段と
を具備することを特徴とする音声評価装置。 - 前記明瞭度情報出力手段が出力した明瞭度情報に基づいて、当該明瞭度情報の示す明瞭度を報知する明瞭度報知手段
を備えることを特徴とする請求項1又は2に記載の音声評価装置。 - 前記音声信号のレベルを算出する第2のレベル算出手段と、
前記音声信号において予め定められた周波数帯域のレベルを算出する第3のレベル算出手段と、
前記第2のレベル算出手段が算出したレベルに対する前記第3のレベル算出手段が算出したレベルの比率が大きくなるほど評価が高くなるように、前記第2のレベル算出手段が算出したレベルと前記第3のレベル算出手段が算出したレベルとに基づいて、前記音声の声質を評価する声質評価手段と、
前記声質評価手段の評価結果を示す声質評価情報を出力する声質評価情報出力手段と
を具備することを特徴とする請求項1乃至3のいずれかに記載の音声評価装置。 - 前記声質評価情報出力手段が出力した声質評価情報に基づいて、当該声質評価情報の示す声質評価結果を報知する声質評価結果報知手段
を備えることを特徴とする請求項4に記載の音声評価装置。 - 前記明瞭度算出手段が算出した明瞭度に応じて、前記声質評価手段の評価結果を修正する声質評価修正手段を備え、
前記声質評価情報出力手段は、前記声質評価修正手段により修正された評価結果を示す評価結果情報を出力する
ことを特徴とする請求項5に記載の音声評価装置。 - 制御手段を備えた音声評価装置の音声評価方法であって、
前記制御手段が、音声を表す音声信号を予め定められた複数の周波数成分毎に分析し、周波数成分毎のレベルを算出する第1の工程と、
前記制御手段が、算出した周波数成分毎のレベルを周波数の昇順又は降順に整列したときに、そのレベルの変化が山となって現れる位置を特定するともに、そのレベルの変化が谷となって現れる位置を特定する第2の工程と、
前記制御手段が、前記第2の工程で特定した山の位置のレベルを第1のレベルとして特定するとともに、谷の位置のレベルを第2のレベルとして特定する第3の工程と、
前記制御手段が、前記第2のレベルに対する前記第1のレベルの比率が大きいほど明瞭度が高くなるように、前記第1のレベルと前記第2のレベルとに基づいて音声の明瞭度を算出する第4の工程と、
前記制御手段が、算出された明瞭度を示す明瞭度情報を出力する第5の工程と
を具備することを特徴とする音声評価方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006335807A JP4595934B2 (ja) | 2006-12-13 | 2006-12-13 | 音声評価装置及び音声評価方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006335807A JP4595934B2 (ja) | 2006-12-13 | 2006-12-13 | 音声評価装置及び音声評価方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008145940A true JP2008145940A (ja) | 2008-06-26 |
JP4595934B2 JP4595934B2 (ja) | 2010-12-08 |
Family
ID=39606163
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006335807A Active JP4595934B2 (ja) | 2006-12-13 | 2006-12-13 | 音声評価装置及び音声評価方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4595934B2 (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013254022A (ja) * | 2012-06-05 | 2013-12-19 | Nippon Telegr & Teleph Corp <Ntt> | 音声明瞭度推定装置、音声明瞭度推定方法及びそのプログラム |
JP2015138177A (ja) * | 2014-01-23 | 2015-07-30 | ヤマハ株式会社 | 歌唱評価装置 |
US9318126B2 (en) | 2011-12-28 | 2016-04-19 | Yamaha Corporation | Voice clarification apparatus |
KR101893684B1 (ko) * | 2017-02-24 | 2018-08-30 | 국방과학연구소 | 딥 러닝 기반 보코더 통과 음성 명료도 평가 방법 및 장치 |
JP2019150234A (ja) * | 2018-03-01 | 2019-09-12 | 公立大学法人広島市立大学 | アデノイド肥大判定装置、アデノイド肥大判定方法及びプログラム |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06208395A (ja) * | 1992-10-30 | 1994-07-26 | Gijutsu Kenkyu Kumiai Iryo Fukushi Kiki Kenkyusho | ホルマント検出装置及び音声加工装置 |
JP2005107337A (ja) * | 2003-09-30 | 2005-04-21 | Yamaha Corp | カラオケ装置 |
JP2005107088A (ja) * | 2003-09-30 | 2005-04-21 | Yamaha Corp | 歌唱音声評価装置、カラオケ採点装置及びそのプログラム |
JP2005331783A (ja) * | 2004-05-20 | 2005-12-02 | Fujitsu Ltd | 音声強調装置,音声強調方法および通信端末 |
JP2006154212A (ja) * | 2004-11-29 | 2006-06-15 | Ntt Advanced Technology Corp | 音声評価方法および評価装置 |
JP2006195449A (ja) * | 2004-12-15 | 2006-07-27 | Yamaha Corp | 声質判定装置、声質判定方法、および声質判定プログラム |
JP2006251697A (ja) * | 2005-03-14 | 2006-09-21 | Yamaha Corp | カラオケ装置 |
-
2006
- 2006-12-13 JP JP2006335807A patent/JP4595934B2/ja active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06208395A (ja) * | 1992-10-30 | 1994-07-26 | Gijutsu Kenkyu Kumiai Iryo Fukushi Kiki Kenkyusho | ホルマント検出装置及び音声加工装置 |
JP2005107337A (ja) * | 2003-09-30 | 2005-04-21 | Yamaha Corp | カラオケ装置 |
JP2005107088A (ja) * | 2003-09-30 | 2005-04-21 | Yamaha Corp | 歌唱音声評価装置、カラオケ採点装置及びそのプログラム |
JP2005331783A (ja) * | 2004-05-20 | 2005-12-02 | Fujitsu Ltd | 音声強調装置,音声強調方法および通信端末 |
JP2006154212A (ja) * | 2004-11-29 | 2006-06-15 | Ntt Advanced Technology Corp | 音声評価方法および評価装置 |
JP2006195449A (ja) * | 2004-12-15 | 2006-07-27 | Yamaha Corp | 声質判定装置、声質判定方法、および声質判定プログラム |
JP2006251697A (ja) * | 2005-03-14 | 2006-09-21 | Yamaha Corp | カラオケ装置 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9318126B2 (en) | 2011-12-28 | 2016-04-19 | Yamaha Corporation | Voice clarification apparatus |
JP2013254022A (ja) * | 2012-06-05 | 2013-12-19 | Nippon Telegr & Teleph Corp <Ntt> | 音声明瞭度推定装置、音声明瞭度推定方法及びそのプログラム |
JP2015138177A (ja) * | 2014-01-23 | 2015-07-30 | ヤマハ株式会社 | 歌唱評価装置 |
WO2015111671A1 (ja) * | 2014-01-23 | 2015-07-30 | ヤマハ株式会社 | 歌唱評価装置、歌唱評価方法及び歌唱評価プログラム |
KR101893684B1 (ko) * | 2017-02-24 | 2018-08-30 | 국방과학연구소 | 딥 러닝 기반 보코더 통과 음성 명료도 평가 방법 및 장치 |
JP2019150234A (ja) * | 2018-03-01 | 2019-09-12 | 公立大学法人広島市立大学 | アデノイド肥大判定装置、アデノイド肥大判定方法及びプログラム |
JP7076732B2 (ja) | 2018-03-01 | 2022-05-30 | 公立大学法人広島市立大学 | アデノイド肥大判定装置、アデノイド肥大判定方法及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP4595934B2 (ja) | 2010-12-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4353018B2 (ja) | 楽器演奏教習装置及びそのプログラム | |
KR101521451B1 (ko) | 표시 제어 장치 및 방법 | |
WO2007010637A1 (ja) | テンポ検出装置、コード名検出装置及びプログラム | |
JP2007052394A (ja) | テンポ検出装置、コード名検出装置及びプログラム | |
JP4595934B2 (ja) | 音声評価装置及び音声評価方法 | |
JP2006276693A (ja) | 歌唱評価表示装置およびプログラム | |
JP4212446B2 (ja) | カラオケ装置 | |
JP3996565B2 (ja) | カラオケ装置 | |
JP4910854B2 (ja) | こぶし検出装置、こぶし検出方法及びプログラム | |
JP4204940B2 (ja) | カラオケ装置 | |
JP2007271977A (ja) | 評価基準判定装置、制御方法及びプログラム | |
JP2007264569A (ja) | 検索装置、制御方法及びプログラム | |
JP4913638B2 (ja) | 評価装置及びカラオケ装置 | |
JP2007322934A (ja) | 歌唱練習装置、カラオケ装置及びプログラム | |
JP6102076B2 (ja) | 評価装置 | |
JP4839967B2 (ja) | 指導装置及びプログラム | |
JP2007256619A (ja) | 評価装置、制御方法及びプログラム | |
JP2004102146A (ja) | ビブラート採点機能を有するカラオケ採点装置 | |
JP5050606B2 (ja) | 能力評価システムおよび能力評価プログラム | |
JP2009092871A (ja) | 採点装置及びプログラム | |
JP4698606B2 (ja) | 楽曲処理装置 | |
JP4891135B2 (ja) | 評価装置 | |
JP2007304489A (ja) | 楽曲練習支援装置、制御方法及びプログラム | |
JP5585320B2 (ja) | 歌唱音声評価装置 | |
JP6135229B2 (ja) | 歌唱評価装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20091021 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100305 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100316 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100513 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100622 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100726 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100824 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100906 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4595934 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131001 Year of fee payment: 3 |