JP2015031729A - 情報処理装置、及びプログラム - Google Patents
情報処理装置、及びプログラム Download PDFInfo
- Publication number
- JP2015031729A JP2015031729A JP2013159240A JP2013159240A JP2015031729A JP 2015031729 A JP2015031729 A JP 2015031729A JP 2013159240 A JP2013159240 A JP 2013159240A JP 2013159240 A JP2013159240 A JP 2013159240A JP 2015031729 A JP2015031729 A JP 2015031729A
- Authority
- JP
- Japan
- Prior art keywords
- vowel
- pitch
- voice
- quality evaluation
- utterance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Reverberation, Karaoke And Other Acoustics (AREA)
Abstract
【解決手段】安定域特定処理では、制御部は、歌唱旋律を構成する各楽音における母音を発声した波形である母音発声波形それぞれを抽出すると共に、その母音発声波形にて発声された母音の内容を対応付ける(S220)。制御部は、各母音の内容に対する平均ベクトル(即ち、発声ケプストラムの一例)と、母音の内容ごとに予め用意された母音標準ケプストラムとの相関係数を声質評価として導出する(S260)。制御部は、ユーザが安定して発声可能な音域である安定発声域を特定する(S280)。この安定発声域の特定では、制御部が、予め規定された規定閾値以上である声質評価に対応する音高の中で、最も低い音高から最も高い音高までの音域を母音安定発声域として特定する。
【選択図】図2
Description
そこで、本発明は、適切に発声可能な音高を特定することを目的とする。
本発明において、内容データ取得手段は、所定の音高と、所定の音高にて発声される少なくとも2つの音の母音を含む文字列を表す発声内容データを取得する。音声データ取得手段は、発声内容データによって表される文字列について発声された音声波形を表す音声データを取得する。
したがって、本発明の情報処理装置によれば、適切な発声が可能であるかを、所定の音高ごとに評価できる。この結果、本発明の情報処理装置によれば、安定発声音高を特定でき、適切に発声可能な音高を特定できる。
さらに、本発明においては、第一表示手段が、声質評価手段により評価された声質評価を、所定の音高における声質評価手段の評価に合わせて、所定の表示部に表示させても良い。
また、本発明においては、内容データ取得手段が、複数の音高と、複数の音高にて発声される少なくとも2つの音の母音を含む文字列を表す発声内容データを取得し、音声データ取得手段が、発声内容データによって表される文字列について発声された音声波形を表す音声データを取得しても良い。この場合、声質評価手段は、音声データ取得手段により取得された音声データによって表される音声波形において、文字列が含む母音で発声された波形を示す母音発声波形と、文字列が含む母音を構成する音に用意され、かつ、文字列が含む母音の基準とから、母音発声波形の声質評価を複数の音高ごとに決定し、音高特定手段は、声質評価手段で決定された複数の音高ごとの声質評価の中で所定の条件を満たす声質評価を特定し、その特定された声質評価に対応する母音発声波形の音高を安定発声音高として特定しても良い。
このような情報処理装置によれば、利用者が適切に発声可能な音域、即ち、安定発声域を特定できる。
このような情報処理装置によれば、安定発声域を所定の表示部に表示することができる。この結果、情報処理装置の利用者は、安定発声域を認識できる。
本発明における声域特定手段は、安定発声音高の中から、母音ごとに特定された所定の条件を満たす音高の音域を数値処理することにより、一つの発声内容データを通して一つの安定発声域を特定しても良い。
そして、本発明においては、所定の楽曲における歌唱旋律を構成する各楽音の音の高さを複数の音高とし、所定の楽曲において歌唱すべき歌詞を文字列とした発声内容データを取得しても良い。この場合、情報処理装置によれば、利用者が安定して歌唱可能であるか否かを、一つの楽曲を通して特定できる。
さらに、本発明においては、第三表示手段が、音高特定手段にて特定された安定発声音高、及び声域特定手段で特定した安定発声域の少なくとも一方と、不安定特定手段にて特定された不安定発声音高、及び声域特定手段で特定した不安定発声域の少なくとも一方とを識別可能な態様で所定の表示部に表示させても良い。
なお、本発明における音声データ取得手段は、発声内容データについて発声されている音声波形に基づく音声データを順次取得し、声質評価手段が、音声データ取得手段で音声データを取得するごとに、その取得された音声データによって表される音声波形における母音発声波形と、母音の基準とから、母音発声波形の声質評価を所定の音高ごとに決定しても良い。この場合、音高特定手段は、声質評価手段にて声質評価が決定されるごとに、その決定された声質評価が所定の条件を満たすかを判定し、判定の結果、所定の条件を満たしていれば、当該声質評価に対応する母音発声波形の音高を安定発声音高として特定しても良い。
ところで、本発明は、情報処理装置が備えるコンピュータが実行するプログラムとしてなされていても良い。
〈カラオケシステムについて〉
図1に示すように、カラオケシステム1は、ユーザ(利用者)が指定した楽曲を演奏し、その演奏に合わせてユーザが歌唱するシステムである。
情報処理装置10は、カラオケの用途に用いられる音楽データMDに基づいて楽曲を演奏すると共に、その楽曲の演奏中に音声の入力を受け付ける。情報格納サーバ25は、楽曲ごとに用意された音楽データMDそれぞれを格納すると共に、情報処理装置10を介して入力された音声それぞれの音声波形を表すデータである音声データSVを格納する。
〈情報格納サーバ〉
情報格納サーバ25は、記憶装置27と、制御装置29とを備え、通信網を介して、情報処理装置10に接続されている。
音楽データMDは、楽曲MIDIデータDMと、歌詞データDLとを有し、それぞれ対応する楽曲ごとに対応付けられている。
このうち、歌詞テロップデータDTは、楽曲において歌唱されるべき歌詞を表すデータであり、周知のカラオケ装置を構成する表示装置に表示されるテロップに関するデータである。歌詞出力データDOは、歌詞出力タイミングを楽曲MIDIデータDMの演奏と対応付けたタイミング対応関係が規定されたデータである。ここで言う歌詞出力タイミングとは、歌詞構成文字の出力タイミングであり、歌詞構成文字とは、歌詞テロップデータDTによって表される歌詞を構成する文字である。
〈情報処理装置〉
情報処理装置10は、通信部11と、入力受付部12と、音源モジュール16と、記憶部17と、制御部20とを備えている。この情報処理装置10には、表示部13と、音声入力部14と、音声出力部15とが接続されている。
表示部13は、制御部20からの信号に従って、少なくとも、画像を表示する表示装置である。本実施形態における表示装置とは、例えば、液晶ディスプレイやCRTなどである。また、音声入力部14は、音を電気信号に変換して制御部20に入力する装置(いわゆるマイクロホン)である。音声出力部15は、制御部20からの電気信号を音に変換して出力する装置(いわゆるスピーカ)である。
記憶部17は、記憶内容を読み書き可能に構成された不揮発性の記憶装置である。本実施形態における記憶装置とは、例えば、ハードディスク装置や、フラッシュメモリなどである。
〈安定域特定処理〉
制御部20が実行する安定域特定処理は、起動指令が入力されると起動される。なお、起動指令は、カラオケ演奏処理の終了後に自動的に入力されても良いし、カラオケ演奏処理の終了後に入力されるようにユーザが予め設定した場合に入力されても良い。または、安定域特定処理を実行するためのアプリケーションが、情報処理装置10で実行された場合に起動されても良い。
具体的にS200では、制御部20が、S180での分析時間窓ごとの周波数解析の結果(即ち、周波数スペクトル)それぞれについて周波数軸上での自己相関を導出する。この自己相関の導出は、時系列に沿って順次実施される。そして、制御部20は、自己相関の導出の結果、ピークの存在が未検出である状態から検出された状態へと切り替わった分析時間窓に対応する時刻を発声開始タイミングΔctsとして特定する。
具体的にS210では、制御部20が、S200にて自己相関を導出した結果に基づいて、各発声開始タイミングΔcts以降に、所定の条件を満たす最初の時刻を発声終了タイミングΔcteとして特定しても良い。ここで言う所定の条件とは、例えば、ピークの存在を検出した状態から未検出である状態へと切り替わった分析時間窓に対応することである。
さらに、S220では、制御部20が、母音データに基づいて、各母音発声波形にて発声された母音の内容を対応付ける。
つまり、本実施形態の安定域特定処理では、制御部20が、対象楽曲に対する音声データSVを解析し、ユーザが安定して発声可能な音域である安定発声域、及び歌唱可能帯域を特定する。そして、制御部20は、それらの特定した安定発声域及び歌唱可能帯域を表示部13に表示させる。
[実施形態の効果]
本実施形態における母音標準ケプストラムは、母音それぞれについて模範となるように発声した際の音声波形に基づくものである。よって、本実施形態における声質評価は、母音に対する発声の声質が低いと、その値が小さくなる。この場合、情報処理装置のユーザは、当該母音に対応する音高を苦しそうに歌唱していることが多い。
以上のことから、情報処理装置10によれば、各音高に対してユーザが発声した音声波形に基づいて、所定の音高ごとに適切な発声が可能であるかを評価できる。さらに、情報処理装置10によれば、適切な発声が可能な音域を安定発声域として特定できる。
しかも、情報処理装置10の安定域特定処理によれば、その特定した安定発声域を表示部13に表示させるため、情報処理装置のユーザは安定発声域を認識できる。
また、様々な処理には、ユーザが安定して発声することが可能な音域(即ち、安定発声域)を広げるためのトレーニング処理を含んでいても良い。この場合、楽曲における一部の楽音の音高を、歌唱可能帯域内にシフトすることが考えられる。
[その他の実施形態]
以上、本発明の実施形態について説明したが、本発明は上記実施形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において、様々な態様にて実施することが可能である。
[実施形態と特許請求の範囲との対応関係]
最後に、上記実施形態の記載と、特許請求の範囲の記載との関係を説明する。
Claims (11)
- 所定の音高と、前記所定の音高にて発声される少なくとも2つの音の母音を含む文字列を表す発声内容データを取得する内容データ取得手段と、
前記発声内容データによって表される文字列について発声された音声波形を表す音声データを取得する音声データ取得手段と、
前記音声データ取得手段により取得された音声データによって表される音声波形において、前記文字列が含む母音で発声された波形を示す母音発声波形と、前記文字列が含む母音を構成する音に用意され、かつ、前記文字列が含む母音の基準とから、前記母音発声波形の声質評価を前記所定の音高について決定する声質評価手段と、
前記声質評価手段で前記所定の音高について決定された声質評価の中で所定の条件を満たす声質評価を特定し、その特定された声質評価に対応する母音発声波形の音高を安定発声音高として特定する音高特定手段と、
を備えることを特徴とする情報処理装置。 - 前記声質評価手段により評価された前記声質評価を、前記所定の音高における前記声質評価手段の評価に合わせて、所定の表示部に表示させる第一表示手段と
を備えることを特徴とする請求項1に記載の情報処理装置。 - 前記内容データ取得手段は、複数の音高と、前記複数の音高にて発声される少なくとも2つの音の母音を含む文字列を表す発声内容データを取得し、
前記音声データ取得手段は、前記発声内容データによって表される文字列について発声された音声波形を表す音声データを取得し、
前記声質評価手段は、前記音声データ取得手段により取得された音声データによって表される音声波形において、前記文字列が含む母音で発声された波形を示す母音発声波形と、前記文字列が含む母音を構成する音に用意され、かつ、前記文字列が含む母音の基準とから、前記母音発声波形の声質評価を前記複数の音高ごとに決定し、
前記音高特定手段は、前記声質評価手段で決定された前記複数の音高ごとの声質評価の中で所定の条件を満たす声質評価を特定し、その特定された声質評価に対応する母音発声波形の音高を前記安定発声音高として特定し、
さらに、
前記音高特定手段にて特定された安定発声音高の中で、所定の条件を満たす音高の音域を、安定発声域として特定する声域特定手段と
を備えることを特徴とする請求項1または請求項2に記載の情報処理装置。 - 前記声域特定手段で特定した安定発声域を、所定の表示部に表示させる第二表示手段と、
を備えることを特徴とする請求項3に記載の情報処理装置。 - 前記音高特定手段は、前記声質評価手段で決定された声質評価の中で所定の条件を満たす声質評価を特定し、その特定された声質評価に対応する母音発声波形の音高を前記安定発声音高として前記母音ごとに特定し、
前記声域特定手段は、前記音高特定手段にて特定された前記母音ごとの安定発声音高の中で、所定の条件を満たす音高の音域を前記安定発声域として、前記母音ごとに特定する
ことを特徴とする請求項3または請求項4に記載の情報処理装置。 - 前記声域特定手段は、前記安定発声音高の中から、母音ごとに特定された所定の条件を満たす音高の音域を数値処理することにより、一つの前記発声内容データを通して一つの前記安定発声域を特定する
ことを特徴とする請求項5に記載の情報処理装置。 - 前記声質評価手段で決定された前記複数の音高ごとの声質評価の中で前記所定の条件を満たさない声質評価を特定し、その特定された声質評価に対応する母音発声波形の音高を不安定発声音高として特定する不安定特定手段と、
前記不安定特定手段にて特定された不安定発声音高の中で、前記所定の条件を満たさない音高の音域を特定し、その特定された音域の中で前記安定発声域と異なる音域を不安定発声域として特定する不安域特定手段と
を備えることを特徴とする請求項3から請求項6までのいずれか一項に記載の情報処理装置。 - 前記音高特定手段にて特定された安定発声音高、及び前記声域特定手段で特定した安定発声域の少なくとも一方と、前記不安定特定手段にて特定された不安定発声音高、及び前記声域特定手段で特定した不安定発声域の少なくとも一方とを識別可能な態様で所定の表示部に表示させる第三表示手段と
を備えることを特徴とする請求項7に記載の情報処理装置。 - 前記声質評価手段は、前記母音発声波形それぞれにおけるケプストラムである発声ケプストラムそれぞれを導出し、前記発声ケプストラムそれぞれと、各母音のフォルマント構造におけるスペクトル包絡から導出したケプストラムそれぞれである基準値との相関係数を前記声質評価として導出する
ことを特徴とする請求項1から請求項8までのいずれか一項に記載の情報処理装置。 - 前記音声データ取得手段は、前記発声内容データについて発声されている音声波形に基づく音声データを順次取得し、
前記声質評価手段は、前記音声データ取得手段で音声データを取得するごとに、その取得された音声データによって表される音声波形において前記文字列が含む母音で発声された波形を示す母音発声波形と、前記母音の基準とから、前記母音発声波形の声質評価を前記所定の音高ごとに決定し、
前記音高特定手段は、前記声質評価手段にて声質評価が決定されるごとに、その決定された声質評価が所定の条件を満たすかを判定し、判定の結果、前記所定の条件を満たしていれば、当該声質評価に対応する母音発声波形の音高を前記安定発声音高として特定する
ことを特徴とする請求項1から請求項9までのいずれか一項に記載の情報処理装置。 - 所定の音高と、前記所定の音高にて発声される少なくとも2つの音の母音を含む文字列を表す発声内容データを取得する内容データ取得手順と、
前記発声内容データによって表される文字列について発声された音声波形を表す音声データを取得する音声データ取得手順と、
前記音声データ取得手順により取得された音声データによって表される音声波形において、前記文字列が含む母音で発声された波形を示す母音発声波形と、前記文字列が含む母音を構成する音に用意され、かつ、前記文字列が含む母音の基準とから、前記母音発声波形の声質評価を前記所定の音高について決定する声質評価手順と、
前記声質評価手順で前記所定の音高について決定された声質評価の中で所定の条件を満たす声質評価を特定し、その特定された声質評価に対応する母音発声波形の音高を安定発声音高として特定する音高特定手順と、
をコンピュータに実行させることを特徴とするプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013159240A JP6098422B2 (ja) | 2013-07-31 | 2013-07-31 | 情報処理装置、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013159240A JP6098422B2 (ja) | 2013-07-31 | 2013-07-31 | 情報処理装置、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015031729A true JP2015031729A (ja) | 2015-02-16 |
JP6098422B2 JP6098422B2 (ja) | 2017-03-22 |
Family
ID=52517123
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013159240A Active JP6098422B2 (ja) | 2013-07-31 | 2013-07-31 | 情報処理装置、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6098422B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105989853A (zh) * | 2015-02-28 | 2016-10-05 | 科大讯飞股份有限公司 | 一种音频质量评测方法及系统 |
CN106782614A (zh) * | 2016-12-26 | 2017-05-31 | 广州酷狗计算机科技有限公司 | 音质检测方法及装置 |
CN111816207A (zh) * | 2020-08-31 | 2020-10-23 | 广州汽车集团股份有限公司 | 声音分析方法、系统、汽车及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009244707A (ja) * | 2008-03-31 | 2009-10-22 | Brother Ind Ltd | 音域判定システムおよびプログラム |
JP2009258366A (ja) * | 2008-04-16 | 2009-11-05 | Arcadia:Kk | 音声制御装置 |
JP2010085655A (ja) * | 2008-09-30 | 2010-04-15 | Brother Ind Ltd | 音域特定システム、プログラム |
-
2013
- 2013-07-31 JP JP2013159240A patent/JP6098422B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009244707A (ja) * | 2008-03-31 | 2009-10-22 | Brother Ind Ltd | 音域判定システムおよびプログラム |
JP2009258366A (ja) * | 2008-04-16 | 2009-11-05 | Arcadia:Kk | 音声制御装置 |
JP2010085655A (ja) * | 2008-09-30 | 2010-04-15 | Brother Ind Ltd | 音域特定システム、プログラム |
Non-Patent Citations (2)
Title |
---|
JPN6016020344; 平山 健太郎 Kentaro HIRAYAMA: 'ポピュラー音楽の歌唱を対象とする高音域発声評価システムの構築' 第73回(平成23年)全国大会講演論文集(2) 人工知能と認知科学 , 20110302, p.2-277,p.2-278, 一般社団法人情報処理学会 * |
JPN6016020345; 平山 健太郎 KENTARO HIRAYAMA: 'ポピュラー歌唱における高音域の声区と発声状態の判別手法 Discrimination Method of Voice Register and' 情報処理学会研究報告 2011(平成23)年度▲6▼ [DVD-ROM] , 20120415, p.1-6, 一般社団法人情報処理学会 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105989853A (zh) * | 2015-02-28 | 2016-10-05 | 科大讯飞股份有限公司 | 一种音频质量评测方法及系统 |
CN106782614A (zh) * | 2016-12-26 | 2017-05-31 | 广州酷狗计算机科技有限公司 | 音质检测方法及装置 |
CN106782614B (zh) * | 2016-12-26 | 2020-08-18 | 广州酷狗计算机科技有限公司 | 音质检测方法及装置 |
CN111816207A (zh) * | 2020-08-31 | 2020-10-23 | 广州汽车集团股份有限公司 | 声音分析方法、系统、汽车及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
JP6098422B2 (ja) | 2017-03-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6060867B2 (ja) | 情報処理装置,データ生成方法,及びプログラム | |
JP4205824B2 (ja) | 歌唱評価装置およびカラオケ装置 | |
US20190304327A1 (en) | Singing practice device, singing practice method, and storage medium | |
CN113506554A (zh) | 电子乐器、电子乐器的控制方法 | |
JP6098422B2 (ja) | 情報処理装置、及びプログラム | |
JP5598516B2 (ja) | カラオケ用音声合成システム,及びパラメータ抽出装置 | |
JP6056394B2 (ja) | 音声処理装置 | |
JP5125958B2 (ja) | 音域特定システム、プログラム | |
JP2017181793A (ja) | 音響処理装置、及びプログラム | |
JP6252420B2 (ja) | 音声合成装置、及び音声合成システム | |
JP2013210501A (ja) | 素片登録装置,音声合成装置,及びプログラム | |
JP5810947B2 (ja) | 発声区間特定装置、音声パラメータ生成装置、及びプログラム | |
JP6075314B2 (ja) | プログラム,情報処理装置,及び評価方法 | |
JP6399715B1 (ja) | 歌唱支援装置および、カラオケ装置 | |
JP6075313B2 (ja) | プログラム,情報処理装置,及び評価データ生成方法 | |
JP6090043B2 (ja) | 情報処理装置、及びプログラム | |
JP6252517B2 (ja) | 音声合成装置、及びプログラム | |
JP6406182B2 (ja) | カラオケ装置、及びカラオケシステム | |
JP6365483B2 (ja) | カラオケ装置,カラオケシステム,及びプログラム | |
JP2016183998A (ja) | 音声合成装置、及びプログラム | |
JP5983670B2 (ja) | プログラム、情報処理装置、及びデータ生成方法 | |
JP2015191177A (ja) | プログラム、情報処理装置、及びデータ生成方法 | |
JP5805474B2 (ja) | 音声評価装置,音声評価方法,及びプログラム | |
JP6260499B2 (ja) | 音声合成システム、及び音声合成装置 | |
JP5549651B2 (ja) | 歌詞出力データ修正装置,及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150226 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160525 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160607 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160805 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170124 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170206 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6098422 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |