JP5740353B2 - 音声明瞭度推定装置、音声明瞭度推定方法及びそのプログラム - Google Patents
音声明瞭度推定装置、音声明瞭度推定方法及びそのプログラム Download PDFInfo
- Publication number
- JP5740353B2 JP5740353B2 JP2012128029A JP2012128029A JP5740353B2 JP 5740353 B2 JP5740353 B2 JP 5740353B2 JP 2012128029 A JP2012128029 A JP 2012128029A JP 2012128029 A JP2012128029 A JP 2012128029A JP 5740353 B2 JP5740353 B2 JP 5740353B2
- Authority
- JP
- Japan
- Prior art keywords
- speech
- power ratio
- periodic power
- data
- periodic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Description
非周期性指標A(i,f)を用いて、スペクトルパワーP(i,f)から周期性パワーPP(i,f)を分離する第一パラメータ変換ステップと、対象音声データs(t)を用いて、所定のサンプル間隔でフォルマント周波数F(i,j)を抽出するフォルマント抽出ステップと、周期性パワーPP(i,f)及びフォルマント周波数F(i,j)を用いて、各フォルマントステップ分のスペクトルが占めるパワーの割合である周期性パワー比RP(i,j)を求め、全てのフレームにおける周期性パワー比RP(i,j)の平均である平均周期性パワー比RT(j)を求める第一パワー比計算ステップと、平均周期性パワー比RT(j)と、学習用音声データsk(t)に対する音声明瞭度xkとその学習用音声データsk(t)に対する平均周期性パワー比RT,k(j)との関係をモデル化した周期性パワー比回帰モデルとを用いて、対象音声データs(t)に対する音声明瞭度x’を推定する明瞭度推定ステップと、を含む。
予め主観評価により求めておいた雑音環境下での音声明瞭度と、学習用音声データのフォルマント部分の平均周期性パワー比から、音声明瞭度推定用のモデル(後述する周期性パワー比回帰モデル)を生成しておき、対象音声データに対する音声明瞭度を推定する際には、その周期性パワー比回帰モデルを使用する。
図1は音声明瞭度推定装置100の機能ブロック図を、図2はその処理フローを示す。音声明瞭度推定装置100は、第一音声分析部110、第一パラメータ変換部120、フォルマント抽出部130、第一パワー比計算部140、周期性パワー比回帰モデル生成部150及び明瞭度推定部180を含む。
第一音声分析部110は、対象となる音声データs(t)を受け取り、音声データs(t)をフレーム毎に音声分析し(s110)、音声データs(t)からスペクトルパワーP(i,f)及び非周期性指標A(i,f)を抽出し、第一パラメータ変換部120に出力する。例えば、参考文献1記載の音声分析方法を用いることができる。
(参考文献1)河原英紀,“聴覚の情景分析が生んだ高品質VOCODER: STRAIGHT”,日本音響学会誌,1998年7月,54巻,7号,pp.521-526
第一パラメータ変換部120は、スペクトルパワーP(i,f)及び非周期性指標A(i,f)を受け取り、非周期性指標A(i,f)を用いて、スペクトルパワーP(i,f)を非周期性パワーPA(i,f)と周期性パワーPP(i,f)に分離し(s120)、周期性パワーPP(i,f)を第一パワー比計算部140に出力する。なお、周期性パワーPP(i,f)はスペクトルパワーP(i,f)に含まれる周期成分のスペクトルパワーであり、非周期性パワーPA(i,f)はスペクトルパワーP(i,f)に含まれる非周期成分のスペクトルパワーである。
PA(i,f)=10A(i,f)/20・P(i,f)
PP(i,f)=P(i,f)-PA(i,f)
フォルマントとは、図6のような音声スペクトルのピーク部分であり、低い周波数から第一フォルマント、第二フォルマントというように番号で区別される。このフォルマントの周波数軸上の位置が、音声の音韻性や話者性を特徴付ける。
(参考文献2)大塚貴弘,“音源パルス列を考慮した頑健なARX音声分析法”,日本音響学会誌,2002年7月,58巻,7号,pp.386-397
まず、第一パワー比計算部140は、周期性パワーPP(i,f)及びフォルマント周波数F(i,j)を受け取り、これらの値を用いて、第jフォルマント部分のスペクトルが占めるパワーの割合である周期性パワー比RP(i,j)を求める(s140)。周期性パワー比RP(i,j)とは、言い換えると、フレームiにおける第jフォルマントの部分のスペクトルにおいて、周期性パワーが占める割合である。
iに初期値を設定する(s140a)。
F(i,j)=0が、全てのj(j=1,2,…,J)について成り立つか否かを判定する(s140b)。
成り立つ場合、全てのjについて、周期性パワー比RP(i,j)に0を代入する(s140c)。
成り立たない場合、全ての帯域fについての周期性パワーPP(i,f)の総和PPSUMを
jに初期値を設定する(s140e)。
次のfL(j)及びfH(j)を求める(s140f〜s140r)。
iをインクリメントし、iが[T/p−1]よりも大きくなるまで、s140b〜s140tを繰り返す(s140t)。
明瞭度推定部180は、音声明瞭度推定に先立ち、周期性パワー比回帰モデルM(j,m)を後述する周期性パワー比回帰モデル生成部150から受け取る。明瞭度推定部180は、音声明瞭度推定時に、音声データs(t)に対する平均周期性パワー比RT(j)を受け取り、周期性パワー比回帰モデルM(j,m)及び平均周期性パワー比RT(j)を用いて、次式のように、音声データs(t)に対する音声明瞭度x’を推定し(s180)、音声明瞭度推定装置100の出力値として出力する。
周期性パワー比回帰モデル生成部150は、音声明瞭度推定に先立ち、K個の学習用音声データsk(t)と、そのそれぞれに対する音声明瞭度xkとに基づき、周期性パワー比回帰モデルM(j,m)を生成し、明瞭度推定部180に出力する。
周期性パワー比回帰モデル生成部150は、音声データベース(以下「音声DB」ともいう)151、第二音声分析部152、第二パラメータ変換部153、フォルマント抽出部154、第二パワー比計算部155及び線形回帰分析部157を含む。
音声DB151は、音声明瞭度推定に先立ち、K個の学習用音声データsk(t)と、各学習用音声データsk(t)のインデックス番号kと、各学習用音声データsk(t)に対する音声明瞭度xkとを格納しておく(図10参照)。ただし、Kを1以上の整数とし、k=1,2,…Kとする。
第二音声分析部152、第二パラメータ変換部153、フォルマント抽出部154及び第二パワー比計算部155は、それぞれ第一音声分析部110、第一パラメータ変換部120、フォルマント抽出部130及び第一パワー比計算部140と同様の構成であり、同様の処理を行う。以下、簡単に説明する。
線形回帰分析部157は、K個の平均周期性パワー比RT,k(j)を受け取り、それぞれに対応する音声明瞭度xkを音声DB151から取り出す。K個の平均周期性パワー比RT,k(j)と、K個の音声明瞭度xkとを用いて、線形回帰分析を行い、周期性パワー比回帰モデルM(j,m)を求め(s157)、明瞭度推定部180に出力する。mは、求める線形回帰係数の次数を示し、0または1の値を取る。
xk≒xk’=M(j,0)+RT,k(j)M(j,1)
と仮定し、
E=(xk-xk’)2
を最小とするM(j,m)を求める。具体的には下記計算を行う。
雑音環境下において、通常、発声される音声に対して、人間の主観的感覚とマッチした音声明瞭度を推定することができる。それにより、情報提供者側が明瞭性の高い発声者を、低コストかつ高精度に決定することができる効果がある。
第二実施形態においても、第一実施形態と同様に、予め主観評価により求めておいた雑音環境下での音声明瞭度と、学習用音声のフォルマント部分の周期性パワー比から、周期性パワー比回帰モデルを生成しておき、対象音声データに対する音声明瞭度を推定する際には、その周期性パワー比回帰モデルを使用して音声明瞭度を推定する。ただし、様々な種類の雑音環境下での音声明瞭度と、学習用音声データに基づき周期性パワー比回帰モデルを生成する。予め学習用音声データを聴取する環境における環境雑音データを、その雑音環境毎にクラスタリングし、そのクラスタ毎に周期性パワー比回帰モデルを生成しておく。対象音声データに対する音声明瞭度を推定する際には、その対象音声データを聴取する環境における環境雑音データを元に、適切な周期性パワー比回帰モデルを選択し、その周期性パワー比回帰モデルを使用して音声明瞭度の推定を行う。これにより、雑音環境のクラスタ毎に周期性パワー比回帰モデルが生成でき、また音声明瞭度を推定したい雑音環境において適切な周期性パワー比回帰モデルを選択できるため、様々な雑音環境下における音声明瞭度の推定精度向上が期待できる。
第一実施形態と異なる部分について説明する。
図13は音声明瞭度推定装置200の機能ブロック図を、図14はその処理フローを示す。音声明瞭度推定装置200は、第一音声分析部110、第一パラメータ変換部120、フォルマント抽出部130、第一パワー比計算部140、周期性パワー比回帰モデル生成部250、周期性パワー比回帰モデルデータベース(以下「周期性パワー比回帰モデルDB」ともいう)260、周期性パワー比回帰モデル選択部270及び明瞭度推定部180を含む。
周期性パワー比回帰モデル生成部250は、音声明瞭度推定に先立ち、K個の学習用音声データsk(t)と、そのそれぞれに対する音声明瞭度xkと環境雑音データNk(t)に基づき、雑音環境毎に周期性パワー比回帰モデルMu(j,m)を生成し、周期性パワー比回帰モデルDB260に格納する。
音声DB251は、音声明瞭度推定に先立ち、K個の学習用音声データsk(t)と、各学習用音声データsk(t)のインデックス番号kと、各学習用音声データsk(t)に対する音声明瞭度xkと、学習用音声データsk(t)を聴取する環境における環境雑音データNk(t)とを格納しておく(図17参照)。
(1)音声明瞭度を求めた際に学習用音声データsk(t)に重畳した環境雑音データNk(t)は、第一実施形態のように音声DB151中で同一(例えば、駅ホームでの雑音でS/N比−5dB)ではなく、様々な環境(例えば、駅ホーム以外に、空港、街中の人ごみ、幹線道路沿い、走行中の自動車内部等)における、様々なS/N比の雑音である点。
(2)環境雑音データNk(t)についても、音声DB251中に音声番号kと対応して格納する点。
環境雑音クラスタリング部256は、K個の環境雑音データNk(t)を音声DB251から取り出し、K個の環境雑音データNk(t)をクラスタリングし(s256a)、環境雑音データNk(t)の属するクラスタNc,kを求める。まず似ている環境雑音データのまとまり(クラスタ)を作ってから、後段で説明するまとまり毎の周期性パワー比回帰モデルMu(j,m)を作るためである。以下、このクラスタリングにより求められるクラスタを環境雑音クラスタと呼び、そのインデックス番号をuとし、u=1,2,…,Uとする。なお、環境雑音クラスタNc,kは、環境雑音データNk(t)が、どの環境雑音クラスタuに属するかを表す整数値であり、1〜Uの何れかの値である。以下、詳細を説明する。
線形回帰分析部257は、環境雑音クラスタNc,k(t)、平均周期性パワー比RT,k(j)及び音声明瞭度xkをそれぞれ環境雑音クラスタリング部256、第二パワー比計算部155及び音声DB251から受け取り、環境雑音クラスタu毎に、その環境雑音クラスタuに属する(雑音特徴量ベクトルVN,kの元となる)環境雑音データNk(t)に対応する音声明瞭度xkと平均周期性パワー比RT,k(j)の線形回帰分析を行い、周期性パワー比回帰モデルMu(j,m)を求め(s257)、周期性パワー比回帰モデルMu(j,m)と環境雑音クラスタリング部256で求めた代表雑音特徴量ベクトルCv(u)とのU個の組合せを周期性パワー比回帰モデルDB260に格納する。
周期性パワー比回帰モデルDB260は、音声明瞭度推定に先立ち、環境雑音クラスタuの代表雑音特徴量ベクトルCv(u)と周期性パワー比回帰モデルMu(j,m)とを格納しておく。
周期性パワー比回帰モデル選択部270は、環境雑音データN(t)を受け取り、この値から得られる雑音特徴量ベクトルVNに最も近い代表雑音特徴量ベクトルCv(n)を求め、求めた代表雑音特徴量ベクトルCv(n)に対応する周期性パワー比回帰モデルMn(j,m)を周期性パワー比回帰モデルDB260から選択し(s270)、明瞭度推定部180に出力する。
明瞭度推定部180は、周期性パワー比回帰モデル選択部270によって選択された周期性パワー比回帰モデルMn(j,m)と、音声データs(t)に対する平均周期性パワー比RT(j)をと受け取り、周期性パワー比回帰モデルMn(j,m)及び平均周期性パワー比RT(j)を用いて、第一実施形態と同様の方法により、音声データs(t)に対する音声明瞭度x’を推定し(s180)、音声明瞭度推定装置200の出力値として出力する。
このような構成により、第一実施形態と同様の効果を得ることができる。さらに、様々な雑音環境下においても音声明瞭度の推定を精度よく行うことができるため、想定される雑音に適した発声者を選択することができる。
本発明は上記の実施形態及び変形例に限定されるものではない。
例えば、音声明瞭度として評価者が5段階MOSで評価したスコアの平均値を用いているが、音声の聞き取りやすさを表す指標であればどのようなものを用いてもよい。
上述した音声明瞭度推定装置は、コンピュータにより機能させることもできる。この場合はコンピュータに、目的とする装置(各種実施形態で図に示した機能構成をもつ装置)として機能させるためのプログラム、またはその処理手順(各実施形態で示したもの)の各過程をコンピュータに実行させるためのプログラムを、CD−ROM、磁気ディスク、半導体記憶装置などの記録媒体から、あるいは通信回線を介してそのコンピュータ内にダウンロードし、そのプログラムを実行させればよい。
110 第一音声分析部
120 第一パラメータ変換部
130 フォルマント抽出部
140 第一パワー比計算部
150 周期性パワー比回帰モデル生成部
151 音声DB
152 第二音声分析部
153 第二パラメータ変換部
154 フォルマント抽出部
155 第二パワー比計算部
157 線形回帰分析部
180 明瞭度推定部
250 周期性パワー比回帰モデル生成部
251 音声DB
256 環境雑音クラスタリング部
257 線形回帰分析部
260 周期性パワー比回帰モデルDB
270 周期性パワー比回帰モデル選択部
Claims (8)
- 対象音声データs(t)について、音声の聞き取りやすさである音声明瞭度を推定する音声明瞭度推定装置であって、
前記対象音声データs(t)をフレーム毎に音声分析し、スペクトルパワーP(i,f)及び非周期性指標A(i,f)を抽出する第一音声分析部と、
前記非周期性指標A(i,f)を用いて、前記スペクトルパワーP(i,f)から周期性パワーPP(i,f)を分離する第一パラメータ変換部と、
前記対象音声データs(t)を用いて、所定のサンプル間隔でフォルマント周波数F(i,j)を抽出するフォルマント抽出部と、
前記周期性パワーPP(i,f)及び前記フォルマント周波数F(i,j)を用いて、各フォルマント部分のスペクトルが占めるパワーの割合である周期性パワー比RP(i,j)を求め、全てのフレームにおける周期性パワー比RP(i,j)の平均である平均周期性パワー比RT(j)を求める第一パワー比計算部と、
前記平均周期性パワー比RT(j)と、学習用音声データsk(t)に対する音声明瞭度xkとその学習用音声データsk(t)に対する平均周期性パワー比RT,k(j)との関係をモデル化した周期性パワー比回帰モデルとを用いて、前記対象音声データs(t)に対する音声明瞭度x’を推定する明瞭度推定部と、を含む、
音声明瞭度推定装置。 - 請求項1記載の音声明瞭度推定装置であって、
Kを1以上の整数とし、k=1,2,…Kとし、音声明瞭度推定に先立ち、K個の学習用音声データsk(t)と、各学習用音声データsk(t)に対する音声明瞭度xkとが格納される音声データベースと、
前記学習用音声データsk(t)をフレーム毎に音声分析し、スペクトルパワーPk(i,f)、非周期性指標Ak(i,f)を抽出する第二音声分析部と、
前記非周期性指標Ak(i,f)を用いて、前記スペクトルパワーPk(i,f)から周期性パワーPP,k(i,f)を分離する第二パラメータ変換部と、
前記学習用音声データsk(t)を用いて、所定のサンプル間隔でフォルマント周波数Fk(i,j)を抽出するフォルマント抽出部と
前記周期性パワーPP,k(i,f)及び前記フォルマント周波数Fk(i,j)を用いて、各フォルマント部分のスペクトルが占めるパワーの割合である周期性パワー比RP,k(i,j)を求め、全てのフレームにおける周期性パワー比RP,k(i,j)の平均である平均周期性パワー比RT,k(j)を求める第二パワー比計算部と、
前記音声明瞭度xkと前記平均周期性パワー比RT,k(j)の線形回帰分析を行い、前記周期性パワー比回帰モデルを求める線形回帰分析部と、をさらに含む、
音声明瞭度推定装置。 - 請求項1記載の音声明瞭度推定装置であって、
前記周期性パワー比回帰モデルは、学習用音声データsk(t)を聴取する環境における環境雑音データNk(t)の属する環境雑音クラスタNc,k毎に、学習用音声データsk(t)に対する音声明瞭度xkとその学習用音声データsk(t)に対する平均周期性パワー比RT,k(j)との関係をモデル化したものであり、
環境雑音クラスタuを代表する代表雑音特徴量ベクトルCv(u)と、その環境雑音クラスタuの周期性パワー比回帰モデルとが格納される周期性パワー比回帰モデルデータベースと、
前記対象音声データs(t)を聴取する環境における環境雑音データN(t)から得られる雑音特徴量ベクトルVNに最も近い代表雑音特徴量ベクトルCv(n)に対応する周期性パワー比回帰モデルを前記周期性パワー比回帰モデルデータベースから選択する周期性パワー比回帰モデル選択部と、をさらに含む、
音声明瞭度推定装置。 - 請求項3記載の音声明瞭度推定装置であって、
Kを1以上の整数とし、k=1,2,…Kとし、音声明瞭度推定に先立ち、K個の学習用音声データsk(t)と、各学習用音声データsk(t)に対する音声明瞭度xkと、学習用音声データsk(t)を聴取する環境における環境雑音データNk(t)とが格納される音声データベースと、
前記学習用音声データsk(t)をフレーム毎に音声分析し、スペクトルパワーPk(i,f)、非周期性指標Ak(i,f)を抽出する第二音声分析部と、
前記非周期性指標Ak(i,f)を用いて、前記スペクトルパワーPk(i,f)から周期性パワーPP,k(i,f)を分離する第二パラメータ変換部と、
前記学習用音声データsk(t)を用いて、所定のサンプル間隔でフォルマント周波数Fk(i,j)を抽出するフォルマント抽出部と
前記周期性パワーPP,k(i,f)及び前記フォルマント周波数Fk(i,j)を用いて、各フォルマント部分のスペクトルが占めるパワーの割合である周期性パワー比RP,k(i,j)を求め、全てのフレームにおける周期性パワー比RP,k(i,j)の平均である平均周期性パワー比RT,k(j)を求める第二パワー比計算部と、
前記環境雑音データNk(t)をクラスタリングし、環境雑音クラスタuを代表する代表雑音特徴量ベクトルCv(u)を求める雑音環境クラスタリング部と、
環境雑音クラスタu毎に、その環境雑音クラスタuに属する環境雑音データNk(t)に対応する前記音声明瞭度xkと前記平均周期性パワー比RT,k(j)の線形回帰分析を行い、周期性パワー比回帰モデルを求める線形回帰分析部と、をさらに含む、
音声明瞭度推定装置。 - 対象音声データs(t)について、音声の聞き取りやすさである音声明瞭度を推定する音声明瞭度推定方法であって、
前記対象音声データs(t)をフレーム毎に音声分析し、スペクトルパワーP(i,f)及び非周期性指標A(i,f)を抽出する第一音声分析ステップと、
前記非周期性指標A(i,f)を用いて、前記スペクトルパワーP(i,f)から周期性パワーPP(i,f)を分離する第一パラメータ変換ステップと、
前記対象音声データs(t)を用いて、所定のサンプル間隔でフォルマント周波数F(i,j)を抽出するフォルマント抽出ステップと、
前記周期性パワーPP(i,f)及び前記フォルマント周波数F(i,j)を用いて、各フォルマントステップ分のスペクトルが占めるパワーの割合である周期性パワー比RP(i,j)を求め、全てのフレームにおける周期性パワー比RP(i,j)の平均である平均周期性パワー比RT(j)を求める第一パワー比計算ステップと、
前記平均周期性パワー比RT(j)と、学習用音声データsk(t)に対する音声明瞭度xkとその学習用音声データsk(t)に対する平均周期性パワー比RT,k(j)との関係をモデル化した周期性パワー比回帰モデルとを用いて、前記対象音声データs(t)に対する音声明瞭度x’を推定する明瞭度推定ステップと、を含む、
音声明瞭度推定方法。 - 請求項5記載の音声明瞭度推定方法であって、
Kを1以上の整数とし、k=1,2,…Kとし、音声明瞭度推定に先立ち、K個の学習用音声データsk(t)と、各学習用音声データsk(t)に対する音声明瞭度xkとが格納される音声データベースから、前記学習用音声データsk(t)を取り出し、フレーム毎に音声分析し、スペクトルパワーPk(i,f)、非周期性指標Ak(i,f)を抽出する第二音声分析ステップと、
前記非周期性指標Ak(i,f)を用いて、前記スペクトルパワーPk(i,f)から周期性パワーPP,k(i,f)を分離する第二パラメータ変換ステップと、
前記音声データベースから前記学習用音声データsk(t)を取り出し、所定のサンプル間隔でフォルマント周波数Fk(i,j)を抽出するフォルマント抽出ステップと
前記周期性パワーPP,k(i,f)及び前記フォルマント周波数Fk(i,j)を用いて、各フォルマントステップ分のスペクトルが占めるパワーの割合である周期性パワー比RP,k(i,j)を求め、全てのフレームにおける周期性パワー比RP,k(i,j)の平均である平均周期性パワー比RT,k(j)を求める第二パワー比計算ステップと、
前記音声データベースから前記音声明瞭度xkを取り出し、前記音声明瞭度xkと前記平均周期性パワー比RT,k(j)の線形回帰分析を行い、前記周期性パワー比回帰モデルを求める線形回帰分析ステップと、をさらに含む、
音声明瞭度推定方法。 - 請求項5記載の音声明瞭度推定方法であって、
前記周期性パワー比回帰モデルは、学習用音声データsk(t)を聴取する環境における環境雑音データNk(t)の属する環境雑音クラスタNc,k毎に、学習用音声データsk(t)に対する音声明瞭度xkとその学習用音声データsk(t)に対する平均周期性パワー比RT,k(j)との関係をモデル化したものであり、
環境雑音クラスタuを代表する代表雑音特徴量ベクトルCv(u)と、その環境雑音クラスタuの周期性パワー比回帰モデルとが格納される周期性パワー比回帰モデルデータベースから、前記代表雑音特徴量ベクトルCv(u)を取り出し、前記対象音声データs(t)を聴取する環境における環境雑音データN(t)から得られる雑音特徴量ベクトルVNに最も近い代表雑音特徴量ベクトルCv(n)を求め、その代表雑音特徴量ベクトルCv(n)に対応する周期性パワー比回帰モデルを前記周期性パワー比回帰モデルデータベースから選択する周期性パワー比回帰モデル選択ステップと、をさらに含む、
音声明瞭度推定方法。 - 請求項1から請求項4の何れかに記載の音声明瞭度推定装置として、コンピュータを機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012128029A JP5740353B2 (ja) | 2012-06-05 | 2012-06-05 | 音声明瞭度推定装置、音声明瞭度推定方法及びそのプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012128029A JP5740353B2 (ja) | 2012-06-05 | 2012-06-05 | 音声明瞭度推定装置、音声明瞭度推定方法及びそのプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013254022A JP2013254022A (ja) | 2013-12-19 |
JP5740353B2 true JP5740353B2 (ja) | 2015-06-24 |
Family
ID=49951578
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012128029A Expired - Fee Related JP5740353B2 (ja) | 2012-06-05 | 2012-06-05 | 音声明瞭度推定装置、音声明瞭度推定方法及びそのプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5740353B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9034442B2 (en) | 2012-11-30 | 2015-05-19 | Corning Incorporated | Strengthened borosilicate glass containers with improved damage tolerance |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4432893B2 (ja) * | 2004-12-15 | 2010-03-17 | ヤマハ株式会社 | 声質判定装置、声質判定方法、および声質判定プログラム |
JP2006267465A (ja) * | 2005-03-23 | 2006-10-05 | Tokyo Electric Power Co Inc:The | 発話状態評価装置、発話状態評価プログラム、プログラム格納媒体 |
JP4595934B2 (ja) * | 2006-12-13 | 2010-12-08 | ヤマハ株式会社 | 音声評価装置及び音声評価方法 |
EP2363852B1 (en) * | 2010-03-04 | 2012-05-16 | Deutsche Telekom AG | Computer-based method and system of assessing intelligibility of speech represented by a speech signal |
US8731911B2 (en) * | 2011-12-09 | 2014-05-20 | Microsoft Corporation | Harmonicity-based single-channel speech quality estimation |
EP2660814B1 (en) * | 2012-05-04 | 2016-02-03 | 2236008 Ontario Inc. | Adaptive equalization system |
-
2012
- 2012-06-05 JP JP2012128029A patent/JP5740353B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2013254022A (ja) | 2013-12-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Van Kuyk et al. | An evaluation of intrusive instrumental intelligibility metrics | |
Emiya et al. | Subjective and objective quality assessment of audio source separation | |
US8972255B2 (en) | Method and device for classifying background noise contained in an audio signal | |
CN105593936B (zh) | 用于文本转语音性能评价的系统和方法 | |
JP6339187B2 (ja) | 音声信号品質を測定するためのシステムおよび方法 | |
US20160111112A1 (en) | Speaker change detection device and speaker change detection method | |
Ganapathy et al. | Robust feature extraction using modulation filtering of autoregressive models | |
US8655656B2 (en) | Method and system for assessing intelligibility of speech represented by a speech signal | |
CN110459241B (zh) | 一种用于语音特征的提取方法和系统 | |
JP2010224321A (ja) | 信号処理装置 | |
JP6439682B2 (ja) | 信号処理装置、信号処理方法および信号処理プログラム | |
US11875770B2 (en) | Systems and methods for selectively providing audio alerts | |
EP3979240A1 (en) | Signal extraction system, signal extraction learning method, and signal extraction learning program | |
Valero et al. | Narrow-band autocorrelation function features for the automatic recognition of acoustic environments | |
Zouhir et al. | A bio-inspired feature extraction for robust speech recognition | |
JP2012181561A (ja) | 信号処理装置 | |
JP5740353B2 (ja) | 音声明瞭度推定装置、音声明瞭度推定方法及びそのプログラム | |
JP6724290B2 (ja) | 音響処理装置、音響処理方法、及び、プログラム | |
CN106531156A (zh) | 一种基于室内多移动源实时处理的语音信号增强技术方法 | |
Hussain et al. | A speech intelligibility enhancement model based on canonical correlation and deep learning for hearing-assistive technologies | |
Nguyen et al. | Automatic Mean Opinion Score Estimation with Temporal Modulation Features on Gammatone Filterbank for Speech Assessment. | |
Pendharkar | Auralization of road vehicles using spectral modeling synthesis | |
JP2007328268A (ja) | 音楽信号の帯域拡張方式 | |
JP7278161B2 (ja) | 情報処理装置、プログラム及び情報処理方法 | |
Tu et al. | Computational auditory scene analysis based voice activity detection |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140813 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150414 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150421 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150427 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5740353 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |