JP4778613B2 - スピーチプロセシング - Google Patents
スピーチプロセシング Download PDFInfo
- Publication number
- JP4778613B2 JP4778613B2 JP2000577651A JP2000577651A JP4778613B2 JP 4778613 B2 JP4778613 B2 JP 4778613B2 JP 2000577651 A JP2000577651 A JP 2000577651A JP 2000577651 A JP2000577651 A JP 2000577651A JP 4778613 B2 JP4778613 B2 JP 4778613B2
- Authority
- JP
- Japan
- Prior art keywords
- speech
- level
- utterance
- noise
- time period
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000005259 measurement Methods 0.000 claims description 19
- 238000000034 method Methods 0.000 claims description 19
- 230000007613 environmental effect Effects 0.000 claims description 12
- 230000005534 acoustic noise Effects 0.000 abstract 3
- 230000001419 dependent effect Effects 0.000 abstract 1
- 230000008859 change Effects 0.000 description 7
- 230000000694 effects Effects 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 230000007423 decrease Effects 0.000 description 2
- 230000001934 delay Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 230000001550 time effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/20—Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0364—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
- G10L2021/03646—Stress or Lombard effect
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Electrophonic Musical Instruments (AREA)
- Indicating And Signalling Devices For Elevators (AREA)
- Exchange Systems With Centralized Control (AREA)
- Telephonic Communication Services (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
- Circuit For Audible Band Transducer (AREA)
- Bidet-Like Cleaning Device And Other Flush Toilet Accessories (AREA)
- Control Of Amplification And Gain Control (AREA)
Description
本発明は種々の量の騒音を含む環境に遭遇する話者のスピーチレベルを予測する方法及び装置に関する。
【0002】
これに限るわけではないが本発明は特にスピーチ認識に用いる装置と方法に関する。
【0003】
自動スピーチ認識の中心的プロセスは認識されるべきスピーチの若干の表示とスピーチ音又は言葉或はその他のユニットの対応する基準モデルのセットとの間の比較にある。認識器に表示されるスピーチ信号レベルが該モデルによって期待されているものに近似していることが重要である。
【0004】
スピーチ音は本来的な音の大きさに変化があるので全体的スピーチレベルの測定は平凡なプロセスではない。十分な量のスピーチのサンプルを取り上げてスピーチ音間に生じる変化を平均化するか、レベルが測定される発声を音声内容が同じ人の若干の既知レベルの発声と比較するとかが必要である。この第2の方法においては音声の同じスピーチ音が比較され得るが測定される発声の内容の情報を必要とする。
【0005】
本発明においては騒音環境にあるスピーチ信号のレベルの変化はその環境騒音レベルを測定し、そしてロンバート (Lombart) 効果として知られている現象を用いて大体のスピーチレベルを決定することにより見積ることが出来ると分かった。
【0006】
ロンバート効果とは人が騒音下にあるときはその人のスピーチの声が段段と大きく変わる現象である。自動スピーチ認識システムにおいてロンバート効果を調節しないときは、認識すべきスピーチのレベルと期待していたレベルとの間にミスマッチが生ずる。原理的にはこれはスピーチレベルを観察し認識器内増幅器の利得を調節してレベル変動を補償することが出来る。しかしある場合にはこれは現実的な構成ではない。例えば、自動車にあっては騒音は速度変化とか路面変化とか、窓が降ろされているとかにより、ある発声から他の発声へと変化する。前の発声に基づく利得設定はこのときは不適となる。ある場合には、発声が完了するまで待ち,話のレベルを測定し、記録された発声を調節してこのレベルに標準化し、このときだけ認識器へと送ることが出来る。しかし、このプロセスは認識の反応を遅らせることになり多くの適用例で受け入れられない。
【0007】
本発明は一つの視点として、色々なレベルの騒音がある環境におかれた話者のスピーチレベルを予測する装置であって、該環境の騒音を測定する手段と、及びこの測定騒音レベルを用いて該発声のスピーチレベルを予測する処理手段とよりなるスピーチレベル予測装置を提起する。
【0008】
この装置においては話者がいる場所の騒音レベルが発声間に変化し話者のスピーチレベルがロンバート効果に基づき上昇したり下降したりし、そして装置がスピーチレベルを予測する。このスピーチレベルは発声に隣接の騒音を測定し、そして定常騒音のレベル測定が全く簡単で短い騒音サンプルでなされることにより合理的な精度で予測出来る。本装置はスピーチレベルの測定値と、前の又は標準化した発声に関する対応する騒音レベルをも用いることが好ましい。
【0009】
周囲の騒音レベルは単語や句の発声中でも前でも後でも測定出来、発声の時間的至近に測定をなし、測定と実際の発声との間に騒音レベルが相当にずれることに起因するスピーチレベルの予測が不正確になるおそれを減らすのが好ましい。
【0010】
測定手段については発声直前の騒音レベルを測定し、スピーチレベルの予測はその後ではなく発声がなされながら或はその前に決定される。或は又測定は発声の後でもよい。
【0011】
本装置は発声ごとに決定するように働く手段を含むのが好ましく、この発声
ピリオドは上記騒音レベルを測定する第1のピリオドと上記発声がなされている間である第2ピリオドとよりなる。
【0012】
然して、好ましい実施態様においては、本発明は使用者入力装置(スイッチ等)、とタイマと制御手段とを含み、上記第1の騒音測定ピリオド、及び第2のスピーチ測定及び或は記録ピリオドを決定し、第1のピリオドの終わりが上記使用者に示されるのが好ましい。
【0013】
特に好ましい本発明の視点としては,本装置が話者による1つ或はそれ以上の発声に感じ、上記測定装置が上記発声毎に優勢な騒音レベルを測定し、一連の騒音測定値を作り、更に上記装置は発声のスピーチレベルを測定する手段を含み、上記プロセス手段は上記騒音測定値の少なくとも2つと直前発声のスピーチレベルの測定値とを用い、最新の発声のスピーチレベルの予測を作ることである。
【0014】
1つの例においては騒音が発声直前に測定されプロセス装置手段が次の式に基づき発声(1)のスピーチレベルを予測する。
【数3】
【0015】
但しS0は発声直前のスピーチレベル、N1、N0はスピーチレベルが予測されようとしている発声の直前の優勢な騒音レベルと、次の直前の騒音レベル、f(x)は話者がその話者のスピーチレベルにあるときの騒音レベルの変化に関する関数である。
【0016】
この関数は単調増加関数であるのが好ましく,簡単な場合は、掛け算係数が1以下である。この係数は代表的には0から0.6までの範囲の正の値であり1つの例としては0.32である。
【0017】
或はまた、この関数は騒音レベル差のもっと複雑な関数でもある。同様にこの関数は変形して2つ以上の騒音レベル測定を考慮に入れるようにしてもよく、多数の前の発声のスピーチレベルに関する情報とこれに関連する騒音レベルとを寄せ集めて次の発声のスピーチレベルを予測する。
【0018】
他の視点においては本発明はスピーチ認識即ちプロセス装置を提起し、これは上記した予測装置を含み、認識プロセシングの前にスピーチ信号の利得調節に用いる。
【0019】
更に別の視点によれば、本発明は色々なレベルの騒音がある環境におかれた話者のスピーチレベルを予測する方法であって、
該環境の騒音レベルを測定し、
この測定騒音レベルを処理してスピーチレベルを予測値を作る予測方法を提起する。
【0020】
また別の視点によれば、本発明は、スピーチ認識器または処理システムの利得を調節する方法であって、上記した方法で得たスピーチレベルの予測に基づきスピーチ信号の利得を調節する方法を提起する。
【0021】
本発明は上述した通りであるが、上述した特徴或は次の説明との組合わせの発明まで拡張することができる。
【0022】
本発明は色々な方法で実施せられるが、その例として次の1実施形態を図面を用いて説明する。
【0023】
図示の実施形態は環境騒音レベルの変化の情報、及びこれのスピーチレベルへの影響の情報とを与えスピーチ認識器で認識されるべき次の発声におけるスピーチレベルを予測するシステムを示す。単1の発声の時間の騒音レベル変化は発声と発声との間に生ずる変化と比べ比較的小さいものとし、また騒音が短時間で十分な定常性を有し、このレベルが簡単なサンプルで計測できるものとする。
【0024】
図1を説明すると、このスピーチ認識システムはマイクロホン10を具備し、その出力が14においてアナログからデジタルに変換する前に12において音声処理を受ける。このデジタル信号はデジタル利得装置16を経てプロセサ18に至るがこれには認識器20とスピーチレベル予想器22とが組み込まれる。
【0025】
このスピーチ認識器はどんな形式のものでもよく、適当な認識器は当業技術にとってよく知られたものである。プロセサ18は使用者入力装置として働くスイッチ24からの入力を受け、音響発生器26を経て警報音を発生する。
【0026】
図示のシステムは騒音レベルが変化する騒音環境内で使用するように意図されたものである。使用に際して、使用者は彼の発声を認識させたいときはスイッチ24を閉じることによりシステムを喚起する。プロセサはこのとき発声フレームを決定するが、このフレームは環境騒音をサンプルし、音響発生器26から警報音を発し使用者に話をしてよいことを示す第1の短時間ピリオドと、スピーチ信号がサンプルされ、認識器20へこれが送られる第2のピリオドとより成る。第2のピリオドは第1ピリオドより長く、最も長い発声でも含みうる十分な長さである。第2のピリオドを決めるには、設定によりこの時間を設ける以外にいろいろな手法がある。例えば使用者がボタンを押したまま保持するとかボタンを再び押すとかこのピリオドの長さを使用者が決めることが出来る。或は、プロセサが沈黙時間を聞き取ったり、発声の言葉の分析に基づきコマンドの終わりを類推するようにしてもよい。更にスイッチを利用する代わりに発声フレームの開始を使用者コードで示してもよい。
【0027】
スピーチレベルが騒音レベルと共に変化するのは公知であるから騒音レベルから発声におけるスピーチレベルの変化を予想するのは可能である。スピーチと騒音レベルS0、N0(db)は1つの騒音条件でプロセサにより測定される。次の発声の第1ピリオドにあり且つ認識されるべき発声開始直前における新たな騒音レベルN1もプロセサで計測される。2つの騒音レベルの差 N0―N1がそれから決定され、前の発声のスピーチレベルS0の情報と共にプロセサに用いられ新たな発声のスピーチレベルS1を予測する。ここで、
【数4】
【0028】
と書き表せるが、S1´はS1の予測値、f(x)は話者のスピーチレベルに対する話者の耳における騒音レベルの変化に関する関数である。最も簡単な構成においてはこの関数は1以下の係数であるが、騒音レベル差のもっと複雑な関数でもあり得る。実際には1つの適用例においてスピーチレベルの良好な結果が代表的に0.3の掛け算係数を用いて達成されると経験的に計測しているが、0から0.6までの係数でもある程度の改善をもたらす。これは全話者にとって同じと考えられるが、各話者ごとに別々に予想も出来る。
【0029】
基準たるスピーチと騒音レベルS0、N0各々の計測は測定誤差を伴うものであるから多数の前の発声と騒音予測値からS1の予測に貢献する情報とを集合することが好ましい。上記したS1´の計算は多数の前の発声の平均で置き換えることも出来る。これは単純な平均或は重みつき平均であり、この重みは色々な基準発声とS1との差のような係数と色々な基準発声の相対的時間との時間差のような係数とによって定まる。例えば計算には何らかの時間効果を勘案する。例えば特定の環境騒音にさらされた時、話者のスピーチレベルは最初より上昇し、それから一時的フィルタ効果において下降することがわかっている。
【0030】
新たな発声のスピーチレベルが決定されるとプロセサが信号の利得を制御する。この利得は色々な点で調節せられるが、信号がまだアナログ状態にあるときに調節されたり或はデジタル利得装置16によって示されるようにデジタルスケールで達成される。更に別のやり方としてはスピーチ認識器においてFFT値(fast fourier transform)を取り扱うことである。もしセプストラム(cepstrum)が計算されるならば係数C0に適当な定数を加えることにより信号の大きさが定められる。更に別な構成においては、システムが実効的なスピーチレベルを調節することによりスピーチレベルの増加、減少を補償してもよい。
【0031】
利得は単にバックグランド騒音レベル以外のファクタを考慮してもよく例えばスペクトル構造を考慮することが出来る。
【0032】
認識器の出力はいかなる便利な態様で使ってもよく、例えば装置に対して人が口で言うコマンドを発するように使ってもよい。
【図面の簡単な説明】
【図1】 本発明によるスピーチレベル予測を含んだスピーチ認識器のブロックダイヤグラムである。
Claims (11)
- 色々なレベルの騒音がある環境におかれた話者の発声のスピーチレベルを予測する装置であって、該環境の騒音を測定する手段、及びこの測定騒音レベルを用いて該発声のスピーチレベルを予測する処理手段とよりなり、該測定手段が隣接の発声の環境騒音レベルを測定する、装置において、
該測定手段を隣接の発声前に働かす手段と、
連続した発声における各発声について、上記環境騒音レベルを測定する第1の時間ピリオドと発声がなされている第2の時間ピリオドとよりなる発声時間ピリオドを決定するように働く手段と、をさらに含み、該処理手段が、第1の時間ピリオドと第2の時間ピリオドとの間の騒音測定値の計算できる差に基づいて、適切なスピーチレベルを予測する、
ことを特徴とするスピーチレベル予測装置。 - 本装置の使用者用の入力装置と、タイマと、上記第1並びに第2の時間ピリオドを決定する制御手段と、及び上記第1時間ピリオドの終わりを使用者に指示する手段とを含むことを特徴とする請求項1に記載のスピーチレベル予測装置。
- 上記予測装置が話者の1つ以上の次々の発声を測定するように働き、上記測定手段は各発声における環境騒音レベルを測定し、一連の騒音値を作るように働き、また上記予測装置は発声のスピーチレベルを測定する手段を含み、そして上記処理手段は少なくとも2つの騒音値と発声直前のスピーチレベルを表す値とをもって次の発声のスピーチレベルを予測することを特徴とする請求項2に記載のスピーチレベル予測装置。
- K>1であることを特徴とする請求項5に記載のスピーチレベル予測装置。
- Kが0より上から0.6以下にあることを特徴とする請求項5に記載のスピーチレベル予測装置。
- 騒音環境で用いられるスピーチ認識装置にして、認識しようとしているスピーチ発声を表すデータを受けこれを処理し、上記スピーチ発声の語彙内容を表したりこれに基づくデータを出力するスピーチ認識手段を含み、該スピーチ認識装置はスピーチ発声のレベルを調節するレベル調節手段を含み、さらに本認識装置は上記スピーチ発声中またはその前の上記環境騒音のレベルを測定する手段、この測定された環境騒音レベルを用い、上記スピーチ発声のレベルを予測する処理手段、及び該予測に基づき上記レベル制御手段を調節する手段、連続した発声における各発声について、上記環境騒音レベルを測定する第1の時間ピリオドと発声がなされている第2の時間ピリオドとよりなる発声時間ピリオドを決定するように働く手段を含み、該処理手段が、第1の時間ピリオドと第2の時間ピリオドとの間の騒音測定値の計算できる差に基づいて、適切なスピーチレベルを予測する、ことを特徴とするスピーチ認識装置。
- 色々なレベルの騒音がある環境におかれた話者の発声のスピーチレベルを予測する方法であって、該環境の騒音レベルを測定し、この測定騒音レベルを処理して該発声のスピーチレベルを予測し、さらに、連続した発声における各発声について、上記環境騒音レベルを測定する第1の時間ピリオドと発声がなされている第2の時間ピリオドとよりなる発声時間ピリオドを決定し、第1の時間ピリオドと第2の時間ピリオドとの間の騒音測定値の計算できる差に基づいて、適切なスピーチレベルを予測することを含む処理をすることを特徴とするスピーチレベル予測方法。
- 連続した発声における各発声について、上記環境騒音レベルの複数の測定が行われ、環境騒音レベルの上記測定に対応する1つ或は複数の発声のスピーチレベルの測定と共に用いて発声の適切なスピーチレベルを予測することを特徴とする請求項9に記載のスピーチレベル予測方法。
- 色々なレベルの騒音がある環境におけるスピーチ認識器または処理システムの利得を調節する方法であって、スピーチレベルの予測に基づきスピーチ信号の利得を調節し、該予測は上記環境騒音レベルの測定によって得られ、そして、上記測定された騒音レベルを処理して上記発声のスピーチレベルの予測をなし、さらに、連続した発声における各発声について、上記環境騒音レベルを測定する第1の時間ピリオドと発声がなされている第2の時間ピリオドとよりなる発声時間ピリオドを決定し、第1の時間ピリオドと第2の時間ピリオドとの間の騒音測定値の計算できる差に基づいて、適切なスピーチレベルを予測することを含む処理をすることを特徴とするスピーチ認識または処理システムの利得を調節する方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
GBGB9822529.5A GB9822529D0 (en) | 1998-10-16 | 1998-10-16 | Speech processing |
GB9822529.5 | 1998-10-16 | ||
PCT/GB1999/003322 WO2000023984A1 (en) | 1998-10-16 | 1999-10-15 | Speech processing |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2002528753A JP2002528753A (ja) | 2002-09-03 |
JP4778613B2 true JP4778613B2 (ja) | 2011-09-21 |
Family
ID=10840649
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000577651A Expired - Fee Related JP4778613B2 (ja) | 1998-10-16 | 1999-10-15 | スピーチプロセシング |
Country Status (8)
Country | Link |
---|---|
EP (1) | EP1121685B1 (ja) |
JP (1) | JP4778613B2 (ja) |
AT (1) | ATE241845T1 (ja) |
AU (1) | AU6479499A (ja) |
CA (1) | CA2346967A1 (ja) |
DE (1) | DE69908396T2 (ja) |
GB (1) | GB9822529D0 (ja) |
WO (1) | WO2000023984A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DK2617127T3 (en) | 2010-09-15 | 2017-03-13 | Sonova Ag | METHOD AND SYSTEM TO PROVIDE HEARING ASSISTANCE TO A USER / METHOD AND SYSTEM FOR PROVIDING HEARING ASSISTANCE TO A USER |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03138698A (ja) * | 1989-10-25 | 1991-06-13 | Yuhshin Co Ltd | 車載用音声認識装置の入力方式 |
JPH03206499A (ja) * | 1989-10-04 | 1991-09-09 | Matsushita Electric Ind Co Ltd | 音声認識装置 |
JPH0677894A (ja) * | 1986-06-02 | 1994-03-18 | British Telecommun Plc <Bt> | 無線端末装置 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS58190994A (ja) * | 1982-05-01 | 1983-11-08 | 日産自動車株式会社 | 車両用音声認識装置 |
JPS59139099A (ja) * | 1983-01-31 | 1984-08-09 | 株式会社東芝 | 音声区間検出装置 |
JPH04343399A (ja) * | 1991-05-20 | 1992-11-30 | Ricoh Co Ltd | 音声特徴量抽出方式及び音声認識装置 |
JPH05224694A (ja) * | 1992-02-14 | 1993-09-03 | Ricoh Co Ltd | 音声認識装置 |
JPH0627991A (ja) * | 1992-07-13 | 1994-02-04 | Toshiba Corp | 音声認識装置 |
KR100217734B1 (ko) * | 1997-02-26 | 1999-09-01 | 윤종용 | 음성인식 전화기에서 잡음에 따른 음성 인식 레벨 조절장치 및 방법 |
-
1998
- 1998-10-16 GB GBGB9822529.5A patent/GB9822529D0/en not_active Ceased
-
1999
- 1999-10-15 EP EP99952678A patent/EP1121685B1/en not_active Expired - Lifetime
- 1999-10-15 DE DE69908396T patent/DE69908396T2/de not_active Expired - Fee Related
- 1999-10-15 CA CA002346967A patent/CA2346967A1/en not_active Abandoned
- 1999-10-15 AT AT99952678T patent/ATE241845T1/de not_active IP Right Cessation
- 1999-10-15 AU AU64794/99A patent/AU6479499A/en not_active Abandoned
- 1999-10-15 JP JP2000577651A patent/JP4778613B2/ja not_active Expired - Fee Related
- 1999-10-15 WO PCT/GB1999/003322 patent/WO2000023984A1/en active IP Right Grant
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0677894A (ja) * | 1986-06-02 | 1994-03-18 | British Telecommun Plc <Bt> | 無線端末装置 |
JPH09325790A (ja) * | 1986-06-02 | 1997-12-16 | British Telecommun Plc <Bt> | 音声処理方法および装置 |
JPH03206499A (ja) * | 1989-10-04 | 1991-09-09 | Matsushita Electric Ind Co Ltd | 音声認識装置 |
JPH03138698A (ja) * | 1989-10-25 | 1991-06-13 | Yuhshin Co Ltd | 車載用音声認識装置の入力方式 |
Also Published As
Publication number | Publication date |
---|---|
ATE241845T1 (de) | 2003-06-15 |
CA2346967A1 (en) | 2000-04-27 |
EP1121685A1 (en) | 2001-08-08 |
EP1121685B1 (en) | 2003-05-28 |
DE69908396D1 (de) | 2003-07-03 |
GB9822529D0 (en) | 1998-12-09 |
DE69908396T2 (de) | 2004-04-01 |
WO2000023984A1 (en) | 2000-04-27 |
AU6479499A (en) | 2000-05-08 |
JP2002528753A (ja) | 2002-09-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Bistafa et al. | Reverberation time and maximum background-noise level for classrooms from a comparative study of speech intelligibility metrics | |
Kubichek | Mel-cepstral distance measure for objective speech quality assessment | |
US5276765A (en) | Voice activity detection | |
EP1252621B1 (en) | System and method for modifying speech signals | |
KR100438826B1 (ko) | 스무딩 필터를 이용한 음성 합성 시스템 및 그 방법 | |
JP3321156B2 (ja) | 音声の動作特性検出 | |
US20080044048A1 (en) | Modification of voice waveforms to change social signaling | |
US10755731B2 (en) | Apparatus, method, and non-transitory computer-readable storage medium for storing program for utterance section detection | |
JPH09505701A (ja) | 電気通信装置の試験 | |
EP1774516B1 (en) | Normalization of cepstral features for speech recognition | |
JP6996185B2 (ja) | 発話区間検出装置、発話区間検出方法及び発話区間検出用コンピュータプログラム | |
JP4778613B2 (ja) | スピーチプロセシング | |
Alku et al. | Effects of bandwidth on glottal airflow waveforms estimated by inverse filtering | |
JP3350713B2 (ja) | 騒音源の種類を特定する方法、その装置および媒体 | |
Kaur et al. | Optimizing feature extraction techniques constituting phone based modelling on connected words for Punjabi automatic speech recognition | |
US6539350B1 (en) | Method and circuit arrangement for speech level measurement in a speech signal processing system | |
CN113593604A (zh) | 检测音频质量方法、装置及存储介质 | |
JP2976998B2 (ja) | 発話速度測定装置 | |
Dai et al. | An improved model of masking effects for robust speech recognition system | |
Surahman | An analysis of voice spectrum characteristics to the male voices recording using praat software | |
JPH08110796A (ja) | 音声強調方法および装置 | |
KR100741355B1 (ko) | 인지 가중 필터를 이용한 전처리 방법 | |
JP2003057108A (ja) | 音響評価方法およびそのシステム | |
Sedigh | Application of polyscale methods for speaker verification | |
JPH1124692A (ja) | 音声波の有音/休止区間判定方法およびその装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060926 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100119 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100407 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110104 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20110404 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20110411 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110428 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110607 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110704 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4778613 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140708 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |