JP2004502985A - 以後のオフライン音声認識のための音声情報を記録する記録装置 - Google Patents

以後のオフライン音声認識のための音声情報を記録する記録装置 Download PDF

Info

Publication number
JP2004502985A
JP2004502985A JP2002509271A JP2002509271A JP2004502985A JP 2004502985 A JP2004502985 A JP 2004502985A JP 2002509271 A JP2002509271 A JP 2002509271A JP 2002509271 A JP2002509271 A JP 2002509271A JP 2004502985 A JP2004502985 A JP 2004502985A
Authority
JP
Japan
Prior art keywords
information
recording
voice
quality
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2002509271A
Other languages
English (en)
Other versions
JP2004502985A5 (ja
JP4917729B2 (ja
Inventor
バルトシク ハインリッヒ エフ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Publication of JP2004502985A publication Critical patent/JP2004502985A/ja
Publication of JP2004502985A5 publication Critical patent/JP2004502985A5/ja
Application granted granted Critical
Publication of JP4917729B2 publication Critical patent/JP4917729B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/69Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for evaluating synthetic or decoded voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/42221Conversation recording systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/225Feedback of the input speech
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/40Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/60Medium conversion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/50Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
    • H04M3/51Centralised call answering arrangements requiring operator intervention, e.g. call or contact centers for telemarketing
    • H04M3/5108Secretarial services

Abstract

【課題】オフライン音声認識サービスのユーザが、受信された音声信号の品質が、オフライン音声認識の場合に、この回路に続く音声認識デバイスが、十分高い品質を持ってテキスト情報を認識できるために十分であるか否かについてのフィードバックを、口述中に、既に、受信している記録デバイスを提供すること。
【解決手段】口述の音声情報(SI)を記録し、次いで、前記口述の前記記録された音声情報をオフライン音声認識のための音声認識デバイス(4)に転送するための記録装置(3)において、前記記録装置が、前記口述の前記音声情報(SI)を受信するための受信手段(6)と、前記口述の前記受信された音声情報(SI)を前記記録装置(3)の記録モードで記録するための記録手段(7)と、前記口述の記録された音声情報(SI)を前記記録装置の転送モードで前記音声認識デバイス(4)に転送するための転送手段(8)であって、前記音声認識デバイスが、前記転送された音声情報(SI)に割り当てられるテキスト情報(TI)を認識するように構成され、前記認識されたテキスト情報(TI)の品質が前記受信された音声情報(SI)の品質に依存する転送手段(8)と、を有し、さらに、前記記録モードで受信された前記音声情報(SI)が前記音声認識デバイス(4)によって処理される時に、前記記録モードで受信された前記音声情報(SI)の品質が、前記認識されたテキスト情報(TI)の予め定められた品質を得るに十分であるかどうかをテストするための音声品質テスト手段(13)であって、前記音声情報(SI)が、前記転送モードで前記転送手段によって転送される音声品質テスト手段(13)を有し、かつ、前記記録モードでフィードバック情報(FI)を転送するためのフィードバック手段(14)であって、前記フィードバック情報が前記音声品質テスト手段(13)の前記テストの結果を表すフィードバック手段(14)を有する。
【選択図】図1

Description

【0001】
【発明の属する技術分野】
本発明は、口述の音声情報を記録し、次いで、前記口述の前記記録された音声情報をオフライン音声認識のための音声認識デバイスに転送するための記録装置において、前記記録装置が、前記口述の前記音声情報を受信するための受信手段と、前記口述の前記受信された音声情報を前記記録装置の記録モードで記録するための記録手段と、前記口述の記録された音声情報を前記記録装置の転送モードで前記音声認識デバイスに転送するための転送手段であって、前記音声認識デバイスが、前記転送された音声情報に割り当てられるテキスト情報を認識するように配置され、前記認識されたテキスト情報の品質が前記受信された音声情報の品質に依存する転送手段と、を有する記録装置に関する。
【0002】
【従来の技術】
冒頭のパラグラフに記載の種類の記録装置は、英国特許出願公開GB−A−2,323,693号により既知であり、かつオフライン音声認識サービスのコンピュータサーバによって構成される。オフライン音声認識サービスを利用するために、ユーザは、電話を介してコンピュータサーバを呼び出し、電話に口述を話すことができる。コンピュータサーバの受信手段が、電話回線に接続され、ハードディスクによって構成される記録手段が、受信された音声信号を記憶する。
【0003】
ユーザが口述を終了した後、記録された音声信号は、オフライン音声認識用の音声認識デバイスに転送される。音声認識デバイスが、その音声信号に割り当てられるテキスト情報を認識し、その後、オフライン音声認識サービスのオペレータが、認識されたテキスト情報内に存在する明白な誤りを訂正する。その後、認識され、そして、誤りが訂正されたテキスト情報が、オフライン音声認識サービスのユーザにe−メールで送られ、その作業の費用が、ユーザに請求される。
【0004】
【発明が解決しようとする課題】
この既知の記録デバイスにおいて、オフライン音声認識サービスのユーザが、ときには長い口述を行ない、そして、受信されかつ記録された音声信号の品質が、その後に転送される音声信号を音声認識デバイスがうまく処理できるほど十分であるか否かについて、何のフィードバックも与えられないということが、問題であるということが判明している。オフライン音声認識サービスのユーザに対して、彼の口述の記録された音声信号が、(例えば、性能の低い電話線のために)音声認識デバイスによって受け入れられないようなことが発生すれば、そのユーザは、最早二度とそのオフライン音声認識サービスを使わないであろう。これは、オフライン音声認識サービスのプロバイダにとって、大きな財政損失を意味する。
【0005】
認識されたテキスト情報の品質が低いため、オフライン音声認識サービスのオペレータが、多数の明らかな誤りを訂正しなければならないということも、既知の記録デバイスのさらなる問題として判明している。したがって、オフライン音声認識サービスのユーザに、既に受信された音声信号の品質が低いことが口述中に指摘されるならば、オフライン音声認識サービスの費用は、相当に低減させることができる。
【0006】
【課題を解決するための手段】
本発明の1つの目的は、オフライン音声認識サービスのユーザが、受信された音声信号の品質が、オフライン音声認識の場合に、この回路に続く音声認識デバイスが、十分高い品質を持ってテキスト情報を認識できるために十分であるか否かについてのフィードバックを、口述中に、既に、受信している記録デバイスを提供することである。
【0007】
この目的は、冒頭のパラグラフに記載の種類の記録デバイスであって、前記記録モードで受信された前記音声情報が、前記音声認識デバイスによって処理される時に、前記記録モードで受信された前記音声情報の品質が、前記認識されたテキスト情報の予め定められた品質を得るに十分であるか否かをテストするための音声品質テスト手段であって、前記音声情報が、前記転送モードで前記転送手段によって転送される音声品質テスト手段を有する音声品質テスト手段を有し、かつ、前記記録モードで、前記音声品質テスト手段の前記テストの結果を表すフィードバック情報を転送するためのフィードバック手段を有する記録装置により実現される。
【0008】
このことは、前記記録デバイスの前記ユーザが、前記受信された音声情報が、前記音声認識デバイスによってうまく処理されるのに十分であるか否かに関するフィードバックを、口述中に既に、受信しているという利点を提供する。
【0009】
記録された音声信号の記録レベルをユーザが認識できるインディケータを有するディクテーティング機が、公知であることは、理解されるであろう。これにより、ユーザは、記録される音声信号のよりよい記録レベルを得るために、より大声で、または、より小声で話すことができる。しかしながら、記録された音声信号のただ1つまたは複数のパラメータにしかこのようなモニタリングをしないことは、高い信頼性で上述の目的を到達するためには十分ではない。
【0010】
さらに、ユーザがマイクロフォンに口述を行ない、若干の処理期間の後に認識されたテキストをモニタ上に表示させることができるオンライン音声認識方式を実行するための音声認識デバイスが、公知であることも理解されるであろう。ユーザが、認識されたテキスト中の多くの誤りから、認識されたテキストの品質が低いことを認識すると、そのユーザは、処理された音声信号の記録レベルの表示を利用して、それに対応するように、口述中の自分の声の大きさを変えたり、または、再度、音声認識デバイスのマイクロフォンのオーディオ状態を変更することが出来る。
【0011】
既知のディクテーティング機およびオンライン音声認識のための既知の音声認識デバイスの場合、受信されかつ処理された音声信号のただ1つのパラメータしか、示されない。これは、受信された音声信号の品質がその後の音声認識に適するか否かという、受信された音声信号の品質テストに全く適さない。さらに、既知のディクテーティング機および既知の音声認識デバイスでは、処理された音声信号の記録レベルを単に示すのみで、記録レベルの値が、受信された音声情報の品質に関し、その後のオフライン音声認識に対して十分ではないということは、示されない。何故ならば、このような記録レベルは、いずれにしても、後のオーディオ再生のための口述の単なる記録にも、オンライン音声認識にも、必要ではないからである。したがって、本発明による記録デバイスが解決しようとする課題も、その課題を解決するために発見された解決法も、従来技術のディクテーティング機およびオンライン音声認識のための音声認識デバイスにおいては知られていない。
【0012】
請求項2および請求項3に記載の装置によれば、記録中に既に、記録デバイスによって記録されるべき音声信号の品質が、十分に良好な信号/雑音比および十分に高いレベルに対してテストされるという利点が得られる。
【0013】
請求項4に記載の装置によれば、ユーザが、どの程度速く口述の言葉を話しているかについてテストが行なわれ、そして、話す速度が速すぎる場合には、そのユーザが、フィードバック情報によりもっとゆっくり話すように要求され、その結果、認識されるテキスト情報が、それに対応させた高い品質に達するという利点が得られる。
【0014】
請求項5に記載の装置によれば、ユーザが、どのくらい明瞭に、理解し易く、それぞれ、口述の言葉を話しているかについてテストが行なわれ、そして、ユーザが不明瞭に言葉を発している場合には、そのユーザは、フィードバック情報によって、もっと明瞭に、理解し易く話すように要求され、その結果、認識されるテキスト情報の、それに対応させた高い品質が得られるという利点が得られる。
【0015】
請求項6に記載の装置によれば、口述中に、その後の音声認識に対し、その後の処置によって、十分に高品質な音声情報の記録が得られるように、記録デバイスが、受信された音声情報の品質が低い場合に指示をユーザに与えるという利点が得られる。
【0016】
【発明の実施の形態】
本発明のこれらの、および、他の有利な観点は、以下の実施例の参照により明らかとなり、解明されるであろう。
【0017】
図1は、オフライン音声認識方法を実行できるオフライン音声認識システム1を示している。このシステムは、電話2、電話録音マシン(telephone answering machine)3、音声認識コンピュータ4、ユーザ端末5、を有している。電話2およびユーザ端末5が、オフライン音声認識システム1のユーザの使用できるものであり、電話/データネットワークNETを介して、電話録音マシン3および音声認識コンピュータ4に接続されている。
【0018】
音声認識コンピュータ4は、(例えば、Philips社の音声認識ソフトウェアSpeech Magicのような)音声認識ソフトウェア上で動作し、したがって、オフライン音声認識方法を実行するための音声認識デバイスを構成する。音声認識デバイスは、従来から知られているように、転送された音声情報SIのデジタル音声データSD(SI)を受信し、そして、この受信された音声情報SIに割り当てられるテキスト情報TIを認識する。
【0019】
認識されたテキスト情報TIの品質は、認識されたテキスト情報TI内の正しく認識された単語と、認識されたテキスト情報TI内で得られた全ての単語との比として定義できる認識品質値で、記述することができる。音声認識デバイスによって認識されるテキスト情報TIの品質は、多くの影響因子に依存する。そのような影響因子としては、例えば、音声認識デバイスのトレーニング状態や、音声認識デバイスが認識し得る単語の数すなわち基本辞書(basic lexicon)に収納されている単語の数がある。しかしながら、最良の音声認識デバイスであっても、音声情報SIの品質が悪ければ、高い認識品質レベルを持つテキスト情報TIを認識することはできないので、音声認識デバイスが受信する音声情報SIの品質も、これらの影響因子の1つである。
【0020】
音声情報SIの品質は、非常に強い背景ノイズや、電話2の性能の悪いマイクロフォンによって、口述の間に既に損なわれていたり、または電話/データネットワークNETの電話線の不十分な送信特性によって、音声情報SIの送信のすぐ後で既に損なわれていたりすることがある。この場合には、音声情報SIに内包されるアナログ電気的音声信号SS(SI)の品質は、音声信号SS(SI)の信号/雑音比および音声信号SS(SI)のレベルによって記述させることができる。
【0021】
音声信号SS(SI)に内包される音声情報SIを、テキスト情報TIの認識のために、音声認識デバイスによって評価させるとき、オフライン音声認識方法のための音声情報SIの品質を、さらに、別のパラメータによって記述することも出来る。これらのパラメータの1つは、以下に詳細に検討されるように、音声情報SIに含まれている単語の連続する速度を意味するスピーチ速度パラメータである。
【0022】
音声認識コンピュータ4もユーザ端末5も、(例えば、IBMのLotus Notesのような)e−メールソフトウェア上で動作し、かつ電話/データネットワークNETに接続されている。音声認識コンピュータ4は、このオフライン音声認識方法が終了すると、オフライン音声認識システム1のユーザのユーザ端末5に、e−メールの添付メールとして、認識されたテキスト情報TIを送る。
【0023】
電話録音マシン3は、電話録音マシン3に転送されてきた口述の音声情報SIを記録し、その後、その口述の記録された音声情報SIを転送する記録デバイスを構成している。この目的のために、電話録音マシン3は、受信手段6、記録手段7、転送手段8を有している。
【0024】
受信手段6は、電話プラグ9および電話インターフェースステージ10を有している。電話録音マシン3は、電話プラグ9を介して、電話/データネットワークNETに接続されている。オフライン音声認識システム1のユーザは、自分の電話2を用いて電話録音マシン3の電話番号をダイアルし、そして、自分のユーザ端末5を用いて、認識されたテキスト情報TIとして受信したいと思う自分の口述の音声情報SIを入力することができる。そして、電話インターフェースステージ10は、従来から知られているように、電話標準に一致する信号および電圧を受信し、転送するために設けられている。したがって、音声情報SIの音声信号SS(SI)が、電話2から、電話/データネットワークNET、電話プラグ9および電話インターフェースステージ10を介して、記録手段7に転送される。
【0025】
記録手段7は、音声情報SIのアナログ音声信号SS(SI)を、デジタル音声データSD(SI)に変換するためのアナログ−デジタル変換器を有している。記録手段7は、さらに、電話録音マシン3の記録モードで音声データSD(SI)を記録するハードディスクを有している。
【0026】
記録手段7は、転送手段8の一部を構成していて、電話録音マシン3の転送モードで記録された音声データSD(SI)を、それぞれ、再生したり、転送したりするように構成されている。電話録音マシン3の転送手段8は、さらに、再生された音声データSD(SI)が符号化方法にしたがって符号化されるデータ処理ステージ11を有している。この操作は、音声認識コンピュータ4に対して、音声データSD(SI)の処理を、より容易にする。転送手段8のデータ端子を介して、処理された音声データSD(SI)が、電話録音マシン3から音声認識コンピュータ4に転送される。
【0027】
電話録音マシン3は、記録モードで受信された音声情報SIの品質が、転送モードで転送手段8から転送された音声情報SIの処理中に認識されるテキスト情報の予め定められている品質に、十分到達しているか否かをテストするように構成されている音声品質テスト手段13を有する。この目的のために、音声品質テスト手段13は、音声信号SS(SI)の信号/雑音比、音声信号SS(SI)のレベル、および、音声情報SIのスピーチ速度パラメータをテストするように構成されている。
【0028】
信号/雑音比をテストするために、50ms毎の音声信号SS(SI)の時間スロットのスペクトル成分に含有されるエネルギー量が決定され、エネルギー量の周波数分布が決定される。このようにして決定された周波数分布曲線の幅が広がれば広がるほど、音声信号SS(SI)の信号/雑音比は、小さくなる。専門家は、電気信号の信号/雑音比を決定する他の同様の方法に精通している。
【0029】
信号/雑音比が小さすぎる場合には、かなり大きな雑音成分が、音声信号SS(SI)に含まれている。これは、音声信号SS(SI)のアナログ−デジタル変換中に外乱を与え、その結果、音声データSD(SI)に内包される音声情報SIが、最早、ユーザによって話された音声情報SIに一致しなくなる。信号/雑音比が小さすぎる、このような品質の低い音声信号SS(SI)内に発生する音声情報SIは、音声認識デバイスによって、認識品質のかなり低い値でしか認識され得ない。
【0030】
音声信号SS(SI)のレベルをテストするために、スパイク部のエネルギー量を削除して、各スペクトル成分で決定されたエネルギー量を足し合わせる。音声信号SS(SI)のレベルが低すぎると、その音声信号SS(SI)に重なる雑音信号の効果が、音声信号SS(SI)が十分高いレベルを有している場合よりも、相当に顕著になる。したがって、音声信号SS(SI)のレベルが低すぎる場合、その音声信号SS(SI)は低品質である。
【0031】
スピーチ速度をテストするために、音声品質テスト手段13が、音声情報SIのスピーチ速度パラメータを決定する。この目的のために、音声品質テスト手段13内に備えられた時間測定手段が、大きなエネルギー量を持つ音声信号SS(SI)の隣接するセクション間の時間間隔を決定する。このように決定された時間間隔が小さければ小さいほど、音声情報SIの各声が、たがいにより速く続き、そして、オフライン音声認識システム1のユーザは、より高速に話している。
【0032】
スピーチ速度パラメータにより、ユーザがかなり高速に話していたことが見出されると、そのオフライン音声認識方法による処理において、音声情報SIは低品質である。このような音声情報SIは、音声認識デバイスによって低品質であるとしか認識されず、この結果、この場合に音声認識デバイスによって認識されるテキスト情報TIは、低品質であり、かつ、低い値の認識品質しか有しない。
【0033】
音声品質テスト手段13による音声信号SS(SI)のテストは、10秒の時間周期で行われる。受信された音声情報SIの品質テスト結果は、その後、音声品質情報QIとして、電話録音マシン3のフィードバック手段14に転送される。10秒間の長さの周期で音声信号SS(SI)をテストすることによって、例えば、電話線のひびの結果として、音声信号SS(SI)の品質がわずかに低下したとしても、これによって、音声品質情報QIが低い値になることはない。
【0034】
フィードバック手段14は、電話録音マシン3の記録モードが活性状態にあり、かつ、音声品質情報QIとして低い値が受信されたときに、オフライン音声認識システム1のユーザに、フィードバック情報FIを伝える。したがって、フィードバック情報FIは、音声品質テスト手段13のテスト結果を示すものである。
【0035】
このことにより、電話録音マシン3に受信された音声情報SIの品質が低すぎて、その後のオフライン音声認識方法において十分に高い品質を持ち得るテキスト情報が実現できないときに、オフライン音声認識システム1のユーザが、口述中、既に、フィードバック情報FIを受信しているという利点が得られる。この結果、そのユーザが、すぐにフィードバック情報FIに対応できるという利点が得られ、したがって、音声情報SIの品質が低すぎるという事実によって、彼の全口述が使用不可能になってしまうという事態の発生を回避することができる。
【0036】
オフライン音声認識システム1の操作、および、電話録音マシン3の利点を、実施例を参照して、以下に、詳細に説明する。オフライン音声認識システム1のユーザが、医師で、かつ彼が、自分の発見を口述しようとしていると仮定する。さらに、この医師は、既に、オフライン音声認識システム1の身元確認ルーチンを通して既に作業にはいっていて、そして、(図1には全く示されていないが)医師のクレジットカード番号とともに医師の電話2の電話番号が、オフライン音声認識サービス料金の支払いのために、オフライン音声認識システム1に格納されていると仮定する。
【0037】
医師は、今、電話録音マシン3の電話番号をダイアルし、オフライン音声認識システム1の使い方を簡単に説明しているテキストを聞いている。テレフォンインターフェース手段10が、テレフォンプロトコルに送信されてきた電話2の電話番号により発信人の身元を確認し、それによって、オフライン音声認識サービス料金の支払いが、可能になる。その後、電話録音マシン3の記録モードが活性状態になり、医師が、自分の発見を、話し始める、即ち、口述し始める。そして、話された言葉の音声情報SIが、受信手段6によって音声信号SS(SI)として受信され、記録手段7のハードディスクに音声データSD(SI)として記憶される。
【0038】
医師が口述している最中に、彼の助手が、部屋に入ってきて窓を開け、その後、通りからの雑音が、電話録音マシンによって受信される音声情報SIに、かなり強い背景雑音として含まれるようになる。自分の口述に熱中している医師は、このことに気付かず、自分の発見を口述し続ける。
【0039】
次いで、音声品質テスト手段13が、常に遂行されている信号/雑音比、レベルおよびスピーチ速度のテストの結果により、音声信号SS(SI)の信号/雑音比が相当に低下していることを確認し、そしてフィードバック手段14に、それぞれの音声品質情報QIを送る。次いで、フィードバック手段14は、ユーザに彼の部屋の背景雑音が強すぎることを指摘するフィードバック情報FIとしてフィードバック手段14に記録されたテキストを、再生する。この再生されたテキストに対応する音声信号SS(FI)が、電話プラグ9および電話/データネットワークNETを介して、電話2に与えられる。背景雑音を減少させなければ認識されるテキスト情報TIが多くの誤りを含むことになると言う理由から、ユーザは、フィードバックテキストFIにより、背景雑音を減少させるよう要求される。
【0040】
このことにより、過度の背景雑音が含まれているという問題が、医師に、すぐに、指摘されるので、窓が開かれた以後に口述されたテキストの、認識されたテキスト情報TIに多くの誤りが導入されることを避けることが出来る利点が得られる。フィードバックテキストFIによって警告され、医師は、窓を閉め、口述を続けるので、過度の背景雑音の問題は、解決される。
【0041】
医師は、自分のテキストの口述を終え、通話を止める。その後、電話録音マシンは、記録モードから転送モードに変り、医師の口述の記録された音声データSD(SI)を、音声認識コンピュータ4に転送する。音声データSD(SI)が転送されている間に、他のオフライン音声認識システム1のユーサが、電話録音マシン3を呼び出すと、転送モードは中断され、そして後に再開される。
【0042】
次いで、音声認識コンピュータ4によって構成される音声認識デバイスが、転送された音声データSD(SI)に割り当てられるテキスト情報TIを認識し、それを、eメールの添付ファイルとして医師のユーザ端末に転送する。このようにして、医師は、eメールにより、自分の口述から認識されたテキストを受信し、そして、このオフライン音声認識サービスの費用が、彼のクレジットカードに請求される。
【0043】
オフライン音声認識システム1のさらなる実施例によれば、医師は、電話録音マシン3の電話番号をダイアルするが、この場合、電話/データネットワークNETの電話線の送信品質はかなり低い。このことは、医師の口述の最初の単語の音声信号SS(SI)のテスト中に既に、この音声信号SS(SI)の信号/雑音比が低く、かつ、レベルが低いために、音声品質テスト手段14によって、確認される。
【0044】
口述の最初の数語ですぐに、医師が、フィードバック手段14から、電話線の品質が非常に低いので、通話を中止し、通話し直すことを要求するフィードバック情報FIを受信することは、利点である。このようにして、医師が、全テキストを電話2に口述したが、認識されたテキストが低品質であるためにオフライン音声認識システム1に不満を抱くということが、この場合にも、回避される。
【0045】
記録デバイスがフィードバック情報FIを敏速にフィードバックすることによって、音声認識コンピュータ4によって認識されたテキストをeメイルによってユーザ端末5に送る前に、明白な誤りを捜すためにこのテキストをチェックする、オフライン音声認識システム1のオペレータが、非常に多くの誤りを訂正する必要がなくなるという利点も、得られる。したがって、ユーザに即座にフィードバックする結果、従業員の作業時間の増加を省くことが可能となるので、オフライン音声認識サービスが、より高い費用効率で実行することが可能になる。
【0046】
図2は、オフライン音声認識における記録デバイスをも構成しているユーザのハンドヘルド型デジタルディクテーティング機15を示している。ユーザによって話された口述の音声情報SIが、マイクロフォン17と信号処理ステージ18とを有する受信手段16によって受信される。
【0047】
ディクテーティング機15の記録モードで、信号処理ステージ18によって転送された音声情報SIの音声信号SS(SI)が、アナログ/デジタル変換器と、記憶媒体としてのサポートバッテリ付きのフラッシュRAMとを有する記録手段19によって記憶される。
【0048】
記録手段19は、ディクテーティング機15の転送モードで、記録された音声情報SIを内包するデジタル音声データSD(SI)を、転送手段20のデータ処理ステージ21に転送する転送手段20の一部を構成している。データ処理ステージ21は、再生された音声データSD(SI)を処理し、その処理された音声データSD(SI)をデータ端子22に転送するように構成されている。
【0049】
ディクテーティング機15は、そのデータ端子22によって、音声認識ソフトウェアを走らせる音声認識コンピュータ23に接続可能である。ディクテーティング機15によって転送された音声情報SIから音声認識コンピュータ23によって認識されたテキスト情報TIが、音声認識コンピュータ23からモニタ24に転送され、そこで表示される。
【0050】
ディクテーティング機15は、さらに、その動作が、図1に示す音声品質テスト手段13の動作と同じである音声品質テスト手段13を有している。音声品質テスト手段13によって確認された音声品質情報QIは、フィードバック手段25および記録手段19に転送可能である。
【0051】
音声品質テスト手段13が、音声信号SS(SI)の信号/雑音比が小さすぎることを確認すると、フィードバック手段25は、スイッチオン電圧を1番目のフィードバック情報FI1として発光ダイオード26に転送する。フィードバック手段25は、さらに、音声品質テスト手段13が、音声信号SS(SI)のレベルが小さすぎることを確認すると、スイッチオン電圧を2番目のフィードバック情報FI2として発光ダイオード27に転送する。フィードバック手段25は、さらに、音声品質テスト手段13が、音声信号SS(SI)を基として、ユーザの話し方が速すぎることを確認すると、スイッチオン電圧を3番目のフィードバック情報FI3として発光ダイオード28に転送する。
【0052】
ディクテーティング機15の動作を、具体例を参照して、以下により詳しく説明する。一例として、ディクテーティング機15のユーザは、旅行中であり、到着先で、そのディクテーティング機15を用いて口述を行って、記録された口述を、自分の音声認識コンピュータ23によって処理し、認識されたテキスト情報TIをモニタ24に表示させたいと考えていると仮定しよう。
【0053】
この目的のために、このユーザは、ディクテーティング機15の記録モードを活性状態にし、口述を記録し始める。ユーザは、非常に急いでいるので、極めて早口に口述する。このため、この時にディクテーティング機15によって記録される音声情報SIのスピーチ速度が速すぎて、このオフライン音声認識方法と音声認識コンピュータ23とを用いて認識されたテキスト情報TIは、十分高い認識品質に到達できない。
【0054】
次いで、音声品質テスト手段13が、フィードバック手段25に、それぞれの音声品質情報QIを転送する。フィードバック手段25は、発光ダイオード28に第3のフィードバック情報FI3を転送する。この結果、発光ダイオード28は、発光を始め、ユーザに、彼の話し方が速すぎるので、記録された音声データSD(SI)がオフライン音声認識に適さないということを示す。
【0055】
ユーザが、発光ダイオード28の発光に気付き、自分の話している口述の言葉が速すぎることを認識し、そして、もっとゆっくりと話し始めることは、利点である。次いで、発光ダイオード28は発光を止め、それ以後に記録される音声データSD(SI)は、音声認識コンピュータ23による良好な処理に適したものとなる。
【0056】
記録手段19は、それぞれの音声データSD(SI)に割り当てられ、かつ音声品質テスト手段13によって決定される音声品質情報QIを記録し、そして、それを、音声データSD(SI)とともに、ディクテーティング機15の転送モードで音声認識コンピュータ23に転送する。
【0057】
このことは、音声認識コンピュータ23が、非常に品質の低い音声情報SIを内包する音声データSD(SI)を処理する際、それらの音声データSD(SI)を、できる限り良好な認識品質の結果が得られるような処理に適した処置を採用するように構成することができるという利点を提供する。このような処置としては、例えば、受信されたデジタル音声データSD(SI)の適切な前処理がある。
【0058】
この点で、オフライン音声認識方法は、口述の間に、音声情報SIに割り当てられる、認識されたテキスト情報TIがユーザにすぐには示されない音声認識方式(オンライン音声認方式がこれに当たる)であると理解されることは認識されるであろう。このようなオンライン音声認識方式は、例えば、フィリップス社の音声認識ソフトウェアFreeSpeech 2000を用いて実現される。
【0059】
記録手段による音声情報SIの記録と転送の結果として、音声情報SIがデジタル音声データSD(SI)として記録されるため、受信された音声情報SIの品質に余分な劣化が生じないということは認識されるであろう。この結果、実際(上述したように)、音声品質テスト手段を用いて受信されたアナログ音声信号SS(SI)の品質をテストすることによって、音声認識デバイスによって受信され、かつ処理された最後のデジタル音声データSD(SI)の品質を、推測することが出来る。
【0060】
オフライン音声認識方法に対する音声情報SIの品質を、さらなるパラメータ、即ち、理解度パラメータによっても記述できることは、認識されるであろう。音声品質テスト手段を用いて音声信号SS(SI)の周波数成分を時間連続で統計的に解析することによって、この音声信号SS(SI)が、音声情報SIか、または雑音のみか、または音楽を含むかを確認することができる。理解度パラメータは、また、音声信号SS(SI)の種々のパラメータ量(平均エネルギー、スペクトル分布、ゼロクロス、ピッチ、…)が、音声信号SS(SI)の分類のために結合されている、音声信号SS(SI)の他の解析によっても、決定することが出来る。
【0061】
音声情報SIが音声信号SS(SI)に含まれているか否かを識別する確認された理解度パラメータの閾値が、相対的に高く設定されている場合には、ユーザによって不明瞭に、または、ほとんど理解しがたく発音された音声情報SIも、雑音として分類される。このように、本発明による記録デバイスは、ユーザに、彼の口述の発音の中の不明瞭な音を指摘するフィードバック情報FIをユーザに転送することが出来る。その後、ユーザは、より明瞭に話し始め、したがって、認識されるテキスト情報TIの品質が、改良されると言う利点が得られる。
【図面の簡単な説明】
【図1】記録デバイスとしての電話録音マシンを示す。
【図2】音声品質テスト手段と音声情報の品質の低さを指示する3個の発光ダイオードとを有する携帯ディクテーティング機を示す。
【符号の説明】
1 オフライン音声認識システム
2 電話
3 電話録音マシン
4, 23 音声認識コンピュータ
5 ユーザ端末
6, 16 受信手段
7, 19 記録手段
8, 20 転送手段
13 音声品質テスト手段
14 フィードバック手段
15 ハンドヘルド型デジタルディクテーティング機
26, 27, 28 発光ダイオード
FI, FI1, FI2, FI3 フィードバック情報
SI 音声情報
TI テキスト情報
QI 音声品質情報
SS(SI) 音声信号
SD(SI) 音声データ

Claims (8)

  1. 口述の音声情報を記録し、次いで、前記口述の前記記録された音声情報をオフライン音声認識のための音声認識デバイスに転送するための記録装置において、前記記録装置が、
    前記口述の前記音声情報を受信するための受信手段と、
    前記口述の前記受信された音声情報を前記記録装置の記録モードで記録するための記録手段と、
    前記口述の記録された音声情報を前記記録装置の転送モードで前記音声認識デバイスに転送するための転送手段であって、前記音声認識デバイスが、前記転送された音声情報に割り当てられるテキスト情報を認識するように構成されていて、前記認識されたテキスト情報の品質が前記受信された音声情報の品質に依存する、転送手段と、
    を有し、かつ、
    前記記録モードで受信された前記音声情報が、前記音声認識デバイスによって処理される時に、前記記録モードで受信された前記音声情報の品質が、前記認識されたテキスト情報の予め定められた品質を得るに十分であるか否かをテストするための音声品質テスト手段であって、前記音声情報が、前記転送モードで前記転送手段によって転送される音声品質テスト手段を有する音声品質テスト手段を有し、かつ、
    前記記録モードで、前記音声品質テスト手段の前記テストの結果を表すフィードバック情報を転送するためのフィードバック手段を有する記録装置。
  2. 請求項1に記載の記録装置であって、前記受信手段が、音声情報を内包する音声信号を受信するように構成され、かつ、前記音声品質テスト手段が、前記受信された音声信号の信号/雑音比をテストするように構成され、かつ、前記信号/雑音比が低すぎる場合には、前記フィードバック手段が、それぞれのフィードバック情報を転送することが可能である記録装置。
  3. 請求項1に記載の記録装置であって、前記受信手段が、前記音声情報を内包する音声信号を受信するように構成され、かつ、前記音声品質テスト手段が、前記受信された音声信号のレベルをテストするように構成され、かつ、前記レベルが低すぎる場合には、前記フィードバック手段が、それぞれのフィードバック情報を転送することが可能である記録装置。
  4. 請求項1に記載の記録装置であって、前記音声品質テスト手段が、前記受信された音声情報をテストする際、ユーザのスピーチ速度を確定するように構成され、かつ、前記スピーチ速度が速すぎる場合には、前記フィードバック手段が、それぞれのフィードバック情報を転送することが可能である記録装置。
  5. 請求項1に記載の記録装置であって、前記音声品質テスト手段が、前記受信された音声情報をテストする際、ユーザによって話された前記口述の言葉の理解度または明瞭度を、それぞれ、確定するように構成され、かつ、前記ユーザが、前記言葉が理解され得ない、または、不明瞭であるように、前記言葉を発音した場合には、前記フィードバック手段が、それぞれのフィードバック情報を転送することが可能である記録装置。
  6. 請求項1に記載の記録装置であって、前記フィードバック手段が、ユーザの処置によって前記受信された音声情報の品質をどの程度改良することが可能であるかを、前記ユーザに指示するフィードバック情報を転送するように構成されている記録装置。
  7. 請求項1に記載の記録装置であって、前記記録装置が、ハンドヘルド型ディクテーティング機によって形成される記録装置。
  8. 請求項1に記載の記録装置であって、前記受信手段が、前記音声情報を受信するために、電話線またはデータラインに、それぞれ、接続することが可能である記録装置。
JP2002509271A 2000-06-29 2001-06-25 以後のオフライン音声認識のための音声情報を記録する記録装置 Expired - Fee Related JP4917729B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP00890205 2000-06-29
EP00890205.8 2000-06-29
PCT/EP2001/007186 WO2002005537A1 (en) 2000-06-29 2001-06-25 Speech quality estimation for off-line speech recognition

Publications (3)

Publication Number Publication Date
JP2004502985A true JP2004502985A (ja) 2004-01-29
JP2004502985A5 JP2004502985A5 (ja) 2008-08-21
JP4917729B2 JP4917729B2 (ja) 2012-04-18

Family

ID=8175950

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002509271A Expired - Fee Related JP4917729B2 (ja) 2000-06-29 2001-06-25 以後のオフライン音声認識のための音声情報を記録する記録装置

Country Status (7)

Country Link
US (1) US6910005B2 (ja)
EP (1) EP1299996B1 (ja)
JP (1) JP4917729B2 (ja)
CN (1) CN1205800C (ja)
AT (1) ATE419710T1 (ja)
DE (1) DE60137225D1 (ja)
WO (1) WO2002005537A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009535106A (ja) * 2006-04-27 2009-10-01 ティアガラジャン,アービンド 心音の解析および表示のためのシステムおよび方法

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2375935A (en) * 2001-05-22 2002-11-27 Motorola Inc Speech quality indication
JP2003091299A (ja) * 2001-07-13 2003-03-28 Honda Motor Co Ltd 車載用音声認識装置
DE10243955B4 (de) * 2002-09-20 2006-03-30 Kid-Systeme Gmbh Verfahren und Vorrichtung zur Übertragung von Sprachsignalen mittels einer Flugzeug-Sprachübertragungseinrichtung
GB0224806D0 (en) * 2002-10-24 2002-12-04 Ibm Method and apparatus for a interactive voice response system
DE10251113A1 (de) * 2002-11-02 2004-05-19 Philips Intellectual Property & Standards Gmbh Verfahren zum Betrieb eines Spracherkennungssystems
US8380510B2 (en) * 2005-05-20 2013-02-19 Nuance Communications, Inc. System and method for multi level transcript quality checking
GB2426368A (en) * 2005-05-21 2006-11-22 Ibm Using input signal quality in speeech recognition
US8364492B2 (en) * 2006-07-13 2013-01-29 Nec Corporation Apparatus, method and program for giving warning in connection with inputting of unvoiced speech
CN101001294B (zh) * 2006-12-19 2010-10-06 中山大学 一种基于语音识别技术的智能化家居语音记录及提醒系统
US8332212B2 (en) * 2008-06-18 2012-12-11 Cogi, Inc. Method and system for efficient pacing of speech for transcription
US8639514B2 (en) * 2008-12-18 2014-01-28 At&T Intellectual Property I, L.P. Method and apparatus for accessing information identified from a broadcast audio signal
CN102044251B (zh) * 2009-10-13 2012-07-25 创杰科技股份有限公司 无线电语音数据传输系统的语音质量改善方法
CA2795098A1 (en) * 2010-03-30 2011-10-13 Nvoq Incorporated Dictation client feedback to facilitate audio quality
CN102376303B (zh) * 2010-08-13 2014-03-12 国基电子(上海)有限公司 录音设备及利用该录音设备进行声音处理与录入的方法
US8892444B2 (en) * 2011-07-27 2014-11-18 International Business Machines Corporation Systems and methods for improving quality of user generated audio content in voice applications
US20130325449A1 (en) 2012-05-31 2013-12-05 Elwha Llc Speech recognition adaptation systems based on adaptation data
US9495966B2 (en) 2012-05-31 2016-11-15 Elwha Llc Speech recognition adaptation systems based on adaptation data
US10431235B2 (en) 2012-05-31 2019-10-01 Elwha Llc Methods and systems for speech adaptation data
US8843371B2 (en) 2012-05-31 2014-09-23 Elwha Llc Speech recognition adaptation systems based on adaptation data
US20130325453A1 (en) 2012-05-31 2013-12-05 Elwha LLC, a limited liability company of the State of Delaware Methods and systems for speech adaptation data
US10395672B2 (en) * 2012-05-31 2019-08-27 Elwha Llc Methods and systems for managing adaptation data
WO2015196063A1 (en) * 2014-06-19 2015-12-23 Robert Bosch Gmbh System and method for speech-enabled personalized operation of devices and services in multiple operating environments
US10720154B2 (en) * 2014-12-25 2020-07-21 Sony Corporation Information processing device and method for determining whether a state of collected sound data is suitable for speech recognition
JP6893150B2 (ja) * 2017-08-14 2021-06-23 株式会社ディーアンドエムホールディングス オーディオ装置およびコンピュータで読み取り可能なプログラム
WO2023050301A1 (zh) * 2021-09-30 2023-04-06 华为技术有限公司 语音质量评估、语音识别质量预测与提高的方法及装置

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0434499A (ja) * 1990-05-30 1992-02-05 Sharp Corp 発声法指示装置
JPH0675588A (ja) * 1992-08-27 1994-03-18 Fujitsu Ltd 音声認識装置
JPH0944183A (ja) * 1995-07-26 1997-02-14 Sony Corp レベル表示装置、音声認識装置およびナビゲーション装置
JPH1070613A (ja) * 1996-08-28 1998-03-10 Bell Syst Nijiyuuyon:Kk 住所・氏名のオフライン認識サポートシステム、通信販売等の電話注文受けシステム、および聞き起し画面
JPH10240291A (ja) * 1996-12-26 1998-09-11 Seiko Epson Corp 音声認識装置における音声入力可能状態報知方法及びその装置
GB2323693A (en) * 1997-03-27 1998-09-30 Forum Technology Limited Speech to text conversion
JPH11153999A (ja) * 1997-11-19 1999-06-08 Fujitsu Ltd 音声認識装置及びそれを用いた情報処理装置
JPH11352995A (ja) * 1998-06-08 1999-12-24 Toshiba Tec Corp 音声認識装置
JP2000075893A (ja) * 1998-08-31 2000-03-14 Olympus Optical Co Ltd 音声認識装置

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA1169969A (en) * 1980-08-20 1984-06-26 Gregor N. Neff Dictation system and method
US5243149A (en) * 1992-04-10 1993-09-07 International Business Machines Corp. Method and apparatus for improving the paper interface to computing systems
DE4434255A1 (de) * 1994-09-24 1996-03-28 Sel Alcatel Ag Vorrichtung zur Sprachaufzeichnung mit anschließender Texterstellung
US5835667A (en) * 1994-10-14 1998-11-10 Carnegie Mellon University Method and apparatus for creating a searchable digital video library and a system and method of using such a library
US5684921A (en) * 1995-07-13 1997-11-04 U S West Technologies, Inc. Method and system for identifying a corrupted speech message signal
JP3402100B2 (ja) * 1996-12-27 2003-04-28 カシオ計算機株式会社 音声制御ホスト装置
JPH11194795A (ja) * 1997-12-26 1999-07-21 Kyocera Corp 音声認識作動装置
US6336091B1 (en) * 1999-01-22 2002-01-01 Motorola, Inc. Communication device for screening speech recognizer input
US6477493B1 (en) * 1999-07-15 2002-11-05 International Business Machines Corporation Off site voice enrollment on a transcription device for speech recognition
DE60143506D1 (de) * 2000-01-27 2011-01-05 Nuance Comm Austria Gmbh Sprachdetektiongsgerät mit zwei abschaltkriterien

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0434499A (ja) * 1990-05-30 1992-02-05 Sharp Corp 発声法指示装置
JPH0675588A (ja) * 1992-08-27 1994-03-18 Fujitsu Ltd 音声認識装置
JPH0944183A (ja) * 1995-07-26 1997-02-14 Sony Corp レベル表示装置、音声認識装置およびナビゲーション装置
JPH1070613A (ja) * 1996-08-28 1998-03-10 Bell Syst Nijiyuuyon:Kk 住所・氏名のオフライン認識サポートシステム、通信販売等の電話注文受けシステム、および聞き起し画面
JPH10240291A (ja) * 1996-12-26 1998-09-11 Seiko Epson Corp 音声認識装置における音声入力可能状態報知方法及びその装置
GB2323693A (en) * 1997-03-27 1998-09-30 Forum Technology Limited Speech to text conversion
JPH11153999A (ja) * 1997-11-19 1999-06-08 Fujitsu Ltd 音声認識装置及びそれを用いた情報処理装置
JPH11352995A (ja) * 1998-06-08 1999-12-24 Toshiba Tec Corp 音声認識装置
JP2000075893A (ja) * 1998-08-31 2000-03-14 Olympus Optical Co Ltd 音声認識装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009535106A (ja) * 2006-04-27 2009-10-01 ティアガラジャン,アービンド 心音の解析および表示のためのシステムおよび方法

Also Published As

Publication number Publication date
WO2002005537A8 (en) 2002-02-28
US6910005B2 (en) 2005-06-21
CN1205800C (zh) 2005-06-08
EP1299996B1 (en) 2008-12-31
EP1299996A1 (en) 2003-04-09
US20020019734A1 (en) 2002-02-14
ATE419710T1 (de) 2009-01-15
CN1389059A (zh) 2003-01-01
DE60137225D1 (de) 2009-02-12
JP4917729B2 (ja) 2012-04-18
WO2002005537A1 (en) 2002-01-17

Similar Documents

Publication Publication Date Title
JP4917729B2 (ja) 以後のオフライン音声認識のための音声情報を記録する記録装置
RU2439716C2 (ru) Детектирование автоответчика путем распознавания речи
CA2706046C (en) Method for determining the on-hold status in a call
US8417524B2 (en) Analysis of the temporal evolution of emotions in an audio interaction in a service delivery environment
US6882973B1 (en) Speech recognition system with barge-in capability
WO2019227580A1 (zh) 语音识别方法、装置、计算机设备及存储介质
JP5533854B2 (ja) 音声認識処理システム、および音声認識処理方法
US20030158732A1 (en) Voice barge-in in telephony speech recognition
US20130204607A1 (en) Voice Detection For Automated Communication System
US7167544B1 (en) Telecommunication system with error messages corresponding to speech recognition errors
TW200540649A (en) Method and apparatus for automatic telephone menu navigation
US20060282265A1 (en) Methods and apparatus to perform enhanced speech to text processing
US8949134B2 (en) Method and apparatus for recording/replaying application execution with recorded voice recognition utterances
JP5039879B2 (ja) スピーチエネーブル装置のユーザインターフェースの完全性をテストする方法および装置
EP2789123A1 (en) Apparatus, system, and method for distinguishing voice in a communication stream
EP3641286B1 (en) Call recording system for automatically storing a call candidate and call recording method
CN115706875A (zh) 对讲语音质量优化方法、装置、设备及存储介质
US8170195B2 (en) Methods and systems for verifying typed objects or segments of a telephonic communication between a customer and a contact center
JP4633981B2 (ja) 音声疎通試験結果判定方法及び装置及び音声疎通試験結果判定プログラムを格納した記憶媒体
KR100229864B1 (ko) 음성우편장치에서의 녹음자 음성확인 서비스 제공방법
WO2014152542A2 (en) Voice detection for automated communication system
CN116684392A (zh) 电脑和手机的通讯方法、装置、电子设备及存储介质
JP2007199247A (ja) 音響分析装置及びコンピュータプログラム、音声認識システム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080624

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080624

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20080624

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20090507

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20090715

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110419

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110712

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110816

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111108

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120110

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120127

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150203

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees