JP2021175176A - エコー遅延検出方法、装置、プログラム及び非一時的コンピュータ読み取り可能な記憶媒体 - Google Patents

エコー遅延検出方法、装置、プログラム及び非一時的コンピュータ読み取り可能な記憶媒体 Download PDF

Info

Publication number
JP2021175176A
JP2021175176A JP2020191504A JP2020191504A JP2021175176A JP 2021175176 A JP2021175176 A JP 2021175176A JP 2020191504 A JP2020191504 A JP 2020191504A JP 2020191504 A JP2020191504 A JP 2020191504A JP 2021175176 A JP2021175176 A JP 2021175176A
Authority
JP
Japan
Prior art keywords
data block
counter
count value
buffer area
electronic device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2020191504A
Other languages
English (en)
Other versions
JP7162040B2 (ja
Inventor
政斌 宋
Zhengbin Song
丹青 楊
Danqing Yang
俊飛 歩
Junfei Bu
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Publication of JP2021175176A publication Critical patent/JP2021175176A/ja
Application granted granted Critical
Publication of JP7162040B2 publication Critical patent/JP7162040B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M9/00Arrangements for interconnection not involving centralised switching
    • H04M9/08Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
    • H04M9/082Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic using echo cancellers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R29/00Monitoring arrangements; Testing arrangements
    • H04R29/001Monitoring arrangements; Testing arrangements for loudspeakers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0264Noise filtering characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/165Management of the audio stream, e.g. setting of volume, audio stream path
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02082Noise filtering the noise being echo, reverberation of the speech
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • G11B2020/10537Audio or video recording
    • G11B2020/10546Audio or video recording specifically adapted for audio data
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • G11B2020/1062Data buffering arrangements, e.g. recording or playback buffers

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Otolaryngology (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Telephone Function (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)

Abstract

【課題】エコー遅延検出の演算量を大幅に低減することができ、エコーの長遅延検出の効率を効果的に向上させるエコー遅延検出方法、装置及び電子機器を提供する。【解決手段】エコー遅延検出方法において、第1電子機器がオーディオを再生し、且つ、カウンタがオンである場合、カウンタがオンになってから現在受信中の録音データブロックであるN番目(Nは1より大きい整数)の録音データブロックを取得し、N番目の録音データブロックとバッファ領域内の参照データブロックとを整合し、N番目の録音データブロックがバッファ領域内の参照データブロックと整合する場合、録音データブロックとバッファ領域内の参照データブロックと整合しない場合にカウントするカウンタの第1カウント値を取得し、目標時間長と第1カウント値とに基づいてエコー遅延を決定する。。【選択図】図1

Description

本願は、コンピュータ技術分野のオーディオ処理技術に係り、特にエコー遅延検出方法、装置、プログラム及び非一時的コンピュータ読み取り可能な記憶媒体に係る。
遅延検出は、エコーを除去するために応用される。エコー除去アルゴリズムは、エコーを除去するためにエコーの遅延を知る必要がある。ここで、エコー除去アルゴリズムでは、通常、単に再生されたオーディオデータと録音データとの時間差を多数の演算によって算出し、算出された時間差をエコーの遅延として決定する。しかしながら、従来のエコー除去アルゴリズムは、エコーの遅延を算出するにあたり、演算リソースの消費が大きく、特に、スマートバックミラーの音楽やナビゲーション音声などのオーディオデータを車載機に伝送して出力する場合など、長時間の遅延の算出では、データ伝送に遅延の存在があるため、エコーの遅延が秒オーダーに達してしまう。
従来のエコー遅延の検出では、演算リソースの消費が大きいという問題があったことが分かる。
従来のエコー遅延の検出では演算リソースの消費が大きいという問題を解決するために、エコー遅延検出方法、装置及び電子機器を提供する。
第1態様として、カウンタが設けられた第1電子機器に応用されるエコー遅延の検出方法を提供し、前記第1電子機器がオーディオを再生し且つ前記カウンタがオンである場合、前記カウンタがオンになってから現在受信中の録音データブロックであるN番目(Nは1より大きい整数)の録音データブロックを取得することと、前記N番目の録音データブロックと、前記カウンタがオンになってから前記第1電子機器で再生されたオーディオデータブロックをバッファリングするためのバッファ領域内の、前記録音データブロックとは共に目標時間長のデータブロックである参照データブロックとを整合することと、前記N番目の録音データブロックが前記バッファ領域内の参照データブロックと整合する場合、前記録音データブロックと前記バッファ領域内の参照データブロックと整合しない場合にカウントする前記カウンタの第1カウント値を取得することと、前記目標時間長と前記第1カウント値とに基づいて前記エコー遅延を決定することと、を含む。
第2態様として、カウンタが設けられた第1電子機器に応用されるエコー遅延の検出装置を更に提供し、前記第1電子機器がオーディオを再生し且つ前記カウンタがオンである場合、前記カウンタがオンになってから現在受信中の録音データブロックであるN番目(Nは1より大きい整数)の録音データブロックを取得する録音データブロック取得モジュールと、前記N番目の録音データブロックと、前記カウンタがオンになってから前記第1電子機器で再生されたオーディオデータブロックをバッファリングするためのバッファ領域内の、前記録音データブロックとは共に目標時間長のデータブロックである参照データブロックとを整合する整合モジュールと、前記N番目の録音データブロックが前記バッファ領域内の参照データブロックと整合する場合、前記録音データブロックと前記バッファ領域内の参照データブロックと整合しない場合にカウントする前記カウンタの第1カウント値を取得する第1カウント値取得モジュールと、前記目標時間長と前記第1カウント値とに基づいて前記エコー遅延を決定するエコー遅延決定モジュールと、を備える。
第3態様として、少なくとも1つのプロセッサと、前記少なくとも1つのプロセッサと通信するように接続されたメモリとを備える電子機器を更に提供し、前記メモリには、前記少なくとも1つのプロセッサによって実行されるコマンドが格納され、前記コマンドが前記少なくとも1つのプロセッサによって実行されることによって、前記少なくとも1つのプロセッサは、上記第1態様に記載の方法を実行可能である。
第4態様として、上記第1態様に記載の方法をコンピュータに実行させるコンピュータコマンドが格納されている非一時的コンピュータ読み取り可能な記憶媒体を提供する。
本願において、前記第1電子機器がオーディオを再生し且つ前記カウンタがオンである場合、前記カウンタがオンになってから現在受信中の録音データブロックであるN番目(Nは1より大きい整数)の録音データブロックを取得し、前記N番目の録音データブロックと、前記カウンタがオンになってから前記第1電子機器で再生されたオーディオデータブロックをバッファリングするためのバッファ領域内の、前記録音データブロックとは共に目標時間長のデータブロックである参照データブロックとを整合し、前記N番目の録音データブロックが前記バッファ領域内の参照データブロックと整合する場合、前記録音データブロックと前記バッファ領域内の参照データブロックと整合しない場合にカウントする前記カウンタの第1カウント値を取得し、前記目標時間長と前記第1カウント値とに基づいて前記エコー遅延を決定することによって、前記エコー遅延を決定する。このように、演算リソースの消費量を特に長遅延のエコー遅延検出において削減することができ、エコー遅延の検出効率を向上させることができる。
なお、本部分に記載の内容は、本開示の実施例のポイント又は重要な特徴を特定することを目的とせず、本開示の範囲を制限することも目的としない。本開示の他の特徴は、以下の明細書から容易に理解される。
図面は、本構成をよりよく理解するためのものであり、本願の限定にならない。
本願の実施例1の概略図である。 本願の実施例2の概略図である。 本願の実施例2の概略図である。 本願の実施例2の概略図である。 本願の実施例に係るエコー遅延の検出方法を実現するための電子機器のブロック図である。
以下、図面を参照して本願の例示的な実施例を説明し、理解することに寄与する本願の実施例の様々な詳細が含まれるが、それらは、単に例示的なものであると考えるべきである。よって、当業者にとって、ここに記載の実施例に対し、本開示の範囲や趣旨から逸脱することなく様々な変更や修正を行うことができることを認識すべきである。同様に、明確及び簡潔のために、以下の記載では、既知の機能や構造の記載を省略している。
図1は、本願の実施例による車両の制御方法を示す。この方法は、第1電子機器に応用可能である。図1に示すように、前記車両の制御方法は、以下のステップを含むことができる。
ステップ101において、前記第1電子機器がオーディオを再生し且つ前記カウンタがオンである場合、前記カウンタがオンになってから受信したN番目(Nは1より大きい整数)の録音データブロックを取得する。ここで、前記N番目の録音データブロックは、現在受信中の録音データブロックである。
ステップ102において、前記N番目の録音データブロックとバッファ領域内の参照データブロックとを整合する。ここで、前記録音データブロックと前記参照データブロックは、共に目標時間長のデータブロックである。前記バッファ領域は、前記カウンタがオンになってから前記第1電子機器で再生されたオーディオデータブロックをバッファリングするためのものである。
ステップ103において、前記N番目の録音データブロックが前記バッファ領域内の参照データブロックと整合する場合、前記カウンタの第1カウント値を取得する。ここで、前記カウンタは、前記録音データブロックと前記バッファ領域内の参照データブロックと整合しない場合にカウントする。
ステップ104において、前記目標時間長と前記第1カウント値とに基づいて前記エコー遅延を決定する。
ここで、第1電子機器は、現在受信中の録音データブロックとバッファ領域にバッファリングされているオーディオデータブロックとの整合結果に基づいてカウンタの第1カウント値を取得し、カウンタの第1カウント値とデータブロックの目標時間長とに基づいてエコー遅延を決定することができるので、録音データと再生されたオーディオデータとの時間差を算出してエコー遅延を決定する場合に比べて、演算リソースの消費量を特に長時間の遅延の検出において削減することができ、エコー遅延の検出効率を向上させることができる。
なお、第1電子機器は、オーディオ再生中に、カウンタがオンになってから、再生されたオーディオデータブロックを参照データブロックとしてバッファリングを開始し、現在受信中の録音データブロックを取得する。ここで、上記録音データブロック及び上記参照データブロックは、共に目標時間長のデータブロックであり、該目標時間長は、実際の状況に応じて設定された時間長であってもよい。例えば、上記目標時間長を8msと予め設定しておき、第1電子機器のサンプリングレートが16KHzであれば、上記録音データブロック及び上記参照データブロック内のデータ量は、共に128サンプルである。
具体的には、上記第1電子機器が12:00:08に前記カウンタをオンにする例を挙げると、第1電子機器が受信した最初の録音データブロックは、12:00:00から12:00:07まで録音された録音データを含み、2番目の録音データブロックは、12:00:08から12:00:15まで録音された録音データを含み、3番目の録音データブロックは、12:00:16から12:00:23まで録音された録音データを含み、……。バッファ領域にバッファリングされている最初の参照データブロックは、12:00:00から12:00:07まで再生されるオーディオデータを含み、2番目の参照データブロックは、12:00:08から12:00:15まで再生されるオーディオデータを含み、3番目の参照データブロックは、12:00:16から12:00:23まで再生されるオーディオデータを含み、……。
前記カウンタがオンであることは、第1電子機器がオーディオを再生中に、ユーザの目標操作を受信した場合に、カウンタをオンすることであってもよく、又は、例えば、上述オーディオが再生される時間長が30sなどの一定の時間長に達した場合などに、第1電子機器が自動的にカウンタをオンにするようにしてもよい。
一部の実施形態において、上記ステップ101の前に、再生されているオーディオデータブロックの有効が検出された場合、前記カウントをオンにすることを更に含むことによって、カウンタを便利且つタイムリーにオンにすることができる。
本実施形態において、上記第1電子機器は、再生されているオーディオデータブロックが有効か否かを検出し、具体的には、オーディオデータブロックに音声信号が存在するかを検出し、音声信号が存在すればオーディオデータブロックが有効であると決定し、逆の場合に無効とする。
また、上記カウンタがオンになった時、第1電子機器は、該有効なオーディオデータブロックを、バッファ領域内の最初の参照データブロックとして上記バッファ領域にバッファリングすることができる。
なお、第1電子機器は、現在再生中のオーディオデータブロックが無効であると検出すると、上記カウンタをオフにし、次に有効なオーディオデータブロックが検出された場合に上記カウンタを再起動する。また、第1電子機器は、カウンタがオフのとき、上記バッファ領域をクリアする。
本願において、上記第1電子機器がオーディオを再生することは、第1電子機器のオーディオプレーヤが再生して第1電子機器の音声出力装置(例えば、スピーカ等)が出力し、且つ上記録音データは、第1電子機器の録音装置(例えば、マイク等)が音声出力装置のオーディオの音声の出力と同時に録音したものである。
又は、一部の実施形態において、前記第1電子機器は、再生されたオーディオを、前記オーディオを出力するための第2電子機器に伝送し、前記N番目の録音データブロックは、前記第2電子機器が前記オーディオを出力している場合に録音された録音データブロックである。
ここで、上記第1電子機器が、再生されたオーディオを第2電子機器の音声出力装置に伝送して出力し、第2電子機器の音声出力装置から出力したオーディオの音声を第1電子機器の録音装置で同時に録音する場合、データ伝送に長い遅延が存在するため、同一時間のオーディオデータと録音データとに長いエコー遅延が存在することになる。このような場合、本願におけるエコー遅延の決定方法によれば、エコー遅延検出の演算量を大幅に低減することができ、エコーの長遅延検出の効率を効果的に向上させることができる。
例えば、上記第1電子機器が車両内のスマートバックミラーであり、且つ上記第2電子機器が車両の車載端末である場合、スマートバックミラーがナビゲーションを行う過程で、スマートバックミラーは、データ伝送プロトコル(例えば、Carlifeプロトコルなど)を介してナビゲーション音声(即ち、参照データブロックは、ナビゲーション音声のオーディオデータを含む)を車載端末に伝送し、車載端末の車内スピーカーから出力する。スマートバックミラーは、同時に走行監視を行い、そのマイクロフォンアレイを介して、車内スピーカーから出力されたナビゲーション音声(即ち、録音データブロックは、録音されたナビゲーション音声のオーディオデータを含む)を録音する。
又は、上記第1電子機器は、上記オーディオを再生して出力するものであり、上記録音データブロックは、第1電子機器が上記オーディオを出力する場合に第2電子機器が録音する録音データブロックであり、且つ第2電子機器は、録音データブロックを第1電子機器に伝送するものであってもよい。
なお、上記カウンタは、第1電子機器における仮想モジュール又は実体モジュールであってもよく、カウンタは、現在受信中の録音データブロックが、バッファ領域にバッファリングされた参照データブロックと整合しない場合にカウントし、即ちカウント値を1だけ増加させる。現在受信中の録音データブロックがバッファ領域にバッファリングされている参照データブロックとは整合する場合にはカウントしない。
上記ステップ101において、上記第1電子機器がオーディオを再生し且つ上記カウンタがオンになっている場合、第1電子機器は、現在受信中の録音データブロック、即ちN番目の録音データブロックを取得する。
本願において、第1電子機器の実際の動作中、第1電子機器が同時刻に再生するオーディオデータ及び録音された録音データは、通常、数十ミリ秒から数百ミリ秒などの遅延を有するため、カウンタをオンにしてから受信した最初の録音データブロックは、通常、バッファ領域内の参照データブロックと整合しない。即ち、最初の録音データブロックに対して、第1電子機器が上述したステップ201から204までの全処理を実行せず、2番目の録音データブロック以降の録音データブロックがバッファ領域内の参照データブロックと整合するようになる。従って、上記Nは、1より大きい整数である。
もちろん、カウンタの正常カウントを保証するために、上記第1電子機器は、上記最初の録音データブロックを受信した場合、最初の録音データブロックとバッファ領域にバッファリングされた参照データブロック(この場合、バッファ領域には最初の参照データのみがバッファリングされる)とを整合し、整合結果として、最初の録音データブロックとバッファ領域にバッファリングされた参照データブロックとが整合しない場合、カウンタのカウント値に1を加算する。即ち、第1電子機器が最初の録音データブロックを取得した場合、上記ステップ201から203までを実行する。
上記ステップ102において、第1電子機器は、現在受信中の録音データブロック、即ちN番目の録音データブロックを受信した場合、N番目の録音データブロックとバッファ領域にバッファリングされた参照データブロックとを整合する。
本願において、上記のN番目の録音データブロックとバッファ領域にバッファリングされた参照データブロックとを整合することは、所定の類似度計算方法により、N番目の録音データブロックとバッファ領域内の参照データブロックとの類似度を算出し、バッファ領域にN番目の録音データブロックとの類似度が所定の閾値以上であるオーディオデータブロックが存在する場合、第1電子機器が、N番目の録音データブロックとバッファ領域内の参照データブロックとは整合すると決定し、逆の存在しない場合、N番目の録音データブロックとバッファ領域内の参照データブロックとは整合しないと決定する。
例えば、第1電子機器は、N番目の録音データブロックとバッファリングされた参照データブロックとの間で類似するサンプリング点の割合を上記類似度として計算し、上記所定の閾値が60%である場合、N番目の録音データブロックとバッファ領域にバッファリングされたある参照データブロックとの類似度が60%以上(例えば、類似度が70%)であれば、N番目の録音データブロックとバッファ領域内の参照データブロックとが整合すると決定し、N番目の録音データブロックとバッファ領域にバッファリングされたすべての参照データブロックとの類似度がいずれも60%未満であれば、N番目の録音データブロックとバッファ領域内の参照データブロックとが整合しないと決定する。
また、前記N番目の録音データブロックとバッファ領域内の参照データブロックとを整合することは、N番目の録音データブロックとバッファ領域内の各々の参照データブロックとを整合することであってもよい。例えば、上記第1電子機器が12:00:08に上記カウンタをオンにしたことを例にすると、第1電子機器が3番目の録音データブロック(即ち、3番目の録音データブロックが12:00:16〜12:00:23に録音された録音データを含む)を受信した際に、バッファ領域に最初の参照データブロック、2番目の参照データブロック、3番目の参照データブロックがバッファリングされているため、第1電子機器が3番目の録音データブロックと、最初の参照データブロック、2番目の参照データブロック、3番目の参照データブロックとの類似度をそれぞれ算出し、3番目の録音データブロックとの類似度が上記所定の閾値以上である参照データブロックがバッファ領域に存在するか否かを決定する。
又は、一部の実施形態において、上記ステップ102は、前記N−1番目の録音データブロックが前記バッファ領域内の参照データブロックと整合しない場合、前記N番目の録音データブロックと前記バッファ領域内の最初の録音データブロックとを整合することを含む。
本実施形態において、録音データと再生されたオーディオデータには、数十ミリ秒から数百ミリ秒の遅延があるため、カウンタがオンになってからバッファリングされた最初の参照データブロックは、通常、最初の参照データブロックのオーディオデータの再生後に受信した録音データブロック(2番目以降の録音データブロック)と整合する。
従って、上記第1電子機器は、1つ前の録音データブロックとバッファ領域の参照データブロックとが整合しない場合、現在受信中の録音データブロックと最初の録音データブロックとを整合することで、整合の正確性を保証しつつ、演算量を効果的に低減してエコー遅延検出の処理効率を更に向上させることができる。
例えば、上記第1電子機器が12:00:08に上記カウンタをオンにする例を挙げれば、第1電子機器は、2番目の録音データブロックを受信し、最初の録音データブロックがバッファ領域内の最初の参照データブロックと整合しないのであれば、2番目の録音データブロックを最初の録音データブロックと整合し、3番目の録音データブロックを受信し、2番目の録音データブロックがバッファ領域内の最初の参照データブロック及び2番目の参照データブロックのいずれとも整合しないのであれば、3番目の録音データブロックを最初の録音データブロックと整合し、4番目の録音データブロックを受信し、3番目の録音データブロックがバッファ領域内の最初の参照データブロック、2番目の参照データブロック及び3番目の参照データブロックのいずれとも整合しないのであれば、4番目の録音データブロックを最初の録音データブロックと整合し、……。
なお、現在受信中の録音データブロックが最初の参照データブロックと整合する場合、次に受信する録音データブロックも最初の参照データブロックの後にバッファリングされた参照データブロックと整合する可能性がある。具体的には、上記ステップ102は、N−1番目の録音データブロックが、前記バッファ領域内のk(kは正の整数)番目の参照データブロックと整合する場合、前記N番目の録音データブロックを、前記バッファ領域内のk+1番目の参照データブロックと整合することを更に含んでもよい。
また、上記N−1番目の録音データブロックと前記バッファ領域内の参照データブロックとが整合しないことは、N−1番目の録音データブロックが最初の参照データブロック又はk番目の参照データブロックと整合しないことである。
例えば、上記第1電子機器が12:00:08に上記カウンタをオンにすることを例にすると、第1電子機器は、3番目の録音データブロックを受信し、2番目の録音データブロックがバッファ領域内の最初の参照データブロックと整合すると、3番目の録音データブロックが2番目の録音データブロックと整合し、逆の場合に3番目の録音データブロックを最初の録音データブロックと整合し、4番目の録音データブロックを受信し、3番目の録音データブロックがバッファ領域内の2番目の参照データブロックと整合した場合、4番目の録音データブロックが3番目の録音データブロックと整合し、逆の場合に4番目の録音データブロックが最初の録音データブロックと整合し、……。
上記ステップ103において、第1電子機器は、前記N番目の録音データブロックが前記バッファ領域内の参照データブロックと整合すると決定した場合、前記カウンタの第1カウント値を取得する。
本願において、上記第1電子機器は、前記カウンタの第1カウント値を取得してもよく、現在受信中の録音データブロックがバッファ領域内の参照データブロックと整合すると決定し、カウンタの現在のカウント値を上記第1カウント値として決定し、且つ後続の録音データブロックの整合を停止するようにしてもよい。
又は、一部の実施例において、前記の前記カウンタの第1カウント値を取得することは、現在受信中の録音データブロックと前記バッファ領域内の参照データブロックとの整合が前記第1電子機器によって連続して決定された回数である目標整合回数を取得することと、前記目標整合回数が所定の条件を満たした場合、前記カウンタの第1カウント値を取得することとを含む。
ここで、第1電子機器は、現在受信中の録音データブロックとバッファ領域内の参照データブロックとが整合すると決定した場合に、上記目標整合回数を取得し、目標整合回数に基づいて第1カウント値を取得することによって、カウンタのカウント値を取得する条件がより厳しくなり、さらにエコー遅延検出の精度が向上する。
ここで、上記目標整合回数は、前記第1電子機器が、現在受信中の録音データブロックと前記バッファ領域内の参照データブロックとが整合したと連続して決定した回数である。例えば、上記第1電子機器が12:00:08に上記カウンタをオンにすることを例にすると、第1電子機器が2番目の録音データブロックと最初の参照データブロックとが整合していると決定した場合、第1電子機器は、3番目の録音データブロックを受信したのであれば、3番目の録音データブロックを2番目の参照データブロックと整合し、3番目の録音データブロックと2番目の参照データブロックとが整合していると決定したのであれば、上記目標整合回数が2回であり、更に、4番目の録音データブロックを受信したのであれば、4番目の録音データブロックを3番目の参照データブロックと整合し、4番目の録音データブロックと3番目の参照データブロックとが整合すると決定すると、上記目標整合回数が3回であり、……。
また、上記所定の条件は、実際の必要性に応じて予め設定された判定条件であってもよい。一部の実施形態において、前記目標整合回数が所定の条件を満たした場合、前記カウンタの第1カウント値を取得することは、前記目標整合回数が所定の回数以上である場合、前記カウンタの第1カウント値を取得することを含み、ここで、前記所定の回数は、1より大きい整数を取る。
ここで、第1電子機器は、目標整合回数が所定の回数以上であると決定し、即ち、現在受信中の録音データブロックが前記バッファ領域内の参照データブロックと整合した回数が所定の回数以上であると連続して決定した場合にのみ、上記カウンタのカウント値を取得し、エコー遅延検出の精度を高める。
例えば、上記所定の回数が3回である場合、第1電子機器は、4番目の録音データブロックと3番目の参照データブロックとが整合すると決定し、即ち目標整合回数が3回であれば、カウンタのカウント値を取得する。その際に、最初の録音データブロックのみがバッファ領域の参照データブロックと整合しないため、カウンタのカウント値が1である。
又は、別の一部の実施形態において、前記バッファ領域の最大蓄積量は、M個の参照データブロックであり、前記Mは、1より大きい整数である。前記目標整合回数が所定の条件を満たした場合、前記カウンタの第1カウント値を取得することは、前記目標整合回数が前記Mである場合、前記カウンタの第1カウント値を取得することを含む。
ここで、第1電子機器が、目標整合回数がバッファ領域の最大蓄積録音データブロック数である場合にのみカウンタのカウント値を取得するので、カウンタのカウント値を取得する条件がより厳しくなり、エコー遅延検出の精度が更に向上する。
例えば、上記バッファ領域の最大蓄積量が16個の参照データブロックである場合、第1電子機器は、16回連続して現在受信中の録音データブロックがバッファ領域にバッファリングされた参照データブロックと整合したと決定すると、カウンタのカウント値を取得する。
また、上記の1つのケースで、即ち、第1電子機器は、前記N−1番目の録音データブロックと前記バッファ領域内の参照データブロックとが整合しない場合、前記N番目の録音データブロックと前記バッファ領域内の最初の録音データブロックとを整合し、N−1番目の録音データブロックと前記バッファ領域内のk番目の参照データブロックとが整合する場合、前記N番目の録音データブロックと前記バッファ領域内のk+1番目の参照データブロックとを整合し、バッファ領域にバッファリングされた参照データブロックの全てが録音データブロックと整合した場合にのみ、上記カウンタのカウント値を取得する。
例えば、上記バッファ領域には、最大16個の参照データブロックをバッファリングすることができるとし、上記第1電子機器は、最初の3つの録音データブロックがバッファ領域にバッファリングされた参照データブロックと整合しないと決定し、即ちカウント値が3である場合、4番目の録音データブロックが最初の参照データブロックと整合し、5番目の録音データブロックが2番目の参照データブロックと整合し、……、i(iは、2より大きくかつ16未満の整数)+3番目の録音データブロックがi番目の参照データブロックと整合し、……、及び19番目の録音データブロックが16番目の参照データブロックと整合すると決定した場合、カウンタのカウント値を取得する。即ち、カウント値が3である。
なお、上記バッファ領域の最大蓄積量がM個の参照データブロックである場合、カウンタがオンになったときからM個の参照データブロックをバッファ領域にバッファリングした後に、次に再生されるオーディオのデータブロックをバッファ領域にバッファリングしなくなり、且つ第1電子機器は、次に現在で録音データブロックを受信したとき、現在受信中の録音データブロックを上記M個の参照データブロックと整合する。
また、上記第1電子装置は、上記カウンタを再起動させてバッファ領域をクリアするように一定の所定の条件に基づいて制御する。具体的には、前記N番目の録音データブロックとバッファ領域内の参照データブロックとを整合した後に、前記N番目の録音データブロックと前記バッファ領域内の参照データブロックと整合しない場合、前記カウンタの第2カウント値を取得することと、前記第2カウント値と前記目標時間長に基づいて決定された遅延が所定の遅延閾値以上である場合、前記バッファ領域をクリアして前記カウンタをリセットすることを更に含む。
ここで、第1電子機器は、カウンタのカウント値に対応する遅延が所定の遅延閾値を超えた場合、前記バッファ領域をタイムリーにクリアして前記カウンタをリセットすることによって、上記カウンタの第1カウント値を取得する要求を長時間満たさない場合にエコー遅延検出フローを再スタートさせることを回避し、エコー遅延検出の効率を更に向上させることができる。
例えば、上記所定の遅延閾値を2sに設定すると、カウンタの現在のカウント値(即ち、第2カウント値)に対応する遅延が上記2sよりも大きい場合、第1電子機器は、バッファ領域をクリアし、カウンタをリセットする。
上記ステップ104において、第1電子機器は、上記第1カウント値を取得した後に、第1カウント値及び上記目標時間長に基づいてエコー遅延を決定する。
本願において、上記の第1カウント値と上記目標時間長とに基づいてエコー遅延を決定することは、第1カウント値と目標時間長との積を上記エコー遅延として決定する。例えば、上記目標遅延が8msであり、且つ第1カウント値が10である場合、上記エコー遅延は、80msとなる。
本願のエコー遅延の検出方法の理解を容易にするために、エコー遅延の検出方法の実際の応用におけるフローを説明する。具体的に、第1電子機器は、各データブロックの時間長(即ち、目標時間長)が8msであり、且つバッファ領域の最大蓄積量が16個の参照データブロック(即ち、M=16)であると仮定して、最初の録音データブロックを受信した場合(この場合、バッファ領域に最初の参照データブロックをバッファリングする)、最初の録音データブロックとバッファリングされた最初の参照データブロックとを整合し、整合しなければ、カウンタに1を加算する。第1電子機器は、引き続き、現在受信中の2番目の録音データブロックと最初の参照データブロックとを整合し、整合しなければ、カウンタを再び1を加算する。第1電子機器は、引き続き、現在受信中の3番目の録音データブロックと最初の参照データブロックとを整合し、3番目の録音データブロックと最初の参照データブロックとが整合した場合、引き続き、現在受信中の4番目の録音データブロックと2番目の参照データブロックとを整合し、……、18番目の録音データブロックと16番目の参照データブロックとが整合するまで行われると、カウンタのカウント値を2(即ち、第1カウント値)として取得し、エコー遅延を16msと決定する。ここで、上記3番目の録音データブロックから上記18番目の参照データブロックまで、現在の対応する参照データブロックと整合しないことが生じた場合、例えば、4番目の録音データブロックが2番目の参照データブロックと整合するものの、5番目の録音データブロックが3番目の参照データブロックと整合せず、又は、現在受信中の録音データブロックが最初の参照データブロックを整合する場合に3番目の録音データブロックが最初の参照データブロックと整合しないなど不整合が生じると、第1電子機器は、次に受信する録音データブロックと最初の参照データブロックとを整合する。また、上記所定の遅延閾値が2msであれば、カウンタのカウント値が16であり、即ち、カウンタのカウント値に対応する遅延が所定の遅延閾値より大きい場合、第1電子機器は、カウンタを再起動して上記バッファ領域をクリアする。
図2は、本願の実施例によるエコー遅延の検出装置を示し、カウンタが設けられた第1電子機器に応用される。図2に示すように、エコー遅延検出装置200は、前記第1電子機器がオーディオを再生し且つ前記カウンタがオンである場合、前記カウンタがオンになって現在受信中の録音データブロックであるN番目(Nは1より大きい整数)の録音データブロックを取得する録音データブロック取得モジュール201と、前記N番目の録音データブロックと、前記カウンタがオンになってから前記第1電子機器で再生されたオーディオデータブロックをバッファリングするためのバッファ領域内の、前記録音データブロックとは共に目標時間長のデータブロックである参照データブロックとを整合する整合モジュール202と、前記N番目の録音データブロックが前記バッファ領域内の参照データブロックと整合する場合、前記録音データブロックと前記バッファ領域内の参照データブロックと整合しない場合にカウントする前記カウンタの第1カウント値を取得する第1カウント値取得モジュール203と、前記目標時間長と前記第1カウント値とに基づいて前記エコー遅延を決定するエコー遅延決定モジュール204とを備える。
任意選択で、図3に示すように、前記第1カウント値取得モジュール203は、現在受信中の録音データブロックと前記バッファ領域内の参照データブロックとの整合が前記第1電子機器によって連続して決定された回数である目標整合回数を取得する整合回数取得ユニット2031と、前記目標整合回数が所定の条件を満たした場合、前記カウンタの第1カウント値を取得する第1カウント値取得ユニット2032とを備える。
任意選択で、前記第1カウント値取得ユニットは、具体的には、前記目標整合回数が、1より大きい整数を取る所定の回数以上である場合、前記カウンタの第1カウント値を取得する。
任意選択で、前記バッファ領域の最大蓄積量は、M(Mは1より大きい整数)個の参照データブロックであり、前記第1カウント値取得ユニットは、具体的には、前記目標整合回数が前記Mである場合、前記カウンタの第1カウント値を取得する。
任意選択で、前記整合モジュールは、具体的には、前記N−1番目の録音データブロックが前記バッファ領域内の参照データブロックと整合しない場合、前記N番目の録音データブロックと前記バッファ領域内の最初の録音データブロックとを整合する。
任意選択で、図4に示すように、前記装置200は、前記N番目の録音データブロックと前記バッファ領域内の参照データブロックと整合しない場合、前記カウンタの第2カウント値を取得する第2カウント値取得モジュール205と、前記第2カウント値と前記目標時間長に基づいて決定された遅延が所定の遅延閾値以上である場合、前記バッファ領域をクリアして前記カウンタをリセットするリセットモジュール206とを更に含む。
任意選択で、前記第1電子機器は、再生されたオーディオを、前記オーディオを出力するための第2電子機器に伝送し、前記N番目の録音データブロックは、前記第2電子機器が前記オーディオを出力している場合に録音された録音データブロックである。
なお、車両の制御装置400は、本願の図1の方法実施例において電子機器によって実現される各プロセスを実現し、同じ効果を奏することができるため、重複を避けるために、ここでは繰り返さない。
本願の実施例によれば、本願は、電子機器及び読み取り可能な記憶媒体を更に提供する。
図5は、本願の実施例のエコー遅延の検出方法に係る電子機器のブロック図である。電子機器は、ラップトップコンピュータ、デスクトップコンピュータ、ワークステーション、携帯情報端末(PDA:Personal Digital Assistant)、サーバ、ブレードサーバ、メインフレームコンピュータ、及び他の適切なコンピュータなどの様々な形態のデジタルコンピュータを表すことが意図される。電子機器はまた、パーソナルデジタルプロセシング、セルラー電話、スマートフォン、ウェアラブルデバイス、及び他の同様のコンピューティングデバイスなど、様々な形態のモバイルデバイスを表してもよい。本明細書に示される構成要素、それらの接続及び関係、並びにそれらの機能は、単なる例であり、本明細書に記載及び/又は特許請求される本願の実現を限定することを意図しない。
図5に示すように、該電子機器は、1又は複数のプロセッサ501、メモリ502、及び高速インターフェースと低速インターフェースを含む各構成要素を接続するためのインターフェースを備える。各構成要素は、異なるバスで相互に接続され、共通のマザーボード上に実装されてもよいし、必要に応じて他の形態で実装されてもよい。プロセッサは、インターフェースに結合されたディスプレイデバイスなどの外部入出力装置にGUIのグラフィカル情報を表示するために、メモリ内又はメモリ上に記憶されたコマンドを含む、電子機器内で実行されるコマンドを処理する。他の実施形態では、複数のプロセッサ及び/又は複数のバスが、必要に応じて、複数のメモリ及び複数のメモリとともに使用される。また、複数の電子機器が接続され、各機器が必要な動作の一部を提供するようにしてもよい(例えば、サーバアレイ、ブレードサーバの集合、マルチプロセッサシステムなど)。図5では、1つのプロセッサ501を例に挙げている。
メモリ502は、本願において提供される非一時的コンピュータ読み取り可能な記憶媒体である。ここで、前記メモリは、少なくとも1つのプロセッサによって実行されるコマンドが格納されている。それによって、前記少なくとも1つのプロセッサは、本願において提供されるエコー遅延の検出方法を実行する。本願の非一時的コンピュータ読み取り可能な記憶媒体は、本願において提供されるエコー遅延の検出方法をコンピュータに実行させるためのコンピュータコマンドを記憶する。
非一時的コンピュータ読み取り可能な記憶媒体としてのメモリ502は、本願の実施例におけるエコー遅延の検出方法に対応するプログラムコマンド/モジュール(例えば、図2に示す録音データブロック取得モジュール201、整合モジュール202、第1カウント値取得モジュール203、エコー遅延決定モジュール204)などの非一時的なソフトウェアプログラム、非一時的なコンピュータ実行可能プログラム及びモジュールなどを記憶するために使用される。プロセッサ501は、メモリ502に格納された非一時的ソフトウェアプログラム、コマンド及びモジュールを実行することにより、サーバの各種機能アプリケーションやデータ処理を実行し、即ち、上記方法の実施例におけるエコー遅延の検出方法を実現する。
メモリ502は、オペレーティングシステム、少なくとも1つの機能に必要なアプリケーションを記憶することができるプログラム記憶領域と、エコー遅延の検出に係る電子機器の使用に応じて作成されたデータなどを記憶することができるデータ記憶領域とを含む。また、メモリ502は、高速ランダムアクセスメモリを備えてもよく、また、少なくとも1つの磁気ディスクメモリデバイス、フラッシュメモリデバイス、又は他の非一時的ソリッドステートメモリデバイスなどの非一時的メモリを備えてもよい。一部の実施形態では、メモリ502は、任意選択で、プロセッサ501から遠隔に配置されたメモリを備える。これらの遠隔メモリは、ネットワークを介してエコー遅延検出に係る電子装置に接続される。上記ネットワークの例としては、インターネット、イントラネット、ローカルエリアネットワーク、移動体通信ネットワーク、及びこれらの組み合わせが挙げられるが、これらに限定されない。
エコー遅延の検出方法に係る電子機器は、入力装置503と出力装置504とを更に備えてもよい。プロセッサ501、メモリ502、入力装置503及び出力装置504は、バス又は他の方式で接続され、図5では、バスを介して接続される例が示される。
タッチスクリーン、キーパッド、マウス、トラックパッド、タッチパッド、ポインティングスティック、1つ又は複数のマウスボタン、トラックボール、ジョイスティックなどの入力装置である入力装置503は、入力された数字又は文字情報を受信し、エコー遅延の検出に係る電子機器のユーザ設定及び機能制御に関するキー信号入力を生じる。出力装置504は、ディスプレイ装置、補助照明装置(例えば、LED)、及び触覚フィードバック装置(例えば、振動モータ)などを含む。該表示装置は、液晶ディスプレイ(LCD)、発光ダイオード(LED)ディスプレイ、及びプラズマディスプレイを含むが、これらに限定されない。一部の実施形態では、表示装置は、タッチスクリーンであってもよい。
本明細書に記載するシステム及び技術の様々な実施形態は、デジタル電子回路システム、集積回路システム、特定用途向けASIC(特定用途向け集積回路)、コンピュータハードウェア、ファームウェア、ソフトウェア、及び/又はそれらの組み合わせにおいて実現される。これらの様々な実施形態は、記憶システム、少なくとも1つの入力装置、及び少なくとも1つの出力装置からデータ及びコマンドを受信し、該記憶システム、該少なくとも1つの入力装置、及び該少なくとも1つの出力装置にデータ及びコマンドを送信することができる専用又は汎用のプログラマブルプロセッサである少なくとも1つのプログラマブルプロセッサを含むプログラマブルシステム上で実行及び/又は解釈可能な1つ又は複数のコンピュータプログラムで実現することを含む。
これらのコンピュータプログラム(プログラム、ソフトウェア、ソフトウェアアプリケーション、又はコードとも呼ばれる)は、プラグラマブルプロセッサの機械コマンドを含み、これらのコンピュータプログラムは、高レベルのプロセス及び/又はオブジェクト指向プログラミング言語、及び/又はアセンブリ/機械言語で実現される。本明細書で使用される場合、用語「機械読み取り可能な媒体」及び「コンピュータ読み取り可能な媒体」は、機械読み取り可能な信号として機械コマンドを受信する機械読み取り可能な媒体を含む、プラグラマブルプロセッサに機械コマンド及び/又はデータを提供するための任意のコンピュータプログラム製品、デバイス、及び/又は装置(例えば、磁気ディスク、光学ディスク、メモリ、プログラム可能論理デバイス(PLD))を指す。用語「機械読み取り可能な信号」は、機械コマンド及び/又はデータをプログラマブルプロセッサに提供するために使用される任意の信号を指す。
ユーザとの対話を提供するために、本明細書に記載されたシステム及び技術は、ユーザに情報を表示するための表示装置(例えば、CRT(陰極線管)又はLCD(液晶ディスプレイ)モニタ)と、ユーザがコンピュータに入力を提供することができるキーボード及びポインティングデバイス(例えば、マウス又はトラックボール)とを有するコンピュータ上で実施される。他の種類の装置を使用して、ユーザとの対話を提供してもよい。例えば、ユーザに提供されるフィードバックは、任意の形態の感覚フィードバック(例えば、視覚フィードバック、聴覚フィードバック、又は触覚フィードバック)であってもよい。ユーザからの入力は、音声入力、又は触覚入力を含む任意の形態で受信される。
本明細書に記載のシステム及び技術は、バックエンド構成要素を含むコンピューティングシステム(例えば、データサーバとして)、又はミドルウェア構成要素を含むコンピューティングシステム(例えば、アプリケーションサーバ)、又はフロントエンド構成要素を含むコンピューティングシステム(例えば、ユーザが本明細書に記載のシステム及び技術の実施形態とやり取りするグラフィカルユーザインターフェース又はウェブブラウザを有するユーザコンピュータ)、又はそのようなバックエンド構成要素、ミドルウェア構成要素、又はフロントエンド構成要素の任意の組み合わせを含むコンピューティングシステムにおいて実施される。システムの構成要素は、任意の形式又は媒体(例えば、通信ネットワーク)のデジタルデータ通信によって互いに接続される。通信ネットワークとしては、例えば、ローカルエリアネットワーク(LAN)、ワイドエリアネットワーク(WAN)、インターネットなどが挙げられる。
コンピュータシステムは、クライアント及びサーバを備える。クライアント及びサーバは、一般に、互いから離れており、通常、通信ネットワークを介して対話する。クライアントとサーバの関係は、それぞれのコンピュータ上で実行され、互いにクライアント−サーバ関係を有するコンピュータプログラムによって生成される。
本願において、前記第1電子機器がオーディオを再生し且つ前記カウンタがオンである場合、前記カウンタがオンになってから現在受信中の録音データブロックであるN番目(Nは1より大きい整数)の録音データブロックを取得し、前記N番目の録音データブロックと、前記カウンタがオンになってから前記第1電子機器で再生されたオーディオデータブロックをバッファリングするためのバッファ領域内の、前記録音データブロックとは同じく目標時間長のデータブロックである参照データブロックとを整合し、前記N番目の録音データブロックが前記バッファ領域内の参照データブロックと整合する場合、前記録音データブロックと前記バッファ領域内の参照データブロックと整合しない場合にカウントする前記カウンタの第1カウント値を取得し、前記目標時間長と前記第1カウント値とに基づいて前記エコー遅延を決定することによって、前記エコー遅延を決定する。このように、演算リソースの消費量を特に長遅延のエコー遅延検出において削減することができ、エコー遅延の検出効率を向上させることができる。
上記に示された様々な形態のフローが、ステップの順序変更、追加、又は削除のために使用されることが理解されるべきである。例えば、本願に記載された各ステップは、並列に実行されても、順次的に実行されても、異なる順序で実行されてもよく、本願に開示された技術的解決手段の所望の結果を実現できる限り、本明細書ではこれについて限定しない。
上述した具体的な実施形態は、本願の保護範囲への制限にならない。当業者にとって、設計の要求や他の要素によって様々な修正、組み合わせ、サブ組み合わせ及び置換を行うことができることは、明らかである。本願の趣旨や原則内に為した修正、均等置換及び改良などは、すべて本願の保護範囲に含まれるべきである。

Claims (16)

  1. カウンタが設けられた第1電子機器に応用されるエコー遅延検出方法であって、
    前記第1電子機器がオーディオを再生し且つ前記カウンタがオンである場合、前記カウンタがオンになって現在受信中の録音データブロックであるN番目(Nは1より大きい整数)の録音データブロックを取得することと、
    前記N番目の録音データブロックと、前記カウンタがオンになってから前記第1電子機器で再生されたオーディオデータブロックをバッファリングするためのバッファ領域内の、前記録音データブロックとは共に目標時間長のデータブロックである参照データブロックとを整合することと、
    前記N番目の録音データブロックが前記バッファ領域内の参照データブロックと整合する場合、前記録音データブロックと前記バッファ領域内の参照データブロックと整合しない場合にカウントする前記カウンタの第1カウント値を取得することと、
    前記目標時間長と前記第1カウント値とに基づいてエコー遅延を決定することと、
    を含むエコー遅延検出方法。
  2. 前記カウンタの第1カウント値を取得することが、
    現在受信中の録音データブロックと前記バッファ領域内の参照データブロックとの整合が前記第1電子機器によって連続して決定された回数である目標整合回数を取得することと、
    前記目標整合回数が所定の条件を満たした場合、前記カウンタの第1カウント値を取得することと、
    を含む請求項1に記載の方法。
  3. 前記目標整合回数が所定の条件を満たした場合、前記カウンタの第1カウント値を取得することが、
    前記目標整合回数が、1より大きい整数を取る所定の回数以上である場合、前記カウンタの第1カウント値を取得することを含む請求項2に記載の方法。
  4. 前記バッファ領域の最大蓄積量は、M(Mは1より大きい整数)個の参照データブロックであり、
    前記目標整合回数が所定の条件を満たした場合、前記カウンタの第1カウント値を取得することが、
    前記目標整合回数が前記Mである場合、前記カウンタの第1カウント値を取得することを含む請求項2に記載の方法。
  5. 前記N番目の録音データブロックとバッファ領域内の参照データブロックとを整合することが、
    N−1番目の録音データブロックが前記バッファ領域内の参照データブロックと整合しない場合、前記N番目の録音データブロックと前記バッファ領域内の最初の録音データブロックとを整合することを含む請求項1に記載の方法。
  6. 前記N番目の録音データブロックとバッファ領域内の参照データブロックとを整合した後に、
    前記N番目の録音データブロックと前記バッファ領域内の参照データブロックと整合しない場合、前記カウンタの第2カウント値を取得することと、
    前記第2カウント値と前記目標時間長に基づいて決定された遅延が所定の遅延閾値以上である場合、前記バッファ領域をクリアして前記カウンタをリセットすることと、
    を含む請求項1に記載の方法。
  7. 前記第1電子機器が、再生されたオーディオを、前記オーディオを出力するための第2電子機器に伝送し、
    前記N番目の録音データブロックは、前記第2電子機器が前記オーディオを出力している場合に録音された録音データブロックである請求項1に記載の方法。
  8. カウンタが設けられた第1電子機器に応用されるエコー遅延検出装置であって、
    前記第1電子機器がオーディオを再生し且つ前記カウンタがオンである場合、前記カウンタがオンになって現在受信中の録音データブロックであるN番目(Nは1より大きい整数)の録音データブロックを取得する録音データブロック取得モジュールと、
    前記N番目の録音データブロックと、前記カウンタがオンになってから前記第1電子機器で再生されたオーディオデータブロックをバッファリングするためのバッファ領域内の、前記録音データブロックとは共に目標時間長のデータブロックである参照データブロックとを整合する整合モジュールと、
    前記N番目の録音データブロックが前記バッファ領域内の参照データブロックと整合する場合、前記録音データブロックと前記バッファ領域内の参照データブロックと整合しない場合にカウントする前記カウンタの第1カウント値を取得する第1カウント値取得モジュールと、
    前記目標時間長と前記第1カウント値とに基づいてエコー遅延を決定するエコー遅延決定モジュールと、
    を備えるエコー遅延検出装置。
  9. 前記第1カウント値取得モジュールが、
    現在受信中の録音データブロックと前記バッファ領域内の参照データブロックとの整合が前記第1電子機器によって連続して決定された回数である目標整合回数を取得する整合回数取得ユニットと、
    前記目標整合回数が所定の条件を満たした場合、前記カウンタの第1カウント値を取得する第1カウント値取得ユニットと、
    を含む請求項8に記載の装置。
  10. 前記第1カウント値取得ユニットが、前記目標整合回数が1より大きい整数を取る所定の回数以上である場合、前記カウンタの第1カウント値を取得する請求項9に記載の装置。
  11. 前記バッファ領域の最大蓄積量は、M(Mは1より大きい整数)個の参照データブロックであり、
    前記第1カウント値取得ユニットが、前記目標整合回数が前記Mである場合、前記カウンタの第1カウント値を取得する請求項9に記載の装置。
  12. 前記整合モジュールが、
    前記N−1番目の録音データブロックが前記バッファ領域内の参照データブロックと整合しない場合、前記N番目の録音データブロックと前記バッファ領域内の最初の録音データブロックとを整合する請求項8に記載の装置。
  13. 前記N番目の録音データブロックと前記バッファ領域内の参照データブロックと整合しない場合、前記カウンタの第2カウント値を取得する第2カウント値取得モジュールと、
    前記第2カウント値と前記目標時間長に基づいて決定された遅延が所定の遅延閾値以上である場合、前記バッファ領域をクリアして前記カウンタをリセットするリセットモジュールと、
    を備える請求項8に記載の装置。
  14. 前記第1電子機器が、再生されたオーディオを、前記オーディオを出力するための第2電子機器に伝送し、
    前記N番目の録音データブロックは、前記第2電子機器が前記オーディオを出力している場合に録音された録音データブロックである請求項8に記載の装置。
  15. 請求項1から7のいずれか一項に記載の方法をコンピュータに実行させるエコー遅延検出プログラム。
  16. コンピュータコマンドが格納されている非一時的コンピュータ読み取り可能な記憶媒体であって、
    前記コンピュータコマンドが、請求項1から7のいずれか一項に記載の方法をコンピュータに実行させる記憶媒体。
JP2020191504A 2020-04-30 2020-11-18 エコー遅延検出方法、装置、プログラム及び非一時的コンピュータ読み取り可能な記憶媒体 Active JP7162040B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202010362972.0A CN113593589B (zh) 2020-04-30 2020-04-30 回声时延检测方法、装置及电子设备
CN202010362972.0 2020-04-30

Publications (2)

Publication Number Publication Date
JP2021175176A true JP2021175176A (ja) 2021-11-01
JP7162040B2 JP7162040B2 (ja) 2022-10-27

Family

ID=72885432

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020191504A Active JP7162040B2 (ja) 2020-04-30 2020-11-18 エコー遅延検出方法、装置、プログラム及び非一時的コンピュータ読み取り可能な記憶媒体

Country Status (4)

Country Link
US (1) US11330383B2 (ja)
EP (1) EP3905654B1 (ja)
JP (1) JP7162040B2 (ja)
CN (1) CN113593589B (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001144655A (ja) * 1999-11-15 2001-05-25 Oki Electric Ind Co Ltd エコーキャンセラ装置
JP2003517782A (ja) * 1999-12-14 2003-05-27 フランス テレコム コンピュータ端末の拡声器とマイクとの間のエコーの除去のためのリアルタイム処理及び管理方法
JP2004282700A (ja) * 2002-10-25 2004-10-07 Avaya Inc エコー検出および監視

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2011103938A (ru) * 2011-02-03 2012-08-10 ЭлЭсАй Корпорейшн (US) Управление акустическими эхо-сигналами на основе временной области
CN103516921A (zh) * 2012-06-28 2014-01-15 杜比实验室特许公司 通过隐藏音频信号的回声控制
JP6011188B2 (ja) * 2012-09-18 2016-10-19 沖電気工業株式会社 エコー経路遅延測定装置、方法及びプログラム
CN103051818B (zh) * 2012-12-20 2014-10-29 歌尔声学股份有限公司 一种用于小型免提语音通讯系统中的回声消除装置和方法
CN103700374B (zh) 2013-12-25 2016-08-17 宁波菊风系统软件有限公司 确定声学回声消除中系统延时的方法及声学回声消除方法
CN106470284B (zh) * 2015-08-20 2020-02-11 钉钉控股(开曼)有限公司 消除声学回声的方法、装置、系统、服务器及通话装置
US9812146B1 (en) * 2016-02-16 2017-11-07 Amazon Technologies, Inc. Synchronization of inbound and outbound audio in a heterogeneous echo cancellation system
CN106231145B (zh) 2016-08-31 2019-09-27 广州市百果园网络科技有限公司 一种回声延时处理方法及回声延时处理装置
CN106210371B (zh) * 2016-08-31 2018-09-18 广州视源电子科技股份有限公司 一种回声时延的确定方法、装置及智能会议设备
US9916840B1 (en) * 2016-12-06 2018-03-13 Amazon Technologies, Inc. Delay estimation for acoustic echo cancellation
CN107333018B (zh) * 2017-05-24 2019-11-15 华南理工大学 一种回声时延估计及追踪方法
CN109040501A (zh) * 2018-09-10 2018-12-18 成都擎天树科技有限公司 一种改善voip通话质量的回声消除方法
CN109493883B (zh) * 2018-11-23 2022-06-07 小捷科技(深圳)有限公司 一种智能设备及其智能设备的音频时延计算方法和装置
CN109688284B (zh) * 2018-12-28 2021-10-08 广东美电贝尔科技集团股份有限公司 一种回音延时检测方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001144655A (ja) * 1999-11-15 2001-05-25 Oki Electric Ind Co Ltd エコーキャンセラ装置
JP2003517782A (ja) * 1999-12-14 2003-05-27 フランス テレコム コンピュータ端末の拡声器とマイクとの間のエコーの除去のためのリアルタイム処理及び管理方法
JP2004282700A (ja) * 2002-10-25 2004-10-07 Avaya Inc エコー検出および監視

Also Published As

Publication number Publication date
EP3905654B1 (en) 2023-05-10
US11330383B2 (en) 2022-05-10
JP7162040B2 (ja) 2022-10-27
EP3905654A1 (en) 2021-11-03
CN113593589B (zh) 2022-06-28
US20210345053A1 (en) 2021-11-04
CN113593589A (zh) 2021-11-02

Similar Documents

Publication Publication Date Title
US11893988B2 (en) Speech control method, electronic device, and storage medium
JP7258932B2 (ja) 車載多音域に基づくノイズ低減方法、装置、電子機器及び記憶媒体
EP3916727A1 (en) Voice pickup method and apparatus for intelligent rearview mirror
CN112634890B (zh) 用于唤醒播放设备的方法、装置、设备以及存储介质
EP3836141A2 (en) Method and apparatus for extracting video clip
KR20210092689A (ko) 그래프 데이터베이스의 순회 방법, 장치, 설비 및 저장매체
CN112133307A (zh) 人机交互方法、装置、电子设备及存储介质
CN111831383A (zh) 窗口拼接方法、装置、设备以及存储介质
JP2021175176A (ja) エコー遅延検出方法、装置、プログラム及び非一時的コンピュータ読み取り可能な記憶媒体
CN111613238B (zh) 信号之间延时的确定方法、装置、设备以及存储介质
US20210209166A1 (en) Relationship network generation method and device, electronic apparatus, and storage medium
CN113986849A (zh) 音乐缓存方法、装置、电子设备及存储介质
JP2022006183A (ja) 言語モデルのトレーニング方法、装置、及び電子機器
JP7300478B2 (ja) 負の遅延時間の検出方法、装置、電子機器及び記憶媒体
CN112988105A (zh) 播放状态控制方法、装置、电子设备和存储介质
CN111724805A (zh) 用于处理信息的方法和装置
EP4056424B1 (en) Audio signal playback delay estimation for smart rearview mirror
CN113127511B (zh) 多数据流的数据拼接方法、装置、电子设备和存储介质
CN115774702A (zh) 分布式数据库实现方法、装置、电子设备及存储介质
CN111651218A (zh) 一种小程序保留方法、装置、电子设备及存储介质
CN113763734A (zh) 一种红绿灯状态检测方法、装置、设备及存储介质
CN113918334A (zh) 一种设备性能优化方法、装置、电子设备及存储介质
CN117472926A (zh) 数据库的更新方法及装置、设备和介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20201118

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20211019

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20211101

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220630

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220906

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220927

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20221017

R150 Certificate of patent or registration of utility model

Ref document number: 7162040

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150