JP2021131536A - ダブルトーク状態検出方法、装置及び電子機器 - Google Patents

ダブルトーク状態検出方法、装置及び電子機器 Download PDF

Info

Publication number
JP2021131536A
JP2021131536A JP2021019188A JP2021019188A JP2021131536A JP 2021131536 A JP2021131536 A JP 2021131536A JP 2021019188 A JP2021019188 A JP 2021019188A JP 2021019188 A JP2021019188 A JP 2021019188A JP 2021131536 A JP2021131536 A JP 2021131536A
Authority
JP
Japan
Prior art keywords
ratio
energy
sub
smoothing
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2021019188A
Other languages
English (en)
Other versions
JP7159366B2 (ja
Inventor
俊楠 呉
Junnan Wu
俊楠 呉
楊飛 徐
Yangfei Xu
楊飛 徐
峻 寧
Jun Ning
峻 寧
▲ユイ▼洲 貢
Yuzhou Gong
▲ユイ▼洲 貢
楠 周
Nan Zhou
楠 周
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu Online Network Technology Beijing Co Ltd
Original Assignee
Baidu Online Network Technology Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Baidu Online Network Technology Beijing Co Ltd filed Critical Baidu Online Network Technology Beijing Co Ltd
Publication of JP2021131536A publication Critical patent/JP2021131536A/ja
Application granted granted Critical
Publication of JP7159366B2 publication Critical patent/JP7159366B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/21Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/002Applications of echo suppressors or cancellers in telephonic connections
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M9/00Arrangements for interconnection not involving centralised switching
    • H04M9/08Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
    • H04M9/082Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic using echo cancellers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02082Noise filtering the noise being echo, reverberation of the speech

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Telephone Function (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

【課題】検出精度が向上したダブルトーク状態検出方法、装置及び電子機器を提供する。【解決手段】ダブルトーク状態検出方法は、M個のサブバンドのそれぞれにおける誤差信号の第1エネルギーと同サブバンドにおけるフィルタリング信号の第2エネルギーとのエネルギー比の値を計算し、M個のエネルギー比の値を得る。誤差信号はマイクロフォンによって収集された入力信号とフィルタリング信号との差であり、フィルタリング信号は基準信号をフィルタリング処理した信号であり、Mは正の整数である。M個のエネルギー比の値に対して第1平滑化処理を行い、M個の第1エネルギー平滑化比の値を得て、M個のエネルギー平滑化比の値に対して第2平滑化処理を行い、M個の第2エネルギー平滑化比の値を得て、M個の第1エネルギー平滑化比の値及びM個の第2エネルギー平滑化比の値に基づいて、ダブルトーク状態検出を行い、入力信号の状態を決定する。【選択図】図1

Description

本願はコンピュータ技術における音声の技術分野に関し、特にダブルトーク状態検出方法、装置及び電子機器に関する。
たとえば、音声対話を実行可能なスマートスピーカー等のようないくつかの電子機器では、音響エコーキャンセル(AEC)は重要な役割を果たしており、音響エコーキャンセルの効果はスマートスピーカーの音声対話性能を直接左右している。また、たとえば、電子機器による通話中、音響エコーキャンセルによって通話品質を向上させることができる。AECアルゴリズムでは、遠端基準信号をよりよく除去するとともに、近端音声信号を保護するために、通常、ダブルトーク検出モジュールが備えられる。ダブルトーク検出モジュールは現在の信号の状態がシングルトーク状態であるかダブルトーク状態であるかを検出する。シングルトーク状態とは、遠端基準信号のみがあることを意味し、ダブルトーク状態とは、近端話者の音声信号も遠端基準信号もあることを意味する。
従来のダブルトーク状態検出方法は、フルバンドエネルギー比の方法を採用し、即ち、マイクロフォンにより収集される信号を線形フィルタで処理した残りの信号エネルギーとスピーカーの信号エネルギーとを比較し、比の値が設定された検出閾値よりも大きい場合、ダブルトーク(double talk)状態であると判断し、それ以外の場合、シングルトーク(single talk)状態であると判断する。
しかしながら、上記ダブルトーク状態検出方法によって状態検出を行う場合、基準信号のエネルギーが大きい、又は近端信号のエネルギーが小さい(たとえば、話者の声が非常に小さい)と、誤判断が発生しやすく、即ち、状態検出の精度が低くなりやすい。
本願は、ダブルトーク状態検出精度が低いという課題を解決するために、ダブルトーク状態検出方法、装置及び電子機器を提供する。
第1態様によれば、本願の一実施例は、
M個のサブバンドのそれぞれにおける誤差信号の第1エネルギーと同サブバンドにおけるフィルタリング信号の第2エネルギーとのエネルギー比の値を計算し、M個のエネルギー比の値を得ることであって、前記誤差信号はマイクロフォンによって収集された入力信号とフィルタリング信号との差であり、前記フィルタリング信号は基準信号をフィルタリング処理した信号であり、Mは正の整数であることと、
前記M個のエネルギー比の値に対して第1平滑化処理を行い、M個の第1エネルギー平滑化比の値を得て、前記M個のエネルギー平滑化比の値に対して第2平滑化処理を行い、M個の第2エネルギー平滑化比の値を得ることと、
前記M個の第1エネルギー平滑化比の値及び前記M個の第2エネルギー平滑化比の値に基づいてダブルトーク状態検出を行い、前記入力信号の状態を決定することと、を含むダブルトーク状態検出方法を提供する。
本願の実施例に係るダブルトーク状態検出方法では、M個のサブバンドのそれぞれにおける誤差信号の第1エネルギーと同サブバンドにおけるフィルタリング信号の第2エネルギーとのエネルギー比の値に対して第1平滑化処理を行うことにより、得られるM個の第1エネルギー平滑化比の値をさらに安定化させ、それにより、いくつかのサブバンドにおける誤差信号の異常に起因するM個のエネルギー比の値のうちの異常エネルギー比の値の、状態検出の精度に対する影響を低減させ、そして、第1平滑化処理を行われたM個の第1エネルギー平滑化比の値に対して第2平滑化処理を行うことで、得られるM個の第2エネルギー平滑化比の値をさらに安定化させ、それにより、M個の第1エネルギー平滑化比の値のうちのいくつかの異常比の値の、状態検出の精度に対する影響を低減させることができ、したがって、前記M個の第1エネルギー平滑化比の値及び前記M個の第2エネルギー平滑化比の値に基づいてダブルトーク状態検出を行うことで、状態検出の精度を向上させることができる。
選択可能に、前記の前記M個の第1エネルギー平滑化比の値及び前記M個の第2エネルギー平滑化比の値に基づいてダブルトーク状態検出を行い、前記入力信号の状態を決定することは、
前記M個の第2エネルギー平滑化比の値に基づいて、前記M個の第2エネルギー平滑化比の値の雑音を予測することと、
前記M個の第1エネルギー平滑化比の値及び前記M個の第2エネルギー平滑化比の値の雑音に基づいて、前記M個のエネルギー比の値の信号対雑音比を得ることと、
前記M個のエネルギー比の値の信号対雑音比及び所定閾値に基づいてダブルトーク状態検出を行い、前記入力信号の状態を決定することと、を含む。
本実施例では、M個の第1エネルギー平滑化比の値及び予測されたM個の第2エネルギー平滑化比の値の雑音を利用してエネルギー比の値の信号対雑音比を計算し、エネルギー比の値の信号対雑音比を利用してダブルトーク状態検出を行うことで、検出精度を向上させる。
選択可能に、前記フィルタリング信号はNフレームのフィルタリングサブ信号を含み、前記誤差信号はNフレームの誤差サブ信号を含み、Nは正の整数であり、
ターゲットサブバンドにおける前記エネルギー比の値は前記ターゲットサブバンドにおけるN個のサブエネルギー比を含み、前記ターゲットサブバンドにおけるN個のサブエネルギー比は前記ターゲットサブバンドにおける各フレームの誤差サブ信号の第1エネルギーと前記ターゲットサブバンドにおける対応するフレームのフィルタリングサブ信号の第2エネルギーとのエネルギー比を含み、前記ターゲットサブバンドにおける前記第1エネルギー平滑化比の値は前記N個のサブエネルギー比に対して前記第1平滑化処理を行って得たN個の第1サブエネルギー平滑化比の値を含み、前記ターゲットサブバンドにおける前記第2エネルギー平滑化比の値は前記N個の第1サブエネルギー平滑化比の値に対して前記第2平滑化処理を行って得たN個の第2サブエネルギー平滑化比の値を含み、前記ターゲットサブバンドは前記M個のサブバンドのうちのいずれかのサブバンドである。
本実施例では、誤差信号及びフィルタリング信号をフレーミング処理し、ターゲットサブバンドにおけるNフレームの誤差サブ信号のそれぞれの第1エネルギーとそれに対応するフレームのフィルタリングサブ信号の第2エネルギーとのエネルギー比を計算し、ターゲットサブバンドにおけるN個のサブエネルギー比を得て、ターゲットサブバンドにおけるエネルギー比の値はターゲットサブバンドにおけるN個のサブエネルギー比を含み、M個のサブバンドがあるため、M個のサブバンドのそれぞれにおけるN個のサブエネルギー比が得られ、M個のサブバンドのそれぞれにおけるN個のサブエネルギー比をダブルトーク状態検出の基礎とすることで、状態検出の精度を向上させることができる。
選択可能に、以下の式によって前記M個のエネルギー比の値に対して第1平滑化処理を行う。
ratio_short_sm(n+1,k)=α*ratio_short_sm(n,k)+(1-α)*ratio(n+1,k)
(ただし、αは第1平滑化因子であり、前記ratio(n+1,k)はk番目のサブバンドにおける第n+1フレームの誤差サブ信号の第1エネルギーとk番目のサブバンドにおける第n+1フレームのフィルタリングサブ信号の第2エネルギーとのサブエネルギー比であり、前記ratio_short_sm(n+1,k)は前記ratio(n+1,k)に対して第1平滑化処理を行って得た第1サブエネルギー平滑化比の値であり、ratio_short_sm(n,k)は前記ratio(n,k)に対して第1平滑化処理を行って得た第1サブエネルギー平滑化比の値であり、ratio(n,k)はk番目のサブバンドにおける第nフレームの誤差サブ信号の第1エネルギーとk番目のサブバンドにおける第nフレームのフィルタリングサブ信号の第2エネルギーとのサブエネルギー比であり、nは正の整数であり、且つn≦N−1であり、kは正の整数であり、且つk≦Mであり、ratio_short_sm(1,k)はratio(1,k)に等しく、ratio(1,k)はk番目のサブバンドにおける第1フレームの誤差サブ信号の第1エネルギーとk番目のサブバンドにおける第1フレームのフィルタリングサブ信号の第2エネルギーとのサブエネルギー比である。)
上記第1平滑化処理によって、得られたM個の第1エネルギー平滑化比の値がM個のエネルギー比の値よりも安定的になり、これに基づいてダブルトーク状態検出を行うことで、検出精度を向上させる。
選択可能に、以下の式によって前記M個のエネルギー平滑化比の値に対して第2平滑化処理を行う。
ratio_long_sm(n+1,k)=β*ratio_long_sm(n,k)+(1-β)*ratio_short_sm(n+1,k)
(ただし、βは第2平滑化因子であり、前記ratio_long_sm(n+1,k)は前記ratio_short_sm(n+1,k)に対して第2平滑化処理を行って得た第2サブエネルギー平滑化比の値であり、前記ratio_short_sm(n+1,k)は前記ratio(n+1,k)に対して第1平滑化処理を行って得た第1サブエネルギー平滑化比の値であり、前記ratio(n+1,k)はk番目のサブバンドにおける第n+1フレームの誤差サブ信号の第1エネルギーとk番目のサブバンドにおける第n+1フレームのフィルタリングサブ信号の第2エネルギーとのサブエネルギー比であり、前記ratio_long_sm(n,k)は前記ratio_short_sm(n,k)に対して第2平滑化処理を行って得た第1サブエネルギー平滑化比の値であり、ratio_short_sm(n,k)は前記ratio(n,k)に対して第1平滑化処理を行って得た第1サブエネルギー平滑化比の値であり、ratio(n,k)はk番目のサブバンドにおける第nフレームの誤差サブ信号の第1エネルギーとk番目のサブバンドにおける第nフレームのフィルタリングサブ信号の第2エネルギーとのサブエネルギー比であり、nは正の整数であり、且つn≦N−1であり、kは正の整数であり、且つk≦Mであり、ratio_long_sm(1,k)はratio_short_sm(1,k)に等しい。)
上記第2平滑化処理によって、得られたM個の第2エネルギー平滑化比の値がM個の第1エネルギー平滑化値よりも安定的になり、これに基づいてダブルトーク状態検出を行うことで、検出精度を向上させる。
選択可能に、前記の前記M個のエネルギー比の値の信号対雑音比及び所定閾値に基づいてダブルトーク状態検出を行い、前記入力信号の状態を決定することは、
前記M個のエネルギー比の値の信号対雑音比のうちのI(Iは正の整数で、且つI≦Mである)個のエネルギー比の値の信号対雑音比の合計を計算することと、
前記合計が前記所定閾値よりも大きい場合、前記入力信号がダブルトーク状態であると決定し、又は、前記合計が前記所定閾値以下の場合、前記入力信号がシングルトーク状態であると決定することと、を含む。
本実施例では、M個のエネルギー比の値のうち対応するサブバンドのサブ周波数範囲が第1所定範囲内にあるエネルギー比の値(即ち、I個のエネルギー比の値)の信号対雑音比の合計でダブルトーク状態検出を行う。このようにして、計算量を減少させるだけでなく、検出精度を向上させることができる。
第2態様によれば、本願の一実施例は、
M個のサブバンドのそれぞれにおける誤差信号の第1エネルギーと同サブバンドにおけるフィルタリング信号の第2エネルギーとのエネルギー比の値を計算し、M個のエネルギー比の値を得るための第1計算モジュールであって、前記誤差信号はマイクロフォンによって収集された入力信号とフィルタリング信号との差であり、前記フィルタリング信号は基準信号をフィルタリング処理した信号であり、Mは正の整数である第1計算モジュールと、
前記M個のエネルギー比の値に対して第1平滑化処理を行い、M個の第1エネルギー平滑化比の値を得て、前記M個のエネルギー平滑化比の値に対して第2平滑化処理を行い、M個の第2エネルギー平滑化比の値を得るための平滑化モジュールと、
前記M個の第1エネルギー平滑化比の値及び前記M個の第2エネルギー平滑化比の値に基づいてダブルトーク状態検出を行い、前記入力信号の状態を決定するための状態検出モジュールと、を含むダブルトーク状態検出装置を提供する。
選択可能に、前記状態検出モジュールは、
前記M個の第2エネルギー平滑化比の値に基づいて、前記M個の第2エネルギー平滑化比の値の雑音を予測するための雑音予測モジュールと、
前記M個の第1エネルギー平滑化比の値及び前記M個の第2エネルギー平滑化比の値の雑音に基づいて、前記M個のエネルギー比の値の信号対雑音比を得るための信号対雑音比取得モジュールと、
前記M個のエネルギー比の値の信号対雑音比及び所定閾値に基づいてダブルトーク状態検出を行い、前記入力信号の状態を決定するための状態決定モジュールと、を含む。
選択可能に、前記フィルタリング信号はNフレームのフィルタリングサブ信号を含み、前記誤差信号はNフレームの誤差サブ信号を含み、Nは正の整数であり、
ターゲットサブバンドにおける前記エネルギー比の値は前記ターゲットサブバンドにおけるN個のサブエネルギー比を含み、前記ターゲットサブバンドにおけるN個のサブエネルギー比は前記ターゲットサブバンドにおける各フレームの誤差サブ信号の第1エネルギーと前記ターゲットサブバンドにおける対応するフレームのフィルタリングサブ信号の第2エネルギーとのエネルギー比を含み、前記ターゲットサブバンドにおける前記第1エネルギー平滑化比の値は前記N個のサブエネルギー比に対して前記第1平滑化処理を行って得たN個の第1サブエネルギー平滑化比の値を含み、前記ターゲットサブバンドにおける前記第2エネルギー平滑化比の値は前記N個の第1サブエネルギー平滑化比の値に対して前記第2平滑化処理を行って得たN個の第2サブエネルギー平滑化比の値を含み、前記ターゲットサブバンドは前記M個のサブバンドのうちのいずれかのサブバンドである。
選択可能に、前記平滑化モジュールは、以下の式によって前記M個のエネルギー比の値に対して第1平滑化処理を行う。
ratio_short_sm(n+1,k)=α*ratio_short_sm(n,k)+(1-α)*ratio(n+1,k)
(ただし、αは第1平滑化因子であり、前記ratio(n+1,k)はk番目のサブバンドにおける第n+1フレームの誤差サブ信号の第1エネルギーとk番目のサブバンドにおける第n+1フレームのフィルタリングサブ信号の第2エネルギーとのサブエネルギー比であり、前記ratio_short_sm(n+1,k)は前記ratio(n+1,k)に対して第1平滑化処理を行って得た第1サブエネルギー平滑化比の値であり、ratio_short_sm(n,k)は前記ratio(n,k)に対して第1平滑化処理を行って得た第1サブエネルギー平滑化比の値であり、ratio(n,k)はk番目のサブバンドにおける第nフレームの誤差サブ信号の第1エネルギーとk番目のサブバンドにおける第nフレームのフィルタリングサブ信号の第2エネルギーとのサブエネルギー比であり、nは正の整数であり、且つn≦N−1であり、kは正の整数であり、且つk≦Mであり、ratio_short_sm(1,k)はratio(1,k)に等しく、ratio(1,k)はk番目のサブバンドにおける第1フレームの誤差サブ信号の第1エネルギーとk番目のサブバンドにおける第1フレームのフィルタリングサブ信号の第2エネルギーとのサブエネルギー比である。)
選択可能に、前記平滑化モジュールは、以下の式によって前記M個のエネルギー平滑化比の値に対して第2平滑化処理を行う。
ratio_long_sm(n+1,k)=β*ratio_long_sm(n,k)+(1-β)*ratio_short_sm(n+1,k)
(ただし、βは第2平滑化因子であり、前記ratio_long_sm(n+1,k)は前記ratio_short_sm(n+1,k)に対して第2平滑化処理を行って得た第2サブエネルギー平滑化比の値であり、前記ratio_short_sm(n+1,k)は前記ratio(n+1,k)に対して第1平滑化処理を行って得た第1サブエネルギー平滑化比の値であり、前記ratio(n+1,k)はk番目のサブバンドにおける第n+1フレームの誤差サブ信号の第1エネルギーとk番目のサブバンドにおける第n+1フレームのフィルタリングサブ信号の第2エネルギーとのサブエネルギー比であり、前記ratio_long_sm(n,k)は前記ratio_short_sm(n,k)に対して第2平滑化処理を行って得た第1サブエネルギー平滑化比の値であり、ratio_short_sm(n,k)は前記ratio(n,k)に対して第1平滑化処理を行って得た第1サブエネルギー平滑化比の値であり、ratio(n,k)はk番目のサブバンドにおける第nフレームの誤差サブ信号の第1エネルギーとk番目のサブバンドにおける第nフレームのフィルタリングサブ信号の第2エネルギーとのサブエネルギー比であり、nは正の整数であり、且つn≦N−1であり、kは正の整数であり、且つk≦Mであり、ratio_long_sm(1,k)はratio_short_sm(1,k)に等しい。)
選択可能に、前記状態決定モジュールは、前記入力信号の状態を決定し、
前記M個のエネルギー比の値の信号対雑音比のうちのI(Iは正の整数で、且つI≦Mである)個のエネルギー比の値の信号対雑音比の合計を計算するための合計モジュールを含み、
前記合計が前記所定閾値よりも大きい場合、前記入力信号がダブルトーク状態であると決定し、又は、前記合計が前記所定閾値以下の場合、前記入力信号がシングルトーク状態であると決定する。
第3態様によれば、本願の一実施例は、
少なくとも1つのプロセッサ、及び
前記少なくとも1つのプロセッサに通信可能に接続されたメモリを含み、
前記少なくとも1つのプロセッサにより実行されると、本願の各実施例に係る方法を前記少なくとも1つのプロセッサに実行させる、前記少なくとも1つのプロセッサによって実行可能な命令が前記メモリに記憶されている電子機器をさらに提供する。
第4態様によれば、本願の一実施例は、コンピュータ命令が記憶されている非一時的なコンピュータ読み取り可能な記憶媒体であって、
前記コンピュータ命令は、本願の各実施例に係る方法を前記コンピュータに実行させる、非一時的なコンピュータ読み取り可能な記憶媒体をさらに提供する。
図面は本技術案をより理解しやするためであり、本願を制限するものではない。
本願に係る一実施例のダブルトーク状態検出方法の一例の模式的なフローチャートである。 本願に係る一実施例のダブルトーク状態検出方法の別の模式的なフローチャートである。 本願に係る一実施例のAECアルゴリズムの回路図である。 本願に係る一実施例のダブルトーク状態検出装置の構造図である。 本願の実施例のダブルトーク状態検出方法を実現するための電子機器のブロック図である。
以下では、図面を参照しながら本願の例示的な実施例を説明するが、この説明には、理解を容易にするために本願の実施例の様々な詳細が含まれるが、これらは単に例示的なものであると考えるべきである。したがって、当業者が理解できるように、本願の範囲及び精神を逸脱することなく、ここで記載される実施例に様々な変更及び修正を加えることができる。同様に、以下の説明では、周知の機能及び構造については、明確化及び簡明化のために説明を省略する。
図1に示すように、本願の実施例では、本願はダブルトーク状態検出方法を提供し、電子機器に適用でき、たとえば、電子機器はスマートスピーカー等を含んでもよく、上記方法は、ステップS101〜S103を含む。
ステップS101、M個のサブバンドのそれぞれにおける誤差信号の第1エネルギーと同サブバンドにおけるフィルタリング信号の第2エネルギーとのエネルギー比の値を計算し、M個のエネルギー比の値を得る。
誤差信号はマイクロフォンによって収集された入力信号とフィルタリング信号との差であり、フィルタリング信号は基準信号をフィルタリング処理した信号であり、Mは正の整数である。一例として、線形フィルタによって基準信号をフィルタリング処理してもよい。なお、上記基準信号は、電子機器のスピーカーに伝送して放送する信号として理解してもよい。電子機器のマイクロフォンは入力信号を収集でき、電子機器のスピーカーが放送している場合、マイクロフォンによって収集された入力信号はスピーカーによって放送されている信号について収集された信号及び近端音声信号(たとえば、ユーザーが話している等)を含んでもよい。
周波数領域では、1つの周波数帯が複数のサブバンドに分割され、各サブバンドは一定の周波数範囲に対応し、たとえば、0〜100Hzの周波数帯域の場合、5個のサブバンドに分割されてもよく、各サブバンドに対応するサブ周波数範囲の大きさが20Hzであり、5個のサブバンドに対応するサブ周波数範囲がそれぞれ0〜20Hz、20〜40Hz、40〜60Hz、60〜80Hz、80〜100Hzである。本実施例では、1つの周波数帯域を予め設定してもよく、該周波数帯域は電子機器に処理可能な信号の周波数範囲に関連してもよい。たとえば、スマートスピーカーの場合、一例として、該周波数帯域は3000Hzであってもよい。予め設定された周波数帯域を予め周波数分割して、M個のサブバンドを得るようにしてもよい。
M個のサブバンドのうちのいずれかにおける誤差信号は該サブバンドにおける入力信号と該サブバンドにおけるフィルタリング信号との差である。サブバンドのいずれかに対して、該サブバンドにおける誤差信号の第1エネルギーと該サブバンドにおけるフィルタリング信号の第2エネルギーとのエネルギー比の値を計算でき、つまり、各エネルギー比の値は同一サブバンドにおける誤差信号とフィルタリング信号とのエネルギーの比である。即ち、各サブバンドにおける誤差信号の第1エネルギーと同サブバンドにおけるフィルタリング信号の第2エネルギーとのエネルギー比の値は、同一サブバンドのそれぞれにおける誤差信号の第1エネルギーとフィルタリング信号の第2エネルギーとのエネルギー比として理解してもよく、得られるM個のエネルギー比の値は同一サブバンドのそれぞれにおける誤差信号の第1エネルギーとフィルタリング信号の第2エネルギーとのエネルギー比を含み、即ち、各エネルギー比の値は対応するサブバンドを有し、M個のエネルギー比の値はM個のサブバンドにおけるエネルギー比の値として理解してもよい。たとえば、M個のサブバンドは1番目のサブバンド及び2番目のサブバンドを含み、即ち、Mが2である場合、1番目のサブバンドにおける誤差信号の第1エネルギーと1番目のサブバンドにおけるフィルタリング信号の第2エネルギーとのエネルギー比の値、及び2番目のサブバンドにおける誤差信号の第1エネルギーと2番目のサブバンドにおけるフィルタリング信号の第2エネルギーとのエネルギー比の値を計算し、このようにして、2個のエネルギー比の値を得る。
ステップS102、M個のエネルギー比の値に対して第1平滑化処理を行い、M個の第1エネルギー平滑化比の値を得て、M個のエネルギー平滑化比の値に対して第2平滑化処理を行い、M個の第2エネルギー平滑化比の値を得る。
M個のエネルギー比を得た後、まず、第1平滑化処理を行い、M個の第1エネルギー平滑化比の値を得て、次に、M個の第1エネルギー平滑化比の値に対して第2平滑化処理を行い、M個の第2エネルギー平滑化比の値を得て、M個のエネルギー比の値に対して第1平滑化処理を行うことによって、得られるM個の第1エネルギー平滑化比の値をM個のエネルギー比の値よりも安定化させ、いくつかのサブバンドにおける誤差信号の異常に起因するM個のエネルギー比の値のうちの異常エネルギー比の値の、状態検出の精度に対する影響を低減させ、さらにM個のエネルギー平滑化比の値に対して第2平滑化処理を行うことによって、M個の第2エネルギー平滑化比の値をM個の第1エネルギー平滑化比の値よりも安定化させ、M個の第1エネルギー平滑化比の値のうちのいくつかの異常比の値の、状態検出の精度に対する影響を低減させる。一例として、第1平滑化処理の平滑化パラメータと第2平滑化処理の平滑化パラメータは異なる。
ステップS103、M個の第1エネルギー平滑化比の値及びM個の第2エネルギー平滑化比の値に基づいてダブルトーク状態検出を行い、入力信号の状態を決定する。
本実施例では、M個の第1エネルギー平滑化比の値及びM個の第2エネルギー平滑化比の値をダブルトーク状態検出の根拠とすることで、状態検出の精度を向上させる。
本願の実施例に係るダブルトーク状態検出方法では、M個のサブバンドのそれぞれにおける誤差信号の第1エネルギーと同サブバンドにおけるフィルタリング信号の第2エネルギーとのエネルギー比の値に対して第1平滑化処理を行うことで、得られるM個の第1エネルギー平滑化比の値をさらに安定化させ、それにより、いくつかのサブバンドにおける誤差信号の異常に起因するM個のエネルギー比の値のうちの異常エネルギー比の値の、状態検出の精度に対する影響を低減させ、そして、第1平滑化処理を行われたM個の第1エネルギー平滑化比の値に対して第2平滑化処理を行うことで、得られるM個の第2エネルギー平滑化比の値をさらに安定化させ、それにより、M個の第1エネルギー平滑化比の値のうちのいくつかの異常比の値の、状態検出の精度に対する影響を低減させることができ、したがって、前記M個の第1エネルギー平滑化比の値及び前記M個の第2エネルギー平滑化比の値に基づいてダブルトーク状態検出を行うことで、状態検出の精度を向上させることができる。
一実施例では、M個のエネルギー比の値に対して第1平滑化処理を行い、M個の第1エネルギー平滑化比の値を得て、M個のエネルギー平滑化比の値に対して第2平滑化処理を行い、M個の第2エネルギー平滑化比の値を得るステップは、基準信号の信号対雑音比が所定の信号対雑音比よりも大きい場合、M個のエネルギー比の値に対して第1平滑化処理を行い、M個の第1エネルギー平滑化比の値を得て、M個のエネルギー平滑化比の値に対して第2平滑化処理を行い、M個の第2エネルギー平滑化比の値を得るステップを含む。
即ち、基準信号を取得した後、まず、基準信号の信号対雑音比を計算し、たとえば、基準信号の雑音を推定し(たとえば、最小値追跡法を採用して雑音を推定することができる)、即ち、基準信号の雑音を追跡し、基準信号の雑音を得て、次に、基準信号と基準信号の雑音との比を計算し、基準信号の信号対雑音比を得ることができる。基準信号の信号対雑音比が低い場合、雑音の存在のためエネルギー比の値がやや大きく、状態検出の精度が低下してしまうという現象を軽減するために、本実施例の平滑化処理過程では、まず、基準信号の信号対雑音比と所定の信号対雑音比を比較し、基準信号の信号対雑音比が所定の信号対雑音比よりも大きい場合、M個のエネルギー比の値に対して第1平滑化処理を行い、M個の第1エネルギー平滑化比の値を得る。基準信号が強い(即ち、基準信号の信号対雑音比が高い)場合、後続で非常に小さい雑音が追跡されることを回避するために、さらにM個の第1エネルギー平滑化比の値に対して第2平滑化処理を行い、M個の第2エネルギー平滑化比の値を得て、それにより、状態検出の精度を向上させる。
一例として、入力信号の状態を決定した後、入力信号の状態に応じて、線形フィルタのフィルタリングパラメータを調整するステップをさらに含んでもよい。
線形フィルタは基準信号をフィルタリングしてフィルタリング信号を得るフィルタであり、たとえば、入力信号の状態がダブルトーク状態である場合、線形フィルタのフィルタリングパラメータを一定に維持し、入力信号の状態がシングルトーク状態である場合、線形フィルタのフィルタリングパラメータを更新する。線形フィルタのフィルタリングパラメータを更新する方式は様々であり、本願では限定しない。
図2に示すように、一実施例では、M個の第1エネルギー平滑化比の値及びM個の第2エネルギー平滑化比の値に基づいてダブルトーク状態検出を行い、入力信号の状態を決定するステップ103は、ステップS1031〜ステップS1033を含む。
ステップS1031、M個の第2エネルギー平滑化比の値に基づいて、M個の第2エネルギー平滑化比の値の雑音を予測する。
M個の第2エネルギー平滑化比の値はM個の第1エネルギー平滑化比の値に対して第2平滑化処理を行った結果であり、このようにして、第2平滑化処理を行われたM個の第2エネルギー平滑化比の値に基づいて雑音予測を行うことで、雑音予測の精度を向上させ、それにより、状態検出の精度を向上させることができる。
なお、上記M個の第2エネルギー平滑化比の値の雑音を予測する方式は様々であり、一例として、最小値追跡アルゴリズムによってM個の第2エネルギー平滑化比の値の雑音を予測してもよく、即ち、最小値追跡アルゴリズムによって第2エネルギー平滑化比の値に対して最小値追跡を行い、第2エネルギー平滑化比の値の最小値を予測して、第2エネルギー平滑化比の値の雑音とする。
ステップS1032、M個の第1エネルギー平滑化比の値及びM個の第2エネルギー平滑化比の値の雑音に基づいて、M個のエネルギー比の値の信号対雑音比を得る。
第1エネルギー平滑化比の値はエネルギー比の値に対して第1平滑化処理を行った結果であり、第1エネルギー平滑化比の値はエネルギー比の値に1対1で対応し、第2エネルギー平滑化比の値は第1エネルギー平滑化比の値に対して第2平滑化処理を行った結果であり、即ち、第2エネルギー平滑化比の値は第1エネルギー平滑化比の値に1対1で対応し、各第1エネルギー平滑化比の値とそれに対応する第2エネルギー平滑化比の値との比の値を、対応するエネルギー比の値の信号対雑音比とすることができ、このようにして、M個のエネルギー比の値の信号対雑音比を得ることができる。
ステップS1033、M個のエネルギー比の値の信号対雑音比及び所定閾値に基づいてダブルトーク状態検出を行い、入力信号の状態を決定する。
M個のエネルギー比の値の信号対雑音比を得た後、M個のエネルギー比の値の信号対雑音比及び所定閾値に基づいてダブルトーク状態検出を行い、入力信号の状態を決定することができる。
本実施例では、M個の第1エネルギー平滑化比の値及び予測されたM個の第2エネルギー平滑化比の値の雑音を利用してエネルギー比の値の信号対雑音比を計算し、エネルギー比の値の信号対雑音比を利用してダブルトーク状態検出を行うことで、検出精度を向上させる。
一実施例では、M個のサブバンドのそれぞれにおける誤差信号の第1エネルギーと同サブバンドにおけるフィルタリング信号の第2エネルギーとのエネルギー比の値を計算する前に、基準信号及びマイクロフォンによって収集された入力信号を取得するステップと、基準信号をフィルタリング処理してフィルタリング信号を得るステップと、入力信号とフィルタリング信号との誤差信号を取得するステップと、M個のサブバンドにおける誤差信号のM個の第1エネルギー及びM個のサブバンドにおけるフィルタリング信号のM個の第2エネルギーを計算するステップと、をさらに含む。
即ち、エネルギー比を計算する前に、エネルギーを取得する必要がある。M個のサブバンドがあるため、M個のサブバンドのそれぞれにおける誤差信号の第1エネルギーを計算し、M個のサブバンドのそれぞれにおけるフィルタリング信号の第2エネルギーを計算する必要があり、このようにして、M個の第1エネルギー及びM個の第2エネルギーを得て、後続のエネルギー比の値の計算に根拠を提供する。
一実施例では、フィルタリング信号はNフレームのフィルタリングサブ信号を含み、誤差信号はNフレームの誤差サブ信号を含み、Nは正の整数であり、
ターゲットサブバンドにおけるエネルギー比の値はターゲットサブバンドにおけるN個のサブエネルギー比を含み、ターゲットサブバンドにおけるN個のサブエネルギー比はターゲットサブバンドにおける各フレームの誤差サブ信号の第1エネルギーとターゲットサブバンドにおける対応するフレームのフィルタリングサブ信号の第2エネルギーとのエネルギー比を含み、ターゲットサブバンドにおける第1エネルギー平滑化比の値はN個のサブエネルギー比に対して第1平滑化処理を行って得たN個の第1サブエネルギー平滑化比の値を含み、ターゲットサブバンドにおける第2エネルギー平滑化比の値はN個の第1サブエネルギー平滑化比の値に対して第2平滑化処理を行って得たN個の第2サブエネルギー平滑化比の値を含み、ターゲットサブバンドはM個のサブバンドのうちのいずれかのサブバンドである。
なお、入力信号はNフレームの入力サブ信号を含み、基準信号はNフレームの基準サブ信号を含み、誤差信号は入力信号及び基準信号に応じて決定され、このため、誤差サブ信号は入力サブ信号及び基準サブ信号に応じて決定され、入力サブ信号は誤差サブ信号に1対1で対応し、基準サブ信号は誤差サブ信号に1対1で対応している。フィルタリング信号は基準信号によって決定され、このため、フィルタリングサブ信号は基準サブ信号によって決定され、フィルタリングサブ信号は基準サブ信号に1対1で対応している。このようにして、誤差サブ信号はフィルタリングサブ信号に1対1で対応し、ターゲットサブバンドにおける各フレームの誤差サブ信号は、対応する第1エネルギーを有し、ターゲットサブバンドにおける各フレームのフィルタリングサブ信号は対応する第2エネルギーを有する。ターゲットサブバンドにおけるNフレームの誤差サブ信号のそれぞれの第1エネルギーとそれに対応するフレームのフィルタリングサブ信号の第2エネルギーとのエネルギー比を計算することによって、N個のサブエネルギー比を得ることができる。
本実施例では、誤差信号及びフィルタリング信号をフレーミング処理し、ターゲットサブバンドにおけるNフレームの誤差サブ信号のそれぞれの第1エネルギーとそれに対応するフレームのフィルタリングサブ信号の第2エネルギーとのエネルギー比を計算し、ターゲットサブバンドにおけるN個のサブエネルギー比を得て、ターゲットサブバンドにおけるエネルギー比の値はターゲットサブバンドにおけるN個のサブエネルギー比を含み、M個のサブバンドがあるため、M個のサブバンドのそれぞれにおけるN個のサブエネルギー比が得られ、M個のサブバンドのそれぞれにおけるN個のサブエネルギー比をダブルトーク状態検出の基礎とすることで、状態検出の精度を向上させることができる。
一実施例では、以下の式によって前記M個のエネルギー比の値に対して第1平滑化処理を行う。
ratio_short_sm(n+1,k)=α*ratio_short_sm(n,k)+(1-α)*ratio(n+1,k)
(ただし、αは第1平滑化因子であり、前記ratio(n+1,k)はk番目のサブバンドにおける第n+1フレームの誤差サブ信号の第1エネルギーとk番目のサブバンドにおける第n+1フレームのフィルタリングサブ信号の第2エネルギーとのサブエネルギー比であり、前記ratio_short_sm(n+1,k)は前記ratio(n+1,k)に対して第1平滑化処理を行って得た第1サブエネルギー平滑化比の値であり、ratio_short_sm(n,k)は前記ratio(n,k)に対して第1平滑化処理を行って得た第1サブエネルギー平滑化比の値であり、ratio(n,k)はk番目のサブバンドにおける第nフレームの誤差サブ信号の第1エネルギーとk番目のサブバンドにおける第nフレームのフィルタリングサブ信号の第2エネルギーとのサブエネルギー比であり、nは正の整数であり、且つn≦N−1であり、kは正の整数であり、且つk≦Mであり、ratio_short_sm(1,k)はratio(1,k)に等しく、ratio(1,k)はk番目のサブバンドにおける第1フレームの誤差サブ信号の第1エネルギーとk番目のサブバンドにおける第1フレームのフィルタリングサブ信号の第2エネルギーとのサブエネルギー比である。)
上記誤差サブ信号のフレーム順序は誤差信号における誤差サブ信号の時間順であり、上記フィルタリングサブ信号のフレーム順序はフィルタリング信号におけるフィルタリングサブ信号の時間順であり、ratio_short_sm(1,k)がratio(1,k)に等しく、このことから理解できるように、k番目のサブバンドにおける、時間が最も早い第1フレームの誤差サブ信号の第1エネルギーとk番目のサブバンドにおける第1フレームのフィルタリングサブ信号の第2エネルギーとのサブエネルギー比については、第1平滑化を行った結果が平滑化前の結果と同じであり、つまり、k番目のサブバンドにおける、最も早く収集される第1フレームの誤差サブ信号の第1エネルギーとk番目のサブバンドにおける第1フレームのフィルタリングサブ信号の第2エネルギーとのサブエネルギー比については、平滑化を行わない。上記第1平滑化処理によって、得られたM個の第1エネルギー平滑化比の値がM個のエネルギー比の値よりも安定的になり、これに基づいてダブルトーク状態検出を行うことで、検出精度を向上させる。
一例として、0≦α≦1である。上記第1平滑化処理の式では、第1平滑化因子αの値は式の右側のratio_short_sm(n,k)及びratio(n+1,k)に応じて決定でき、n又は/及びkの変化に伴い、ratio_short_sm(n,k)及びratio(n+1,k)が変化し、この場合、αは変化する可能性がある。たとえば、ratio(n,k)に対して第1平滑化処理を行って、ratio_short_sm(n,k)を得て、現在、ratio(n+1,k)に対して第1平滑化処理を行う必要があり、ratio_short_sm(n,k)がratio(n+1,k)未満の場合、現在、近端音声が存在する可能性が大きいことを示し、現在のratio(n+1,k)をできるだけ早く追跡する必要があり、したがって、第1平滑化因子として小さい値を選択し、逆の場合は、大きい値を選択する。たとえば、第1所定値及び第2所定値が予め設定されており、第1所定値は第2所定値未満であり、一例として、第1所定値は0.5、第2所定値は0.7であってもよく、ratio_short_sm(n,k)がratio(n+1,k)未満の場合、第1所定値を第1平滑化因子の値として選択し、それ以外の場合、第2所定値を第1平滑化因子の値として選択する。
一実施例では、以下の式によって前記M個のエネルギー平滑化比の値に対して第2平滑化処理を行う。
ratio_long_sm(n+1,k)=β*ratio_long_sm(n,k)+(1-β)*ratio_short_sm(n+1,k)
(ただし、βは第2平滑化因子であり、前記ratio_long_sm(n+1,k)は前記ratio_short_sm(n+1,k)に対して第2平滑化処理を行って得た第2サブエネルギー平滑化比の値であり、前記ratio_short_sm(n+1,k)は前記ratio(n+1,k)に対して第1平滑化処理を行って得た第1サブエネルギー平滑化比の値であり、前記ratio(n+1,k)はk番目のサブバンドにおける第n+1フレームの誤差サブ信号の第1エネルギーとk番目のサブバンドにおける第n+1フレームのフィルタリングサブ信号の第2エネルギーとのサブエネルギー比であり、前記ratio_long_sm(n,k)は前記ratio_short_sm(n,k)に対して第2平滑化処理を行って得た第1サブエネルギー平滑化比の値であり、ratio_short_sm(n,k)は前記ratio(n,k)に対して第1平滑化処理を行って得た第1サブエネルギー平滑化比の値であり、ratio(n,k)はk番目のサブバンドにおける第nフレームの誤差サブ信号の第1エネルギーとk番目のサブバンドにおける第nフレームのフィルタリングサブ信号の第2エネルギーとのサブエネルギー比であり、nは正の整数であり、且つn≦N−1であり、kは正の整数であり、且つk≦Mであり、ratio_long_sm(1,k)はratio_short_sm(1,k)に等しい。)
上記誤差サブ信号のフレーム順序は誤差信号における誤差サブ信号の時間順であり、上記フィルタリングサブ信号のフレーム順序はフィルタリング信号におけるフィルタリングサブ信号の時間順であり、ratio_long_sm(1,k)がratio_short_sm(1,k)に等しく、このことから理解できるように、k番目のサブバンドにおける、時間が最も早い第1フレームの誤差サブ信号の第1エネルギーとk番目のサブバンドにおける第1フレームのフィルタリングサブ信号の第2エネルギーとのサブエネルギー比については、第1平滑化処理を行った結果が、第2平滑化を行った結果と同じであり、つまり、k番目のサブバンドにおける、最も早く収集される第1フレームの誤差サブ信号の第1エネルギーとk番目のサブバンドにおける第1フレームのフィルタリングサブ信号の第2エネルギーとのサブエネルギー比については、第1平滑化処理を行った後、第2平滑化処理を行わない。上記第2平滑化処理によって、得られたM個の第2エネルギー平滑化比の値がM個の第1エネルギー平滑化値よりも安定的になり、これに基づいてダブルトーク状態検出を行うことで、検出精度を向上させる。一例として、0≦β≦1であり、たとえば、βは0.99であってもよい。また、β>αである。
一実施例では、M個のエネルギー比の値の信号対雑音比及び所定閾値に基づいてダブルトーク状態検出を行い、入力信号の状態を決定するステップは、
M個のエネルギー比の値の信号対雑音比のうちのI(Iは正の整数で、且つI≦Mである)個のエネルギー比の値の信号対雑音比の合計を計算するステップと、
合計が所定閾値よりも大きい場合、入力信号がダブルトーク状態であると決定し、又は、合計が所定閾値以下の場合、入力信号がシングルトーク状態であると決定するステップと、を含む。
エネルギー比の値はサブバンドに1対1で対応し、サブバンドは1つのサブ周波数範囲に対応し、一例として、上記I個のエネルギー比の値はM個のエネルギー比の値のうち対応するサブバンドのサブ周波数範囲が第1周波数範囲に属するエネルギー比の値であってもよく、たとえば、周波数帯域を3000Hzと予め設定し、分割されたM個のサブバンドについて、近端音声信号のエネルギーが主に低周波帯域(2000Hz以下)にあるため、第1周波数範囲が0〜2000Hzであってもよい。又は、電子機器のマイクロフォンによって受信された入力信号の周波数分布に応じて第1周波数範囲を選択してもよく、たとえば、マイクロフォンによって収集された入力信号のうち信号対雑音比が大きい(たとえば、所定閾値よりも大きい)周波数帯域を第1周波数範囲とする。本実施例では、M個のエネルギー比の値のうち対応するサブバンドのサブ周波数範囲が第1所定範囲内にあるエネルギー比の値(即ち、I個のエネルギー比の値)の信号対雑音比の合計でダブルトーク状態検出を行う。このようにして、計算量を減少させるだけでなく、検出精度を向上させることができる。
一実施例では、入力信号はNフレームの入力サブ信号を含み、入力サブ信号は誤差信号に1対1で対応しており、フレーミング処理の場合、上記合計は各フレームの誤差サブ信号(又は各フレームのフィルタリングサブ信号)におけるM個のエネルギー比の値の信号対雑音比のうちI個のエネルギー比の値の信号対雑音比の和を含んでもよく、即ち、合計はN個の信号対雑音比の和を含み、したがって、前記合計が前記所定閾値よりも大きい場合、前記入力信号がダブルトーク状態であると決定するステップは、前記N個の信号対雑音比の和のうち所定閾値よりも大きい第1ターゲット信号対雑音比に対応する第1ターゲットフレームの入力サブ信号(入力信号の入力サブ信号に属する)がダブルトーク状態であると決定し、前記N個の信号対雑音比の和のうち所定閾値以下の第2ターゲット信号対雑音比に対応する第2ターゲットフレームの入力サブ信号(入力信号の入力サブ信号に属する)がシングルトーク状態であると決定するステップを含む。
以下、具体的な実施例をもって上記ダブルトーク状態検出方法の過程を詳細に説明する。
図3に示すように、AECアルゴリズムの回路図であり、AECアルゴリズムでは、遠端信号をよりよく除去するとともに、近端音声信号sを保護するために、通常、ダブルトーク検出モジュールが備えられる。ダブルトーク検出モジュールは入力信号yの状態、即ち、近端状態、シングルトーク状態及びダブルトーク状態を検出する。近端状態とは、近端話者の近端音声信号のみがあることを意味し、シングルトーク状態とは、遠端信号のみがあることを意味し、ダブルトーク状態とは、近端話者の近端音声信号も遠端信号もあることを意味する。入力信号の状態を識別して初めて、後続の処理では状態に応じて処理を行うことができ、たとえば、近端状態では、音響エコーキャンセルが不要であり、ダブルトーク状態では、音響エコーキャンセルの等級が低く、シングルトーク状態では、音響エコーキャンセルの等級が高まり、それによって、遠端信号のみがある場合、できるだけ除去し、近端信号がある場合、音声信号の歪みを低減させる。
図3に示すように、AECアルゴリズムを実現する回路図は線形フィルタ、ダブルトーク検出モジュール及び非線形処理モジュールを含み、また、マイクロフォンと差分回路との間には、入力信号をサブバンド分解する第1サブバンド変換モジュールがさらに接続され、且つ、基準信号xと線形フィルタとの間には、基準信号をサブバンド分解する第2サブバンド変換モジュールがさらに接続されている。線形フィルタモジュールが基準信号を線形フィルタリングした後、マイクロフォンの入力信号yとフィルタリング信号
Figure 2021131536
を差分回路で差分処理して誤差信号eを得て、マイクロフォンによって受信された入力信号のうち遠端信号の大部分が除去されたが、近端音声信号が保持され、非線形処理モジュールは誤差信号eに対してさらなる音響エコーキャンセルを行う。このとき、各サブバンドにおいて誤差信号とフィルタリング信号とのエネルギー比の値ratio(n,k)をそれぞれ計算する。ここで、
Figure 2021131536
(E(n,k)はk番目のサブバンドにおける誤差信号のうちの第nフレームの誤差サブ信号の周波数領域信号であり、|E(n,k)|2はk番目のサブバンドにおける誤差信号のうちの第nフレームの誤差サブ信号の第1エネルギーであり、X(n,k)はk番目のサブバンドにおけるフィルタリング信号のうちの第nフレームのフィルタリングサブ信号の周波数領域信号であり、|X(n,k)|2はk番目のサブバンドにおけるフィルタリング信号のうちの第nフレームのフィルタリングサブ信号の第2エネルギーである。)である。
近端音声信号がある場合、ratio(n,k)が大きく、遠端信号のみがある場合、ratio(n,k)が小さく、該ratio(n,k)を直接利用して状態判定を行う場合、基準信号のエネルギーが異なると、判定閾値は統一し難く、且ついくつかのサブバンドにおける異常点が最終的な判定結果に影響を与えやすい。
基準信号の信号対雑音比が大きい場合、ratio(n,k)に対して短時間平滑化(即ち、第1平滑化処理)及び長時間平滑化(第2平滑化処理)を行い、基準信号の信号対雑音比が大きいことを求めるのは、基準信号の信号対雑音比が低い場合、雑音信号の存在によってratio(n,k)が大きすぎて判定結果に悪影響を与えることを防止するためである。
本実施例では、上記ダブルトーク状態検出方法の過程は以下の通りである。
M個のサブバンドにおける誤差信号のM個の第1エネルギー及びM個のサブバンドにおけるフィルタリング信号のM個の第2エネルギーを計算する。
サブエネルギー比ratio(n,k)を計算し、ここで、nは1、2、…、N−1であり、kは1、2、…、Mであり、
ratio(n,k)に対して短時間平滑化を行い、ratio_short_sm(n,k)を得る。
ratio_short_sm(n,k)に対して長時間平滑化を行い、ratio_long_sm(n,k)を得る。
最小値追跡アルゴリズムによってratio_short_sm(n,k)の雑音ratio_long_min(n,k)を追跡する。
ratio(n,k)の信号対雑音比ratio_snr(n,k)を計算し、ここで、
Figure 2021131536
である。
サブバンドのサブ周波数範囲が第1所定周波数範囲であるratio_snr(n,k)を合計し、即ち、
Figure 2021131536
であり、
式中、k1、k2のそれぞれに対応するサブ周波数範囲が第1所定周波数範囲内にあり、k1は正の整数であり、且つk1≦Mであり、k2は正の整数であり、且つk2≦Mであり、k1≦k2であり、RATIO_SNRは第nフレームの誤差信号におけるk2−k1+1個のエネルギー比の値の信号対雑音比の和であり、また、第nフレームの入力サブ信号におけるk2−k1+1個のエネルギー比の値の信号対雑音比の和であり、即ち、Iはk2−k1+1であるようにしてもよい。
RATIO_SNRを判定閾値(即ち、所定閾値)Tと比較し、RATIO_SNR>Tであると、ダブルトーク状態であると判断し、RATIO_SNR>Tではないと、シングルトーク状態であると判断する。
最終的に判定閾値と比較するのが誤差信号とフィルタリング信号(基準信号に対応する)とのエネルギー比の値の信号対雑音比であるため、ダブルトーク状態検出の適応調整を実現することができ、誤差信号とフィルタリング信号とのエネルギーの大きさにかかわらず、その信号対雑音比が常に同一レベルに維持でき、即ち、近端音声が存在する場合、信号対雑音比が高く、それ以外の場合、信号対雑音比が低い。また、低周波帯域を選択する(又は実際の機器に応じてほかの周波数帯域を選択する)ことによっても、いくつかの周波数における異常点による影響を回避し、それによってダブルトークの検出精度をさらに向上させることができる。
図4に示すように、本願は一実施例に係るダブルトーク状態検出装置400を提供し、装置は、
M個のサブバンドのそれぞれにおける誤差信号の第1エネルギーと同サブバンドにおけるフィルタリング信号の第2エネルギーとのエネルギー比の値を計算し、M個のエネルギー比の値を得るための第1計算モジュール401であって、誤差信号はマイクロフォンによって収集された入力信号とフィルタリング信号との差であり、フィルタリング信号は基準信号をフィルタリング処理した信号であり、Mは正の整数である第1計算モジュール401と、
M個のエネルギー比の値に対して第1平滑化処理を行い、M個の第1エネルギー平滑化比の値を得て、M個のエネルギー平滑化比の値に対して第2平滑化処理を行い、M個の第2エネルギー平滑化比の値を得るための平滑化モジュール402と、
M個の第1エネルギー平滑化比の値及びM個の第2エネルギー平滑化比の値に基づいてダブルトーク状態検出を行い、入力信号の状態を決定するための状態検出モジュール403と、を含む。
一実施例では、状態検出モジュールは、
M個の第2エネルギー平滑化比の値に基づいて、M個の第2エネルギー平滑化比の値の雑音を予測するための雑音予測モジュールと、
M個の第1エネルギー平滑化比の値及びM個の第2エネルギー平滑化比の値の雑音に基づいて、M個のエネルギー比の値の信号対雑音比を得るための信号対雑音比取得モジュールと、
M個のエネルギー比の値の信号対雑音比及び所定閾値に基づいてダブルトーク状態検出を行い、入力信号の状態を決定するための状態決定モジュールと、を含む。
一実施例では、フィルタリング信号はNフレームのフィルタリングサブ信号を含み、誤差信号はNフレームの誤差サブ信号を含み、Nは正の整数であり、
ターゲットサブバンドにおけるエネルギー比の値はターゲットサブバンドにおけるN個のサブエネルギー比を含み、ターゲットサブバンドにおけるN個のサブエネルギー比はターゲットサブバンドにおける各フレームの誤差サブ信号の第1エネルギーとターゲットサブバンドにおける対応するフレームのフィルタリングサブ信号の第2エネルギーとのエネルギー比を含み、ターゲットサブバンドにおける第1エネルギー平滑化比の値はN個のサブエネルギー比に対して第1平滑化処理を行って得たN個の第1サブエネルギー平滑化比の値を含み、ターゲットサブバンドにおける第2エネルギー平滑化比の値はN個の第1サブエネルギー平滑化比の値に対して第2平滑化処理を行って得たN個の第2サブエネルギー平滑化比の値を含み、ターゲットサブバンドはM個のサブバンドのうちのいずれかのサブバンドである。
一実施例では、平滑化モジュールは以下の式によってM個のエネルギー比の値に対して第1平滑化処理を行う。
ratio_short_sm(n+1,k)=α*ratio_short_sm(n,k)+(1-α)*ratio(n+1,k)
(ただし、αは第1平滑化因子であり、前記ratio(n+1,k)はk番目のサブバンドにおける第n+1フレームの誤差サブ信号の第1エネルギーとk番目のサブバンドにおける第n+1フレームのフィルタリングサブ信号の第2エネルギーとのサブエネルギー比であり、前記ratio_short_sm(n+1,k)は前記ratio(n+1,k)に対して第1平滑化処理を行って得た第1サブエネルギー平滑化比の値であり、ratio_short_sm(n,k)は前記ratio(n,k)に対して第1平滑化処理を行って得た第1サブエネルギー平滑化比の値であり、ratio(n,k)はk番目のサブバンドにおける第nフレームの誤差サブ信号の第1エネルギーとk番目のサブバンドにおける第nフレームのフィルタリングサブ信号の第2エネルギーとのサブエネルギー比であり、nは正の整数であり、且つn≦N−1であり、kは正の整数であり、且つk≦Mであり、ratio_short_sm(1,k)はratio(1,k)に等しく、ratio(1,k)はk番目のサブバンドにおける第1フレームの誤差サブ信号の第1エネルギーとk番目のサブバンドにおける第1フレームのフィルタリングサブ信号の第2エネルギーとのサブエネルギー比である。)
一実施例では、平滑化モジュールは以下の式によってM個のエネルギー平滑化比の値に対して第2平滑化処理を行う。
ratio_long_sm(n+1,k)=β*ratio_long_sm(n,k)+(1-β)*ratio_short_sm(n+1,k)
(ただし、βは第2平滑化因子であり、前記ratio_long_sm(n+1,k)は前記ratio_short_sm(n+1,k)に対して第2平滑化処理を行って得た第2サブエネルギー平滑化比の値であり、前記ratio_short_sm(n+1,k)は前記ratio(n+1,k)に対して第1平滑化処理を行って得た第1サブエネルギー平滑化比の値であり、前記ratio(n+1,k)はk番目のサブバンドにおける第n+1フレームの誤差サブ信号の第1エネルギーとk番目のサブバンドにおける第n+1フレームのフィルタリングサブ信号の第2エネルギーとのサブエネルギー比であり、前記ratio_long_sm(n,k)は前記ratio_short_sm(n,k)に対して第2平滑化処理を行って得た第1サブエネルギー平滑化比の値であり、ratio_short_sm(n,k)は前記ratio(n,k)に対して第1平滑化処理を行って得た第1サブエネルギー平滑化比の値であり、ratio(n,k)はk番目のサブバンドにおける第nフレームの誤差サブ信号の第1エネルギーとk番目のサブバンドにおける第nフレームのフィルタリングサブ信号の第2エネルギーとのサブエネルギー比であり、nは正の整数であり、且つn≦N−1であり、kは正の整数であり、且つk≦Mであり、ratio_long_sm(1,k)はratio_short_sm(1,k)に等しい。)
一実施例では、状態決定モジュールは、入力信号の状態を決定し、
M個のエネルギー比の値の信号対雑音比のうちのI(Iは正の整数で、且つI≦Mである)個のエネルギー比の値信号対雑音比の合計を計算するための合計モジュールを含み、
合計が所定閾値よりも大きい場合、入力信号がダブルトーク状態であると決定し、又は、合計が所定閾値以下の場合、入力信号がシングルトーク状態であると決定する。
上記各実施例に係るダブルトーク状態検出装置は、上記各実施例に係るダブルトーク状態検出方法を実現する装置であり、技術的特徴が対応し、技術的効果が対応し、ここでは詳しく説明しない。
本願の実施例によれば、本願は、電子機器及び読み取り可能な記憶媒体をさらに提供する。
図5に示すように、本願の実施例に係るダブルトーク状態検出方法の電子機器のブロック図である。電子機器は、たとえば、ラップトップコンピュータ、デスクトップコンピュータ、ワークステーション、パーソナルデジタルアシスタント、サーバ、ブレードサーバ、メインフレームコンピュータ、及びその他の適切なコンピュータなど、様々な形式のデジタルコンピュータを指すことを意図している。電子機器は、たとえば、パーソナルデジタルアシスタント、携帯電話、スマートフォン、ウェアラブルデバイス、及びその他の類似のコンピュータ装置など、様々な形式の移動装置を示してもよい。本明細書に示されているコンポーネント、それらの接続と関係、及びそれらの機能は単なる例であるが、本明細書の説明及び/又は要求される本願の実現を制限する意図はしない。
図5に示すように、この電子機器は、1つ又は複数のプロセッサ501、メモリ502、及び高速インターフェースと低速インターフェースを含む、様々なコンポーネントを接続するためのインターフェースを含む。各コンポーネントは、異なるバスを介して互いに接続され、共通のマザーボードに取り付けられ、又は必要に応じて他の方式で取り付けられ得る。プロセッサは電子機器内で実行される命令を処理でき、この命令には、メモリ内に格納される又はメモリ上に格納されて外部入力/出力装置(たとえば、インターフェースに結合された表示機器など)にGUIのグラフィック情報を表示する命令が含まれる。他の実施形態では、複数のプロセッサ及び/又は複数のバスを、必要に応じて、複数のメモリ及び複数のメモリとともに使用することができる。同様に、複数の電子機器を接続することができ、各機器は必要な操作の一部(たとえば、サーバアレイ、ブレードサーバのグループ、又はマルチプロセッサシステムとして)を提供する。図5では、1つのプロセッサ501の場合が例示されている。
メモリ502は、本願に係る非一時的なコンピュータ読み取り可能な記憶媒体である。前記メモリは、本願に係るダブルターク状態検出方法を前記少なくとも1つの前記プロセッサに実行させるように、少なくとも1つのプロセッサによって実行可能な命令を格納している。本願の非一時的なコンピュータ読み取り可能な記憶媒体は、本願に係るダブルターク状態検出方法をコンピュータに実行させるためのコンピュータ命令を格納している。
非一時的なコンピュータ読み取り可能な記憶媒体としてのメモリ502は、非一時的なソフトウェアプログラム、非一時的なコンピュータ実行可能なプログラム及びモジュール、たとえば、本願の実施例におけるダブルターク状態検出方法に対応するプログラム命令/モジュール(たとえば、図4に示される第1計算モジュール401、平滑化モジュール402、状態検出モジュール403)を格納することができる。プロセッサ501は、メモリ502に格納された非一時的なソフトウェアプログラム、命令、及びモジュールを実行することによって、サーバの様々な機能アプリケーション及びデータ処理を実行し、すなわち、上記方法実施例におけるダブルターク状態検出方法を実現する。
メモリ502は、プログラム記憶領域及びデータ記憶領域を含むことができ、プログラム記憶領域は、オペレーティングシステム、及び少なくとも1つの機能に必要なアプリケーションプログラムを格納し、データ記憶領域は、キーボード表示に基づく電子機器の使用にしたがって作成されたデータなどを格納する。さらに、メモリ502は、高速ランダムアクセスメモリを含み、さらに、たとえば、少なくとも1つの磁気ディスクストレージデバイス、フラッシュメモリデバイス、又は他の非一時的なソリッドステートストレージデバイスなどの非一時的なメモリを含んでもよい。いくつかの実施例では、メモリ502は、プロセッサ501に対して遠隔的に設置されるメモリを選択的に含んでもよく、これらの遠隔メモリは、ネットワークを介してキーボードに表示された電子機器に接続され得る。上記ネットワークの例には、インターネット、企業イントラネット、ローカルエリアネットワーク、モバイル通信ネットワーク、及びそれらの組み合わせが含まれるが、これらに限定されない。
ダブルトーク状態検出方法の電子機器は、入力装置503及び出力装置504をさらに含んでもよい。プロセッサ501、メモリ502、入力装置503及び出力装置504はバス又はその他の方式で接続してもよく、図5には、バスによる接続が例示されている。
入力装置503は、入力される数字又はキャラクター情報を受信すること、キーボードに表示された電子機器、たとえば、タッチスクリーン、キーパッド、マウス、トラックパッド、タッチパッド、ポインタ、1つ又は複数のマウスボタン、トラックボール、ジョイスティックなどの入力装置のユーザ設定及び機能制御に関連するキー信号入力を生成することができる。出力装置504は、表示機器、補助照明装置(たとえば、LED)、触覚フィードバック装置(たとえば、振動モータ)などを含む。この表示機器は、液晶ディスプレイ(LDC)、発光ダイオード(LED)ディスプレイ、及びプラズマディスプレイを含むが、これらに限定されない。いくつかの実施形態では、表示機器はタッチスクリーンであり得る。
ここで説明するシステム及び技術の様々な実施形態は、デジタル電子回路システム、集積回路システム、専用ASIC(特定用途向け集積回路)、コンピュータハードウェア、ファームウェア、ソフトウェア、及び/又はそれらの組み合わせにおいて実現することができる。これらの様々な実施形態は、1つ又は複数のコンピュータプログラムにおいて実施され、この1つ又は複数のコンピュータプログラムは、少なくとも1つのプログラム可能なプロセッサを含むプログラム可能なシステムで実行及び/又は解釈され得、このプログラム可能なプロセッサは専用又は汎用のプログラム可能なプロセッサであってもよく、ストレージシステム、少なくとも1つの入力装置、及び少なくとも1つの出力装置からデータ及び命令を受信し、データ及び命令をこのストレージシステム、少なくとも1つの入力装置、及び少なくとも1つの出力装置に送信することができる。
これらのコンピュータプログラム(プログラム、ソフトウェア、ソフトウェアアプリケーション、又はコードとも呼ばれる)には、プログラム可能なプロセッサの機械命令が含まれ、プロセス及び/又はオブジェクト指向のプログラミング言語、及び/又はアセンブリ/機械語を用いてこれらのコンピュータプログラムを実施できる。たとえば、本明細書で使用される「機械読み取り可能な媒体」及び「コンピュータ読み取り可能な媒体」という用語は、機械命令及び/又はデータをプログラム可能なプロセッサの任意のコンピュータプログラム製品、機器、及び/又は装置(たとえば、磁気ディスク、光ディスク、メモリ、プログラマブルロジック機器(PLD))に提供するものを指し、機械読み取り可能な信号としての機械命令を受信するための機械読み取り可能な媒体を含む。「機械読み取り可能な信号」という用語は、プログラム可能なプロセッサに機械命令及び/又はデータを提供するために使用される任意の信号を指す。
ユーザと対話できるように、ここで説明するシステム及び技術をコンピュータに実施することができ、このコンピュータは、ユーザに情報を表示するための表示装置(たとえば、CRT(陰極線管)又はLCD(液晶ディスプレイ)モニター)、ユーザがコンピュータに入力することを可能とするキーボード及びポインティング装置(たとえば、マウスやトラックボール)を有する。他の種類の装置も、ユーザとの対話を提供することができ、たとえば、ユーザに提供するフィードバックは、任意の形式の感覚フィードバック(たとえば、視覚的フィードバック、聴覚的フィードバック、又は触覚的フィードバック)であってもよく、そして、ユーザからの入力は、任意の形式(音響入力、音声入力、又は触覚入力を含む)で受信できる。
ここで説明するシステム及び技術は、バックエンドコンポーネントを含むコンピュータシステム(たとえば、データサーバとして)、又はミドルウェアコンポーネントを含むコンピュータシステム(たとえば、アプリケーションサーバ)、又はフロントエンドコンポーネントを含むコンピュータシステム(たとえば、グラフィカルユーザインターフェース又はWEBブラウザーを備えたユーザコンピュータが挙げられ、ユーザはこのグラフィカルユーザインターフェース又はこのWEBブラウザーを介してここで説明するシステム及び技術の実施形態と対話できる)、又はこのようなバックエンドコンポーネント、ミドルウェアコンポーネント、又はフロントエンドコンポーネントを含む任意の組み合わせコンピュータシステムにおいて実施できる。システムのコンポーネントは、任意の形式又は媒体のデジタルデータ通信(たとえば、通信ネットワーク)を介して相互に接続できる。通信ネットワークの例には、ローカルエリアネットワーク(LAN)、ワイドエリアネットワーク(WAN)、及びインターネットが含まれる。
コンピュータシステムには、クライアントとサーバを含むことができる。クライアントとサーバは通常、互いに遠く離れており、通信ネットワークを介して互いに会話するのが一般的である。クライアントとサーバの関係は、対応するコンピュータで実行され、互いにクライアント−サーバの関係を持つコンピュータプログラムによって生成される。
本願の実施例の技術案によれば、本願の実施例に係るダブルトーク状態検出方法では、M個のサブバンドのそれぞれにおける誤差信号の第1エネルギーと同サブバンドにおけるフィルタリング信号の第2エネルギーとのエネルギー比の値に対して第1平滑化処理を行うことで、得られるM個の第1エネルギー平滑化比の値をさらに安定化させ、それにより、いくつかのサブバンドにおける誤差信号の異常に起因するM個のエネルギー比の値のうちの異常エネルギー比の値の、状態検出の精度に対する影響を低減させ、そして、第1平滑化処理を行われたM個の第1エネルギー平滑化比の値に対して第2平滑化処理を行うことで、得られるM個の第2エネルギー平滑化比の値をさらに安定化させ、それにより、M個の第1エネルギー平滑化比の値のうちのいくつかの異常比の値の、状態検出の精度に対する影響を低減させることができ、したがって、前記M個の第1エネルギー平滑化比の値及び前記M個の第2エネルギー平滑化比の値に基づいてダブルトーク状態検出を行うことで、状態検出の精度を向上させることができる。
なお、上記の様々な形式のプロセスを用いて、ステップを改めて並べ替えたり、追加したり、削除したりすることができる。たとえば、本願に記載の各ステップは、本願開示の技術案の所望の結果が達成できる限り、並行して実施しても、順次実施しても、異なる順序で実施してもよく、本明細書では、それについて限定しない。
上記特定実施形態は、本願の特許範囲に対する制限を構成するものではない。当業者にとって明らかなように、設計要件及び他の要因に応じて、様々な修正、組み合わせ、サブ組み合わせ、及び置換を行うことができる。本願の精神及び原則の範囲内で行われた修正、同等の置換、及び改良であれば、本願の特許範囲に含まれるものとする。

Claims (15)

  1. M個のサブバンドのそれぞれにおける誤差信号の第1エネルギーと同サブバンドにおけるフィルタリング信号の第2エネルギーとのエネルギー比の値を計算し、M個のエネルギー比の値を得することであって、前記誤差信号はマイクロフォンによって収集された入力信号とフィルタリング信号との差であり、前記フィルタリング信号は基準信号をフィルタリング処理した信号であり、Mは正の整数であることと、
    前記M個のエネルギー比の値に対して第1平滑化処理を行い、M個の第1エネルギー平滑化比の値を得て、前記M個のエネルギー平滑化比の値に対して第2平滑化処理を行い、M個の第2エネルギー平滑化比の値を得ることと、
    前記M個の第1エネルギー平滑化比の値及び前記M個の第2エネルギー平滑化比の値に基づいてダブルトーク状態検出を行い、前記入力信号の状態を決定することと、を含む、ことを特徴とするダブルトーク状態検出方法。
  2. 前記の前記M個の第1エネルギー平滑化比の値及び前記M個の第2エネルギー平滑化比の値に基づいてダブルトーク状態検出を行い、前記入力信号の状態を決定することは、
    前記M個の第2エネルギー平滑化比の値に基づいて、前記M個の第2エネルギー平滑化比の値の雑音を予測することと、
    前記M個の第1エネルギー平滑化比の値及び前記M個の第2エネルギー平滑化比の値の雑音に基づいて、前記M個のエネルギー比の値の信号対雑音比を得ることと、
    前記M個のエネルギー比の値の信号対雑音比及び所定閾値に基づいてダブルトーク状態検出を行い、前記入力信号の状態を決定することと、を含む、ことを特徴とする請求項1に記載の方法。
  3. 前記フィルタリング信号はNフレームのフィルタリングサブ信号を含み、前記誤差信号はNフレームの誤差サブ信号を含み、Nは正の整数であり、
    ターゲットサブバンドにおける前記エネルギー比の値は前記ターゲットサブバンドにおけるN個のサブエネルギー比を含み、前記ターゲットサブバンドにおけるN個のサブエネルギー比は前記ターゲットサブバンドにおける各フレームの誤差サブ信号の第1エネルギーと前記ターゲットサブバンドにおける対応するフレームのフィルタリングサブ信号の第2エネルギーとのエネルギー比を含み、前記ターゲットサブバンドにおける前記第1エネルギー平滑化比の値は前記N個のサブエネルギー比に対して前記第1平滑化処理を行って得たN個の第1サブエネルギー平滑化比の値を含み、前記ターゲットサブバンドにおける前記第2エネルギー平滑化比の値は前記N個の第1サブエネルギー平滑化比の値に対して前記第2平滑化処理を行って得たN個の第2サブエネルギー平滑化比の値を含み、前記ターゲットサブバンドは前記M個のサブバンドのうちのいずれかのサブバンドである、ことを特徴とする請求項1に記載の方法。
  4. 以下の式によって前記M個のエネルギー比の値に対して第1平滑化処理を行う、ことを特徴とする請求項3に記載の方法。
    ratio_short_sm(n+1,k)=α*ratio_short_sm(n,k)+(1-α)*ratio(n+1,k)
    (ただし、αは第1平滑化因子であり、前記ratio(n+1,k)はk番目のサブバンドにおける第n+1フレームの誤差サブ信号の第1エネルギーとk番目のサブバンドにおける第n+1フレームのフィルタリングサブ信号の第2エネルギーとのサブエネルギー比であり、前記ratio_short_sm(n+1,k)は前記ratio(n+1,k)に対して第1平滑化処理を行って得た第1サブエネルギー平滑化比の値であり、ratio_short_sm(n,k)は前記ratio(n,k)に対して第1平滑化処理を行って得た第1サブエネルギー平滑化比の値であり、ratio(n,k)はk番目のサブバンドにおける第nフレームの誤差サブ信号の第1エネルギーとk番目のサブバンドにおける第nフレームのフィルタリングサブ信号の第2エネルギーとのサブエネルギー比であり、nは正の整数であり、且つn≦N−1であり、kは正の整数であり、且つk≦Mであり、ratio_short_sm(1,k)はratio(1,k)に等しく、ratio(1,k)はk番目のサブバンドにおける第1フレームの誤差サブ信号の第1エネルギーとk番目のサブバンドにおける第1フレームのフィルタリングサブ信号の第2エネルギーとのサブエネルギー比である。)
  5. 以下の式によって前記M個のエネルギー平滑化比の値に対して第2平滑化処理を行う、ことを特徴とする請求項3に記載の方法。
    ratio_long_sm(n+1,k)=β*ratio_long_sm(n,k)+(1-β)*ratio_short_sm(n+1,k)
    (ただし、βは第2平滑化因子であり、前記ratio_long_sm(n+1,k)は前記ratio_short_sm(n+1,k)に対して第2平滑化処理を行って得た第2サブエネルギー平滑化比の値であり、前記ratio_short_sm(n+1,k)は前記ratio(n+1,k)に対して第1平滑化処理を行って得た第1サブエネルギー平滑化比の値であり、前記ratio(n+1,k)はk番目のサブバンドにおける第n+1フレームの誤差サブ信号の第1エネルギーとk番目のサブバンドにおける第n+1フレームのフィルタリングサブ信号の第2エネルギーとのサブエネルギー比であり、前記ratio_long_sm(n,k)は前記ratio_short_sm(n,k)に対して第2平滑化処理を行って得た第1サブエネルギー平滑化比の値であり、ratio_short_sm(n,k)は前記ratio(n,k)に対して第1平滑化処理を行って得た第1サブエネルギー平滑化比の値であり、ratio(n,k)はk番目のサブバンドにおける第nフレームの誤差サブ信号の第1エネルギーとk番目のサブバンドにおける第nフレームのフィルタリングサブ信号の第2エネルギーとのサブエネルギー比であり、nは正の整数であり、且つn≦N−1であり、kは正の整数であり、且つk≦Mであり、ratio_long_sm(1,k)はratio_short_sm(1,k)に等しい。)
  6. 前記の前記M個のエネルギー比の値の信号対雑音比及び所定閾値に基づいてダブルトーク状態検出を行い、前記入力信号の状態を決定することは、
    前記M個のエネルギー比の値の信号対雑音比のうちのI(Iは正の整数で、且つI≦Mである)個のエネルギー比の値の信号対雑音比の合計を計算することと、
    前記合計が前記所定閾値よりも大きい場合、前記入力信号がダブルトーク状態であると決定し、又は、前記合計が前記所定閾値以下の場合、前記入力信号がシングルトーク状態であると決定することと、を含む、ことを特徴とする請求項2に記載の方法。
  7. M個のサブバンドのそれぞれにおける誤差信号の第1エネルギーと同サブバンドにおけるフィルタリング信号の第2エネルギーとのエネルギー比の値を計算し、M個のエネルギー比の値を得るための第1計算モジュールであって、前記誤差信号はマイクロフォンによって収集された入力信号とフィルタリング信号との差であり、前記フィルタリング信号は基準信号をフィルタリング処理した信号であり、Mは正の整数である第1計算モジュールと、
    前記M個のエネルギー比の値に対して第1平滑化処理を行い、M個の第1エネルギー平滑化比の値を得て、前記M個のエネルギー平滑化比の値に対して第2平滑化処理を行い、M個の第2エネルギー平滑化比の値を得るための平滑化モジュールと、
    前記M個の第1エネルギー平滑化比の値及び前記M個の第2エネルギー平滑化比の値に基づいてダブルトーク状態検出を行い、前記入力信号の状態を決定するための状態検出モジュールと、を含む、ことを特徴とするダブルトーク状態検出装置。
  8. 前記状態検出モジュールは、
    前記M個の第2エネルギー平滑化比の値に基づいて、前記M個の第2エネルギー平滑化比の値の雑音を予測するための雑音予測モジュールと、
    前記M個の第1エネルギー平滑化比の値及び前記M個の第2エネルギー平滑化比の値の雑音に基づいて、前記M個のエネルギー比の値の信号対雑音比を得るための信号対雑音比取得モジュールと、
    前記M個のエネルギー比の値の信号対雑音比及び所定閾値に基づいてダブルトーク状態検出を行い、前記入力信号の状態を決定するための状態決定モジュールと、を含む、ことを特徴とする請求項7に記載の装置。
  9. 前記フィルタリング信号はNフレームのフィルタリングサブ信号を含み、前記誤差信号はNフレームの誤差サブ信号を含み、Nは正の整数であり、
    ターゲットサブバンドにおける前記エネルギー比の値は前記ターゲットサブバンドにおけるN個のサブエネルギー比を含み、前記ターゲットサブバンドにおけるN個のサブエネルギー比は前記ターゲットサブバンドにおける各フレームの誤差サブ信号の第1エネルギーと前記ターゲットサブバンドにおける対応するフレームのフィルタリングサブ信号の第2エネルギーとのエネルギー比を含み、前記ターゲットサブバンドにおける前記第1エネルギー平滑化比の値は前記N個のサブエネルギー比に対して前記第1平滑化処理を行って得たN個の第1サブエネルギー平滑化比の値を含み、前記ターゲットサブバンドにおける前記第2エネルギー平滑化比の値は前記N個の第1サブエネルギー平滑化比の値に対して前記第2平滑化処理を行って得たN個の第2サブエネルギー平滑化比の値を含み、前記ターゲットサブバンドは前記M個のサブバンドのうちのいずれかのサブバンドである、ことを特徴とする請求項7に記載の装置。
  10. 前記平滑化モジュールは、以下の式によって前記M個のエネルギー比の値に対して第1平滑化処理を行う、ことを特徴とする請求項9に記載の装置。
    ratio_short_sm(n+1,k)=α*ratio_short_sm(n,k)+(1-α)*ratio(n+1,k)
    (ただし、αは第1平滑化因子であり、前記ratio(n+1,k)はk番目のサブバンドにおける第n+1フレームの誤差サブ信号の第1エネルギーとk番目のサブバンドにおける第n+1フレームのフィルタリングサブ信号の第2エネルギーとのサブエネルギー比であり、前記ratio_short_sm(n+1,k)は前記ratio(n+1,k)に対して第1平滑化処理を行って得た第1サブエネルギー平滑化比の値であり、ratio_short_sm(n,k)は前記ratio(n,k)に対して第1平滑化処理を行って得た第1サブエネルギー平滑化比の値であり、ratio(n,k)はk番目のサブバンドにおける第nフレームの誤差サブ信号の第1エネルギーとk番目のサブバンドにおける第nフレームのフィルタリングサブ信号の第2エネルギーとのサブエネルギー比であり、nは正の整数であり、且つn≦N−1であり、kは正の整数であり、且つk≦Mであり、ratio_short_sm(1,k)はratio(1,k)に等しく、ratio(1,k)はk番目のサブバンドにおける第1フレームの誤差サブ信号の第1エネルギーとk番目のサブバンドにおける第1フレームのフィルタリングサブ信号の第2エネルギーとのサブエネルギー比である。)
  11. 前記平滑化モジュールは、以下の式によって前記M個のエネルギー平滑化比の値に対して第2平滑化処理を行う、ことを特徴とする請求項9に記載の装置。
    ratio_long_sm(n+1,k)=β*ratio_long_sm(n,k)+(1-β)*ratio_short_sm(n+1,k)
    (ただし、βは第2平滑化因子であり、前記ratio_long_sm(n+1,k)は前記ratio_short_sm(n+1,k)に対して第2平滑化処理を行って得た第2サブエネルギー平滑化比の値であり、前記ratio_short_sm(n+1,k)は前記ratio(n+1,k)に対して第1平滑化処理を行って得た第1サブエネルギー平滑化比の値であり、前記ratio(n+1,k)はk番目のサブバンドにおける第n+1フレームの誤差サブ信号の第1エネルギーとk番目のサブバンドにおける第n+1フレームのフィルタリングサブ信号の第2エネルギーとのサブエネルギー比であり、前記ratio_long_sm(n,k)は前記ratio_short_sm(n,k)に対して第2平滑化処理を行って得た第1サブエネルギー平滑化比の値であり、ratio_short_sm(n,k)は前記ratio(n,k)に対して第1平滑化処理を行って得た第1サブエネルギー平滑化比の値であり、ratio(n,k)はk番目のサブバンドにおける第nフレームの誤差サブ信号の第1エネルギーとk番目のサブバンドにおける第nフレームのフィルタリングサブ信号の第2エネルギーとのサブエネルギー比であり、nは正の整数であり、且つn≦N−1であり、kは正の整数であり、且つk≦Mであり、ratio_long_sm(1,k)はratio_short_sm(1,k)に等しい。)
  12. 前記状態決定モジュールは、前記入力信号の状態を決定し、
    前記M個のエネルギー比の値の信号対雑音比のうちのI(Iは正の整数で、且つI≦Mである)個のエネルギー比の値の信号対雑音比の合計を計算するための合計モジュールを含み、
    前記合計が前記所定閾値よりも大きい場合、前記入力信号がダブルトーク状態であると決定し、又は、前記合計が前記所定閾値以下の場合、前記入力信号がシングルトーク状態であると決定する、ことを特徴とする請求項8に記載の装置。
  13. 少なくとも1つのプロセッサ、及び
    前記少なくとも1つのプロセッサに通信可能に接続されたメモリを含み、
    前記少なくとも1つのプロセッサにより実行されると、請求項1〜6のいずれか1項に記載の方法を前記少なくとも1つのプロセッサに実行させる、前記少なくとも1つのプロセッサによって実行可能な命令が前記メモリに記憶されている、ことを特徴とする電子機器。
  14. コンピュータ命令が記憶されている非一時的なコンピュータ読み取り可能な記憶媒体であって、
    前記コンピュータ命令は、請求項1〜6のいずれか1項に記載の方法を前記コンピュータに実行させる、ことを特徴とする非一時的なコンピュータ読み取り可能な記憶媒体。
  15. コンピュータプログラムを含むコンピュータプログラム製品であって、
    前記コンピュータプログラムがプロセッサにより実行されると、請求項1〜6のいずれか1項に記載の方法が実現される、ことを特徴とするコンピュータプログラム製品。
JP2021019188A 2020-02-20 2021-02-09 ダブルトーク状態検出方法、装置及び電子機器 Active JP7159366B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202010105947.4A CN111161748B (zh) 2020-02-20 2020-02-20 一种双讲状态检测方法、装置以及电子设备
CN202010105947.4 2020-02-20

Publications (2)

Publication Number Publication Date
JP2021131536A true JP2021131536A (ja) 2021-09-09
JP7159366B2 JP7159366B2 (ja) 2022-10-24

Family

ID=70566015

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021019188A Active JP7159366B2 (ja) 2020-02-20 2021-02-09 ダブルトーク状態検出方法、装置及び電子機器

Country Status (5)

Country Link
US (1) US11804235B2 (ja)
EP (1) EP3869775B1 (ja)
JP (1) JP7159366B2 (ja)
KR (1) KR102523305B1 (ja)
CN (1) CN111161748B (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112292844B (zh) * 2019-05-22 2022-04-15 深圳市汇顶科技股份有限公司 双端通话检测方法、双端通话检测装置以及回声消除系统
CN111161748B (zh) * 2020-02-20 2022-09-23 百度在线网络技术(北京)有限公司 一种双讲状态检测方法、装置以及电子设备
CN112837697B (zh) * 2021-02-20 2024-05-14 北京猿力未来科技有限公司 一种回声抑制方法及装置
CN113223547B (zh) * 2021-04-30 2024-05-24 杭州网易智企科技有限公司 双讲检测方法、装置、设备和介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007110527A (ja) * 2005-10-14 2007-04-26 Matsushita Electric Works Ltd 拡声通話装置
JP2010055024A (ja) * 2008-08-29 2010-03-11 Toshiba Corp 信号補正装置
JP2012510779A (ja) * 2008-12-02 2012-05-10 クゥアルコム・インコーポレイテッド 音響的に過酷な環境におけるダブルトーク検出のためのシステム及び方法

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020103636A1 (en) * 2001-01-26 2002-08-01 Tucker Luke A. Frequency-domain post-filtering voice-activity detector
US7062040B2 (en) * 2002-09-20 2006-06-13 Agere Systems Inc. Suppression of echo signals and the like
EP1521240A1 (en) * 2003-10-01 2005-04-06 Siemens Aktiengesellschaft Speech coding method applying echo cancellation by modifying the codebook gain
US7577248B2 (en) * 2004-06-25 2009-08-18 Texas Instruments Incorporated Method and apparatus for echo cancellation, digit filter adaptation, automatic gain control and echo suppression utilizing block least mean squares
US20060018460A1 (en) * 2004-06-25 2006-01-26 Mccree Alan V Acoustic echo devices and methods
US7778408B2 (en) * 2004-12-30 2010-08-17 Texas Instruments Incorporated Method and apparatus for acoustic echo cancellation utilizing dual filters
US7764783B1 (en) * 2005-08-15 2010-07-27 Fortemedia, Inc. Acoustic echo cancellation with oversampling
US8081753B2 (en) * 2007-04-02 2011-12-20 Microsoft Corporation Hybrid echo canceller controllers
GB2449720A (en) * 2007-05-31 2008-12-03 Zarlink Semiconductor Inc Detecting double talk conditions in a hands free communication system
WO2009028023A1 (ja) * 2007-08-24 2009-03-05 Fujitsu Limited エコー抑制装置、エコー抑制システム、エコー抑制方法及びコンピュータプログラム
US8175871B2 (en) * 2007-09-28 2012-05-08 Qualcomm Incorporated Apparatus and method of noise and echo reduction in multiple microphone audio systems
GB2456400B (en) * 2008-01-21 2012-12-26 Skype Reducing echo in a signal to be transmitted in a communication system
US8472616B1 (en) * 2009-04-02 2013-06-25 Audience, Inc. Self calibration of envelope-based acoustic echo cancellation
CN103325379A (zh) * 2012-03-23 2013-09-25 杜比实验室特许公司 用于声学回声控制的方法与装置
US9088336B2 (en) * 2012-09-06 2015-07-21 Imagination Technologies Limited Systems and methods of echo and noise cancellation in voice communication
US8934622B2 (en) * 2012-10-01 2015-01-13 Via Telecom Co., Ltd. Method for detecting double-talk condition and system using the same
CN104050971A (zh) * 2013-03-15 2014-09-17 杜比实验室特许公司 声学回声减轻装置和方法、音频处理装置和语音通信终端
CN105957520B (zh) * 2016-07-04 2019-10-11 北京邮电大学 一种适用于回声消除系统的语音状态检测方法
CN109256145B (zh) 2017-07-14 2021-11-02 北京搜狗科技发展有限公司 基于终端的音频处理方法、装置、终端和可读存储介质
US10863269B2 (en) * 2017-10-03 2020-12-08 Bose Corporation Spatial double-talk detector
CN107742522B (zh) * 2017-10-23 2022-01-14 科大讯飞股份有限公司 基于麦克风阵列的目标语音获取方法及装置
US10115411B1 (en) * 2017-11-27 2018-10-30 Amazon Technologies, Inc. Methods for suppressing residual echo
CN108172233B (zh) * 2017-12-12 2019-08-13 天格科技(杭州)有限公司 基于远端估计信号和误差信号回归因子的回声消除方法
CN108806713B (zh) 2018-05-22 2020-06-16 出门问问信息科技有限公司 一种双讲状态检测方法及装置
US10937441B1 (en) * 2019-01-04 2021-03-02 Amazon Technologies, Inc. Beam level based adaptive target selection
CN112292844B (zh) * 2019-05-22 2022-04-15 深圳市汇顶科技股份有限公司 双端通话检测方法、双端通话检测装置以及回声消除系统
CN110634496B (zh) * 2019-10-22 2021-12-24 广州视源电子科技股份有限公司 一种双讲检测方法、装置、计算机设备和存储介质
CN111161748B (zh) * 2020-02-20 2022-09-23 百度在线网络技术(北京)有限公司 一种双讲状态检测方法、装置以及电子设备

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007110527A (ja) * 2005-10-14 2007-04-26 Matsushita Electric Works Ltd 拡声通話装置
JP2010055024A (ja) * 2008-08-29 2010-03-11 Toshiba Corp 信号補正装置
JP2012510779A (ja) * 2008-12-02 2012-05-10 クゥアルコム・インコーポレイテッド 音響的に過酷な環境におけるダブルトーク検出のためのシステム及び方法

Also Published As

Publication number Publication date
CN111161748A (zh) 2020-05-15
KR102523305B1 (ko) 2023-04-19
EP3869775A1 (en) 2021-08-25
JP7159366B2 (ja) 2022-10-24
US11804235B2 (en) 2023-10-31
US20210264935A1 (en) 2021-08-26
EP3869775B1 (en) 2022-12-21
CN111161748B (zh) 2022-09-23
KR20210106905A (ko) 2021-08-31

Similar Documents

Publication Publication Date Title
JP2021131536A (ja) ダブルトーク状態検出方法、装置及び電子機器
CN110199351B (zh) 混合后回声消除系统及方法
EP2973557B1 (en) Acoustic echo mitigation apparatus and method, audio processing apparatus and voice communication terminal
CN109087663B (zh) 信号处理器
US11349525B2 (en) Double talk detection method, double talk detection apparatus and echo cancellation system
WO2017065989A1 (en) Audio signal processing
US10181329B2 (en) Audio processing circuit and method for reducing noise in an audio signal
US20190132452A1 (en) Acoustic echo cancellation based sub band domain active speaker detection for audio and video conferencing applications
US20100177884A1 (en) Echo presence determination in voice conversations
KR20010043833A (ko) 스펙트럼 종속 지수 이득 함수 평균화를 이용한 스펙트럼공제에 의한 신호 잡음 저감
KR20160076059A (ko) 디스플레이장치 및 그 반향 제거방법
SE1150031A1 (sv) Metod och anordning för mikrofonval
CN111968662A (zh) 音频信号的处理方法及装置、存储介质
CN112669878B (zh) 声音增益值的计算方法、装置和电子设备
CN113160846A (zh) 噪声抑制方法和电子设备
CN112997249B (zh) 语音处理方法、装置、存储介质及电子设备
WO2000062281A1 (en) Signal noise reduction by time-domain spectral subtraction
US20230138637A1 (en) Echo residual suppression
CN113763975B (zh) 一种语音信号处理方法、装置及终端
CN112489669A (zh) 一种音频信号处理方法、装置、设备和介质
CN110971769A (zh) 通话信号的处理方法、装置、电子设备及存储介质
US20230115316A1 (en) Double talk detection using capture up-sampling
CN116962583A (zh) 一种回声控制的方法、装置、设备、存储介质及程序产品
Li et al. Dynamic Neural Network-based Solutions for Acoustic Echo Suppression
Pandey et al. Impementation of LMS and VSLMS Algorithm for Speech Enhancement using TMS320C6713 DSP Processor

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210209

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220322

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220329

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220530

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220927

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20221012

R150 Certificate of patent or registration of utility model

Ref document number: 7159366

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150