JP2021096482A

JP2021096482A - 信号処理方法、装置、電子機器及びコンピュータプログラム製品

Info

Publication number: JP2021096482A
Application number: JP2021036166A
Authority: JP
Inventors: 雷耿; Lei Geng
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2020-03-12
Filing date: 2021-03-08
Publication date: 2021-06-24
Anticipated expiration: 2041-03-08
Also published as: EP3851952A2; EP3851952A3; US20210201894A1; CN111369999A; KR20210035110A; CN111369999B; JP7133055B2

Abstract

【課題】ターゲット動作モードに対応するターゲット信号処理アルゴリズムを切り替えて処理を行うことができ、動作モードの変更に適応でき、信号処理アルゴリズムの選択の柔軟性を高め、音声処理効果を向上させる信号処理方法、装置、電子機器及びコンピュータプログラム製品を提供する。【解決手段】信号処理方法は、第１の入力オーディオ信号と、第１の入力オーディオ信号に対応する第１の動作モードとを取得し、デジタル信号処理チップに統合されている複数の信号処理アルゴリズムのうち、第１の動作モードとマッチングする第１の信号処理アルゴリズムにより第１の入力オーディオ信号を処理し、第１のターゲット信号を出力する。【選択図】図１

Description

本願は、コンピュータ技術における信号処理の技術分野に関し、特に信号処理方法、装置、電子機器及びコンピュータプログラム製品に関する。

近年、音声識別技術の成熟に伴い、音声インタラクション機能を備えた電子機器が増えている。音声インタラクション機能は、フロントエンドオーディオ信号処理アルゴリズムからのサポートを必要とする。

現在の電子機器は、各動作モードで固定された信号処理アルゴリズムを使用し、入力されたオーディオ信号を処理するため、オーディオ信号の処理効果が悪くなりやすい。

本願は、オーディオ信号の処理効果が悪いという問題を解決するための、信号処理方法、装置及び電子機器を提供する。

第１の態様では、本願の実施例は、第１の入力オーディオ信号と、前記第１の入力オーディオ信号に対応する第１の動作モードとを取得することと、デジタル信号処理チップにおける第１の信号処理アルゴリズムにより前記第１の入力オーディオ信号を処理し、第１のターゲット信号を出力することであって、前記デジタル信号処理チップには複数の信号処理アルゴリズムが統合されており、前記第１の信号処理アルゴリズムは前記複数の信号処理アルゴリズムのうち、前記第１の動作モードとマッチングするアルゴリズムであることとを含む信号処理方法を提供する。

本実施例の信号処理方法では、デジタル信号処理チップに複数の信号処理アルゴリズムが統合されているため、第１の入力オーディオ信号と第１の動作モードとが取得された後、複数の信号処理アルゴリズムのうち、第１の動作モードとマッチングする第１の信号処理アルゴリズムを使用して第１の入力オーディオを処理することができる。このように、異なる動作モードで異なる信号処理アルゴリズムを使用して入力オーディオ信号を処理することができ、それによってオーディオ信号の処理効果を向上させることができる。

オプションとして、第１のターゲット信号を出力した後、前記デジタル信号処理チップによって切り替え命令を受信し、前記切り替え命令に対応するターゲット動作モードを取得することであって、前記切り替え命令は、メインプロセッサが前記第１のターゲット信号を受信した後、前記第１のターゲット信号に基づいてターゲット動作モードを確定して前記ターゲット動作モードに切り替える場合に送信する命令であることと、第２の入力オーディオ信号が受信された場合、前記デジタル信号処理チップにおけるターゲット信号処理アルゴリズムにより第２の入力オーディオ信号を処理し、第２のターゲット信号を出力することであって、前記ターゲット信号処理アルゴリズムは前記複数の信号処理アルゴリズムのうち、前記ターゲット動作モードとマッチングするアルゴリズムであることとをさらに含む。

即ち、本実施例では、ターゲット動作モードに対応するターゲット信号処理アルゴリズムを切り替えて処理を行うことができ、動作モードの変更に適応でき、信号処理アルゴリズムの選択の柔軟性を高め、音声処理効果を向上させることができる。

オプションとして、第１のターゲット信号を出力した後、前記第１の動作モードが音声識別動作モードである場合、プリセット時間長内にオーディオ信号が受信されないと、メインプロセッサによって前記第１の動作モードを待機動作モードに切り替えることと、第３の入力オーディオ信号が受信された場合、前記デジタル信号処理チップにおける待機音声ウェイクアップアルゴリズムにより前記第３の入力オーディオを処理し、前記待機音声ウェイクアップアルゴリズムにより前記第３の入力オーディオからプリセットウェイクアップワードが検出された場合、ウェイクアップ信号を前記メインプロセッサに出力することであって、ウェイクアップ信号は、前記メインプロセッサが前記ウェイクアップ信号に基づいて待機動作モードを音声識別動作モードに切り替えるためのものであり、待機音声ウェイクアップアルゴリズムは複数の信号処理アルゴリズムのうち、待機動作モードとマッチングするアルゴリズムであることとをさらに含む。

このようにして、消費電力を削減できるだけでなく、待機音声ウェイクアップアルゴリズムにより、第３の入力オーディオにプリセットウェイクアップワードがあるか否かを検出でき、待機音声ウェイクアップアルゴリズムにより、第３の入力オーディオからプリセットウェイクアップワードが検出された場合、ウェイクアップ信号をメインプロセッサに出力すると、メインプロセッサをウェイクアップでき、メインプロセッサは、ウェイクアップされた後、音声識別動作モードになり、後で音声インタラクションを行うことができる。即ち、ユーザとメインプロセッサとの音声インタラクションなどが実現され得る。

オプションとして、前記複数の信号処理アルゴリズムは、待機音声ウェイクアップアルゴリズム、音声ノイズ低減アルゴリズム及び通信ノイズ低減アルゴリズムを含む。

このようにして、待機音声ウェイクアップアルゴリズム、音声ノイズ低減アルゴリズム及び通信ノイズ低減アルゴリズムのうち、第１の動作モードとマッチングするアルゴリズムを使用して信号処理を行い、それにより、第１の動作モードに適応でき、オーディオ信号の処理効果を向上させることができる。

第２の態様では、本願の１つの実施例は、第１の入力オーディオ信号と、前記第１の入力オーディオ信号に対応する第１の動作モードとを取得するための第１の取得モジュールと、デジタル信号処理チップにおける第１の信号処理アルゴリズムにより前記第１の入力オーディオ信号を処理し、第１のターゲット信号を出力するための第１の処理モジュールであって、前記デジタル信号処理チップには複数の信号処理アルゴリズムが統合されており、前記第１の信号処理アルゴリズムは前記複数の信号処理アルゴリズムのうち、前記第１の動作モードとマッチングするアルゴリズムである第１の処理モジュールとを含む信号処理装置を提供する。

オプションとして、装置は、前記デジタル信号処理チップによって切り替え命令を受信し、前記切り替え命令に対応するターゲット動作モードを取得するための第１の受信モジュールであって、前記切り替え命令は、メインプロセッサが前記第１のターゲット信号を受信した後、前記第１のターゲット信号に基づいてターゲット動作モードを確定して前記ターゲット動作モードに切り替える場合に送信する命令である第１の受信モジュールと、第２の入力オーディオ信号が受信された場合、前記デジタル信号処理チップにおけるターゲット信号処理アルゴリズムにより第２の入力オーディオ信号を処理し、第２のターゲット信号を出力するための第２の処理モジュールであって、前記ターゲット信号処理アルゴリズムは前記複数の信号処理アルゴリズムのうち、前記ターゲット動作モードとマッチングするアルゴリズムである第２の処理モジュールとをさらに含む。

オプションとして、装置は、前記第１の動作モードが音声識別動作モードである場合、プリセット時間長内にオーディオ信号が受信されないと、メインプロセッサによって前記第１の動作モードを待機動作モードに切り替えるための切り替えモジュールと、第３の入力オーディオ信号が受信された場合、前記デジタル信号処理チップにおける待機音声ウェイクアップアルゴリズムにより前記第３の入力オーディオを処理し、前記待機音声ウェイクアップアルゴリズムにより前記第３の入力オーディオからプリセットウェイクアップワードが検出された場合、ウェイクアップ信号を前記メインプロセッサに出力するための第３の処理モジュールであって、ウェイクアップ信号は、前記メインプロセッサが前記ウェイクアップ信号に基づいて待機動作モードを音声識別動作モードに切り替えるためのものであり、待機音声ウェイクアップアルゴリズムは複数の信号処理アルゴリズムのうち、待機動作モードとマッチングするアルゴリズムである第３の処理モジュールとをさらに含む。

オプションとして、前記複数の信号処理アルゴリズムは、待機音声ウェイクアップアルゴリズム、音声ノイズ低減アルゴリズム、及び通信ノイズ低減アルゴリズムを含む。

第３の態様では、本願の１つの実施例は、少なくとも１つのプロセッサ、及び前記少なくとも１つのプロセッサに通信可能に接続されたメモリを含み、前記少なくとも１つのプロセッサにより実行されると、本願の各実施例による方法を前記少なくとも１つのプロセッサに実行させる、前記少なくとも１つのプロセッサによって実行可能な命令が前記メモリに記憶されている、電子機器をさらに提供する。

第４の態様では、本願の１つの実施例は、コンピュータ命令が記憶されている非一時的なコンピュータ読み取り可能な記憶媒体であって、前記コンピュータ命令は、本願の各実施例による方法を前記コンピュータに実行させる、非一時的なコンピュータ読み取り可能な記憶媒体をさらに提供する。

図面は、本技術案をより理解しやすくするためであり、本願を制限するものではない。
本願の１つの実施例による信号処理方法のフローチャートである。本願の１つの実施例による信号処理方法の原理図である。本願の１つの実施例による待機音声ウェイクアップアルゴリズムのブロック図である。本願の１つの実施例による音声ノイズ低減アルゴリズムのブロック図である。本願の１つの実施例による通信ノイズ低減アルゴリズムのブロック図である。本願の１つの実施例による信号処理装置の構造図である。本願の実施例による信号処理方法を実現するための電子機器のブロック図である。

以下では、図面を参照しながら本願の例示的な実施例を説明するが、この説明には、理解を容易にするために本願の実施例の様々な詳細が含まれるが、これらは単なる例示であると考えるべきである。したがって、当業者が理解できるように、本願の範囲及び精神を逸脱することなく、ここで記載される実施例に様々な変更及び修正を加えることができる。同様に、以下の説明では、周知の機能及び構造については、明確化及び簡明化のために説明を省略する。

図１に示すように、本願の実施例によれば、本願は、信号処理方法を提供し、この信号処理方法は、ステップＳ１０１とステップＳ１０２を含む。

ステップＳ１０１、第１の入力オーディオ信号と、第１の入力オーディオ信号に対応する第１の動作モードとを取得する。

信号処理方法は、接続されているデジタル信号処理チップ及びメインプロセッサを含むことができる電子機器に適用できる。まず、当該第１の入力オーディオ信号は、デジタル信号、即ち、収集された、ユーザによって入力されたアナログオーディオ信号に対してアナログ−デジタル変換を実行して得られるオーディオ信号であってもよい。第１の入力オーディオ信号は、デジタル信号処理チップに入力されてもよく、即ち、第１の入力オーディオ信号は、デジタル信号処理チップによって取得されてもよい。また、第１の入力オーディオ信号に対応する第１の動作モードを取得することもでき、メインプロセッサは、異なる動作モードで動作することができ、当該第１の動作モードは、第１の入力オーディオ信号が取得されたときのメインプロセッサの動作モードとして理解されてもよい。例えば、メインプロセッサは、待機動作モード、音声識別動作モード、通信動作モードのいずれかで動作することができ、第１の動作モードは、待機動作モード（即ち、メインプロセッサは、電源が投入されており、ウェイクアップされて動作状態になることを待っている状態）、音声識別動作モード（音声インタラクションを行う動作状態として理解されてもよい）及び通信動作モード（通信を行っている動作状態として理解されてもよい）のいずれかの動作モードであってもよい。メインプロセッサは、命令の形でその動作モードをデジタル信号処理チップに通知することができる。

ステップＳ１０２、デジタル信号処理チップにおける第１の信号処理アルゴリズムにより第１の入力オーディオ信号を処理し、第１のターゲット信号を出力する。

デジタル信号処理チップには複数の信号処理アルゴリズムが統合されている。第１の信号処理アルゴリズムは、複数の信号処理アルゴリズムのうち、第１の動作モードとマッチングするアルゴリズムである。

即ち、デジタル信号処理チップに複数の信号処理アルゴリズムが統合されているため、第１の入力オーディオ信号及び第１の動作モードが取得された後、デジタル信号処理チップのうち、第１の動作モードとマッチングする第１の信号処理アルゴリズムにより第１の入力オーディオ信号を処理することができる。使用される第１の信号処理アルゴリズムが第１の動作モードによって異なることが理解できるため、異なる動作モードで異なる信号処理アルゴリズムを使用して入力オーディオ信号を処理することができ、それによって、オーディオ信号の処理効果を向上させることができる。なお、デジタル信号処理チップにより第１のターゲット信号をメインプロセッサに出力することができ、メインプロセッサは、第１のターゲット信号を受信した後、第１のターゲット信号及び現在の第１の動作モードに基づいて対応する動作を実行する。例えば、第１の動作モードが音声識別動作モードである場合、メインプロセッサは、第１のターゲット信号を受信した後、第１のターゲット信号に基づいて、対応する応答信号を出力することができる。例えば、第１の入力オーディオ信号が音楽の再生を制御するために使用される信号である場合、メインプロセッサは、第１のターゲット信号を受信した後、音楽を再生できる。複数の信号処理アルゴリズムのファームウェアがフラッシュメモリに記憶されてもよく、デジタル信号処理チップは、電源が投入されると、複数の信号処理アルゴリズムのファームウェアをフラッシュメモリから速くロードすることができる。

本実施例の信号処理方法では、デジタル信号処理チップに複数の信号処理アルゴリズムが統合されているため、第１の入力オーディオ信号及び第１の動作モードが取得された後、複数の信号処理アルゴリズムのうち、第１の動作モードとマッチングする第１の信号処理アルゴリズムを使用して第１の入力オーディオを処理することができる。このように、異なる動作モードで異なる信号処理アルゴリズムを使用して入力オーディオ信号を処理することができるので、それにより、オーディオ信号の処理効果を向上させることができる。

１つの実施例では、第１のターゲット信号を出力した後、デジタル信号処理チップによって切り替え命令を受信し、切り替え命令に対応するターゲット動作モードを取得するステップであって、切り替え命令は、メインプロセッサが第１のターゲット信号を受信した後、第１のターゲット信号に基づいてターゲット動作モードを確定してターゲット動作モードに切り替える場合に送信する命令であるステップと、第２の入力オーディオ信号が受信された場合、デジタル信号処理チップにおけるターゲット信号処理アルゴリズムにより第２の入力オーディオ信号を処理し、第２のターゲット信号を出力するステップであって、ターゲット信号処理アルゴリズムは複数の信号処理アルゴリズムのうち、ターゲット動作モードとマッチングするアルゴリズムであるステップとをさらに含む。

第１のターゲット信号がデジタル信号処理チップによってメインプロセッサに出力されると、メインプロセッサは、第１のターゲット信号に基づいてターゲット動作モードを確定する。現在の第１の動作モードがターゲット動作モードと異なると、ターゲット動作モードに切り替え、かつデジタル信号処理チップに切り替え命令を送信し、デジタル信号処理チップにより切り替え命令に従って対応するターゲット動作モードを取得する。この場合、後に第２の入力オーディオ信号が受信されると、デジタル信号処理チップは、複数の信号処理アルゴリズムのうち、ターゲット動作モードとマッチングするターゲット信号処理アルゴリズムを使用して、第２の入力オーディオ信号を処理し、第２のターゲット信号を出力する。例えば、第１の動作モードが音声識別動作モードである場合、デジタル信号処理チップは、第１のターゲット信号処理アルゴリズムを使用して第１の入力オーディオ信号を処理し、第１のターゲット信号をメインプロセッサに出力する。例えば、Ａとの音声通話又はＢへの通話などの第１の入力オーディオ信号は、ノイズが含まれている可能性があるので、ノイズ低減処理が行われた後、メインプロセッサに出力される。メインプロセッサは、第１のターゲット信号を受信した後、第１のターゲット信号に基づいて、ターゲット動作モードが通信動作モードであると確定できる場合には、通信動作モードに切り替えることができ、通信動作モードへの切り替え命令をデジタル信号処理チップに送信する。デジタル信号処理チップは、この切り替え命令を受信すると、メインプロセッサが現在通信モードにあると理解し、後に第２の入力オーディオ信号が受信された場合、通信動作モードに対応する信号処理アルゴリズムにより第２の入力オーディオ信号を処理し、第２のターゲット信号をメインプロセッサに出力することができる。なお、切り替え命令にはターゲット動作モードに対応するターゲット信号処理アルゴリズムに対応するアルゴリズムパラメータが含まれてもよく、例えば、ターゲット信号処理アルゴリズムが信号増幅サブアルゴリズム及びエコーキャンセルサブアルゴリズムを含む場合、アルゴリズムパラメータは、増幅パラメータ及びエコーキャンセルサブアルゴリズムに対応するアルゴリズムパラメータなどを含むことができる。

即ち、本実施例では、ターゲット動作モードに対応するターゲット信号処理アルゴリズムを切り替えて処理を行うことができ、動作モードの変更に適応でき、信号処理アルゴリズムの選択の柔軟性を高め、オーディオ処理効果を向上させることができる。

１つの実施例では、第１のターゲット信号を出力した後、第１の動作モードが音声識別動作モードである場合、プリセット時間長内にオーディオ信号が受信されないと、メインプロセッサによって第１の動作モードを待機動作モードに切り替えるステップと、第３の入力オーディオ信号が受信された場合、デジタル信号処理チップにおける待機音声ウェイクアップアルゴリズムにより第３の入力オーディオを処理し、待機音声ウェイクアップアルゴリズムにより第３の入力オーディオからプリセットウェイクアップワードが検出された場合、ウェイクアップ信号をメインプロセッサに出力するステップであって、ウェイクアップ信号は、メインプロセッサがウェイクアップ信号に基づいて待機動作モードを音声識別動作モードに切り替えるためのものであり、待機音声ウェイクアップアルゴリズムは複数の信号処理アルゴリズムのうち、待機動作モードとマッチングするアルゴリズムであるステップとをさらに含む。

第１の動作モードが音声識別動作モードである場合、消費電力を減少するために、プリセット時間長内にオーディオ信号が受信されないと、メインプロセッサによって第１の動作モードを待機動作モードに切り替える。後で第３の入力オーディオ信号が受信されると、デジタル信号処理チップにおける待機音声ウェイクアップアルゴリズムにより第３の入力オーディオを処理し、このようにして、使用された信号処理アルゴリズムが待機動作モードに適応するようにする。デジタル信号処理チップにおける待機音声ウェイクアップアルゴリズムにより第３の入力オーディオを処理し、即ち、待機音声ウェイクアップアルゴリズムにより第３の入力オーディオ信号を検出し、第３の入力オーディオからプリセットウェイクアップワードが検出されると、ウェイクアップ信号をメインプロセッサに出力する。メインプロセッサは、ウェイクアップ信号を受信すると、待機動作モードを音声識別モードに切り替え、このようにして、ウェイクアップが実現される。

このようにして、消費電力を削減できるだけでなく、待機音声ウェイクアップアルゴリズムにより、第３の入力オーディオにプリセットウェイクアップワードがあるか否かを検出でき、待機音声ウェイクアップアルゴリズムにより、第３の入力オーディオからプリセットウェイクアップワードが検出された場合には、ウェイクアップ信号をメインプロセッサに出力することで、メインプロセッサをウェイクアップでき、メインプロセッサは、ウェイクアップされた後音声識別動作モードになり、後に音声インタラクションを行うことができる。即ち、ユーザとメインプロセッサとの音声インタラクションなどが実現される。

１つの実施例では、前記複数の信号処理アルゴリズムは、待機音声ウェイクアップアルゴリズム、音声ノイズ低減アルゴリズム、及び通信ノイズ低減アルゴリズムを含む。待機音声ウェイクアップアルゴリズムは、待機動作モードに対応し、音声ノイズ低減アルゴリズムは、ノイズ低減アルゴリズムであり、ここでは限定されず、音声識別動作モードに対応する。通信ノイズ低減アルゴリズムは、同様にノイズ低減アルゴリズムであり、ここでは限定されず、ノイズ低減アルゴリズムとは異なり、通信ノイズ低減アルゴリズムは通信動作モードに対応する。このようにして、待機音声ウェイクアップアルゴリズム、音声ノイズ低減アルゴリズム及び通信ノイズ低減アルゴリズムのうち、第１の動作モードとマッチングするアルゴリズムを使用して信号処理を行う。このようにして、第１の動作モードに適応できるようになり、オーディオ信号の処理効果を向上させることができる。

以下、１つの具体的な実施例で上記方法のプロセスを説明する。当該方法は、接続されているデジタル信号処理チップとメインプロセッサとを含む電子機器に適用される。電子機器は、マイクアレイとアナログ−デジタル変換回路とをさらに含み、アナログ−デジタル変換回路は、マイクアレイとデジタル信号処理チップの間に接続され、入力されたアナログオーディオ信号をマイクアレイから取得し、デジタルオーディオ信号（例えば、第１の入力オーディオ信号など）に変換してから、デジタル信号処理チップに出力する。図２に示すように、デジタル信号処理チップは、オーディオデジタル信号処理チップ、即ち図２のＤＳＰである。

オーディオデジタル信号処理チップのファームウェアには、モジュール化されたフロントエンド信号アルゴリズム（複数の信号処理アルゴリズム）が統合されている。複数の信号処理アルゴリズムが異なり、スマートハードウェア、即ち電子機器に電源が投入された後、メインプロセッサは、待機動作モードになり、デジタル信号処理チップは、アルゴリズムファームウェアをロードした後、デフォルトのウェイクアップ待ちモードになる。即ち、複数の信号処理アルゴリズムのうち待機音声ウェイクアップアルゴリズムが使用されており、アナログ−デジタル変換回路の出力が待機音声ウェイクアップアルゴリズムの入力として使用される。ユーザから入力されたアナログ音声信号が、マイクアレイを介して取得され、アナログ−デジタル変換回路に出力し、アナログ−デジタル変換回路がアナログ音声信号に対してアナログ−デジタル変換を行って、入力オーディオ信号が取得される。アナログ−デジタル変換回路の出力が待機音声ウェイクアップアルゴリズムの入力であるため、待機音声ウェイクアップアルゴリズムが入力オーディオ信号に基づいて検出することが理解されよう。図３に示すように、待機音声ウェイクアップアルゴリズムには、音声検出アルゴリズムとウェイクアップアルゴリズムが含まれてもよく、音声検出アルゴリズムにより、入力オーディオ信号にユーザの音声である人間の音が含まれているか否かを検出し、含まれていると検出した場合、ウェイクアップアルゴリズムにより入力オーディオ信号に対してウェイクアップワード検出を行い、入力オーディオからプリセットウェイクアップワード（又は、ＸＸ、ＸＸのウェイクアップワードなどのプリセットキーワードと呼ばれる）を検出した場合、ウェイクアップ信号がメインプロセッサに出力される。メインプロセッサは、ウェイクアップ信号を受信すると、待機動作モードを音声識別動作モードに切り替える。このように、ウェイクアップが実現される。

なお、プリセットウェイクアップワードが検出された場合、デジタル信号処理チップは、ＧＰＩＯインタフェース（汎用入出力インタフェース）をトリガーしてウェイクアップして、トリガーレベル信号（即ち対応するウェイクアップ信号）をメインプロセッサに出力させ、メインプロセッサチップが起動して通常の動作モードに入るようにする。本実施例では、メインプロセッサチップは、音声識別動作モードに入ることができ、メインプロセッサチップは、音声識別動作モードに入ると、Ｉ２Ｃ（シンプルな双方向２線式同期シリアルバス）、シリアルポート、ＵＳＢ（汎用シリアルバス）やＳＰＩ（シリアル周辺インタフェース）などのインタフェースを介して、デジタル信号処理チップのレジスタを設定するためにデジタル信号処理チップに命令を送信して、アナログ−デジタル変換回路の出力を音声識別動作モードの音声ノイズ低減アルゴリズムの入力とし、ファームウェアにおけるモジュール化された複数の信号処理アルゴリズムのうち、音声識別動作モードの音声ノイズ低減アルゴリズムのアルゴリズムパラメータを設定する。音声ノイズ低減アルゴリズムは様々であり、ここでは限定されない。例えば、音声ノイズ低減アルゴリズムのブロック図である図４に示すように、音声ノイズ低減アルゴリズムは、第１の等化アルゴリズムモジュール、第２の等化アルゴリズムモジュール、第１のエコーキャンセルアルゴリズムモジュール（スピーカー例えばホーンに対するループバックＡＥＣ（エコーキャンセル）信号を別に入力する必要があり、ループバックＡＥＣ信号はパワーアンプ処理モジュールで処理してから、第３のエコーキャンセルアルゴリズムに入力され得る）、第１の非線形処理アルゴリズムモジュール、第２のエコーキャンセルアルゴリズムモジュール（第１のエコーキャンセルアルゴリズムモジュールと同様に、スピーカー例えばホーンに対するループバックＡＥＣ信号を別に入力する必要があり、ループバックＡＥＣ信号はパワーアンプ処理モジュールで処理してから、第３のエコーキャンセルアルゴリズムに再入力され得る）、第２の非線形処理アルゴリズムモジュール、ビームフォーミングアルゴリズムモジュール、ブラインドソース分離アルゴリズムモジュール、第１の残響除去アルゴリズムモジュール、第３の非線形処理モジュール、第１の動的範囲制御アルゴリズムモジュール、第１の信号増幅アルゴリズムモジュール、第１の音声検出アルゴリズムモジュール、及び第１の音声ウェイクアップアルゴリズムモジュールを含み、各モジュールの接続関係は、図４に示され、第１の信号増幅アルゴリズムモジュールで出力されたターゲット信号はメインプロセッサの音声識別エンジンに出力される。上記音声ノイズ低減アルゴリズムにより、オーディオ信号に対するノイズ低減を実現することができる。

デジタル信号処理チップは、当該命令を受信した後、対応するターゲット動作モード、即ち音声識別動作モードを取得することができる。音声識別モードでは、後でアナログ−デジタル変換回路から入力オーディオ信号を受信すると、音声インタラクションを行い、音声ノイズ低減アルゴリズムにより、後で受信された入力オーディオ信号に対してノイズ処理を行ってからメインプロセッサに出力し、メインプロセッサが応答する。これにより、音声インタラクションが実現される。

メインプロセッサは、音声識別動作モードに入ってから、後に受信する入力オーディオ信号に対して、ターゲット動作モードを確定することもできる。例えば、ユーザから入力されたオーディオ信号を識別し、通信する必要がある場合（例えばオーディオ信号に「Ａへ電話をかける」が含まれている場合）には、メインプロセッサは、Ｉ２Ｃ、シリアルポート、ＵＳＢやＳＰＩなどのインタフェースを介して命令を送信して、デジタル信号処理チップのレジスタを設定し、ファームウェアにおけるモジュール化されたフロントエンドの複数の信号処理アルゴリズムのうちの通信ノイズ低減アルゴリズムのパラメータを設定する。通信アプリケーションが終了すると、メインプロセッサチップは、Ｉ２Ｃ、シリアルポート、ＵＳＢやＳＰＩなどのインタフェースを介して命令を送信し、デジタル信号処理チップのレジスタを設定し、アナログ−デジタル変換回路の出力を通信動作モードの通信ノイズ低減アルゴリズムの入力として、ファームウェアにおけるモジュール化された複数の信号処理アルゴリズムのうちの通信動作モードの通信ノイズ低減アルゴリズムのパラメータを設定する。通信ノイズ低減アルゴリズムは様々であり、ここでは限定されない。例えば、通信ノイズ低減アルゴリズムのブロック図である図５に示すように、通信ノイズ低減アルゴリズムは、第３の等化アルゴリズムモジュール、第４の等化アルゴリズムモジュール、加算アルゴリズムモジュール、第３のエコーキャンセルアルゴリズム（スピーカー例えばホーンに対するループバックＡＥＣ信号を別に入力する必要があり、ループバックＡＥＣ信号はパワーアンプ処理モジュールで処理してから、第３のエコーキャンセルアルゴリズムモジュールに再入力される）、第４の非線形処理アルゴリズムモジュール、ノイズ抑制アルゴリズムモジュール、第２の残響除去アルゴリズムモジュール、第５の非線形処理モジュール、コンフォートノイズ生成アルゴリズムモジュール、第２の動的範囲制御アルゴリズムモジュール、第２の信号増幅アルゴリズム、及び第２の音声検出アルゴリズムを含む。各モジュールの接続関係は、図５に示されており、第２の信号増幅アルゴリズムモジュールで出力されたターゲット信号は、メインプロセッサにおける通信アプリケーションに出力される。上記通信ノイズ低減アルゴリズムにより、オーディオ信号に対するノイズ低減を実現することができる。

音声識別動作モードに入った後、設定されたプリセット時間長（たとえば５分間）内に音声インタラクションがなく、即ち、オーディオ信号が受信されていない場合には、メイン処理チップは、待機動作モード、即ち低消費電力になる。また、待機になる前に、Ｉ２Ｃ、シリアルポート、ＵＳＢ又はＳＰＩなどのインタフェースを介して命令を送信し、デジタル信号処理チップのレジスタを設定し、ファームウェアにおけるモジュール化されたフロントエンドの複数の信号処理アルゴリズムのうち低周波・低電力のウェイクアップ待ちモードでの音声ウェイクアップアルゴリズムのアルゴリズムパラメータを設定する。

本願の実施例では、オーディオデジタル信号処理チップは、様々な製品アプリケーションでより柔軟に使用され、各アプリケーションで最高のユーザエクスペリエンスを得ることができる。本願の実施例の技術案を使用することにより、電子機器の平均電力消費を低減し、電子機器の耐用年数を延長することができる。また、異なるアプリケーション（異なる適用シナリオに対応）に対してファームウェア全体をアップグレードする必要がないため、ファームウェアアップグレードの回数が減り、さらにＦｌａｓｈ（一定の数の消去及び書き込み回数がある）メモリの耐用年数が長くなる。

図６を参照すると、本願の１つの実施例は、信号処理装置６００を提供する。この装置は、第１の入力オーディオ信号と、前記第１の入力オーディオ信号に対応する第１の動作モードとを取得するための第１の取得モジュール６０１と、デジタル信号処理チップにおける第１の信号処理アルゴリズムにより前記第１の入力オーディオ信号を処理し、第１のターゲット信号を出力するための第１の処理モジュール６０２であって、前記デジタル信号処理チップには複数の信号処理アルゴリズムが統合されており、前記第１の信号処理アルゴリズムは前記複数の信号処理アルゴリズムのうち、前記第１の動作モードとマッチングするアルゴリズムである第１の処理モジュール６０２とを含む。

１つの実施例において、装置は、前記デジタル信号処理チップによって切り替え命令を受信し、前記切り替え命令に対応するターゲット動作モードを取得するための第１の受信モジュールであって、前記切り替え命令は、メインプロセッサが前記第１のターゲット信号を受信した後、前記第１のターゲット信号に基づいてターゲット動作モードを確定して前記ターゲット動作モードに切り替える場合に送信する命令である第１の受信モジュールと、第２の入力オーディオ信号が受信された場合、前記デジタル信号処理チップにおけるターゲット信号処理アルゴリズムにより第２の入力オーディオ信号を処理し、第２のターゲット信号を出力するための第２の処理モジュールであって、前記ターゲット信号処理アルゴリズムは前記複数の信号処理アルゴリズムのうち、前記ターゲット動作モードとマッチングするアルゴリズムである第２の処理モジュールとをさらに含む。

１つの実施例において、装置は、前記第１の動作モードが音声識別動作モードである場合、プリセット時間長内にオーディオ信号が受信されないと、前記メインプロセッサによって前記第１の動作モードを待機動作モードに切り替えるための切り替えモジュールと、第３の入力オーディオ信号が受信された場合、前記デジタル信号処理チップにおける待機音声ウェイクアップアルゴリズムにより前記第３の入力オーディオを処理し、前記待機音声ウェイクアップアルゴリズムにより前記第３の入力オーディオからプリセットウェイクアップワードが検出された場合、ウェイクアップ信号をメインプロセッサに出力するための第３の処理モジュールであって、ウェイクアップ信号は、前記メインプロセッサが前記ウェイクアップ信号に基づいて待機動作モードを音声識別動作モードに切り替えるためのものであり、待機音声ウェイクアップアルゴリズムは複数の信号処理アルゴリズムのうち待機動作モードとマッチングするアルゴリズムである第３の処理モジュールとをさらに含む。

１つの実施例では、前記複数の信号処理アルゴリズムは、待機音声ウェイクアップアルゴリズム、音声ノイズ低減アルゴリズム、及び通信ノイズ低減アルゴリズムを含む。

上記の各実施例の信号処理装置は、上記の各実施例の信号処理方法を実現するための装置であり、技術的特徴が対応し、技術的効果が対応するため、ここでは詳しく説明しない。

本願の実施例によれば、電子機器及び読み取り可能な記憶媒体をさらに提供する。

図７には、本願の実施例による信号処理方法の電子機器のブロック図が示されている。電子機器は、たとえば、ラップトップコンピュータ、デスクトップコンピュータ、ワークステーション、パーソナルデジタルアシスタント、サーバ、ブレードサーバ、メインフレームコンピュータ、及びその他の適切なコンピュータなど、様々な形式のデジタルコンピュータを意図している。電子機器は、たとえば、パーソナルデジタルアシスタント、携帯電話、スマートフォン、ウェアラブル機器、及びその他の類似のコンピューティング装置など、様々な形式の移動装置を示してもよい。本明細書に示されているコンポーネント、それらの接続と関係、及びそれらの機能は単なる例であるが、本明細書の説明及び／又は要求される本願の実現を制限する意図はない。

図７に示すように、この電子機器は、１つ又は複数のプロセッサ７０１、メモリ７０２、及び高速インタフェースと低速インタフェースを含む、様々なコンポーネントを接続するためのインタフェースを含む。各コンポーネントは、異なるバスを介して互いに接続され、共通のマザーボードに取り付けられ、又は必要に応じて他の方式で取り付けられ得る。プロセッサは電子機器内で実行される命令を処理でき、この命令には、メモリ内に格納される又はメモリ上に格納されて外部入力／出力装置（たとえば、インタフェースに結合された表示機器など）にＧＵＩのグラフィック情報を表示する命令が含まれる。他の実施形態では、複数のプロセッサ及び／又は複数のバスを、必要に応じて、複数のメモリ使用することができる。同様に、複数の電子機器を接続することができ、各機器は必要な操作の一部（たとえば、サーバアレイ、ブレードサーバのグループ、又はマルチプロセッサシステムとして）を提供する。図７では、１つのプロセッサ７０１の場合が例示されている。

メモリ７０２は、本願の非一時的なコンピュータ読み取り可能な記憶媒体である。前記メモリは、本願の信号処理方法を前記少なくとも１つの前記プロセッサに実行させるように、少なくとも１つのプロセッサによって実行可能な命令を格納している。本願の非一時的なコンピュータ読み取り可能な記憶媒体は、本願の信号処理方法をコンピュータに実行させるためのコンピュータ命令を格納している。

非一時的なコンピュータ読み取り可能な記憶媒体としてのメモリ７０２は、非一時的なソフトウェアプログラム、非一時的なコンピュータ実行可能なプログラム及びモジュール、たとえば、本願の実施例における信号処理方法に対応するプログラム命令／モジュール（たとえば、図６に示す第１の取得モジュール６１０、第１の処理モジュール６０２）を格納することができる。プロセッサ７０１は、メモリ７０２に格納された非一時的なソフトウェアプログラム、命令、及びモジュールを実行することによって、サーバの様々な機能アプリケーション及びデータ処理を実行し、すなわち、上記方法実施例における信号処理方法を実現する。

メモリ７０２は、プログラム記憶領域及びデータ記憶領域を含むことができ、プログラム記憶領域は、オペレーティングシステム、及び少なくとも１つの機能に必要なアプリケーションプログラムを格納し、データ記憶領域は、キーボードに表示される電子機器の使用に従って作成されたデータなどを格納する。メモリ７０２は、高速ランダムアクセスメモリを含み、たとえば、少なくとも１つの磁気ディスクストレージデバイス、フラッシュメモリデバイス、又は他の非一時的なソリッドステートストレージデバイスなどの非一時的なメモリを含んでもよい。いくつかの実施例では、メモリ７０２は、プロセッサ７０１に対して遠隔的に設置されるメモリを選択的に含んでもよく、これらの遠隔メモリは、ネットワークを介してキーボードに表示される電子機器に接続され得る。上記ネットワークの例には、インターネット、企業イントラネット、ローカルエリアネットワーク、モバイル通信ネットワーク、及びそれらの組み合わせが含まれるが、これらに限定されない。

信号処理方法を実現する電子機器は、入力装置７０３及び出力装置７０４をさらに含んでもよい。プロセッサ７０１、メモリ７０２、入力装置７０３及び出力装置７０４はバス又はその他の方式で接続してもよく、図７には、バスによる接続が例示されている。

入力装置７０３は、入力される数字又はキャラクター情報を受信すること、キーボードに表示される電子機器、たとえば、タッチスクリーン、キーパッド、マウス、トラックパッド、タッチパッド、ポインタ、１つ又は複数のマウスボタン、トラックボール、ジョイスティックなどの入力装置のユーザ設定及び機能制御に関連するキー信号入力を生成することができる。出力装置７０４は、表示機器、補助照明装置（たとえば、ＬＥＤ）、触覚フィードバック装置（たとえば、振動モータ）などを含む。この表示機器は、液晶ディスプレイ（ＬＤＣ）、発光ダイオード（ＬＥＤ）ディスプレイ、及びプラズマディスプレイを含むが、これらに限定されない。いくつかの実施形態では、表示機器はタッチスクリーンであり得る。

ここで説明するシステム及び技術の様々な実施形態は、デジタル電子回路システム、集積回路システム、専用ＡＳＭＣ（特定用途向け集積回路）、コンピュータハードウェア、ファームウェア、ソフトウェア、及び／又はそれらの組み合わせにおいて実現することができる。これらの様々な実施形態は、１つ又は複数のコンピュータプログラムにおいて実施され、この１つ又は複数のコンピュータプログラムは、少なくとも１つのプログラム可能なプロセッサを含むプログラム可能なシステムで実行及び／又は解釈される。このプログラム可能なプロセッサは専用又は汎用のプログラム可能なプロセッサであってもよく、ストレージシステム、少なくとも１つの入力装置、及び少なくとも１つの出力装置からデータ及び命令を受信し、データ及び命令をこのストレージシステム、少なくとも１つの入力装置、及び少なくとも１つの出力装置に送信することができる。

これらのコンピューティングプログラム（プログラム、ソフトウェア、ソフトウェアアプリケーション、又はコードとも呼ばれる）には、プログラム可能なプロセッサの機械命令が含まれ、プロセス及び／又はオブジェクト指向のプログラミング言語、及び／又はアセンブリ／機械語を用いてこれらのコンピューティングプログラムを実施できる。たとえば、本明細書で使用される「機械読み取り可能な媒体」及び「コンピュータ読み取り可能な媒体」という用語は、機械命令及び／又はデータをプログラム可能なプロセッサの任意のコンピュータプログラム製品、機器、及び／又は装置（たとえば、磁気ディスク、光ディスク、メモリ、プログラマブルロジック機器（ＰＬＤ））に提供するものを指し、機械読み取り可能な信号としての機械命令を受信するための機械読み取り可能な媒体を含む。「機械読み取り可能な信号」という用語は、プログラム可能なプロセッサに機械命令及び／又はデータを提供するために使用される任意の信号を指す。

ユーザと対話するように、ここで説明するシステム及び技術をコンピュータで実施することができ、このコンピュータは、ユーザに情報を表示するための表示装置（たとえば、ＣＲＴ（陰極線管）又はＬＣＤ（液晶ディスプレイ）モニター）、ユーザがコンピュータに入力することを可能とするキーボード及びポインティング装置（たとえば、マウスやトラックボール）を有する。他の種類の装置も、ユーザとの対話を提供することができ、たとえば、ユーザに提供するフィードバックは、任意の形式の感覚フィードバック（たとえば、視覚的フィードバック、聴覚的フィードバック、又は触覚的フィードバック）であってもよく、ユーザからの入力は、任意の形式（音響入力、音声入力、又は触覚入力を含む）で受信できる。

ここで説明するシステム及び技術は、バックエンドコンポーネントを含むコンピューティングシステム（たとえば、データサーバとして）、又はミドルウェアコンポーネントを含むコンピューティングシステム（たとえば、アプリケーションサーバ）、又はフロントエンドコンポーネントを含むコンピューティングシステム（たとえば、グラフィカルユーザインターフェース又はＷＥＢブラウザーを備えたユーザコンピュータが挙げられ、ユーザはこのグラフィカルユーザインターフェース又はこのＷＥＢブラウザーを介してここで説明するシステム及び技術の実施形態と対話できる）、又はこのようなバックエンドコンポーネント、ミドルウェアコンポーネント、又はフロントエンドコンポーネントを含む任意の組み合わせコンピューティングシステムにおいて実施できる。システムのコンポーネントは、任意の形式又は媒体のデジタルデータ通信（たとえば、通信ネットワーク）を介して相互に接続できる。通信ネットワークの例には、ローカルエリアネットワーク（ＬＡＮ）、ワイドエリアネットワーク（ＷＡＮ）、及びインターネットが含まれる。

コンピュータシステムには、クライアントとサーバを含むことができる。クライアントとサーバは通常、互いに遠く離れており、通信ネットワークを介して互いに会話するのが一般的である。クライアントとサーバの関係は、対応するコンピュータで実行され、互いにクライアント−サーバの関係を持つコンピュータプログラムによって生成される。

本願の実施例の技術案によれば、デジタル信号処理チップに複数の信号処理アルゴリズムが統合されているため、第１の入力オーディオ信号と第１の動作モードが取得された後、複数の信号処理アルゴリズムのうち、第１の動作モードとマッチングする第１の信号処理アルゴリズムを使用して第１の入力オーディオを処理することができる。それにより、異なる動作モードで異なる信号処理アルゴリズムを使用して入力オーディオ信号を処理することができる。それにより、オーディオ信号の処理効果を向上させることができる。

上記の様々な形式のプロセスを用いて、ステップを改めて並べ替えたり、追加したり、削除したりすることができる。たとえば、本願に記載の各ステップは、本願開示の技術案の所望の結果が達成できる限り、並行して実施しても、順次実施しても、異なる順序で実施してもよく、本明細書では、それについて限定しない。

上記特定の実施形態は、本願の特許範囲を制限するものではない。当業者にとって明らかなように、設計要件及び他の要因に応じて、様々な修正、組み合わせ、サブ組み合わせ、及び置換を行うことができる。本願の精神及び原則の範囲内で行われた修正、同等の置換、及び改良であれば、本願の特許範囲に含まれるものとする。

Claims

第１の入力オーディオ信号と、前記第１の入力オーディオ信号に対応する第１の動作モードとを取得することと、
デジタル信号処理チップにおける第１の信号処理アルゴリズムにより前記第１の入力オーディオ信号を処理し、第１のターゲット信号を出力することであって、前記デジタル信号処理チップには複数の信号処理アルゴリズムが統合されており、前記第１の信号処理アルゴリズムは、前記複数の信号処理アルゴリズムのうち、前記第１の動作モードとマッチングするアルゴリズムであることと、を含むことを特徴とする、信号処理方法。
第１のターゲット信号を出力した後、
前記デジタル信号処理チップによって切り替え命令を受信し、前記切り替え命令に対応するターゲット動作モードを取得することであって、前記切り替え命令は、メインプロセッサが前記第１のターゲット信号を受信した後、前記第１のターゲット信号に基づいてターゲット動作モードを確定して前記ターゲット動作モードに切り替える場合に送信する命令であることと、
第２の入力オーディオ信号が受信された場合、前記デジタル信号処理チップにおけるターゲット信号処理アルゴリズムにより第２の入力オーディオ信号を処理し、第２のターゲット信号を出力することであって、前記ターゲット信号処理アルゴリズムは前記複数の信号処理アルゴリズムのうち、前記ターゲット動作モードとマッチングするアルゴリズムであることと、をさらに含むことを特徴とする、請求項１に記載の方法。
第１のターゲット信号を出力した後、
前記第１の動作モードが音声識別動作モードである場合、プリセット時間長内にオーディオ信号が受信されない場合に、メインプロセッサによって前記第１の動作モードを待機動作モードに切り替えることと、
第３の入力オーディオ信号が受信された場合、前記デジタル信号処理チップにおける待機音声ウェイクアップアルゴリズムにより前記第３の入力オーディオを処理し、前記待機音声ウェイクアップアルゴリズムにより前記第３の入力オーディオからプリセットウェイクアップワードが検出された場合、ウェイクアップ信号を前記メインプロセッサに出力することであって、ウェイクアップ信号は、前記メインプロセッサが前記ウェイクアップ信号に基づいて待機動作モードを音声識別動作モードに切り替えるためのものであり、待機音声ウェイクアップアルゴリズムは複数の信号処理アルゴリズムのうち待機動作モードとマッチングするアルゴリズムであることと、をさらに含むことを特徴とする、請求項１又は２に記載の方法。
前記複数の信号処理アルゴリズムは、待機音声ウェイクアップアルゴリズム、音声ノイズ低減アルゴリズム及び通信ノイズ低減アルゴリズムを含むことを特徴とする、請求項１に記載の方法。
第１の入力オーディオ信号と、前記第１の入力オーディオ信号に対応する第１の動作モードとを取得するための第１の取得モジュールと、
デジタル信号処理チップにおける第１の信号処理アルゴリズムにより前記第１の入力オーディオ信号を処理し、第１のターゲット信号を出力するための第１の処理モジュールであって、前記デジタル信号処理チップには複数の信号処理アルゴリズムが統合されており、前記第１の信号処理アルゴリズムは前記複数の信号処理アルゴリズムのうち、前記第１の動作モードとマッチングするアルゴリズムである第１の処理モジュールと、を含むことを特徴とする、信号処理装置。
前記デジタル信号処理チップによって切り替え命令を受信し、前記切り替え命令に対応するターゲット動作モードを取得するための第１の受信モジュールであって、前記切り替え命令は、メインプロセッサが前記第１のターゲット信号を受信した後、前記第１のターゲット信号に基づいてターゲット動作モードを確定して前記ターゲット動作モードに切り替える場合に送信する命令である第１の受信モジュールと、
第２の入力オーディオ信号が受信された場合、前記デジタル信号処理チップにおけるターゲット信号処理アルゴリズムにより第２の入力オーディオ信号を処理し、第２のターゲット信号を出力するための第２の処理モジュールであって、前記ターゲット信号処理アルゴリズムは前記複数の信号処理アルゴリズムのうち、前記ターゲット動作モードとマッチングするアルゴリズムである第２の処理モジュールと、をさらに含むことを特徴とする、請求項５に記載の装置。
前記第１の動作モードが音声識別動作モードである場合、プリセット時間長内にオーディオ信号が受信されないと、メインプロセッサによって前記第１の動作モードを待機動作モードに切り替えるための切り替えモジュールと、
第３の入力オーディオ信号が受信された場合、前記デジタル信号処理チップにおける待機音声ウェイクアップアルゴリズムにより前記第３の入力オーディオを処理し、前記待機音声ウェイクアップアルゴリズムにより前記第３の入力オーディオからプリセットウェイクアップワードが検出された場合、ウェイクアップ信号を前記メインプロセッサに出力するための第３の処理モジュールであって、ウェイクアップ信号は、前記メインプロセッサが前記ウェイクアップ信号に基づいて待機動作モードを音声識別動作モードに切り替えるためのものであり、待機音声ウェイクアップアルゴリズムは複数の信号処理アルゴリズムのうち、待機動作モードとマッチングするアルゴリズムである第３の処理モジュールと、をさらに含むことを特徴とする、請求項５又は６に記載の装置。
前記複数の信号処理アルゴリズムは、待機音声ウェイクアップアルゴリズム、音声ノイズ低減アルゴリズム、及び通信ノイズ低減アルゴリズムを含むことを特徴とする、請求項５に記載の装置。
少なくとも１つのプロセッサと、
前記少なくとも１つのプロセッサに通信可能に接続されたメモリと、を含み、
該メモリには、前記少なくとも１つのプロセッサにより実行されると、請求項１から４のいずれか１項に記載の方法を前記少なくとも１つのプロセッサに実行させる、前記少なくとも１つのプロセッサによって実行可能な命令が記憶されていることを特徴とする、電子機器。
コンピュータ命令が記憶されている非一時的なコンピュータ読み取り可能な記憶媒体であって、
前記コンピュータ命令は、請求項１から４のいずれか１項に記載の方法を前記コンピュータに実行させることを特徴とする、非一時的なコンピュータ読み取り可能な記憶媒体。
プロセッサによって実行されると、請求項１から４のいずれか１項に記載の方法が実現されるコンピュータプログラムを含む、コンピュータプログラム製品。