JP2018519552A - ロボット自身音源を解消するシステム - Google Patents

ロボット自身音源を解消するシステム Download PDF

Info

Publication number
JP2018519552A
JP2018519552A JP2017567760A JP2017567760A JP2018519552A JP 2018519552 A JP2018519552 A JP 2018519552A JP 2017567760 A JP2017567760 A JP 2017567760A JP 2017567760 A JP2017567760 A JP 2017567760A JP 2018519552 A JP2018519552 A JP 2018519552A
Authority
JP
Japan
Prior art keywords
signal
mixed
sound
numeric
sound source
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2017567760A
Other languages
English (en)
Other versions
JP2018519552A5 (ja
Inventor
リウ、シン
ガオ、ペン
シ、ジアキ
ファン、リチュン
Original Assignee
ユウトウ・テクノロジー(ハンジョウ)・カンパニー・リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ユウトウ・テクノロジー(ハンジョウ)・カンパニー・リミテッド filed Critical ユウトウ・テクノロジー(ハンジョウ)・カンパニー・リミテッド
Publication of JP2018519552A publication Critical patent/JP2018519552A/ja
Publication of JP2018519552A5 publication Critical patent/JP2018519552A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0272Voice signal separating
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L25/84Detection of presence or absence of voice signals for discriminating voice from noise
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Quality & Reliability (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本発明はロボット自身音源を解消するシステムを公開し、そのロボット自身音源を解消するシステムにおいて、左右サウンドチャンネルが混合されている数字信号を収集して出力するピックアップユニットと;接収したロボット自身音源の参考信号と左右サウンドチャンネルが混合されている数字信号とを混合音声信号に混合し生成して出力するサウンドカード駆動ユニットと;混合音声信号を左右サウンドチャンネルが混合されている数字信号と参考信号とに分離して、且つ、左右サウンドチャンネルが混合されている数字信号に干渉信号があるかどうかを判断し、放送信号量を取得して出力する信号分離ユニットと;参考信号と放送信号量と左右サウンドチャンネルが混合されている数字信号とを接収して、且つ、放送信号量によって、左右サウンドチャンネルが混合されている数字信号における干渉信号を解消して、出力する音源解消ユニットと;左右サウンドチャンネルが混合されている数字信号を識別する識別ユニットと;を含む。本発明により、ロボット自身の放送した音楽における干渉信号を相殺や抑制でき、ロボットの音声認識率を高めることになる。

Description

本発明はオーディオ識別に関し、特に、ロボットシステムにおける自身音源を解消するシステムに関するものである。
コンピューター技術、パターン識別などの技術の発展とともに、異なる場合に適応する音声識別システムが相次いで開発されてきて、音声認識と処理技術のその強い技術の優勢がますます顕著になってくる。近年、音声識別はコンピューター、情報処理、通信と電子システム、自動制御などの分野での応用がますます広くなってくる。人々は音声通信過程で周囲環境や伝送媒を介して導入された騒音や、通信設備内部に存在する騒音や、他のスピーカーからの干渉などを受けることは必然的に避けられないので、最終的接収者は接収した音声が純粋な原始音声信号ではなくて、騒音公害を受けたノイズある音声信号であることになる。既存のロボットシステムに、ロボットのHIFI(High-Fidelity、ハイファイ)サウンドシステムが音楽を放送する時、発生した音楽信号はロボットマイクロホンによりピックアップされた音声信号に混じられることがあり、自動音声識別システムに入った音声信号対騒音比が減少し、ロボット自動音声を識別する(Automatic Speech Recognition、ASR)システムの認識率に一定の干渉をもたらし、認識率を低下させ、ロボット音声識別のユーザー体験に影響を及ぼす。
発明の内容
既存の音声識別及び処理技術に存在する上述した問題に対して、本発明はロボット自身の放送した干渉信号を相殺や抑制でき、音声認識率を高めることができることを目的としてロボット自身音源を解消するシステムを提供する。
具体的な技術案は以下通りであり、すなわち:
本発明のロボット自身音源解消システムは、
左右サウンドチャンネルが混合されている数字信号を収集する及び出力するピックアップユニットと;
前記ピックアップユニットに連接され、接収したロボット自身音源の参考信号及び左右サウンドチャンネルが混合されている前記数字信号を混合して音声信号を生成して、出力するサウンドカード駆動ユニットと;
前記サウンドカード駆動ユニットに連接され、混合音声信号を左右サウンドチャンネルが混合されている前記数字信号と前記参考信号に分離して、それに、左右サウンドチャンネル信号が混合されている前記数字信号における干渉信号が存在するかどうかを判断して、放送信号量を取得して出力する信号分離ユニットと;
前記信号分離ユニットに連接され、前記参考信号と前記放送信号量と左右サウンドチャンネルが混合されている前記数字信号とを接収して、前記放送信号量によって、左右サウンドチャンネルが混合されている前記数字信号における干渉信号を解消して、出力する音源解消ユニットと;
前記音源解消ユニットに連接され、前記左右サウンドチャンネルが混合されている前記数字信号を識別する識別ユニットと;
を含む。
好ましくは、前記音源解消ユニットにおいて、前記参考信号と前記放送信号量と左右サウンドチャンネルが混合されて前記数字信号とを接収し、前記放送信号量によって、左右サウンドチャンネルが混合される前記数字信号における干渉信号を解消し、左サウンドチャンネルの数字信号を出力する左サウンドチャンネル音源を解消するモジュールを含む。
好ましくは、前記音源解消ユニットにおいて、前記参考信号と前記放送信号量と左右サウンドチャンネルが混合される前記数字信号とを接収し、前記放送信号量によって、左右サウンドチャンネルが混合される前記数字信号における干渉信号を解消し、右サウンドチャンネルの数字信号を出力する右サウンドチャンネル音源を解消するモジュールをさらに含む。
好ましくは、前記認識ユニットにおいて、前記左サウンドチャンネルの数字信号と前記右サウンドチャンネルの数字信号とを接収して、出力する録音アダプタを含む。
好ましくは、前記認識ユニットにおいて、前記録音アダプタに連接され、前記左サウンドチャンネルの数字信号と前記右サウンドチャンネルの数字信号を混合して混合信号を生成して、出力するサウンドチャンネルが混合されるモジュールをさらに含む。
好ましくは、前記認識ユニットにおいて、前記サウンドチャンネルが混合されるモジュールに連接され、前記混合信号における音声信号を検測して、検査結果を取得して、前記検査結果によって、相応しい通知を出力する検測モジュールをさらに含む。
好ましくは、前記認識ユニットにおいて、前記検測モジュールと前記サウンドチャンネルが混合されるモジュールに連接され、接収した前記通知によって、前記混合信号を識別する音声認識モジュールをさらに含む。
本発明の技術案により、ロボット自身音源を解消するシステムはロボット自身の放送した音楽における干渉信号を相殺や抑制することができ、音声認識に純粋な音声信号を提供するようにより、ロボットの音声認識率を高めるようになる。
図1は本発明の一つ好ましい実施例の、ロボット自身音源を解消するシステムのモジュール図である。
具体的な実施形態
以下は、本発明の実施形態の付図を参照しながら、本発明実施例の技術案をはっきり、完全的に説明し、明らかに、記載されている実施例はただ本発明の一部だけであり、全部の実施例ではない。本発明の実施例に基づいて、当業者が創造的な労働をしなかったもとに取得した他の実施例は全部本発明の保護範囲内に属する。
説明すべきのは、衝突しない状況では、本発明の実施例及び実施例中の特徴を相互的に組み合わせることができる。
以下は図面と具体的な実施例により、本発明をもっと詳しく説明するが、本発明の制限とするものではない。
図1の示したように、本発明のロボット自身音源を解消するシステムは、
左右サウンドチャンネルが混合される数字信号を収集し、出力するピックアップユニット1と;
ピックアップユニット1に連接され、接収されたロボット自身音源の参考信号と左右サウンドチャンネルが混合される数字信号を混合して音声信号を形成して、出力するサウンドカード駆動ユニット2と、
サウンドカード駆動ユニット2に連接され、混合音声信号を左右サウンドチャンネルが混合される数字信号と参考信号とに分離して、左右サウンドチャンネルが混合される数字信号における干渉信号が存在するかどうかを判断して、放送信号量を取得して、出力する信号分離ユニット3と、
信号分離ユニット3に連接され、参考信号と放送信号量と左右サウンドチャンネルが混合される数字信号とを接収し、放送信号量によって、左右サウンドチャンネルが混合される数字信号における干渉信号を解消して、出力する音源解消ユニット4と、
音源解消ユニット4に連接され、左右サウンドチャンネルが混合される数字信号を認識する認識ユニット5と;
を含む。
更に、サウンドカード駆動ユニット2はUSBサウンドカード駆動を採用することができ、USBサウンドカードはAndroid(登録商標)システム設備中の標準USBサウンドカード駆動であり;ピックアップユニット1はダブルサウンドチャンネル遠距離ピックアップマイクロホンを採用することができ、当該マイクロホンはステレオをピックアップする機能を具備し;また、一つのUSBインターフェースと一つの3.5Line-outインターフェースを含むことができ、3.5Line-outインターフェースは左右サウンドチャンネルPCM(パルスコード変調)の参考信号を収集して、収集された参考信号をマイクロホンがピックアップした音声信号と一緒に、USBインターフェースを介して、Androidシステムに同期に出力するために用いられ;USBインターフェースを介して、ロボット自身音源を解消するマイクロホンとロボットのメインコントロールボード3とを接続して、USBサウンドカードの方式でAndroidシステムにアクセスし;よって、マイクロホンにより収集された左右サウンドチャンネルが混合される数字信号と3.5Line-outインターフェースから収集された左右サウンドチャンネルPCMの参考信号とを、USBサウンドカード駆動を介して、信号分離ユニット3まで出力する。信号分離ユニット3はUSBサウンドカード駆動により収集された混合音声信号を左右サウンドチャンネルが混合される数字信号と参考信号とに分離し;それに左右サウンドチャンネルが混合される数字信号によってシステムは音楽を放送しているかどうかを判断する。システムは音楽を放送している場合は、放送信号量をTrueに設定して、そして放送信号量と左右サウンドチャンネルが混合される数字信号と参考信号とを同期に音源解消ユニット4に送信し、処理し;システムは音楽を放送してない場合、放送信号量をFalseに設定し、システム処理流れが直接的に認識ユニット5に入る。
本実施例では、ロボット自身音源を解消するシステムを採用することにより、ロボット自身の放送した音楽における干渉信号を相殺や抑制することができ、音声識別には純粋な音声信号を提供することができ、よって、ロボットの音声認識率を向上させるようになり、よってユーザーのハンズフリー(Hands-free)の音声識別体験も高めるようになる。
好ましい実施例では、音源解消ユニット4は参考信号と放送信号量と左右サウンドチャンネルが混合される数字信号とを接収し、放送信号量によって左右サウンドチャンネルが混合される数字信号における干渉信号を解消し、左サウンドチャンネルの数字信号を出力する左サウンドチャンネル音源解消モジュール41を含むことができる。
本実施例にの左サウンドチャンネル音源を解消するモジュール41はシステムが音楽を放送する時に音声識別に対する干渉を抑制することができる。サウンドチャンネル音源を解消するモジュールに入力されるパラメータが三つある:マイクロホンがピックアップした左右サウンドチャンネルが混合される数字信号と自身音源の左右サウンドチャンネルPCMの参考信号と放送信号量。放送信号量はTrueである場合、左サウンドチャンネル音源解消モジュール41はマイクロホンによりピックアップしされた左右サウンドチャンネルが混合される数字信号に対して自身音源を解消する。左サウンドチャンネル音源を解消するモジュール41は左サウンドチャンネルの数字信号を出力し;音楽を放送信号量はFalseである場合、左サウンドチャンネル音源を解消するモジュール41を越えて、直接にシステムの流れは認識ユニット5に入る。
好ましい実施形例では、音源解消ユニット4は参考信号と放送信号量と左右サウンドチャンネルが混合される数字信号とを接収し、放送信号量によって、左右サウンドチャンネルが混合される数字信号における干渉信号を解消して、右サウンドチャンネルの数字信号を出力する右サウンドチャンネル音源を解消するモジュール42をさらに含む。
本実施例では、右サウンドチャンネル音源を解消するモジュール42はシステムが音楽を放送する時に、音声認識に対する干渉を抑制することができる。右サウンドチャンネル音源解消モジュール42に入力されるパラメータは三つある:マイクロホンがピックアップした左右サウンドチャンネルが混合される数字信号と自身音源の左右サウンドチャンネルPCMの参考信号と放送信号量。放送信号料はTrueである場合、右サウンドチャンネル音源を解消するモジュール42はマイクロホンがピックアップした左右サウンドチャンネルが混合される数字信号に対して自身音源を解消する。右サウンドチャンネル音源を解消するモジュール42は右サウンドチャンネルの数字信号を出力する。音楽放送信号量はFalseである場合、右サウンドチャンネル音源を解消するモジュール42を越えて、システムの流れは直接識別ユニット5に入る。
好ましい実施例では、認識ユニット5は左サウンドチャンネル音源を解消するモジュール41と右サウンドチャンネル音源を解消するモジュール42とに接され、左サウンドチャンネルの数字信号と右サウンドチャンネルの数字信号とを接収して、出力する録音アダプタ51を含むことができる。
本実施例では、採用された録音アダプタ51は録音効果が良い、音声が純粋で、且つ、騒音がないメリットを持つ。
好ましい実施例では、認識ユニット5は録音アダプタ51に連接され、左サウンドチャンネルの数字信号と右サウンドチャンネルの数字信号とを混合して混合信号を生成して、出力するサウンドチャンネルを混合するモジュール52をさらに含むことができる。
本実施例では、サウンドチャンネルを混合するモジュール52を採用して、録音アダプタ51から出力された左サウンドチャンネルの数字信号と右サウンドチャンネルの数字信号を混合して、出力することができる。
好ましい実施例では、認識ユニット5はサウンドチャンネル混合モジュール52に連接され、混合信号における音声信号を検測し、検測結果を取得して、結果によって、相応しい通知を出力する検測モジュール53をさらに含むことができる。
本実施形態中で、検測モジュール53は混合信号を検測し、音声信号を検出する場合、相応しい通知事件を生成して、出力する。
好ましい実施例では、認識ユニット5は検査モジュール53とサウンドチャンネルを混合するモジュール52とにそれぞれ連接され、接収された通知によって、混合信号を識別する音声識別モジュール54をさらに含むことができる。
本実施例では、検測モジュール53は音声信号を検出した場合、相応しい通知事件を生成し、音声認識モジュール54を起動させ、音声認識モジュール54により、音声を識別する。
本発明はUSBサウンドカードを採用して、マイクロホンが収集した数字信号を信号分離ユニット3に送信する。ロボット自身音源を解消するシステムはロボットサウンドシステムの放送した自身音源を有効的に解消や抑制することができる。信号分離ユニット3を採用して、マイクロホンにより収集された左右サウンドチャンネルが混合される数字信号と参考信号とを相互的に分離することができ、且つ、同時に音源解消ユニット4に入力して処理することができ;音源解消ユニット4により処理した後、信号対騒音比が高い音声信号を出力して、よって、音声認識率を高めるようになる。ロボット自身音源を解消するシステムはまたテキストフォーマットから変換された音声フォーマットの信号にも有効に自身音源を解消するまたは抑制することができる。
上記述べたのはただ本発明の好ましい実施例であり、本発明の実施方式と保護範囲を制限する意図がなくて、当業者には、本発明の明細書及び図面の内容を使って作り出された等しい置換や明らかな変更により取得された方案はすべて本発明の保護範囲内に属するということに意識すべきである。

Claims (7)

  1. 左右サウンドチャンネルが混合されている数字信号を収集し、出力するピックアップユニットと;
    前記ピックアップユニットに連接され、接収したロボット自身音源の参考信号と左右サウンドチャンネルが混合されている数字信号とを混合音声信号に混合し生成して出力するサウンドカード駆動ユニットと;
    前記サウンドカード駆動ユニットに連接され、混合音声信号を左右サウンドチャンネルが混合されている数字信号と参考信号とに分離して、且つ、左右サウンドチャンネルが混合されている数字信号に干渉信号があるかどうかを判断し、放送信号量を取得して出力する信号分離ユニットと;
    前記信号分離ユニットに連接され、参考信号と放送信号量と左右サウンドチャンネルが混合されている数字信号とを接収して、且つ、前記放送信号量によって、左右サウンドチャンネルが混合されている前記数字信号における干渉信号を解消して、出力する音源解消ユニットと;
    前記音源解消ユニットに連接され、左右サウンドチャンネルが混合されている数字信号を識別する識別ユニットと;
    を含むことを特徴とするロボット自身音源を解消するシステム。
  2. 前記音源解消ユニットにおいて、前記参考信号と、前記放送信号量と、左右サウンドチャンネルが混合されている前記数字信号とを接収し、前記放送信号量によって、左右サウンドチャンネルが混合されている前記数字信号における干渉信号を解消して、左サウンドチャンネルの数字信号を出力する左サウンドチャンネルの音源を解消するモジュールを含むことを特徴とする請求項1記載のロボット自身音源を解消するシステム。
  3. 前記音源解消ユニットにおいて、前記参考信号と前記放送信号量と左右サウンドチャンネルが混合されている前記数字信号とを接収し、前記放送信号量によって、左右サウンドチャンネルが混合されている前記数字信号における干渉信号を解消し、右サウンドチャンネルの数字信号を出力する右サウンドチャンネル音源を解消するモジュールをさらに含むことを特徴とする請求項2記載のロボット自身音源を解消するシステム。
  4. 前記認識ユニットにおいて、前記左サウンドチャンネルの数字信号と前記右サウンドチャンネルの数字信号とを接収して、出力する録音アダプタを含むことを特徴とする請求項3記載のロボット自身音源を解消するシステム。
  5. 前記認識ユニットにおいて、前記録音アダプタに連接され、前記左サウンドチャンネルの数字信号と前記右サウンドチャンネルの数字信号とを混合して、混合信号に生成して、出力するサウンドチャンネルが混合されるモジュールをさらに含むことを特徴とする請求項4記載のロボット自身音源を解消するシステム。
  6. 前記認識ユニットにおいて、前記サウンドチャンネルが混合されるモジュールに連接され、前記混合信号における音声信号を検測して、検測結果を取得して、前記結果によって相応する通知を出力する検測モジュールをさらに含むことを特徴とする請求項5記載のロボット自身音源を解消するシステム。
  7. 前記認識ユニットにおいて、前記検測モジュールと前記サウンドチャンネルが混合されるモジュールとに連接され、接収した前記通知によって、前記混合信号を識別する音声認識モジュールをさらに含むことを特徴とする請求項6記載のロボット自身音源を解消するシステム。
JP2017567760A 2015-06-30 2016-06-14 ロボット自身音源を解消するシステム Pending JP2018519552A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201510381657.1 2015-06-30
CN201510381657.1A CN106328165A (zh) 2015-06-30 2015-06-30 一种机器人自身音源消除系统
PCT/CN2016/085760 WO2017000774A1 (zh) 2015-06-30 2016-06-14 一种机器人自身音源消除系统

Publications (2)

Publication Number Publication Date
JP2018519552A true JP2018519552A (ja) 2018-07-19
JP2018519552A5 JP2018519552A5 (ja) 2019-05-23

Family

ID=57607848

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017567760A Pending JP2018519552A (ja) 2015-06-30 2016-06-14 ロボット自身音源を解消するシステム

Country Status (6)

Country Link
US (1) US10482898B2 (ja)
EP (1) EP3319088A4 (ja)
JP (1) JP2018519552A (ja)
CN (1) CN106328165A (ja)
TW (1) TWI588821B (ja)
WO (1) WO2017000774A1 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110534110B (zh) * 2018-05-25 2022-04-15 深圳市优必选科技有限公司 一种机器人及提高其语音交互识别率的方法、装置和电路
US11270712B2 (en) 2019-08-28 2022-03-08 Insoundz Ltd. System and method for separation of audio sources that interfere with each other using a microphone array
CN111883158B (zh) * 2020-07-30 2024-04-16 广州易点智慧出行科技有限公司 一种回声消除方法和装置
CN113035188A (zh) * 2021-02-25 2021-06-25 平安普惠企业管理有限公司 通话文本生成方法、装置、设备及存储介质
CN115103286A (zh) * 2022-04-29 2022-09-23 北京瑞森新谱科技股份有限公司 一种asio低延时声学检测方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002264053A (ja) * 2001-03-09 2002-09-18 Japan Science & Technology Corp ロボット視聴覚システム
JP2007155986A (ja) * 2005-12-02 2007-06-21 Mitsubishi Heavy Ind Ltd 音声認識装置および音声認識装置を備えたロボット

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4974191A (en) * 1987-07-31 1990-11-27 Syntellect Software Inc. Adaptive natural language computer interface system
ATE188793T1 (de) * 1994-10-12 2000-01-15 Touchtunes Music Corp Intelligentes system zur numerischen audio- visuellen reproduktion
US6689947B2 (en) * 1998-05-15 2004-02-10 Lester Frank Ludwig Real-time floor controller for control of music, signal processing, mixing, video, lighting, and other systems
KR100657912B1 (ko) * 2004-11-18 2006-12-14 삼성전자주식회사 잡음 제거 방법 및 장치
US20080119953A1 (en) * 2005-04-07 2008-05-22 Iofy Corporation Device and System for Utilizing an Information Unit to Present Content and Metadata on a Device
JP5170440B2 (ja) * 2006-05-10 2013-03-27 本田技研工業株式会社 音源追跡システム、方法、およびロボット
WO2007138503A1 (en) * 2006-05-31 2007-12-06 Philips Intellectual Property & Standards Gmbh Method of driving a speech recognition system
WO2008085207A2 (en) * 2006-12-29 2008-07-17 Prodea Systems, Inc. Multi-services application gateway
US8468244B2 (en) * 2007-01-05 2013-06-18 Digital Doors, Inc. Digital information infrastructure and method for security designated data and with granular data stores
CN101084817B (zh) * 2007-04-26 2012-08-22 复旦大学 开放智能计算构架的家用多功能小型服务机器人
KR20080111290A (ko) 2007-06-18 2008-12-23 삼성전자주식회사 원거리 음성 인식을 위한 음성 성능을 평가하는 시스템 및방법
TW200926150A (en) * 2007-12-07 2009-06-16 Univ Nat Chiao Tung Intelligent voice purification system and its method thereof
JP5075664B2 (ja) * 2008-02-15 2012-11-21 株式会社東芝 音声対話装置及び支援方法
DE202011111062U1 (de) * 2010-01-25 2019-02-19 Newvaluexchange Ltd. Vorrichtung und System für eine Digitalkonversationsmanagementplattform
JP5328744B2 (ja) * 2010-10-15 2013-10-30 本田技研工業株式会社 音声認識装置及び音声認識方法
CN102141812A (zh) 2010-11-16 2011-08-03 深圳中科智酷机器人科技有限公司 机器人
CN102890936A (zh) * 2011-07-19 2013-01-23 联想(北京)有限公司 一种音频处理方法、终端设备及系统
CN102305925A (zh) * 2011-07-22 2012-01-04 北京大学 一种机器人连续声源定位方法
TWI442384B (zh) 2011-07-26 2014-06-21 Ind Tech Res Inst 以麥克風陣列為基礎之語音辨識系統與方法
DE112011105791B4 (de) * 2011-11-02 2019-12-12 Mitsubishi Electric Corporation Störungsunterdrückungsvorrichtung
JP5971047B2 (ja) * 2012-09-12 2016-08-17 沖電気工業株式会社 音声信号処理装置、方法及びプログラム
CN102915732A (zh) * 2012-10-31 2013-02-06 黑龙江省电力有限公司信息通信分公司 抑制背景广播的语音指令识别方法与装置
US9747899B2 (en) * 2013-06-27 2017-08-29 Amazon Technologies, Inc. Detecting self-generated wake expressions
CN103593048B (zh) * 2013-10-28 2017-01-11 浙江大学 动物机器人系统的语音导航系统及方法
CN104123950B (zh) * 2014-07-17 2015-11-25 努比亚技术有限公司 一种录音方法及装置
US9849588B2 (en) * 2014-09-17 2017-12-26 Brain Corporation Apparatus and methods for remotely controlling robotic devices

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002264053A (ja) * 2001-03-09 2002-09-18 Japan Science & Technology Corp ロボット視聴覚システム
JP2007155986A (ja) * 2005-12-02 2007-06-21 Mitsubishi Heavy Ind Ltd 音声認識装置および音声認識装置を備えたロボット

Also Published As

Publication number Publication date
CN106328165A (zh) 2017-01-11
TWI588821B (zh) 2017-06-21
US10482898B2 (en) 2019-11-19
EP3319088A1 (en) 2018-05-09
TW201701272A (zh) 2017-01-01
EP3319088A4 (en) 2019-01-23
WO2017000774A1 (zh) 2017-01-05
US20190115042A1 (en) 2019-04-18

Similar Documents

Publication Publication Date Title
JP2018519552A (ja) ロボット自身音源を解消するシステム
US9913022B2 (en) System and method of improving voice quality in a wireless headset with untethered earbuds of a mobile device
US9516411B2 (en) Signal-separation system using a directional microphone array and method for providing same
US8036715B2 (en) Vehicle communication system
US6868045B1 (en) Voice control system with a microphone array
US20160269844A1 (en) Stereo headset, terminal, and audio signal processing methods thereof
CA2524338A1 (en) Hearing aid system, a hearing aid and a method for processing audio signals
CN107004425B (zh) 共享声学空间中的增强型对话通信
US20100113104A1 (en) Hands-free telephone conversation apparatus
WO2017026568A1 (ko) 음질 개선을 위한 방법 및 헤드셋
CN107004423A (zh) 用于共享声学空间中的增强型交谈式通信的反馈消除
US20170084287A1 (en) Electronic device and method of audio processing thereof
JP2018519552A5 (ja)
US20150117669A1 (en) Apparatus and method for controlling beamforming microphone considering location of driver seat
CN104136299A (zh) 用于在车内对声音进行导向的系统、方法以及装置
CN102915732A (zh) 抑制背景广播的语音指令识别方法与装置
CN106569774B (zh) 一种去除噪声的方法及终端
CN108353229A (zh) 车辆中的音频信号处理
US20120197635A1 (en) Method for generating an audio signal
US20160165373A1 (en) Wireless audio transmission system, in particular wireless microphone system
JP6674737B2 (ja) 位置データを有する聴取装置および聴取装置の動作方法
CN110996238A (zh) 双耳同步信号处理助听系统及方法
CN111512363A (zh) 语音辅助设备和方法
JP5377442B2 (ja) 参照情報により雑音から音声を分離するシステム
US9118527B2 (en) Data during analog audio

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180221

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20181228

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190115

A524 Written submission of copy of amendment under article 19 pct

Free format text: JAPANESE INTERMEDIATE CODE: A524

Effective date: 20190411

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20190709