JP2018519552A - ロボット自身音源を解消するシステム - Google Patents
ロボット自身音源を解消するシステム Download PDFInfo
- Publication number
- JP2018519552A JP2018519552A JP2017567760A JP2017567760A JP2018519552A JP 2018519552 A JP2018519552 A JP 2018519552A JP 2017567760 A JP2017567760 A JP 2017567760A JP 2017567760 A JP2017567760 A JP 2017567760A JP 2018519552 A JP2018519552 A JP 2018519552A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- mixed
- sound
- numeric
- sound source
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000005236 sound signal Effects 0.000 claims abstract description 17
- 238000000926 separation method Methods 0.000 claims abstract description 11
- 230000008030 elimination Effects 0.000 claims description 12
- 238000003379 elimination reaction Methods 0.000 claims description 12
- 238000005259 measurement Methods 0.000 claims description 5
- 238000007689 inspection Methods 0.000 claims description 3
- 238000001514 detection method Methods 0.000 claims 1
- 238000005516 engineering process Methods 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 230000006854 communication Effects 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000000034 method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0272—Voice signal separating
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L25/84—Detection of presence or absence of voice signals for discriminating voice from noise
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/022—Knowledge engineering; Knowledge acquisition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/20—Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Quality & Reliability (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
Description
本発明のロボット自身音源解消システムは、
左右サウンドチャンネルが混合されている数字信号を収集する及び出力するピックアップユニットと;
前記ピックアップユニットに連接され、接収したロボット自身音源の参考信号及び左右サウンドチャンネルが混合されている前記数字信号を混合して音声信号を生成して、出力するサウンドカード駆動ユニットと;
前記サウンドカード駆動ユニットに連接され、混合音声信号を左右サウンドチャンネルが混合されている前記数字信号と前記参考信号に分離して、それに、左右サウンドチャンネル信号が混合されている前記数字信号における干渉信号が存在するかどうかを判断して、放送信号量を取得して出力する信号分離ユニットと;
前記信号分離ユニットに連接され、前記参考信号と前記放送信号量と左右サウンドチャンネルが混合されている前記数字信号とを接収して、前記放送信号量によって、左右サウンドチャンネルが混合されている前記数字信号における干渉信号を解消して、出力する音源解消ユニットと;
前記音源解消ユニットに連接され、前記左右サウンドチャンネルが混合されている前記数字信号を識別する識別ユニットと;
を含む。
左右サウンドチャンネルが混合される数字信号を収集し、出力するピックアップユニット1と;
ピックアップユニット1に連接され、接収されたロボット自身音源の参考信号と左右サウンドチャンネルが混合される数字信号を混合して音声信号を形成して、出力するサウンドカード駆動ユニット2と、
サウンドカード駆動ユニット2に連接され、混合音声信号を左右サウンドチャンネルが混合される数字信号と参考信号とに分離して、左右サウンドチャンネルが混合される数字信号における干渉信号が存在するかどうかを判断して、放送信号量を取得して、出力する信号分離ユニット3と、
信号分離ユニット3に連接され、参考信号と放送信号量と左右サウンドチャンネルが混合される数字信号とを接収し、放送信号量によって、左右サウンドチャンネルが混合される数字信号における干渉信号を解消して、出力する音源解消ユニット4と、
音源解消ユニット4に連接され、左右サウンドチャンネルが混合される数字信号を認識する認識ユニット5と;
を含む。
Claims (7)
- 左右サウンドチャンネルが混合されている数字信号を収集し、出力するピックアップユニットと;
前記ピックアップユニットに連接され、接収したロボット自身音源の参考信号と左右サウンドチャンネルが混合されている数字信号とを混合音声信号に混合し生成して出力するサウンドカード駆動ユニットと;
前記サウンドカード駆動ユニットに連接され、混合音声信号を左右サウンドチャンネルが混合されている数字信号と参考信号とに分離して、且つ、左右サウンドチャンネルが混合されている数字信号に干渉信号があるかどうかを判断し、放送信号量を取得して出力する信号分離ユニットと;
前記信号分離ユニットに連接され、参考信号と放送信号量と左右サウンドチャンネルが混合されている数字信号とを接収して、且つ、前記放送信号量によって、左右サウンドチャンネルが混合されている前記数字信号における干渉信号を解消して、出力する音源解消ユニットと;
前記音源解消ユニットに連接され、左右サウンドチャンネルが混合されている数字信号を識別する識別ユニットと;
を含むことを特徴とするロボット自身音源を解消するシステム。 - 前記音源解消ユニットにおいて、前記参考信号と、前記放送信号量と、左右サウンドチャンネルが混合されている前記数字信号とを接収し、前記放送信号量によって、左右サウンドチャンネルが混合されている前記数字信号における干渉信号を解消して、左サウンドチャンネルの数字信号を出力する左サウンドチャンネルの音源を解消するモジュールを含むことを特徴とする請求項1記載のロボット自身音源を解消するシステム。
- 前記音源解消ユニットにおいて、前記参考信号と前記放送信号量と左右サウンドチャンネルが混合されている前記数字信号とを接収し、前記放送信号量によって、左右サウンドチャンネルが混合されている前記数字信号における干渉信号を解消し、右サウンドチャンネルの数字信号を出力する右サウンドチャンネル音源を解消するモジュールをさらに含むことを特徴とする請求項2記載のロボット自身音源を解消するシステム。
- 前記認識ユニットにおいて、前記左サウンドチャンネルの数字信号と前記右サウンドチャンネルの数字信号とを接収して、出力する録音アダプタを含むことを特徴とする請求項3記載のロボット自身音源を解消するシステム。
- 前記認識ユニットにおいて、前記録音アダプタに連接され、前記左サウンドチャンネルの数字信号と前記右サウンドチャンネルの数字信号とを混合して、混合信号に生成して、出力するサウンドチャンネルが混合されるモジュールをさらに含むことを特徴とする請求項4記載のロボット自身音源を解消するシステム。
- 前記認識ユニットにおいて、前記サウンドチャンネルが混合されるモジュールに連接され、前記混合信号における音声信号を検測して、検測結果を取得して、前記結果によって相応する通知を出力する検測モジュールをさらに含むことを特徴とする請求項5記載のロボット自身音源を解消するシステム。
- 前記認識ユニットにおいて、前記検測モジュールと前記サウンドチャンネルが混合されるモジュールとに連接され、接収した前記通知によって、前記混合信号を識別する音声認識モジュールをさらに含むことを特徴とする請求項6記載のロボット自身音源を解消するシステム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510381657.1 | 2015-06-30 | ||
CN201510381657.1A CN106328165A (zh) | 2015-06-30 | 2015-06-30 | 一种机器人自身音源消除系统 |
PCT/CN2016/085760 WO2017000774A1 (zh) | 2015-06-30 | 2016-06-14 | 一种机器人自身音源消除系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018519552A true JP2018519552A (ja) | 2018-07-19 |
JP2018519552A5 JP2018519552A5 (ja) | 2019-05-23 |
Family
ID=57607848
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017567760A Pending JP2018519552A (ja) | 2015-06-30 | 2016-06-14 | ロボット自身音源を解消するシステム |
Country Status (6)
Country | Link |
---|---|
US (1) | US10482898B2 (ja) |
EP (1) | EP3319088A4 (ja) |
JP (1) | JP2018519552A (ja) |
CN (1) | CN106328165A (ja) |
TW (1) | TWI588821B (ja) |
WO (1) | WO2017000774A1 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110534110B (zh) * | 2018-05-25 | 2022-04-15 | 深圳市优必选科技有限公司 | 一种机器人及提高其语音交互识别率的方法、装置和电路 |
US11270712B2 (en) | 2019-08-28 | 2022-03-08 | Insoundz Ltd. | System and method for separation of audio sources that interfere with each other using a microphone array |
CN111883158B (zh) * | 2020-07-30 | 2024-04-16 | 广州易点智慧出行科技有限公司 | 一种回声消除方法和装置 |
CN113035188A (zh) * | 2021-02-25 | 2021-06-25 | 平安普惠企业管理有限公司 | 通话文本生成方法、装置、设备及存储介质 |
CN115103286A (zh) * | 2022-04-29 | 2022-09-23 | 北京瑞森新谱科技股份有限公司 | 一种asio低延时声学检测方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002264053A (ja) * | 2001-03-09 | 2002-09-18 | Japan Science & Technology Corp | ロボット視聴覚システム |
JP2007155986A (ja) * | 2005-12-02 | 2007-06-21 | Mitsubishi Heavy Ind Ltd | 音声認識装置および音声認識装置を備えたロボット |
Family Cites Families (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4974191A (en) * | 1987-07-31 | 1990-11-27 | Syntellect Software Inc. | Adaptive natural language computer interface system |
ATE188793T1 (de) * | 1994-10-12 | 2000-01-15 | Touchtunes Music Corp | Intelligentes system zur numerischen audio- visuellen reproduktion |
US6689947B2 (en) * | 1998-05-15 | 2004-02-10 | Lester Frank Ludwig | Real-time floor controller for control of music, signal processing, mixing, video, lighting, and other systems |
KR100657912B1 (ko) * | 2004-11-18 | 2006-12-14 | 삼성전자주식회사 | 잡음 제거 방법 및 장치 |
US20080119953A1 (en) * | 2005-04-07 | 2008-05-22 | Iofy Corporation | Device and System for Utilizing an Information Unit to Present Content and Metadata on a Device |
JP5170440B2 (ja) * | 2006-05-10 | 2013-03-27 | 本田技研工業株式会社 | 音源追跡システム、方法、およびロボット |
WO2007138503A1 (en) * | 2006-05-31 | 2007-12-06 | Philips Intellectual Property & Standards Gmbh | Method of driving a speech recognition system |
WO2008085207A2 (en) * | 2006-12-29 | 2008-07-17 | Prodea Systems, Inc. | Multi-services application gateway |
US8468244B2 (en) * | 2007-01-05 | 2013-06-18 | Digital Doors, Inc. | Digital information infrastructure and method for security designated data and with granular data stores |
CN101084817B (zh) * | 2007-04-26 | 2012-08-22 | 复旦大学 | 开放智能计算构架的家用多功能小型服务机器人 |
KR20080111290A (ko) | 2007-06-18 | 2008-12-23 | 삼성전자주식회사 | 원거리 음성 인식을 위한 음성 성능을 평가하는 시스템 및방법 |
TW200926150A (en) * | 2007-12-07 | 2009-06-16 | Univ Nat Chiao Tung | Intelligent voice purification system and its method thereof |
JP5075664B2 (ja) * | 2008-02-15 | 2012-11-21 | 株式会社東芝 | 音声対話装置及び支援方法 |
DE202011111062U1 (de) * | 2010-01-25 | 2019-02-19 | Newvaluexchange Ltd. | Vorrichtung und System für eine Digitalkonversationsmanagementplattform |
JP5328744B2 (ja) * | 2010-10-15 | 2013-10-30 | 本田技研工業株式会社 | 音声認識装置及び音声認識方法 |
CN102141812A (zh) | 2010-11-16 | 2011-08-03 | 深圳中科智酷机器人科技有限公司 | 机器人 |
CN102890936A (zh) * | 2011-07-19 | 2013-01-23 | 联想(北京)有限公司 | 一种音频处理方法、终端设备及系统 |
CN102305925A (zh) * | 2011-07-22 | 2012-01-04 | 北京大学 | 一种机器人连续声源定位方法 |
TWI442384B (zh) | 2011-07-26 | 2014-06-21 | Ind Tech Res Inst | 以麥克風陣列為基礎之語音辨識系統與方法 |
DE112011105791B4 (de) * | 2011-11-02 | 2019-12-12 | Mitsubishi Electric Corporation | Störungsunterdrückungsvorrichtung |
JP5971047B2 (ja) * | 2012-09-12 | 2016-08-17 | 沖電気工業株式会社 | 音声信号処理装置、方法及びプログラム |
CN102915732A (zh) * | 2012-10-31 | 2013-02-06 | 黑龙江省电力有限公司信息通信分公司 | 抑制背景广播的语音指令识别方法与装置 |
US9747899B2 (en) * | 2013-06-27 | 2017-08-29 | Amazon Technologies, Inc. | Detecting self-generated wake expressions |
CN103593048B (zh) * | 2013-10-28 | 2017-01-11 | 浙江大学 | 动物机器人系统的语音导航系统及方法 |
CN104123950B (zh) * | 2014-07-17 | 2015-11-25 | 努比亚技术有限公司 | 一种录音方法及装置 |
US9849588B2 (en) * | 2014-09-17 | 2017-12-26 | Brain Corporation | Apparatus and methods for remotely controlling robotic devices |
-
2015
- 2015-06-30 CN CN201510381657.1A patent/CN106328165A/zh active Pending
-
2016
- 2016-06-14 EP EP16817138.7A patent/EP3319088A4/en not_active Withdrawn
- 2016-06-14 JP JP2017567760A patent/JP2018519552A/ja active Pending
- 2016-06-14 WO PCT/CN2016/085760 patent/WO2017000774A1/zh active Application Filing
- 2016-06-14 US US15/739,320 patent/US10482898B2/en active Active
- 2016-06-29 TW TW105120630A patent/TWI588821B/zh not_active IP Right Cessation
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002264053A (ja) * | 2001-03-09 | 2002-09-18 | Japan Science & Technology Corp | ロボット視聴覚システム |
JP2007155986A (ja) * | 2005-12-02 | 2007-06-21 | Mitsubishi Heavy Ind Ltd | 音声認識装置および音声認識装置を備えたロボット |
Also Published As
Publication number | Publication date |
---|---|
CN106328165A (zh) | 2017-01-11 |
TWI588821B (zh) | 2017-06-21 |
US10482898B2 (en) | 2019-11-19 |
EP3319088A1 (en) | 2018-05-09 |
TW201701272A (zh) | 2017-01-01 |
EP3319088A4 (en) | 2019-01-23 |
WO2017000774A1 (zh) | 2017-01-05 |
US20190115042A1 (en) | 2019-04-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2018519552A (ja) | ロボット自身音源を解消するシステム | |
US9913022B2 (en) | System and method of improving voice quality in a wireless headset with untethered earbuds of a mobile device | |
US9516411B2 (en) | Signal-separation system using a directional microphone array and method for providing same | |
US8036715B2 (en) | Vehicle communication system | |
US6868045B1 (en) | Voice control system with a microphone array | |
US20160269844A1 (en) | Stereo headset, terminal, and audio signal processing methods thereof | |
CA2524338A1 (en) | Hearing aid system, a hearing aid and a method for processing audio signals | |
CN107004425B (zh) | 共享声学空间中的增强型对话通信 | |
US20100113104A1 (en) | Hands-free telephone conversation apparatus | |
WO2017026568A1 (ko) | 음질 개선을 위한 방법 및 헤드셋 | |
CN107004423A (zh) | 用于共享声学空间中的增强型交谈式通信的反馈消除 | |
US20170084287A1 (en) | Electronic device and method of audio processing thereof | |
JP2018519552A5 (ja) | ||
US20150117669A1 (en) | Apparatus and method for controlling beamforming microphone considering location of driver seat | |
CN104136299A (zh) | 用于在车内对声音进行导向的系统、方法以及装置 | |
CN102915732A (zh) | 抑制背景广播的语音指令识别方法与装置 | |
CN106569774B (zh) | 一种去除噪声的方法及终端 | |
CN108353229A (zh) | 车辆中的音频信号处理 | |
US20120197635A1 (en) | Method for generating an audio signal | |
US20160165373A1 (en) | Wireless audio transmission system, in particular wireless microphone system | |
JP6674737B2 (ja) | 位置データを有する聴取装置および聴取装置の動作方法 | |
CN110996238A (zh) | 双耳同步信号处理助听系统及方法 | |
CN111512363A (zh) | 语音辅助设备和方法 | |
JP5377442B2 (ja) | 参照情報により雑音から音声を分離するシステム | |
US9118527B2 (en) | Data during analog audio |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180221 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20181228 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190115 |
|
A524 | Written submission of copy of amendment under article 19 pct |
Free format text: JAPANESE INTERMEDIATE CODE: A524 Effective date: 20190411 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20190709 |