JP6023823B2 - 音声信号を混合する方法、装置及びコンピュータプログラム - Google Patents
音声信号を混合する方法、装置及びコンピュータプログラム Download PDFInfo
- Publication number
- JP6023823B2 JP6023823B2 JP2014561192A JP2014561192A JP6023823B2 JP 6023823 B2 JP6023823 B2 JP 6023823B2 JP 2014561192 A JP2014561192 A JP 2014561192A JP 2014561192 A JP2014561192 A JP 2014561192A JP 6023823 B2 JP6023823 B2 JP 6023823B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- audio signal
- audio
- time
- frequency
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000005236 sound signal Effects 0.000 title claims description 110
- 238000000034 method Methods 0.000 title claims description 42
- 238000004590 computer program Methods 0.000 title claims description 3
- 238000001514 detection method Methods 0.000 claims description 35
- 238000012545 processing Methods 0.000 claims description 27
- 230000000694 effects Effects 0.000 claims description 15
- 230000004044 response Effects 0.000 claims description 4
- 241001342895 Chorus Species 0.000 claims description 2
- HAORKNGNJCEJBX-UHFFFAOYSA-N cyprodinil Chemical compound N=1C(C)=CC(C2CC2)=NC=1NC1=CC=CC=C1 HAORKNGNJCEJBX-UHFFFAOYSA-N 0.000 claims description 2
- 230000005284 excitation Effects 0.000 claims description 2
- 238000005562 fading Methods 0.000 claims description 2
- 230000008569 process Effects 0.000 description 13
- 238000004891 communication Methods 0.000 description 9
- 230000003595 spectral effect Effects 0.000 description 8
- 238000013459 approach Methods 0.000 description 5
- 239000000654 additive Substances 0.000 description 4
- 230000000996 additive effect Effects 0.000 description 4
- 230000001419 dependent effect Effects 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 230000002411 adverse Effects 0.000 description 2
- 230000002238 attenuated effect Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 239000002609 medium Substances 0.000 description 2
- 230000002829 reductive effect Effects 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 101000863856 Homo sapiens Shiftless antiviral inhibitor of ribosomal frameshifting protein Proteins 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 239000006227 byproduct Substances 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000019771 cognition Effects 0.000 description 1
- 230000003930 cognitive ability Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 210000005069 ears Anatomy 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000036962 time dependent Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 230000007723 transport mechanism Effects 0.000 description 1
- 239000006163 transport media Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/003—Changing voice quality, e.g. pitch or formants
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0272—Voice signal separating
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0364—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/56—Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities
- H04M3/568—Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities audio processing specific to telephonic conferencing, e.g. spatial distribution, mixing of participants
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Quality & Reliability (AREA)
- Telephone Function (AREA)
- Telephonic Communication Services (AREA)
- Stereophonic System (AREA)
Description
米国特許出願公開第2009/0150151号明細書(特許文献2)は、複数のマイクロホンによって拾得されたオーディオ信号を処理し、それらの加法混合を出力する装置を開示している。装置は、特に、異なるオーディオ信号における同時の発話を特定する特定部と、同時の発話のうちの1つをキャッシュするよう動作可能な記憶部とを有する。同時の発話を伴うエピソードの間、アクティブ音声を含む信号の1つは混合されず、代わりに、同時の発話を伴うエピソードが終わるまで記憶部にキャッシュされ得る。エピソードの終了時点で、キャッシュされた音声は、記憶部から取り出され、通常の又は速められた速度で、混合に出力される。
本発明の目的は、混合された信号において音声信号の明りょう度を改善することである。特に、本発明は、混合された信号によって搬送される発話された自然言語を復号する聴取者の能力に影響を及ぼすと期待される条件を改善することを目的とする。他の目的は、混合された音声信号においてトーカコリジョンを軽減することである。本発明の更なる目的は、混合された音声信号において同時の発話の悪影響を減らすことである。
図1は、本発明の例となる実施形態に従う音声信号混合装置100を示す。入力音声信号i1,i2,i3,i4は、インターフェース101で受信される。インターフェース101は、パケットスイッチドネットワーク(図示せず。)へのネットワークインターフェースであってよく、パケットスイッチドネットワークから、混合装置100は、パケット化されたビットストリームとして入力音声信号を受信する。混合装置100において、夫々の入力音声信号i1,i2,i3,i4は、コリジョン検出部102、ミキサ104及びセレクタ105へ供給され、セレクタ105は、選択された音声信号ij(複数を含む。)を、セレクタ105の下流に位置するプロセッサ103へ転送するよう動作する。図1では、セレクタ105は、多投単極スイッチによって象徴的に表されている。本発明は、図1によって示されている簡略化された場合に制限されない。例えば、1よりも多い入力音声信号が、肯定的なトーカコリジョンの検出結果に応答して、処理を受けてよいことが考えられる。
本発明の更なる実施形態は、上記の説明を検討した後に当業者に明らかになるであろう。たとえ本明細書及び図面が実施形態及び例を開示するとしても、発明はそれらの具体的な例に制限されない。多くの改良及び変形は、添付の特許請求の範囲によって定義される本発明の適用範囲から逸脱することなしに行われ得る。特許請求の範囲において現れる如何なる参照符号も、それらの適用範囲を制限するものとして理解されるべきでない。
本願は、2012年3月23日付けで出願された米国特許仮出願第61/614577号に基づく優先権を主張するものである。なお、この米国出願は、その全文を参照により本願に援用される。
Claims (16)
- 音声信号間のトーカコリジョンを低減しながら前記音声信号を混合する方法であって、
2又はそれ以上の音声信号を共通の時間基準により受信するステップと、
前記音声信号のうちの少なくとも第1及び第2の音声信号の間でトーカコリジョンが存在する信号インターバルを検出するステップと、
肯定的な検出結果の場合に、前記音声信号のうちの第1の音声信号を、該第1の音声信号を知覚的に区別できるようにするために処理するステップと、
出力信号を得るよう前記共通の時間基準に従って少なくとも1つの前記処理された音声信号を残りの音声信号と混合するステップと
を有し、
前記検出するステップは、
前記音声信号の夫々について周波数バンドごとのエネルギ含量のインジケータを導出するステップであって、第1の周波数バンドごとのエネルギ含量のインジケータは前記第1の音声信号について導出され、第2の周波数バンドごとのエネルギ含量のインジケータは前記第2の音声信号について導出されるステップと、
前記第1の周波数バンドごとのエネルギ含量のインジケータ及び前記第2の周波数バンドごとのエネルギ含量のインジケータに基づき前記信号インターバル内の周波数サブレンジにおいて前記第1の音声信号及び前記第2の音声信号で同程度のエネルギ含量を検出するよう、前記信号インターバル内の前記周波数サブレンジに対応する前記トーカコリジョンの位置において前記第1の音声信号及び前記第2の音声信号で同程度のエネルギ含量を有することを含む検出条件を適用するステップと
を有し、
前記処理するステップは、該処理するステップが必要とされる時間セグメントに制限され、前記処理するステップは、時間とともに漸進的に前記トーカコリジョンの位置の信号成分を周波数シフトすることを含む、方法。 - 前記処理するステップは、前記第1の音声信号の前記検出された信号インターバルの信号成分を前記共通の時間基準に対して時間シフトするステップを含む、
請求項1に記載の方法。 - 前記時間シフトするステップは、前記共通の時間基準に対する一連の正又は負方向のタイムストレッチを前記第1の音声信号に適用するステップを含む、
請求項2に記載の方法。 - 前記時間シフトするステップは、前記検出された信号インターバルの信号成分を減衰し、前記検出された信号インターバルの前記信号成分を隣接する信号インターバルにコピーするステップを含む、
請求項2に記載の方法。 - 前記処理するステップは、前記検出された信号インターバルにおける信号成分の周波数サブレンジにのみ作用する、
請求項2乃至4のうちいずれか一項に記載の方法。 - シフトするより前に、
前記第1の音声信号の一部を音素に分けるステップと、
完全な音素のみをカバーするよう前記検出された信号インターバルを調整するステップと
を更に有する請求項2乃至5のうちいずれか一項に記載の方法。 - 前記検出条件は、前記トーカコリジョンの位置において前記第1及び第2の音声信号の両方で所定の閾値を上回るエネルギ含量を有することを更に含む、
請求項1乃至6のうちいずれか一項に記載の方法。 - 前記音声信号は、時間−周波数タイルに分けられ、該時間−周波数タイルの夫々は、前記周波数バンドごとのエネルギ含量のインジケータの値と関連付けられ、基本検出単位である、
請求項1乃至7のうちいずれか一項に記載の方法。 - 前記検出された信号インターバルにおいて最小のエネルギ含量を有する音声信号を前記第1の音声信号として選択するステップを更に有し、
前記処理するステップは、前記検出された信号インターバルの信号成分を時間シフト又は周波数シフトすることを含み、前記第1の音声信号に作用する、
請求項1乃至8のうちいずれか一項に記載の方法。 - 前記検出は、周波数サブレンジ及び信号インターバルの組み合わせであって、前記トーカコリジョンの位置に近く且つ前記検出条件が満たされない少なくとも1つの目標位置を見つけることを更に含み、
前記処理するステップは、前記第1の音声信号の信号成分を前記目標位置に時間シフト又は周波数シフトすることを含む、
請求項1乃至9のうちいずれか一項に記載の方法。 - 前記検出は、少なくとも2つの目標位置を見つけ、夫々の目標位置について、前記トーカコリジョンの位置に対するシフト距離を示すメトリックを導出することを更に含み、
前記処理するステップは、前記第1の音声信号の信号成分を、前記メトリックが最小である目標位置に時間シフト又は周波数シフトすることを含む、
請求項10に記載の方法。 - 第1の目標位置は、純粋な正方向の時間シフト又は純粋な周波数シフトに対応し、第2の目標位置は、純粋な負方向の時間シフト又は純粋な周波数シフトに対応し、
シフト量が最小である目標位置が選択される、
請求項11に記載の方法。 - 調和励振、
振動効果、
トレモロ、
ヴィブラート、
コーラス、
フランジング、及び
フェージング
を含むグループ内の効果を前記音声信号の厳密なサブセットにのみ適用することによって、前記音声信号の前記厳密なサブセットを処理するステップを更に有する、
請求項1乃至12のうちいずれか一項に記載の方法。 - ライブ会議システムで実装される、請求項1乃至13のうちいずれか一項に記載の方法。
- コンピュータで実行される場合に、該コンピュータに、請求項1乃至14のうちいずれか一項に記載の方法を実行させるコンピュータプログラム。
- 音声信号を混合する装置であって、
1又はそれ以上の音声信号を共通の時間基準により受信するインターフェースと、
前記音声信号のうちの少なくとも第1及び第2の音声信号の間でトーカコリジョンが存在する信号インターバルを検出するコリジョン検出部と、
前記コリジョン検出部から検出結果を受け取り、肯定的な検出結果に応答して、前記音声信号のうちの少なくとも1つの音声信号を、該少なくとも1つの音声信号を知覚的に区別可能にするために処理するプロセッサと、
前記少なくとも1つの処理された音声信号及び残りの音声信号を前記共通の時間基準に対してパースし、それらの信号を然るべく混合して出力信号を供給するミキサと
を有し、
前記コリジョン検出部は、
前記音声信号の夫々について周波数バンドごとのエネルギ含量のインジケータを導出し、第1の周波数バンドごとのエネルギ含量のインジケータは前記第1の音声信号について導出され、第2の周波数バンドごとのエネルギ含量のインジケータは前記第2の音声信号について導出され、
前記第1の周波数バンドごとのエネルギ含量のインジケータ及び前記第2の周波数バンドごとのエネルギ含量のインジケータに基づき前記信号インターバル内の周波数サブレンジにおいて前記第1の音声信号及び前記第2の音声信号で同程度のエネルギ含量を検出するよう、前記信号インターバル内の前記周波数サブレンジに対応する前記トーカコリジョンの位置において前記第1の音声信号及び前記第2の音声信号で同程度のエネルギ含量を有することを含む検出条件を適用する
よう構成され、
前記プロセッサは、該プロセッサによる処理を、該処理が必要とされる時間セグメントに制限されるよう構成され、前記プロセッサは、時間とともに漸進的に前記トーカコリジョンの位置の信号成分を周波数シフトするよう更に構成される、装置。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201261614577P | 2012-03-23 | 2012-03-23 | |
US61/614,577 | 2012-03-23 | ||
PCT/US2013/033366 WO2013142727A1 (en) | 2012-03-23 | 2013-03-21 | Talker collisions in an auditory scene |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015511029A JP2015511029A (ja) | 2015-04-13 |
JP6023823B2 true JP6023823B2 (ja) | 2016-11-09 |
Family
ID=48096233
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014561192A Active JP6023823B2 (ja) | 2012-03-23 | 2013-03-21 | 音声信号を混合する方法、装置及びコンピュータプログラム |
Country Status (6)
Country | Link |
---|---|
US (1) | US9502047B2 (ja) |
EP (1) | EP2828849B1 (ja) |
JP (1) | JP6023823B2 (ja) |
CN (1) | CN104205212B (ja) |
HK (1) | HK1204134A1 (ja) |
WO (1) | WO2013142727A1 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9237238B2 (en) * | 2013-07-26 | 2016-01-12 | Polycom, Inc. | Speech-selective audio mixing for conference |
CN104767652B (zh) * | 2014-01-08 | 2020-01-17 | 杜比实验室特许公司 | 监视数字传输环境性能的方法 |
US10079941B2 (en) | 2014-07-07 | 2018-09-18 | Dolby Laboratories Licensing Corporation | Audio capture and render device having a visual display and user interface for use for audio conferencing |
CN106878533B (zh) * | 2015-12-10 | 2021-03-19 | 北京奇虎科技有限公司 | 一种移动终端的通信方法和装置 |
EP3291226B1 (en) * | 2016-09-05 | 2020-11-04 | Unify Patente GmbH & Co. KG | A method of treating speech data, a device for handling telephone calls and a hearing device |
US11017790B2 (en) * | 2018-11-30 | 2021-05-25 | International Business Machines Corporation | Avoiding speech collisions among participants during teleconferences |
CN111354356B (zh) * | 2018-12-24 | 2024-04-30 | 北京搜狗科技发展有限公司 | 一种语音数据处理方法及装置 |
WO2022259637A1 (ja) * | 2021-06-08 | 2022-12-15 | ソニーグループ株式会社 | 情報処理装置、情報処理方法、情報処理プログラム、及び情報処理システム |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7391877B1 (en) | 2003-03-31 | 2008-06-24 | United States Of America As Represented By The Secretary Of The Air Force | Spatial processor for enhanced performance in multi-talker speech displays |
JP2005267667A (ja) * | 2004-03-16 | 2005-09-29 | Denon Ltd | 音声記録再生装置 |
WO2006050353A2 (en) | 2004-10-28 | 2006-05-11 | Verax Technologies Inc. | A system and method for generating sound events |
US7970115B1 (en) * | 2005-10-05 | 2011-06-28 | Avaya Inc. | Assisted discrimination of similar sounding speakers |
ATE456845T1 (de) * | 2006-06-02 | 2010-02-15 | Koninkl Philips Electronics Nv | Sprachdifferenzierung |
US7853649B2 (en) | 2006-09-21 | 2010-12-14 | Apple Inc. | Audio processing for improved user experience |
US8559646B2 (en) | 2006-12-14 | 2013-10-15 | William G. Gardner | Spatial audio teleconferencing |
US20080298610A1 (en) | 2007-05-30 | 2008-12-04 | Nokia Corporation | Parameter Space Re-Panning for Spatial Audio |
WO2008144784A1 (en) | 2007-06-01 | 2008-12-04 | Technische Universität Graz | Joint position-pitch estimation of acoustic sources for their tracking and separation |
GB0712099D0 (en) * | 2007-06-22 | 2007-08-01 | Wivenhoe Technology Ltd | Transmission Of Audio Information |
US8180029B2 (en) * | 2007-06-28 | 2012-05-15 | Voxer Ip Llc | Telecommunication and multimedia management method and apparatus |
JP2009139592A (ja) * | 2007-12-05 | 2009-06-25 | Sony Corp | 音声処理装置、音声処理システム及び音声処理プログラム |
JP5195652B2 (ja) | 2008-06-11 | 2013-05-08 | ソニー株式会社 | 信号処理装置、および信号処理方法、並びにプログラム |
US20110109798A1 (en) | 2008-07-09 | 2011-05-12 | Mcreynolds Alan R | Method and system for simultaneous rendering of multiple multi-media presentations |
WO2010092914A1 (ja) * | 2009-02-13 | 2010-08-19 | 日本電気株式会社 | 多チャンネル音響信号処理方法、そのシステム及びプログラム |
US8417703B2 (en) | 2009-11-03 | 2013-04-09 | Qualcomm Incorporated | Data searching using spatial auditory cues |
-
2013
- 2013-03-21 JP JP2014561192A patent/JP6023823B2/ja active Active
- 2013-03-21 CN CN201380015383.3A patent/CN104205212B/zh active Active
- 2013-03-21 WO PCT/US2013/033366 patent/WO2013142727A1/en active Application Filing
- 2013-03-21 EP EP13716560.1A patent/EP2828849B1/en active Active
- 2013-03-21 US US14/373,336 patent/US9502047B2/en active Active
-
2015
- 2015-05-05 HK HK15104256.4A patent/HK1204134A1/xx unknown
Also Published As
Publication number | Publication date |
---|---|
CN104205212A (zh) | 2014-12-10 |
HK1204134A1 (en) | 2015-11-06 |
WO2013142727A1 (en) | 2013-09-26 |
US9502047B2 (en) | 2016-11-22 |
EP2828849B1 (en) | 2016-07-20 |
EP2828849A1 (en) | 2015-01-28 |
US20150012266A1 (en) | 2015-01-08 |
JP2015511029A (ja) | 2015-04-13 |
CN104205212B (zh) | 2016-09-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6023823B2 (ja) | 音声信号を混合する方法、装置及びコンピュータプログラム | |
US10607629B2 (en) | Methods and apparatus for decoding based on speech enhancement metadata | |
JP5734517B2 (ja) | 多チャンネル・オーディオ信号を処理する方法および装置 | |
EP2716075B1 (en) | An audio system and method therefor | |
JP2017530396A (ja) | 音源を強調するための方法及び機器 | |
KR101680953B1 (ko) | 인지 오디오 코덱들에서의 고조파 신호들에 대한 위상 코히어런스 제어 | |
TW201737244A (zh) | 音訊信號解碼 | |
US10728688B2 (en) | Adaptive audio construction | |
US8996389B2 (en) | Artifact reduction in time compression | |
JPWO2018198789A1 (ja) | 信号処理装置および方法、並びにプログラム | |
US20220060824A1 (en) | An Audio Capturing Arrangement | |
US20230254655A1 (en) | Signal processing apparatus and method, and program | |
JP2018205449A (ja) | 音声処理装置、音声処理方法およびプログラム | |
CN115462097A (zh) | 用于使能渲染空间音频信号的装置、方法和计算机程序 | |
KR20160122029A (ko) | 스피커 정보에 기초하여, 오디오 신호를 처리하는 방법 및 장치 | |
JP6313619B2 (ja) | 音声信号処理装置及びプログラム | |
Kamper et al. | Multi-Channel Recording and Modeling Strategies for Improved Source Realism in Auralizations | |
JP2023514121A (ja) | ビデオ情報に基づく空間オーディオ拡張 | |
KR20100138182A (ko) | 오디오 변속처리 방법 및 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150810 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150901 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20151126 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20160419 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160818 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20160829 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160920 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20161007 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6023823 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |