PL211141B1 - Sposób miksowania sygnałów dźwiękowych - Google Patents
Sposób miksowania sygnałów dźwiękowychInfo
- Publication number
- PL211141B1 PL211141B1 PL376464A PL37646405A PL211141B1 PL 211141 B1 PL211141 B1 PL 211141B1 PL 376464 A PL376464 A PL 376464A PL 37646405 A PL37646405 A PL 37646405A PL 211141 B1 PL211141 B1 PL 211141B1
- Authority
- PL
- Poland
- Prior art keywords
- micro
- areas
- elements
- signal
- signals
- Prior art date
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04H—BROADCAST COMMUNICATION
- H04H60/00—Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
- H04H60/02—Arrangements for generating broadcast information; Arrangements for generating broadcast-related information with a direct linking to broadcast information or to broadcast space-time; Arrangements for simultaneous generation of broadcast information and broadcast-related information
- H04H60/04—Studio equipment; Interconnection of studios
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
- Electrophonic Musical Instruments (AREA)
- Amplifiers (AREA)
- Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)
Description
(12) OPIS PATENTOWY (19) PL (11) 211141 (13) B1 (21) Numer zgłoszenia: 376464 (51) Int.Cl.
G10L 21/02 (2006.01) H04H 60/04 (2008.01) (22) Data zgłoszenia: 03.08.2005 (54)
Sposób miksowania sygnałów dźwiękowych
(73) Uprawniony z patentu: | |
(43) Zgłoszenie ogłoszono: | KLECZKOWSKI PIOTR, Kraków, PL |
05.02.2007 BUP 03/07 | (72) Twórca(y) wynalazku: |
PIOTR KLECZKOWSKI, Kraków, PL | |
(45) O udzieleniu patentu ogłoszono: | |
30.04.2012 WUP 04/12 | (74) Pełnomocnik: |
rzecz. pat. Małgorzata Geissler |
PL 211 141 B1
Opis wynalazku
Przedmiotem wynalazku jest sposób miksowania sygnałów dźwiękowych. Sposób dotyczy zarówno miksowania sygnałów w studiach nagrań jak i miksowania sygnałów z osobnych torów elektroakustycznych na żywo.
Wynalazek może być zastosowany dla dowolnych materiałów dźwiękowych: muzycznych, słownych czy efektów dźwiękowych, a także dla dowolnej ilości torów przy nagraniach monofonicznych oraz w technikach wielokanałowych.
W znanych i powszechnie stosowanych sposobach proces miksowania polega jedynie na sumowaniu sygnałów dźwiękowych. Przeprowadza się go w technice analogowej przy pomocy konsolet mikserskich, albo w technice cyfrowej przy pomocy cyfrowych stołów mikserskich lub komputerów z odpowiednim oprogramowaniem.
Znane jest też podobne rozwiązanie ze zgłoszenia patentowego nr P-358531 pt. Sposób zwiększania wyrazistości dźwięku solowego na tle dźwięków tła akustycznego. Wynalazek ten, z uwagi na inaczej postawione zagadnienie techniczne, dotyczy miksowania ścieżki solowej z tłem dając nieznaczne zwiększenie wyrazistości tylko tej ścieżki.
Zgodnie z tym rozwiązaniem sposób zwiększania wyrazistości polega na dynamicznym tłumieniu tła akustycznego w zależności od obecności dźwięku solowego i charakteryzuje się tym, że cyfrowe sygnały dźwięku solowego i tła akustycznego poddaje się analizie czasowo-częstotliwościowej w elektronicznym urządzeniu procesorowym. Następnie, według przyjętych algorytmów obliczeniowych, wyznacza się obszary koncentracji energii dźwięku solowego i odpowiadające im obszary tłumienia tła oraz określa stopień tłumienia, po czym dokonuje się tłumienia i resyntezy dźwięku tła oraz miesza go z dźwiękiem solowym.
Celem wynalazku jest opracowanie technicznego sposobu miksowania sygnałów dźwiękowych pozwalającego na odbieranie przez słuch większej ilości szczegółów w słuchanych dźwiękach.
Sposób polega na odwzorowaniu sygnałów wejściowych na płaszczyzny czasowo-częstotliwościowe i obróbce tych sygnałów w dziedzinie czasowo-częstotliwościowej. Po dokonaniu obróbki realizowane jest sumowanie na zmiksowany sygnał wyjściowy.
Istotą sposobu według wynalazku jest to, że w procesie obróbki sygnałów, z pojedynczych elementów sygnałów w analogicznych mikroobszarach na płaszczyznach czasowo-częstotliwościowych, wybiera się co najmniej jeden element uprzywilejowany. Analogiczne mikroobszary utworzone są przez mikroobszary o jednakowych współrzędnych, znajdujące się na płaszczyznach czasowo-częstotliwościowych. W przypadku wyboru jednego elementu uprzywilejowanego wybiera się element o najwyższej wartości energii, w innych przypadkach, kolejno dwa najwyższe i dalsze, jednak zawsze łącznie z najwyższymi. Tak wybrane elementy sygnałów, określane jako elementy uprzywilejowane, przesyła się do sumowania na zmiksowany sygnał wyjściowy. Elementy sygnałów, które pozostały po oddzieleniu sygnałów uprzywilejowanych, tłumi się przed sumowaniem. Opisane wybieranie uprzywilejowanych elementów realizuje się dla wszystkich mikroobszarów na płaszczyznach czasowo-częstotliwościowych.
Korzystnie jest gdy w procesie obróbki sygnałów przed wybieraniem, w każdej z płaszczyzn, wartości energii elementów sygnałów w mikroobszarach zastępuje się średnimi wartościami energii wyliczonymi dla większych obszarów złożonych z wielu sąsiadujących ze sobą mikroobszarów. Wyliczone wartości przypisuje się jednemu mikroobszarów!, ulokowanemu w środku tego obszaru.
Korzystnie jest jeśli elementy sygnałów wybiera się z mikroobszarów połączonych w grupy za pomocą odpowiedniego algorytmu obliczeniowego. Wielkość takiej grupy mikroobszarów może wynosić od 2, dla najniższych, do 500 mikroobszarów, dla najwyższych częstotliwości akustycznych. Do tworzenia grup mikroobszarów wykorzystuje się sztuczne sieci neuronowe lub logikę rozmytą.
Korzystne jest również, gdy przed wybieraniem, wartości energii danego sygnału mnoży się przez współczynnik o wartości od 0,1 do 10. Tę pomnożoną wartość energii uwzględniamy w wybieraniu z analogicznych mikroobszarów. Po dokonaniu wyboru przekazuje się do miksowania sygnał o pierwotnej wartości energii. Dotyczy to przypadków, gdy jeden lub kilka z sygnałów ma być traktowany inaczej od pozostałych.
Następujące po obróbce tłumienie sygnałów, daje korzystny rezultat, jeśli elementy sygnałów, inne niż uprzywilejowane, doprowadza się do zerowej wartości energii.
PL 211 141 B1
Korzystnie jest także, jeśli przed sumowaniem wzmacnia się elementy uprzywilejowane, tak aby wartość ich energii była równa sumie wartości energii elementów sygnałów przed obróbką, przypadających na analogiczne mikroobszary.
Ze względów technicznych korzystnym jest gdy sumowanie sygnałów odbywa się w dziedzinie czasowo-częstotliwościowej.
Sposób, według wynalazku, nadaje się zarówno do nagrań monofonicznych, jak i wielokanałowych, na przykład stereofonicznych. W przypadku nagrań wielokanałowych sposób, według wynalazku stosuje się oddzielnie dla każdego z kanałów.
Dzięki takiemu sposobowi miksowania uzyskuje się znaczną poprawę jakości nagrania, szczególnie zwiększenie wyrazistości dźwięków. Zmiksowany sygnał na wyjściu jest czystszy a w nagraniach stereofonicznych łatwiejsza jest ocena lokalizacji poszczególnych źródeł dźwięku. W szczególności wynalazek jest przydatny dla poprawiania brzmienia nagrań dokonywanych z wielu mikrofonów jednocześnie, gdy powstają przesłuchy. Wynalazek w wysokim stopniu eliminuje to zjawisko.
Sposób według wynalazku przybliżono, na przykładzie przedstawionym na rysunku, na którym fig. 1 jest schematem blokowym, fig. 2 jest graficznym obrazem procesu wybierania mikroobszarów, a fig. 3 jest graficznym obrazem procesu wybierania grup mikroobszarów.
Poszczególne sygnały do zmiksowania otrzymuje się z mikrofonów lub innych źródeł. Każdy z sygnałów na wejściu WE może przechodzić przez przedwzmacniacz mikrofonowy 1, a następnie zostaje przetworzony w przetworniku a/c 2 do postaci cyfrowej. Sygnały w postaci cyfrowej wprowadzane są do procesora cyfrowego 3, w którym przeprowadza się obróbkę zgodnie z istotą wynalazku.
Procesor cyfrowy może być niezależnym urządzeniem przeznaczonym do tego zadania, kartą rozszerzającą do komputera z procesorem sygnałowym DSP lub wprost procesorem zwykłego komputera personalnego.
Po wykonaniu obróbki sygnał cyfrowy przekazywany jest do przetwornika c/a 4 i po przetworzeniu do toru elektroakustycznego 5 zawierającego wzmacniacze i głośniki.
Jeśli przedstawiony sposób miksowania służy do produkcji nagrań, wtedy sygnały z przedwzmacniaczy mikrofonowych 1 najpierw są nagrywane na osobnych ścieżkach, a następnie podczas odtwarzania są przekazywane do obróbki w procesorze cyfrowym 3.
Zmiksowane sygnały z wyjścia procesora cyfrowego 3 są nagrywane w postaci cyfrowej.
Dźwięk można rozłożyć na składowe częstotliwościowe. Dźwięki mowy i muzyki są zmienne w czasie i dlatego właściwa jest dla nich analiza w dziedzinie czasowo-częstotliwościowej.
Na rysunku fig. 2 pokazano płaszczyzny 6 wykresu czas - częstotliwość. Każda płaszczyzna odpowiada jednemu sygnałowi. Jeśli czas trwania sygnału wynosi 3 minuty to ilość niepodzielnych mikroobszarów 7, odpowiadających elementom sygnału, sięga do 8 milionów. Na fig. 2 zaznaczono przykładowe analogiczne mikroobszary 7. Wartości energii sygnału w mikroobszarach 7 obrazowane są na wykresie stopniem zaczernienia. Podczas obróbki porównuje się mikroobszary we wszystkich sygnałach, co schematycznie zaznaczono linią A-A.
Przykład, w którym obróbkę prowadzi się na obszarach utworzonych przez grupy mikroobszarów obrazuje fig. 3. Na płaszczyznach 6 wykresów czas - częstotliwość pokazano analogiczne grupy mikroobszarów 8. Wartości energii sygnału w grupach mikroobszarów 8 obrazowane są na wykresie stopniem zaczernienia. Dla czytelności zobrazowania przykładu pominięto zaczernianie pozostałych mikroobszarów. Podczas obróbki porównuje się grupy mikroobszarów we wszystkich sygnałach, co schematycznie zaznaczono linią B-B.
Claims (10)
- Zastrzeżenia patentowe1. Sposób miksowania sygnałów dźwiękowych, polegający na odwzorowaniu sygnałów wejściowych na płaszczyzny czasowo-częstotliwościowe, obróbce tych sygnałów w dziedzinie czasowo-częstotliwościowej, a następnie sumowaniu na zmiksowany sygnał wyjściowy, znamienny tym, że w procesie obróbki sygnałów, z elementów sygnałów w analogicznych mikroobszarach na płaszczyznach czasowo-częstotliwościowych wybiera się co najmniej jeden element uprzywilejowany, poczynając od najwyższej wartości energii, i te elementy uprzywilejowane przesyła się do sumowania na zmiksowany sygnał wyjściowy, natomiast elementy sygnałów w pozostałych mikroobszarach tłumi się przed sumowaniem, przy czym wybieranie realizuje się dla wszystkich mikroobszarów płaszczyzny czasowo-częstotliwościowej.PL 211 141 B1
- 2. Sposób według zastrz. 1, znamienny tym, że w procesie obróbki sygnałów, przed wybieraniem, wartości energii elementów sygnałów w mikroobszarach zastępuje się średnimi wartościami energii wyliczonymi dla obszarów złożonych z wielu sąsiadujących ze sobą mikroobszarów.
- 3. Sposób według zastrz. 1, znamienny tym, ż e elementy sygnałów wybiera się z mikroobszarów połączonych w grupy za pomocą odpowiedniego algorytmu obliczeniowego, przy czym wielkość grupy mikroobszarów wynosi 2 - 500 mikroobszarów.
- 4. Sposób według zastrz. 1, znamienny tym, że do wyboru grup mikroobszarów wykorzystuje się sztuczne sieci neuronowe.
- 5. Sposób według zastrz. 1, znamienny tym, że do wyboru grup mikroobszarów wykorzystuje się logikę rozmytą.
- 6. Sposób według zastrz. 1, znamienny tym, że przed wybieraniem wszystkie elementy sygnału mnoży się przez współczynnik o wartości od 0,1 do 10, a po ich wybraniu przekazuje się do miksowania sygnał o pierwotnej wartości energii.
- 7. Sposób według zastrz. 1, znamienny tym, że elementy sygnałów, z wyjątkiem uprzywilejowanych, tłumi się do zera.
- 8. Sposób wedł ug zastrz. 1, znamienny tym, ż e przed sumowaniem wzmacnia się elementy uprzywilejowane do wartości energii równej sumie energii elementów wszystkich sygnałów przed obróbką, przypadających na analogiczne mikroobszary.
- 9. Sposób według zastrz. 1, znamienny tym, że przed sumowaniem wzmacnia się elementy uprzywilejowane do wartości energii równej sumie energii elementów wszystkich sygnałów przed obróbką, przypadających na analogiczne grupy mikroobszarów.
- 10. Sposób według zastrz. 1, znamienny tym, że sumowanie sygnałów odbywa się w dziedzinie czasowo-częstotliwościowej.
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PL376464A PL211141B1 (pl) | 2005-08-03 | 2005-08-03 | Sposób miksowania sygnałów dźwiękowych |
US11/997,180 US20080199027A1 (en) | 2005-08-03 | 2006-08-03 | Method of Mixing Audion Signals and Apparatus for Mixing Audio Signals |
PCT/PL2006/000054 WO2007015652A2 (en) | 2005-08-03 | 2006-08-03 | A method of mixing audio signals and apparatus for mixing audio signals |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PL376464A PL211141B1 (pl) | 2005-08-03 | 2005-08-03 | Sposób miksowania sygnałów dźwiękowych |
Publications (2)
Publication Number | Publication Date |
---|---|
PL376464A1 PL376464A1 (pl) | 2007-02-05 |
PL211141B1 true PL211141B1 (pl) | 2012-04-30 |
Family
ID=37709021
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PL376464A PL211141B1 (pl) | 2005-08-03 | 2005-08-03 | Sposób miksowania sygnałów dźwiękowych |
Country Status (3)
Country | Link |
---|---|
US (1) | US20080199027A1 (pl) |
PL (1) | PL211141B1 (pl) |
WO (1) | WO2007015652A2 (pl) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101272972B1 (ko) | 2009-09-14 | 2013-06-10 | 한국전자통신연구원 | 음원 데이터베이스를 사용하지 않는 음악 음원 분리 방법 및 장치 |
JP5532518B2 (ja) * | 2010-06-25 | 2014-06-25 | ヤマハ株式会社 | 周波数特性制御装置 |
US8804984B2 (en) * | 2011-04-18 | 2014-08-12 | Microsoft Corporation | Spectral shaping for audio mixing |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6289309B1 (en) * | 1998-12-16 | 2001-09-11 | Sarnoff Corporation | Noise spectrum tracking for speech enhancement |
US7613529B1 (en) * | 2000-09-09 | 2009-11-03 | Harman International Industries, Limited | System for eliminating acoustic feedback |
US7529659B2 (en) * | 2005-09-28 | 2009-05-05 | Audible Magic Corporation | Method and apparatus for identifying an unknown work |
US6901363B2 (en) * | 2001-10-18 | 2005-05-31 | Siemens Corporate Research, Inc. | Method of denoising signal mixtures |
US6954494B2 (en) * | 2001-10-25 | 2005-10-11 | Siemens Corporate Research, Inc. | Online blind source separation |
US7574352B2 (en) * | 2002-09-06 | 2009-08-11 | Massachusetts Institute Of Technology | 2-D processing of speech |
US7047047B2 (en) * | 2002-09-06 | 2006-05-16 | Microsoft Corporation | Non-linear observation model for removing noise from corrupted signals |
US7499686B2 (en) * | 2004-02-24 | 2009-03-03 | Microsoft Corporation | Method and apparatus for multi-sensory speech enhancement on a mobile device |
US7742914B2 (en) * | 2005-03-07 | 2010-06-22 | Daniel A. Kosek | Audio spectral noise reduction method and apparatus |
-
2005
- 2005-08-03 PL PL376464A patent/PL211141B1/pl not_active IP Right Cessation
-
2006
- 2006-08-03 WO PCT/PL2006/000054 patent/WO2007015652A2/en active Application Filing
- 2006-08-03 US US11/997,180 patent/US20080199027A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
WO2007015652A3 (en) | 2007-04-19 |
PL376464A1 (pl) | 2007-02-05 |
WO2007015652A2 (en) | 2007-02-08 |
US20080199027A1 (en) | 2008-08-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Crew et al. | Contributions of electric and acoustic hearing to bimodal speech and music perception | |
US8027478B2 (en) | Method and system for sound source separation | |
KR101989062B1 (ko) | 오디오 신호를 향상시키기 위한 장치 및 방법 및 음향 향상 시스템 | |
JP6832968B2 (ja) | クロストーク処理の方法 | |
US20090052681A1 (en) | System and a method of processing audio data, a program element, and a computer-readable medium | |
Westermann et al. | The influence of informational masking in reverberant, multi-talker environments | |
Tahmasebi et al. | Design and evaluation of a real-time audio source separation algorithm to remix music for cochlear implant users | |
WO2011100802A1 (en) | Hearing apparatus and method of modifying or improving hearing | |
Deroche et al. | Voice segregation by difference in fundamental frequency: Evidence for harmonic cancellation | |
CN114222226A (zh) | 增强具有左通道和右通道的音频信号的方法、系统和介质 | |
PL211141B1 (pl) | Sposób miksowania sygnałów dźwiękowych | |
Pan et al. | A single-input/binaural-output antiphasic speech enhancement method for speech intelligibility improvement | |
Gribben et al. | The perception of band-limited decorrelation between vertically oriented loudspeakers | |
Terrell et al. | An offline, automatic mixing method for live music, incorporating multiple sources, loudspeakers, and room effects | |
JP2007271686A (ja) | オーディオ信号処理装置 | |
JP2008072600A (ja) | 音響信号処理装置、音響信号処理プログラム、音響信号処理方法 | |
Grazioli et al. | Preliminary evaluation of a sound system employing a cancelling auralizer for producing virtual rooms in a modern recording studio | |
Kasak et al. | Hybrid binaural singing voice separation | |
Kleczkowski | Perception of Mixture of Musical Instruments with Spectral Overlap Removed | |
Brereton et al. | The Virtual Singing Studio: A loudspeaker-based room acoustics simulation for real-time musical performance | |
Logason | Recreating acoustics | |
JP6785166B2 (ja) | 音声信号補償装置、音声信号補償方法、及びプログラム | |
Kleczkowski et al. | Perceptual evaluation of the effect of threshold in selective mixing of sounds | |
Chon et al. | Listeners' response to string quartet performances recorded in virtual acoustics | |
Kristoffersson | Understanding the differences between reverberation and delay on vocals in live music scenarios: A study on the perceptions and preferences of the live concert audience |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
LAPS | Decisions on the lapse of the protection rights |
Effective date: 20140803 |