PL211141B1 - Sposób miksowania sygnałów dźwiękowych - Google Patents

Sposób miksowania sygnałów dźwiękowych

Info

Publication number
PL211141B1
PL211141B1 PL376464A PL37646405A PL211141B1 PL 211141 B1 PL211141 B1 PL 211141B1 PL 376464 A PL376464 A PL 376464A PL 37646405 A PL37646405 A PL 37646405A PL 211141 B1 PL211141 B1 PL 211141B1
Authority
PL
Poland
Prior art keywords
micro
areas
elements
signal
signals
Prior art date
Application number
PL376464A
Other languages
English (en)
Other versions
PL376464A1 (pl
Inventor
Piotr Kleczkowski
Original Assignee
Piotr Kleczkowski
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Piotr Kleczkowski filed Critical Piotr Kleczkowski
Priority to PL376464A priority Critical patent/PL211141B1/pl
Priority to US11/997,180 priority patent/US20080199027A1/en
Priority to PCT/PL2006/000054 priority patent/WO2007015652A2/en
Publication of PL376464A1 publication Critical patent/PL376464A1/pl
Publication of PL211141B1 publication Critical patent/PL211141B1/pl

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H60/00Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
    • H04H60/02Arrangements for generating broadcast information; Arrangements for generating broadcast-related information with a direct linking to broadcast information or to broadcast space-time; Arrangements for simultaneous generation of broadcast information and broadcast-related information
    • H04H60/04Studio equipment; Interconnection of studios

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Amplifiers (AREA)
  • Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)

Description

(12) OPIS PATENTOWY (19) PL (11) 211141 (13) B1 (21) Numer zgłoszenia: 376464 (51) Int.Cl.
G10L 21/02 (2006.01) H04H 60/04 (2008.01) (22) Data zgłoszenia: 03.08.2005 (54)
Sposób miksowania sygnałów dźwiękowych
(73) Uprawniony z patentu:
(43) Zgłoszenie ogłoszono: KLECZKOWSKI PIOTR, Kraków, PL
05.02.2007 BUP 03/07 (72) Twórca(y) wynalazku:
PIOTR KLECZKOWSKI, Kraków, PL
(45) O udzieleniu patentu ogłoszono:
30.04.2012 WUP 04/12 (74) Pełnomocnik:
rzecz. pat. Małgorzata Geissler
PL 211 141 B1
Opis wynalazku
Przedmiotem wynalazku jest sposób miksowania sygnałów dźwiękowych. Sposób dotyczy zarówno miksowania sygnałów w studiach nagrań jak i miksowania sygnałów z osobnych torów elektroakustycznych na żywo.
Wynalazek może być zastosowany dla dowolnych materiałów dźwiękowych: muzycznych, słownych czy efektów dźwiękowych, a także dla dowolnej ilości torów przy nagraniach monofonicznych oraz w technikach wielokanałowych.
W znanych i powszechnie stosowanych sposobach proces miksowania polega jedynie na sumowaniu sygnałów dźwiękowych. Przeprowadza się go w technice analogowej przy pomocy konsolet mikserskich, albo w technice cyfrowej przy pomocy cyfrowych stołów mikserskich lub komputerów z odpowiednim oprogramowaniem.
Znane jest też podobne rozwiązanie ze zgłoszenia patentowego nr P-358531 pt. Sposób zwiększania wyrazistości dźwięku solowego na tle dźwięków tła akustycznego. Wynalazek ten, z uwagi na inaczej postawione zagadnienie techniczne, dotyczy miksowania ścieżki solowej z tłem dając nieznaczne zwiększenie wyrazistości tylko tej ścieżki.
Zgodnie z tym rozwiązaniem sposób zwiększania wyrazistości polega na dynamicznym tłumieniu tła akustycznego w zależności od obecności dźwięku solowego i charakteryzuje się tym, że cyfrowe sygnały dźwięku solowego i tła akustycznego poddaje się analizie czasowo-częstotliwościowej w elektronicznym urządzeniu procesorowym. Następnie, według przyjętych algorytmów obliczeniowych, wyznacza się obszary koncentracji energii dźwięku solowego i odpowiadające im obszary tłumienia tła oraz określa stopień tłumienia, po czym dokonuje się tłumienia i resyntezy dźwięku tła oraz miesza go z dźwiękiem solowym.
Celem wynalazku jest opracowanie technicznego sposobu miksowania sygnałów dźwiękowych pozwalającego na odbieranie przez słuch większej ilości szczegółów w słuchanych dźwiękach.
Sposób polega na odwzorowaniu sygnałów wejściowych na płaszczyzny czasowo-częstotliwościowe i obróbce tych sygnałów w dziedzinie czasowo-częstotliwościowej. Po dokonaniu obróbki realizowane jest sumowanie na zmiksowany sygnał wyjściowy.
Istotą sposobu według wynalazku jest to, że w procesie obróbki sygnałów, z pojedynczych elementów sygnałów w analogicznych mikroobszarach na płaszczyznach czasowo-częstotliwościowych, wybiera się co najmniej jeden element uprzywilejowany. Analogiczne mikroobszary utworzone są przez mikroobszary o jednakowych współrzędnych, znajdujące się na płaszczyznach czasowo-częstotliwościowych. W przypadku wyboru jednego elementu uprzywilejowanego wybiera się element o najwyższej wartości energii, w innych przypadkach, kolejno dwa najwyższe i dalsze, jednak zawsze łącznie z najwyższymi. Tak wybrane elementy sygnałów, określane jako elementy uprzywilejowane, przesyła się do sumowania na zmiksowany sygnał wyjściowy. Elementy sygnałów, które pozostały po oddzieleniu sygnałów uprzywilejowanych, tłumi się przed sumowaniem. Opisane wybieranie uprzywilejowanych elementów realizuje się dla wszystkich mikroobszarów na płaszczyznach czasowo-częstotliwościowych.
Korzystnie jest gdy w procesie obróbki sygnałów przed wybieraniem, w każdej z płaszczyzn, wartości energii elementów sygnałów w mikroobszarach zastępuje się średnimi wartościami energii wyliczonymi dla większych obszarów złożonych z wielu sąsiadujących ze sobą mikroobszarów. Wyliczone wartości przypisuje się jednemu mikroobszarów!, ulokowanemu w środku tego obszaru.
Korzystnie jest jeśli elementy sygnałów wybiera się z mikroobszarów połączonych w grupy za pomocą odpowiedniego algorytmu obliczeniowego. Wielkość takiej grupy mikroobszarów może wynosić od 2, dla najniższych, do 500 mikroobszarów, dla najwyższych częstotliwości akustycznych. Do tworzenia grup mikroobszarów wykorzystuje się sztuczne sieci neuronowe lub logikę rozmytą.
Korzystne jest również, gdy przed wybieraniem, wartości energii danego sygnału mnoży się przez współczynnik o wartości od 0,1 do 10. Tę pomnożoną wartość energii uwzględniamy w wybieraniu z analogicznych mikroobszarów. Po dokonaniu wyboru przekazuje się do miksowania sygnał o pierwotnej wartości energii. Dotyczy to przypadków, gdy jeden lub kilka z sygnałów ma być traktowany inaczej od pozostałych.
Następujące po obróbce tłumienie sygnałów, daje korzystny rezultat, jeśli elementy sygnałów, inne niż uprzywilejowane, doprowadza się do zerowej wartości energii.
PL 211 141 B1
Korzystnie jest także, jeśli przed sumowaniem wzmacnia się elementy uprzywilejowane, tak aby wartość ich energii była równa sumie wartości energii elementów sygnałów przed obróbką, przypadających na analogiczne mikroobszary.
Ze względów technicznych korzystnym jest gdy sumowanie sygnałów odbywa się w dziedzinie czasowo-częstotliwościowej.
Sposób, według wynalazku, nadaje się zarówno do nagrań monofonicznych, jak i wielokanałowych, na przykład stereofonicznych. W przypadku nagrań wielokanałowych sposób, według wynalazku stosuje się oddzielnie dla każdego z kanałów.
Dzięki takiemu sposobowi miksowania uzyskuje się znaczną poprawę jakości nagrania, szczególnie zwiększenie wyrazistości dźwięków. Zmiksowany sygnał na wyjściu jest czystszy a w nagraniach stereofonicznych łatwiejsza jest ocena lokalizacji poszczególnych źródeł dźwięku. W szczególności wynalazek jest przydatny dla poprawiania brzmienia nagrań dokonywanych z wielu mikrofonów jednocześnie, gdy powstają przesłuchy. Wynalazek w wysokim stopniu eliminuje to zjawisko.
Sposób według wynalazku przybliżono, na przykładzie przedstawionym na rysunku, na którym fig. 1 jest schematem blokowym, fig. 2 jest graficznym obrazem procesu wybierania mikroobszarów, a fig. 3 jest graficznym obrazem procesu wybierania grup mikroobszarów.
Poszczególne sygnały do zmiksowania otrzymuje się z mikrofonów lub innych źródeł. Każdy z sygnałów na wejściu WE może przechodzić przez przedwzmacniacz mikrofonowy 1, a następnie zostaje przetworzony w przetworniku a/c 2 do postaci cyfrowej. Sygnały w postaci cyfrowej wprowadzane są do procesora cyfrowego 3, w którym przeprowadza się obróbkę zgodnie z istotą wynalazku.
Procesor cyfrowy może być niezależnym urządzeniem przeznaczonym do tego zadania, kartą rozszerzającą do komputera z procesorem sygnałowym DSP lub wprost procesorem zwykłego komputera personalnego.
Po wykonaniu obróbki sygnał cyfrowy przekazywany jest do przetwornika c/a 4 i po przetworzeniu do toru elektroakustycznego 5 zawierającego wzmacniacze i głośniki.
Jeśli przedstawiony sposób miksowania służy do produkcji nagrań, wtedy sygnały z przedwzmacniaczy mikrofonowych 1 najpierw są nagrywane na osobnych ścieżkach, a następnie podczas odtwarzania są przekazywane do obróbki w procesorze cyfrowym 3.
Zmiksowane sygnały z wyjścia procesora cyfrowego 3 są nagrywane w postaci cyfrowej.
Dźwięk można rozłożyć na składowe częstotliwościowe. Dźwięki mowy i muzyki są zmienne w czasie i dlatego właściwa jest dla nich analiza w dziedzinie czasowo-częstotliwościowej.
Na rysunku fig. 2 pokazano płaszczyzny 6 wykresu czas - częstotliwość. Każda płaszczyzna odpowiada jednemu sygnałowi. Jeśli czas trwania sygnału wynosi 3 minuty to ilość niepodzielnych mikroobszarów 7, odpowiadających elementom sygnału, sięga do 8 milionów. Na fig. 2 zaznaczono przykładowe analogiczne mikroobszary 7. Wartości energii sygnału w mikroobszarach 7 obrazowane są na wykresie stopniem zaczernienia. Podczas obróbki porównuje się mikroobszary we wszystkich sygnałach, co schematycznie zaznaczono linią A-A.
Przykład, w którym obróbkę prowadzi się na obszarach utworzonych przez grupy mikroobszarów obrazuje fig. 3. Na płaszczyznach 6 wykresów czas - częstotliwość pokazano analogiczne grupy mikroobszarów 8. Wartości energii sygnału w grupach mikroobszarów 8 obrazowane są na wykresie stopniem zaczernienia. Dla czytelności zobrazowania przykładu pominięto zaczernianie pozostałych mikroobszarów. Podczas obróbki porównuje się grupy mikroobszarów we wszystkich sygnałach, co schematycznie zaznaczono linią B-B.

Claims (10)

  1. Zastrzeżenia patentowe
    1. Sposób miksowania sygnałów dźwiękowych, polegający na odwzorowaniu sygnałów wejściowych na płaszczyzny czasowo-częstotliwościowe, obróbce tych sygnałów w dziedzinie czasowo-częstotliwościowej, a następnie sumowaniu na zmiksowany sygnał wyjściowy, znamienny tym, że w procesie obróbki sygnałów, z elementów sygnałów w analogicznych mikroobszarach na płaszczyznach czasowo-częstotliwościowych wybiera się co najmniej jeden element uprzywilejowany, poczynając od najwyższej wartości energii, i te elementy uprzywilejowane przesyła się do sumowania na zmiksowany sygnał wyjściowy, natomiast elementy sygnałów w pozostałych mikroobszarach tłumi się przed sumowaniem, przy czym wybieranie realizuje się dla wszystkich mikroobszarów płaszczyzny czasowo-częstotliwościowej.
    PL 211 141 B1
  2. 2. Sposób według zastrz. 1, znamienny tym, że w procesie obróbki sygnałów, przed wybieraniem, wartości energii elementów sygnałów w mikroobszarach zastępuje się średnimi wartościami energii wyliczonymi dla obszarów złożonych z wielu sąsiadujących ze sobą mikroobszarów.
  3. 3. Sposób według zastrz. 1, znamienny tym, ż e elementy sygnałów wybiera się z mikroobszarów połączonych w grupy za pomocą odpowiedniego algorytmu obliczeniowego, przy czym wielkość grupy mikroobszarów wynosi 2 - 500 mikroobszarów.
  4. 4. Sposób według zastrz. 1, znamienny tym, że do wyboru grup mikroobszarów wykorzystuje się sztuczne sieci neuronowe.
  5. 5. Sposób według zastrz. 1, znamienny tym, że do wyboru grup mikroobszarów wykorzystuje się logikę rozmytą.
  6. 6. Sposób według zastrz. 1, znamienny tym, że przed wybieraniem wszystkie elementy sygnału mnoży się przez współczynnik o wartości od 0,1 do 10, a po ich wybraniu przekazuje się do miksowania sygnał o pierwotnej wartości energii.
  7. 7. Sposób według zastrz. 1, znamienny tym, że elementy sygnałów, z wyjątkiem uprzywilejowanych, tłumi się do zera.
  8. 8. Sposób wedł ug zastrz. 1, znamienny tym, ż e przed sumowaniem wzmacnia się elementy uprzywilejowane do wartości energii równej sumie energii elementów wszystkich sygnałów przed obróbką, przypadających na analogiczne mikroobszary.
  9. 9. Sposób według zastrz. 1, znamienny tym, że przed sumowaniem wzmacnia się elementy uprzywilejowane do wartości energii równej sumie energii elementów wszystkich sygnałów przed obróbką, przypadających na analogiczne grupy mikroobszarów.
  10. 10. Sposób według zastrz. 1, znamienny tym, że sumowanie sygnałów odbywa się w dziedzinie czasowo-częstotliwościowej.
PL376464A 2005-08-03 2005-08-03 Sposób miksowania sygnałów dźwiękowych PL211141B1 (pl)

Priority Applications (3)

Application Number Priority Date Filing Date Title
PL376464A PL211141B1 (pl) 2005-08-03 2005-08-03 Sposób miksowania sygnałów dźwiękowych
US11/997,180 US20080199027A1 (en) 2005-08-03 2006-08-03 Method of Mixing Audion Signals and Apparatus for Mixing Audio Signals
PCT/PL2006/000054 WO2007015652A2 (en) 2005-08-03 2006-08-03 A method of mixing audio signals and apparatus for mixing audio signals

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PL376464A PL211141B1 (pl) 2005-08-03 2005-08-03 Sposób miksowania sygnałów dźwiękowych

Publications (2)

Publication Number Publication Date
PL376464A1 PL376464A1 (pl) 2007-02-05
PL211141B1 true PL211141B1 (pl) 2012-04-30

Family

ID=37709021

Family Applications (1)

Application Number Title Priority Date Filing Date
PL376464A PL211141B1 (pl) 2005-08-03 2005-08-03 Sposób miksowania sygnałów dźwiękowych

Country Status (3)

Country Link
US (1) US20080199027A1 (pl)
PL (1) PL211141B1 (pl)
WO (1) WO2007015652A2 (pl)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101272972B1 (ko) 2009-09-14 2013-06-10 한국전자통신연구원 음원 데이터베이스를 사용하지 않는 음악 음원 분리 방법 및 장치
JP5532518B2 (ja) * 2010-06-25 2014-06-25 ヤマハ株式会社 周波数特性制御装置
US8804984B2 (en) * 2011-04-18 2014-08-12 Microsoft Corporation Spectral shaping for audio mixing

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6289309B1 (en) * 1998-12-16 2001-09-11 Sarnoff Corporation Noise spectrum tracking for speech enhancement
US7613529B1 (en) * 2000-09-09 2009-11-03 Harman International Industries, Limited System for eliminating acoustic feedback
US7529659B2 (en) * 2005-09-28 2009-05-05 Audible Magic Corporation Method and apparatus for identifying an unknown work
US6901363B2 (en) * 2001-10-18 2005-05-31 Siemens Corporate Research, Inc. Method of denoising signal mixtures
US6954494B2 (en) * 2001-10-25 2005-10-11 Siemens Corporate Research, Inc. Online blind source separation
US7574352B2 (en) * 2002-09-06 2009-08-11 Massachusetts Institute Of Technology 2-D processing of speech
US7047047B2 (en) * 2002-09-06 2006-05-16 Microsoft Corporation Non-linear observation model for removing noise from corrupted signals
US7499686B2 (en) * 2004-02-24 2009-03-03 Microsoft Corporation Method and apparatus for multi-sensory speech enhancement on a mobile device
US7742914B2 (en) * 2005-03-07 2010-06-22 Daniel A. Kosek Audio spectral noise reduction method and apparatus

Also Published As

Publication number Publication date
WO2007015652A3 (en) 2007-04-19
PL376464A1 (pl) 2007-02-05
WO2007015652A2 (en) 2007-02-08
US20080199027A1 (en) 2008-08-21

Similar Documents

Publication Publication Date Title
Crew et al. Contributions of electric and acoustic hearing to bimodal speech and music perception
US8027478B2 (en) Method and system for sound source separation
KR101989062B1 (ko) 오디오 신호를 향상시키기 위한 장치 및 방법 및 음향 향상 시스템
JP6832968B2 (ja) クロストーク処理の方法
US20090052681A1 (en) System and a method of processing audio data, a program element, and a computer-readable medium
Westermann et al. The influence of informational masking in reverberant, multi-talker environments
Tahmasebi et al. Design and evaluation of a real-time audio source separation algorithm to remix music for cochlear implant users
WO2011100802A1 (en) Hearing apparatus and method of modifying or improving hearing
Deroche et al. Voice segregation by difference in fundamental frequency: Evidence for harmonic cancellation
CN114222226A (zh) 增强具有左通道和右通道的音频信号的方法、系统和介质
PL211141B1 (pl) Sposób miksowania sygnałów dźwiękowych
Pan et al. A single-input/binaural-output antiphasic speech enhancement method for speech intelligibility improvement
Gribben et al. The perception of band-limited decorrelation between vertically oriented loudspeakers
Terrell et al. An offline, automatic mixing method for live music, incorporating multiple sources, loudspeakers, and room effects
JP2007271686A (ja) オーディオ信号処理装置
JP2008072600A (ja) 音響信号処理装置、音響信号処理プログラム、音響信号処理方法
Grazioli et al. Preliminary evaluation of a sound system employing a cancelling auralizer for producing virtual rooms in a modern recording studio
Kasak et al. Hybrid binaural singing voice separation
Kleczkowski Perception of Mixture of Musical Instruments with Spectral Overlap Removed
Brereton et al. The Virtual Singing Studio: A loudspeaker-based room acoustics simulation for real-time musical performance
Logason Recreating acoustics
JP6785166B2 (ja) 音声信号補償装置、音声信号補償方法、及びプログラム
Kleczkowski et al. Perceptual evaluation of the effect of threshold in selective mixing of sounds
Chon et al. Listeners' response to string quartet performances recorded in virtual acoustics
Kristoffersson Understanding the differences between reverberation and delay on vocals in live music scenarios: A study on the perceptions and preferences of the live concert audience

Legal Events

Date Code Title Description
LAPS Decisions on the lapse of the protection rights

Effective date: 20140803