WO2024079264A1 - Wiener-filter-based signal restoration with learned signal-to-noise ratio estimate - Google Patents

Wiener-filter-based signal restoration with learned signal-to-noise ratio estimate Download PDF

Info

Publication number
WO2024079264A1
WO2024079264A1 PCT/EP2023/078344 EP2023078344W WO2024079264A1 WO 2024079264 A1 WO2024079264 A1 WO 2024079264A1 EP 2023078344 W EP2023078344 W EP 2023078344W WO 2024079264 A1 WO2024079264 A1 WO 2024079264A1
Authority
WO
WIPO (PCT)
Prior art keywords
signal
training
noise ratio
training signal
restoration
Prior art date
Application number
PCT/EP2023/078344
Other languages
German (de)
French (fr)
Inventor
Johannes Meyer
Original Assignee
Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. filed Critical Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V.
Publication of WO2024079264A1 publication Critical patent/WO2024079264A1/en

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/60Image enhancement or restoration using machine learning, e.g. neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/70Denoising; Smoothing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/27Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
    • G10L25/30Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]

Definitions

  • the present disclosure relates to a method and apparatus for Wiener filter-based signal restoration, in which a signal is received, a signal-to-noise ratio of the signal is estimated for use in a Wiener filter-based restoration algorithm, and then an original signal is restored from the received signal by means of the Wiener filter-based restoration algorithm, ie a (restored) signal that is as similar as possible to the original signal, taking into account the estimated signal-to-noise ratio.
  • signals transmitted on signal or reception paths are degraded, ie an original or original signal is corrupted on the one hand by non-ideal transmission to a corresponding receiving sensor, mathematically represented by a non-ideal mapping function, and on the other hand by external interference, mathematically represented by an interference signal.
  • the observed or received signal always deviates from the original signal.
  • a restoration filter function is therefore applied to the observed signal and a restored signal is generated.
  • the restored signal is an estimate of the original signal, since various assumptions must be made when choosing the restoration function and thus a perfect restoration is not achieved, and as a restored signal it is treated as the same as the original signal in further use.
  • image deteriorations can be formulated as linear, shift-invariant systems and thus completely described using their impulse response. Examples of this are blurred images, image errors caused by suboptimal optics, motion blur and the like. From a system theory perspective, the captured image as an observed signal then corresponds to a convolution of the undisturbed image, the original signal, with the impulse response of the existing image deterioration, the non-ideal imaging function.
  • the Wiener filter is used to improve signals in speech processing.
  • Two convolutional neural networks are trained that can detect areas with and without speech in the time signal. Assuming that the noise in both areas is similar, the signal-to-noise ratio, or SNR for short, can be estimated by calculating the corresponding signal components.
  • SNR signal-to-noise ratio
  • the task is therefore to improve filter-based signal restoration, in particular the result of Wiener filter-based signal restoration.
  • the approach presented below is based on the usual signal model for signal restoration, as is known, for example, from image restoration.
  • An original signal is transformed by a non-ideal mapping function h, and the transformed signal is additionally distorted by a disturbance n, thus yielding the observed or received signal g.
  • Applying a restoration function v to the observed or received signal yields a restored signal s.
  • the signals s, g, s as well as functions h and v and the disturbance n can, as is typically the case with image signals, exhibit a dependency on a location x, in other areas of application, for example, also a dependency on a frequency f and the like.
  • the Wiener filter for the case of an image signal in the frequency domain results in the following:
  • SNR(f) S s s(f)/S n n(f ) must be determined or estimated as accurately as possible.
  • S ss (f) denotes the unknown and thus to be estimated spectral power density of the undisturbed original signal s
  • S nn (f) denotes the unknown and thus to be estimated spectral power density of, for example, noise as disturbance n.
  • One aspect of the approach presented relates to a method for Wiener filter-based signal restoration, also referred to as data signal restoration, with the method steps of receiving a signal, the observed signal g, estimating the signal-to-noise ratio for restoring the original signal s underlying the received signal g in the form of a restored signal s, and generating the restored signal s from the received signal g and the estimated SNR.
  • the method steps are by a signal processing unit, which can contain, for example, a microprocessor and corresponding further electronic elements.
  • the signal belongs to a respective signal type, so it can be, for example, an image signal, in particular a single- or multi-channel image signal, and/or an audio signal, and/or a digital data transmission signal, or the signal can comprise one or more signals of the corresponding signal type "image signal” and/or "audio signal” and/or "data transmission signal".
  • the received signal can be generated and/or received by an image sensor unit and/or audio sensor unit and/or a data transmission unit.
  • the signal is received on a respective reception path, whereby the received or observed signal is formed by a falsification of the original signal by or on the reception path.
  • the falsification can occur due to the nature of the reception path itself, which is then described by the non-ideal mapping function h, or due to additional interference which is described by the interference factor n.
  • the signal-to-noise ratio is estimated for a Wiener filter-based recovery algorithm by a processing algorithm obtained by means of a machine learning method.
  • the processing algorithm obtained by means of the machine learning method can be or comprise a neural network, in particular a deep neural network with two or more, preferably three or more hidden layers.
  • other machine learning methods such as pixel-by-pixel support vector regression can also be used.
  • the estimation is carried out as a function of a spectral power density S gg calculated for the received signal.
  • the restored signal s is generated from the received, i.e. observed signal g and the signal-to-noise ratio SNR estimated for the Wiener filter-based restoration algorithm v by means of the Wiener filter-based restoration algorithm v.
  • the signal-to-noise ratio SNR estimated by the processing algorithm obtained in machine learning methods forms the basis of the Wiener filter of the Wiener filter-based restoration algorithm v.
  • the method presented here directly addresses the weakness of the Wiener filter, namely the signal-to-noise ratio, which is often difficult to estimate correctly in practice.
  • the method also includes training the processing algorithm obtained by means of the machine learning method with a large number of training signal-data pairs.
  • These training signal-data pairs each comprise or contain a spectral power density calculated for a received training signal of the same signal type as the signal later received in the application and a training signal-to-noise ratio calculated as a function of an original training signal and a predetermined noise training signal.
  • the training described here and below can also be carried out independently of the signal restoration itself, i.e. spatially and/or temporally separated from the actual Wiener filter-based signal restoration. This has the advantage that the processing algorithm obtained by means of the machine learning method can quickly estimate an SNR in practice, since only the observed signal is required to estimate the respective SNR. Since very large existing databases of signals such as images, audio signals, and other signals and corresponding non-ideal mapping functions such as impulse responses of reception paths can be used for training, such training is also suitable for practical use.
  • the spectral power density calculated for the received signal during the estimation is a logarithmic power density, ie the calculated spectral power density after the calculation and before the further processing is logarithmic.
  • the spectral power density calculated during training for the received training signal is a logarithmic power density, just as the training signal-to-noise ratio calculated as a function of the original training signal and the specified noise training signal is a logarithmic training signal-to-noise ratio, so the SNR is also logarithmized after calculation before further processing.
  • the signal-to-noise ratio estimated for the Wiener filter-based restoration algorithm is exponentiated in order to compensate for distortions induced by the logarithmization of the input variable.
  • the respective received training signal is calculated as a function of the respective associated original training signal, i.e. the original training signal of the same pair, and a respective impulse response training signal. This means that with access to the different databases, the amount of training data can be increased again in a relevant way and thus the performance of the processing algorithm can be increased.
  • the respective received training signal can also depend on the specified noise training signal.
  • the (non-logarithmic) training signal-to-noise ratio calculated as a function of the original training signal and the predetermined noise training signal comprises the quotient of the spectral power density calculated for the original training signal with the spectral power density calculated for the predetermined noise training signal, in particular is proportional to this quotient or is the quotient.
  • the SNR is therefore calculated with the quotient or as the quotient of the respective spectral power densities estimated or calculated. This leads to good recovery results, especially in combination with the calculation method of the received training signal with the associated spectral power density described in the last paragraph.
  • a further aspect relates to a signal processing unit for Wiener filter-based signal restoration, which is designed to carry out a method according to one of the described embodiments, i.e. the Wiener filter-based signal restoration and/or the training of the processing algorithm obtained by means of machine learning methods described for this purpose.
  • Fig. 1 shows a signal path for a reception path with subsequent restoration according to a known signal model
  • Fig. 2 shows a schematic overview of an exemplary training procedure for a processing algorithm obtained by means of machine learning.
  • Fig. 1 shows a well-known signal model for signal restoration.
  • An original signal s is shaped on the receiving path by its specific properties, which is modeled by a non-ideal mapping function h, which is applied to the original signal s, for example by convolution.
  • the signal is additionally distorted by an external disturbance n, resulting in a signal g, which is then observed or received.
  • This observed or received signal g is transformed by a restoration filter function v, which can also be referred to as a restoration algorithm v, so that the restoration result is a restored signal s, an estimate of the original or original signal s.
  • a restoration filter function v which can also be referred to as a restoration algorithm v
  • Fig. 2 schematically shows an exemplary embodiment of a method for training a processing algorithm obtained by means of machine learning methods, here a neural network 4>.
  • the neural network 4> is trained in such a way that, based on an estimate of the spectral power density S ⁇ of the received signal g, for example of an observed image g(x), the desired SNR is estimated as SNR (f).
  • SNR (f) SNR applies.
  • S gg (f)
  • the Fourier transformation T ⁇ . ⁇ is chosen as an example as a discrete Fourier transformation DFT ⁇ . ⁇ .
  • an original signal s in this case an image s(x), is selected from a first database D1 to train the neural network 4>.
  • the original signal s is convolved with the impulse response as a non-ideal mapping function h in order to simulate the signal degradation during training.
  • image data for example, the image degradation databases from the article "Understanding and Evaluating Blind Deconvolution Algorithms" by Levin A.
  • the logarithmic quotient log the logarithmized signal-to-noise ratio log SNR which is later estimated during signal recovery by the processing algorithm, here the neural network 4>, is calculated, which determines or forms a reference input for the training of the neural network 4>.
  • the transfer function h required for reconstruction or its Fourier transform H of the signal deterioration can be calculated using other existing methods. If the signals are image data, for example, motion blur can be estimated using the data from an acceleration sensor or a gyroscope of the recording device, for example a smartphone.

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Image Processing (AREA)

Abstract

The disclosure relates to a method for Wiener-filter-based signal restoration, comprising the following method steps: receiving a signal (g); estimating a signal-to-noise ratio for a Wiener-filter-based restoration algorithm (v) by a processing algorithm (φ) obtained by means of a machine learning processing, depending on a spectral power density calculated for the received signal; and generating a restored signal (ŝ) from the received signal (g) and from the signal-to-noise ratio estimated for the Wiener-filter-based restoration algorithm (v) by means of the Wiener-filter-based restoration algorithm (v) in order to improve the filter-based signal restoration, in particular the result of a Wiener-filter-based signal restoration.

Description

Fraunhofer Gesellschaft 239PCT 1678 GD Fraunhofer Society 239PCT 1678 GD
Wiener-Filter-basierte Signalwiederherstellung mit gelernter Signal-zu-Rausch- Verhältnis-Abschätzung Wiener filter-based signal restoration with learned signal-to-noise ratio estimation
Die vorliegende Offenbarung bezieht sich auf Verfahren und Vorrichtung zur Wiener-Filter-basierten Signalwiederherstellung, bei welchem ein Signal empfangen wird, ein Signal-zu-Rausch-Verhältnis des Signals für die Verwendung in einem Wiener-Filter-basierten Wiederherstellungsalgorithmus abgeschätzt wird und sodann mittels des Wiener-Filter-basierten Wiederherstellungsalgorithmus aus dem empfangenen Signal unter Berücksichtigung des abgeschätz- ten Signal-zu-Rausch-Verhältnisses ein ursprüngliches Signal wiederhergestellt wird, d.h. ein dem ursprünglichen Signal möglichst ähnliches (wiederhergestelltes) Signal. Allgemein werden auf Signal- oder Empfangswegen übertragene Signale verschlechtert, d. h. ein ursprüngliches oder originales Signal verfälscht einerseits durch nicht-ideale Übertragung auf einen entsprechenden Empfangssensor, mathematisch dargestellt durch eine nicht-ideale Abbildungsfunktion, und andererseits durch externe Störungen, mathematisch dargestellt durch ein Störsignal. Dadurch weicht das beobachtete oder empfangene Signal stets von dem originalen Signal ab. Üblicherweise wird daher eine Wiederherstellungsfilterfunktion auf das beobachtete Signal angewandt und ein wiederhergestelltes Signal erzeugt. Das wiederhergestellte Signal ist eine Schätzung des originalen Signals, da bei der Wahl der Wiederherstellungsfunktion verschiedene Annahmen getroffen werden müssen und somit eine perfekte Wiederherstellung nicht erreicht wird, und wird als wiederhergestelltes Signal dem originalen Signal in der weiteren Verwendung gleichgestellt. The present disclosure relates to a method and apparatus for Wiener filter-based signal restoration, in which a signal is received, a signal-to-noise ratio of the signal is estimated for use in a Wiener filter-based restoration algorithm, and then an original signal is restored from the received signal by means of the Wiener filter-based restoration algorithm, ie a (restored) signal that is as similar as possible to the original signal, taking into account the estimated signal-to-noise ratio. In general, signals transmitted on signal or reception paths are degraded, ie an original or original signal is corrupted on the one hand by non-ideal transmission to a corresponding receiving sensor, mathematically represented by a non-ideal mapping function, and on the other hand by external interference, mathematically represented by an interference signal. As a result, the observed or received signal always deviates from the original signal. Usually, a restoration filter function is therefore applied to the observed signal and a restored signal is generated. The restored signal is an estimate of the original signal, since various assumptions must be made when choosing the restoration function and thus a perfect restoration is not achieved, and as a restored signal it is treated as the same as the original signal in further use.
Werden also beispielsweise mit einem Kamerasystem Bilder erfasst, kommt es dabei je nach Situation zu physikalisch bedingten Bildverschlechterungen. Einige Bildverschlechterungen lassen sich als lineare, verschiebungsinvariante Systeme formulieren und damit anhand ihrer Impulsantwort vollständig beschreiben. Beispiele hierfür sind unscharfe Aufnahmen, Bildfehler durch suboptimale Optiken, Bewegungsunschärfe und dergleichen. Das aufgenommene Bild als beobachtetes Signal entspricht dann systemtheoretisch betrachtet einer Faltung des ungestörten Bildes, des originalen Signals, mit der Impuls-ant- wort der vorliegenden Bildverschlechterung, der nicht-idealen Abbildungsfunktion. In solchen Fällen ist es, je nach Schwere der Bildverschlechterung und des vorliegenden Bildrauschens als zusätzliches Störsignal in gewissem Maße möglich mittels Bildwiederherstellungs- oder Restaurationsverfahren ein Bild als wiederhergestelltes Signal zu errechnen, das dem originalen Bild sehr nahekommt. In der Theorie ist diese Aufgabe durch das sog. Wiener-Filter optimal lösbar. In der Praxis hat das Wiener-Filter jedoch den entscheidenden Nachteil, dass das für die Filterung mit dem Wiener-Filter notwendige Signal-zu-Rausch- Verhältnis nicht bekannt ist und grundsätzlich nur geschätzt werden kann. Als Folge ist das Filterergebnis des Wiener-Filters in der Regel nicht zufriedenstellend und wird entsprechend im Allgemeinen nachbearbeitet, um ein besseres Ergebnis zu erhalten. In dem Artikel „A Data Driven Approach to A Priori SNR Estimation" von Suhadi S. et al., erschienen 2011 in den IEEE Transactions on Audio, Speech, and Language Processing 19, auf den Seiten 186 bis 195, wird das Wiener-Filter zur Signalverbesserung in der Sprachverarbeitung genutzt. Dabei werden zwei Faltungsnetze, sog. „convolutional neural networks" trainiert, die im Zeitsignal Bereiche mit und ohne Sprache detektieren können. Unter der Annahme, dass das Rauschen in beiden Bereichen ähnlich ist, kann durch Verrechnen der entsprechenden Signalanteile das Signal-zu-Rausch-Verhältnis, kurz SNR, geschätzt werden. Beispielsweise für Bildsignale ist dieser Ansatz jedoch nicht anwendbar, da hier das Wiener-Filter im Ortsfrequenzbereich beschrieben ist und nicht bezüglich einzelner Pixel oder Bildregionen. If, for example, images are captured using a camera system, depending on the situation, physically caused image deterioration can occur. Some image deteriorations can be formulated as linear, shift-invariant systems and thus completely described using their impulse response. Examples of this are blurred images, image errors caused by suboptimal optics, motion blur and the like. From a system theory perspective, the captured image as an observed signal then corresponds to a convolution of the undisturbed image, the original signal, with the impulse response of the existing image deterioration, the non-ideal imaging function. In such cases, depending on the severity of the image deterioration and the image noise present as an additional interference signal, it is possible to a certain extent to use image recovery or restoration methods to calculate an image as a restored signal that is very close to the original image. In theory, this task can be optimally solved using the so-called Wiener filter. In practice, however, the Wiener filter has the crucial disadvantage that the signal-to-noise ratio required for filtering with the Wiener filter is not known and can basically only be estimated. As a result, the filter result of the Wiener filter is usually unsatisfactory and is generally post-processed to achieve a better result. In the article "A Data Driven Approach to A Priori SNR Estimation" by Suhadi S. et al., published in 2011 in the IEEE Transactions on Audio, Speech, and Language Processing 19, on pages 186 to 195, the Wiener filter is used to improve signals in speech processing. Two convolutional neural networks are trained that can detect areas with and without speech in the time signal. Assuming that the noise in both areas is similar, the signal-to-noise ratio, or SNR for short, can be estimated by calculating the corresponding signal components. However, this approach is not applicable to image signals, for example, because the Wiener filter is described in the spatial frequency domain and not with respect to individual pixels or image regions.
In dem Artikel „An Iterative SNR Estimation Algorithm for Wiener Deconvolution of Self-Similar Images Distorted by Camera Shake Blurring" von Marcelo A. P. et al., erschienen 2008 in den Proceedings of the 8th Conference on Signal, Speech and Image Processing auf den Seiten 97 bis 100 wird zuerst eine initiale Schätzung des SNR verwendet, um mit dem Wiener-Filter das Eingabebild zu restaurieren. Das Ergebnisbild wird als wiederhergestelltes Bild mit dem Eingabebild im Sinne der Ähnlichkeit der Gradienten in x- und y-Richtung verglichen, um dann das SNR entsprechend anzupassen. Daraufhin folgt die nächste Iteration. In the article "An Iterative SNR Estimation Algorithm for Wiener Deconvolution of Self-Similar Images Distorted by Camera Shake Blurring" by Marcelo A. P. et al., published in 2008 in the Proceedings of the 8th Conference on Signal, Speech and Image Processing on pages 97 to 100, an initial estimate of the SNR is first used to restore the input image using the Wiener filter. The resulting image is compared as a restored image with the input image in terms of the similarity of the gradients in the x and y directions in order to then adjust the SNR accordingly. This is followed by the next iteration.
In dem Artikel „SNR-Aware Convolutional Neural Network Modelling for Speech Enhancement" von Fu S.-W. et al., erschienen 2016 in Interspeech auf den Seiten 3268 bis 3772, wird ein Sprachsignal von einem Faltungsnetzwerk verarbeitet, um damit insbesondere für jeden betrachteten Zeitabschnitt das SNR zu schätzen. Allerdings wird hier nur ein mittlerer Wert für das SNR geschätzt und nicht separate SNR-Werte für alle zur Verfügung stehenden Frequenzen, wie es für das Wiener-Filter erforderlich ist. In the article "SNR-Aware Convolutional Neural Network Modelling for Speech Enhancement" by Fu S.-W. et al., published in 2016 in Interspeech on pages 3268 to 3772, a speech signal is processed by a convolutional neural network in order to estimate the SNR for each time period considered. However, only an average value for the SNR is estimated here and not separate SNR values for all available frequencies, as is required for the Wiener filter.
Es stellt sich somit die Aufgabe, die filterbasierte Signalwiederherstellung, insbesondere das Ergebnis einer Wiener-Filter-basierten-Signalwieder-herstel- lung zu verbessern. The task is therefore to improve filter-based signal restoration, in particular the result of Wiener filter-based signal restoration.
Diese Aufgabe wird durch die Gegenstände der unabhängigen Patentansprüche gelöst. Vorteilhafte Ausführungsformen ergeben sich aus den abhängigen Patentansprüchen, der Beschreibung und den Figuren. This task is solved by the subject-matter of the independent patent claims solved. Advantageous embodiments emerge from the dependent patent claims, the description and the figures.
Der im Folgenden vorgestellte Ansatz setzt dabei auf dem üblichen Signalmodell für Signalwiederherstellung auf wie es beispielsweise aus der Bildrestauration bekannt ist. Ein originales Signal wird durch eine nicht-ideale Abbildungsfunktion h transformiert, zusätzlich wird das transformierte Signal durch eine Störung n verfälscht und ergibt so das beobachtete bzw. empfangene Signal g. Das Anwenden einer Wiederherstellungsfunktion v auf das beobachtete bzw. empfangene Signal liefert ein wiederhergestelltes Signal s. Die Signale s, g, s sowie Funktionen h und v und die Störung n können dabei, wie typischerweise bei Bildsignalen der Fall, eine Abhängigkeit von einem Ort x aufweisen, in anderen Anwendungsbereichen beispielsweise auch eine Abhängigkeit von einer Frequenz f und dergleichen. Mit der vorgestellten Nomenklatur ergibt sich das Wiener-Filter für den Fall eines Bildsignals im Frequenzbereich entsprechend zu
Figure imgf000006_0001
The approach presented below is based on the usual signal model for signal restoration, as is known, for example, from image restoration. An original signal is transformed by a non-ideal mapping function h, and the transformed signal is additionally distorted by a disturbance n, thus yielding the observed or received signal g. Applying a restoration function v to the observed or received signal yields a restored signal s. The signals s, g, s as well as functions h and v and the disturbance n can, as is typically the case with image signals, exhibit a dependency on a location x, in other areas of application, for example, also a dependency on a frequency f and the like. With the nomenclature presented, the Wiener filter for the case of an image signal in the frequency domain results in the following:
Figure imgf000006_0001
Dabei beschreibt /7(f) = T{h(x)} die Übertragungsfunktion der Bildverschlechterung, also die Fouriertransformierte der Impulsantwort als nicht-ideale Abbildungsfunktion h(x). Um das Wiener-Filter nutzen zu können, muss wie bekannt, der Ausdruck SNR(f) = Sss(f)/Snn(f ) möglichst korrekt bestimmt bzw. abgeschätzt werden. Dabei bezeichnet Sss(f) die nicht bekannte und damit abzuschätzende spektrale Leistungsdichte des ungestörten ursprünglichen Signals s und Snn(f) die nicht bekannte und damit abzuschätzende spektrale Leistungsdichte beispielsweise eines Rauschens als Störung n. Here, /7(f) = T{h(x)} describes the transfer function of the image degradation, i.e. the Fourier transform of the impulse response as a non-ideal mapping function h(x). In order to be able to use the Wiener filter, the expression SNR(f) = S s s(f)/S n n(f ) must be determined or estimated as accurately as possible. Here, S ss (f) denotes the unknown and thus to be estimated spectral power density of the undisturbed original signal s and S nn (f) denotes the unknown and thus to be estimated spectral power density of, for example, noise as disturbance n.
Ein Aspekt des vorgestellten Ansatzes betrifft entsprechend ein Verfahren zur Wiener-Filter-basierten Signalwiederherstellung, auch als Daten-Signalwieder- herstellung bezeichenbar, mit den Verfahrensschritten des Empfangens eines Signals, dem beobachteten Signal g, einem Abschätzen des Signal-zu-Rausch- Verhältnisses für das Wiederherstellen des dem empfangenen Signal g zugrundeliegenden ursprünglichen Signals s in Form eines wiederhergestellten Signals s, und dem Erzeugen des wiederhergestellten Signals s aus dem empfangenen Signal g und dem abgeschätzten SNR. Die Verfahrensschritte werden dabei durch eine Signalverarbeitungseinheit, welche beispielsweise einen Mikroprozessor und entsprechende weitere elektronische Elemente enthalten kann, durchgeführt. Das Signal gehört dabei einem jeweiligen Signaltyp an, es kann sich also beispielsweise um ein Bildsignal, insbesondere ein ein- oder mehrka- naliges Bildsignal, und/oder ein Audiosignal, und/oder ein digitales Datenübertragungssignal handeln, bzw. das Signal kann jeweils ein oder mehrere Signale des entsprechenden Signaltyps „Bildsignal" und/oder „Audiosignal" und/oder „Datenübertragungssignal" umfassen. Entsprechend kann das empfangene Signal durch eine Bildsensoreinheit und/oder Audiosensoreinheit und/oder eine Datenübertragungseinheit erzeugt und/oder empfangen werden oder sein. Das Signal wird auf einem jeweiligen Empfangsweg empfangen, wobei das empfangene bzw. beobachtete Signal durch ein Verfälschen des ursprünglichen Signals durch bzw. auf dem Empfangsweg geformt ist. Das Verfälschen kann dabei durch die Natur des Empfangsweges selber erfolgen, welche dann durch die nicht-ideale Abbildungsfunktion h beschrieben ist, oder durch zusätzliche Störungen die durch den Störfaktor n beschrieben sind. One aspect of the approach presented relates to a method for Wiener filter-based signal restoration, also referred to as data signal restoration, with the method steps of receiving a signal, the observed signal g, estimating the signal-to-noise ratio for restoring the original signal s underlying the received signal g in the form of a restored signal s, and generating the restored signal s from the received signal g and the estimated SNR. The method steps are by a signal processing unit, which can contain, for example, a microprocessor and corresponding further electronic elements. The signal belongs to a respective signal type, so it can be, for example, an image signal, in particular a single- or multi-channel image signal, and/or an audio signal, and/or a digital data transmission signal, or the signal can comprise one or more signals of the corresponding signal type "image signal" and/or "audio signal" and/or "data transmission signal". Accordingly, the received signal can be generated and/or received by an image sensor unit and/or audio sensor unit and/or a data transmission unit. The signal is received on a respective reception path, whereby the received or observed signal is formed by a falsification of the original signal by or on the reception path. The falsification can occur due to the nature of the reception path itself, which is then described by the non-ideal mapping function h, or due to additional interference which is described by the interference factor n.
Das Abschätzen des Signal-zu-Rausch-Verhältnisses erfolgt für einen Wiener- Filter-basierten-Wiederherstellungsalgorithmus durch einen mittels eines maschinellen Lernverfahrens gewonnenen Verarbeitungsalgorithmus. Der mittels des maschinellen Lernverfahrens gewonnene Verarbeitungsalgorithmus kann ein neuronales Netzwerk sein oder umfassen, insbesondere ein tiefes neuronales Netzwerk mit zwei oder mehr, bevorzugt drei oder mehr versteckten Schichten. Es können aber auch andere maschinelle Lernverfahren wie beispielsweise eine pixelweise Supportvektorregression genutzt werden. Das Abschätzen erfolgt in Abhängigkeit, d. h. als Funktion einerfür das empfangene Signal berechneten spektralen Leistungsdichte Sgg. The signal-to-noise ratio is estimated for a Wiener filter-based recovery algorithm by a processing algorithm obtained by means of a machine learning method. The processing algorithm obtained by means of the machine learning method can be or comprise a neural network, in particular a deep neural network with two or more, preferably three or more hidden layers. However, other machine learning methods such as pixel-by-pixel support vector regression can also be used. The estimation is carried out as a function of a spectral power density S gg calculated for the received signal.
Das Erzeugen des wiederhergestellten Signals s erfolgt aus dem empfangenen, d. h. beobachteten Signal g und dem für den Wiener-Filter-basierten Wiederherstellungsalgorithmus v abgeschätzten Signal-zu-Rausch-Verhältnis SNR mittels des Wiener-Filter-basierten Wiederherstellungsalgorithmus v. Dabei liegt das durch den in maschinellen Lernverfahren gewonnenen Verarbeitungsalgorithmus abgeschätzte Signal-zu-Rausch-Verhältnis SNR dem Wiener-Filter des Wiener-Filter-basierten Wiederherstellungsalgorithmus v zugrunde. Im Gegensatz zu bekannten Verfahren, bei welchen ein Ergebnis eines Wiener- Filter-basierten Wiederherstellungsalgorithmus nachträglich optimiert wird, setzt das hier vorgestellte Verfahren direkt an der Schwäche des Wiener-Filters an, nämlich an dem in der Praxis oft schwer korrekt zu schätzenden Signal-zu- Rausch-Verhältniss. Als Folge kommt die theoretische Optimalität des Wiener- Filters auch in praxisnahen Anwendungen voll zum Tragen - So haben verschiedene Experimente gezeigt, dass der hier vorgestellte Ansatz typischerweise das Wiederherstellen von Signalen in einer Qualität erreicht, welche die Leistungen bekannter Ansätze in gängigen Qualitätsmetriken um 10 %, d.h. 10 Prozentpunkte, übertrifft. The restored signal s is generated from the received, i.e. observed signal g and the signal-to-noise ratio SNR estimated for the Wiener filter-based restoration algorithm v by means of the Wiener filter-based restoration algorithm v. The signal-to-noise ratio SNR estimated by the processing algorithm obtained in machine learning methods forms the basis of the Wiener filter of the Wiener filter-based restoration algorithm v. In contrast to known methods in which the result of a Wiener filter-based restoration algorithm is subsequently optimized, the method presented here directly addresses the weakness of the Wiener filter, namely the signal-to-noise ratio, which is often difficult to estimate correctly in practice. As a result, the theoretical optimality of the Wiener filter also comes into full effect in practical applications - various experiments have shown that the approach presented here typically achieves the restoration of signals in a quality that exceeds the performance of known approaches in common quality metrics by 10%, i.e. 10 percentage points.
Entsprechend umfasst das Verfahren in einer vorteilhaften Ausführungsform auch ein Trainieren des mittels des maschinellen Lernverfahrens gewonnenen Verarbeitungsalgorithmus mit einer Vielzahl von Trainings-Signal-Daten-Paa- ren. Diese Trainings-Signal-Daten-Paare umfassen oder enthalten jeweils eine für ein Empfangs-Trainings-Signal des gleichen Signaltyps wie das später in der Anwendung empfangene Signal s berechnete spektrale Leistungsdichte und ein in Abhängigkeit eines Original-Trainings-Signals und eines vorgegebenen Rausch-Trainings-Signals berechnetes Trainings-Signal-zu-Rausch-Verhältnis. Das hier und im Folgenden beschriebene Trainieren kann dabei auch unabhängig von der Signalwiederherstellung selber, d. h. räumlich und/oder zeitlich getrennt von der eigentlichen Wiener-Filter-basierten-Signalwiederherstellung vorgenommen werden. Das hat den Vorteil, dass der mittels des maschinellen Lernverfahrens gewonnene Verarbeitungsalgorithmus in der Praxis schnell ein SNR schätzen kann, da einzig das beobachtete Signal zum Schätzen des jeweiligen SNR erforderlich ist. Da für das Trainieren auf sehr große bestehende Datenbanken von Signalen wie Bildern, Audiosignalen, und sonstigen Signalen und entsprechende nicht-ideale Abbildungsfunktionen wie Impulsantworten von Empfangswegen zurückgegriffen werden kann, ist ein solches Training auch praxistauglich. Accordingly, in an advantageous embodiment, the method also includes training the processing algorithm obtained by means of the machine learning method with a large number of training signal-data pairs. These training signal-data pairs each comprise or contain a spectral power density calculated for a received training signal of the same signal type as the signal later received in the application and a training signal-to-noise ratio calculated as a function of an original training signal and a predetermined noise training signal. The training described here and below can also be carried out independently of the signal restoration itself, i.e. spatially and/or temporally separated from the actual Wiener filter-based signal restoration. This has the advantage that the processing algorithm obtained by means of the machine learning method can quickly estimate an SNR in practice, since only the observed signal is required to estimate the respective SNR. Since very large existing databases of signals such as images, audio signals, and other signals and corresponding non-ideal mapping functions such as impulse responses of reception paths can be used for training, such training is also suitable for practical use.
In einer vorteilhaften Ausführungsform ist dabei vorgesehen, dass die bei dem Abschätzen für das empfangene Signal berechnete spektrale Leistungsdichte eine logarithmische Leistungsdichte ist, d. h. die berechnete spektrale Leistungsdichte nach dem Berechnen und vor dem weiteren Verarbeiten logarith- miert wird, und die bei dem Trainieren für das Empfangs-Trainings-Signal berechnete spektrale Leistungsdichte entsprechend eine logarithmische Leistungsdichte ist, so wie das in Abhängigkeit des Original-Trainings-Signals und des vorgegebenen Rausch-Trainings-Signals berechnete Trainings-Signal-zu- Rausch-Verhältnis ein logarithmisches Trainings-Signal-zu-Rausch-Verhältnis ist, das SNR also ebenfalls nach dem Berechnen vor einem weiteren Verarbeiten logarithmisiert wird. Es wird dann vor dem Wiederherstellen des ursprünglichen Signals das für den Wiener-Filter-basierten-Wiederherstellungs-algorith- mus abgeschätzte Signal-zu-Rausch-Verhältnis exponenziert, um durch das Lo- garithmisieren der Eingangsgröße induzierte Verfälschungen wieder zu kompensieren. Das hat den Vorteil, dass das maschinelle Lernverfahren, gerade, wenn es sich um ein neuronales Netz, insbesondere ein tiefes neuronales Netz, handelt, besser konvergiert, da gerade bei Bilddaten bei einem Schätzen der spektralen Leistungsdichte über das vorteilhafte Betragsquadrat der diskreten Fouriertransformation ein Konvergenzverhalten der genannten maschinellen Lernverfahren beeinträchtigt wird. In an advantageous embodiment, it is provided that the spectral power density calculated for the received signal during the estimation is a logarithmic power density, ie the calculated spectral power density after the calculation and before the further processing is logarithmic. and the spectral power density calculated during training for the received training signal is a logarithmic power density, just as the training signal-to-noise ratio calculated as a function of the original training signal and the specified noise training signal is a logarithmic training signal-to-noise ratio, so the SNR is also logarithmized after calculation before further processing. Then, before restoring the original signal, the signal-to-noise ratio estimated for the Wiener filter-based restoration algorithm is exponentiated in order to compensate for distortions induced by the logarithmization of the input variable. This has the advantage that the machine learning method converges better, especially when it is a neural network, in particular a deep neural network, since, especially in the case of image data, the convergence behavior of the machine learning methods mentioned is impaired when estimating the spectral power density via the advantageous square of the discrete Fourier transform.
In einer weiteren vorteilhaften Ausführungsform ist vorgesehen, dass das jeweilige Empfangs-Trainings-Signal in Abhängigkeit des jeweils zugehörigen Original-Trainings-Signals, d. h. des Original-Trainings-Signals desselben Paares, und eines jeweiligen Impulsantwort-Trainings-Signals berechnet wird. Dadurch kann mit Zugriff auf die unterschiedlichen Datenbanken die Menge der Trainingsdaten nochmals in relevanter Weise gesteigert werden und somit die Leistungsfähigkeit des Verarbeitungsalgorithmus erhöht werden. Zusätzlich kann das jeweilige Empfangs-Trainings-Signal auch von dem vorgegebenen Rausch- Trainings-Signal abhängen. In a further advantageous embodiment, it is provided that the respective received training signal is calculated as a function of the respective associated original training signal, i.e. the original training signal of the same pair, and a respective impulse response training signal. This means that with access to the different databases, the amount of training data can be increased again in a relevant way and thus the performance of the processing algorithm can be increased. In addition, the respective received training signal can also depend on the specified noise training signal.
In einer anderen vorteilhaften Ausführungsform ist vorgesehen, dass das in Abhängigkeit des Original-Trainings-Signals und des vorgegebenen Rausch-Trai- nings-Signals berechnete (nichtlogarithmische) Trainings-Signal-zu-Rausch- Verhältnis den Quotienten der für das Original-Trainings-Signal berechneten spektralen Leistungsdichte mit der für das vorgegebene Rausch-Trainings-Sig- nal berechneten spektralen Leistungsdichte umfasst, insbesondere zu diesem Quotienten proportional ist oder der Quotient ist. Das SNR wird also mit dem Quotienten oder als der Quotient der jeweiligen spektralen Leistungsdichten abgeschätzt bzw. berechnet. Dies führt gerade in Kombination mit der im letzten Absatz geschilderten Berechnungsweise des Empfangs-Trainings-Signals mit der zugehörigen spektralen Leistungsdichte zu guten Wiederherstellungsergebnissen. In another advantageous embodiment, it is provided that the (non-logarithmic) training signal-to-noise ratio calculated as a function of the original training signal and the predetermined noise training signal comprises the quotient of the spectral power density calculated for the original training signal with the spectral power density calculated for the predetermined noise training signal, in particular is proportional to this quotient or is the quotient. The SNR is therefore calculated with the quotient or as the quotient of the respective spectral power densities estimated or calculated. This leads to good recovery results, especially in combination with the calculation method of the received training signal with the associated spectral power density described in the last paragraph.
Ein weitere Aspekt betrifft eine Signalverarbeitungseinheit zur Wiener-Filter- basierten-Signalwiederherstellung, welche ausgebildet ist, ein Verfahren nach einer der geschilderten Ausführungsformen durchzuführen, also die Wiener- Filter-basierte Signalwiederherstellung und/oder das hierfür beschriebene Trainieren des mittels maschinellen Lernverfahrens gewonnenen Verarbeitungsalgorithmus. A further aspect relates to a signal processing unit for Wiener filter-based signal restoration, which is designed to carry out a method according to one of the described embodiments, i.e. the Wiener filter-based signal restoration and/or the training of the processing algorithm obtained by means of machine learning methods described for this purpose.
Vorteile und vorteilhafte Ausführungsformen der Signalverarbeitungseinheit entsprechend dabei Vorteilen und vorteilhaften Ausführungsformen der jeweiligen Verfahren. Advantages and advantageous embodiments of the signal processing unit correspond to advantages and advantageous embodiments of the respective methods.
Die vorstehend in der Beschreibung, auch im einleitenden Teil, genannten Merkmale und Merkmalskombinationen, sowie die nachfolgend in der Figurenbeschreibung genannten und/oder in den Figuren alleine gezeigten Merkmale und Merkmalskombinationen sind nicht nur in der jeweils angegebenen Kombination, sondern auch in anderen Kombinationen verwendbar, ohne den Rahmen der Erfindung zu verlassen. Es sind somit auch Ausführungen von der Erfindung als umfasst und offenbart anzusehen, die in den Figuren nicht explizit gezeigt und erläutert sind, jedoch durch separierte Merkmalskombinationen aus den erläuterten Ausführungen hervorgehen und erzeugbar sind. Es sind auch Ausführungen und Merkmalskombinationen als offenbart anzusehen, die somit nicht alle Merkmale eines ursprünglich formulierten unabhängigen Anspruchs aufweisen. Es sind darüber hinaus Ausführungen und Merkmalskombinationen, insbesondere durch die oben dargelegten Ausführungen, als offenbart anzusehen, die über die in den Rückbezügen der Ansprüche dargelegten Merkmalskombinationen hinausgehen oder von diesen abweichen. The features and combinations of features mentioned above in the description, including in the introductory part, as well as the features and combinations of features mentioned below in the description of the figures and/or shown in the figures alone can be used not only in the combination specified in each case, but also in other combinations without departing from the scope of the invention. Thus, embodiments are also to be regarded as encompassed and disclosed by the invention that are not explicitly shown and explained in the figures, but which emerge and can be produced by separate combinations of features from the explained embodiments. Embodiments and combinations of features are also to be regarded as disclosed that do not have all the features of an originally formulated independent claim. In addition, embodiments and combinations of features, in particular through the embodiments set out above, which go beyond or deviate from the combinations of features set out in the references to the claims are to be regarded as disclosed.
Dabei zeigen: Fig. 1 einen Signalweg für einen Empfangsweg mit anschließender Wiederherstellung gemäß einem bekannten Signalmodell; und Showing: Fig. 1 shows a signal path for a reception path with subsequent restoration according to a known signal model; and
Fig. 2 einen schematischen Überblick über ein beispielhaftes Trainingsverfahren für einen mittels maschinellem Lernverfahren gewonnenen Verarbeitungsalgorithmus. Fig. 2 shows a schematic overview of an exemplary training procedure for a processing algorithm obtained by means of machine learning.
In den Figuren sind dabei gleiche oder funktionsgleiche Elemente mit den gleichen Bezugszeichen versehen. In the figures, identical or functionally identical elements are provided with the same reference symbols.
In Fig. 1 ist ein allgemein bekanntes Signalmodell für eine Signalwiederherstellung dargestellt. Ein originales Signal s wird dabei auf dem Empfangsweg durch dessen spezifische Eigenschaften geformt, was durch eine nicht-ideale Abbildungsfunktion h modelliert wird, welche auf das originale Signal s beispielsweise durch eine Faltung angewandt wird. Das Signal wird zusätzlich durch eine externe Störung n additiv verfälscht, woraus sich insgesamt ein Signal g ergibt, welches dann beobachtet oder empfangen wird. Dieses beobachtete oder empfangene Signal g wird durch eine Wiederherstellungsfilterfunktion v, welche auch als Wiederherstellungsalgorithmus v bezeichnet werden kann, transformiert, so dass als Wiederherstellungsergebnis ein wiederhergestelltes Signal s, eine Schätzung des ursprünglichen oder originalen Signals s vorliegt. Mit Bildsignalen als beispielhafte Signale, und somit von einem Ort x abhängigen Signale bzw. Funktionen s, h, n, g, v, s ergibt sich das Wiener-Filter im Frequenzbereich zu der bereits vorgestellten Formel:
Figure imgf000011_0001
Fig. 1 shows a well-known signal model for signal restoration. An original signal s is shaped on the receiving path by its specific properties, which is modeled by a non-ideal mapping function h, which is applied to the original signal s, for example by convolution. The signal is additionally distorted by an external disturbance n, resulting in a signal g, which is then observed or received. This observed or received signal g is transformed by a restoration filter function v, which can also be referred to as a restoration algorithm v, so that the restoration result is a restored signal s, an estimate of the original or original signal s. With image signals as exemplary signals, and thus signals or functions s, h, n, g, v, s dependent on a location x, the Wiener filter in the frequency domain results in the formula already presented:
Figure imgf000011_0001
Entscheidend für die Qualität des Wiederherstellungsergebnisses ist die möglichst genaue Bestimmung des Signal-zu-Rausch-Verhältnisses SNR = Sss/Snn, wobei im vorliegenden Beispiel die jeweiligen Termini SNR, Sss und Snn über eine Fouriertransformation durch den Vektor x mit der Frequenz f verknüpft sind. The decisive factor for the quality of the restoration result is the most accurate determination of the signal-to-noise ratio SNR = S s s/S n n, where in the present example the respective terms SNR, S ss and S nn are linked to the frequency f via a Fourier transformation by the vector x.
In Fig. 2 ist eine beispielhafte Ausführungsform eines Verfahrens zum Trainieren eines mittels maschinellem Lernverfahren gewonnenen Verarbeitungsalgorithmus, hier eines neuronalen Netzes 4>, schematisch dargestellt. Das neuronale Netz 4> wird dahingehend trainiert, dass, basierend auf einer Schätzung der spektralen Leistungsdichte S^des empfangenen Signals g, beispielsweise eines beobachteten Bildes g(x) das gesuchte SNR, im Fall eines ortsabhängigen Bildes g(x) das gesuchte SNR als SNR (f), abschätzt. Es gilt somit 4>(^) = SNR. Dabei gilt Sgg(f) = |T’(sr(x))|2 mit der Fouriertransformation T{.} und der Schätzung des Signal-zu-Rausch-Verhältnisses SNR. In Fig. 2 ist die Fouriertransformation T{.} beispielshaft als diskrete Fouriertransformation DFT {.} gewählt. Fig. 2 schematically shows an exemplary embodiment of a method for training a processing algorithm obtained by means of machine learning methods, here a neural network 4>. The neural network 4> is trained in such a way that, based on an estimate of the spectral power density S^ of the received signal g, for example of an observed image g(x), the desired SNR is estimated as SNR (f). Thus, 4>(^) = SNR applies. Here, S gg (f) = |T'(s r (x))| 2 with the Fourier transformation T{.} and the estimation of the signal-to-noise ratio SNR. In Fig. 2, the Fourier transformation T{.} is chosen as an example as a discrete Fourier transformation DFT {.}.
Im gezeigten Beispiel wird für das Trainieren des neuronalen Netzes 4> aus einer ersten Datenbank Dl ein originales Signal s, vorliegend ein Bild s(x) ausgewählt. Aus einer zweiten Datenbank D2, welche eine beliebige Signalverschlechterungsdatenbank sein kann, wird eine entsprechende Impulsantwort als nicht lineare Abbildungsfunktion h, hier h(x), ausgewählt. Das originale Signal s wird mit der Impulsantwort als nicht-idealer Abbildungsfunktion h gefaltet, um im Training die Signalverschlechterung zu simulieren. Für Bilddaten können beispielsweise die Bildverschlechterungsdatenbanken aus dem Artikel „Understanding and Evaluating Blind Deconvolution Algorithms" von Levin A. et al., erschienen 2009 in der IEEE Conference on Computervision and Pattern Recognition auf den Seiten 1964 bis 1971 oder aus dem Artikel „Edge-Based Blur Kernel Estimation using Patch Priors" von Libin Sun et al., erschienen 2013 in der IEEE International Conference on Computational Photography auf Seiten 1 bis 8, genutzt werden. Zu dem Faltungsergebnis wird die Störung n, beispielsweise als normal verteiltes Rauschen n(x) simuliert, addiert. Das Ergebnis ist ein simuliertes empfangenes Signal g, hier g(x). Von diesem simulierten empfangenen Signal g wird der Logarithmus des Betragsquadrates der diskreten Fouriertransformation DFT {.} berechnet, was das Eingangssignal log Sgg für das neuronale Netz 4> darstellt. In the example shown, an original signal s, in this case an image s(x), is selected from a first database D1 to train the neural network 4>. A corresponding impulse response as a non-linear mapping function h, here h(x), is selected from a second database D2, which can be any signal degradation database. The original signal s is convolved with the impulse response as a non-ideal mapping function h in order to simulate the signal degradation during training. For image data, for example, the image degradation databases from the article "Understanding and Evaluating Blind Deconvolution Algorithms" by Levin A. et al., published in 2009 in the IEEE Conference on Computervision and Pattern Recognition on pages 1964 to 1971 or from the article "Edge-Based Blur Kernel Estimation using Patch Priors" by Libin Sun et al., published in 2013 in the IEEE International Conference on Computational Photography on pages 1 to 8, can be used. The disturbance n, for example simulated as normally distributed noise n(x), is added to the convolution result. The result is a simulated received signal g, here g(x). From this simulated received signal g, the logarithm of the square of the discrete Fourier transform DFT {.} is calculated, which represents the input signal log S gg for the neural network 4>.
Zudem wird anhand des logarithmierten Quotienten log
Figure imgf000012_0001
das später bei der Signalwiederherstellung von dem Verarbeitungsalgorithmus, hier dem neuronalen Netz 4>, geschätzte logarithmisierte Signal-zu-Rausch-Verhältnis log SNR berechnet, welches eine Referenzeingabe für das Training des neuronalen Netzwerks 4> bestimmt oder bildet.
In addition, the logarithmic quotient log
Figure imgf000012_0001
the logarithmized signal-to-noise ratio log SNR, which is later estimated during signal recovery by the processing algorithm, here the neural network 4>, is calculated, which determines or forms a reference input for the training of the neural network 4>.
Das Verwenden der Logarithmen log S^und log SNR zum Training des neuro- nalen Netzes statt S^und SNR dient der Reduktion der Dynamik der sich ergebenden Werte. Entsprechend muss nach der Auswertung von 4> der von dem neuronalen Netz 4> ausgegebene Wert exponenziert werden, und das Gesuchte, durch den Verarbeitungsalgorithmus gewonnene Signal-zu-Rausch- Verhältnis SNR ist dann gegeben durch
Figure imgf000013_0001
Using the logarithms log S^and log SNR to train the neuro- nal network instead of S^ and SNR serves to reduce the dynamics of the resulting values. Accordingly, after the evaluation of 4>, the value output by the neural network 4> must be exponentiated, and the sought-after signal-to-noise ratio SNR obtained by the processing algorithm is then given by
Figure imgf000013_0001
Die zur Rekonstruktion notwendige Übertragungsfunktion h bzw. deren Fou- riertransformierte H der Signalverschlechterung kann mit anderen existieren- den Verfahren berechnet werden. Handelt es sich bei den Signalen um Bilddaten, so kann beispielsweise bei Bewegungsunschärfe anhand der Daten eines Beschleunigungssensors oder eines Gyroskops des Aufnahmegerätes, beispielsweise eines Smartphones, geschätzt werden. The transfer function h required for reconstruction or its Fourier transform H of the signal deterioration can be calculated using other existing methods. If the signals are image data, for example, motion blur can be estimated using the data from an acceleration sensor or a gyroscope of the recording device, for example a smartphone.

Claims

Ansprüche Expectations
1. Verfahren zur Wiener-Filter-basierten Signalwiederherstellung, mit den Verfahrensschritten: 1. Method for Wiener filter-based signal recovery, with the following steps:
- Empfangen eines Signals (g); - receiving a signal (g);
- Abschätzen eines Signal-zu-Rausch-Verhältnisses für einen Wiener- Filter-basierten Wiederherstellungsalgorithmus (v) durch einen mittels eines maschinellen Lernverfahrens gewonnenen Verarbeitungsalgorithmus (4>), in Abhängigkeit einer für das empfangene Signal berechneten spektralen Leistungsdichte; - estimating a signal-to-noise ratio for a Wiener filter-based recovery algorithm (v) by a processing algorithm (4>) obtained by means of a machine learning method, depending on a spectral power density calculated for the received signal;
- Erzeugen eines wiederhergestellten Signals (s) aus dem empfangenen Signal (g) und dem für den Wiener-Filter-basierten Wiederherstellungsalgorithmus (v) abgeschätzten Signal-zu-Rausch-Verhältnis mittels des Wiener-Filter-basierten Wiederherstellungsalgorithmus' (v). - generating a restored signal (s) from the received signal (g) and the signal-to-noise ratio estimated for the Wiener filter-based restoration algorithm (v) by means of the Wiener filter-based restoration algorithm (v).
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass das Signal ein Bildsignal und/oder ein Audiosignal und/oder ein digitales Datenübertragungssignal ist oder umfasst. 2. Method according to claim 1, characterized in that the signal is or comprises an image signal and/or an audio signal and/or a digital data transmission signal.
3. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass das Signal durch eine Bildsensoreinheit und/oder durch eine Audiosensoreinheit und/oder eine Datenübertragungseinheit erzeugt. 3. Method according to one of the preceding claims, characterized in that the signal is generated by an image sensor unit and/or by an audio sensor unit and/or a data transmission unit.
4. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass der mittels des maschinellen Lernverfahrens gewonnenen Verarbeitungsalgorithmus (4>) ein neurales Netzwerk, insbesondere ein tiefes neurales Netzwerk, umfasst. 4. Method according to one of the preceding claims, characterized in that the processing algorithm (4>) obtained by means of the machine learning method comprises a neural network, in particular a deep neural network.
5. Verfahren nach einem der vorhergehenden Ansprüche, gekennzeichnet durch ein 5. Method according to one of the preceding claims, characterized by a
- Trainieren des mittels des maschinellen Lernverfahrens gewonnenen Verarbeitungsalgorithmus (4>) mit einer Vielzahl von Trainings-Signal- Daten-Paaren, welche jeweils eine für ein Empfangs-Trainings-Signal (g) berechnete spektrale Leistungsdichte und ein in Abhängigkeit eines Original-Trainings-Signals (s) und eines vorgegebenen Rausch-Trai- nings-Signals (n) berechnetes Trainings-Signal-zu-Rausch-Verhältnis umfassen. - Training the processing algorithm (4>) obtained by means of the machine learning method with a plurality of training signal-data pairs, each of which comprises a spectral power density calculated for a received training signal (g) and a training signal-to-noise ratio calculated as a function of an original training signal (s) and a predetermined noise training signal (n).
6. Verfahren nach Anspruch 5, dadurch gekennzeichnet, dass 6. Method according to claim 5, characterized in that
- die bei dem Abschätzen für das empfangene Signal (g) berechnete spektrale Leistungsdichte eine logarithmische Leistungsdichte ist, und- the spectral power density calculated in the estimation for the received signal (g) is a logarithmic power density, and
- die bei dem Trainieren für das Empfangs-Trainings-Signal (g) berechnete spektrale Leistungsdichte eine logarithmische Leistungsdichte und das in Abhängigkeit des Original-Trainings-Signals (s) und des vorgegebenen Rausch-Trainings-Signals (s) berechnete Trainings-Signal- zu-Rausch-Verhältnis ein logarithmisches Trainings-Signal-zu-Rausch- Verhältnis ist, wobei - the spectral power density calculated during training for the received training signal (g) is a logarithmic power density and the training signal-to-noise ratio calculated as a function of the original training signal (s) and the predetermined noise training signal (s) is a logarithmic training signal-to-noise ratio, where
- vor dem Erzeugen des wiederhergestellten Signals (s) das für den Wiener-Filter-basierten Wiederherstellungsalgorithmus (v) abgeschätzte Signal-zu-Rausch-Verhältnis exponenziert wird. - before generating the recovered signal (s), the signal-to-noise ratio estimated for the Wiener filter-based recovery algorithm (v) is exposed.
7. Verfahren nach Anspruch 5 oder 6, dadurch gekennzeichnet, dass das jeweilige Empfangs-Trainings-Signal (g) in Abhängigkeit des jeweils zugehörigen Original-Trainings-Signals (s) und eines jeweiligen Impulsantwort-Trainings-Signals (h) berechnet wird. 7. Method according to claim 5 or 6, characterized in that the respective received training signal (g) is calculated as a function of the respectively associated original training signal (s) and a respective impulse response training signal (h).
8. Verfahren nach Anspruch 5 oder 6 oder 7, dadurch gekennzeichnet, dass das in Abhängigkeit des Original-Trainings-Signals (s) und des vorgegebenen Rausch-Trainings-Signals (n) berechnete Trainings-Signal-zu- Rausch-Verhältnis den Quotienten der für das Original-Trainings-Signal (s) berechneten spektralen Leistungsdichte mit der für das vorgegebene Rausch-Trainings-Signal (n) berechneten spektralen Leistungsdichte umfasst, insbesondere zu diesem proportional ist oder der Quotient ist. 8. Method according to claim 5 or 6 or 7, characterized in that the training signal-to-noise ratio calculated as a function of the original training signal (s) and the predetermined noise training signal (n) comprises the quotient of the spectral power density calculated for the original training signal (s) with the spectral power density calculated for the predetermined noise training signal (n), in particular is proportional to this or is the quotient.
9. Verfahren zum Trainieren des per maschinellen Lernverfahrens für einen Wiener-Filter-basierten Wiederherstellungsalgorithmus (v) gewonnenen Verarbeitungsalgorithmus (4>) nach einem der vorhergehenden Ansprüche. 9. Method for training the processing algorithm (4>) obtained by machine learning for a Wiener filter-based recovery algorithm (v) according to one of the preceding claims.
10. Signalverarbeitungseinheit zur Wiener-Filter-basierten Signalwiederherstellung, welche ausgebildet ist, ein Verfahren nach einem der vorhergehenden Ansprüche durchzuführen. 10. Signal processing unit for Wiener filter-based signal restoration, which is designed to carry out a method according to one of the preceding claims.
PCT/EP2023/078344 2022-10-14 2023-10-12 Wiener-filter-based signal restoration with learned signal-to-noise ratio estimate WO2024079264A1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE102022210839.6 2022-10-14
DE102022210839.6A DE102022210839A1 (en) 2022-10-14 2022-10-14 Wiener filter-based signal recovery with learned signal-to-noise ratio estimation

Publications (1)

Publication Number Publication Date
WO2024079264A1 true WO2024079264A1 (en) 2024-04-18

Family

ID=88413602

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/EP2023/078344 WO2024079264A1 (en) 2022-10-14 2023-10-12 Wiener-filter-based signal restoration with learned signal-to-noise ratio estimate

Country Status (2)

Country Link
DE (1) DE102022210839A1 (en)
WO (1) WO2024079264A1 (en)

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022026948A1 (en) 2020-07-31 2022-02-03 Dolby Laboratories Licensing Corporation Noise reduction using machine learning

Non-Patent Citations (9)

* Cited by examiner, † Cited by third party
Title
J.URGEN TCHORZ ET AL: "SNR Estimation Based on Amplitude Modulation Analysis With Applications to Noise Suppression", vol. 11, no. 3, 1 May 2003 (2003-05-01), XP011079710, ISSN: 1063-6676, Retrieved from the Internet <URL:https://ieeexplore.ieee.org/document/1208288> DOI: 10.1109/TSA.2003.811542 *
PIOTR MASZTALSKI ET AL: "StoRIR: Stochastic Room Impulse Response Generation for Audio Data Augmentation", ARXIV.ORG, CORNELL UNIVERSITY LIBRARY, 201 OLIN LIBRARY CORNELL UNIVERSITY ITHACA, NY 14853, 17 August 2020 (2020-08-17), XP081742683 *
SUHADI SUHADI ET AL: "A Data-Driven Approach to A Priori SNR Estimation", IEEE TRANSACTIONS ON AUDIO, SPEECH AND LANGUAGE PROCESSING, IEEE, US, vol. 19, no. 1, 1 January 2011 (2011-01-01), pages 186 - 195, XP011304817, ISSN: 1558-7916, DOI: 10.1109/TASL.2010.2045799 *
VON FU S.-W ET AL., SNR-AWARE CONVOLUTIONAL NEURAL NETWORK MODELLING FOR SPEECH ENHANCEMENT, 2016
VON LEVIN A ET AL., UNDER-STANDING AND EVALUATING BLIND DECONVOLUTION ALGORITHMS, 2009
VON LIBIN SUN ET AL., EDGE-BASED BLUR KERNEL ESTIMATION USING PATCH PRIORS, 2013
VON MARCELO A. P ET AL., AN ITERATIVE SNR ESTIMATION ALGORITHM FOR WIENER DECONVOLUTION OF SELF-SIMILAR IMAGES DISTORTED BY CAMERA SHAKE BLURRING, 2008
VON SUHADI S ET AL., A DATA DRIVEN APPROACH TO A PRIORI SNR ESTIMATION, 2011
XIA YANGYANG ET AL: "A Priori SNR Estimation Based on a Recurrent Neural Network for Robust Speech Enhancement", INTERSPEECH 2018, 2 September 2018 (2018-09-02), ISCA, pages 3274 - 3278, XP055785397, Retrieved from the Internet <URL:http://www.cs.cmu.edu/afs/cs/user/robust/www/Papers/XiaStern18.pdf> DOI: 10.21437/Interspeech.2018-2423 *

Also Published As

Publication number Publication date
DE102022210839A1 (en) 2024-04-25

Similar Documents

Publication Publication Date Title
DE69812800T2 (en) Image enhancement method and apparatus
DE112009004059B4 (en) Method for removing blur from an image and recording medium on which the method is recorded
DE602005004694T2 (en) Method and apparatus for locally adaptive image processing filters
DE60030456T2 (en) METHOD AND SYSTEM FOR IMPROVING DIGITAL IMAGES
DE60300462T2 (en) Method for sharpening a digital image with signal noise evaluation
DE60020795T2 (en) Real-time modeling of the behavior of human vision systems
DE60115546T2 (en) Method and apparatus for improving signal-to-noise ratio using wave chips and thresholding frequencies
DE60300097T2 (en) Method for sharpening a digital image without amplification noise
DE102004007637A1 (en) A method of producing an increased resolution image using a plurality of low resolution images
DE602004001366T2 (en) Weighted, over-determined noise reduction
DE102021103293A1 (en) A Bayesian image denoising method based on distribution constraints of noisy images
DE19827034A1 (en) Iterative filter system for medical imaging
DE602004012125T2 (en) ROBUST RECYCLED COVER OPERATORS FOR QUICKLY PROCESSING RETINEX-TYPE IMAGES
DE102007013570A1 (en) Method for noise reduction in digital images with locally different and directional noise
DE10114732A1 (en) Active noise reduction method using independent component analysis
DE102008023915A1 (en) Filtering control variable setting method for noise reduction in medical image in X-ray diagnostic facility, involves comparing standard noise deviation and standard structure deviation and setting control variable as function of comparison
DE60023837T2 (en) DEVICE AND METHOD FOR FILTERING
Chierchia et al. An epigraphical convex optimization approach for multicomponent image restoration using non-local structure tensor
DE102020134755A1 (en) PROCESSING VIDEO FRAMES VIA NEURONAL FOLDING NETWORK USING STATISTICS OF PREVIOUS FRAMES
WO2024079264A1 (en) Wiener-filter-based signal restoration with learned signal-to-noise ratio estimate
DE102015120967A1 (en) Method and device for image correction
WO2018224444A1 (en) Method and device for image correction
DE102017212339A1 (en) Method and device for evaluating image sections for correspondence formation
WO2000025489A1 (en) Signal separation method and device for non-linear mixing of unknown signals
DE102020115256A1 (en) Image processing device, image pick-up device, image processing method, program and storage medium

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 23789939

Country of ref document: EP

Kind code of ref document: A1