EP4145384B1

EP4145384B1 - Bildentrauschungsverfahren und -vorrichtung, elektronische vorrichtung und speichermedium

Info

Publication number: EP4145384B1
Application number: EP21795374.4A
Authority: EP
Inventors: Jisong AI; Ke Xu; Dehui KONG; Ning Wang; Xin Liu; Jing YOU; Fang Zhu
Original assignee: Sanechips Technology Co Ltd
Current assignee: Sanechips Technology Co Ltd
Priority date: 2020-04-27
Filing date: 2021-04-22
Publication date: 2026-02-11
Anticipated expiration: 2041-04-22
Also published as: US12394023B2; WO2021218765A1; CN113643189B; EP4145384A4; US20230230206A1; CN113643189A; EP4145384A1

Claims

Bildentrauschungsverfahren, umfassend:
Erfassen (101) eines zu verarbeitenden Bildes; und

Eingeben (102) des zu verarbeitenden Bildes in ein Bildentrauschungsmodell, um ein entrauschtes Bild zu erhalten, wobei das Bildentrauschungsmodell ein Modell ist, das durch Kombinieren eines U-förmigen Netzes, eines Residualnetzes und eines dichten Netzes gebildet ist,

wobei das Bildentrauschungsmodell umfasst: eine Eingabeschicht, eine erste Faltungsschicht, mindestens ein dichtes Residualmodul, einen dichten Residualblock, mindestens ein Upsampling-Modul, eine zweite Faltungsschicht, eine dritte Faltungsschicht und eine Ausgabeschicht, die sequenziell verbunden sind;

wobei eine Subtraktionsoperation an einem Ausgang der Eingabeschicht und einem Ausgang der dritten Faltungsschicht durchgeführt wird, und ein Ergebnis der Subtraktionsoperation an einen Eingang der Ausgabeschicht eingegeben wird;

eine Additionsoperation an einem Ausgang der ersten Faltungsschicht und einem Ausgang der zweiten Faltungsschicht durchgeführt wird, und ein Ergebnis der Additionsoperation an einen Eingang der dritten Faltungsschicht eingegeben wird;

das mindestens eine dichte Residualmodul ein erstes dichtes Residualuntermodule und ein Faltungsuntermodule umfasst, die sequenziell verbunden sind;

das mindestens eine Upsampling-Modul ein Upsampling-Untermodule und ein zweites dichtes Residualuntermodule umfasst, die sequenziell verbunden sind; und

eine Additionsoperation an einem Ausgang des ersten dichten Residualuntermodule und einem Eingang des Upsampling-Untermodule durchgeführt wird.
Verfahren nach Anspruch 1, wobei das erste dichte Residualuntermodule umfasst: eine vierte Faltungsschicht, eine fünfte Faltungsschicht, eine sechste Faltungsschicht und eine siebte Faltungsschicht, die sequenziell verbunden sind;
wobei eine Additionsoperation an einem Eingang der vierten Faltungsschicht und einem Eingang der siebten Faltungsschicht durchgeführt wird;

eine Fusionsoperation an einem Eingang der fünften Faltungsschicht und dem Eingang der vierten Faltungsschicht durchgeführt wird;

eine Fusionsoperation an einem Eingang der sechsten Faltungsschicht,

einem Ausgang der vierten Faltungsschicht und dem Eingang der vierten Faltungsschicht durchgeführt wird; und

eine Fusionsoperation an dem Eingang der siebten Faltungsschicht, dem Eingang der vierten Faltungsschicht, einem Ausgang der fünften Faltungsschicht und dem Ausgang der vierten Faltungsschicht durchgeführt wird.
Verfahren nach einem der Ansprüche 1 bis 2, wobei das Verfahren vor dem Eingeben (102) des zu verarbeitenden Bildes in das Bildentrauschungsmodell, um das entrauschte Bild zu erhalten, ferner umfasst:
Erfassen (401) eines ersten Trainingsrauschbildes und eines entsprechenden ersten Trainingswahrwertbildes;

Eingeben (402) des ersten Trainingsrauschbildes in ein anfängliches Bildentrauschungsmodell, um ein Ausgaberesultat zu erhalten;

Bestimmen (403) einer Verlustfunktion gemäß dem Ausgaberesultat und dem entsprechenden ersten Trainingswahrwertbild; und

Anpassen (404), als Reaktion darauf, dass die Verlustfunktion größer als ein vorbestimmter Schwellenwert ist, einer Netzwerkarchitektur und von Netzwerkparametern des anfänglichen Bildentrauschungsmodells gemäß der Verlustfunktion, Bestimmen eines aktualisierten Bildentrauschungsmodells, Verwenden des aktualisierten Bildentrauschungsmodells als neues anfängliches Bildentrauschungsmodell, Zurückkehren zu dem Vorgang des Eingebens des ersten Trainingsrauschbildes in das anfängliche Bildentrauschungsmodell, um das Ausgaberesultat zu erhalten, bis die Verlustfunktion kleiner als oder gleich dem vorbestimmten Schwellenwert ist, und Bestimmen des Bildentrauschungsmodells, wenn die Verlustfunktion kleiner als oder gleich dem vorbestimmten Schwellenwert ist, als das Bildentrauschungsmodell.
Verfahren nach Anspruch 3, wobei das Erfassen (401) des ersten Trainingsrauschbildes und des entsprechenden ersten Trainingswahrwertbildes umfasst:
Erzeugen (501), gemäß einer Vielzahl von Zielbildern, die unter einer ersten vorbestimmten Lichtquellenhelligkeit aufgenommen wurden, eines zweiten Trainingswahrwertbildes;

Verwenden (502) einer Vielzahl von Bildern, die durch zufälliges Einstellen einer Lichtquellenhelligkeit innerhalb eines Bereichs einer zweiten vorbestimmten Lichtquellenhelligkeit und einer dritten vorbestimmten Lichtquellenhelligkeit aufgenommen wurden, als zweite Trainingsrauschbilder, wobei die zweite vorbestimmte Lichtquellenhelligkeit geringer als die dritte vorbestimmte Lichtquellenhelligkeit ist, und die dritte vorbestimmte Lichtquellenhelligkeit geringer als die erste vorbestimmte Lichtquellenhelligkeit ist;

Trainieren (503), gemäß dem zweiten Trainingswahrwertbild und den zweiten Trainingsrauschbildern, eines anfänglichen gegnerischen Netzes, um ein endgültig trainiertes gegnerisches Netz zu erhalten;

Eingeben (504) eines im Voraus erfassten dritten Trainingswahrwertbildes in das gegnerische Netz, um ein drittes Trainingsrauschbild zu erhalten, das von einem Generatornetz des gegnerischen Netzes ausgegeben wird; und

Verwenden (505) sowohl des zweiten Trainingsrauschbildes als auch des dritten Trainingsrauschbildes als erste Trainingsrauschbilder, und Verwenden sowohl des zweiten Trainingswahrwertbildes als auch des dritten Trainingswahrwertbildes als die entsprechenden ersten Trainingswahrwertbilder.
Verfahren nach Anspruch 4, wobei das Erzeugen (501), gemäß der Vielzahl von Zielbildern, die unter der ersten vorbestimmten Lichtquellenhelligkeit aufgenommen wurden, des zweiten Trainingswahrwertbildes umfasst:
Erzeugen (601), gemäß einer Vielzahl von Bildern, die in einer strahlenlosen Umgebung aufgenommen wurden, eines Mittelwertbildes der Vielzahl von Bildern;

Vergleichen (602), für jedes Zielbild, eines ersten Pixelwertes jedes Pixelpunktes in dem Zielbild mit einem zweiten Pixelwert eines Pixelpunktes an einer entsprechenden Position in dem Mittelwertbild;

Bestimmen (603), als Reaktion darauf, dass ein Absolutwert einer Differenz zwischen dem ersten Pixelwert und dem zweiten Pixelwert größer als ein vorbestimmter erster Pixeldifferenz-Schwellenwert ist, eines aktualisierten Wertes des ersten Pixelwertes in einem bilinearen Interpolationsverfahren, um ein aktualisiertes Zielbild zu bilden; und

Erzeugen (604), gemäß dem aktualisierten Zielbild, des zweiten Trainingswahrwertbildes.
Verfahren nach Anspruch 5, wobei das Erzeugen (604), gemäß dem aktualisierten Zielbild, des zweiten Trainingswahrwertbildes umfasst:
Bestimmen, für jedes aktualisierte Zielbild, eines durchschnittlichen Pixelwertes aller Pixelpunkte in dem aktualisierten Zielbild;

Bestimmen, gemäß dem durchschnittlichen Pixelwert jedes aktualisierten Zielbildes, eines Mittelwertes der durchschnittlichen Pixelwerte einer Vielzahl von aktualisierten Zielbildern;

Verwerfen eines aktualisierten Zielbildes, dessen Absolutwert einer Differenz zwischen einem entsprechenden durchschnittlichen Pixelwert und dem Mittelwert der durchschnittlichen Pixelwerte größer als ein vorbestimmter zweiter Pixeldifferenz-Schwellenwert ist, um gefilterte aktualisierte Zielbilder zu bilden; und

Erzeugen, gemäß den gefilterten aktualisierten Zielbildern, des zweiten Trainingswahrwertbildes.
Verfahren nach Anspruch 6, wobei das Erzeugen, gemäß den gefilterten aktualisierten Zielbildern, des zweiten Trainingswahrwertbildes umfasst:
Aktualisieren, für jedes gefilterte aktualisierte Zielbild und als Reaktion darauf, dass ein Pixelwert an einer ersten Position des gefilterten aktualisierten Zielbildes kleiner als oder gleich einem vorbestimmten ersten Pixel-Schwellenwert ist oder größer als oder gleich einem vorbestimmten zweiten Pixel-Schwellenwert ist, des Pixelwertes an der ersten Position auf einen Pixelwert, unter Pixelwerten an ersten Positionen aller gefilterten aktualisierten Zielbilder, der am häufigsten erscheint, und Erzeugen sekundär aktualisierter gefilterter Zielbilder, wobei der erste Pixel-Schwellenwert kleiner als der zweite Pixel-Schwellenwert ist; und

Bestimmen eines Mittelwertbildes aller sekundär aktualisierten gefilterten Zielbilder als das zweite Trainingswahrwertbild.
Verfahren nach Anspruch 4, wobei das Trainieren (503), gemäß dem zweiten Trainingswahrwertbild und den zweiten Trainingsrauschbildern, des anfänglichen gegnerischen Netzes, um das endgültig trainierte gegnerische Netz zu erhalten, umfasst:
Eingeben normalverteilter Rauschsignale, des zweiten Trainingswahrwertbildes und von Kameraparametern, die einem beliebigen zweiten Trainingsrauschbild entsprechen, in ein anfängliches Generatornetz in dem anfänglichen gegnerischen Netz, um ein Ausgaberauschbild zu erhalten;

Eingeben des Rauschbildes, des zweiten Trainingsrauschbildes, von Kameraparametern, die dem zweiten Trainingsrauschbild entsprechen, und des zweiten Trainingswahrwertbildes in ein anfängliches Diskriminatornetz in dem anfänglichen gegnerischen Netz, um eine Ausgabe-Wahrscheinlichkeit des anfänglichen Diskriminatornetzes zu erhalten; und

Bestimmen, gemäß der Ausgabe-Wahrscheinlichkeit, der Kameraparameter, die dem zweiten Trainingsrauschbild entsprechen, des zweiten Trainingswahrwertbildes und des Rauschbildes, einer Verlustfunktion des anfänglichen Diskriminatornetzes und einer Verlustfunktion des anfänglichen Generatornetzes, abwechselnd Zurückkehren zu, als Reaktion darauf, dass bestimmt wird, dass das anfängliche gegnerische Netz gemäß der Verlustfunktion des anfänglichen Diskriminatornetzes und der Verlustfunktion des anfänglichen Generatornetzes nicht konvergiert ist, dem Vorgang des Eingebens der normalverteilten Rauschsignale, des zweiten Trainingswahrwertbildes und der Kameraparameter, die dem zweiten Trainingsrauschbild entsprechen, in das anfängliche Generatornetz in dem anfänglichen gegnerischen

Netz, um das Ausgaberauschbild zu erhalten, und dem Vorgang des Eingebens des Rauschbildes, des zweiten Trainingsrauschbildes, der Kameraparameter, die dem zweiten Trainingsrauschbild entsprechen, und des zweiten Trainingswahrwertbildes in das anfängliche Diskriminatornetz in dem anfänglichen gegnerischen Netz, um die Ausgabe-Wahrscheinlichkeit des anfänglichen Diskriminatornetzes zu erhalten, bis bestimmt wird, dass das gegnerische Netz gemäß der Verlustfunktion des anfänglichen Diskriminatornetzes und der Verlustfunktion des anfänglichen Generatornetzes konvergiert ist, und Bestimmen des konvergierten gegnerischen Netzes als das endgültig trainierte gegnerische Netz.
Verfahren nach einem der Ansprüche 4 bis 8, wobei das Generatornetz und das Diskriminatornetz in dem gegnerischen Netz jeweils ein U-förmiges Netz sind.
Elektronische Vorrichtung, umfassend:
einen oder mehrere Prozessoren (111); und

einen Speicher (112), der konfiguriert ist, ein oder mehrere Programme zu speichern,

wobei die ein oder mehreren Programme, wenn sie durch den einen oder mehreren Prozessoren (111) ausgeführt werden, bewirken, dass die ein oder mehreren Prozessoren (111) das Bildentrauschungsverfahren nach einem der Ansprüche 1 bis 9 implementieren.
Computerlesbares Speichermedium, auf dem ein Computerprogramm gespeichert ist, das, wenn es durch einen Prozessor ausgeführt wird, bewirkt, dass der Prozessor das Bildentrauschungsverfahren nach einem der Ansprüche 1 bis 9 implementiert.