CN109716770B - 用于图像压缩的方法和系统以及非暂时性计算机可读介质 - Google Patents

用于图像压缩的方法和系统以及非暂时性计算机可读介质 Download PDF

Info

Publication number
CN109716770B
CN109716770B CN201780057840.3A CN201780057840A CN109716770B CN 109716770 B CN109716770 B CN 109716770B CN 201780057840 A CN201780057840 A CN 201780057840A CN 109716770 B CN109716770 B CN 109716770B
Authority
CN
China
Prior art keywords
image
received image
identifying
semantically related
received
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201780057840.3A
Other languages
English (en)
Other versions
CN109716770A (zh
Inventor
安东尼·曼特勒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Google LLC
Original Assignee
Google LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Google LLC filed Critical Google LLC
Publication of CN109716770A publication Critical patent/CN109716770A/zh
Application granted granted Critical
Publication of CN109716770B publication Critical patent/CN109716770B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/167Position within a video image, e.g. region of interest [ROI]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/20Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/20Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding
    • H04N19/23Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding with coding of regions that are present throughout a whole video segment, e.g. sprites, background or mosaic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Image Analysis (AREA)

Abstract

本公开大体涉及用于图像压缩的方法和系统以及非暂时性计算机可读介质。一种方法,包括:在系统中接收图像;通过使用所述系统,识别接收到的图像中在语义上相关的部分;以及通过使用所述系统,基于识别到的部分来压缩接收到的图像。

Description

用于图像压缩的方法和系统以及非暂时性计算机可读介质
相关申请的交叉引用
本申请要求于2017年1月20日提交的标题为“IMAGE COMPRESSION BASED ONSEMANTIC RELEVANCE”的美国非临时专利申请第15/411,203号的优先权,并且是该案的延续案,其公开内容以引用的方式全部并入本文。
技术领域
本文大体上涉及基于语义相关性的图像压缩。
背景技术
执行对数字图像内容的压缩以减小内容大小,以方便图像的更高效传输和存储。针对图像或图像序列的现有压缩技术使用将图像或图像序列作为整体分析而不考虑图像内容的算法。该技术然后可以应用有损压缩以在不明显牺牲图像质量的情况下丢弃尽可能多的数据。这会导致对重要内容的过度压缩和/或对不重要内容的压缩不足。
例如,在视频压缩中,编码器可能有余地选择用什么保真度来更新图像的哪个区域。此外,对于如何表示连续的帧存在灵活性,这是因为,对于特定帧,能存在基本上构成可分辨照片的传输数据,或者可以基于序列中的先前的和/或将来的帧来定义该帧。不管如何,通常应用单种压缩级别。往往基于整图质量度量来做出这种图像压缩决定。例如,目标可以是避免在图像中心处或者在边缘处出现过多的瑕疵。即,在整个图像中应用相同的压缩级别。
发明内容
在第一方面中,一种方法,包括:在系统中接收图像;通过使用系统,识别接收到的图像中在语义上相关的部分;以及通过使用系统,基于识别到的部分来压缩接收到的图像。
实施方式可以包括任何或所有以下特征。基于识别到的部分来压缩接收到的图像包括:基于识别到的部分对压缩功能进行加权。基于识别到的部分来压缩接收到的图像包括:基于识别到的部分将量化应用到接收到的图像。应用量化包括:将来自接收到的图像的识别到的部分的图像信息量化到第一集合的整数,并且将不是来自识别到的部分的图像信息量化到第二集合的整数,其中,量化被配置为使得第一集合大于第二集合。将来自识别到的部分的图像信息量化到最接近的整数值,并且将不是来自识别到的部分的图像信息量化到最接近的第N个整数值,其中,N是预定义数。识别接收到的图像中在语义上相关的部分包括:将面部追踪功能应用到接收到的图像。识别接收到的图像中在语义上相关的部分包括:将对象辨别功能应用到接收到的图像。识别接收到的图像中在语义上相关的部分包括:将接收到的图像中的预定义位置作为目标。识别接收到的图像中在语义上相关的部分包括:确定在接收到的图像中的对象的相对大小。识别接收到的图像中在语义上相关的部分包括:分析在接收到的图像中的对象的移动。分析对象的移动包括:确定在接收到的图像中的对象的速度。识别接收到的图像中在语义上相关的部分包括:针对接收到的图像的区域估计编码复杂度。与图像有关的自动聚焦数据指示在图像中的自动聚焦位置,以及其中,接收到的图像中在语义上相关的部分基于自动聚焦位置来识别。
在第二方面中,一种计算机程序产品有形地体现为非暂时性计算机可读介质并且包括可执行指令,该可执行指令在被执行时使计算设备执行操作,该操作包括:接收图像;识别接收到的图像中在语义上相关的部分;以及基于识别到的部分来压缩接收到的图像。
在第三方面中,一种系统,包括:包含图像的储存器;图像分析电路,其被配置为识别图像中在语义上相关的部分;以及图像压缩电路,其被配置为基于识别到的部分来压缩图像。
实施方式可以包括任何或所有以下特征。系统还包括被配置为对图像执行变换的变换电路。图像压缩电路被配置为执行图像数据的量化和舍入,并且基于识别到的部分对量化和舍入中的至少一种进行加权。系统还包括图像模板,其中,图像分析电路被配置为在识别图像中在语义上相关的部分时使用图像模板。图像压缩电路被配置为在识别图像中在语义上相关的部分时对图像执行对象辨别。系统还包括被配置为生成与图像有关的自动聚焦数据的自动聚焦电路,自动聚焦数据指示在图像中的自动聚焦位置,以及其中,图像分析电路基于自动聚焦位置来识别图像中在语义上相关的部分。
附图说明
图1至图3示出了分析在语义上相关的内容的图像的示例。
图4至图8示出了系统的示例。
图9示出了可以用于实施本文描述的技术的计算机设备和移动计算机设备的示例。
在各个图中,类似的附图标记表示类似的元件。
具体实施方式
本文描述了基于语义相关性的图像压缩的示例。在一些实施方式中,执行图像分析以识别图像中被视为比该图像的另一区域或剩余部分具有更高相关性的至少一个区域。基于该识别,人们可以对识别到的区域应用比其它地方相对较低的图像压缩,或者相反,对其它(多个)区域应用比识别到的区域更高的压缩。这可以使系统保留感兴趣区域中的更多数据并且丢弃不那么感兴趣区域中的更多数据。
图1至图3示出了分析在语义上相关的内容的图像的示例。图1示意性地示出了图像100。通过定义图像的内容,图像可以被形成为表示图像的一种或多种类型的图像值的阵列。出于清楚起见,在本图示中未明确示出图像内容。可以通过使用任何图像格式来存储图像,包括但不限于将图像存储为JPEG图像。
此处,在图像100中示出了与图像压缩有关的线。即,水平线102彼此等距隔开并且与图像的顶边缘和底边缘等距隔开,垂直线104也彼此等距隔开并且与图像的左边缘和右边缘等距隔开。线102-104形成导向,其有时称为三分法:它们将图像的水平跨度和垂直跨度分成三份。用于图像压缩的拇指规则建议应该沿着这些线放置重要的组成元素。这样,线可以不是图像100的部分,但本文出于图示的目的示出了它们。
可以分析或以其他方式处理图像100,以便确定图像中在语义上感兴趣的或以其他方式具有相关性的区域。在一些实施方式中,可以使用线102-104。例如,可以选择位于线102-104中的两条线的相交处的区域106。区域106可以具有任何形状,包括但不限于矩形。本示例表明可以将图像中的预定义位置识别为在语义上是相关的。可以基于线102-104进行其它选择。
可以将图像中的一个或多个其它区域识别为具有语义相关性。在一些实施方式中,可以基于图像以最感兴趣物品或视图为中心的频繁发生的情况,来识别图像的中心。例如,可以基于图像的中心来识别区域108。区域108可以具有任何形状,包括但不限于矩形。
图像区域的识别可以用于一种或多种目的。在一些实施方式中,基于识别到的(多个)区域来执行图像压缩。例如,相较于图像中的其它地方,可以在识别到的(多个)区域中应用更低的压缩。这样,在一些实施方式中,可以执行方法,该方法包括:在系统中接收图像;通过使用系统,识别接收到的图像中在语义上相关的部分;以及通过使用系统,基于识别到的部分压缩接收到的图像。
图2示出了图像200的示例,该图像200示出了端上来的餐点,诸如在餐厅中。图像200示出了桌面202、搁置在桌面上的餐具垫204、以及位于餐具垫上的餐盘206、餐巾208和玻璃杯210。在餐盘206上的是食物212,诸如寿司卷,并且在餐巾208上的是筷子214。
可以执行图像处理来辨别图像200中的对象。例如,可以将对象辨别功能应用到图像200以辨别对象202-214中的一个或多个。例如,可以图像为基础训练对象辨别功能的算法以辨别物品(诸如餐盘、玻璃杯等)的普通形状。辨别出来的对象可用于确定图像200的哪些区域在语义上更相关或在语义上不那么相关。例如,图像库可以包含图像描绘了诸如寿司212等食物的许多实例,但图像描绘了诸如餐巾208等物品的实例则较少。基于此,可以对算法进行调整以将寿司212视为比餐巾208在语义上更相关,仅列举图像200中的一对对象的一个示例。可以针对任何其它对象集合(由对象中的两个或多个组成)执行相似的估计,直到算法已经确定更相关的(多个)对象和不那么相关的(多个)对象。然后可以使用有关语义相关性的信息来确定如何压缩图像200。
可以对来自图像序列的一个或多个图像进行语义相关性分析,以便调整对整个图像的压缩级别。图3示出了图像序列300的示例。图像序列300包括此处出于图示的目的而并排示出的图像302。例如,图像序列300构成视频剪辑,该视频剪辑是在一具体时间段(诸如几秒)内记录的。此处,任意数量N个图像302是图像序列300的一部分。即,图像序列此处包括相应的图像I1至IN,在这些图像中,图像I1、I2、Ik、Ik+1和IN被示出。
例如,假设图像序列300是在海滩上拍摄的。具体地,拍摄者在捕获视频剪辑的时候利用相机(例如,智能手机)执行了滑动运动,从而按照连续的方式捕获到了一连串海滩和海洋的视图。例如,图像I1包括与海滩304、海滩外的海洋306、海洋上方的天空308、地平线上的船只310对应的图像内容。此外,在图像I2中,由于相机的摇摄,物品已经移动了一点。
在图像Ik中,一个人312已经出现在图像序列中。该人可以被辨别为在语义上相关的图像内容。在一些实施方式中,可以确定人312相对于图像Ik的剩余部分的大小。例如,看起来较大的对象可以表明摄影者认为它们是在语义上相关的。因此,可以确定人312的高度、宽度、和/或面积,并且可以将它们与图像Ik的整个大小相比较。
图像中的对象的移动可以用于确定该对象是在语义上相关的。在一些实施方式中,可以确定人312从图像Ik到图像Ik+1的明显移动,并且可以将该移动用作语义相关性信号,使得对该图像内容应用相对较低的压缩。例如,可以确定对象的速度并且将该速度纳入考虑。相对于图像所定义的框架来确定该移动。因此,因为在捕获图像时对象实际上正在移动、或者在连续图像捕获之间正在移动相机、或者这两种原因,该移动能够看得出来。
可以使用面部追踪技术来确定语义相关性。例如,可以将面部追踪功能应用到图像302。虽然在图像I1和I2中未检测到面部,但在图像Ik中可以检测到人312的面部。例如,然后可以将标记314应用到面部。即,面部追踪功能可以检测到面部(或者人的身体)出现在图像中,并且该信息可以用于将区域识别为在语义上相关的。
可以使用对象辨别技术来确定语义相关性。与图2中的上述示例相似,可以将对象辨别功能应用到图像302。当检测到人312并且将其辨别为与比如海滩或海洋相对的人时,系统可以将人312归类成语义上相关的图像内容。
可以将编码复杂度用作语义相关性的度量。在一些实施方式中,可以将功能应用到图像,该功能估计针对该图像的多个部分编码过程会有多复杂。例如,在图像I1中,海滩304和天空308在视觉上相对均匀的,因此可能编码复杂度相对较低。另一方面,在图像Ik中,人312可能纹理丰富并且会表现出许多不同的细节、明暗度、对比度、和/或亮度水平。因此,人312的编码复杂度会相对较高。因此,可以使用编码复杂度来确定图像的哪些区域应该被更大或更小程度地压缩。例如,高编码复杂度可以表明应该保留相对较多的图像信息,反之亦然。
可以使用自动聚焦功能来识别语义上相关的图像部分。拍摄者选择在自动聚焦功能已经选好被置于焦点处的特定对象的时刻拍摄照片这一事实可以表明该对象可能具有语义相关性。例如,人312的头部上的标记314可以是由相机/镜头系统中的自动聚焦电路限定的自动聚焦位置。可以使用有关自动聚焦的位置的该信息来将该图像归类为在语义上相关的。
图4至图8示出了系统的示例。这些示例涉及其中一些系统组件以框的形式被示出的框图。框表示被实施来执行操作(包括明确描述的那些操作)的一个或多个电路或其它系统组件。在一些实施方式中,框可以包括至少一个处理器和配置为存储用于该处理器的指令的存储器。例如,计算机程序产品可以具有其中存储的待由处理器读取和执行的指令。此处,仅出于图示的目的对框进行了组织。在一些实施方式中,可以将两个或多个框组合成一个公共单元。同样或相反,可以使用比此处示出的框更多或更少的框。
图4示出了可用于图像处理的系统400的示例。系统400此处包括成像组件410、图像分析组件420和图像压缩组件430。例如,系统400可以是相机的一部分,诸如位于智能手机中或位于分开的相机单元中。成像组件410检测光(由箭头440示意性地指示)并且,诸如通过使用图像传感器和有关的电路,生成电子形式的图像信号。可以将生成的信号提供给图像分析组件420,该图像分析组件420对信号进行处理以例如根据本文描述的一种或多种方式识别图像中在语义上相关的至少一个部分。此外,图像压缩组件430从图像分析组件420或直接从成像组件410接收图像信号。图像压缩组件430还从图像分析组件420接收有关图像的识别到的(多个)部分的信息。图像压缩组件然后基于识别到的(多个)部分对图像进行压缩。例如,图像压缩组件430可以具有适合用在图像上的一个或多个压缩功能,并且可以基于图像分析组件420识别到了图像的哪些(多个)部分来对这些功能进行加权。
图5示出了可用于图像的编码和解码的系统500的示例。在一些实施方式中,组件510、520和530执行操作以生成编码图像,并且然后可以在一个或多个通道540中转发该图像。例如,可以执行编码图像的有线或无线传输。组件550和560然后可以从接收到的编码图像生成解码图像。例如,可以将解码图像诸如在监视器或其它显示器上呈现给观看者。
具体地,组件510对图像执行语义内容分析。可以使用本文描述的任何或所有方法。组件510基于其对图像的分析来识别图像中在语义上相关的部分。此外,组件520对图像数据执行变换。该变换基于图像的内容诸如在频域中创建图像的单独表示。例如,可以执行离散余弦变换(DCT)。
组件530基于识别到的(多个)部分执行图像内容的量化和压缩。在一些实施方式中,量化涉及将另一形式的量化矩阵或系数应用到图像数据的值。可以将高相关性的区域量化到第一集合的整数,并且可以将较低相关性的区域量化到第二集合的整数,其中,第一集合大于第二集合。例如,可以将高相关性的区域量化到最接近的整数,并且可以将较低相关性的区域量化到最接近的第N个整数,其中,N是预定义数。作为另一示例,可以将相关的区域量化到最接近的整数,并且在不那么相关的区域中,可以使用根据特定模式省略了一些整数的修改整数集合,诸如集合1,2,4,5,7,8,…。可以使用其它整数集合进行量化。可以执行得到的值的舍入。执行压缩,使得相较于图像中的其它地方,在识别到的(多个)部分中应用较低的压缩。
在通过通道540提供编码图像之后,组件550可以执行解码。例如,可以按照与组件530进行编码的方式相反的方式来进行该解码。相似地,组件560可以执行与组件520应用的变换基本上相逆的变换。例如,可以执行逆DCT。
图6示出了可以使用自动聚焦数据来识别图像的语义相关部分的系统600的示例。箭头602示意性地图示了系统600所捕获的光,该系统600可以被实施在相机中,仅列举一个示例。系统600包括接收捕获到的光的光学组件604。例如,可以将一个或多个镜头和图像感测电路包括在光学组件604中。箭头606指示来自光学组件604的图像输出信号。来自光学组件604的输出信号的一个接收方是自动聚焦电路608。例如,自动聚焦电路可以在图像中与系统600相隔不同距离的物品之间进行选取,以限定用于光学组件604的自动聚焦位置以便用于调节(多个)镜头进行适当的曝光。箭头610指示从自动聚焦电路608输出的自动聚焦数据。自动聚焦数据输出的一个接收方是光学组件604,其可以对应地调节其设置。
箭头606表明来自光学组件604的图像输出信号也被图像分析组件612接收到。图像分析组件612分析捕获到的图像并且将该图像中的一个或多个部分识别为在语义上相关的。箭头614此处表明图像内容和识别(多个)语义相关部分的信息被提供给图像压缩组件616。图像压缩组件616基于识别到的(多个)部分对图像进行压缩。因此,图像压缩组件616从自动聚焦电路608接收自动聚焦数据,如箭头610所示。可以基于图像中的自动聚焦位置来识别语义相关部分。在一些实施方式中,图像压缩组件616可以直接从光学组件604接收图像数据。
箭头618表明图像压缩组件616可以将压缩和编码的图像提供给在系统600外面的组件(未示出),包括但不限于:诸如存储器等储存器、或用于传输的通信组件。
图7示出了可以执行量化和舍入作为对图像进行处理的一部分的系统700的示例。箭头710指示图像内容被提供给系统700。例如,可以选择宏块部分,诸如包括8x 8像素。对图像内容(例如,8x 8像素块)进行DCT 720。例如,DCT 720可以基于宏块部分生成值的8x 8矩阵。箭头730指示DCT 720生成的矩阵。
可以提供量化矩阵(QM)740。QM包括被配置用于量化由DCT 720生成的值的系数。在一些实施方式中,可以将QM 740应用到图像的整个颜色通道中的所有或一些。例如,大值QM指示将DCT值量化到相对较少的值。相反,小值QM指示将DCT值量化到相对较宽的值范围。除法功能750指示除法运算,该除法运算涉及来自DCT 720的矩阵和QM 740。例如,可以将来自DCT 720的矩阵的各个元素除以来自QM 740的对应元素。可以对来自除法功能750的输出进行舍入功能760。例如,可以使值为最接近的整数值,以便消除用于浮动点信息的比特。
系统700可以基于语义相关图像部分来应用压缩。在一些实施方式中,系统700可以对压缩功能进行加权,以便在相关部分中应用比在其它(多个)部分中更低的压缩,反之亦然。可以对压缩和/或舍入进行加权。例如,可以将QM因子减半,并且可以进行舍入到最接近的偶数,而不是舍入到最接近的整数。结果可以是:一旦已经进行了霍夫曼编码作为图像压缩的一部分,便具有相同数量的比特来表示所有的值,但这些比特是分散在图像中的。例如,在仅使用偶数的一个图像部分中,使用少量的数据,并且在被确定为具有相关性的区域中,使用偶数和奇数来在该区域中获得更高的清晰度。该方法可以允许使用更高质量的QM740,使得在不明显增加压缩数据的大小的情况下提高在观看者高度感兴趣区域中的图像质量。
图8示出了可用于图像处理的系统800的示例。语义内容分析组件810可以通过使用本文描述的任何或所有方法来确定图像中的语义相关区域。一种这种方法是:基于现有的图像采集对语义内容分析组件810进行训练以辨别语义上相关的内容。图像库820是可用于该目的的数字图像的储存器。语义内容分析组件810可以针对图像库820中描绘的对象分析图像库820中的图像。例如,如果在图像库820中比另一种类型的对象(例如,餐巾)明显更常描绘一种类型的对象(例如,寿司卷),那么语义内容分析组件810可以推出该种类型的对象比该另一种类型的对象在语义上更相关。
语义内容分析组件810在确定语义相关图像内容时可以使用模板830。模板可以将图像的预定义部分指定为在语义上相关的。例如,可以指定图像的中心或三分之一区域。因此,可以通过语义内容分析组件810将一个或多个模板830应用到图像。
图9示出了可以与本文描述的技术一起使用的通用计算机设备900和通用移动计算机设备950的示例。计算设备900旨在表示各种形式的数字计算机,诸如膝上型计算机、台式计算机、平板、工作台、个人数字助理、电视、服务器、刀片式服务器、大型主机、以及其它合适的计算设备。计算设备500旨在表示各种形式的移动设备,诸如个人数字助理、蜂窝电话、智能手机、以及其它相似的计算设备。本文示出的组件、它们的连接和关系、以及它们的功能意在仅仅是示例性的,并且不意在限制所描述的和/或在本文所要求的本发明的实施方式。
计算设备900包括处理器902、存储器904、储存器设备906、连接至存储器904和高速扩展端口910的高速控制器908、以及连接至低速总线914和储存器设备906的低速控制器912。处理器902可以是基于半导体的处理器。存储器904可以是基于半导体的存储器。各个组件902、904、906、908、910和912使用各种总线互连,并且可以安装在公共主板上或以其它方式安装(若恰当)。处理器902可以处理用于在计算设备900内执行的指令,包括存储在存储器904中或存储在储存器设备906上以将用于GUI的图形信息显示在外部输入/输出设备(诸如,联接至高速控制器908的显示器916)的指令。在其它实施方式中,若恰当,连同多个存储器和多种类型的存储器,可以使用多个处理器和/或多个总线。同样,可以将多个计算设备900与提供必要操作的部分的各个设备连接(例如,作为服务器集群、一组刀片式服务器、或多处理器系统)。
存储器904将信息存储在计算设备900内。在一种实施方式中,存储器904是易失性存储器单元或多个易失性存储器单元。在另一实施方式中,存储器904是非易失性存储器单元或多个非易失性存储器单元。存储器904还可以是另一形式的计算机可读介质,诸如磁盘或光盘。
储存器设备906能够为计算设备900提供海量存储。在一种实施方式中,储存器设备906可以是或可以包含计算机可读介质,诸如软盘设备、硬盘设备、光盘设备、或磁带设备、闪存或其它相似的固态存储器设备、或设备阵列,包括存储区域网络或其它配置中的设备。计算机程序产品可以有形地体现为信息载体。计算机程序产品还可以包含指令,该指令在被执行时执行一种或多种方法,诸如上面描述的方法。信息载体是计算机可读介质或机器可读介质,诸如存储器904、储存器设备906、或处理器902上的存储器。
高速控制器908管理用于计算设备900的带宽密集型操作,而低速控制器912管理不那么带宽密集型的操作。这种功能分配仅仅是示例性的。在一种实施方式中,高速控制器908联接至存储器904、显示器916(例如,通过图形处理器或加速器)并且联接至高速扩展端口910,高速扩展端口910可以接受各种扩展卡(未示出)。在本实施方式中,低速控制器912联接至储存器设备906和低速扩展端口914。低速扩展端口914(可以包括各种通信端口(例如,USB、蓝牙、以太网、无线以太网))可以例如通过网络适配器联接至一个或多个诸如键盘、指向设备、扫描仪等输入/输出设备、或诸如开关或路由器等联网设备。
计算设备900可以被实施成众多不同的形式,如图中所示。例如,可以将其实施为标准服务器920、或分多次实施在一组这种服务器中。还可以将其实施为机架式服务器系统924的一部分。另外,可以将其实施在诸如膝上型计算机922等个人计算机中。可替代地,可以将来自计算设备900的组件与移动设备(未示出)(诸如设备950)中的其它组件相结合。各个这种设备可以包含计算设备900、950中的一个或多个,并且整个系统可以由多个彼此通信的计算设备900、950构成。
除了其它组件之外,计算设备950还包括处理器952、存储器964、诸如显示器954等输入/输出设备、通信接口966、以及收发器968。设备950也可以设置有储存器设备,诸如微硬盘或其它设备,以提供附加存储。各个组件950、952、964、954、966和968使用各种总线互连,并且这些组件中的多个组件可以安装在公共主板上或以其它方式安装(若恰当)。
处理器952可以执行在计算设备950内的指令,包括存储在存储器964中的指令。处理器可以被实施为包括分开的多个模拟和数字处理器的芯片的芯片集。例如,处理器可以提供设备950的其它组件的配合,诸如用户界面的控制、设备950运行的应用、以及设备950进行的无线通信。
处理器952可以通过控制接口958和联接至显示器954的显示接口956与用户通信。例如,显示器954可以是TFT LCD(薄膜晶体管液晶显示器)或OLED(有机发光二极管)显示器、或其它合适的显示技术。显示接口956可以包括用于驱动显示器954向用户呈现图形和其它信息的合适的电路。控制接口958可以接收来自用户的命令并且转化这些命令以提交到处理器952。另外,可以提供外部接口962以与处理器952通信,以便实现设备950与其它设备的近区通信。例如,外部接口962在一些实施方式中可以提供有线通信,或者在其它实施方式中可以提供无线通信,并且还可以使用多个接口。
存储器964将信息存储在计算设备950内。存储器964可以被实施为(多个)计算机可读介质、(多个)易失性存储器单元、或(多个)非易失性存储器单元中的一种或多种。还可以提供扩展存储器974并且扩展存储器974可以通过扩展接口972连接至设备950,扩展接口972可以包括例如SIMM(单线存储器模块)卡接口。这种扩展存储器974可以为设备950提供额外的存储空间,或者还可以存储用于设备950的应用或其它信息。具体地,扩展存储器974可以包括用于进行或补充上面描述的过程的指令,并且还可以包括安全信息。因此,例如,扩展存储器974可以被提供为用于设备950的安全模块,并且可以编程有允许安全使用设备950的指令。另外,可以经由SIMM卡连同附加信息提供安全应用,诸如按照不会受到黑客攻击的方式将识别信息放在SIMM卡上。
例如,存储器可以包括闪存和/或NVRAM存储器,如下面讨论的。在一种实施方式中,计算机程序产品有形地体现为信息载体。计算机程序产品可以包含指令,该指令在被执行时执行一种或多种方法,诸如上面描述的方法。信息载体是计算机可读介质或机器可读介质,诸如存储器964、扩展存储器974、或处理器952上的存储器,其可以通过收发器968或外部接口962接收。
设备950可以通过通信接口966无线通信,必要时其可以包括数字信号处理电路。通信接口966可以提供在各种模式或协议下的通信,诸如GSM语音通话、SMS、EMS或MMS消息传递、CDMA、TDMA、PDC、WCDMA、CDMA2000、或GPRS,等等。例如,这种通信可以通过射频收发器968进行。另外,可以进行短程通信,诸如使用蓝牙、WiFi、或其它这种收发器(未示出)。另外,GPS(全球定位系统)接收器模块970可以向设备950提供另外的与导航有关的以及与位置有关的无线数据,若适用,这些数据可供在设备950上运行的应用使用。
设备950还可以通过使用音频编解码器960进行可听地通信,音频编解码器960可以接收来自用户的口头信息并且将其转化成可用的数字信息。音频编解码器960同样可以为用户生成可听的声音,诸如通过扬声器(例如,位于设备950的耳机中)。这种声音可以包括来自语音电话通话的声音,可以包括记录的声音(例如,语音消息、音乐文件等),并且还可以包括由在设备950上操作的应用生成的声音。
计算设备950可以被实施成众多不同的形式,如图中所示。例如,其可以被实施为蜂窝电话980。其也可以被实施为智能电话982、个人数字助理、或其它相似移动设备的一部分。
本文描述的系统和技术的各种实施方式可以被实现在数字电子电路、集成电路、专门设计的ASIC(应用专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中。这些各种实施方式可以包括实施在可在包括至少一个可编程处理器的可编程系统上执行和/或解释的一个或多个计算机程序中,该可编程处理器可以是专用的或通用的、被联接用于从存储系统、至少一个输入设备、以及至少一个输出设备接收数据和指令以及向它们发送数据和指令。
这些计算机程序(也称为程序、软件、软件应用或代码)包括用于可编程处理器的机器指令,并且可以用高级程序化和/或面向对象的编程语言、和/或汇编/机器语言来实施。如本文使用的,术语“机器可读介质”、“计算机刻度介质”指用于向可编程处理器提供机器指令和/或数据的任何计算机程序产品、装置和/或设备(例如,磁盘、光盘、存储器、可编程逻辑设备(PLD)),包括接收机器指令作为机器可读信号的机器可读介质。术语“机器可读信号”指用于向可编程处理器提供机器指令和/或数据的任何信号。
为了提供与用户的交互,本文描述的系统和技术可以被实施在具有用于向用户显示信息的显示设备(例如,CRT(阴极射线管)或LCD(液晶显示器)监视器)和用户可以用来向计算机提供输入的指向设备(例如,鼠标或轨迹球)的计算机上。也可以使用其它类型的设备来提供与用户的交互;例如,向用户提供的反馈可以是任何形式的感测反馈(例如,视觉反馈、听觉反馈、或触觉反馈);并且来自用户的输入可以任何形式被接收,包括声音输入、语音输入或触觉输入。
本文描述的系统和技术可以实施在包括后台组件(例如,作为数据服务器)、或包括中间件组件(例如,应用服务器)、或包括前台组件(例如,具有图形用户界面或Web浏览器(通过该Web浏览器,用户可以与本文描述的系统和技术的实施方式交互)的客户端计算机)、或这种后台、中间件或前台组件的任何组合的计算系统中。系统的组件可以通过任何形式的数字数据通信或数字数据通信介质(例如,通信网络)互连。通信网络的示例包括局域网(“LAN”)、广域网(“WAN”)、和互联网。
计算系统可以包括客户端和服务器。客户端和服务器通常远离彼此并且通常通过通信网络交互。客户端和服务器的关系借由在相应计算机上运行并且彼此具有客户端-服务器关系的计算机程序产生。
已经描述了众多实施例。虽然如此,要理解,在不脱离本发明的精神和范围的情况下,可以进行各种修改。
另外,图中描绘的逻辑流程不要求所示的特定顺序、或者向后顺序,来实现期望的结果。另外,可以提供其它步骤,或者可以从描述的流程取消步骤,并且可以向所描述的系统添加其它组件或可以从所描述的系统移除其它组件。因此,其它实施例在以下权利要求书的范围内。
以下示例中概述了另外的实施方式:
示例1:一种方法,包括:在系统中接收图像;通过使用系统,识别接收到的图像中在语义上相关的部分;以及通过使用系统,基于识别到的部分来压缩接收到的图像。
示例2:根据示例1的方法,其中,基于识别到的部分来压缩接收到的图像包括:基于识别到的部分对压缩功能进行加权。
示例3:根据示例1或2的方法,其中,基于识别到的部分来压缩接收到的图像包括:基于识别到的部分将量化应用到接收到的图像。
示例4:根据示例3的方法,其中,应用量化包括:将来自接收到的图像的识别到的部分的图像信息量化到第一集合的整数,并且将不是来自识别到的部分的图像信息量化到第二集合的整数,其中,量化被配置为使得第一集合大于第二集合。
示例5:根据示例4的方法,其中,将来自识别到的部分的图像信息量化到最接近的整数值,并且将不是来自识别到的部分的图像信息量化到最接近的第N个整数值,其中,N是预定义数。
示例6:根据示例1至5中的一个示例的方法,其中,识别接收到的图像中在语义上相关的部分包括:将面部追踪功能应用到接收到的图像。
示例7:根据示例1至6中的一个示例的方法,其中,识别接收到的图像中在语义上相关的部分包括:将对象辨别功能应用到接收到的图像。
示例8:根据示例1至7中的一个示例的方法,其中,识别接收到的图像中在语义上相关的部分包括:将接收到的图像中的预定义位置作为目标。
示例9:根据示例1至8中的一个示例的方法,其中,识别接收到的图像中在语义上相关的部分包括:确定在接收到的图像中的对象的相对大小。
示例10:根据示例1至9中的一个示例的方法,其中,识别接收到的图像中在语义上相关的部分包括:分析在接收到的图像中的对象的移动。
示例11:根据示例10的方法,其中,分析对象的移动包括:确定在接收到的图像中的对象的速度。
示例12:根据示例1至11中的一个示例的方法,其中,识别接收到的图像中在语义上相关的部分包括:针对接收到的图像的区域估计编码复杂度。
示例13:根据示例1至12中的一个示例的方法,其中,与图像有关的自动聚焦数据指示在图像中的自动聚焦位置,以及其中,接收到的图像中在语义上相关的部分基于自动聚焦位置来识别。
示例14:一种计算机程序产品,计算机程序产品有形地体现为非暂时性计算机可读介质并且包括可执行指令,该可执行指令在被执行时使计算设备执行操作,该操作包括:接收图像;识别接收到的图像中在语义上相关的部分;以及基于识别到的部分来压缩接收到的图像。
示例15:一种系统,包括:包含图像的储存器;图像分析电路,其配置为识别图像中在语义上相关的部分;以及图像压缩电路,其配置为基于识别到的部分来压缩图像。
示例16:根据示例15的系统,还包括被配置为对图像执行变换的变换电路。
示例17:根据示例15或16的系统,其中,图像压缩电路被配置为执行图像数据的量化和舍入,并且基于识别到的部分对量化和舍入中的至少一种进行加权。
示例18:根据示例15至17中的一个示例的系统,还包括图像模板,其中,图像分析电路被配置为在识别图像中在语义上相关的部分时使用图像模板。
示例19:根据示例15至18中的一个示例的系统,其中,图像压缩电路被配置为在识别图像中在语义上相关的部分时对图像执行对象辨别。
示例20:根据示例15至19中的一个示例的系统,还包括配置为生成与图像有关的自动聚焦数据的自动聚焦电路,自动聚焦数据指示在图像中的自动聚焦位置,以及其中,图像分析电路基于自动聚焦位置来识别图像中在语义上相关的部分。

Claims (20)

1.一种用于图像压缩的方法,包括:
在系统中接收图像;
通过使用所述系统,识别接收到的图像中在语义上相关的部分,其中,识别接收到的图像中在语义上相关的所述部分进一步包括:
识别接收到的图像中的至少两个对象;
从所述至少两个对象中确定在图像库中最常见的对象;以及
将接收到的图像中描绘所确定的在图像库中最常见的对象的部分识别为在语义上相关;以及
通过使用所述系统,基于识别到的部分来压缩接收到的图像,其中,与接收到的图像的另一部分相比,识别到的部分被更低地压缩。
2.根据权利要求1所述的方法,其中,基于识别到的部分来压缩接收到的图像包括:基于识别到的部分对压缩功能进行加权。
3.根据权利要求1所述的方法,其中,基于识别到的部分来压缩接收到的图像包括:基于识别到的部分将量化应用到接收到的图像。
4.根据权利要求3所述的方法,其中,应用所述量化包括:将来自接收到的图像的识别到的部分的图像信息量化到第一集合的整数,并且将不是来自识别到的部分的图像信息量化到第二集合的整数,其中,所述量化被配置为使得所述第一集合大于所述第二集合。
5.根据权利要求4所述的方法,其中,将来自识别到的部分的所述图像信息量化到最接近的整数值,并且将不是来自识别到的部分的所述图像信息量化到最接近的第N个整数值,其中,N是预定义数。
6.根据权利要求1所述的方法,其中,识别接收到的图像中在语义上相关的所述部分包括:将面部追踪功能应用到接收到的图像。
7.根据权利要求1所述的方法,其中,识别接收到的图像中在语义上相关的所述部分包括:将对象辨别功能应用到接收到的图像。
8.根据权利要求1所述的方法,其中,识别接收到的图像中在语义上相关的所述部分包括:将接收到的图像中的预定义位置作为目标。
9.根据权利要求1所述的方法,其中,识别接收到的图像中在语义上相关的所述部分包括:确定在接收到的图像中的对象的相对大小。
10.根据权利要求1所述的方法,其中,识别接收到的图像中在语义上相关的所述部分包括:分析在接收到的图像中的对象的移动。
11.根据权利要求10所述的方法,其中,分析所述对象的所述移动包括:确定在接收到的图像中的所述对象的速度。
12.根据权利要求1所述的方法,其中,识别接收到的图像中在语义上相关的所述部分包括:针对接收到的图像的区域估计编码复杂度。
13.根据权利要求1所述的方法,其中,与接收到的图像有关的自动聚焦数据指示在接收到的图像中的自动聚焦位置,以及其中,接收到的图像中在语义上相关的所述部分基于所述自动聚焦位置来识别。
14.一种包括可执行指令的非暂时性计算机可读介质,所述可执行指令在被执行时使计算设备执行操作,所述操作包括:
接收图像;
识别接收到的图像中在语义上相关的部分,其中,识别接收到的图像中在语义上相关的所述部分进一步包括:
识别接收到的图像中的至少两个对象;
从所述至少两个对象中确定在图像库中最常见的对象;以及
将接收到的图像中描绘所确定的在图像库中最常见的对象的部分识别为在语义上相关;以及
基于识别到的部分来压缩接收到的图像,其中,与接收到的图像的另一部分相比,识别到的部分被更低地压缩。
15.一种用于图像压缩的系统,包括:
包含接收到的图像的储存器;
图像分析电路,被配置为识别接收到的图像中在语义上相关的部分,所述图像分析电路被配置为:
识别接收到的图像中的至少两个对象;
从所述至少两个对象中确定在图像库中最常见的对象;以及
将接收到的图像中描绘所确定的在图像库中最常见的对象的部分识别为在语义上相关;以及
图像压缩电路,被配置为基于识别到的部分来压缩接收到的图像,其中,与接收到的图像的另一部分相比,识别到的部分被更低地压缩。
16.根据权利要求15所述的系统,还包括被配置为对接收到的图像执行变换的变换电路。
17.根据权利要求15所述的系统,其中,所述图像压缩电路被配置为执行图像数据的量化和舍入,并且基于识别到的部分对所述量化和所述舍入中的至少一种进行加权。
18.根据权利要求15所述的系统,还包括图像模板,其中,所述图像分析电路被配置为在识别接收到的图像中在语义上相关的所述部分时使用所述图像模板。
19.根据权利要求15所述的系统,其中,所述图像压缩电路被配置为在识别接收到的图像中在语义上相关的所述部分时对接收到的图像执行对象辨别。
20.根据权利要求15所述的系统,还包括被配置为生成与接收到的图像有关的自动聚焦数据的自动聚焦电路,所述自动聚焦数据指示在接收到的图像中的自动聚焦位置,以及其中,所述图像分析电路基于所述自动聚焦位置来识别接收到的图像中在语义上相关的所述部分。
CN201780057840.3A 2017-01-20 2017-10-31 用于图像压缩的方法和系统以及非暂时性计算机可读介质 Active CN109716770B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US15/411,203 US10405003B2 (en) 2017-01-20 2017-01-20 Image compression based on semantic relevance
US15/411,203 2017-01-20
PCT/US2017/059301 WO2018136129A1 (en) 2017-01-20 2017-10-31 Image compression based on semantic relevance

Publications (2)

Publication Number Publication Date
CN109716770A CN109716770A (zh) 2019-05-03
CN109716770B true CN109716770B (zh) 2023-10-03

Family

ID=60473613

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780057840.3A Active CN109716770B (zh) 2017-01-20 2017-10-31 用于图像压缩的方法和系统以及非暂时性计算机可读介质

Country Status (4)

Country Link
US (1) US10405003B2 (zh)
EP (1) EP3497929A1 (zh)
CN (1) CN109716770B (zh)
WO (1) WO2018136129A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110769258A (zh) * 2019-11-05 2020-02-07 山东浪潮人工智能研究院有限公司 一种用于特定场景多语义区域的图像压缩方法及系统
GB2592683A (en) * 2020-03-06 2021-09-08 Sony Corp A device, computer program and method

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6175829B1 (en) * 1998-04-22 2001-01-16 Nec Usa, Inc. Method and apparatus for facilitating query reformulation
CN101030230A (zh) * 2007-04-18 2007-09-05 北京北大方正电子有限公司 一种图像检索方法及系统
CN101325624A (zh) * 2007-05-29 2008-12-17 捷讯研究有限公司 在上载图像之前调整图像大小的系统及方法
CN101755461A (zh) * 2007-07-20 2010-06-23 富士胶片株式会社 图像处理设备、图像处理方法和程序
CN102117400A (zh) * 2009-07-01 2011-07-06 手持产品公司 捕获和分析目标的图像数据的系统以及方法
CN102238390A (zh) * 2011-08-05 2011-11-09 中国科学院深圳先进技术研究院 基于图像库的视频和图像的编码解码方法与系统
CN102428483A (zh) * 2009-03-23 2012-04-25 生命力有限公司 用于多流视频压缩的系统和方法
JP2013207449A (ja) * 2012-03-28 2013-10-07 Brother Ind Ltd 画像読取装置、画像処理方法および画像処理プログラム
JP2013207324A (ja) * 2012-03-27 2013-10-07 Fujitsu Ltd 複数の画像圧縮方式が存在する環境における映像選択方法
CN106255968A (zh) * 2014-05-16 2016-12-21 微软技术许可有限责任公司 自然语言图像搜索

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08331561A (ja) 1995-03-30 1996-12-13 Canon Inc 画像処理装置
US6970602B1 (en) * 1998-10-06 2005-11-29 International Business Machines Corporation Method and apparatus for transcoding multimedia using content analysis
US6539124B2 (en) 1999-02-03 2003-03-25 Sarnoff Corporation Quantizer selection based on region complexities derived using a rate distortion model
JP2003018599A (ja) * 2001-07-04 2003-01-17 Matsushita Electric Ind Co Ltd 画像符号化装置および方法
US7574016B2 (en) * 2003-06-26 2009-08-11 Fotonation Vision Limited Digital image processing using face detection information
US7463775B1 (en) * 2004-05-18 2008-12-09 Adobe Systems Incorporated Estimating compressed storage size of digital data
US7885988B2 (en) * 2006-08-24 2011-02-08 Dell Products L.P. Methods and apparatus for reducing storage size
WO2010057170A1 (en) 2008-11-17 2010-05-20 Cernium Corporation Analytics-modulated coding of surveillance video
IT1402430B1 (it) 2010-09-17 2013-09-04 St Microelectronics Srl "procedimento e dispositivo per l'elaborazione di segnali video, trasmettitore o prodotto informatico relativi"
WO2012050832A1 (en) 2010-09-28 2012-04-19 Google Inc. Systems and methods utilizing efficient video compression techniques for providing static image data
CA2810899C (en) 2010-10-05 2016-08-09 General Instrument Corporation Coding and decoding utilizing adaptive context model selection with zigzag scan
US9179201B2 (en) * 2011-08-26 2015-11-03 Cyberlink Corp. Systems and methods of detecting significant faces in video streams
US9171018B2 (en) * 2012-01-17 2015-10-27 Google Inc. System and method for associating images with semantic entities
US9648355B2 (en) * 2014-03-07 2017-05-09 Eagle Eye Networks, Inc. Adaptive security camera image compression apparatus and method of operation
US20160080743A1 (en) 2014-09-12 2016-03-17 Tmm, Inc. Systems and methods for subject-oriented compression
KR102212762B1 (ko) * 2014-09-17 2021-02-05 삼성전자주식회사 코덱과 이를 포함하는 장치들

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6175829B1 (en) * 1998-04-22 2001-01-16 Nec Usa, Inc. Method and apparatus for facilitating query reformulation
CN101030230A (zh) * 2007-04-18 2007-09-05 北京北大方正电子有限公司 一种图像检索方法及系统
CN101325624A (zh) * 2007-05-29 2008-12-17 捷讯研究有限公司 在上载图像之前调整图像大小的系统及方法
CN101755461A (zh) * 2007-07-20 2010-06-23 富士胶片株式会社 图像处理设备、图像处理方法和程序
CN102428483A (zh) * 2009-03-23 2012-04-25 生命力有限公司 用于多流视频压缩的系统和方法
CN102117400A (zh) * 2009-07-01 2011-07-06 手持产品公司 捕获和分析目标的图像数据的系统以及方法
CN102238390A (zh) * 2011-08-05 2011-11-09 中国科学院深圳先进技术研究院 基于图像库的视频和图像的编码解码方法与系统
JP2013207324A (ja) * 2012-03-27 2013-10-07 Fujitsu Ltd 複数の画像圧縮方式が存在する環境における映像選択方法
JP2013207449A (ja) * 2012-03-28 2013-10-07 Brother Ind Ltd 画像読取装置、画像処理方法および画像処理プログラム
CN106255968A (zh) * 2014-05-16 2016-12-21 微软技术许可有限责任公司 自然语言图像搜索

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
李冬梅.多媒体应用中的视觉信息描述与压缩技术.现代电视技术.2001,(第08期),全文. *

Also Published As

Publication number Publication date
EP3497929A1 (en) 2019-06-19
WO2018136129A1 (en) 2018-07-26
CN109716770A (zh) 2019-05-03
US10405003B2 (en) 2019-09-03
US20180213260A1 (en) 2018-07-26

Similar Documents

Publication Publication Date Title
JP7429676B2 (ja) ビデオ符号化及び復号のための適応的伝達関数
US10319115B2 (en) Image compression device
US9785865B2 (en) Multi-stage image classification
JP5859111B2 (ja) 対象オブジェクトベースの画像処理
RU2653314C2 (ru) Способ и устройство сжатия изображений и сервер
CN106664437B (zh) 一种用于对视频内容进行编码以进行无线传输的计算机实现的方法、系统、设备以及可读介质
CN116342622A (zh) 视频流的图像分割和修改
JP5766877B2 (ja) 類似度、視覚的品質、および関心に基づくフレーム符号化選択
KR102356924B1 (ko) 클라이언트측 비디오 트랜스코딩
US9407823B2 (en) Handling video frames compromised by camera motion
US11062210B2 (en) Method and apparatus for training a neural network used for denoising
JP2012239085A (ja) 画像処理装置、画像処理方法
CN109716770B (zh) 用于图像压缩的方法和系统以及非暂时性计算机可读介质
CN116847087A (zh) 视频处理方法、装置、存储介质及电子设备
US20220279191A1 (en) Face-based frame packing for video calls
JP2014036260A (ja) 画質評価装置、画質評価方法及び画質評価プログラム
US10735737B1 (en) Bit assignment based on spatio-temporal analysis
CN111654709B (zh) 基于先前帧的误差来压缩帧
EP2988502A1 (en) Method and system for transmitting data
KR20150086385A (ko) 관심 객체 기반 이미지 처리

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant