CN1307599C - 图像匹配 - Google Patents
图像匹配 Download PDFInfo
- Publication number
- CN1307599C CN1307599C CNB018026427A CN01802642A CN1307599C CN 1307599 C CN1307599 C CN 1307599C CN B018026427 A CNB018026427 A CN B018026427A CN 01802642 A CN01802642 A CN 01802642A CN 1307599 C CN1307599 C CN 1307599C
- Authority
- CN
- China
- Prior art keywords
- image
- cutting apart
- pixel
- coupling
- candidate value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
一种匹配数字图像的方法,包括调整多个像素组成的一个数字图像的图像特征,确定一套有限的候选值,其中一个候选值表示在第一图像的图像特征与第二图像的图像特征之间的一个可能匹配的候选值,以及建立用于评估这些候选值的一个匹配补偿函数,评估每个候选值的匹配补偿函数,并根据匹配补偿函数的评估结果来选择候选值,以及通过分割第一图像来调整该第一图像,这种调整包括将第一图像的至少一部分像素分配到各自的分割段,确定对于一个分割段的至少部分像素的确定参数,并且建立相应的匹配补偿函数,使得该函数至少部分基于该确定参数。
Description
技术领域
本发明涉及数字图像的匹配。
背景技术
图像处理过程会使用两个或多个图像的匹配,上述匹配实质上包括确定后继图像中的匹配段。在图像处理的多个领域中,图像的匹配是一个基本的步骤,比如深度重建,图像数据压缩,和动态分析。
匹配过程包括:确定在第一图像的第一位置中的图像特征,以及确定第二图像中这些图像特征的位置。在第一和第二图像的特征之间位置上的不同信息,例如平移或者旋转,可以被用在更多的处理中。比如:两个连续图像之间图像特征的平移可用来测量与该图像特征相关的物体的速度。
通过上下文所述的独立处理步骤可以执行图像匹配,上述匹配可以通过使用通用的图像处理硬件或软件实现,如MPEG的编码(解码)和电视扫描速度变换。在这些应用中,视频流的后继数字图像需要相互匹配。用于上述过程的一般方法内容如下。
源于同一视频流的两个后续图像需要匹配,使这些图象成为二维数字图象I1(x,y)和I2(x,y),这两个图像的匹配包括计算一对函数M=Mx(x,y)和M=My(x,y)值,在图象I1至图像I2中的每个像素,其理想图像由下式求得:
I2(x,y)=I1(x+Mx(x,y),y+My(x,y))。
M函数包括了有关两个图像之间像素或者特征如何移动的信息。视频流中像素的运动变化可用M函数来表示,每个像素用一个运动矢量来描述。这种运动矢量描述用于很多方面,比如二维图像的深度重建,电视中的扫描速率向上转换过程,还有MPEG的压缩等。因此,图像匹配的一个重要步骤就是求出M函数。
M被定义为一个独立于图像中所有像素的函数,这就导致如何求出该M函数的问题变得难以确定。尽管函数M最终能够被确定,但是函数M的构造会成问题,并导致相当的花费,尤其在时间和计算量上。这样,为了简化确立函数M的问题,提出了规范化函数M的解决途径。US5 072 293所提供的一种方法是越过图像中关于图像帧被确定的预定义模块,将函数M设定成一常量,从而简化了求M的过程。但是这种方法的计算量仍然很大。
发明内容
本发明的目的在于提供一种比现有方法更快更有效的匹配后续图像段的方法。
为了达到这个目的,本发明提供了可用于分割图像、计算机程序、媒体、信号、以及显示设备的方法和装置。
按照本发明,提供了一种数字图像匹配的方法,步骤如下:
调整由多个像素组成的一个第一数字图像的图像特征;
提供由多个像素组成的一个第二数字图像;
确定一组有限的候选值,其中一个候选值表示所述第一图像的图像特征与所述第二图像的图像特征之间一个可能的匹配候选;
建立一个匹配补偿函数,用来计算所述候选值;
计算每个候选值的匹配补偿函数;以及
根据该匹配补偿函数的计算结果选择一个候选值;
其特征在于:
通过分割上述第一图像调整所述第一图像,上述调整包括
根据与图像相关的像素特性,将至少部分上述图像的像素分配到各自的分割段;
根据像素到一个分割段的实边界部分的距离,对一个分割段的至少部分的像素确定一个确定的参数;
在至少部分的确定参数的基础上建立匹配补偿函数。
按照本发明,提供了一种用于匹配数字图像的装置,该装置包括:
一个输入部分,用来接收数字图像,该数字图像包含由多个像素组成的一个第一数字图像和由多个像素组成的一个第二数字图像;
一个输出部分,用来输出匹配的结果;
一个处理单元,连接在所述输入部分和所述输出部分之间,用来:
通过分割所述第一图像来调整所述第一数字图像(I1)的图像特征,包括根据与图像相关的像素特性向各个分割段指定所述图像的至少部分像素;
确定一套有限候选值,其中一个候选值表示所述第一图像的图像特征与所述第二图像的图像特征之间一个可能匹配的候选;
根据像素到一个分割段的实边界部分的距离,为一个分割段的至少部分像素确定一个确定的参数;
建立用于计算所述候选值的一个匹配补偿函数,该匹配补偿函数是至少部分地根据所述确定的参数;
计算对每个候选值的匹配补偿函数;以及
根据匹配补偿函数的计算结果选择一个候选值。
本发明的第一实施例中,通过分割调整第一图像使图像被匹配,分割包括指定所述第一图像至少部分的像素到各自的分割段,对一个分割段至少部分像素确定一个确定参数,并至少部分的根据该确定参数建立一个匹配补偿函数。通过分割调整第一个图像,向各个分割段提供确定的信息,就能更快更有效的实现本发明的匹配过程。如果采用准分割法,那么分割图像和提供确定信息所花的努力就会显著减少。准分割法在相应的申请,标题为“数字图像分割”(参考文件PHNL000493)中有详细的描述。
本发明的显著优点在实施例中作了阐述。本发明更多的目的、细节、修改、效果以及细节将参考附图进行详细描述。
附图说明
图1表示一个分割段的匹配过程的实例示意图
图2表示一种用于匹配数字图像的装置示意图
具体实施方式
在随后的本发明实施例中将叙述两个图像的匹配方案。这些图像可以是来自视频流的后续图像,但本发明并不局限于此。该图像是包括有效的像素并且可用二元函数I1(x,y),I2(x,y)来表述的数字图像。其中,x、y是确定像素位置的坐标。
两个图像的匹配包括计算一对函数M=Mx(x,y)和M=My(x,y)。M函数与前面一样定义为将图像I1中的每个像素映射到I2中像素的函数。所依据的公式为:I2(x,y)=I1(x+Mx(x,y),y+My(x,y))。
根据本发明的一个实施例,修改函数M的构造在于通过公式I2(x,y)=I1(x+Mx(G(x,y)),y+My(G(x,y))),调整先前定义的函数M,将M重新定义为具有类似运动的像素组的常量函数。
引入函数G使得M对于一组有类似运动特征的像素为一常量。引入函数G是为了规范化匹配的问题,G函数的改进可以明显的减少求M的精力。
使得M为一常量的一组像素是由被认为具有相似运动特征的像素组成。为了找到这些像素集合,需要通过分割将图像划分为多个分割段。图像的分割相当于对图像中的每个像素确定一套有限分割段中的一个成员,其中一个分割段是一个相联系的像素集合。一种比较好的分割方法是可以根据与像素相关的像素特性比如颜色,亮度,和结构来确定分割段的像素成员,并进行局部划分。这种局部划分出来的多个分割段没有必要与目标图像直接对应,但是在一个确定分割段中的像素仍有可能具有类似的运动特征。有一种特别优选的分割方法叫做准分割法,在标题为“数字图像的分割”的相应专利申请文献中有详细的解释(参考文献PHNL000493),在这里引用可作为参考。采用准分割的方法,图像可以被快速而有效地分割。
通过上述的准分割方法,图像I1被分成多个分割段,所产生的分割段包括由边界所限定的多个像素,其中上述边界用于定义各自的分割段。由于采用准分割方法,这些分割段是由实边界和虚边界来限定。实边界部分是图像特征的分析结果,它对相关的分割段的边界具有很高的确定性。虚边界部分是通过计算对所检测的实边界部分的距离来确定,因此对相关的分割段边界的确定性就弱了一些。边界部分与图像内容联系越紧密,边界部分就越相关。根据本发明的一个实施例,在匹配分割段的形式中图像的匹配是优先于各自分割段的高确定特征的匹配来完成的。
图1中,图像I1的分割段10是由准分割法确定,并由边界为11(实线表示)和12(虚线表示)划定界限。为了确定分割段10在图像I1和I2之间的位移函数,需要找到在图像I2中与分割段10相匹配的分段10的投影,从而求出位移函数M。这需要选择与分割段10相匹配的多个可能的图像I2的匹配候选,计算对每个候选的匹配标准,并选择具有最佳匹配结果的候选。匹配标准是一个确定性的测量,其中第一图像的分割段与第二图像中的投影相匹配。
图1中,与分割段10相匹配的图像I2的候选是以图像I2中的投影20、30、40表示,由实边界部分21、31、41和虚边界部分22、32、42来限定。对于每个投影20、30、40,函数M分别以箭头M1、M2、M3表示。这样M1、M2、M3可看作函数M的候选值。为了确定哪个候选投影20,30,40与分割段10的关系最匹配,就必须计算对每个投影20,30,40的匹配标准。在评估对函数M的候选投影和候选值中,该匹配标准对高确定性的实边界部分具有更大的重要性。因此,在分割段的实边界部分与投影的边界部分之间的匹配比分割段虚边界部分的匹配具有更高的确定性。
匹配标准应用在数字图像处理中,并以作为减少匹配误差或简化匹配补偿函数的应用而著名。这种简化匹配函数的函数和匹配方法本身是现有技术中已知的,比如由作者De Haan和Biezen在“信号处理:图像通信6”(1994)229-239页中发表的“三维递归中检索块匹配时子像素运动的估计”。
一套有限的候选函数Mx,My为函数M在x和y坐标中的函数,定义为:{(Mx,i,My,i)|i=1,2,3,....}。
对一套有限的候选函数Mx,My的选择本身已应用在本领域中,例如在上文提到的De Haan和Biezen的著作中同样运用了Mx,My的函数集合。最好尽量减少需要计算每个候选的计算量,使得计算简便。对于每个候选,每个候选投影之间都是相互联系的。
分割段中的像素坐标集合表示为Ω,对i-th候选的匹配补偿Pi可表示为:
这个匹配补偿函数反应了在一个分割段中每个像素都是平等的关系。根据上文所谈到的在每个分割段中的各个像素的确定度并不一样,考虑到这一方面,匹配补偿函数就要改写为:
函数w(x,y)是对每个像素分配一个确定权衡因素,以便具有高确定性的像素能够更好的促进补偿函数的计算。这个实施例中,w(x,y)的值与到该分割段的实边界部分的距离d(x,y)有关,并随着从实边界部分的距离的增加而减小。任何合适的距离定义都可应用,比如Euclidean的“城市街区”,“棋盘”或者上文所提到的PHNL000493中的距离转换。对于w(x,y),任何合适的函数都可选用,只要函数值随着分割段边界距离的增加而减少即可。下面是一组可选用的一元情况w(x,y)的例子,两元函数对本领域普通技术人员来说是很显然的。下面的例子可无限的类推下去:
w(x)=1/d(x),
w(x)=1/d(x)2,
w(x)=1如果d(x)<1.5;w(x)=0如果d(x)≥1.5,
w(x)=(5-d(x))/4如果x<5;d(x)=0如果x≥5,
w(x)=(52-d(x)2)/(52-1)如果d(x)<5;w(x)=0如果d(x)≥1.5,并且
w(x)=(152-d(x)2)/(152-1)如果d(x)<15;w(x)=0如果d(x)≥15。
注意上面所有的函数值都随着与实边界部分距离的增加产生一个减少值。假设上面的第三个函数的值在预先确定的距离上是一个常量,超过该距离的函数值为零,因此,也产生一个随着距离的增加而减少的函数值。第三到第六个函数把计算限定到只有一些确定的最接近的像素,这样就进一步减少了计算量。如果用上文提到优选的准分割法实现图像的分割,最接近像素所属的分割段的实边界部分的距离已经从分割处理中获得,它作为距离数组中的信息形式。这样又大大减少了匹配过程中的计算量。
上面表示确定函数的实施例与到实边界段像素的距离有关。但本发明并不仅仅适用于上面的情况,还可以运用将确定值分配到每个像素的其它方法。那种情况下一个确定数组w(x,y)必须被对每个像素的权衡因数填充,其中每个像素与各自像素所属的分割段相关。
本发明还可用于单一图像中图像部分的匹配,比如用于样品或图像识别。
本发明还涉及一种计算机程序产品,它包括在运行计算机时用于执行本发明方法步骤的计算机程序编码部分。本发明的计算机程序产品可存储在任何一个适合的信息载体中,如硬盘,软盘,CD-ROM或计算机内存中。
本发明还涉及一种如图2所示的装置100,用于匹配数字图像。根据上面所述的方法,装置100具有一个用户匹配数字图像的处理单元110。处理单元110与输入端口120相连,通过该输入端口120能够接收数字图像,并将它们输入到单元110。单元110与输出端口130相连,通过输出端口输出图像之间匹配的结果。装置100可以包括如(3—维)电视的显示装置200。
应该注意到上面叙述的实施例并不限制本发明,在不超出附加权利要求的范围内本领域的普通技术人员可以设计各种替换的实施例。在权利要求中,任何圆括号之间的参考标记将不会限制该权利要求。文字“包括”并不排除那些所列权利要求中之外的其它元件和步骤的存在。本发明可通过包括多个不同的元件和一个合适的编程计算机来实现。在装置权利要求中,所例举的几个装置可通过一个或同样的硬件项目来实现。在多个不同的从属权利要求中叙述多种方法,但这不表明这些方法的组合没有显著的优势。
简言之,本文提供了数字图像的匹配方法,该方法包括调整由多个像素组成的一个数字图像的图像特征,确定一套有限的候选值,其中一个候选值表示在第一图像的图像特征与第二图像的图像特征之间的一个可能匹配的候选值,以及建立用于评估这些候选值的一个匹配补偿函数,评估每个候选值的匹配补偿函数,并根据匹配补偿函数的评估结果来选择候选值,以及通过分割第一图像来调整该第一图像,这种调整包括将第一图像的至少一部分像素分配到各自的分割段,确定一个对于一个分割段的至少部分像素的确定参数,并且建立相应的匹配补偿函数,使得该函数至少部分基于该确定参数。
Claims (3)
1.一种数字图像匹配的方法,步骤如下:
调整由多个像素组成的一个第一数字图像(I1)的图像特征;
提供由多个像素组成的一个第二数字图像(I2);
确定一组有限的候选值(Mx;i,My;i),其中一个候选值表示所述第一图像的图像特征与所述第二图像的图像特征之间一个可能的匹配候选;
建立一个匹配补偿函数(P’i),用来计算所述候选值(Mx;i,My;i);
计算每个候选值(Mx;i,My;i)的匹配补偿函数(P’i);以及
根据该匹配补偿函数的计算结果选择一个候选值(Mx;i,My;i);
其特征在于:
通过分割上述第一图像调整所述第一图像,上述调整包括
根据与图像相关的像素特性,将至少部分上述图像的像素分配到各自的分割段;
根据像素到一个分割段的实边界部分的距离d(x,y),对一个分割段的至少部分的像素确定一个确定的参数w(x,y);
在至少部分的确定参数w(x,y)的基础上建立匹配补偿函数(P’i)。
2.如权利要求1所述的方法,其中由准分割方法实现分割。
3.一种用于匹配数字图像的装置,该装置包括:
一个输入部分(120),用来接收数字图像,该数字图像包含由多个像素组成的一个第一数字图像和由多个像素组成的一个第二数字图像;
一个输出部分(130),用来输出匹配的结果;
一个处理单元(110),连接在所述输入部分和所述输出部分之间,用来:
通过分割所述第一图像来调整所述第一数字图像(I1)的图像特征,包括根据与图像相关的像素特性向各个分割段指定所述图像的至少部分像素;
确定一套有限候选值(Mx;i,My;i),其中一个候选值表示所述第一图像的图像特征与所述第二图像的图像特征之间一个可能匹配的候选;
根据像素到一个分割段的实边界部分的距离d(x,y),为一个分割段的至少部分像素确定一个确定的参数w(x,y);
建立用于计算所述候选值(Mx;i,My;i)的一个匹配补偿函数(P’i),该匹配补偿函数(P’i)是至少部分地根据所述确定的参数w(x,y);
计算对每个候选值(Mx;i,My;i)的匹配补偿函数(P’i);以及
根据匹配补偿函数的计算结果选择一个候选值(Mx;i,My;i)。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP00203080.7 | 2000-09-07 | ||
EP00203080 | 2000-09-07 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1547725A CN1547725A (zh) | 2004-11-17 |
CN1307599C true CN1307599C (zh) | 2007-03-28 |
Family
ID=8171984
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB018026427A Expired - Fee Related CN1307599C (zh) | 2000-09-07 | 2001-08-27 | 图像匹配 |
Country Status (6)
Country | Link |
---|---|
US (1) | US7046850B2 (zh) |
EP (1) | EP1374174A2 (zh) |
JP (1) | JP4700892B2 (zh) |
KR (1) | KR100843112B1 (zh) |
CN (1) | CN1307599C (zh) |
WO (1) | WO2002021438A2 (zh) |
Families Citing this family (123)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8645137B2 (en) | 2000-03-16 | 2014-02-04 | Apple Inc. | Fast, language-independent method for user authentication by voice |
KR20050090000A (ko) * | 2003-01-06 | 2005-09-09 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 디지털 이미지들의 깊이 오더링을 위한 방법 및 장치 |
US8677377B2 (en) | 2005-09-08 | 2014-03-18 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
WO2008029345A1 (en) * | 2006-09-04 | 2008-03-13 | Koninklijke Philips Electronics N.V. | Method for determining a depth map from images, device for determining a depth map |
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
CN100463002C (zh) * | 2006-12-07 | 2009-02-18 | 北京航空航天大学 | 基于像素跳跃的图像匹配方法 |
US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
CN101340811B (zh) * | 2007-07-06 | 2010-12-08 | 鸿富锦精密工业(深圳)有限公司 | 影像最优匹配系统及方法 |
KR100827849B1 (ko) | 2007-08-08 | 2008-06-10 | (주)올라웍스 | 화상 데이터에 나타난 인물에 부착된 상품 정보를 획득하기위한 방법 및 장치 |
US9330720B2 (en) | 2008-01-03 | 2016-05-03 | Apple Inc. | Methods and apparatus for altering audio output signals |
US8996376B2 (en) | 2008-04-05 | 2015-03-31 | Apple Inc. | Intelligent text-to-speech conversion |
US10496753B2 (en) | 2010-01-18 | 2019-12-03 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US20100030549A1 (en) | 2008-07-31 | 2010-02-04 | Lee Michael M | Mobile device having human language translation capability with positional feedback |
WO2010067118A1 (en) | 2008-12-11 | 2010-06-17 | Novauris Technologies Limited | Speech recognition involving a mobile device |
US10706373B2 (en) | 2011-06-03 | 2020-07-07 | Apple Inc. | Performing actions associated with task items that represent tasks to perform |
US10241752B2 (en) | 2011-09-30 | 2019-03-26 | Apple Inc. | Interface for a virtual digital assistant |
US10241644B2 (en) | 2011-06-03 | 2019-03-26 | Apple Inc. | Actionable reminder entries |
US9858925B2 (en) | 2009-06-05 | 2018-01-02 | Apple Inc. | Using context information to facilitate processing of commands in a virtual assistant |
US8200021B2 (en) * | 2009-06-16 | 2012-06-12 | Nec Corporation | Image signature matching device |
US9431006B2 (en) | 2009-07-02 | 2016-08-30 | Apple Inc. | Methods and apparatuses for automatic speech recognition |
US10679605B2 (en) | 2010-01-18 | 2020-06-09 | Apple Inc. | Hands-free list-reading by intelligent automated assistant |
US10705794B2 (en) | 2010-01-18 | 2020-07-07 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US10553209B2 (en) | 2010-01-18 | 2020-02-04 | Apple Inc. | Systems and methods for hands-free notification summaries |
US10276170B2 (en) | 2010-01-18 | 2019-04-30 | Apple Inc. | Intelligent automated assistant |
DE202011111062U1 (de) | 2010-01-25 | 2019-02-19 | Newvaluexchange Ltd. | Vorrichtung und System für eine Digitalkonversationsmanagementplattform |
US8682667B2 (en) | 2010-02-25 | 2014-03-25 | Apple Inc. | User profiling for selecting user specific voice input processing information |
US10762293B2 (en) | 2010-12-22 | 2020-09-01 | Apple Inc. | Using parts-of-speech tagging and named entity recognition for spelling correction |
US9262612B2 (en) | 2011-03-21 | 2016-02-16 | Apple Inc. | Device access using voice authentication |
US8582821B1 (en) * | 2011-05-23 | 2013-11-12 | A9.Com, Inc. | Tracking objects between images |
US10057736B2 (en) | 2011-06-03 | 2018-08-21 | Apple Inc. | Active transport based notifications |
US8994660B2 (en) | 2011-08-29 | 2015-03-31 | Apple Inc. | Text correction processing |
US10134385B2 (en) | 2012-03-02 | 2018-11-20 | Apple Inc. | Systems and methods for name pronunciation |
US9483461B2 (en) | 2012-03-06 | 2016-11-01 | Apple Inc. | Handling speech synthesis of content for multiple languages |
US9280610B2 (en) | 2012-05-14 | 2016-03-08 | Apple Inc. | Crowd sourcing information to fulfill user requests |
US9721563B2 (en) | 2012-06-08 | 2017-08-01 | Apple Inc. | Name recognition system |
US9495129B2 (en) | 2012-06-29 | 2016-11-15 | Apple Inc. | Device, method, and user interface for voice-activated navigation and browsing of a document |
US9576574B2 (en) | 2012-09-10 | 2017-02-21 | Apple Inc. | Context-sensitive handling of interruptions by intelligent digital assistant |
US9547647B2 (en) | 2012-09-19 | 2017-01-17 | Apple Inc. | Voice-based media searching |
KR20240132105A (ko) | 2013-02-07 | 2024-09-02 | 애플 인크. | 디지털 어시스턴트를 위한 음성 트리거 |
US9368114B2 (en) | 2013-03-14 | 2016-06-14 | Apple Inc. | Context-sensitive handling of interruptions |
AU2014233517B2 (en) | 2013-03-15 | 2017-05-25 | Apple Inc. | Training an at least partial voice command system |
WO2014144579A1 (en) | 2013-03-15 | 2014-09-18 | Apple Inc. | System and method for updating an adaptive speech recognition model |
WO2014197336A1 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for detecting errors in interactions with a voice-based digital assistant |
US9582608B2 (en) | 2013-06-07 | 2017-02-28 | Apple Inc. | Unified ranking with entropy-weighted information for phrase-based semantic auto-completion |
WO2014197334A2 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for user-specified pronunciation of words for speech synthesis and recognition |
WO2014197335A1 (en) | 2013-06-08 | 2014-12-11 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
KR101772152B1 (ko) | 2013-06-09 | 2017-08-28 | 애플 인크. | 디지털 어시스턴트의 둘 이상의 인스턴스들에 걸친 대화 지속성을 가능하게 하기 위한 디바이스, 방법 및 그래픽 사용자 인터페이스 |
EP3008964B1 (en) | 2013-06-13 | 2019-09-25 | Apple Inc. | System and method for emergency calls initiated by voice command |
DE112014003653B4 (de) | 2013-08-06 | 2024-04-18 | Apple Inc. | Automatisch aktivierende intelligente Antworten auf der Grundlage von Aktivitäten von entfernt angeordneten Vorrichtungen |
US9620105B2 (en) | 2014-05-15 | 2017-04-11 | Apple Inc. | Analyzing audio input for efficient speech and music recognition |
US10592095B2 (en) | 2014-05-23 | 2020-03-17 | Apple Inc. | Instantaneous speaking of content on touch devices |
US9502031B2 (en) | 2014-05-27 | 2016-11-22 | Apple Inc. | Method for supporting dynamic grammars in WFST-based ASR |
CN110797019B (zh) | 2014-05-30 | 2023-08-29 | 苹果公司 | 多命令单一话语输入方法 |
US10078631B2 (en) | 2014-05-30 | 2018-09-18 | Apple Inc. | Entropy-guided text prediction using combined word and character n-gram language models |
US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
US9430463B2 (en) | 2014-05-30 | 2016-08-30 | Apple Inc. | Exemplar-based natural language processing |
US9760559B2 (en) | 2014-05-30 | 2017-09-12 | Apple Inc. | Predictive text input |
US9842101B2 (en) | 2014-05-30 | 2017-12-12 | Apple Inc. | Predictive conversion of language input |
US9633004B2 (en) | 2014-05-30 | 2017-04-25 | Apple Inc. | Better resolution when referencing to concepts |
US9734193B2 (en) | 2014-05-30 | 2017-08-15 | Apple Inc. | Determining domain salience ranking from ambiguous words in natural speech |
US9785630B2 (en) | 2014-05-30 | 2017-10-10 | Apple Inc. | Text prediction using combined word N-gram and unigram language models |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US10289433B2 (en) | 2014-05-30 | 2019-05-14 | Apple Inc. | Domain specific language for encoding assistant dialog |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US10659851B2 (en) | 2014-06-30 | 2020-05-19 | Apple Inc. | Real-time digital assistant knowledge updates |
US10446141B2 (en) | 2014-08-28 | 2019-10-15 | Apple Inc. | Automatic speech recognition based on user feedback |
US9818400B2 (en) | 2014-09-11 | 2017-11-14 | Apple Inc. | Method and apparatus for discovering trending terms in speech requests |
US10789041B2 (en) | 2014-09-12 | 2020-09-29 | Apple Inc. | Dynamic thresholds for always listening speech trigger |
US9886432B2 (en) | 2014-09-30 | 2018-02-06 | Apple Inc. | Parsimonious handling of word inflection via categorical stem + suffix N-gram language models |
US10127911B2 (en) | 2014-09-30 | 2018-11-13 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
US10074360B2 (en) | 2014-09-30 | 2018-09-11 | Apple Inc. | Providing an indication of the suitability of speech recognition |
US9668121B2 (en) | 2014-09-30 | 2017-05-30 | Apple Inc. | Social reminders |
US9646609B2 (en) | 2014-09-30 | 2017-05-09 | Apple Inc. | Caching apparatus for serving phonetic pronunciations |
US10552013B2 (en) | 2014-12-02 | 2020-02-04 | Apple Inc. | Data detection |
US9711141B2 (en) | 2014-12-09 | 2017-07-18 | Apple Inc. | Disambiguating heteronyms in speech synthesis |
US9865280B2 (en) | 2015-03-06 | 2018-01-09 | Apple Inc. | Structured dictation using intelligent automated assistants |
US10567477B2 (en) | 2015-03-08 | 2020-02-18 | Apple Inc. | Virtual assistant continuity |
US9721566B2 (en) | 2015-03-08 | 2017-08-01 | Apple Inc. | Competing devices responding to voice triggers |
US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
US9899019B2 (en) | 2015-03-18 | 2018-02-20 | Apple Inc. | Systems and methods for structured stem and suffix language models |
US9842105B2 (en) | 2015-04-16 | 2017-12-12 | Apple Inc. | Parsimonious continuous-space phrase representations for natural language processing |
US10083688B2 (en) | 2015-05-27 | 2018-09-25 | Apple Inc. | Device voice control for selecting a displayed affordance |
US10127220B2 (en) | 2015-06-04 | 2018-11-13 | Apple Inc. | Language identification from short strings |
US10101822B2 (en) | 2015-06-05 | 2018-10-16 | Apple Inc. | Language input correction |
US9578173B2 (en) | 2015-06-05 | 2017-02-21 | Apple Inc. | Virtual assistant aided communication with 3rd party service in a communication session |
US10186254B2 (en) | 2015-06-07 | 2019-01-22 | Apple Inc. | Context-based endpoint detection |
US10255907B2 (en) | 2015-06-07 | 2019-04-09 | Apple Inc. | Automatic accent detection using acoustic models |
US11025565B2 (en) | 2015-06-07 | 2021-06-01 | Apple Inc. | Personalized prediction of responses for instant messaging |
US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
US9697820B2 (en) | 2015-09-24 | 2017-07-04 | Apple Inc. | Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks |
US11010550B2 (en) | 2015-09-29 | 2021-05-18 | Apple Inc. | Unified language modeling framework for word prediction, auto-completion and auto-correction |
US10366158B2 (en) | 2015-09-29 | 2019-07-30 | Apple Inc. | Efficient word encoding for recurrent neural network language models |
US11587559B2 (en) | 2015-09-30 | 2023-02-21 | Apple Inc. | Intelligent device identification |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10049668B2 (en) | 2015-12-02 | 2018-08-14 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition |
US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
US10446143B2 (en) | 2016-03-14 | 2019-10-15 | Apple Inc. | Identification of voice inputs providing credentials |
US9934775B2 (en) | 2016-05-26 | 2018-04-03 | Apple Inc. | Unit-selection text-to-speech synthesis based on predicted concatenation parameters |
US9972304B2 (en) | 2016-06-03 | 2018-05-15 | Apple Inc. | Privacy preserving distributed evaluation framework for embedded personalized systems |
US10249300B2 (en) | 2016-06-06 | 2019-04-02 | Apple Inc. | Intelligent list reading |
US10049663B2 (en) | 2016-06-08 | 2018-08-14 | Apple, Inc. | Intelligent automated assistant for media exploration |
DK179588B1 (en) | 2016-06-09 | 2019-02-22 | Apple Inc. | INTELLIGENT AUTOMATED ASSISTANT IN A HOME ENVIRONMENT |
US10067938B2 (en) | 2016-06-10 | 2018-09-04 | Apple Inc. | Multilingual word prediction |
US10509862B2 (en) | 2016-06-10 | 2019-12-17 | Apple Inc. | Dynamic phrase expansion of language input |
US10192552B2 (en) | 2016-06-10 | 2019-01-29 | Apple Inc. | Digital assistant providing whispered speech |
US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
US10490187B2 (en) | 2016-06-10 | 2019-11-26 | Apple Inc. | Digital assistant providing automated status report |
DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
DK179049B1 (en) | 2016-06-11 | 2017-09-18 | Apple Inc | Data driven natural language event detection and classification |
DK179343B1 (en) | 2016-06-11 | 2018-05-14 | Apple Inc | Intelligent task discovery |
US10043516B2 (en) | 2016-09-23 | 2018-08-07 | Apple Inc. | Intelligent automated assistant |
US10593346B2 (en) | 2016-12-22 | 2020-03-17 | Apple Inc. | Rank-reduced token representation for automatic speech recognition |
DK201770439A1 (en) | 2017-05-11 | 2018-12-13 | Apple Inc. | Offline personal assistant |
DK179496B1 (en) | 2017-05-12 | 2019-01-15 | Apple Inc. | USER-SPECIFIC Acoustic Models |
DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
DK201770431A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
DK201770432A1 (en) | 2017-05-15 | 2018-12-21 | Apple Inc. | Hierarchical belief states for digital assistants |
DK179549B1 (en) | 2017-05-16 | 2019-02-12 | Apple Inc. | FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES |
US20220121975A1 (en) * | 2018-12-31 | 2022-04-21 | Google Llc | Using bayesian inference to predict review decisions in a match graph |
US10771867B1 (en) | 2019-03-08 | 2020-09-08 | Shutterstock, Inc. | Video-generating systems and methods |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0504577A2 (en) * | 1991-03-19 | 1992-09-23 | Eastman Kodak Company | Image processing method and apparatus |
EP0720384A1 (en) * | 1994-12-30 | 1996-07-03 | Daewoo Electronics Co., Ltd | Block matching motion estimation apparatus employing a weight function |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5072293A (en) | 1989-08-29 | 1991-12-10 | U.S. Philips Corporation | Method of estimating motion in a picture signal |
JP3465988B2 (ja) * | 1994-04-27 | 2003-11-10 | 松下電器産業株式会社 | 動き及び奥行き推定方法及びその装置 |
JPH10255049A (ja) * | 1997-03-11 | 1998-09-25 | Sharp Corp | ブロックマッチングを用いた画像処理方法 |
US6445822B1 (en) * | 1999-06-04 | 2002-09-03 | Look Dynamics, Inc. | Search method and apparatus for locating digitally stored content, such as visual images, music and sounds, text, or software, in storage devices on a computer network |
US6751363B1 (en) * | 1999-08-10 | 2004-06-15 | Lucent Technologies Inc. | Methods of imaging based on wavelet retrieval of scenes |
US6738518B1 (en) * | 2000-05-12 | 2004-05-18 | Xerox Corporation | Document image decoding using text line column-based heuristic scoring |
US6775410B1 (en) * | 2000-05-25 | 2004-08-10 | Xerox Corporation | Image processing method for sharpening corners of text and line art |
US6690828B2 (en) * | 2001-04-09 | 2004-02-10 | Gary Elliott Meyers | Method for representing and comparing digital images |
-
2001
- 2001-08-27 JP JP2002525573A patent/JP4700892B2/ja not_active Expired - Fee Related
- 2001-08-27 EP EP01969670A patent/EP1374174A2/en not_active Withdrawn
- 2001-08-27 CN CNB018026427A patent/CN1307599C/zh not_active Expired - Fee Related
- 2001-08-27 WO PCT/EP2001/009992 patent/WO2002021438A2/en active Application Filing
- 2001-08-27 KR KR1020027005910A patent/KR100843112B1/ko not_active IP Right Cessation
- 2001-09-04 US US09/945,954 patent/US7046850B2/en not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0504577A2 (en) * | 1991-03-19 | 1992-09-23 | Eastman Kodak Company | Image processing method and apparatus |
EP0720384A1 (en) * | 1994-12-30 | 1996-07-03 | Daewoo Electronics Co., Ltd | Block matching motion estimation apparatus employing a weight function |
Also Published As
Publication number | Publication date |
---|---|
US20020064310A1 (en) | 2002-05-30 |
US7046850B2 (en) | 2006-05-16 |
KR20020067514A (ko) | 2002-08-22 |
JP2004508639A (ja) | 2004-03-18 |
EP1374174A2 (en) | 2004-01-02 |
CN1547725A (zh) | 2004-11-17 |
WO2002021438A2 (en) | 2002-03-14 |
WO2002021438A3 (en) | 2003-10-09 |
JP4700892B2 (ja) | 2011-06-15 |
KR100843112B1 (ko) | 2008-07-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1307599C (zh) | 图像匹配 | |
RU2698402C1 (ru) | Способ обучения сверточной нейронной сети для восстановления изображения и система для формирования карты глубины изображения (варианты) | |
CN100562920C (zh) | 高分辨率化装置和方法 | |
US7283668B2 (en) | Method and apparatus for color-based object tracking in video sequences | |
CN102088589B (zh) | 基于双向的局部和全局运动估计的帧率转换 | |
CN101389022A (zh) | 图像处理设备、图像处理方法以及图像拾取设备 | |
CN1565118A (zh) | 用于运动估计的装置和方法 | |
CN1575479A (zh) | 用于运动估算的单元和方法以及设有这种运动估算单元的图像处理设备 | |
CN1214648C (zh) | 用于在纹理映射引擎中执行运动补偿的方法与设备 | |
CN117649779A (zh) | 一种基于ar技术的停车管理方法及系统 | |
CN113096199B (zh) | 一种基于莫顿码的点云属性预测方法、装置和介质 | |
KR101572330B1 (ko) | 동영상의 근복사 검출 방법 및 시스템 | |
CN115272666A (zh) | 在线点云语义分割方法、装置、存储介质及电子设备 | |
CN101189870A (zh) | 运动稳定 | |
CN1781121A (zh) | 分段精化 | |
JPH10255071A (ja) | 画像処理システム | |
CN1228987C (zh) | 分段匹配中的优先顺序划分 | |
CN113592875A (zh) | 数据处理方法、图像处理方法、存储介质及计算设备 | |
CN111108528A (zh) | 用于评估图像的方法和设备、运行辅助方法和运行设备 | |
AU750312B2 (en) | Method and apparatus for improved video data motion estimation | |
JP2934156B2 (ja) | 階層型動き検出方法と装置 | |
JP3980666B2 (ja) | 動きベクトル推定方法及び画像処理装置 | |
US20070070059A1 (en) | Refinement of block motion estimate using texture mapping | |
US7412115B2 (en) | Image processing device and method thereof | |
Wong et al. | VOICED: Depth Completion from Inertial Odometry and Vision Technical Report# 190001 March 22, 2019 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20070328 Termination date: 20140827 |
|
EXPY | Termination of patent right or utility model |