CN107480158B - 基于相似性得分评估内容项目与图像的匹配的方法和系统 - Google Patents

基于相似性得分评估内容项目与图像的匹配的方法和系统 Download PDF

Info

Publication number
CN107480158B
CN107480158B CN201611035712.2A CN201611035712A CN107480158B CN 107480158 B CN107480158 B CN 107480158B CN 201611035712 A CN201611035712 A CN 201611035712A CN 107480158 B CN107480158 B CN 107480158B
Authority
CN
China
Prior art keywords
image
content item
metadata associated
similarity score
search query
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201611035712.2A
Other languages
English (en)
Other versions
CN107480158A (zh
Inventor
朱帆
孔旗
杨光
王京傲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu USA LLC
Original Assignee
Baidu USA LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Baidu USA LLC filed Critical Baidu USA LLC
Publication of CN107480158A publication Critical patent/CN107480158A/zh
Application granted granted Critical
Publication of CN107480158B publication Critical patent/CN107480158B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/5866Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, manually generated location and time information
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/51Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0637Strategic management or analysis, e.g. setting a goal or target of an organisation; Planning actions based on goals; Analysis or evaluation of effectiveness of goals

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Library & Information Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Tourism & Hospitality (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Development Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Educational Administration (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

根据一实施方式,接收对评估内容项目与图像之间的匹配的请求,所述内容项目和所述图像是响应于搜索查询从多个内容项目和图像中来识别和选择的。获得与内容项目相关联的第一元数据、与图像相关联的第二元数据和与搜索查询相关联的第三元数据。基于与内容项目相关联的第一元数据以及与搜索查询相关联的第三元数据确定第一相似性得分。基于与图像相关联的第二元数据以及与搜索查询相关联的第三元数据确定第二相似性得分。计算根据搜索查询的内容项目与图像的匹配的评估得分。评估得分用于作为后续搜索查询的响应而识别后续内容项目和后续图像。

Description

基于相似性得分评估内容项目与图像的匹配的方法和系统
技术领域
本发明的实施方式总体涉及搜索内容。更具体地,本发明的实施方式涉及利用响应于搜索查询基于相似性得分匹配图像来搜索内容。
背景技术
通常,大多数搜索引擎在其操作期间经由在客户端装置上运行的浏览器来执行搜索网页。搜索引擎接收由用户输入的搜索词,并检索与搜索词相关联的网页搜索结果列表。搜索引擎基于某些标准将搜索结果显示为搜索列表的一系列子集。搜索操作期间所使用的一般标准是:搜索词是完整地还是部分地出现在给定网页上、搜索字符串出现在搜索结果中的次数、字母次序等。此外,用户可通过点击鼠标按钮来决定打开链接以打开并浏览。搜索引擎可监控和采集用户与搜索结果的一些互动和/或用户信息,以随后提供更好的搜索。
通常,响应于搜索查询,执行搜索以识别和检索内容项目列表。接着将内容项目返回至搜索请求方。普通搜索引擎将照原样返回大多数内容项目而不作修改。搜索结果中的一些内容项目仅仅是纯文本或描述,其可认为是无吸引力的或令人厌烦的。偶尔,如果内容项目准备有与内容项目有关的某些图像,则搜索结果中的内容将更中看或更具吸引力。然而,令适当的图像与内容项目进行匹配相当有挑战性。缺乏有效的方法来使内容与图像匹配以及评估内容与图像的匹配。
发明内容
本申请的目的在于提供用于评估内容项目与图像的匹配的计算机实现方法、评估内容项目与图像的匹配的装置、数据处理系统以及用于使内容项目与图像匹配的计算机实现方法。
根据一个方面,提供了用于评估内容项目与图像的匹配的计算机实现方法,该方法可包括:接收对评估内容项目与图像之间的匹配的请求,内容项目和图像是响应于搜索查询从多个内容项目和多个图像中识别和选择的;获得与内容项目相关联的第一元数据、与图像相关联的第二元数据以及与搜索查询相关联的第三元数据;基于与内容项目相关联的第一元数据以及与搜索查询相关联的第三元数据,确定第一相似性得分;基于与图像相关联的第二元数据以及与搜索查询相关联的第三元数据,确定第二相似性得分;以及计算根据搜索查询的内容项目与图像的匹配的评估得分,其中评估得分用于作为后续搜索查询的响应而识别后续内容项目和后续图像。
根据另一方面,提供了评估内容项目与图像的匹配的装置,可包括:接收对评估内容项目与图像之间的匹配的请求的装置,内容项目和图像是响应于搜索查询从多个内容项目和多个图像中而识别和选择的;获得与内容项目相关联的第一元数据、与图像相关联的第二元数据以及与搜索查询相关联的第三元数据的装置;基于与内容项目相关联的第一元数据以及与搜索查询相关联的第三元数据确定第一相似性得分的装置;基于与图像相关联的第二元数据以及与搜索查询相关联的第三元数据确定第二相似性得分的装置;以及计算根据搜索查询的内容项目与图像的匹配的评估得分的装置,其中评估得分用于作为后续搜索查询的响应而识别后续内容项目和后续图像。
根据又一方面,提供了一种数据处理系统,可包括根据本申请实施方案的评估内容项目与图像的匹配的装置。
根据再一方面,提供了用于使内容项目与图像匹配的计算机实现方法,该方法可包括:接收响应于搜索查询而识别的内容项目和多个图像;针对多个图像中的每一个,基于与内容项目相关联的第一元数据以及与搜索查询相关联的第三元数据确定第一相似性得分,基于与图像相关联的第二元数据以及与搜索查询相关联的第三元数据确定第二相似性得分,以及基于第一相似性得分和第二相似性得分计算图像的排序得分;以及基于图像的排序得分对多个图像进行排序,以选择多个图像中的一个来与内容项目相关联。
附图说明
本发明的实施方式在附图的各图中以举例而非限制的方式示出,在附图中,相似的参考数字表示相似的元件。
图1A和图1B是示出根据本发明一些实施方式用于使图像与内容项目匹配的系统配置的示例的框图。
图2是示出根据本发明一实施方式的图像选择系统的示例的框图。
图3A至图3B是根据本发明某些实施方式的查询-图像匹配表的示例。
图4是示出根据本发明一实施方式的图像选择系统的示例的框图。
图5是根据一实施方式使图像与内容项目进行匹配并对其进行排序的处理流程。
图6是示出根据本发明另一实施方式对图像排序的处理流程的框图。
图7是示出根据本发明一实施方式用于评估内容与图像之间的匹配的数据分析系统的示例的框图。
图8是示出根据本发明一实施方式对用于与内容项目匹配的图像进行排序的过程的流程图。
图9是示出根据本发明一实施方式用于评估内容项目与图像的匹配的过程的流程图。
图10是示出根据一实施方式的数据处理系统的框图。
具体实施方式
以下将参考所讨论的细节来描述本发明的多种实施方式和方面,附图将示出各实施方式。以下描述和附图是对本发明的说明,而不解释为限制本发明。描述诸多特定细节以充分理解本发明各实施方式。然而,在某些示例中,为了使对本发明的实施方式的讨论简洁,不描述公知的或常用的细节。
在说明书中,对“一实施方式”或“实施方式”的参考是指结合该实施方式所描述的特定特征、结构或特性可包括在本发明的至少一个实施方式中。在说明书中各处,短语“在一实施方式中”的出现不必全部表示同一实施方式。
根据一些实施方式,接收内容项目和图像,其中内容项目和图像是响应于搜索查询所识别的。计算内容项目、图像和搜索查询之间的相似性得分。相似性得分包括搜索查询与图像之间的相似性得分、搜索查询与内容项目之间的相似性得分以及内容项目与图像之间的相似性得分。相似性得分表示搜索查询、内容项目和图像之间的关系(例如,各部分之间的相似程度或兼容程度)。基于内容项目、图像和搜索查询之间的相似性得分确定评估得分或排序得分,以用于对内容项目与图像进行匹配。可利用评估得分来评估内容项目与图像匹配的结果,这在过去已经被执行以确定(例如,离线)是否需要调整或改进匹配方法或模型。可利用同一机制来响应于搜索查询实时地对内容项目与图像之间的配对进行动态排序,例如,在线图像选择或排序。
根据本发明一方面,响应于对评估内容项目与图像的匹配的请求,获得与内容项目、图像和搜索查询相关联的元数据,其中所述内容项目和图像是响应于搜索查询而识别的。基于与内容项目和搜索查询相关联的元数据确定第一相似性得分。基于与图像和搜索查询相关联的元数据确定第二相似性得分。基于第一相似性得分和第二相似性得分计算用于评估内容项目与图像之间的匹配的评估得分。在一实施方式中,还可基于第三相似性得分来确定评估得分,其中所述第三相似性得分基于与内容项目和图像相关联的元数据而确定。在随后响应于后续搜索查询对内容项目与图像进行匹配时,评估得分可用于调整选择方法或算法。
根据本发明另一方面,接收已响应于搜索查询而识别的内容项目和图像的列表。针对每一个图像,基于与内容项目和搜索查询相关联的元数据确定第一相似性得分。基于与图像和搜索查询相关联的元数据确定第二相似性得分。基于第一相似性得分和第二相似性得分计算图像的排序得分。随后,基于各图像各自的排序得分对各图像进行排序,以选择各图像中的一个来与内容项目相关联。在一实施方式中,基于与内容项目和图像相关联的元数据确定第三相似性得分。进一步基于第三相似性得分来计算图像的排序得分。
图1A和图1B是示出根据本发明一些实施方式用于使图像与内容项目匹配的系统配置的示例的框图。参考图1A,系统100包括但不限于通过网络103通信地联接到服务器104的一个或多个客户端装置101至102。客户端装置101至102可以是任何类型的客户端装置,诸如,个人计算机(例如,台式计算机、膝上型计算机和平板计算机)、“薄”客户端、个人数字助理(PDA)、支持网络的设备、智能手表或移动电话(例如,智能手机)等。网络103可以是任何类型的有线或无线网络,诸如局域网(LAN)、广域网(WAN)(诸如因特网)或其组合。
服务器104可以是任何种类的服务器或服务器集群,诸如网络或云服务器、应用服务器、后端服务器或其组合。在一实施方式中,服务器104包括但不限于搜索引擎120、图像选择模块110和图像选择方法或模型115。服务器104还包括允许客户端(诸如,客户端装置101至102)访问由服务器104提供的资源或服务的接口(未示出)。接口可包括网络接口、应用编程接口(API)和/或命令行接口(CLI)。
例如,客户端,在该示例中为客户端装置101的用户应用(例如,网络浏览器、移动应用),可向服务器104发送搜索查询;搜索引擎120通过网络103、经由接口接收该搜索查询。响应于搜索查询,搜索引擎120从搜索查询提取一个或多个关键字(也称为搜索词)。搜索引擎120在内容数据库133中执行搜索以识别与关键字有关的内容项目列表,内容数据库可包括主要内容数据库130和/或辅助内容数据库131。主要内容数据库130(也称为主内容数据库)可以是一般内容数据库,而辅助内容数据库131(也称为二级或附属内容数据库)可以是特殊内容数据库。搜索引擎120向客户端装置101返回具有列表中的至少一些内容项目的搜索结果页面,以在客户端装置101中呈现。搜索引擎120可以是可从百度公司获得的
Figure BDA0001156238500000051
搜索引擎,或可替代地,搜索引擎120可表示
Figure BDA0001156238500000052
搜索引擎、Microsoft BingTM搜索引擎、
Figure BDA0001156238500000053
搜索引擎或一些其他搜索引擎。
搜索引擎,诸如网页搜索引擎,是设计成在万维网上搜索信息的软件系统。搜索结果通常呈现在一排结果中,这一排结果通常被称为搜索引擎结果页面。信息可以是网页、图像和其他类型文件的混合。一些搜索引擎还挖掘数据库或开放式目录中可用的数据。不同于仅通过人工编辑器来维护的网络目录,搜索引擎还通过在网页爬虫上运行算法来维护实时信息。
网页搜索引擎通过存储与其从页面的超文本标记语言(HTML)标记检索的诸多网页有关的信息来运作。这些页面通过网页爬虫而被检索,所述网页爬虫是遵循网站上的每个链接的自动网页爬虫。接着,搜索引擎分析每个页面的内容以确定其应如何被索引(例如,可以从标题、页面内容、头部或称为元标签的特殊字段来提取字)。将关于网页的数据存储在索引数据库中,以供在稍后的查询中使用。索引帮助尽可能快地找到与查询有关的信息。
当用户将查询输入到搜索引擎中时(通常是通过使用关键字),引擎检查查询的索引并根据其标准提供最匹配网页的列表,所述标准通常具有包含文档标题且偶尔包括部分文本的简短概述。索引是由与数据一起存储的信息及信息的索引方法构成。搜索引擎查找与输入时完全一致的字或短语。一些搜索引擎提供先进的特征(称为接近搜索),其允许用户定义关键字之间的距离。还存在基于概念的搜索,其中所述搜索涉及在包含你所搜索的字或短语的页面上使用统计分析。以及,自然语言查询允许用户以与将向人询问问题的形式相同的形式来键入问题。
搜索引擎的有用性取决于其所回馈的结果集的相关性。虽然包括特定字或短语的网页可能有数百万个,但是一些页面可能比其他页面更相关、更流行或更有权威。大多数搜索引擎采用多种方法来对结果进行排序以首先提供“最佳”结果。搜索引擎如何决定哪些页面是最佳匹配者以及应按什么次序来示出结果随引擎的不同而广泛变化。
返回参考图1A,根据一实施方式,响应于在服务器104处从客户端装置(在该示例中为客户端装置101)接收的搜索查询,搜索引擎120在内容数据库133(诸如,主要内容数据库130和/或辅助内容数据库131)中执行搜索,以生成内容项目列表。可经由统一资源链接(URL)和/或统一资源标识符(URI)使内容项目中的每一个与特定内容提供者的特定网站(Web site)的特定网页(Web page)相关联。在一实施方式中,主要内容数据库130存储已由网络爬虫采集的一般内容项目(例如,非赞助内容)。辅助内容数据库135存储与特定、已知或预定内容提供者相关联的特定或特殊内容项目(例如,赞助内容)。可替代地,在不区分主要内容数据库130与辅助内容数据库131的情况下,可将内容数据库133实施为单个数据库。
网络爬虫或网页爬虫是自动遍历网络的超文本结构的程序。在实践中,网络爬虫可在单独的计算机或服务器上运行,所述计算机或服务器中的每一个被配置成执行从URL下载文档的一个或多个进程或线程。网络爬虫接收所指派的URL,并以那些URL下载文档。网络爬虫还可检索被已检索的文档引用的文档,以供内容处理系统(未示出)和/或搜索引擎120处理。网络爬虫可使用诸如超文本传输协议(HTTP)和文件传送协议(FTP)的多种协议来下载与URL相关联的页面。
另外,根据一实施方式,图像选择模块或系统110利用图像选择方法或模型115、基于与搜索查询相关联的关键字来识别图像ID列表,所述图像ID标识与同搜索查询相关联的关键字有关的图像。图像选择方法/模型115可包括关键字-图像(关键字/图像)映射表(未示出),其可实施成多种数据结构,诸如表或数据库。基于图像ID,可从图像存储器125中所存储的图像122中识别和检索图像候选列表,其中图像存储器125还可存储描述图像122的图像元数据(未示出)。
在一实施方式中,可通过一个或多个图像或网络爬虫来获得图像122及其各自的元数据,所述图像或网络爬虫设计成爬行网络以采集图像以及其周围的元数据。图像122可以是无特权的、无著作权保护的、适当许可的图像,或可以是任何其他授权的图像。可基于关键字与图像候选之间的排序得分以及内容项目的元数据对图像候选排序。针对在内容数据库133中找到的内容项目中的每一个,从图像候选列表中选择与内容项目相关联的图像。所选图像可与内容项目合并,以生成合并或合成的内容项目。例如,所选图像可充当内容项目的背景图像。合并的内容项目和图像的列表作为搜索结果的一部分返回至客户端装置101。
根据一实施方式,可在接收搜索查询之前(例如,离线)预先配置和生成图像选择方法/模型115,图像选择方法/模型115可包括关键字-图像(关键字/图像)映射表。关键字/图像映射表包括诸多映射条目,每个映射条目将关键字映射到一个或多个图像ID,或者反之将一个或多个图像ID映射到关键字,例如如图3A至图3B所示。关键字可标识为有可能在搜索查询中用到的关键字和/或与某些内容项目相关联的关键字(例如,赞助内容的投标字)。可基于对用户搜索活动或搜索历史的分析或跟踪来识别该关键字,可在一段时间内对用户搜索活动或搜索历史进行编译。
随后,当搜索引擎120在运行时间从客户端装置接收到搜索查询以用于搜索内容时,在内容数据库133中执行搜索以检索内容项目列表。另外,例如,由图像选择模块110对搜索查询执行分析,以确定与搜索查询相关联的一个或多个关键字。所确定的关键字可以是搜索查询中所包括的关键字。所确定的关键字还可包括语义上类似或具有与搜索查询中最初的关键字含义相同的某些关键字(例如,同义字或短语)。基于关键字,利用作为图像选择方法/模型115的一部分的关键字/图像映射表,从图像存储器125识别一个或多个图像的列表。
根据一实施方式,图像选择模块110可利用作为图像选择方法/模型115的一部分的多种排序算法或排序模型对所识别的图像进行排序,所述图像选择方法/模型115已由数据分析系统150(也称为查询/图像映射系统)生成和配置。针对被识别为待与内容项目匹配的图像候选的每一个图像,例如,利用特定的计分算法或方法来确定每对搜索查询、内容项目和图像之间的相似性得分。基于表示内容项目、搜索查询和图像之间的关系的相似性得分确定最终的排序得分。之后,基于图像候选各自的排序得分对图像候选排序。然后,选择各图像中的一个来与内容项目匹配。
根据另一实施方式,可以利用相同或类似的计分方法或模型来评估内容项目与图像的先前匹配的结果。数据分析系统或服务器150可基于先前的内容/图像匹配过程的数据来离线执行评估。可利用评估来进一步调整图像选择方法/模型115,以进行未来的图像选择。
注意,已仅出于例示的目的描述了服务器104的配置。服务器104可以是向多种最终用户装置提供前端搜索服务的网络服务器。替代地,服务器104可为应用服务器或后端服务器,其向前端服务器(例如,网络服务器或一般内容服务器)提供特定或特殊的内容搜索服务以及使图像与内容数据库或服务器的内容项目匹配和/或集成。数据分析系统150也可实施为负责基于内容项目及其各自关联的内容数据库或服务器133的关键字来创建或训练图像选择方法/模型115的单独服务器。
其他架构或配置也可能是可适用的。例如,如图1B所示,内容数据库133可通过网络在作为内容服务器的单独服务器中被维护和托管。类似地,图像存储器125可在作为其中具有图像搜索引擎的图像服务器的单独服务器中被维护和托管。服务器133和125可以是网络服务器、应用服务器或后端服务器。可由与服务器104相同的实体或组织来组织和提供内容服务器133和/或图像服务器125。可替代地,可由负责采集内容数据库130至131中的内容和图像122及其元数据的单独实体或组织(例如,第三方提供者)来维护或托管内容服务器133和/或图像服务器125。
另外注意,内容数据库/服务器133可包括主要内容数据库130和辅助内容数据库131。主要内容数据库130也可在称为主要内容服务器的单独内容服务器中来实现或维护。类似地,辅助内容数据库131可在称为辅助或附属内容服务器的单独内容服务器中来实现或维护。可使用多种匹配公式使从两个内容数据库130至131获得的内容项目与从图像存储器/服务器125获得的图像进行匹配。可替代地,将使仅从主要内容数据库130和辅助内容数据库131中的一者获得的内容项目与从图像存储器/服务器125获得的图像匹配。例如,将使从辅助内容数据库131获得的内容项目(例如,赞助内容)与从图像存储器/服务器125获得的图像匹配,而从主要内容数据库130获得的内容项目(例如,一般内容)将作为搜索结果的一部分返回至客户端装置而不作修改。
图2是示出根据本发明一实施方式用于使图像与内容项目匹配的系统的框图。系统200可实施为图1A至图1B的系统100的一部分。参考图2,当从客户端装置(例如,图1的客户端装置101)接收到搜索查询201时,搜索引擎120在内容数据库或内容服务器133中执行第一搜索,以基于与搜索查询201相关联的一个或多个关键字或搜索词来识别和检索内容项目的第一列表。另外,搜索引擎120与图像选择模块110通信,以使用一组图像选择方法/模型115、基于与搜索查询201相关联的关键字来从图像存储器或图像服务器125识别图像列表。搜索引擎120和/或图像选择模块110可对查询执行分析,以推导出搜索查询201中所包括的关键字和/或与搜索查询201中的关键字类似的关键字(例如,语义上类似的词、同义词)的列表。可对扩展关键字的列表执行在内容数据库/服务器133和/或图像存储器/服务器125中所执行的搜索。
在一实施方式中,图像选择模块110和/或图像选择方法/模型115可与搜索引擎120集成在一起。例如,可通过查询/图像映射系统150预先配置或编译图像选择方法/模型115。查询/图像映射系统150可托管在经由API或通过网络通信地联接到系统200的单独系统或服务器中。查询/图像映射系统150可包括允许用户或管理员配置一组查询/图像匹配规则的用户接口,该组查询/图像匹配规则然后可由处理逻辑使用预定算法来加以扩展和排序。以下将进一步描述查询/图像映射系统150的进一步细节。
类似地,图像采集系统230可采集图像存储器/服务器125中所存储的图像,所述图像采集系统可以是通过网络通信地联接到系统200的单独系统或服务器。可由与系统200相同或不同的实体或组织来操作查询/图像映射系统150和/或图像采集系统230。在该示例中,可将图像缓存和存储在对于系统200为本地(例如,对于服务器104为本地)的图像存储器中。可替代地,可由与图像采集系统230相关联的指定服务器来维护图像,图像选择模块110经由API与所指定的服务器通信以识别和检索图像列表。
基于从图像存储器/服务器125检索的图像列表,图像选择模块110例如基于内容项目、图像和搜索查询之间的相似性得分,根据排序算法对图像进行排序。然后,使一些图像与从内容数据库/服务器133识别和检索的一些内容项目匹配。接着,将匹配的内容项目与图像集成到已集成的内容项目中。在一实施方式中,可将图像选择为内容项目的背景图像或补充图像。例如,内容项目211可以是描述或文本,而图像212可选择为内容项目211的背景图像。以适当的方式,基于本说明书通篇所描述的匹配或排序技术来选择图像212以补充或描述内容项目211,或反之来选择内容项目211以供图像212对其进行补充或描述。例如,内容项目211的内容与如图像212中所示的内容有关,或反之图像212中所示的内容与图像212有关。可将已集成的图像212与内容项目211作为搜索结果215的一部分返回至客户端装置。
根据一实施方式,响应于从客户端装置接收的搜索查询201,基于搜索查询201来确定一个或多个关键字,其中所述关键字可包括搜索查询201中的关键字或基于对搜索查询201的分析而扩展的关键字。基于关键字,在图像选择方法/模型115中执行查找操作或搜索,其可在例如像数据库或表的多种数据结构中实施。
图像选择方法/模型115包括具有诸多映射条目的关键字/图像映射表。每个映射条目将一个或多个关键字映射到标识图像存储器/服务器125中所存储的一个或多个图像的一个或多个图像ID。根据以搜索查询201为基础获得的关键字,可基于图像选择方法/模型115来获得一个或多个图像ID的列表。基于图像ID,从图像存储器/服务器125获得对应图像作为图像候选。接着,使用一个或多个预定排序和/或匹配算法对图像候选进行排序和匹配,所述预定排序和/或匹配算法将在以下进一步详细描述。接着,可选择排在顶部的图像来与内容项目相关联以集成为搜索结果215的一部分。注意,如图2所示的组件或模块中的一些或全部可以软件、硬件或其组合来实施。
图3A至图3B是根据本发明某些实施方式的查询-图像匹配表的示例。参考图3A,查询/图像匹配表300可表示作为如上所述的图1A至图1B和图2的图像选择方法/模型115的一部分的查询/图像映射表。在一实施方式中,查询/图像匹配表300包括诸多匹配条目。每一个匹配条目将一个或多个关键字301映射到一个或多个图像ID 302,其中图像ID 302标识图像存储器或图像服务器(诸如,图像存储器/服务器125)中的对应图像。基于关键字对匹配表300进行索引。在该示例中,第一条目将词“鲜花”映射到图像1至5。第二条目将词“北京鲜花”仅映射到图像1。第三条目将词“上海鲜花”映射到图像2。第四条目将词“鲜花递送”映射到图像1至2和4。因此,如果搜索查询包含“北京鲜花”,则可识别图像1至5。然而,图像1可具有更高排序。
现参考图3B,其是匹配表的可替代实施方式的示例,这个匹配表是可用作图像选择方法/模型115的一部分的图像-关键字(图像/关键字)匹配表。在该示例中,图像/关键字匹配表350包括诸多匹配条目。每个匹配条目将图像ID 351映射到一个或多个关键字352。基于图像ID对匹配表350进行索引。可互换地利用两个表300和350。例如,可使用表300来识别与一个或多个关键字有关的所有图像。
图4是示出根据本发明一实施方式的图像选择系统的示例的框图。系统400可实施为图1A至图1B和图2的系统100或系统200的一部分。参考图4,图像选择模块或系统110包括但不限于关键字提取模块401、图像搜索模块402、查询-内容(QC)计分模块403、查询-图像(QI)计分模块404、内容-图像(CI)计分模块405和图像排序模块406。计分模块403至405配置成确定表示内容项目、图像和对应搜索查询之间的关系的相似性得分,以达成排序目的。计分模块403至405可以软件、硬件或其组合来实施。例如,计分模块403至405可加载在存储器中并由一个或多个处理器执行。
现参考图4至图5,响应于搜索查询501或搜索查询501的搜索词,关键字提取模块401(也称为查询分析模块)对搜索词执行分析,以导出与搜索查询501的搜索词相关联的一组关键字502。关键字502可以是搜索查询501的搜索词中所包括的关键字。可替代地,关键字502还可包括语义上与搜索查询501的搜索词有关的额外关键字,其可基于分析来确定。例如,关键字提取模块401可对搜索词执行潜在语义分析,以导出语义上与搜索查询501的搜索词有关的额外关键字。分析还可从搜索查询501移除认为与搜索请求器的内容无关或矛盾的一些关键字。
在自然语言处理中,尤其在分布语义中,潜在语义分析(LSA)是通过生成与一组文档及其所包含的词有关的一组概念来分析所述文档与所述词之间的关系的技术。LSA假设含义接近的字将出现在类似的文本片段中。包含每段落字数的矩阵(行表示独特字,而列表示每个段落)由大段的文本构成,且使用称为奇异值分解(SVD)的数学技术来减少行数同时保留列之间的相似性结构。接着,通过使用由任意两行形成的两个向量之间的角度的余弦函数(或两个向量的正规化之间的点积)来比较字。接近1的值表示非常类似的字,而接近0的值表示非常不相似的字。
基于关键字502,图像搜索模块402在图像存储器125中进行搜索,以获得作为图像候选的图像504的列表以及其关联的元数据。图像搜索模块402可基于关键字502在关键字/图像映射表411中进行查找,以识别标识图像504的图像ID的列表。针对每一个图像504,图像选择/排序模块406调用计分模块403至405,以使用从如上所述的选择方法/模型115获得的正确计分算法或模型来确定内容项目、图像和搜索查询501之间的相似性得分,其中所述内容项目由内容ID 503标识。基于关联的相似性得分计算每个图像的最终排序得分。接着,按图像各自的排序得分对其排序,以生成经排序的图像候选505。
图6是示出根据本发明另一实施方式对图像排序的处理流程的框图。参考图6,在一实施方式中,作为响应于搜索查询601而识别的内容项目602和图像603的响应,关键字提取模块401提取或确定分别与搜索查询601、内容项目602和图像603相关联的关键字611至613。关键字可包括在搜索查询601、内容项目602和图像603中。可替代地,关键字还可包括类似的关键字或语义上有关的关键字,这些关键字是基于例如对与搜索查询601、内容项目602和图像603相关联的元数据604的分析(例如,潜在语义分析)来确定的。
可基于标题、描述、登陆页面以及与内容项目602相关联的其他元数据来获得与内容项目602相关联的关键字612。与图像603相关联的关键字613可从其标题及与图像603相关联的上下文来获得,所述上下文包括获得图像603的来源和/或由图像603识别出的内容,例如,图像所表示的对象、场景、主题。获得图像的来源可以是其中附有图像的网页或文档。可采集地址,诸如源页面的统一资源定位符(URL)。另外,可对源页面的内容执行分析,以确定可能由图像表示的内容。还可对图像执行图像识别以确定图像的内容(例如,图像是否与人、物体、风景、文本或其组合有关)。
关键字提取模块401还可处理关键字以移除不相关的某些关键字。在一实施方式中,关键字提取模块401将关键字分段、确定字频率和/或对分段的关键字执行词频-逆文档频率(TF-IDF)操作。因此,可移除某些无关的字。例如,可移除更常出现的字(例如,“一(a)”、“所述(the)”“……的(of)”等)。还可移除与时间或地理位置有关的某些字(例如,“圣荷西”)。
QC计分模块403利用QC计分算法或模型412、基于关键字611和/或与搜索查询601及内容项目602相关联的其他元数据来确定QC相似性得分621。QI计分模块404利用QI计分算法或模型413、基于关键字612和/或与搜索查询601及图像603相关联的其他元数据来确定QI相似性得分622。CI计分模块405利用CI计分算法或模型414、基于关键字613和/或与内容项目602及图像603相关联的其他元数据来确定CI相似性得分623。基于QC、QI和CI相似性得分,图像排序模块406例如使用排序算法或模型415来确定待与内容项目602配对的图像603的排序得分625。接着,基于所有图像候选各自的排序得分来对其排序。这些相似性得分也称为二维(2D)得分,因为它们是基于与两方相关联的两组关键字来确定的。
在一实施方式中,在确定相似性得分时,对关键字的相应集合执行作为计分算法412至414的一部分的概率性潜在语义分析(PLSA)。PLSA,也称为概率性潜在语义索引(PLSI,尤其是在信息检索圈子中),是用于分析双模式和同现数据的统计技术。实际上,正如在潜在语义分析中,人们可根据观测变量与某些隐藏变量的密切关系来导出观测变量的二维表示,由此演化出PLSA。概率性潜在语义分析以从潜在类别模型导出的混合体分解为基础。
在一实施方式中,返回参考图6,基于2D相似性得分来确定搜索查询601、内容项目602和图像603中每一个各自的排序得分(例如,3D得分)。例如,可以基于两个2D相似性得分的积来计算各个排序得分。基于QC得分621和QI得分622来确定搜索查询601的排序得分。在一实施方式中,通过下式来计算搜索查询601的排序得分:
S查询=QCδ1*QIδ2
其中QC和QI表示QC相似性得分和QI相似性得分。δ1和δ2是与搜索查询601和内容项目602相关的系数或加权因子,其可大于1。
在一实施方式中,基于QC得分621和CI得分623来确定内容项目602的排序得分。在一实施方式中,通过下式来计算内容项目602的排序得分:
S内容=QCδ1*CIδ3
其中QC和CI表示QC相似性得分和CI相似性得分。δ1和δ3是与搜索查询601和图像603相关联的系数或加权因子,其可大于1。
在一实施方式中,基于QI得分622和CI得分623来确定图像603的排序得分。在一实施方式中,通过下式来计算图像603的排序得分:
S图像=QIδ2*CIδ3
其中QI和CI表示QI相似性得分和CI相似性得分。δ2和δ3是与内容项目602和图像603相关联的系数或加权因子,其可大于1。
在一实施方式中,基于搜索查询601、内容项目602和图像603的各个排序得分,确定用于根据搜索查询601使内容项目602与图像603匹配的最终排序得分。在特定实施方式中,基于下式来计算最终的排序得分:
S最终=(S查询+S内容+S图像)/3
根据另一实施方式,还可以利用上述算法和排序机制、响应于某些搜索查询来评估内容项目和图像之间的先前匹配,从而确定所述匹配是否被正确地执行。可以利用这种评估来调整匹配方法,以进行后续匹配。
图7是示出根据本发明一实施方式用于评估内容与图像之间的匹配的数据分析系统的示例的框图。参考图7,数据分析系统150包括关键字提取模块401、QC计分模块403、QI计分模块404、CI计分模块405和评估模块406。模块401和403至406可具有与如图4中所示的对应模块相同或类似的功能。出于例示的目的,保持相同的参考数字。模块401和403至406执行与关于图6所描述的操作相同或相似的操作。例如,模块401和403至406执行与图6相关联的相同或相似操作,以利用作为评估方法702的一部分的正确计分算法412至415、基于已知的响应于已知搜索查询而匹配的内容项目与图像的匹配信息701来评估内容项目与图像的匹配。利用评估得分来确定内容项目与图像的先前匹配的质量。如果特定的各排序得分低于预定阈值,则这表明关于对应的一方可存在问题。例如,如果图像的排序得分太低,则需要改进图像以进行后续匹配。
图8是示出根据本发明一实施方式对用于与内容项目匹配的图像进行排序的过程的流程图。可由处理逻辑来执行过程800,所述处理逻辑可包括软件、硬件或其组合。例如,可由图4的系统400来执行过程800。参考图8,在框801处,处理逻辑基于搜索查询的一个或多个关键字来识别内容项目和作为图像候选的一个或多个图像的列表。针对每一个图像,在框802处,处理逻辑基于与搜索查询和内容项目相关联的元数据来计算第一相似性得分。在框803处,处理逻辑基于与搜索查询和图像相关联的元数据来计算第二相似性得分。在框804处,处理逻辑基于与内容项目和图像相关联的元数据来计算第三相似性得分。在框805处,处理逻辑基于第一相似性得分、第二相似性得分和第三相似性得分来确定待与内容项目匹配的图像的排序得分。在框806处,基于排序得分选择各图像中的一个来与内容项目匹配。
图9是示出根据本发明一实施方式评估内容项目与图像的匹配的过程的流程图。可由处理逻辑来执行过程900,所述处理逻辑可包括软件、硬件或其组合。例如,可由图7的系统700来执行过程900。参考图9,在框901处,处理逻辑接收对评估响应于搜索查询所识别的内容项目与图像的匹配的请求。在框902处,处理逻辑基于与搜索查询和内容项目相关联的元数据来计算第一相似性得分。在框903处,处理逻辑基于与搜索查询和图像相关联的元数据来计算第二相似性得分。在框904处,处理逻辑基于与内容项目和图像相关联的元数据来计算第三相似性得分。在框905处,处理逻辑基于第一相似性得分、第二相似性得分和第三相似性得分来确定与内容项目匹配的图像的评估得分。
上述技术可应用于匹配图像与赞助内容。一种类型的赞助内容是广告(Ad)。例如,返回参考图1A至图1B,内容数据库(DB)或服务器133可以是Ad数据库或Ad服务器。内容项目(例如,Ad)中的每一个与预定义的关键字、词、短语或句子的列表相关联。这些预定义的关键字、词、短语或句子可以是由广告提供者所购买、定义或指定的投标字。在另一实施方式中,主要内容DB 130可存储通常在公共网络中可用的一般内容。辅助内容DB 131可以是广告DB。一些广告可仅仅是纯文本。通过使图像与广告匹配和集成,例如作为背景图像,广告可更吸引人或对用户更具吸引力。服务器104可以是用于搜索内容的网络服务器,或可替代地,服务器104可以是广告服务器。
图10是示出可与本发明一实施方式一起使用的数据处理系统的示例的框图。例如,系统1500可表示以上所述的执行任意上述过程或方法的任意数据处理系统,例如上述客户端装置或服务器,例如像如上所述的客户端装置101至102、服务器104、内容服务器133、分析系统/服务器150。
系统1500可包括诸多不同的组件。这些组件可以实施为集成电路(IC)、集成电路的部分、离散电子装置或适配成用于电路板的其他模块(诸如计算机系统的主板或插入卡),或者实施为以其他方式并入计算机系统底盘内的组件。
另外注意,系统1500旨在示出计算机系统的诸多组件的高级视图。然而应当理解,某些实施方式中可存在附加的组件,此外,在其他实施方式中所示组件可具有不同布置。系统1500可表示台式计算机、膝上型计算机、平板计算机、服务器、移动电话、媒体播放器、个人数字助理(PDA)、智能手表、个人通信器、游戏装置、网络路由器或集线器、无线接入点(AP)或中继器、机顶盒或其组合。此外,虽然仅示出了单个机器或系统,但是术语“机器”或“系统”还应当理解为包括单独地或共同地执行一个(或多个)指令集以执行本文所讨论的任一种或多种方法的机器或系统的任何集合。
在一实施方式中,系统1500包括经由总线或互连件1510连接的处理器1501、存储器1503以及装置1505至1508。处理器1501可表示其中包括单个处理器内核或多个处理器内核的单处理器或多处理器。处理器1501可表示一个或多个通用处理器,诸如微处理器、中央处理单元(CPU)等。更具体地,处理器1501可以是复杂指令集计算(CISC)微处理器、精简指令集计算(RISC)微处理器、超长指令字(VLIW)微处理器、或实施其他指令集的处理器、或实施指令集组合的处理器。处理器1501还可以是一个或多个专用处理器,诸如专用集成电路(ASIC)、蜂窝或基带处理器、现场可编程门阵列(FPGA)、数字信号处理器(DSP)、网络处理器、图形处理器、通信处理器、加密处理器、协同处理器、嵌入式处理器或能够处理指令的任何其他类型的逻辑。
处理器1501(其可以是低功率多核处理器插座,诸如超低电压处理器)可充当用于与系统的各组件通信的主处理单元和中央集线器。该处理器可实施为片上系统(SoC)。处理器1501配置成执行指令以执行本文所讨论的操作和步骤。系统1500还可包括与可选图形子系统1504通信的图形接口,所述图形子系统可包括显示控制器、图形处理器和/或显示装置。
处理器1501可与存储器1503通信,在一实施方式中存储器1503可以由多个存储器装置来实施以提供给定量的系统内存。存储器1503可包括一个或多个易失性存储(或存储器)装置,诸如随机存取存储器(RAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、静态RAM(SRAM)或其他类型的存储装置。存储器1503可存储包括由处理器1501或任何其他装置执行的指令序列的信息。例如,多种操作系统、装置驱动器、固件(例如,输入输出基础系统或BIOS)和/或应用的可执行代码和/或数据可以加载在存储器1503中并由处理器1501执行。操作系统可以是任何种类型的操作系统,诸如,例如来自
Figure BDA0001156238500000181
公司的
Figure BDA0001156238500000182
操作系统、来自苹果公司的Mac
Figure BDA0001156238500000183
来自
Figure BDA0001156238500000184
公司的
Figure BDA0001156238500000185
或其他实时或嵌入式操作系统(诸如VxWorks)。
系统1500还可包括IO装置,诸如装置1505至1508:包括网络接口装置1505、可选输入装置1506以及其他可选IO装置1507。网络接口装置1505可包括无线收发器和/或网络接口卡(NIC)。无线收发器可以是WiFi收发器、红外收发器、蓝牙收发器、WiMax收发器、无线蜂窝电话收发器、卫星收发器(例如,全球定位系统(GPS)收发器)或其他射频(RF)收发器或其组合。NIC可以是以太网卡。
输入装置1506可包括鼠标、触摸板、触敏屏幕(其可以与显示装置1504集成在一起)、指示装置(诸如指示笔)和/或键盘(例如,物理键盘或作为触敏屏幕的一部分显示的虚拟键盘)。例如,输入装置1506可包括联接到触摸屏的触摸屏控制器。触摸屏和触摸屏控制器例如可以利用多种触摸灵敏度技术(包括但不限于电容、电阻、红外和表面声波技术)中的任一种,以及用于确定与触摸屏的一个或多个接触点的其他接近传感器阵列或其他元件来检测其接触和移动或间断。
IO装置1507可包括音频装置。音频装置可包括扬声器和/或麦克风,以助于支持语音的功能,诸如语音识别、语音复制、数字记录和/或电话功能。其他IO装置1507还可包括通用串行总线(USB)端口、并行端口、串行端口、打印机、网络接口、总线桥(例如,PCI-PCI桥)、传感器(例如,运动传感器,诸如加速度计、陀螺仪、磁强计、光传感器、罗盘、接近传感器等)或其组合。装置1507还可包括成像处理子系统(例如,相机),所述成像处理子系统可包括用来促进相机功能(诸如记录照片和视频片段)的光学传感器,诸如电荷耦合装置(CCD)或互补金属氧化物半导体(CMOS)光学传感器。某些传感器可经由传感器集线器(未示出)联接至互连件1510,而其他装置(诸如,键盘或热传感器)可由嵌入式控制器(未示出)控制,这取决于系统1500的特定配置或设计。
为了永久性地存储诸如数据、应用、一个或多个操作系统等的信息,还可将大容量存储装置(未示出)联接到处理器1501。在各实施方式中,为了实现更薄且更轻的系统设计并且改进系统响应能力,这种大容量存储装置可由固态装置(SSD)来实施。然而,在其他实施方式中,大容量存储装置可主要使用硬盘驱动器(HDD)来实施,而较小量的SSD存储装置充当SSD高速缓存以在断电事件期间能够非易失性地存储上下文状态以及其他此类信息,从而使得在系统活动重新启动时能够实施快速通电。另外,闪存装置可例如经由串行外围接口(SPI)联接到处理器1501。这种闪存装置可非易失性地存储系统软件,所述系统软件包括系统的基础输入/输出软件(BIOS)以及其他固件。
存储装置1508可包括计算机可访问的存储介质1509(也称为机器可读存储介质或计算机可读介质),所述存储介质1509上存储有实现本文所述的任何一种或多种方法或功能的一个或多个指令集或软件(例如,模块、单元和/或逻辑1528)。模块/单元/逻辑1528可表示上述任一组件,例如像如上所述的搜索引擎、编码器、交互日志记录模块、图像选择模块。模块/单元/逻辑1528还可在其被数据处理系统1500、存储器1503和处理器1501执行期间完全地或至少部分地驻留在存储器1503内和/或处理器1501内,另外构成机器可访问的存储介质。模块/单元/逻辑1528还可通过网络经由网络接口装置1505被发射或接收。
计算机可读存储介质1509也可用来永久性地存储以上描述的一些软件功能。虽然在示例性实施方式中计算机可读存储介质1509示为单个介质,但是术语“计算机可读存储介质”应当被认为包括存储所述一个或多个指令集的单个介质或多个介质(例如,集中式或分布式数据库和/或相关联的高速缓存和服务器)。术语“计算机可读存储介质”还应当被认为包括能够存储或编码指令集的任何介质,所述指令集用于由机器执行并且致使机器执行本发明的任何一种或多种方法。因此,术语“计算机可读存储介质”应当被认为包括但不限于固态存储器以及光学介质和磁性介质或者任何其他非瞬态机器可读介质。
本文所述的模块/单元/逻辑1528、组件以及其他特征可以实施为离散硬件组件或集成在硬件组件(诸如ASICS、FPGA、DSP或类似装置)的功能中。另外,模块/单元/逻辑1528可以实施为硬件装置内的固件或功能电路。此外,模块/单元/逻辑1528可以以硬件装置和软件组件的任何组合来实施。
注意,虽然系统1500示为具有数据处理系统的各种组件,但是其不旨在表示任何特定的架构或互连组件的方式;因为此类细节和本发明的实施方式没有密切关系。还将理解,具有更少组件或可能具有更多组件的网络计算机、手持计算机、移动电话、服务器和/或其他数据处理系统也可与本发明的实施方式一起使用。
前述详细描述中的一些部分已经根据在计算机存储器内对数据位进行运算的算法和符号表示而呈现。这些算法描述和表示是数据处理领域技术人员用以最有效地将其工作实质传达给本领域其他技术人员的方式。这里,算法通常被认为是导致期望结果的自相一致的操作序列。操作是需要对物理量进行物理操控的操作。
然而,应当牢记,所有这些和类似的术语均旨在与适当的物理量相关联,并且仅仅是应用于这些量的适宜标记。除非另外明确地叙述,如通过以上讨论而明显,否则应当理解,说明书通篇中利用术语(诸如以下权利要求书中所阐述的术语)的讨论是指计算机系统或类似电子计算装置的动作和处理,所述计算机系统或电子计算装置操控计算机系统的寄存器和存储器内的、表示为物理(例如,电子)量的数据,并将所述数据变换成计算机系统存储器或寄存器或其他此类信息存储器、传输或显示装置内类似地表示为物理量的其他数据。
各图中所示的技术可利用存储在一个或多个电子装置上并在所述电子装置上执行的代码及数据来实施。此类电子装置使用计算机可读介质来存储和传送(在内部和/或通过网络利用其他电子装置)代码及数据,所述计算机可读介质诸如为非瞬态计算机可读存储介质(例如,磁盘、光盘、随机存取存储器、只读存储器、闪存存储器装置、相变存储器)和瞬态计算机可读传输介质(例如,电子、光学、声学或其他形式的传播信号—诸如载波、红外信号、数字信号)。
前述附图中所描绘的过程或方法可由处理逻辑来执行,所述处理逻辑包括硬件(例如,电路、专用逻辑等)、固件、软件(例如,在非瞬态计算机可读介质上实施)或两者的组合。虽然所述过程或方法在上面根据一些顺序操作来描述,但是应当理解,所述操作中的一些可按不同的次序来执行。此外,一些操作可并行地而不是顺序地执行。
在以上说明书中,已经参考本发明的特定例示性实施方式对本发明的实施方式进行了描述。将显而易见的是:在不脱离如以下权利要求书所阐述的本发明更宽泛的精神和范围的情况下,可对本发明进行各种修改。因此,应当以说明性的意义而不是限制性的意义来理解本说明书和附图。

Claims (24)

1.用于评估内容项目与图像的匹配的计算机实现方法,所述方法包括:
接收对评估内容项目与图像之间的匹配的请求,所述内容项目和所述图像是响应于搜索查询从多个内容项目和多个图像中识别和选择的;
获得与所述内容项目相关联的第一元数据、与所述图像相关联的第二元数据以及与所述搜索查询相关联的第三元数据;
基于与所述内容项目相关联的第一元数据以及与所述搜索查询相关联的第三元数据,确定第一相似性得分;
基于与所述图像相关联的第二元数据以及与所述搜索查询相关联的第三元数据,确定第二相似性得分;以及
基于所述第一相似性得分和所述第二相似性得分计算根据所述搜索查询的所述内容项目与所述图像的匹配的评估得分,其中所述评估得分用于作为后续搜索查询的响应而识别后续内容项目和后续图像。
2.如权利要求1所述的方法,其中基于与所述内容项目相关联的第一元数据以及与所述搜索查询相关联的第三元数据来确定第一相似性得分包括:
确定与所述内容项目相关联的一个或多个关键字的第一集合;
确定与所述搜索查询相关联的一个或多个关键字的第三集合;以及
对关键字的所述第一集合和所述第三集合执行第一概率性潜在语义分析,以生成所述第一相似性得分。
3.如权利要求2所述的方法,其中,基于所述内容项目的标题、描述和登陆页面来获得关键字的所述第一集合。
4.如权利要求1所述的方法,其中,基于与所述图像相关联的第二元数据以及与所述搜索查询相关联的第三元数据来确定第二相似性得分包括:
确定与所述图像相关联的一个或多个关键字的第二集合;
确定与所述搜索查询相关联的一个或多个关键字的第三集合;以及
对关键字的所述第二集合和所述第三集合执行第二概率性潜在语义分析,以生成所述第二相似性得分。
5.如权利要求4所述的方法,其中,基于所述图像的标题、由所述图像识别出的对象或描述以及获得所述图像的来源来获得关键字的所述第二集合。
6.如权利要求1所述的方法,还包括基于与所述内容项目相关联的第一元数据以及与所述图像相关联的第二元数据来确定第三相似性得分,其中基于所述第一相似性得分、所述第二相似性得分和所述第三相似性得分来计算所述评估得分。
7.如权利要求6所述的方法,其中基于与所述内容项目相关联的第一元数据以及与所述图像相关联的第二元数据来确定第三相似性得分包括:
确定与所述内容项目相关联的一个或多个关键字的第一集合;
确定与所述图像相关联的一个或多个关键字的第二集合;以及
对关键字的所述第一集合和所述第二集合执行第三概率性潜在语义分析,以生成所述第三相似性得分。
8.如权利要求1所述的方法,其中,响应于所述搜索查询、利用预定选择方法来识别和选择所述内容项目和所述图像,利用所述评估得分来调整用于选择所述后续内容项目和所述后续图像的预定选择方法。
9.一种评估内容项目与图像的匹配的装置,包括:
接收对评估内容项目与图像之间的匹配的请求的装置,所述内容项目和所述图像是响应于搜索查询从多个内容项目和多个图像中而识别和选择的;
获得与所述内容项目相关联的第一元数据、与所述图像相关联的第二元数据以及与所述搜索查询相关联的第三元数据的装置;
基于与所述内容项目相关联的第一元数据以及与所述搜索查询相关联的第三元数据确定第一相似性得分的装置;
基于与所述图像相关联的第二元数据以及与所述搜索查询相关联的第三元数据确定第二相似性得分的装置;以及
基于所述第一相似性得分和所述第二相似性得分计算根据所述搜索查询的所述内容项目与所述图像的匹配的评估得分的装置,其中所述评估得分用于作为后续搜索查询的响应而识别后续内容项目和后续图像。
10.如权利要求9所述的评估内容项目与图像的匹配的装置,其中基于与所述内容项目相关联的第一元数据以及与所述搜索查询相关联的第三元数据来确定第一相似性得分的装置包括:
确定与所述内容项目相关联的一个或多个关键字的第一集合的装置;
确定与所述搜索查询相关联的一个或多个关键字的第三集合的装置;以及
对关键字的所述第一集合和所述第三集合执行第一概率性潜在语义分析以生成所述第一相似性得分的装置。
11.如权利要求10所述的评估内容项目与图像的匹配的装置,其中基于所述内容项目的标题、描述和登陆页面来获得关键字的所述第一集合。
12.如权利要求9所述的评估内容项目与图像的匹配的装置,其中基于与所述图像相关联的第二元数据以及与所述搜索查询相关联的第三元数据来确定第二相似性得分的装置包括:
确定与所述图像相关联的一个或多个关键字的第二集合的装置;
确定与所述搜索查询相关联的一个或多个关键字的第三集合的装置;以及
对关键字的所述第二集合和所述第三集合执行第二概率性潜在语义分析以生成所述第二相似性得分的装置。
13.如权利要求12所述的评估内容项目与图像的匹配的装置,其中基于所述图像的标题、由所述图像识别出的对象或描述以及获得所述图像的来源来获得关键字的所述第二集合。
14.如权利要求9所述的评估内容项目与图像的匹配的装置,还包括基于与所述内容项目相关联的第一元数据以及与所述图像相关联的第二元数据来确定第三相似性得分的装置,其中基于所述第一相似性得分、所述第二相似性得分和所述第三相似性得分来计算所述评估得分。
15.如权利要求14所述的评估内容项目与图像的匹配的装置,其中基于与所述内容项目相关联的第一元数据以及与所述图像相关联的第二元数据来确定第三相似性得分的装置包括:
确定与所述内容项目相关联的一个或多个关键字的第一集合的装置;
确定与所述图像相关联的一个或多个关键字的第二集合的装置;以及
对关键字的所述第一集合和所述第二集合执行第三概率性潜在语义分析以生成所述第三相似性得分的装置。
16.如权利要求9所述的评估内容项目与图像的匹配的装置,其中,响应于所述搜索查询、利用预定选择方法来识别和选择所述内容项目和所述图像,利用所述评估得分来调整用于选择所述后续内容项目和所述后续图像的预定选择方法。
17.数据处理系统,包括如权利要求9至16中任一项所述的评估内容项目与图像的匹配的装置。
18.用于使内容项目与图像匹配的计算机实现方法,所述方法包括:
接收响应于搜索查询而识别的内容项目和多个图像;
针对所述多个图像中的每一个,
基于与所述内容项目相关联的第一元数据以及与所述搜索查询相关联的第三元数据,确定第一相似性得分;
基于与所述图像相关联的第二元数据以及与所述搜索查询相关联的第三元数据,确定第二相似性得分;以及
基于所述第一相似性得分和所述第二相似性得分,计算所述图像的排序得分;以及
基于所述图像的排序得分对所述多个图像进行排序,以选择所述多个图像中的一个来与所述内容项目相关联。
19.如权利要求18所述的方法,其中基于与所述内容项目相关联的第一元数据以及与所述搜索查询相关联的第三元数据来确定第一相似性得分包括:
确定与所述内容项目相关联的一个或多个关键字的第一集合;
确定与所述搜索查询相关联的一个或多个关键字的第三集合;以及
对关键字的所述第一集合和所述第三集合执行第一概率性潜在语义分析,以生成所述第一相似性得分。
20.如权利要求19所述的方法,其中基于所述内容项目的标题、描述和登陆页面来获得关键字的所述第一集合。
21.如权利要求18所述的方法,其中基于与所述图像相关联的第二元数据以及与所述搜索查询相关联的第三元数据来确定第二相似性得分包括:
确定与所述图像相关联的一个或多个关键字的第二集合;
确定与所述搜索查询相关联的一个或多个关键字的第三集合;以及
对关键字的所述第二集合和所述第三集合执行第二概率性潜在语义分析,以生成所述第二相似性得分。
22.如权利要求21所述的方法,其中基于所述图像的标题、由所述图像识别出的对象或描述以及获得所述图像的来源来获得关键字的所述第二集合。
23.如权利要求18所述的方法,还包括基于与所述内容项目相关联的第一元数据以及与所述图像相关联的第二元数据来确定第三相似性得分,其中基于所述第一相似性得分、所述第二相似性得分和所述第三相似性得分来计算所述排序得分。
24.如权利要求23所述的方法,其中基于与所述内容项目相关联的第一元数据以及与所述图像相关联的第二元数据来确定第三相似性得分包括:
确定与所述内容项目相关联的一个或多个关键字的第一集合;
确定与所述图像相关联的一个或多个关键字的第二集合;以及
对关键字的所述第一集合和所述第二集合执行第三概率性潜在语义分析,以生成所述第三相似性得分。
CN201611035712.2A 2016-06-07 2016-11-18 基于相似性得分评估内容项目与图像的匹配的方法和系统 Active CN107480158B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US15/175,584 2016-06-07
US15/175,584 US10459970B2 (en) 2016-06-07 2016-06-07 Method and system for evaluating and ranking images with content based on similarity scores in response to a search query

Publications (2)

Publication Number Publication Date
CN107480158A CN107480158A (zh) 2017-12-15
CN107480158B true CN107480158B (zh) 2021-01-12

Family

ID=57442580

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611035712.2A Active CN107480158B (zh) 2016-06-07 2016-11-18 基于相似性得分评估内容项目与图像的匹配的方法和系统

Country Status (5)

Country Link
US (1) US10459970B2 (zh)
EP (1) EP3255565A1 (zh)
JP (1) JP6266080B2 (zh)
KR (1) KR101932618B1 (zh)
CN (1) CN107480158B (zh)

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9852337B1 (en) * 2015-09-30 2017-12-26 Open Text Corporation Method and system for assessing similarity of documents
US11138523B2 (en) 2016-07-27 2021-10-05 International Business Machines Corporation Greedy active learning for reducing labeled data imbalances
US20180032901A1 (en) * 2016-07-27 2018-02-01 International Business Machines Corporation Greedy Active Learning for Reducing User Interaction
US11042579B2 (en) 2016-08-25 2021-06-22 Lakeside Software, Llc Method and apparatus for natural language query in a workspace analytics system
US10129367B2 (en) * 2016-09-22 2018-11-13 Facebook, Inc. Delivering content items using machine learning based prediction of user actions
US11093561B2 (en) * 2017-12-11 2021-08-17 Facebook, Inc. Fast indexing with graphs and compact regression codes on online social networks
CN108829757B (zh) * 2018-05-28 2022-01-28 广州麦优网络科技有限公司 一种聊天机器人的智能服务方法、服务器及存储介质
US10878037B2 (en) 2018-06-21 2020-12-29 Google Llc Digital supplement association and retrieval for visual search
KR20230003388A (ko) * 2018-06-21 2023-01-05 구글 엘엘씨 시각적 검색을 위한 디지털 보충물 연관 및 검색
US10579230B2 (en) 2018-06-21 2020-03-03 Google Llc Digital supplement association and retrieval for visual search
US11030260B2 (en) * 2018-08-29 2021-06-08 Ip.Com I, Llc System and method for dynamically normalized semantic distance and applications thereof
US11544462B2 (en) * 2018-12-07 2023-01-03 International Business Machines Corporation Processing electronic communications to promote achievement
DE112019006694T5 (de) * 2019-02-21 2021-10-28 Mitsubishi Electric Corporation Informationsverarbeitungsvorrichtung, informationsverarbeitungsverfahren und informationsverarbeitungsprogramm
US11170035B2 (en) * 2019-03-29 2021-11-09 Snap Inc. Context based media curation
CN110162639A (zh) * 2019-04-16 2019-08-23 深圳壹账通智能科技有限公司 识图知意的方法、装置、设备及存储介质
CN110365866B (zh) * 2019-06-13 2021-09-14 首都师范大学 彩色图像加密方法和装置
US11216699B2 (en) 2019-06-13 2022-01-04 Baidu Usa Llc System to mitigate against adversarial samples for ML and AI models
CN110598791A (zh) * 2019-09-12 2019-12-20 深圳前海微众银行股份有限公司 地址相似度评价方法、装置、设备及介质
KR102280494B1 (ko) * 2019-12-06 2021-07-26 주식회사 클리노믹스 상호연관성 기반 우선순위로 정렬된 전문분야 인터넷 검색 서비스 제공 방법
KR102280495B1 (ko) * 2019-12-06 2021-07-26 주식회사 클리노믹스 인공지능 기반의 검색 서비스 제공 장치 및 방법
US11907280B2 (en) * 2020-11-05 2024-02-20 Adobe Inc. Text adjusted visual search
KR102359167B1 (ko) * 2021-03-18 2022-02-08 쿠팡 주식회사 아이템과 관련된 정보를 제공하는 방법 및 전자 장치
US20230048742A1 (en) * 2021-08-10 2023-02-16 Verizon Media Inc. Search query generation based upon received text
US20220291930A1 (en) * 2022-05-31 2022-09-15 Intel Corporation Methods, apparatus, and articles of manufacture to improve performance of a compute device by detecting a scene change

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101021849A (zh) * 2006-09-14 2007-08-22 浙江大学 基于内容相关性的跨媒体检索方法
CN101165647A (zh) * 2006-10-17 2008-04-23 北京书生国际信息技术有限公司 一种文档库系统和文档库系统功能的扩展方法
CN101196897A (zh) * 2006-12-07 2008-06-11 佳能株式会社 图像处理设备和图像处理方法
CN101211341A (zh) * 2006-12-29 2008-07-02 上海芯盛电子科技有限公司 图像智能模式识别搜索方法
JP2012138109A (ja) * 2006-03-08 2012-07-19 Ricoh Co Ltd 検索装置、検索システム、情報処理装置、検索結果受信方法、及び情報受信プログラム
US8775436B1 (en) * 2004-03-19 2014-07-08 Google Inc. Image selection for news search
JP2015153094A (ja) * 2014-02-13 2015-08-24 ヤフー株式会社 抽出装置、抽出方法および抽出プログラム

Family Cites Families (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020038299A1 (en) 2000-03-20 2002-03-28 Uri Zernik Interface for presenting information
US20050160107A1 (en) * 2003-12-29 2005-07-21 Ping Liang Advanced search, file system, and intelligent assistant agent
JP4576977B2 (ja) * 2004-10-28 2010-11-10 ソニー株式会社 情報処理装置および方法、並びにプログラム
CA2500573A1 (en) * 2005-03-14 2006-09-14 Oculus Info Inc. Advances in nspace - system and method for information analysis
US20080109285A1 (en) * 2006-10-26 2008-05-08 Mobile Content Networks, Inc. Techniques for determining relevant advertisements in response to queries
US8090222B1 (en) * 2006-11-15 2012-01-03 Google Inc. Selection of an image or images most representative of a set of images
US20090012863A1 (en) * 2007-07-02 2009-01-08 Syta Saephan Automatic image advertisement generator
KR100939897B1 (ko) * 2007-08-08 2010-01-29 엔에이치엔비즈니스플랫폼 주식회사 광고 노출 방법 및 시스템
US20100100546A1 (en) * 2008-02-08 2010-04-22 Steven Forrest Kohler Context-aware semantic virtual community for communication, information and knowledge management
US8086048B2 (en) * 2008-05-23 2011-12-27 Yahoo! Inc. System to compile landmark image search results
US20100131499A1 (en) * 2008-11-24 2010-05-27 Van Leuken Reinier H Clustering Image Search Results Through Folding
US8112428B2 (en) * 2008-11-24 2012-02-07 Yahoo! Inc. Clustering image search results through voting: reciprocal election
JP5010624B2 (ja) * 2009-02-10 2012-08-29 ヤフー株式会社 検索装置
US20100306249A1 (en) * 2009-05-27 2010-12-02 James Hill Social network systems and methods
US9384214B2 (en) * 2009-07-31 2016-07-05 Yahoo! Inc. Image similarity from disparate sources
US8135222B2 (en) * 2009-08-20 2012-03-13 Xerox Corporation Generation of video content from image sets
US8392430B2 (en) * 2009-09-23 2013-03-05 Microsoft Corp. Concept-structured image search
US9710491B2 (en) * 2009-11-02 2017-07-18 Microsoft Technology Licensing, Llc Content-based image search
KR101139001B1 (ko) * 2010-02-23 2012-04-26 경기대학교 산학협력단 콘텐츠 제공 장치 및 방법
US20110238608A1 (en) * 2010-03-25 2011-09-29 Nokia Corporation Method and apparatus for providing personalized information resource recommendation based on group behaviors
WO2011153508A2 (en) * 2010-06-04 2011-12-08 Google Inc. Service for aggregating event information
JP5094915B2 (ja) * 2010-06-08 2012-12-12 ヤフー株式会社 検索装置
US8270684B2 (en) * 2010-07-27 2012-09-18 Google Inc. Automatic media sharing via shutter click
US8645298B2 (en) * 2010-10-26 2014-02-04 Microsoft Corporation Topic models
US9110977B1 (en) * 2011-02-03 2015-08-18 Linguastat, Inc. Autonomous real time publishing
US9870376B2 (en) * 2011-04-01 2018-01-16 Excalibur Ip, Llc Method and system for concept summarization
US9678992B2 (en) * 2011-05-18 2017-06-13 Microsoft Technology Licensing, Llc Text to image translation
US20130018875A1 (en) * 2011-07-11 2013-01-17 Lexxe Pty Ltd System and method for ordering semantic sub-keys utilizing superlative adjectives
US10198506B2 (en) * 2011-07-11 2019-02-05 Lexxe Pty Ltd. System and method of sentiment data generation
US9916538B2 (en) * 2012-09-15 2018-03-13 Z Advanced Computing, Inc. Method and system for feature detection
US8923655B1 (en) * 2011-10-14 2014-12-30 Google Inc. Using senses of a query to rank images associated with the query
US9020244B2 (en) * 2011-12-06 2015-04-28 Yahoo! Inc. Ranking and selecting representative video images
JP6033326B2 (ja) * 2011-12-12 2016-11-30 エンパイア テクノロジー ディベロップメント エルエルシー コンテンツベースの自動的な入力プロトコルの選択
US9158857B2 (en) * 2012-06-05 2015-10-13 Google Inc. Identifying landing pages for images
US9424279B2 (en) * 2012-12-06 2016-08-23 Google Inc. Presenting image search results
US9230023B2 (en) * 2013-04-16 2016-01-05 Google Inc. Search suggestion and display environment
KR101538998B1 (ko) * 2013-09-13 2015-07-24 한국과학기술원 지식 구조를 기반으로 한 검색 서비스 제공 방법 및 장치
JP5951053B2 (ja) * 2015-02-03 2016-07-13 ヤフー株式会社 検索情報提供装置、検索情報提供方法および検索情報提供プログラム
US10042866B2 (en) * 2015-06-30 2018-08-07 Adobe Systems Incorporated Searching untagged images with text-based queries
US10311374B2 (en) * 2015-09-11 2019-06-04 Adobe Inc. Categorization of forms to aid in form search
US9747348B2 (en) * 2015-11-12 2017-08-29 International Business Machines Corporation Personality-relevant search services
US10891019B2 (en) * 2016-02-29 2021-01-12 Huawei Technologies Co., Ltd. Dynamic thumbnail selection for search results
US10437868B2 (en) * 2016-03-04 2019-10-08 Microsoft Technology Licensing, Llc Providing images for search queries
US10909170B2 (en) * 2016-04-06 2021-02-02 Baidu Usa Llc Method for processing and rendering feed-like based images for mobile devices
US10140315B1 (en) * 2016-06-20 2018-11-27 Shutterstock, Inc. Identifying visual portions of visual media files responsive to visual portions of media files submitted as search queries

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8775436B1 (en) * 2004-03-19 2014-07-08 Google Inc. Image selection for news search
JP2012138109A (ja) * 2006-03-08 2012-07-19 Ricoh Co Ltd 検索装置、検索システム、情報処理装置、検索結果受信方法、及び情報受信プログラム
CN101021849A (zh) * 2006-09-14 2007-08-22 浙江大学 基于内容相关性的跨媒体检索方法
CN101165647A (zh) * 2006-10-17 2008-04-23 北京书生国际信息技术有限公司 一种文档库系统和文档库系统功能的扩展方法
CN101196897A (zh) * 2006-12-07 2008-06-11 佳能株式会社 图像处理设备和图像处理方法
CN101211341A (zh) * 2006-12-29 2008-07-02 上海芯盛电子科技有限公司 图像智能模式识别搜索方法
JP2015153094A (ja) * 2014-02-13 2015-08-24 ヤフー株式会社 抽出装置、抽出方法および抽出プログラム

Also Published As

Publication number Publication date
KR101932618B1 (ko) 2018-12-27
KR20170138333A (ko) 2017-12-15
EP3255565A1 (en) 2017-12-13
JP2017220203A (ja) 2017-12-14
US20170351710A1 (en) 2017-12-07
JP6266080B2 (ja) 2018-01-24
CN107480158A (zh) 2017-12-15
US10459970B2 (en) 2019-10-29

Similar Documents

Publication Publication Date Title
CN107480158B (zh) 基于相似性得分评估内容项目与图像的匹配的方法和系统
CN107145496B (zh) 基于关键词将图像与内容项目匹配的方法
CN107463591B (zh) 响应于搜索查询对待与内容匹配的图像动态排序的方法和系统
CN107103016B (zh) 基于关键词表示使图像与内容匹配的方法
CN107784059B (zh) 用于搜索和选择图像的方法和系统以及机器可读媒体
CN107766399B (zh) 用于使图像与内容项目匹配的方法和系统及机器可读介质
CN107145497B (zh) 基于图像和内容的元数据选择与内容匹配的图像的方法
CN107463592B (zh) 用于将内容项目与图像匹配的方法、设备和数据处理系统
US10275472B2 (en) Method for categorizing images to be associated with content items based on keywords of search queries
CN107491465B (zh) 用于搜索内容的方法和装置以及数据处理系统
US10789287B2 (en) Method and system for multi-dimensional image matching with content in response to a search query
CN107766398B (zh) 用于使图像与内容项目匹配的方法、装置和数据处理系统
CN107784061B (zh) 确定基于图像的内容样式的方法和系统及机器可读介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant