CN114996573A - 内容项处理方法、装置、设备及存储介质 - Google Patents
内容项处理方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN114996573A CN114996573A CN202210553981.7A CN202210553981A CN114996573A CN 114996573 A CN114996573 A CN 114996573A CN 202210553981 A CN202210553981 A CN 202210553981A CN 114996573 A CN114996573 A CN 114996573A
- Authority
- CN
- China
- Prior art keywords
- data
- retrieval
- intention
- content item
- category
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0251—Targeted advertisements
Abstract
本申请公开了一种内容项处理方法、装置、设备及存储介质,属于计算机技术领域。方法包括:对检索数据进行识别处理,得到所述检索数据的检索意图信息,所述检索意图信息用于表示所述检索数据的检索意图;基于所述检索意图信息,生成与所述检索数据匹配的内容项;基于所述检索数据,对所述内容项进行投放。该方案能够通过获取检索数据的检索意图信息,来生成适合的内容项,并基于该检索数据对内容项进行投放,既保证了检索数据与内容项匹配,还避免了在匹配的检索数据中未投放内容项的情况,提高了投放效果。
Description
技术领域
本申请涉及计算机技术领域,特别涉及一种内容项处理方法、装置、设备及存储介质。
背景技术
在SEM(Search Engine Marketing,搜索引擎营销)场景中,广告等内容项对应有投放词,当用户输入的检索数据与内容项的投放词匹配的情况下,将该内容项作为检索结果呈现给用户。
相关技术中,根据广告主的业务范围,确定与该业务范围匹配的检索对象(例如,业务范围是旅游业,检索对象是景点A),人工整理与该检索对象相关的检索数据,得到检索数据的高频模板(xxx的营业时间)。再根据该高频模板生成内容项的文字内容,根据该检索对象获取内容项的图像内容,将文字内容和图像内容组合成内容项;将检索对象与高频模板组合成该内容项的投放词(景点A的营业时间)。
但是实际应用中发现,当用户输入的检索数据为“景点A从几点到几点开门”等与投放词表述有较大不同的数据时,会被判定为检索数据与投放词不匹配,从而不会投放该内容项,导致内容项的投放效果较差。
发明内容
本申请实施例提供了一种内容项处理方法、装置、设备及存储介质,提高了内容项的投放效果。该技术方案如下:
一方面,提供了一种内容项处理方法,所述方法包括:
对检索数据进行识别处理,得到所述检索数据的检索意图信息,所述检索意图信息用于表示所述检索数据的检索意图;
基于所述检索意图信息,生成与所述检索数据匹配的内容项;
基于所述检索数据,对所述内容项进行投放。
一方面,提供了一种内容项处理装置,所述装置包括:
识别模块,用于对检索数据进行识别处理,得到所述检索数据的检索意图信息,所述检索意图信息用于表示所述检索数据的检索意图;
生成模块,用于基于所述检索意图信息,生成与所述检索数据匹配的内容项;
投放模块,用于基于所述检索数据,对所述内容项进行投放。
在一种可能实现方式中,所述识别模块,用于执行以下至少一项:
所述检索意图信息包括所述检索数据对应的意图类别,所述意图类别用于表示所述检索数据的检索意图所属的类别;对所述检索数据进行第一识别处理,得到所述检索数据对应的意图类别;
所述检索意图信息包括所述检索数据对应的业务类别,所述业务类别表示所述检索数据的检索对象所属的业务类别,对所述检索数据进行第二识别处理,得到所述检索数据对应的业务类别;
所述检索意图信息包括所述检索数据的检索对象;对所述检索数据进行第三识别处理,得到所述检索数据的检索对象。
在一种可能实现方式中,所述识别模块,用于基于所述检索数据对应的业务类别,对所述检索数据进行第一识别处理,从所述业务类别对应的多个意图类别中,确定所述检索数据对应的意图类别。
在一种可能实现方式中,所述识别模块,包括:
获取单元,用于获取意图识别模型,所述意图识别模型包括特征提取层、特征处理层和每个业务类别对应的识别层,所述业务类别对应的识别层用于从所述业务类别对应的多个意图类别中确定检索数据的检索意图所属的意图类别;
第一处理单元,用于通过所述特征提取层,对所述检索数据进行特征提取,得到第一特征数据;
第二处理单元,用于通过所述特征提取层,对所述第一特征数据进行处理,得到第二特征数据;
输入单元,用于基于所述检索数据对应的业务类别,将所述第二特征数据输入到所述业务类别对应的识别层;
第三处理单元,用于通过所述识别层,对所述第二特征数据进行识别处理,得到所述检索数据对应的意图类别。
在一种可能实现方式中,所述第一处理单元,用于将所述检索数据进行分词处理,得到多个词语字;
所述第一处理单元,用于通过所述特征提取层,对所述多个词语中的每个词语进行特征提取,得到所述每个词语对应的第一特征数据;
所述第二处理单元,用于对于所述每个词语对应的第一特征数据,通过所述特征提取层,将所述词语对应的第一特征数据与所述多个词语中除了所述词语之外的其他词语的第一特征数据进行融合处理,得到所述词语的第二特征数据。
在一种可能实现方式中,所述装置还包括训练模块;
所述训练模块,用于获取多个样本数据,所述多个样本数据包括对应不同业务类别的多个样本检索数据和所述多个样本检索数据分别对应的样本意图类别;
所述训练模块,用于基于所述多个样本数据,对初始意图识别模型进行训练,得到包括目标识别层的意图识别模型,所述目标识别层为多业务类别对应的识别层;
所述训练模块,用于根据业务类别的数量,对所述目标识别层进行复制处理,得到每个业务类别对应的识别层;
所述训练模块,用于对于每个业务类别对应的识别层,基于对应所述类别的多个样本检索数据和所述多个样本检索数据对应的样本意图类别,对所述业务类别对应的识别层进行训练。
在一种可能实现方式中,所述生成模块用于执行以下至少一项:
基于所述意图类别,从第一对应关系中,获取所述意图类别对应的文本数据,所述第一对应关系为意图类别和文本数据的对应关系,所述文本数据为描述内容项的文本数据;基于所述文本数据,生成与所述检索数据匹配的内容项;
基于所述意图类别,获取与所述意图类别匹配的图像数据;基于所述图像数据,生成与所述检索数据匹配的内容项;
在所述检索数据对应的业务类别为目标业务类别的情况下,基于所述检索意图信息,生成与所述检索数据匹配的内容项,所述目标业务类别为待推荐内容项所属的业务类别;
基于所述检索对象,获取所述检索对象的链接;基于所述检索对象的链接,生成与所述检索数据匹配的内容项。
在一种可能实现方式中,所述检索数据为响应于检索数据获取的检索数据,所述投放模块,用于将所述内容项作为所述检索数据对应的检索结果进行展示。
在一种可能实现方式中,所述检索数据是从检索记录中获取的检索数据,所述投放模块,包括:
确定单元,用于将所述检索数据作为所述内容项的投放数据;
获取单元,用于响应于检索操作,获取被输入的检索数据;
展示单元,用于在所述被输入的检索数据与所述投放数据匹配的情况下,在展示所述检索数据的检索结果时,展示所述内容项。
在一种可能实现方式中,所述识别模块,用于对多条检索数据进行识别处理,得到每条检索数据的检索意图信息;基于所述每条检索数据的检索意图信息,确定不同检索意图信息对应的至少一条检索数据;
所述生成模块,用于将所述检索意图信息对应的至少一条检索数据确定为与所述检索意图信息匹配的内容项的投放数据。
一方面,提供了一种计算机设备,该计算机设备包括一个或多个处理器和一个或多个存储器,该一个或多个存储器中存储有至少一条程序代码,该至少一条程序代码由该一个或多个处理器加载并执行以实现如上述任一种可能实现方式的内容项处理方法所执行的操作。
一方面,提供了一种计算机可读存储介质,该存储介质中存储有至少一条程序代码,该至少一条程序代码由处理器加载并执行以实现如上述任一种可能实现方式的内容项处理方法所执行的操作。
一方面,提供了一种计算机程序或计算机程序产品,所述计算机程序或计算机程序产品包括:计算机程序代码,所述计算机程序代码被计算机执行时,使得所述计算机实现如上述任一种可能实现方式的内容项处理方法所执行的操作。
本申请实施例提供的内容项处理方法、装置、设备及存储介质,通过获取检索数据的检索意图信息,来生成适合的内容项,并基于该检索数据对内容项进行投放,既保证了检索数据与内容项匹配,还避免了在匹配的检索数据中未投放内容项的情况,提高了投放效果。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种实施环境的示意图;
图2是本申请实施例提供的一种内容项处理方法的流程图;
图3是本申请实施例提供的一种内容项处理方法的流程图;
图4是本申请实施例提供的一种对象识别模型的示意图;
图5是本申请实施例提供的一种意图识别模型的示意图;
图6是本申请实施例提供的一种内容项处理方法的流程图;
图7是本申请实施例提供的一种内容项处理方法的流程图;
图8是本申请实施例提供的一种检索数据处理方法的流程图;
图9是本申请实施例提供的一种内容项处理装置结构示意图;
图10是本申请实施例提供的另一种内容项处理装置结构示意图;
图11是本申请实施例提供的终端的结构示意图;
图12是本申请实施例提供的服务器的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
可以理解,本申请所使用的术语“第一”、“第二”等可在本文中用于描述各种概念,但除非特别说明,这些概念不受这些术语限制。这些术语仅用于将一个概念与另一个概念区分。举例来说,在不脱离本申请的范围的情况下,可以将第一图像称为第二图像,且类似地,可将第二图像称为第一图像。
本申请所使用的术语“至少一个”、“多个”、“每个”、“任一”,至少一个包括一个、两个或者两个以上,多个包括两个或者两个以上,而每个是指对应的多个中的每一个,任一是指多个中的任意一个,举例来说,多个图像包括3个图像,而每个是指这3个图像中的每一个图像,任一是指这3个图像中的任意一个,可以是第一个,也可以是第二个,还可以是第三个。
本申请实施例提供的内容项处理方法由计算机设备执行。在一种可能实现方式中,该计算机设备为终端,例如,该终端为台式电脑、平板电脑或者手机等任一种类型的终端。在另一种可能实现方式中,该计算机设备为服务器。例如,该服务器可以为一台服务器,或者由若干服务器组成的服务器集群,或者是一个云计算服务中心。在另一种可能实现方式中,该计算机设备包括终端和服务器。
图1是本申请实施例提供的一种实施环境的示意图,如图1所示,该实施环境包括终端101和服务器102。终端101与服务器102之间通过无线或者有线网络连接。
可选地,终端101为台式电脑、平板电脑或者手机等任一种类型的终端。服务器102为一台服务器,或者由若干服务器组成的服务器集群,或者是一个云计算服务中心。
终端101上安装由服务器102提供服务的目标应用,终端101能够通过该目标应用实现例如数据传输、消息交互等功能。可选地,目标应用为终端101操作系统中的应用,或者为第三方提供的应用。例如,目标应用为多媒体数据处理应用,该多媒体数据处理应用具有处理多媒体数据的功能,当然,该多媒体数据处理应用还能够具有其他功能,例如,点评功能、分享功能等。
可选地,终端101获取检索数据,向服务器102发送该检索数据,服务器102对该检索数据进行识别处理,得到该检索数据的检索意图信息,该检索意图信息用于表示该检索数据的检索意图;服务器102基于该检索意图信息,生成与该检索数据匹配的内容项,基于该检索数据,对该内容项进行投放。例如,服务器102将该内容项作为该检索数据对应的检索结果进行展示;又如,服务器102将该检索数据作为内容项的投放数据,下次获取输入的检索数据之后,如果输入的检索数据与该投放数据匹配的话,在展示该检索数据的检索结果时,展示该内容项。
本申请实施例提供的内容项处理方法能够应用于任一内容项投放的场景,本申请实施例对该内容项投放场景不做限定。
图2是本申请实施例提供的一种内容项处理方法的流程图。本申请实施例以执行主体为计算机设备为例进行示例性说明,该实施例包括:
201、计算机设备对检索数据进行识别处理,得到该检索数据的检索意图信息,该检索意图信息用于表示该检索数据的检索意图。
其中,检索数据是用户输入的、用于检索目的的数据。本申请实施例中,对检索数据进行识别处理,是为了识别检索数据的检索意图,得到该检索数据的检索意图信息。该检索意图信息用于表示该检索数据的检索意图,该检索意图用于表示用户输入检索信息到底想要检索什么信息。例如,检索数据“景点A从几点至几点开门”,该检索数据的检索意图是“景点A的营业时间”。
202、计算机设备基于该检索意图信息,生成与该检索数据匹配的内容项。
本申请实施例中,在获取用户的检索意图信息之后,可以基于该检索意图信息,生成与该检索数据匹配的内容项,也就是说,根据用户的检索意图信息,生成符合该检索意图要求的内容项,该内容项即是与检索数据匹配的内容项。
203、计算机设备基于该检索数据,对该内容项进行投放。
在生成内容项之后,计算机设备可以基于该检索数据,对该内容项进行投放,由于该内容项是基于检索数据的检索意图信息生成的,因此该检索数据符合用户的检索意图,将该内容项投放给用户可以满足用户的检索意图,还避免了在匹配的检索数据中未投放内容项的情况,提高了内容项的投放效果。
本申请实施例提供的内容项处理方法,能够通过获取检索数据的检索意图信息,来生成适合的内容项,并基于该检索数据对内容项进行投放,既保证了检索数据与内容项匹配,还避免了在匹配的检索数据中未投放内容项的情况,提高了投放效果。
需要说明的是,本申请实施例提供的内容项处理方法可以应用于在线场景,也可以应用于离线场景。本申请实施例应用于在线场景时,计算机设备基于该检索数据,对内容项进行投放,包括:将该内容项作为该检索数据对应的检索结果进行展示。本申请实施例应用于离线场景时,计算机设备基于该检索数据,对内容项进行投放,包括:将该检索数据作为该内容项的投放数据;响应于检索操作,获取被输入的检索数据;在被输入的检索数据与投放数据匹配的情况下,在展示该检索数据的检索结果时,展示该内容项。本申请实施例以图3为例,对在线场景进行示例性说明。
图3是本申请实施例提供的一种内容项处理方法的流程图。本申请实施例以执行主体为计算机设备为例进行示例性说明,该实施例包括:
301、计算机设备获取检索数据。
该检索数据为用户输入的、用于检索的任一条数据,例如,用户在检索框中输入的数据等,本申请实施例对检索数据不做限定,对检索数据的内容也不做限定。例如,该检索数据的内容为“景点A的门票为多少元”、“城市A有什么好玩的地方”等。
302、计算机设备对该检索数据进行识别处理,得到该检索数据的检索意图信息,该检索意图信息用于表示该检索数据的检索意图。
本申请实施例考虑到不同用户的描述习惯不同,所输入的检索数据非常多样化,为了面对不同检索数据都可以为用户提供准确的内容项,本申请实施例会先对用户输入的检索数据进行识别,得到该检索数据的检索意图信息,通过该检索意图信息为用户提供准确的内容项。
本申请实施例中,该检索意图信息可以包括检索数据对应的意图类别、该检索数据对应的业务类别、该检索数据的检索对象等中的至少一项,本申请实施例对该检索意图信息不做限定。
本申请实施例中,将用户的检索意图划分了不同的类别,该意图类别可以是:一日游攻略、自驾游攻略、免费景点、景点开放时间等,本申请实施例对意图类别不做限定,可以根据实际需要进行划分。
本申请实施例中,该检索数据对应的业务类别用于表示符合该检索数据的内容项所属业务的类别,该业务类别可以是旅游、美食、酒店、家装等,该业务类别可以根据实际需要进行划分,本申请实施例对业务类别不做限定。
本申请实施例中,该检索数据的检索对象用于表示检索数据所针对的实体对象。可选地,该检索对象可以是检索数据中实体成分。例如,检索数据为“XX公园的门票是多少钱”,实体成分为“XX公园”,因此,检索对象为“XX公园”。
在一种可能实现方式中,计算机设备对检索数据进行识别处理,得到检索数据的检索意图信息,包括以下至少一项:
(1)检索意图信息包括检索数据对应的意图类别,意图类别用于表示检索数据的检索意图所属的类别;对检索数据进行第一识别处理,得到检索数据对应的意图类别。
需要说明的是,本申请实施例可以采用任一种识别方法来对检索数据进行第一识别处理,得到该检索数据对应的意图类别。本申请实施例对采用的识别方法不做限定,仅是以以下两种方式进行示例性说明。
可选地,计算机设备根据第一关键词来确定检索数据对应的意图类别,该第一关键词可以是经验得到的、按照实际需要划分的、技术人员划分的、计算机设备默认的等,本申请实施例对该第一关键词不做限定。计算机设备对检索数据进行第一识别处理,得到检索数据对应的意图类别,包括:计算机设备获取第一关键词和意图类别的对应关系,基于对应关系中的第一关键词对检索数据进行匹配处理,得到与检索数据匹配的第一关键词,从该对应关系中获取该第一关键词对应的意图类别,将该第一关键词对应的意图类别确定为检索数据对应的意图类别。
可选地,计算机设备通过意图识别模型来进行第一识别处理。计算机设备对检索数据进行第一识别处理,得到检索数据对应的意图类别,包括:计算机设备通过意图识别模型对检索数据进行第一识别处理,得到检索数据对应的意图类别。该意图识别模型是用于识别检索数据的意图类别的模型。可选地,意图识别模型用于从多个意图类别中确定检索数据对应的意图类别。例如,意图识别模型用于确定检索数据属于每个意图类别的概率,将最大概率对应的意图类别确定为该检索数据对应的意图类别。
(2)检索意图信息包括检索数据对应的业务类别,该业务类别表示检索数据的检索对象所属的业务类别,对检索数据进行第二识别处理,得到检索数据对应的业务类别。
需要说明的是,本申请实施例可以采用任一种识别方法来对检索数据进行第二识别处理,得到该检索数据对应的业务类别。本申请实施例对采用的识别方法不做限定,仅是以以下两种方式进行示例性说明。
可选地,计算机设备根据第二关键词来确定检索数据对应的业务类别,该第二关键词可以是经验得到的、按照实际需要划分的、技术人员划分的、计算机设备默认的等,本申请实施例对该第二关键词不做限定。计算机设备对检索数据进行第二识别处理,得到检索数据对应的业务类别,包括:计算机设备获取第二关键词和业务类别的对应关系,基于对应关系中的第二关键词对检索数据进行匹配处理,得到与检索数据匹配的第二关键词,从该对应关系中获取该第二关键词对应的业务类别,将该第二关键词对应的业务类别确定为检索数据对应的业务类别。
可选地,计算机设备通过业务识别模型来进行第二识别处理。计算机设备对检索数据进行第二识别处理,得到检索数据对应的业务类别,包括:计算机设备通过业务识别模型对检索数据进行第二识别处理,得到检索数据对应的业务类别。该业务识别模型是用于识别检索数据的业务类别的模型。可选地,业务识别模型用于从多个业务类别中确定检索数据对应的业务类别。例如,业务识别模型用于确定检索数据属于每个业务类别的概率,将最大概率对应的业务类别确定为该检索数据对应的业务类别。
(3)检索意图信息包括检索数据的检索对象;对检索数据进行第三识别处理,得到检索数据的检索对象。
可选地,计算机设备对检索数据进行第三识别处理,得到检索数据的检索对象,包括:计算机设备获取参考检索对象,将检索数据与参考检索对象进行匹配处理,得到与检索数据匹配的参考检索对象,将该参考检索对象确定为该检索数据的检索对象。
可选地,计算机设备通过对象识别模型来进行第三识别处理。可选地,计算机设备对检索数据进行第三识别处理,得到检索数据的检索对象,包括:计算机设备对检索数据进行分字处理,将分字处理后的检索数据输入到对象识别模型,通过对象识别模型对分字处理后的检索数据进行第三识别处理,得到每个字的成分类别,基于每个字的成分类别确定检索数据的检索对象。
例如,如图4所示,将检索数据中目标成分类别对应的部分作为检索对象。如,检索数据为“红烧鲤鱼多少钱”,对象识别模型会确定出“红烧鲤鱼”的成分是“美食”,将“美食”对应的“红烧鲤鱼”作为该检索数据的检索对象。
需要说明的是,本申请实施例中,对象识别模型可以是bert模型,也可以是其他语音处理模型,本申请实施例对对象识别模型不做限定。
需要说明的是,计算机设备对检索数据进行识别处理,得到检索数据的检索意图信息时,可以执行上述任一个或者多个步骤,本申请实施例对此不做限定,并且,本申请实施例在执行上述一个或者多个步骤时,可以同步执行,也可以按照一定的先后顺序执行,本申请实施例对此不做限定。
在一种可能实现方式中,针对不同的业务类别,划分了不同的意图类别。例如,业务类别为旅游类别,该旅游类别下的意图类别有54种,分别是“一日游攻略”、“自驾游攻略”、“景点免费”、“亲子旅游”、“旅游路线”等。计算机设备先确定检索数据对应的业务类别,再确定检索数据对应的意图类别。可选地,计算机设备对检索数据进行第一识别处理,得到检索数据对应的意图类别,包括:基于检索数据对应的业务类别,对检索数据进行第一识别处理,从业务类别对应的多个意图类别中,确定检索数据对应的意图类别。
其中,对检索数据进行第一识别处理可以通过关键词匹配的方法,也可以通过意图识别模型等方法,本申请实施例对此不做限定,仅是以通过意图识别模型进行第一识别处理为例进行示例性说明。
可选地,计算机设备基于检索数据对应的业务类别,对检索数据进行第一识别处理,从业务类别对应的多个意图类别中,确定检索数据对应的意图类别,包括:计算机设备基于检索数据对应的业务类别,获取该业务类别对应的意图识别模型,通过该意图识别模型对检索数据进行第一识别处理,得到该检索数据的意图类别,任一业务类别对应的意图识别模型用于从该业务类别对应的多个意图类别中确定检索数据对应的意图类别。
可选地,计算机设备基于检索数据对应的业务类别,对检索数据进行第一识别处理,从业务类别对应的多个意图类别中,确定检索数据对应的意图类别,包括:获取意图识别模型,该意图识别模型包括特征提取层、特征处理层和每个业务类别对应的识别层,该业务类别对应的识别层用于从该业务类别对应的多个意图类别中确定检索数据的检索意图所属的意图类别;通过该特征提取层,对该检索数据进行特征提取,得到第一特征数据;通过该特征提取层,对该第一特征数据进行处理,得到第二特征数据;基于该检索数据对应的业务类别,将该第二特征数据输入到该业务类别对应的识别层;通过该识别层,对该第二特征数据进行识别处理,得到该检索数据对应的意图类别。
其中,计算机设备通过该特征提取层,对该检索数据进行特征提取,得到第一特征数据,包括:将该检索数据进行分词处理,得到多个词语字;通过该特征提取层,对该多个词语中的每个词语进行特征提取,得到该每个词语对应的第一特征数据。
计算机设备通过该特征提取层,对该第一特征数据进行处理,得到第二特征数据,包括:对于该每个词语对应的第一特征数据,通过该特征提取层,将该词语对应的第一特征数据与该多个词语中除了该词语之外的其他词语的第一特征数据进行融合处理,得到该词语的第二特征数据。
本申请实施例还提供了意图识别模型的训练方法,其中,意图识别模型的每个识别层通过不同业务类别对应的样本数据进行训练。在一种可能实现方式中,意图识别模型包括多个识别层,多个识别层的数量与业务类别种类的数量相同,且一一对应。计算机设备通过所述意图识别模型,基于所述业务类别,对所述检索数据进行第一识别处理,从所述业务类别对应的多个意图类别中,确定所述检索数据对应的意图类别之前,所述方法还包括:针对每种业务类别,获取该业务类别对应的多个样本数据,该样本数据包括样本检索数据和该样本检索数据对应的样本意图类别;基于每种业务类别对应的多个样本数据,对该意图识别模型中的特征提取层和该业务类别对应的识别层进行训练。
为了提高意图识别模型的训练效率,本申请实施例还提供了另一种意图识别模型的训练方法,先基于全业务类别的样本数据训练好一个识别层之后,将该识别层进行复制,得到每个业务类别对应的识别层,再对每个识别层进行针对性训练。在一种可能实现方式中,计算机设备通过该意图识别模型,基于该业务类别,对该检索数据进行第一识别处理,从该业务类别对应的多个意图类别中,确定该检索数据对应的意图类别之前,该方法还包括:获取多个样本数据,该多个样本数据包括对应不同业务类别的多个样本检索数据和该多个样本检索数据分别对应的样本意图类别;基于该多个样本数据,对初始意图识别模型进行训练,得到包括目标识别层的意图识别模型,该目标识别层为多业务类别对应的识别层;根据业务类别的数量,对该目标识别层进行复制处理,得到每个业务类别对应的识别层;对于每个业务类别对应的识别层,基于对应该类别的多个样本检索数据和该多个样本检索数据对应的样本意图类别,对该业务类别对应的识别层进行训练。该意图识别模型的模型结构可以如图5所示。
另外,本申请实施例在对意图识别模型进行训练的时候,可以增加正样本的数量,减少负样本的数量,以避免意图识别模型的区分度较低。其中,可以采用EDA、Mixup或者欠采样等任一种或者多种方式来实现增加正样本和减少负样本的目的。
可选地,本申请实施例在对意图识别模型进行训练的时候,还可以丰富样本数据中的信息,例如,意图识别模型的输入可以是样本检索数据,也可以是样本检索数据+样本意图类别+样本检索数据的高频模板+匹配信息。其中,匹配信息用于表示样本意图类别是否与样本检索数据匹配,也即是说,该匹配信息用于表示该样本数据是正样本还是负样本。相比于仅输入样本检索数据,能够在一定程度上丰富信息,缓解噪声的影响。
可选地,本申请实施例在获取样本数据时,采用了召回+精排的方式。先通过召回的方式进行粗粒度的划分,再通过精排的方式进行细粒度的划分。这样,后续业务需要扩展新的意图类别时,可以对召回的数据再次进行精细分类即可。
需要说明的是,本申请实施例还可以先确定检索数据对应的业务类别,再确定检索数据对应的检索对象。可选地,计算机设备对检索数据进行第三识别处理,得到检索数据的检索对象,包括:计算机设备基于检索数据对应的业务类别,确定目标成分类别;计算机设备通过对象识别模型确定检索数据中每个字的成分类别;将目标成分类别对应的字确定为检索数据对应的检索对象。
例如,检索数据对应的业务类别为“旅游”,则目标成分类别为“地址”,则将检索数据中的“地址”成分对应的字或词语确定为检索对象。
303、计算机设备基于该检索意图信息,生成与该检索数据匹配的内容项。
通过上述步骤302可知,检索意图信息包括业务类别、检索意图类别和检索对象中的至少一项,因此,计算机设备基于该检索意图信息生成该检索数据匹配的内容项时,可以基于业务类别、意图类别和检索对象中的至少一项,生成与该检索数据匹配的内容项。
本申请实施例分别提供了基于业务类别、意图类别和检索对象,生成内容项的方式。在一种可能实现方式中,该计算机设备基于该检索意图信息,生成与该检索数据匹配的内容项,包括以下至少一项:
(1)基于该意图类别,从第一对应关系中,获取该意图类别对应的文本数据,该第一对应关系为意图类别和文本数据的对应关系,该文本数据为描述内容项的文本数据;基于该文本数据,生成与该检索数据匹配的内容项。
可选地,文本数据是基于模板生成的文本创意,模板是离线挖掘的、与意图类别匹配的模板。可选地,文本数据是离线挖掘的、与意图类别匹配文本数据。可选地,文本数据是技术人员制作的。本申请实施例对文本数据的来源方式不做限定。
可选地,该文本数据包括标题信息和描述信息,该标题信息和描述信息均与意图类别匹配。该第一对应关系如表1所示。
表1
需要说明的是,文本数据中预留有检索对象的位置。例如,表1中的“SCENIC景点”会被替换为检索数据的检索对象。
(2)基于该意图类别,获取与该意图类别匹配的图像数据;基于该图像数据,生成与该检索数据匹配的内容项。
需要说明的是,本申请实施例中内容项可以只包括文本数据,也可以只包括图像数据,还可以包括文本数据和图像数据。本申请实施例对内容项不做限定。
(3)在该检索数据对应的业务类别为目标业务类别的情况下,基于该检索意图信息,生成与该检索数据匹配的内容项,该目标业务类别为待推荐内容项所属的业务类别。
例如,检索数据对应的业务类别是“美食”,则向用户推荐与“美食”相关的内容项。
(4)基于该检索对象,获取该检索对象的链接;基于该检索对象的链接,生成与该检索数据匹配的内容项。
例如,用户输入的检索数据是“景点A的门票是多少钱”,那么该检索数据的检索对象是“景点A”,那么基于“景点A”的门票购买链接生成内容项展示给用户,用户就可以通过该内容项,直接跳转到“景点A”的门票购买界面,这样,用户不仅知道了“景点A”的门票价格,还可以直接购买“景点A”的门票。
在一些实施例中,实体链接是某一应用提供的实体链接,该应用可以提供有多个实体链接,为了更加方便快速地找到检索对应的实体链接,该应用还提供了知识图谱,该知识图谱包括多个实体,且多个实体按照递进的关系排列。例如,知识图谱中实体“xx城市”的下一级实体有“xx城市的xx景点”、“xx城市的xx购物中心”、“xx城市的xx广场”等。
知识图谱中的每个实体都对应有实体链接,本申请实施例中,计算机设备基于检索对象从知识图谱中查找与该检索对象匹配的实体,获取该实体对应的实体链接。计算机设备基于检索对象从知识图谱中查找与检索对象匹配的实体时,可以对知识图谱中的多个实体进行打分,将得分最高的实体作为与检索对象匹配的实体。
其中,f为实体的得分,argmax为一种函数,用于寻找具有最大得分的实体。s表示检索对象的词序列,e表示知识图谱中的实体;q表示检索数据,q-s表示检索数据的上下文,例如,检索数据的输入时间等。P表示概率。E表示知识图谱,Sq表示检索数据的词序列集合。P(e|s)表示检索对象指代实体得分,也就是所,检索对象指代该实体的概率。P(q-s|e)表示实体的上下文得分。
例如,检索对象为“B公园MMM”,检索对象的词序列可以是“B公园”、“MMM”和“B公园MMM”。知识图谱中与这些词序列相关的实体和实体得分如表2所示。
表2
其中,点击分数是基于统计的用户行为得到的。
表1中的“MMM购物公园”得分最高,因此,将“MMM购物公园”作为该检索对象的链接。
304、计算机设备将该内容项作为该检索数据对应的检索结果进行展示。
计算机设备在展示该内容项时,可以将该内容项显示在首位,也可以显示在其他位置,本申请实施例对内容项的显示方式不做限定。
本申请实施例提供的内容项处理方法,通过获取检索数据的检索意图信息,来生成适合的内容项,并基于该检索数据对内容项进行投放,既保证了检索数据与内容项匹配,还避免了在匹配的检索数据中未投放内容项的情况,提高了投放效果。
图6是本申请实施例提供的一种内容项处理方法的流程图。本申请实施例以执行主体为计算机设备为例进行示例性说明,该实施例包括:
601、计算机设备获取多条检索数据。
本申请实施例中,多条检索数据可以是用户输入的、用于检索的数据,也可以是其他能够表示用户所关心信息的数据,也就是说,本申请实施例可以获取用户输入的其他数据作为检索数据。
在一种可能实现方式中,如图7所示,计算机设备获取多条检索数据,包括以下至少一项:
(1)获取用户输入的检索数据。
该检索数据可以是用户在任一应用平台输入的检索数据。例如,用户在应用A中输入的检索数据;又如,用户在应用B中输入的检索数据等。本申请实施例对用户输入的检索数据不做限定。计算机设备可以根据检索记录获取用户输入的检索数据,也可以通过其他方式来获取用户输入的检索数据。
(2)获取已有的投放词,将该已有的投放词作为检索数据。
其中,已有的投放词可以是互联网中已有的投放词,也可以是目标应用正在使用的投放词,还可以是竞对应用正在使用的投放词,本申请实施例对已有的投放词不做限定。
(3)获取用户输入的笔记数据,基于该笔记数据获取检索数据。
用户可以在目标应用中发表自己的笔记,该笔记的内容可以是美食推荐、景点推荐、景点攻略等内容,本申请实施例对笔记的内容不做限定。考虑到笔记中记录的内容不仅是用户想要分享的内容,也是其他用户想要了解的内容,因此,可以基于该笔记数据获取检索数据。例如,某一笔记记录了城市A的旅游攻略,那么基于该笔记可以获取检索数据“城市A有什么好玩的”。
(4)获取榜单数据,将榜单数据确定为检索数据。
目标应用中设置有榜单模块,该榜单模块用于提供目标应用中最热门的多条信息,且该多条信息按照热门程度排列。因此,榜单模块中的榜单数据是用户非常关心的数据,因此,可以将榜单数据确定为检索数据。
(5)获取话题数据,将该话题数据确定为检索数据。
目标应用中设置有话题模块,该话题模块用于提供目标应用中最热门的多个话题,且多个话题按照热门程度排列。因此,话题模块中的话题数据是用户非常关心的数据,因此,可以将话题数据确定为检索数据。
(6)获取商户图谱,基于商户图谱获取检索数据。
商户图谱用于记录入驻目标应用的多个商户,每个商户都提供有对应的服务,用户可以搜索相关商户,并在目标应用中购买该商户提供的相关服务,因此,入驻目标应用的多个商户可以是用户的搜索目标,因此,可以基于商户图谱来获取检索数据。
(7)获取用户原创内容数据,基于该用户原创内容数据获取检索数据。
用户可以在目标应用中发布原创内容数据,这些原创内容数据中可以包括其他用户感兴趣的内容,由于检索数据是用于检索用户感兴趣的内容,因此,可以基于用户原创内容数据来获取检索数据。
在一种可能实现方式中,计算机设备获取多条检索数据,包括:从互联网中获取多条检索数据。可选地,本申请实施例提供的内容项处理方法适用于处理目标应用提供的内容项,如果获取的检索数据与目标应用的业务毫不相干的话,可以将该检索数据丢弃。如图8所示,获取到检索数据之后,确定该检索数据的检索意图与目标应用强相关,弱相关还是不相关。
例如,第一应用是电子商务应用,该第一应用中入驻了多个商家;第二应用为检索平台。第一应用可以从互联网中获取多条检索数据,如果该检索数据的检索意图与第一应用的业务相关,则保留该检索数据;如果该检索数据的检索意图与第一应用的业务毫不相关(如,检索数据用于检索某一歌曲),则将该检索数据丢弃。
602、计算机设备对多条检索数据进行识别处理,得到每条检索数据的检索意图信息。
该步骤602与上述步骤302同理,在此不再一一赘述。
603、计算机设备基于每条检索数据的检索意图信息,确定不同检索意图信息对应的至少一条检索数据。
人们在表达某一含义时,可以采用不同的表达方式,这就造成了不同检索数据可以对应于相同的检索意图信息。上述步骤603实际上就是基于每条检索数据的检索意图信息,将检索数据进行归纳,使得对应于相同检索意图信息的检索数据被归纳到一起。
604、计算机设备基于不同检索意图信息中的每个检索意图信息,生成与该检索意图信息匹配的内容项。
上述步骤604与上述步骤304同理,在此不再一一赘述。
605、计算机设备将该检索意图信息对应的至少一条检索数据确定为与该检索意图信息匹配的内容项的投放数据。
也就是说,本申请实施例中,在得到与某一检索意图信息匹配的内容项之后,会将对应于该检索意图信息的全部检索数据作为该内容项的投放数据,这样,后续用户输入的检索数据与对应于该检索意图信息的任一投放数据匹配时,就可以确定用户的检索意图是该检索意图信息所表示的检索意图,就可以将与该检索意图信息匹配的内容项推荐给该用户。
606、计算机设备响应于检索操作,获取被输入的检索数据。
其中,检索操作是用于触发计算机设备进行检索的操作,该检索操作可以是点击操作、滑动操作、单击操作、双击操作等任一种或者多种操作的组合,本申请实施例对检索操作不做限定。
607、计算机设备在被输入的检索数据与一投放数据匹配的情况下,在展示该检索数据的检索结果时,展示该投放数据对应的内容项。
本申请实施例中,在获取到检索数据之后,会将该检索数据与多条投放数据进行匹配,确定与该检索数据匹配的投放数据,将该投放数据对应的内容项展示给用户。
本申请实施例提供的内容项处理方法,根据检索数据的检索意图信息将大量的检索数据进行了归纳,并将对应于同一检索意图信息的检索数据作为与该检索意图信息匹配的内容项的投放数据,这样,只需用户输入的检索数据与已有的投放数据匹配,即可准确地获取到相应的内容项。由于投放数据是从互联网中获取的大量的检索数据,因此,投放数据是丰富多样的,从而能够更加准确地获取到与输入的检索数据匹配的投放数据,从而更加准确地为用户提供内容项。
图9是本申请实施例提供的一种内容项处理装置结构示意图,参见图9,该装置包括:
识别模块901,用于对检索数据进行识别处理,得到所述检索数据的检索意图信息,所述检索意图信息用于表示所述检索数据的检索意图;
生成模块902,用于基于所述检索意图信息,生成与所述检索数据匹配的内容项;
投放模块903,用于基于所述检索数据,对所述内容项进行投放。
如图10所示,在一种可能实现方式中,所述识别模块901,用于执行以下至少一项:
所述检索意图信息包括所述检索数据对应的意图类别,所述意图类别用于表示所述检索数据的检索意图所属的类别;对所述检索数据进行第一识别处理,得到所述检索数据对应的意图类别;
所述检索意图信息包括所述检索数据对应的业务类别,所述业务类别表示所述检索数据的检索对象所属的业务类别,对所述检索数据进行第二识别处理,得到所述检索数据对应的业务类别;
所述检索意图信息包括所述检索数据的检索对象;对所述检索数据进行第三识别处理,得到所述检索数据的检索对象。
在一种可能实现方式中,所述识别模块901,用于基于所述检索数据对应的业务类别,对所述检索数据进行第一识别处理,从所述业务类别对应的多个意图类别中,确定所述检索数据对应的意图类别。
在一种可能实现方式中,所述识别模块901,包括:
获取单元9011,用于获取意图识别模型,所述意图识别模型包括特征提取层、特征处理层和每个业务类别对应的识别层,所述业务类别对应的识别层用于从所述业务类别对应的多个意图类别中确定检索数据的检索意图所属的意图类别;
第一处理单元9012,用于通过所述特征提取层,对所述检索数据进行特征提取,得到第一特征数据;
第二处理单元9013,用于通过所述特征提取层,对所述第一特征数据进行处理,得到第二特征数据;
输入单元9014,用于基于所述检索数据对应的业务类别,将所述第二特征数据输入到所述业务类别对应的识别层;
第三处理单元9015,用于通过所述识别层,对所述第二特征数据进行识别处理,得到所述检索数据对应的意图类别。
在一种可能实现方式中,所述第一处理单元9012,用于将所述检索数据进行分词处理,得到多个词语字;
所述第一处理单元9012,用于通过所述特征提取层,对所述多个词语中的每个词语进行特征提取,得到所述每个词语对应的第一特征数据;
所述第二处理单元9013,用于对于所述每个词语对应的第一特征数据,通过所述特征提取层,将所述词语对应的第一特征数据与所述多个词语中除了所述词语之外的其他词语的第一特征数据进行融合处理,得到所述词语的第二特征数据。
在一种可能实现方式中,所述装置还包括训练模块904;
所述训练模块904,用于获取多个样本数据,所述多个样本数据包括对应不同业务类别的多个样本检索数据和所述多个样本检索数据分别对应的样本意图类别;
所述训练模块904,用于基于所述多个样本数据,对初始意图识别模型进行训练,得到包括目标识别层的意图识别模型,所述目标识别层为多业务类别对应的识别层;
所述训练模块904,用于根据业务类别的数量,对所述目标识别层进行复制处理,得到每个业务类别对应的识别层;
所述训练模块904,用于对于每个业务类别对应的识别层,基于对应所述类别的多个样本检索数据和所述多个样本检索数据对应的样本意图类别,对所述业务类别对应的识别层进行训练。
在一种可能实现方式中,所述生成模块902用于执行以下至少一项:
基于所述意图类别,从第一对应关系中,获取所述意图类别对应的文本数据,所述第一对应关系为意图类别和文本数据的对应关系,所述文本数据为描述内容项的文本数据;基于所述文本数据,生成与所述检索数据匹配的内容项;
基于所述意图类别,获取与所述意图类别匹配的图像数据;基于所述图像数据,生成与所述检索数据匹配的内容项;
在所述检索数据对应的业务类别为目标业务类别的情况下,基于所述检索意图信息,生成与所述检索数据匹配的内容项,所述目标业务类别为待推荐内容项所属的业务类别;
基于所述检索对象,获取所述检索对象的链接;基于所述检索对象的链接,生成与所述检索数据匹配的内容项。
在一种可能实现方式中,所述检索数据为响应于检索数据获取的检索数据,所述投放模块903,用于将所述内容项作为所述检索数据对应的检索结果进行展示。
在一种可能实现方式中,所述检索数据是从检索记录中获取的检索数据,所述投放模块903,包括:
确定单元9031,用于将所述检索数据作为所述内容项的投放数据;
获取单元9032,用于响应于检索操作,获取被输入的检索数据;
展示单元9033,用于在所述被输入的检索数据与所述投放数据匹配的情况下,在展示所述检索数据的检索结果时,展示所述内容项。
在一种可能实现方式中,所述识别模块901,用于对多条检索数据进行识别处理,得到每条检索数据的检索意图信息;基于所述每条检索数据的检索意图信息,确定不同检索意图信息对应的至少一条检索数据;
所述生成模块902,用于将所述检索意图信息对应的至少一条检索数据确定为与所述检索意图信息匹配的内容项的投放数据。
需要说明的是:上述实施例提供的内容项处理装置在处理内容项时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将计算机设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的内容项处理的装置与内容项处理的方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
在示例性实施例中,提供了一种计算机设备,该计算机设备包括一个或多个处理器和一个或多个存储器,该一个或多个存储器中存储有至少一条程序代码,该至少一条程序代码由该一个或多个处理器加载并执行以实现如上述实施例中的内容项处理方法。
可选地,该计算机设备被提供为终端。图11示出了本申请一个示例性实施例提供的终端1100的结构框图。该终端1100可以是:智能手机、平板电脑、MP3播放器(MovingPicture Experts Group Audio Layer III,动态影像专家压缩标准音频层面3)、MP4(Moving Picture Experts Group Audio Layer IV,动态影像专家压缩标准音频层面4)播放器、笔记本电脑或台式电脑。终端1100还可能被称为用户设备、便携式终端、膝上型终端、台式终端等其他名称。
终端1100包括有:处理器1101和存储器1102。
处理器1101可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器1101可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器1101也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(Central ProcessingUnit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器1101可以在集成有GPU(Graphics Processing Unit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器1101还可以包括AI(Artificial Intelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器1102可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器1102还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器1102中的非暂态的计算机可读存储介质用于存储至少一个程序代码,该至少一个程序代码用于被处理器1101所执行以实现本申请中方法实施例提供的内容项处理方法。
在一些实施例中,终端1100还可选包括有:外围设备接口1103和至少一个外围设备。处理器1101、存储器1102和外围设备接口1103之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口1103相连。具体地,外围设备包括:射频电路1104、显示屏1105、摄像头1106、音频电路1107、定位组件1108和电源1109中的至少一种。
外围设备接口1103可被用于将I/O(Input/Output,输入/输出)相关的至少一个外围设备连接到处理器1101和存储器1102。在一些实施例中,处理器1101、存储器1102和外围设备接口1103被集成在同一芯片或电路板上;在一些其他实施例中,处理器1101、存储器1102和外围设备接口1103中的任意一个或两个可以在单独的芯片或电路板上实现,本实施例对此不加以限定。
射频电路1104用于接收和发射RF(Radio Frequency,射频)信号,也称电磁信号。射频电路1104通过电磁信号与通信网络以及其他通信设备进行通信。射频电路1104将电信号转换为电磁信号进行发送,或者,将接收到的电磁信号转换为电信号。可选地,射频电路1104包括:天线系统、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路1104可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于:城域网、各代移动通信网络(2G、3G、4G及5G)、无线局域网和/或WiFi(Wireless Fidelity,无线保真)网络。在一些实施例中,射频电路1104还可以包括NFC(Near Field Communication,近距离无线通信)有关的电路,本申请对此不加以限定。
显示屏1105用于显示UI(User Interface,用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏1105是触摸显示屏时,显示屏1105还具有采集在显示屏1105的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器1101进行处理。此时,显示屏1105还可以用于提供虚拟按钮和/或虚拟键盘,也称软按钮和/或软键盘。在一些实施例中,显示屏1105可以为一个,设置终端1100的前面板;在另一些实施例中,显示屏1105可以为至少两个,分别设置在终端1100的不同表面或呈折叠设计;在再一些实施例中,显示屏1105可以是柔性显示屏,设置在终端1100的弯曲表面上或折叠面上。甚至,显示屏1105还可以设置成非矩形的不规则图形,也即异形屏。显示屏1105可以采用LCD(Liquid Crystal Display,液晶显示屏)、OLED(Organic Light-Emitting Diode,有机发光二极管)等材质制备。
摄像头组件1106用于采集图像或视频。可选地,摄像头组件1106包括前置摄像头和后置摄像头。前置摄像头设置在终端的前面板,后置摄像头设置在终端的背面。在一些实施例中,后置摄像头为至少两个,分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种,以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及VR(Virtual Reality,虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中,摄像头组件1106还可以包括闪光灯。闪光灯可以是单色温闪光灯,也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合,可以用于不同色温下的光线补偿。
音频电路1107可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波,并将声波转换为电信号输入至处理器1101进行处理,或者输入至射频电路1104以实现语音通信。出于立体声采集或降噪的目的,麦克风可以为多个,分别设置在终端1100的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器1101或射频电路1104的电信号转换为声波。扬声器可以是传统的薄膜扬声器,也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时,不仅可以将电信号转换为人类可听见的声波,也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中,音频电路1107还可以包括耳机插孔。
定位组件1108用于定位终端1100的当前地理位置,以实现导航或LBS(LocationBased Service,基于位置的服务)。定位组件1108可以是基于美国的GPS(GlobalPositioning System,全球定位系统)、中国的北斗系统、俄罗斯的格雷纳斯系统或欧盟的伽利略系统的定位组件。
电源1109用于为终端1100中的各个组件进行供电。电源1109可以是交流电、直流电、一次性电池或可充电电池。当电源1109包括可充电电池时,该可充电电池可以支持有线充电或无线充电。该可充电电池还可以用于支持快充技术。
在一些实施例中,终端1100还包括有一个或多个传感器1110。该一个或多个传感器1110包括但不限于:加速度传感器1111、陀螺仪传感器1112、压力传感器1113、指纹传感器1114、光学传感器1115以及接近传感器1116。
加速度传感器1111可以检测以终端1100建立的坐标系的三个坐标轴上的加速度大小。比如,加速度传感器1111可以用于检测重力加速度在三个坐标轴上的分量。处理器1101可以根据加速度传感器1111采集的重力加速度信号,控制显示屏1105以横向视图或纵向视图进行用户界面的显示。加速度传感器1111还可以用于游戏或者用户的运动数据的采集。
陀螺仪传感器1112可以检测终端1100的机体方向及转动角度,陀螺仪传感器1112可以与加速度传感器1111协同采集用户对终端1100的3D动作。处理器1101根据陀螺仪传感器1112采集的数据,可以实现如下功能:动作感应(比如根据用户的倾斜操作来改变UI)、拍摄时的图像稳定、游戏控制以及惯性导航。
压力传感器1113可以设置在终端1100的侧边框和/或显示屏1105的下层。当压力传感器1113设置在终端1100的侧边框时,可以检测用户对终端1100的握持信号,由处理器1101根据压力传感器1113采集的握持信号进行左右手识别或快捷操作。当压力传感器1113设置在显示屏1105的下层时,由处理器1101根据用户对显示屏1105的压力操作,实现对UI界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。
指纹传感器1114用于采集用户的指纹,由处理器1101根据指纹传感器1114采集到的指纹识别用户的身份,或者,由指纹传感器1114根据采集到的指纹识别用户的身份。在识别出用户的身份为可信身份时,由处理器1101授权该用户执行相关的敏感操作,该敏感操作包括解锁屏幕、查看加密信息、下载软件、支付及更改设置等。指纹传感器1114可以被设置终端1100的正面、背面或侧面。当终端1100上设置有物理按键或厂商Logo时,指纹传感器1114可以与物理按键或厂商Logo集成在一起。
光学传感器1115用于采集环境光强度。在一个实施例中,处理器1101可以根据光学传感器1115采集的环境光强度,控制显示屏1105的显示亮度。具体地,当环境光强度较高时,调高显示屏1105的显示亮度;当环境光强度较低时,调低显示屏1105的显示亮度。在另一个实施例中,处理器1101还可以根据光学传感器1115采集的环境光强度,动态调整摄像头组件1106的拍摄参数。
接近传感器1116,也称距离传感器,设置在终端1100的前面板。接近传感器1116用于采集用户与终端1100的正面之间的距离。在一个实施例中,当接近传感器1116检测到用户与终端1100的正面之间的距离逐渐变小时,由处理器1101控制显示屏1105从亮屏状态切换为息屏状态;当接近传感器1116检测到用户与终端1100的正面之间的距离逐渐变大时,由处理器1101控制显示屏1105从息屏状态切换为亮屏状态。
本领域技术人员可以理解,图11中示出的结构并不构成对终端1100的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。
可选地,该计算机设备被提供为服务器。图12是本申请实施例提供的一种服务器的结构示意图,该服务器1200可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(Central Processing Units,CPU)1201和一个或一个以上的存储器1202,其中,该存储器1202中存储有至少一条程序代码,该至少一条程序代码由该处理器1201加载并执行以实现上述各个方法实施例提供的方法。当然,该服务器还可以具有有线或无线网络接口、键盘以及输入输出接口等部件,以便进行输入输出,该服务器还可以包括其他用于实现设备功能的部件,在此不做赘述。
该服务器1200用于执行上述方法实施例中服务器所执行的步骤。
在示例性实施例中,还提供了一种计算机可读存储介质,例如包括程序代码的存储器,上述程序代码可由计算机设备中的处理器执行以完成上述实施例中的内容项处理方法。例如,该计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
在示例性实施例中,还提供了一种计算机程序或计算机程序产品,该计算机程序或计算机程序产品包括计算机程序代码,该计算机程序代码被计算机执行时,使得计算机实现上述实施例中的内容项处理方法。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,该程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本申请的可选实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (13)
1.一种内容项处理方法,其特征在于,所述方法包括:
对检索数据进行识别处理,得到所述检索数据的检索意图信息,所述检索意图信息用于表示所述检索数据的检索意图;
基于所述检索意图信息,生成与所述检索数据匹配的内容项;
基于所述检索数据,对所述内容项进行投放。
2.根据权利要求1所述的方法,其特征在于,所述对检索数据进行识别处理,得到所述检索数据的检索意图信息,包括以下至少一项:
所述检索意图信息包括所述检索数据对应的意图类别,所述意图类别用于表示所述检索数据的检索意图所属的类别;对所述检索数据进行第一识别处理,得到所述检索数据对应的意图类别;
所述检索意图信息包括所述检索数据对应的业务类别,所述业务类别表示所述检索数据的检索对象所属的业务类别,对所述检索数据进行第二识别处理,得到所述检索数据对应的业务类别;
所述检索意图信息包括所述检索数据的检索对象;对所述检索数据进行第三识别处理,得到所述检索数据的检索对象。
3.根据权利要求2所述的方法,所述对所述检索数据进行第一识别处理,得到所述检索数据对应的意图类别,包括:
基于所述检索数据对应的业务类别,对所述检索数据进行第一识别处理,从所述业务类别对应的多个意图类别中,确定所述检索数据对应的意图类别。
4.根据权利要求3所述的方法,其特征在于,所述基于所述检索数据对应的业务类别,对所述检索数据进行第一识别处理,从所述业务类别对应的多个意图类别中,确定所述检索数据对应的意图类别,包括:
获取意图识别模型,所述意图识别模型包括特征提取层、特征处理层和每个业务类别对应的识别层,所述业务类别对应的识别层用于从所述业务类别对应的多个意图类别中确定检索数据的检索意图所属的意图类别;
通过所述特征提取层,对所述检索数据进行特征提取,得到第一特征数据;
通过所述特征提取层,对所述第一特征数据进行处理,得到第二特征数据;
基于所述检索数据对应的业务类别,将所述第二特征数据输入到所述业务类别对应的识别层;
通过所述识别层,对所述第二特征数据进行识别处理,得到所述检索数据对应的意图类别。
5.根据权利要求4所述的方法,其特征在于,所述通过所述特征提取层,对所述检索数据进行特征提取,得到第一特征数据,包括:
将所述检索数据进行分词处理,得到多个词语字;
通过所述特征提取层,对所述多个词语中的每个词语进行特征提取,得到所述每个词语对应的第一特征数据;
所述通过所述特征提取层,对所述第一特征数据进行处理,得到第二特征数据,包括:
对于所述每个词语对应的第一特征数据,通过所述特征提取层,将所述词语对应的第一特征数据与所述多个词语中除了所述词语之外的其他词语的第一特征数据进行融合处理,得到所述词语的第二特征数据。
6.根据权利要求4所述的方法,其特征在于,所述通过所述意图识别模型,基于所述业务类别,对所述检索数据进行第一识别处理,从所述业务类别对应的多个意图类别中,确定所述检索数据对应的意图类别之前,所述方法还包括:
获取多个样本数据,所述多个样本数据包括对应不同业务类别的多个样本检索数据和所述多个样本检索数据分别对应的样本意图类别;
基于所述多个样本数据,对初始意图识别模型进行训练,得到包括目标识别层的意图识别模型,所述目标识别层为多业务类别对应的识别层;
根据业务类别的数量,对所述目标识别层进行复制处理,得到每个业务类别对应的识别层;
对于每个业务类别对应的识别层,基于对应所述类别的多个样本检索数据和所述多个样本检索数据对应的样本意图类别,对所述业务类别对应的识别层进行训练。
7.根据权利要求2所述的方法,其特征在于,所述基于所述检索意图信息,生成与所述检索数据匹配的内容项,包括以下至少一项:
基于所述意图类别,从第一对应关系中,获取所述意图类别对应的文本数据,所述第一对应关系为意图类别和文本数据的对应关系,所述文本数据为描述内容项的文本数据;基于所述文本数据,生成与所述检索数据匹配的内容项;
基于所述意图类别,获取与所述意图类别匹配的图像数据;基于所述图像数据,生成与所述检索数据匹配的内容项;
在所述检索数据对应的业务类别为目标业务类别的情况下,基于所述检索意图信息,生成与所述检索数据匹配的内容项,所述目标业务类别为待推荐内容项所属的业务类别;
基于所述检索对象,获取所述检索对象的链接;基于所述检索对象的链接,生成与所述检索数据匹配的内容项。
8.根据权利要求1所述的方法,其特征在于,所述检索数据为响应于检索数据获取的检索数据,所述基于所述检索数据,对所述内容项进行投放,包括:
将所述内容项作为所述检索数据对应的检索结果进行展示。
9.根据权利要求1所述的方法,其特征在于,所述检索数据是从检索记录中获取的检索数据,所述基于所述检索数据,对所述内容项进行投放,包括:
将所述检索数据作为所述内容项的投放数据;
响应于检索操作,获取被输入的检索数据;
在所述被输入的检索数据与所述投放数据匹配的情况下,在展示所述检索数据的检索结果时,展示所述内容项。
10.根据权利要求9所述的方法,其特征在于,所述对检索数据进行识别处理,得到所述检索数据的检索意图信息,包括:
对多条检索数据进行识别处理,得到每条检索数据的检索意图信息;
基于所述每条检索数据的检索意图信息,确定不同检索意图信息对应的至少一条检索数据;
所述基于所述检索意图信息,生成与所述检索数据匹配的内容项,包括:
基于所述不同检索意图信息中的每个检索意图信息,生成与所述检索意图信息匹配的内容项;
所述将所述检索数据作为所述内容项的投放数据,包括:
将所述检索意图信息对应的至少一条检索数据确定为与所述检索意图信息匹配的内容项的投放数据。
11.一种内容项处理装置,其特征在于,所述装置包括:
识别模块,用于对检索数据进行识别处理,得到所述检索数据的检索意图信息,所述检索意图信息用于表示所述检索数据的检索意图;
生成模块,用于基于所述检索意图信息,生成与所述检索数据匹配的内容项;
投放模块,用于基于所述检索数据,对所述内容项进行投放。
12.一种计算机设备,其特征在于,所述计算机设备包括一个或多个处理器和一个或多个存储器,所述一个或多个存储器中存储有至少一条程序代码,所述至少一条程序代码由所述一个或多个处理器加载并执行以实现如权利要求1至权利要求10任一项所述的内容项处理方法所执行的操作。
13.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一条程序代码,所述至少一条程序代码由处理器加载并执行以实现如权利要求1至权利要求10任一项所述的内容项处理方法所执行的操作。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210553981.7A CN114996573A (zh) | 2022-05-19 | 2022-05-19 | 内容项处理方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210553981.7A CN114996573A (zh) | 2022-05-19 | 2022-05-19 | 内容项处理方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114996573A true CN114996573A (zh) | 2022-09-02 |
Family
ID=83027702
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210553981.7A Pending CN114996573A (zh) | 2022-05-19 | 2022-05-19 | 内容项处理方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114996573A (zh) |
-
2022
- 2022-05-19 CN CN202210553981.7A patent/CN114996573A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111652678B (zh) | 物品信息显示方法、装置、终端、服务器及可读存储介质 | |
CN110061900B (zh) | 消息显示方法、装置、终端及计算机可读存储介质 | |
CN110163066B (zh) | 多媒体数据推荐方法、装置及存储介质 | |
CN110572716B (zh) | 多媒体数据播放方法、装置及存储介质 | |
CN113411680B (zh) | 多媒体资源播放方法、装置、终端及存储介质 | |
WO2022057435A1 (zh) | 基于搜索的问答方法及存储介质 | |
CN111711838B (zh) | 视频切换方法、装置、终端、服务器及存储介质 | |
CN111031391A (zh) | 视频配乐方法、装置、服务器、终端及存储介质 | |
CN112052354A (zh) | 视频推荐方法、视频展示方法、装置及计算机设备 | |
CN114238812B (zh) | 信息展示方法、装置、计算机设备及介质 | |
CN109547847B (zh) | 添加视频信息的方法、装置及计算机可读存储介质 | |
CN113032587A (zh) | 多媒体信息推荐方法、系统、装置、终端和服务器 | |
CN110929159B (zh) | 资源投放方法、装置、设备及介质 | |
CN112069350A (zh) | 歌曲推荐方法、装置、设备以及计算机存储介质 | |
CN112764600A (zh) | 资源处理方法、装置、存储介质及计算机设备 | |
CN111563201A (zh) | 内容推送方法、装置、服务器及存储介质 | |
CN113987326B (zh) | 资源推荐方法、装置、计算机设备及介质 | |
CN113377271A (zh) | 文本获取方法、装置、计算机设备及介质 | |
CN110717110B (zh) | 多媒体资源过滤方法、装置、电子设备及存储介质 | |
CN110808985B (zh) | 歌曲点播方法、装置、终端、服务器及存储介质 | |
CN109635153B (zh) | 迁移路径生成方法、装置及存储介质 | |
CN112100437A (zh) | 图像处理方法、装置、电子设备及计算机可读存储介质 | |
CN112230822A (zh) | 评论信息的显示方法、装置、终端及存储介质 | |
CN111858983A (zh) | 图片类别的确定方法、装置、电子设备及存储介质 | |
CN114996573A (zh) | 内容项处理方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |