CN114881722A - 基于热点的旅游产品匹配方法、系统、设备及存储介质 - Google Patents

基于热点的旅游产品匹配方法、系统、设备及存储介质 Download PDF

Info

Publication number
CN114881722A
CN114881722A CN202210377392.8A CN202210377392A CN114881722A CN 114881722 A CN114881722 A CN 114881722A CN 202210377392 A CN202210377392 A CN 202210377392A CN 114881722 A CN114881722 A CN 114881722A
Authority
CN
China
Prior art keywords
travel
news information
user
news
media file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210377392.8A
Other languages
English (en)
Inventor
刘洋
孙玉霞
何蜀波
孙健卿
林立韵
邹宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ctrip Travel Information Technology Shanghai Co Ltd
Original Assignee
Ctrip Travel Information Technology Shanghai Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ctrip Travel Information Technology Shanghai Co Ltd filed Critical Ctrip Travel Information Technology Shanghai Co Ltd
Priority to CN202210377392.8A priority Critical patent/CN114881722A/zh
Publication of CN114881722A publication Critical patent/CN114881722A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/355Class or cluster creation or modification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/14Travel agencies

Abstract

本发明提供了基于热点的旅游产品匹配方法、系统、设备及存储介质,该方法包括:通过分类模型自预设时段内的新闻信息集合中获得符合旅游主题的新闻信息;至少基于下属于同一旅游主题的新闻信息的数量以及新闻信息的至少一交互参数,获得旅游主题的热度参数;至少根据旅游主题向推送对应的用户包含至少一新闻信息和相关旅游产品信息的媒体文件包;至少基于用户阅读媒体文件包中新闻信息的状态参数,向用户推送相关旅游产品信息。本发明能够对站内外的新闻进行标签化入库,方便OTA平台按需用于推介场景,便于关注到较为实时的旅游热点动态,及时推送文旅活动,提高旅游产品的购买率。

Description

基于热点的旅游产品匹配方法、系统、设备及存储介质
技术领域
本发明涉及在线旅游领域,具体地说,涉及基于热点的旅游产品匹配方法、系统、设备及存储介质。
背景技术
在线旅游(Online Travel Agency),是旅游电子商务行业的专业词语。指“旅游消费者通过网络向旅游服务提供商预定旅游产品或服务,并通过网上支付或者线下付费,即各旅游主体可以通过网络进行产品营销或产品销售”。OTA的出现将原来传统的旅行社销售模式放到网络平台上,更广泛的传递了线路信息,互动式的交流更方便了客人的咨询和订购。
当前各大门户、资讯平台、电商app、内容app都在显著位置或者板块展示热门内容或者商品,用以抓住用户眼球,吸引用户注意。快速获取大众在搜什么、在看什么,在关注什么话题是众多内容平台需要挖掘的点,信息流应用能否快速发现热点、引流用户阅读热点,是影响用户体验的重要因素。内容平台能否引导用户放大扩散优质热点、改造重创作热点,是扩大内容营销、扩展内容生态的关键。
热点挖掘是OTA内容平台向用户展示热门吃喝玩乐住等旅游场景的关键技术之一。快速准确地获取站内外用户上传内容、结构化分析数据、聚合话题并按热度排序并进行内容审核和结构化信息存储是OTA平台面临的一大挑战。
并且,目前的产品推送的时间点相对随机,仅仅是在用户打开相关APP时进行产品信息的推送,或者是仅收集用户的历史数据进行标签后定时进行产品信息的推送,但当所有平台都进行同样形式的推送以后,用户的购买产品的冲动被大量的广告反复冲击而麻痹了,用户基于传统信息推送的购买率在逐渐下降。
因此,本发明提供了一种基于热点的旅游产品匹配方法、系统、设备及存储介质。
发明内容
针对现有技术中的问题,本发明的目的在于提供基于热点的旅游产品匹配方法、系统、设备及存储介质,克服了现有技术的困难,能够对站内外的新闻进行标签化入库,方便OTA平台按需用于推介场景,便于关注到较为实时的旅游热点动态,及时推送文旅活动,提高旅游产品的购买率。
本发明的实施例提供一种基于热点的旅游产品匹配方法,包括以下步骤:
通过分类模型自预设时段内的新闻信息集合中获得符合旅游主题的新闻信息;
至少基于下属于同一所述旅游主题的新闻信息的数量以及所述新闻信息的至少一交互参数,获得所述旅游主题的热度参数;
至少根据所述旅游主题向推送对应的用户包含至少一新闻信息和相关旅游产品信息的媒体文件包;以及
至少基于所述用户阅读所述媒体文件包中新闻信息的状态参数,向用户推送相关旅游产品信息。
优选地,所述通过分类模型自预设时段内的新闻信息集合中获得符合旅游主题的新闻信息,包括:
基于第一分类模型获得具有旅游标签的新闻信息;
基于第二分类模型对新闻信息进行旅游主题分类;以及
基于第三分类模型对同一旅游主题下属的新闻作聚类分析,获得每个所述主题下的不同话题簇。
优选地,所述基于第一分类模型获得具有旅游标签的新闻信息中,包括:
将具有确定的旅游标签的部分数据作为训练语料,训练初始模型;
将海量各种来源的新闻、文章数据使用文本检索模型提取语义特征做检索库;
根据有标签的坏案例提取其语义特征作为查询特点,计算查询特点与检索库中的每一个特征的相似度;
设置相似度阈值,取相似度高的检索标题,自动打上坏案例标注过的标签作为伪标签与原始有确定的旅游标签的训练集混合,重新训练模型,其中,伪标签构建模型的损失函数如下:
Figure BDA0003590786710000031
其中n为数据量的批尺寸,C为预设类别数,y为有标签数据预测得到的伪标签,f是直接取网络对有标签数据的预测的最大值为标签,y'为无标签数据预测得到的伪标签,f'是直接取网络对无标签数据的预测的最大值为标签,α(t)为预设变量。
优选地,所述至少基于下属于同一所述旅游主题的新闻信息的数量以及所述新闻信息的至少一交互参数,获得所述旅游主题的热度参数中,包括:
建立属于同一所述旅游主题的新闻信息子集合;
获得所述新闻信息子集合内每个所述新闻信息的交互参数集合,所述交互参数集合至少包括所述新闻信息被阅读、转发、点赞、收藏的次数;以及
根据加权算法基于所述交互参数集合,获得所述新闻信息子集合的热度参数。
优选地,所述至少根据所述旅游主题向推送对应的用户包含至少一新闻信息和相关旅游产品信息的媒体文件包中,包括:
根据所述用户的历史阅读数据和/或历史旅游数据获得所述用户的旅游标签;
根据所述用户的旅游标签获得该所述旅游标签下热度参数最高的N个新闻信息;
根据所述新闻信息进行语义分析获得旅游类关键词,所述旅游类关键词包括旅游景点、项目类别或是旅游季节;
根据所述旅游标签和旅游类关键词匹配至少一旅游产品;以及
生成一媒体文件包,所述媒体文件包中包括若干新闻信息以及对应每个所述新闻信息的所述旅游产品。
优选地,所述媒体文件包包括一个展示新闻信息题目的目录,每个所述新闻信息题目对应一新闻信息的文本。
优选地,所述至少基于所述用户阅读所述媒体文件包中新闻信息的状态参数,向用户推送相关旅游产品信息中,包括:
采集用户阅读媒体文件包的状态参数,所述状态参数至少包括用户阅读所述阅读中每条所述新闻信息的阅读时间和/或交互参数;
基于所述阅读时间和状态参数获得所述用户对所述媒体文件包中的所述新闻信息的交互参数;以及
当所述新闻信息的交互参数满足预设阈值,则将所述新闻信息对应的旅游产品展示在所述媒体文件包中与所述新闻信息的展示页面中。
优选地,所述至少基于所述用户阅读所述媒体文件包中新闻信息的状态参数,向用户推送相关旅游产品信息中,包括:
采集用户阅读媒体文件包的状态参数,所述状态参数至少包括用户阅读所述阅读中每条所述新闻信息的阅读时间和/或交互参数;
基于所述阅读时间和状态参数获得所述用户对所述媒体文件包中的所述新闻信息的交互参数并进行排序;以及
将所述交互参数最高的所述新闻信息对应的旅游产品展示在所述媒体文件包中与所述新闻信息的目录页面中。
优选地,所述至少基于所述用户阅读所述媒体文件包中新闻信息的状态参数,向用户推送相关旅游产品信息中,包括:
提供一展示页面以展示所述媒体文件包的所有新闻信息的文本;
采集用户阅读媒体文件包的中每条所述新闻信息的阅读时间;以及
当展示页面被下拉到底部时,根据所述阅读时间最长的新闻信息对应的旅游产品展示在所述展示页面的底部。
本发明的实施例还提供一种基于热点的旅游产品匹配系统,用于实现上述的基于热点的旅游产品匹配方法,所述基于热点的旅游产品匹配系统包括:
新闻分类模块,通过分类模型自预设时段内的新闻信息集合中获得符合旅游主题的新闻信息;
交互参数模块,至少基于下属于同一所述旅游主题的新闻信息的数量以及所述新闻信息的至少一交互参数,获得所述旅游主题的热度参数;
媒体文件模块,至少根据所述旅游主题向推送对应的用户包含至少一新闻信息和相关旅游产品信息的媒体文件包;以及
旅游产品模块,至少基于所述用户阅读所述媒体文件包中新闻信息的状态参数,向用户推送相关旅游产品信息。
本发明的实施例还提供一种基于热点的旅游产品匹配设备,包括:
处理器;
存储器,其中存储有所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行上述基于热点的旅游产品匹配方法的步骤。
本发明的实施例还提供一种计算机可读存储介质,用于存储程序,所述程序被执行时实现上述基于热点的旅游产品匹配方法的步骤。
本发明的目的在于提供基于热点的旅游产品匹配方法、系统、设备及存储介质,能够对站内外的新闻进行标签化入库,方便OTA平台按需用于推介场景,便于关注到较为实时的旅游热点动态,及时推送文旅活动,提高旅游产品的购买率。
附图说明
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显。
图1是本发明的基于热点的旅游产品匹配方法的流程图。
图2至5是本发明的基于热点的旅游产品匹配方法的实施过程示意图。
图6是本发明的基于热点的旅游产品匹配系统的模块示意图。
图7是本发明的基于热点的旅游产品匹配设备的结构示意图。
图8是本发明一实施例的计算机可读存储介质的结构示意图。
具体实施方式
以下通过特定的具体实例说明本申请的实施方式,本领域技术人员可由本申请所揭露的内容轻易地了解本申请的其他优点与功效。本申请还可以通过另外不同的具体实施方式加以实施或应用系统,本申请中的各项细节也可以根据不同观点与应用系统,在没有背离本申请的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
下面以附图为参考,针对本申请的实施例进行详细说明,以便本申请所属技术领域的技术人员能够容易地实施。本申请可以以多种不同形态体现,并不限定于此处说明的实施例。
在本申请的表示中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的表示意指结合该实施例或示例表示的具体特征、结构、材料或者特点包括于本申请的至少一个实施例或示例中。而且,表示的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本申请中表示的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于表示目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或隐含地包括至少一个该特征。在本申请的表示中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
为了明确说明本申请,省略与说明无关的器件,对于通篇说明书中相同或类似的构成要素,赋予了相同的参照符号。
在通篇说明书中,当说某器件与另一器件“连接”时,这不仅包括“直接连接”的情形,也包括在其中间把其它元件置于其间而“间接连接”的情形。另外,当说某种器件“包括”某种构成要素时,只要没有特别相反的记载,则并非将其它构成要素排除在外,而是意味着可以还包括其它构成要素。
当说某器件在另一器件“之上”时,这可以是直接在另一器件之上,但也可以在其之间伴随着其它器件。当对照地说某器件“直接”在另一器件“之上”时,其之间不伴随其它器件。
虽然在一些实例中术语第一、第二等在本文中用来表示各种元件,但是这些元件不应当被这些术语限制。这些术语仅用来将一个元件与另一个元件进行区分。例如,第一接口及第二接口等表示。再者,如同在本文中所使用的,单数形式“一”、“一个”和“该”旨在也包括复数形式,除非上下文中有相反的指示。应当进一步理解,术语“包含”、“包括”表明存在的特征、步骤、操作、元件、组件、项目、种类、和/或组,但不排除一个或多个其他特征、步骤、操作、元件、组件、项目、种类、和/或组的存在、出现或添加。此处使用的术语“或”和“和/或”被解释为包括性的,或意味着任一个或任何组合。因此,“A、B或C”或者“A、B和/或C”意味着“以下任一个:A;B;C;A和B;A和C;B和C;A、B和C”。仅当元件、功能、步骤或操作的组合在某些方式下内在地互相排斥时,才会出现该定义的例外。
此处使用的专业术语只用于言及特定实施例,并非意在限定本申请。此处使用的单数形态,只要语句未明确表示出与之相反的意义,那么还包括复数形态。在说明书中使用的“包括”的意义是把特定特性、区域、整数、步骤、作业、要素及/或成份具体化,并非排除其它特性、区域、整数、步骤、作业、要素及/或成份的存在或附加。
虽然未不同地定义,但包括此处使用的技术术语及科学术语,所有术语均具有与本申请所属技术领域的技术人员一般理解的意义相同的意义。普通使用的字典中定义的术语追加解释为具有与相关技术文献和当前提示的内容相符的意义,只要未进行定义,不得过度解释为理想的或非常公式性的意义。
图1是本发明的基于热点的旅游产品匹配方法的流程图。如图1所示,本发明的实施例提供一种基于热点的旅游产品匹配方法,包括以下步骤:
S110、通过分类模型自预设时段内的新闻信息集合中获得符合旅游主题的新闻信息。
S120、至少基于下属于同一旅游主题的新闻信息的数量以及新闻信息的至少一交互参数,获得旅游主题的热度参数。
S130、至少根据旅游主题向推送对应的用户包含至少一新闻信息和相关旅游产品信息的媒体文件包。以及
S140、至少基于用户阅读媒体文件包中新闻信息的状态参数,向用户推送相关旅游产品信息。
本发明一种基于Transformer的旅游热点新闻识别方法和存储介质,用于OTA行业的文本理解以进行结构化存储。本发明提供了一种基于文本分类和文本聚类的旅游热点挖掘方法,其改进之处是利用nlp(自然语言处理)领域中广泛使用到的Transformer技术做文本分类模型,得到大量的属于旅游领域的新闻,然后使用文本聚类技术,得到不同主题下下的若干新闻,本发明能够聚合某一旅游主题下同一属性的话题,通过主题热度、话题热度、新闻本体热度属性等多方面的热度属性来综合评价旅游新闻的热度并作排序展示,从而使得包含信息量丰富的旅游图像识别得更准确,同时,Transformer结构能较为方便融入多模态信息(如文本信息、图像信息、表情符信息)进行多模态学习,得到更为准确更为丰富的新闻标签信息。其中,Transformer模型是谷歌大脑在2017年底发表的论文Attention Is AllYou Need中所提出seq2seq模型。而Transformer这个seq2seq模型的特别之处是模型当中大量用到了Self-Attention这种特别的Layer。
在一个优选实施例中,步骤S110中,包括:
S111、基于第一分类模型获得具有旅游标签的新闻信息。
S112、基于第二分类模型对新闻信息进行旅游主题分类。
S113、基于第三分类模型对同一旅游主题下属的新闻作聚类分析,获得每个主题下的不同话题簇。
在一个优选实施例中,步骤S111中,包括:
将具有确定的旅游标签的部分数据作为训练语料,训练初始模型。
将海量各种来源的新闻、文章数据使用文本检索模型提取语义特征做检索库。
根据有标签的坏案例提取其语义特征作为查询特点,计算查询特点与检索库中的每一个特征的相似度。
设置相似度阈值,取相似度高的检索标题,自动打上坏案例标注过的标签作为伪标签与原始有确定的旅游标签的训练集混合,重新训练模型,其中,伪标签构建模型的损失函数如下:
Figure BDA0003590786710000091
其中n为数据量的批尺寸,C为预设类别数,y为有标签数据预测得到的伪标签,f是直接取网络对有标签数据的预测的最大值为标签,y'为无标签数据预测得到的伪标签,f'是直接取网络对无标签数据的预测的最大值为标签,α(t)为预设变量。
在一个优选实施例中,步骤S120中,包括:
建立属于同一旅游主题的新闻信息子集合。
获得新闻信息子集合内每个新闻信息的交互参数集合,交互参数集合至少包括新闻信息被阅读、转发、点赞、收藏的次数。
根据加权算法基于交互参数集合,获得新闻信息子集合的热度参数。
在一个优选实施例中,步骤S130中,包括:
根据用户的历史阅读数据和/或历史旅游数据获得用户的旅游标签。
根据用户的旅游标签获得该旅游标签下热度参数最高的N个新闻信息。
根据新闻信息进行语义分析获得旅游类关键词,旅游类关键词包括旅游景点、项目类别或是旅游季节。
根据旅游标签和旅游类关键词匹配至少一旅游产品。
生成一媒体文件包,媒体文件包中包括若干新闻信息以及对应每个新闻信息的旅游产品。
在一个优选实施例中,媒体文件包包括一个展示新闻信息题目的目录,每个新闻信息题目对应一新闻信息的文本。
在一个优选实施例中,步骤S140中,包括:
采集用户阅读媒体文件包的状态参数,状态参数至少包括用户阅读每条新闻信息的阅读时间和/或交互参数。
基于阅读时间和状态参数获得用户对媒体文件包中的新闻信息的交互参数。
当新闻信息的交互参数满足预设阈值,则将新闻信息对应的旅游产品展示在媒体文件包中与新闻信息的展示页面中。
在一个优选实施例中,步骤S140中,包括:
采集用户阅读媒体文件包的状态参数,状态参数至少包括用户阅读每条新闻信息的阅读时间和/或交互参数。
基于阅读时间和状态参数获得用户对媒体文件包中的新闻信息的交互参数并进行排序。
将交互参数最高的新闻信息对应的旅游产品展示在媒体文件包中与新闻信息的目录页面中。
在一个优选实施例中,步骤S140中,包括:
提供一展示页面以展示媒体文件包的所有新闻信息的文本。
采集用户阅读媒体文件包的中每条新闻信息的阅读时间。
当展示页面被下拉到底部时,根据阅读时间最长的新闻信息对应的旅游产品展示在展示页面的底部。
本发明要解决的问题在于,利用深度学习中的Transformer技术自动地将新闻分类到所属的标签体系中,对旅游相关的新闻进行结构化信息入库。
在实际文本识别的过程中,是否旅游相关主观性较强,新闻来源差异较大,标题简练,可用信息量少等因素是旅游信息过滤的难点,构建靠谱的旅游信息分类模型是旅游热点获取的关键因素之一。通过细化主题类型,将信息来源细分为娱乐/汽车/体育/游戏/旅游/文化/其他等类别,使用开源语言模型搭建多分类下游任务,预测多个类别,如果类别中包含旅游标签且大于一定阈值,则认为该新闻为旅游相关。
在一个优选实施例中,在训练下游分类模型的时候,本发明在网络中加入特殊的采样策略,对于长短不一,文风不同的训练样本,按照文本长短,文本来源作一下标记,采用的时候按照一定长度阈值,来源分布数量等作加权采样,解决了样本分布不均衡引起的网络不收敛或者是收敛慢的问题。
在一个优选实施例中,利用最终得到的分类模型,能够较好的识别内容丰富的旅游相关文本,并且,Transformer结构能较为方便融入多模态信息(如文本配图、emoji、文章所属的视频信息或者是语音信息)进行多模态学习,得到更为准确更为丰富的图像标签信息。
在一个优选实施例中,得到旅游相关的新闻后,使用bm25算法对新闻作主题分类,将旅游相关的新闻进一步分类成更细粒度的主题,如樱花、滑雪、漂流等。
在一个优选实施例中,得到旅游相关新闻的主题后,使用Infomap算法对同一主题下的新闻作聚类分析,得到同一主题下的不同话题簇,如樱花主题下可能有多个地方举办不同樱花主题活动的话题,并按一定规则选择一条有代表性的新闻标题作为话题标题。
在一个优选实施例中,得到旅游相关新闻的话题后,综合主题分类下的新闻数,话题分类下的新闻数以及新闻本身的点赞、收藏、转发、评论数等相关参数,按照一定的权值计算出某个话题的综合热度得分,并按照热度分排序,得到当天旅游相关热点的榜单。
本发明利用学习好的Transformer模型对站内外的新闻进行标签化入库,方便OTA平台按需用于推介场景,可以大规模应用于旅游推荐,旅游创作等,本发明能关注到较为实时的旅游热点动态,对及时推送文旅活动,推动旅游发展有积极促进作用。
本发明可以通过建立完善的快速迭代模型训练流程:
人工标注部分确定标签的部分数据作为训练语料,训练初始模型,预测线上数据,人工查验坏案例(badcase),打上确定标签。
将海量各种来源的新闻、文章数据使用文本检索模型提取语义特征做检索库,根据有标签的badcase提取其语义特征作为query feature,计算query feature与检索库中的每一个特征的相似度,设置相似度阈值,取相似度高的检索标题,自动打上badcase标注过的标签作为伪标签与原始有确定标签的训练集混合,重新训练模型。
伪标签构建模型的损失函数如下:
Figure BDA0003590786710000111
其中,n为数据量的批尺寸(batchsize),C为预设类别数,y为有标签数据预测得到的伪标签,f是直接取网络对有标签数据的预测的最大值为标签,y'为无标签数据预测得到的伪标签,f'是直接取网络对无标签数据的预测的最大值为标签,α(t)为预设变量。其中α(t)决定着无标签数据的代价在网络更新的作用,选择合适的α(t)很重要,太大性能退化,太小提升有限。
OTA平台旅游热点资讯来源多样,数据时效性也不同步,使用数据适配层构建多源异步数据处理对象,解决不同时间段不同接入源的数据定时标准化输出。
构建主题知识库,使用特定的关键词作为触发词将每天的每个新闻来源分类到不同的主题下,得到每个主题下的主题簇,以主题簇大小衡量主题热度。统计近半月内主题热度的梯度变化用以衡量主题热度攀升指数。
利用语言检索模型提取新闻标题的语义特征,使用语义特征和莱文斯特比结合评价标题与标题的语义相似度。以标题作为节点,标题与标题间的语义相似度为节点间的权重构建无向连接图。使用Infomap社区发现算法获取主题簇下的群组,达到话题聚类的效果。(Infomap的双层编码方式把群组识别同信息编码联系到了一起。一个好的群组划分,可以带来更短的编码。所以,如果能量化编码长度,找到使得长度最短的群组划分,那就找到了一个好的群组划分。)
以话题簇大小衡量话题热度,结合主题热度,主题热度攀升,话题热度,新闻本身点击热度等综合因素,得到话题的综合热门排序,取话题中表述完整优美的标题作为话题标题展示。
本发明的具体实施方式如下:
图2至5是本发明的基于热点的旅游产品匹配方法的实施过程示意图。
基于第一分类模型获得具有旅游标签的新闻信息。基于第二分类模型对新闻信息进行旅游主题分类。基于第三分类模型对同一旅游主题下属的新闻作聚类分析,获得每个主题下的不同话题簇。
建立属于同一旅游主题的新闻信息子集合。获得新闻信息子集合内每个新闻信息的交互参数集合,交互参数集合至少包括新闻信息被阅读、转发、点赞、收藏的次数。根据加权算法基于交互参数集合,获得新闻信息子集合的热度参数。
根据用户的历史阅读数据和/或历史旅游数据获得用户的旅游标签,本实施例中的用户是一位园艺爱好者。根据用户的旅游标签获得该旅游标签下热度参数最高的N个新闻信息。根据新闻信息进行语义分析获得旅游类关键词,旅游类关键词包括旅游景点、项目类别或是旅游季节。根据旅游标签和旅游类关键词匹配至少一旅游产品。生成一媒体文件包,媒体文件包中包括若干新闻信息以及对应每个新闻信息的旅游产品。媒体文件包包括一个展示新闻信息题目的目录,每个新闻信息题目对应一新闻信息的文本。媒体文件包包括了三个关于花博会的新闻信息“AAAAA”、“BBBBB”、“CCCCC”。新闻信息“AAAAA”的文本为“aaaaa.....aaaaa”,对应花博会相关的第一种旅游产品X;新闻信息“BBBBB”的文本为“bbbbb.....bbbbb”,对应花博会相关的第二种旅游产品Y;新闻信息“CCCCC”的文本为“ccccc.....ccccc”,对应花博会相关的第三种旅游产品Z。
在一种实施方式中,通过用户的移动终端1采集用户阅读媒体文件包的状态参数,状态参数至少包括用户阅读每条新闻信息的阅读时间和/或交互参数。基于阅读时间和状态参数获得用户对媒体文件包中的新闻信息的交互参数。如图2所示,当新闻信息的交互参数满足预设阈值,则将新闻信息对应的旅游产品展示在媒体文件包中与新闻信息的展示页面中的广告位2中,从而能够根据用户对新闻信息的兴趣程度(单个新闻信息的阅读时间)的高低,来向用户在实时看完新闻信息的第一时间推送最感兴趣相关旅游产品。
在一个优选实施例中,通过用户的移动终端1采集用户阅读媒体文件包的状态参数,状态参数至少包括用户阅读每条新闻信息的阅读时间和/或交互参数。基于阅读时间和状态参数获得用户对媒体文件包中的新闻信息的交互参数并进行排序。如图3所示,将交互参数最高的新闻信息对应的旅游产品展示在媒体文件包中与新闻信息的目录页面下部的广告位2中,从而能够根据用户对新闻信息的兴趣程度(单个新闻信息的阅读时间)的高低,来向用户在实时看完新闻信息的第一时间推送最感兴趣相关旅游产品。
在一个优选实施例中,通过用户的移动终端1提供一展示页面以展示媒体文件包的所有新闻信息的文本。采集用户阅读媒体文件包的中每条新闻信息的阅读时间。如图4、5所示,当展示页面被用户下拉到底部时,根据阅读时间最长的新闻信息对应的旅游产品展示在展示页面的底部的广告位2中,从而能够根据用户对新闻信息的兴趣程度(单个新闻信息的阅读时间)的高低,来向用户在看完媒体文件包中所有新闻信息的第一时间推送最感兴趣相关旅游产品。
通过本发明能够在用户刚刚完成针对性的新闻信息推送后,立刻获得其最感兴趣的新闻信息相关的旅游产品推送,从而在用户的消费兴奋点时获得更高的旅游产品的购买率。
本发明的基于热点的旅游产品匹配方法能够对站内外的新闻进行标签化入库,方便OTA平台按需用于推介场景,便于关注到较为实时的旅游热点动态,及时推送文旅活动,提高旅游产品的购买率。
图6是本发明的基于热点的旅游产品匹配系统的模块示意图。如图6所示,本发明的实施例还提供一种基于热点的旅游产品匹配系统,用于实现上述的基于热点的旅游产品匹配方法,基于热点的旅游产品匹配系统包括:
新闻分类模块51,通过分类模型自预设时段内的新闻信息集合中获得符合旅游主题的新闻信息。
交互参数模块52,至少基于下属于同一旅游主题的新闻信息的数量以及新闻信息的至少一交互参数,获得旅游主题的热度参数。
媒体文件模块53,至少根据旅游主题向推送对应的用户包含至少一新闻信息和相关旅游产品信息的媒体文件包。以及
旅游产品模块54,至少基于用户阅读媒体文件包中新闻信息的状态参数,向用户推送相关旅游产品信息。
在一个优选实施例中,新闻分类模块51基于第一分类模型获得具有旅游标签的新闻信息,基于第二分类模型对新闻信息进行旅游主题分类,基于第三分类模型对同一旅游主题下属的新闻作聚类分析,获得每个主题下的不同话题簇。
在一个优选实施例中,交互参数模块52建立属于同一旅游主题的新闻信息子集合。获得新闻信息子集合内每个新闻信息的交互参数集合,交互参数集合至少包括新闻信息被阅读、转发、点赞、收藏的次数。根据加权算法基于交互参数集合,获得新闻信息子集合的热度参数。
在第一分类模型中,将具有确定的旅游标签的部分数据作为训练语料,训练初始模型。将海量各种来源的新闻、文章数据使用文本检索模型提取语义特征做检索库。根据有标签的坏案例提取其语义特征作为查询特点,计算查询特点与检索库中的每一个特征的相似度。设置相似度阈值,取相似度高的检索标题,自动打上坏案例标注过的标签作为伪标签与原始有确定的旅游标签的训练集混合,重新训练模型,其中,伪标签构建模型的损失函数如下:
Figure BDA0003590786710000151
其中n为数据量的批尺寸,C为预设类别数,y为有标签数据预测得到的伪标签,f是直接取网络对有标签数据的预测的最大值为标签,y'为无标签数据预测得到的伪标签,f'是直接取网络对无标签数据的预测的最大值为标签,α(t)为预设变量。
在一个优选实施例中,媒体文件模块53根据用户的历史阅读数据和/或历史旅游数据获得用户的旅游标签。根据用户的旅游标签获得该旅游标签下热度参数最高的N个新闻信息。根据新闻信息进行语义分析获得旅游类关键词,旅游类关键词包括旅游景点、项目类别或是旅游季节。根据旅游标签和旅游类关键词匹配至少一旅游产品。生成一媒体文件包,媒体文件包中包括若干新闻信息以及对应每个新闻信息的旅游产品。
在一个优选实施例中,媒体文件包包括一个展示新闻信息题目的目录,每个新闻信息题目对应一新闻信息的文本。
在一个优选实施例中,旅游产品模块54采集用户阅读媒体文件包的状态参数,状态参数至少包括用户阅读每条新闻信息的阅读时间和/或交互参数。基于阅读时间和状态参数获得用户对媒体文件包中的新闻信息的交互参数。当新闻信息的交互参数满足预设阈值,则将新闻信息对应的旅游产品展示在媒体文件包中与新闻信息的展示页面中。
在一个优选实施例中,旅游产品模块54采集用户阅读媒体文件包的状态参数,状态参数至少包括用户阅读每条新闻信息的阅读时间和/或交互参数。基于阅读时间和状态参数获得用户对媒体文件包中的新闻信息的交互参数并进行排序。将交互参数最高的新闻信息对应的旅游产品展示在媒体文件包中与新闻信息的目录页面中。
在一个优选实施例中,旅游产品模块54提供一展示页面以展示媒体文件包的所有新闻信息的文本。采集用户阅读媒体文件包的中每条新闻信息的阅读时间。当展示页面被下拉到底部时,根据阅读时间最长的新闻信息对应的旅游产品展示在展示页面的底部。
本发明的基于热点的旅游产品匹配系统能够对站内外的新闻进行标签化入库,方便OTA平台按需用于推介场景,便于关注到较为实时的旅游热点动态,及时推送文旅活动,提高旅游产品的购买率。
本发明实施例还提供一种基于热点的旅游产品匹配设备,包括处理器。存储器,其中存储有处理器的可执行指令。其中,处理器配置为经由执行可执行指令来执行的基于热点的旅游产品匹配方法的步骤。
如上所示,该实施例本发明的基于热点的旅游产品匹配系统能够对站内外的新闻进行标签化入库,方便OTA平台按需用于推介场景,便于关注到较为实时的旅游热点动态,及时推送文旅活动,提高旅游产品的购买率。
所属技术领域的技术人员能够理解,本发明的各个方面可以实现为系统、方法或程序产品。因此,本发明的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“平台”。
图7是本发明的基于热点的旅游产品匹配设备的结构示意图。下面参照图7来描述根据本发明的这种实施方式的电子设备600。图7显示的电子设备600仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图7所示,电子设备600以通用计算设备的形式表现。电子设备600的组件可以包括但不限于:至少一个处理单元610、至少一个存储单元620、连接不同平台组件(包括存储单元620和处理单元610)的总线630、显示单元640等。
其中,存储单元存储有程序代码,程序代码可以被处理单元610执行,使得处理单元610执行本说明书上述电子处方流转处理方法部分中描述的根据本发明各种示例性实施方式的步骤。例如,处理单元610可以执行如图1中所示的步骤。
存储单元620可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)6201和/或高速缓存存储单元6202,还可以进一步包括只读存储单元(ROM)6203。
存储单元620还可以包括具有一组(至少一个)程序模块6205的程序/实用工具6204,这样的程序模块6205包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线630可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任一总线结构的局域总线。
电子设备600也可以与一个或多个外部设备700(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备600交互的设备通信,和/或与使得该电子设备600能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口650进行。并且,电子设备600还可以通过网络适配器660与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。网络适配器660可以通过总线630与电子设备600的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备600使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储平台等。
本发明实施例还提供一种计算机可读存储介质,用于存储程序,程序被执行时实现的基于热点的旅游产品匹配方法的步骤。在一些可能的实施方式中,本发明的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当程序产品在终端设备上运行时,程序代码用于使终端设备执行本说明书上述电子处方流转处理方法部分中描述的根据本发明各种示例性实施方式的步骤。
如上所示,该实施例本发明的基于热点的旅游产品匹配系统能够对站内外的新闻进行标签化入库,方便OTA平台按需用于推介场景,便于关注到较为实时的旅游热点动态,及时推送文旅活动,提高旅游产品的购买率。
图8是本发明的计算机可读存储介质的结构示意图。参考图8所示,描述了根据本发明的实施方式的用于实现上述方法的程序产品800,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
程序产品可以采用一个或多个可读介质的任一组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任一以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任一合适的组合。
计算机可读存储介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任一合适的组合。可读存储介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任一合适的组合。
可以以一种或多种程序设计语言的任一组合来编写用于执行本发明操作的程序代码,程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任一种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
综上,本发明的目的在于提供基于热点的旅游产品匹配方法、系统、设备及存储介质,能够对站内外的新闻进行标签化入库,方便OTA平台按需用于推介场景,便于关注到较为实时的旅游热点动态,及时推送文旅活动,提高旅游产品的购买率。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。

Claims (12)

1.一种基于热点的旅游产品匹配方法,其特征在于,包括以下步骤:
通过分类模型自预设时段内的新闻信息集合中获得符合旅游主题的新闻信息;
至少基于下属于同一所述旅游主题的新闻信息的数量以及所述新闻信息的至少一交互参数,获得所述旅游主题的热度参数;
至少根据所述旅游主题向推送对应的用户包含至少一新闻信息和相关旅游产品信息的媒体文件包;以及
至少基于所述用户阅读所述媒体文件包中新闻信息的状态参数,向用户推送相关旅游产品信息。
2.如权利要求1所述的基于热点的旅游产品匹配方法,其特征在于,所述通过分类模型自预设时段内的新闻信息集合中获得符合旅游主题的新闻信息,包括:
基于第一分类模型获得具有旅游标签的新闻信息;
基于第二分类模型对新闻信息进行旅游主题分类;以及
基于第三分类模型对同一旅游主题下属的新闻作聚类分析,获得每个所述主题下的不同话题簇。
3.如权利要求2所述的基于热点的旅游产品匹配方法,其特征在于,所述基于第一分类模型获得具有旅游标签的新闻信息中,包括:
将具有确定的旅游标签的部分数据作为训练语料,训练初始模型;
将海量各种来源的新闻、文章数据使用文本检索模型提取语义特征做检索库;
根据有标签的坏案例提取其语义特征作为查询特点,计算查询特点与检索库中的每一个特征的相似度;
设置相似度阈值,取相似度高的检索标题,自动打上坏案例标注过的标签作为伪标签与原始有确定的旅游标签的训练集混合,重新训练模型,其中,伪标签构建模型的损失函数如下:
Figure FDA0003590786700000011
其中,n为数据量的批尺寸,C为预设类别数,y为有标签数据预测得到的伪标签,f是直接取网络对有标签数据的预测的最大值为标签,y'为无标签数据预测得到的伪标签,f'是直接取网络对无标签数据的预测的最大值为标签,α(t)为预设变量。
4.如权利要求1所述的基于热点的旅游产品匹配方法,其特征在于,所述至少基于下属于同一所述旅游主题的新闻信息的数量以及所述新闻信息的至少一交互参数,获得所述旅游主题的热度参数中,包括:
建立属于同一所述旅游主题的新闻信息子集合;
获得所述新闻信息子集合内每个所述新闻信息的交互参数集合,所述交互参数集合至少包括所述新闻信息被阅读、转发、点赞、收藏的次数;以及
根据加权算法基于所述交互参数集合,获得所述新闻信息子集合的热度参数。
5.如权利要求1所述的基于热点的旅游产品匹配方法,其特征在于,所述至少根据所述旅游主题向推送对应的用户包含至少一新闻信息和相关旅游产品信息的媒体文件包中,包括:
根据所述用户的历史阅读数据和/或历史旅游数据获得所述用户的旅游标签;
根据所述用户的旅游标签获得该所述旅游标签下热度参数最高的N个新闻信息;
根据所述新闻信息进行语义分析获得旅游类关键词,所述旅游类关键词包括旅游景点、项目类别或是旅游季节;
根据所述旅游标签和旅游类关键词匹配至少一旅游产品;以及
生成一媒体文件包,所述媒体文件包中包括若干新闻信息以及对应每个所述新闻信息的所述旅游产品。
6.如权利要求5所述的基于热点的旅游产品匹配方法,其特征在于,所述媒体文件包包括一个展示新闻信息题目的目录,每个所述新闻信息题目对应一新闻信息的文本。
7.如权利要求6所述的基于热点的旅游产品匹配方法,其特征在于,所述至少基于所述用户阅读所述媒体文件包中新闻信息的状态参数,向用户推送相关旅游产品信息中,包括:
采集用户阅读媒体文件包的状态参数,所述状态参数至少包括用户阅读所述阅读中每条所述新闻信息的阅读时间和/或交互参数;
基于所述阅读时间和状态参数获得所述用户对所述媒体文件包中的所述新闻信息的交互参数;以及
当所述新闻信息的交互参数满足预设阈值,则将所述新闻信息对应的旅游产品展示在所述媒体文件包中与所述新闻信息的展示页面中。
8.如权利要求6所述的基于热点的旅游产品匹配方法,其特征在于,所述至少基于所述用户阅读所述媒体文件包中新闻信息的状态参数,向用户推送相关旅游产品信息中,包括:
采集用户阅读媒体文件包的状态参数,所述状态参数至少包括用户阅读所述阅读中每条所述新闻信息的阅读时间和/或交互参数;
基于所述阅读时间和状态参数获得所述用户对所述媒体文件包中的所述新闻信息的交互参数并进行排序;以及
将所述交互参数最高的所述新闻信息对应的旅游产品展示在所述媒体文件包中与所述新闻信息的目录页面中。
9.如权利要求1所述的基于热点的旅游产品匹配方法,其特征在于,所述至少基于所述用户阅读所述媒体文件包中新闻信息的状态参数,向用户推送相关旅游产品信息中,包括:
提供一展示页面以展示所述媒体文件包的所有新闻信息的文本;
采集用户阅读媒体文件包的中每条所述新闻信息的阅读时间;以及
当展示页面被下拉到底部时,根据所述阅读时间最长的新闻信息对应的旅游产品展示在所述展示页面的底部。
10.一种基于热点的旅游产品匹配系统,用于实现权利要求1所述的基于热点的旅游产品匹配方法,其特征在于,包括:
新闻分类模块,通过分类模型自预设时段内的新闻信息集合中获得符合旅游主题的新闻信息;
交互参数模块,至少基于下属于同一所述旅游主题的新闻信息的数量以及所述新闻信息的至少一交互参数,获得所述旅游主题的热度参数;
媒体文件模块,至少根据所述旅游主题向推送对应的用户包含至少一新闻信息和相关旅游产品信息的媒体文件包;以及
旅游产品模块,至少基于所述用户阅读所述媒体文件包中新闻信息的状态参数,向用户推送相关旅游产品信息。
11.一种基于热点的旅游产品匹配设备,其特征在于,包括:
处理器;
存储器,其中存储有所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1至9任意一项所述基于热点的旅游产品匹配方法的步骤。
12.一种计算机可读存储介质,用于存储程序,其特征在于,所述程序被处理器执行时实现权利要求1至9任意一项所述基于热点的旅游产品匹配方法的步骤。
CN202210377392.8A 2022-04-11 2022-04-11 基于热点的旅游产品匹配方法、系统、设备及存储介质 Pending CN114881722A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210377392.8A CN114881722A (zh) 2022-04-11 2022-04-11 基于热点的旅游产品匹配方法、系统、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210377392.8A CN114881722A (zh) 2022-04-11 2022-04-11 基于热点的旅游产品匹配方法、系统、设备及存储介质

Publications (1)

Publication Number Publication Date
CN114881722A true CN114881722A (zh) 2022-08-09

Family

ID=82669810

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210377392.8A Pending CN114881722A (zh) 2022-04-11 2022-04-11 基于热点的旅游产品匹配方法、系统、设备及存储介质

Country Status (1)

Country Link
CN (1) CN114881722A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117236659A (zh) * 2023-11-14 2023-12-15 贵州优特云科技有限公司 一种基于线上旅游平台的团计划管理方法及系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117236659A (zh) * 2023-11-14 2023-12-15 贵州优特云科技有限公司 一种基于线上旅游平台的团计划管理方法及系统
CN117236659B (zh) * 2023-11-14 2024-02-02 贵州优特云科技有限公司 一种基于线上旅游平台的团计划管理方法及系统

Similar Documents

Publication Publication Date Title
CN107766371B (zh) 一种文本信息分类方法及其装置
CN107133345B (zh) 基于人工智能的交互方法和装置
WO2022078102A1 (zh) 一种实体识别方法、装置、设备以及存储介质
CN110633373B (zh) 一种基于知识图谱和深度学习的汽车舆情分析方法
CN106682192B (zh) 一种基于搜索关键词训练回答意图分类模型的方法和装置
CN105893609B (zh) 一种基于加权混合的移动app推荐方法
JP4637969B1 (ja) ウェブページの主意,およびユーザの嗜好を適切に把握して,最善の情報をリアルタイムに推奨する方法
CN110532451A (zh) 针对政策文本的检索方法和装置、存储介质、电子装置
CN106970991B (zh) 相似应用的识别方法、装置和应用搜索推荐方法、服务器
CN110555107B (zh) 确定业务对象主题、业务对象推荐的方法及装置
CN111159341B (zh) 基于用户投资理财偏好的资讯推荐方法及装置
CN107832338B (zh) 一种识别核心产品词的方法和系统
CN110489649B (zh) 标签关联内容的方法及装置
CN110348920A (zh) 一种推荐产品的方法及装置
CN114971730A (zh) 文案素材提取方法及其装置、设备、介质、产品
CN111429161B (zh) 特征提取方法、特征提取装置、存储介质及电子设备
CN114443847A (zh) 文本分类、文本处理方法、装置、计算机设备及存储介质
CN115203539A (zh) 一种媒体内容推荐方法、装置、设备及存储介质
CN111225009B (zh) 用于生成信息的方法和装置
CN114881722A (zh) 基于热点的旅游产品匹配方法、系统、设备及存储介质
CN116955591A (zh) 用于内容推荐的推荐语生成方法、相关装置和介质
CN115860283A (zh) 基于知识工作者画像的贡献度预测方法及装置
CN114547313A (zh) 资源类型识别方法以及装置
CN113821718A (zh) 一种物品信息推送方法和装置
CN115329183A (zh) 数据处理方法、装置、存储介质及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination