CN113590940A - 基于知识图谱的文章生成方法和装置 - Google Patents

基于知识图谱的文章生成方法和装置 Download PDF

Info

Publication number
CN113590940A
CN113590940A CN202110773707.6A CN202110773707A CN113590940A CN 113590940 A CN113590940 A CN 113590940A CN 202110773707 A CN202110773707 A CN 202110773707A CN 113590940 A CN113590940 A CN 113590940A
Authority
CN
China
Prior art keywords
interest
interest point
points
article
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110773707.6A
Other languages
English (en)
Other versions
CN113590940B (zh
Inventor
薛成韵
郑烨翰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN202110773707.6A priority Critical patent/CN113590940B/zh
Publication of CN113590940A publication Critical patent/CN113590940A/zh
Application granted granted Critical
Publication of CN113590940B publication Critical patent/CN113590940B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/355Class or cluster creation or modification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries

Abstract

本申请提出一种基于知识图谱的文章生成方法和装置,其中,方法包括:通过获取多个兴趣点,并获取多个兴趣点中每个兴趣点的分类标签,根据分类标签对多个兴趣点进行分类以生成每个分类标签对应的兴趣点集合,进一步的,获取用户的需求条件,根据需求条件对每个分类标签对应的兴趣点集合进行筛选以生成满足需求条件的兴趣点备选集合,最终根据兴趣点备选集合生成文章。该方法能够根据用户的需求条件进行兴趣点过滤,进而根据满足需求条件的兴趣点备选集合生成文章,从而在文章中提供多种出行方案供用户选择,避免了用户自己在网络中搜索指定出行攻略耗费大量的时间和精力的问题。

Description

基于知识图谱的文章生成方法和装置
技术领域
本申请涉及互联网技术领域,尤其涉及一种基于知识图谱的文章的生成方法和装置。
背景技术
随着人们生活水平的提高,在业余生活出去旅游的人也越来越多,在出行前,部分用户会自己制定旅游方案,包括考虑景点的选取、食宿安排、路线规划、天气因素等。目前,用户根据自身的需求,再通过搜索引擎或者各大旅游网站搜索相关的信息,从而筛选出自己满意的去处。进一步的,用户再根据自己的出游时间、预算等,制定出旅游路线并预定酒店等。
现有技术中,用户根据自身需求,利用互联网搜索旅游信息,并从大量的信息中选择并制定,耗费了用户大量的时间和精力,并且制定出的旅游方案也可能不完全满足用户的需求。
发明内容
本申请提出一种基于知识图谱的文章生成方法和装置,根据用户的需求条件进行兴趣点过滤,进而根据满足需求条件的兴趣点备选集合生成文章,从而提供多种出行方案供用户选择,避免了用户自己在网络中搜索指定出行攻略耗费大量的时间和精力的问题。
本申请第一方面实施例提出了一种文章的生成方法,包括:
获取多个兴趣点,并获取多个兴趣点中每个兴趣点的分类标签;
根据所述分类标签对所述多个兴趣点进行分类以生成每个所述分类标签对应的兴趣点集合;
获取用户的需求条件;
根据所述需求条件对每个所述分类标签对应的兴趣点集合进行筛选以生成满足所述需求条件的兴趣点备选集合;以及
根据所述兴趣点备选集合生成所述文章。
本申请实施例的文章生成方法,通过获取多个兴趣点,并获取多个兴趣点中每个兴趣点的分类标签,根据分类标签对多个兴趣点进行分类以生成每个分类标签对应的兴趣点集合,进一步的,获取用户的需求条件,根据需求条件对每个分类标签对应的兴趣点集合进行筛选以生成满足需求条件的兴趣点备选集合,最终根据兴趣点备选集合生成文章。该方法能够根据用户的需求条件进行兴趣点过滤,进而根据满足需求条件的兴趣点备选集合生成文章,从而在文章中提供多种出行方案供用户选择,避免了用户自己在网络中搜索指定出行攻略耗费大量的时间和精力的问题。
本申请第二方面实施例提出了一种文章的生成装置,包括:
第一获取模块,用于获取多个兴趣点,并获取多个兴趣点中每个兴趣点的分类标签;
分类模块,用于根据所述分类标签对所述多个兴趣点进行分类以生成每个所述分类标签对应的兴趣点集合;
第二获取模块,用于获取用户的需求条件;
筛选模块,用于根据所述需求条件对每个所述分类标签对应的兴趣点集合进行筛选以生成满足所述需求条件的兴趣点备选集合;以及
生成模块,用于根据所述兴趣点备选集合生成所述文章。
本申请实施例的文章生成装置,通过获取多个兴趣点,并获取多个兴趣点中每个兴趣点的分类标签,根据分类标签对多个兴趣点进行分类以生成每个分类标签对应的兴趣点集合,进一步的,获取用户的需求条件,根据需求条件对每个分类标签对应的兴趣点集合进行筛选以生成满足需求条件的兴趣点备选集合,最终根据兴趣点备选集合生成文章。该方法能够根据用户的需求条件进行兴趣点过滤,进而根据满足需求条件的兴趣点备选集合生成文章,从而在文章中提供多种出行方案供用户选择,避免了用户自己在网络中搜索指定出行攻略耗费大量的时间和精力的问题。
本申请第三方面实施例提出了一种计算机设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现如上述实施例中所述的文章的生成方法。
本申请第四方面实施例提出了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述实施例中所述的文章的生成方法。
本申请第五方面实施例提出了一种计算机程序产品,当所述计算机程序产品中的指令由处理器执行时,执行如上述实施例中所述的文章的生成方法。
本申请附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。
附图说明
本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本申请实施例所提供的一种文章的生成方法的流程示意图;
图2为本申请实施例所提供的另一种文章的生成方法的流程示意图;
图3为本申请实施例所提供的一种文章的生成装置的结构示意图;
图4为本申请实施例所提供的另一种文章的生成装置的结构示意图;
图5示出了适于用来实现本申请实施方式的示例性计算机设备的框图。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本申请,而不能理解为对本申请的限制。
现有技术中,大多用户在旅游出行前都会自己制定旅游行程,需要考虑景点选取、食宿安排、路线规划、天气因素等,然后用户主要通过搜索引擎查找或到各大出游网站,筛选自己满意的去处,再根据自身的出游时间、预算等,制定出游路线和预定酒店住宿等。此种制定旅游行程的方式需要用户根据自身需求,到互联网中搜集旅游相关的信息,然后从大量的互联网信息中选择并制定出游计划,不仅耗费用户的时间和精力,并且网上的信息也不完全真实导致指定的旅游方案不合理。
针对上述现有技术中的问题,本申请实施例提出了一种文章的生成方法,通过获取多个兴趣点,并获取多个兴趣点中每个兴趣点的分类标签,根据分类标签对多个兴趣点进行分类以生成每个分类标签对应的兴趣点集合,进一步的,获取用户的需求条件,根据需求条件对每个分类标签对应的兴趣点集合进行筛选以生成满足需求条件的兴趣点备选集合,最终根据兴趣点备选集合生成文章。
下面参考附图描述本申请实施例的文章的生成方法和装置。
图1为本申请实施例所提供的一种文章的生成方法的流程示意图。
本申请实施例以该文章的生成方法被配置于文章的生成装置中来举例说明,该文章的生成装置可以应用于任一计算机设备中,以使该计算机设备可以执行文章的生成功能。
其中,计算机设备可以为个人电脑(Personal Computer,简称PC)、云端设备、移动设备等,移动设备例如可以为手机、平板电脑、个人数字助理、穿戴式设备、车载设备等具有各种操作系统、触摸屏和/或显示屏的硬件设备。
如图1所示,该文章的生成方法包括以下步骤:
步骤101,获取多个兴趣点,并获取多个兴趣点中每个兴趣点的分类标签。
其中,兴趣点是指与用户生活密切相关的地理实体,兴趣点例如可以为学校、银行、餐馆、加油站、医院、超市等等,或者可以为一栋房子、一个商铺、一个邮筒、一个公交站等等,对此不作限制。
作为一种可能的实现方式,本申请实施例中,生成的文章可以为与旅游行程相关的文章,因此,可以从搜索引擎或者各大旅游类网站获取到兴趣点,也可以从各个旅游类应用程序(Application,APP)、地图类APP中获取到兴趣点。
由于获取到的每个兴趣点的分类标签不同,因此需要进一步的获取多个兴趣点中每个兴趣点的分类标签,其中,分类标签,是指兴趣点的分类标准,如兴趣点的国家、城市、区域、景点类别等。
作为一种可能的实现方式,可以通过数据爬虫的方式从知识图谱中获取多个兴趣点的信息,每一个兴趣点对应的分类标签不同,进而根据多个兴趣点在知识图谱中的信息生成分类标签。
本申请实施例中,知识图谱可以是已经构建好的现有的知识图谱,也可以从互联网中获取海量的旅游景点以及出行路线等相关信息,构建知识图谱。
作为另一种可能的实现方式,可以从网站中获取兴趣点的动态变化信息,如描写某一景点的文章,或者各大旅游站点中用户对该景点的评价信息、评分等,可以通过文本分词或者实体识别的方法从获取到的兴趣点的动态变化信息中提取可用的分类标签,如人口密集度、风景美观度、人文风情等。
步骤102,根据分类标签对多个兴趣点进行分类以生成每个分类标签对应的兴趣点集合。
具体地,根据获取的多个兴趣点中每个兴趣点的分类标签,将获取的所有的兴趣点根据分类标签进行分类,在不同的分类标签下对应不同的兴趣点集合,因此,可以生成每个分类标签对应的兴趣点集合。
作为一种示例,假如有旅游景点A、B、C、D、E、F、G,当分类标签为旅游人群时,根据该兴趣点分类标签生成的兴趣点集合为{人很多:[A、B、C、D],人很少[E、F、G]},当分类标签为天气气温时,根据该兴趣点分类标签生成的兴趣点集合为{很热:[A、C],适中:[B、F],微冷[D E、G]},当分类标签为交通便利度时,根据该兴趣点分类标签生成的兴趣点集合为{便利:[A、B、D],一般:[C、F、G],不便利[E]}。
步骤103,获取用户的需求条件。
具体地,根据用户在搜索引擎、各个旅游网站或者旅游类APP等输入的需求条件,可以获取到用户的需求条件。例如,用户在旅游网站输入天气温度-适中、交通便利度-便利的需求,可以获取到用户的需求条件为[天气温度-适中、交通便利度-便利]。
步骤104,根据需求条件对每个分类标签对应的兴趣点集合进行筛选以生成满足需求条件的兴趣点备选集合。
具体地,根据获取到的用户的需求条件对每个分类标签对应的兴趣点集合进行筛选,进而得到满足用户的需求条件的兴趣点备选集合。
继续以步骤102中的示例为例,如果获取到的用户的需求条件为[天气温度-适中、交通便利度-便利],则根据该需求条件对步骤102中示例的每个分类标签对应的兴趣点集合进行筛选,得到满足用户的需求条件的兴趣点备选集合为[B]。如果获取到的用户的需求条件为 [旅游人群-人很多、天气气温-微冷、交通便利-便利],则根据该需求条件对步骤102中示例的每个分类标签对应的兴趣点集合进行筛选,得到满足用户的需求条件的兴趣点备选集合为[D]。
步骤105,根据兴趣点备选集合生成文章。
本申请实施例中,可以将根据需求条件对每个分类标签对应的兴趣点集合进行筛选,进而将生成的满足用户需求条件的兴趣点备选集合提供至用户进行选择,进一步地接收用户根据自己的需求从兴趣点备选集合中选择目标兴趣点,并生成目标兴趣点集合。
作为一种示例,假如兴趣点备选集合为[A城市的b景点、B城市的c景点],用户对兴趣点备选集合中的每一个兴趣点进行进一步的分析,例如,可以对兴趣点集合中的每个兴趣点进行打分、查看每个兴趣点对应的用户评价等,选择出目标兴趣点,进而得到目标兴趣点集合[B城市的c景点]。
进一步的,由于目标兴趣点对应的地理区域可能不同,因此获取每个目标兴趣点对应的区域,并按照区域对目标兴趣点集合中的目标兴趣点进行分类,在同一聚类的地理区域内,尽可能多的规划出不同类别的目标兴趣点,如旅游景点、餐厅、动物园等,从而避免了再同一区域去相似的兴趣点,如让用户既去A植物园,又去B植物园。进而使用地图的规划功能对各目标兴趣点进行路径规划,以形成路径规划图,从而为用户规划出多种出行方案,生成用户满意的旅游行程供用户选择,使得用户在同一区域内尽可能多的去不同类型的兴趣点。
本申请实施例的文章生成方法,通过获取多个兴趣点,并获取多个兴趣点中每个兴趣点的分类标签,根据分类标签对多个兴趣点进行分类以生成每个分类标签对应的兴趣点集合,进一步的,获取用户的需求条件,根据需求条件对每个分类标签对应的兴趣点集合进行筛选以生成满足需求条件的兴趣点备选集合,最终根据兴趣点备选集合生成文章。该方法能够根据用户的需求条件进行兴趣点过滤,进而根据满足需求条件的兴趣点备选集合生成文章,从而在文章中提供多种出行方案供用户选择,避免了用户自己在网络中搜索指定出行攻略耗费大量的时间和精力的问题。
为了清楚说明上一实施例,本实施例提供了另一种文章的生成方法,图2为本申请实施例所提供的另一种文章的生成方法的流程示意图。
如图2所示,该文章的生成方法可以包括以下步骤:
步骤201,获取多个兴趣点,并获取与多个兴趣点相关的站点动态数据。
本申请实施例中,站点动态数据,是指各大旅游网站或者旅游类APP中描写兴趣点的文章、用户对兴趣点的评价信息以及评分等。
作为一种可能的实现方式,可以通过数据抓取方法从搜索引擎或者各大旅游类网站获取到多个兴趣点,也可以从各个旅游类APP、地图类APP等各种应用程序中获取多个兴趣点,同时获取与多个兴趣点相关的站点动态数据。
步骤202,根据站点动态数据生成分类标签。
具体地,可以从获取到的与多个兴趣点相关的站点动态数据中提取出可用的兴趣点分类标签,如人口密集度、风景美观度、人文风情等。从而根据站点动态数据可以获取到兴趣点的分类标签。
作为另一种可能的情况,由于各个兴趣点对应的天气信息也是实时变化的,也可以通过抓取天气信息,从而获取到多个兴趣点的天气信息,进而根据多个兴趣点的天气信息生成天气分类标签。例如,天气气温适中、很热等天气分类标签。
步骤203,根据分类标签对多个兴趣点进行分类以生成每个分类标签对应的兴趣点集合。
步骤204,获取用户的需求条件。
步骤205,根据需求条件对每个分类标签对应的兴趣点集合进行筛选以生成满足需求条件的兴趣点备选集合。
本申请实施例中,步骤203至步骤203的实现方式参见上述实施例中步骤102至步骤 104,在此不再赘述。
步骤206,根据兴趣点备选集合中每个兴趣点对应的站点动态数据对兴趣点备选集合中的每个兴趣点进行打分。
本申请实施例中,根据用户的需求条件对每个分类标签对应的兴趣点集合进行筛选得到满足用户需求条件的兴趣点备选集合,进而根据每个兴趣点对应的站点动态数据对兴趣点备选集合中每一个兴趣点进行分析,以对兴趣点备选集合中每个兴趣点进行打分。
具体地,对每个兴趣点进行打分的方法可以动态的变化,可以根据用户的需求加入或者减少用户考虑的因素,例如,考虑用户对兴趣点的评价、评分,也可以选择不考虑用户的评价、评分。其中,在考虑用户评价时,可以对用户的评价文本进行情感分析,对评价进行分析,如“风景不错,加1分”,“风景特别好,加2分”,“风景没看到多少,看的都是人山人海,减2分”。
同时,也可以预先设定兴趣点中每个因素的权值,如对兴趣点有一个正面用户评价,则加1分;一个负面的用户评价,则减3分;一个“风景很好”的评论,则加3分;一个“景区小吃很便宜”的评价,则加1分。
作为另一种可能的情况,也可以考虑获取的兴趣点的图片因素对该兴趣点进行打分,可以使用图片模糊度检查、大小检测、水印检测、人脸检测等方式,为兴趣点对应的图片打分,如图片清晰,加2分;图片太小,减1分等。
步骤207,根据打分结果对兴趣点备选集合中的兴趣点进行排序。
本申请实施例中,根据兴趣点对应的站点动态数据对兴趣点备选集合中的每个兴趣点进行打分的结果,对兴趣点备选集合中的兴趣点进行排序,可以是从高分到低分的排序,也可以是从低分到高分的排序,具体排序方式不做限定。
步骤208,将兴趣点备选集合提供至用户进行选择。
具体地,将排序后的兴趣点备选集合提供至用户,使得用户根据自己的需求进行选择,用户可以剔除掉部分兴趣点,也可以择优选择出部分兴趣点。
作为一种示例,根据用户需求按地理位置分类后,用户选择剔除“a城市的B景点”,或者优先选择去“b城市的C景点”。并将剔除的兴趣点移出兴趣点列表,或者将用户择优选取的兴趣点的排名提高。
步骤209,接收用户从兴趣点备选集合中选择的目标兴趣点并生成目标兴趣点集合。
具体地,用户根据自己的需求从兴趣点备选集合中剔除掉部分兴趣点后,兴趣点备选集合中剩余的兴趣点即为目标兴趣点,从而接收用户剔除部分兴趣点后剩余的兴趣点即可生成目标兴趣点集合。
作为另一种可能的情况,用户可以从兴趣点备选集合中择优选择出目标兴趣点,当接收到用户择优选择出的目标兴趣点,即可生成目标兴趣点集合。
步骤210,获取每个目标兴趣点对应的区域,并按照区域对目标兴趣点集合中的目标兴趣点进行路径规划,以形成路径规划图。
具体的,获取目标兴趣点集合中的每个目标兴趣点的地理区域,然后按照地理区域对目标兴趣点集合中每个兴趣点进行分类。对同一个地理区域内的目标兴趣点集合中的目标兴趣点使用地图的路径规划功能进行路径规划,组要注意的是,在路径规划时尽量避免在同一区域内去相似分类标签的兴趣点,如让用户去了D动物园,又去E动物园。确保在同一个区域内,尽可能多的去不同类型的兴趣点,同时能够根据规划的路径尽可能快的达到下一个区域。
作为一种示例,目标兴趣点集合中的目标兴趣点对应的区域为a区、b区、c区,在同一区域内的目标兴趣点进行路径规划,同时避免在同一个区域内去相似的兴趣点,因此对目标兴趣点进行的路径规划可以为a区的A酒店、B景点;b区的C博物馆、D餐厅;c 区的E海滩、F酒吧等。
需要说明的是,在按照区域对目标兴趣点集合中的目标兴趣点进行路径规划时,可以规划出多种出行方案,为了让用户更加的了解每个出行方案,可以在出行方案中补充更多的信息,从而规划出信息更加完整的出行方案以供用户选择。
具体地,可以获取每个目标兴趣点的参考信息,并将参考信息添加至路径规划图中,让用户更好的选择出行方案。其中,参考信息,可以是景点的门票价格、开放时间、游玩时间、基本介绍、周围交通状况,也可以是所住酒店的参考价格、酒店类型(如三星、四星、普通旅社等),餐厅的参考消费价格、推荐菜单,也可以是当地的风俗等等。
本申请实施例中,参考信息可以根据不同的出行方案中的具体目标兴趣点进行添加或删减,从而让用户尽可能的了解当前出行方案的基本信息,以使用户选择出适合自己需求的出行方案。
本申请实施例的文章的生成方法,通过获取多个兴趣点,并获取与多个兴趣点相关的站点动态数据,根据站点动态数据生成分类标签,根据分类标签对多个兴趣点进行分类以生成每个分类标签对应的兴趣点集合,获取用户的需求条件,根据需求条件对每个分类标签对应的兴趣点集合进行筛选以生成满足需求条件的兴趣点备选集合,根据兴趣点备选集合中每个兴趣点对应的站点动态数据对兴趣点备选集合中的每个兴趣点进行打分,根据打分结果对兴趣点备选集合中的兴趣点进行排序,将兴趣点备选集合提供至用户进行选择,接收用户从兴趣点备选集合中选择的目标兴趣点并生成目标兴趣点集合,获取每个目标兴趣点对应的区域,并按照区域对目标兴趣点集合中的目标兴趣点进行路径规划,以形成路径规划图。由此,通过兴趣点的分类和按照用户需求进行选择出目标兴趣点,为用户提供更合适的兴趣点,进而通过兴趣点区域的划分和路径规划生成多种可供用户选择的出行方案,并在方案中添加了详细的出行信息以及游玩信息,从而避免了用户自己在网络中搜索指定出行攻略耗费大量的时间和精力的问题。
为了实现上述实施例,本申请还提出一种文章的生成装置。
图3为本申请实施例提供的一种文章的生成装置的结构示意图。
如图3所示,该文章的生成装置100包括:第一获取模块110、分类模块120、第二获取模块130、筛选模块140以及生成模块150。
第一获取模块110,用于获取多个兴趣点,并获取多个兴趣点中每个兴趣点的分类标签;
分类模块120,用于根据所述分类标签对所述多个兴趣点进行分类以生成每个所述分类标签对应的兴趣点集合;
第二获取模块130,用于获取用户的需求条件;
筛选模块140,用于根据所述需求条件对每个所述分类标签对应的兴趣点集合进行筛选以生成满足所述需求条件的兴趣点备选集合;以及
生成模块150,用于根据所述兴趣点备选集合生成所述文章。
作为一种可能的实现方式,第一获取模块110,具体用于:获取多个兴趣点在知识图谱中的信息;以及根据多个兴趣点在知识图谱中的信息生成分类标签。
作为另一种可能的实现方式,第一获取模块110,还可以具体用于:获取与多个兴趣点相关的站点动态数据;根据站点动态数据生成分类标签。
作为再一种可能的实现方式,第一获取模块110,还可以具体用于:获取多个兴趣点的天气信息;以及根据多个兴趣点的天气信息生成天气分类标签。
作为一种可能的实现方式,生成模块150,具体用于:将兴趣点备选集合提供至用户进行选择;接收用户从兴趣点备选集合中选择的目标兴趣点并生成目标兴趣点集合;获取每个目标兴趣点对应的区域,并按照区域对目标兴趣点集合中的目标兴趣点进行路径规划,以形成路径规划图。
作为另一种可能的实现方式,生成模块150,还可以具体用于:获取每个目标兴趣点的参考信息,并将参考信息添加至路径规划图中。
进一步地,作为本申请实施例的一种可能的实现方式,参见图4,在图3所示实施例的基础上,该文章的生成装置,还可以包括:
打分模块160,用于根据所述兴趣点备选集合中每个兴趣点对应的站点动态数据对所述兴趣点备选集合中的每个兴趣点进行打分。
排序模块170,用于根据打分结果对兴趣点备选集合中的兴趣点进行排序。
作为一种可能的实现方式,打分模块160,具体用于:获取每个兴趣点对应的站点动态数据对应的用户评价和/或兴趣点图片;根据用户评价生成每个兴趣点的用户评价打分值,和/或,根据每个兴趣点的兴趣点图片质量生成每个兴趣点的图片质量打分值。
本申请实施例的文章生成装置,通过获取多个兴趣点,并获取多个兴趣点中每个兴趣点的分类标签,根据分类标签对多个兴趣点进行分类以生成每个分类标签对应的兴趣点集合,进一步的,获取用户的需求条件,根据需求条件对每个分类标签对应的兴趣点集合进行筛选以生成满足需求条件的兴趣点备选集合,最终根据兴趣点备选集合生成文章。该方法能够根据用户的需求条件进行兴趣点过滤,进而根据满足需求条件的兴趣点备选集合生成文章,从而在文章中提供多种出行方案供用户选择,避免了用户自己在网络中搜索指定出行攻略耗费大量的时间和精力的问题。
需要说明的是,前述对文章的生成方法实施例的解释说明也适用于该实施例的文章的生成装置,此处不再赘述。
为了实现上述实施例,本申请还提出一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现如上述实施例所述的文章的生成方法。
为了实现上述实施例,本申请还提出一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述实施例所述的文章的生成方法。
为了实现上述实施例,本申请还提出一种计算机程序产品,当所述计算机程序产品中的指令由处理器执行时,执行如上述实施例所述的文章的生成方法。
图5示出了适于用来实现本申请实施方式的示例性计算机设备的框图。图5显示的计算机设备12仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图5所示,计算机设备12以通用计算设备的形式表现。计算机设备12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,系统存储器28,连接不同系统组件(包括系统存储器28和处理单元16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(Industry StandardArchitecture;以下简称:ISA)总线,微通道体系结构(Micro Channel Architecture;以下简称:MAC)总线,增强型ISA总线、视频电子标准协会(Video Electronics StandardsAssociation;以下简称: VESA)局域总线以及外围组件互连(Peripheral ComponentInterconnection;以下简称:PCI) 总线。
计算机设备12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机设备12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器 (Random Access Memory;以下简称:RAM)30和/或高速缓存存储器32。计算机设备12 可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图5未显示,通常称为“硬盘驱动器”)。尽管图5中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如:光盘只读存储器(Compact Disc Read OnlyMemory;以下简称:CD-ROM)、数字多功能只读光盘(Digital Video Disc Read OnlyMemory;以下简称:DVD-ROM)或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本申请各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如存储器28中,这样的程序模块42包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本申请所描述的实施例中的功能和/或方法。
计算机设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等) 通信,还可与一个或者多个使得用户能与该计算机系统/服务器12交互的设备通信,和/或与使得该计算机系统/服务器12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,计算机设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(Local AreaNetwork;以下简称:LAN),广域网(Wide Area Network;以下简称:WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器20通过总线18与计算机设备12的其它模块通信。应当明白,尽管图中未示出,可以结合计算机设备12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理单元16通过运行存储在系统存储器28中的程序,从而执行各种功能应用以及数据处理,例如实现前述实施例中提及的方法。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本申请的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本申请的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本申请各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本申请的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本申请的限制,本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (13)

1.一种基于知识图谱的文章生成方法,包括:
获取多个兴趣点,并从知识图谱中获取多个兴趣点中每个兴趣点的分类标签;
根据所述分类标签对所述多个兴趣点进行分类以生成每个所述分类标签对应的兴趣点集合;
获取用户的需求条件;
根据所述需求条件对每个所述分类标签对应的兴趣点集合进行筛选以生成满足所述需求条件的兴趣点备选集合;
根据所述兴趣点备选集合中各目标兴趣点所对应的地理区域,对各所述目标兴趣点进行聚类;
根据同一聚类的地理区域内不同类别的目标兴趣点生成所述文章。
2.根据权利要求1所述的文章生成方法,其中,所述文章为与旅游行程相关的文章。
3.根据权利要求1所述的文章生成方法,其中,所述从知识图谱中获取多个兴趣点中每个兴趣点的分类标签,包括:
获取所述多个兴趣点在所述知识图谱中的信息;以及
根据所述多个兴趣点在所述知识图谱中的信息生成所述分类标签。
4.根据权利要求1所述的文章生成方法,其中,所述方法还包括:
获取与所述多个兴趣点相关的站点动态数据;以及
根据所述站点动态数据生成所述分类标签。
5.根据权利要求3或4所述的文章生成方法,其中,所述方法还包括:
获取所述多个兴趣点的天气信息;以及
根据所述多个兴趣点的天气信息生成所述分类标签。
6.根据权利要求1所述的文章生成方法,其中,在所述根据所述需求条件对每个所述分类标签对应的兴趣点集合进行筛选以生成满足所述需求条件的兴趣点备选集合之后,还包括:
根据所述兴趣点备选集合中每个兴趣点对应的站点动态数据对所述兴趣点备选集合中的每个兴趣点进行打分;
根据打分结果对兴趣点备选集合中的兴趣点进行排序。
7.根据权利要求6所述的文章生成方法,其中,根据所述兴趣点备选集合中每个兴趣点对应的站点动态数据对所述兴趣点备选集合中的每个兴趣点进行打分,包括:
获取所述每个兴趣点对应的站点动态数据对应的用户评价和/或兴趣点图片;
根据所述用户评价生成所述每个兴趣点的用户评价打分值,和/或,根据所述每个兴趣点的兴趣点图片质量生成所述每个兴趣点的图片质量打分值。
8.根据权利要求1-4任一项所述的文章生成方法,其中,所述根据所述兴趣点备选集合中各目标兴趣点所对应的地理区域,对各所述目标兴趣点进行聚类,包括:
将所述兴趣点备选集合提供至用户进行选择;
接收所述用户从所述兴趣点备选集合中选择的目标兴趣点并生成目标兴趣点集合;
获取每个目标兴趣点对应的区域,并按照区域对所述目标兴趣点集合中的目标兴趣点进行聚类。
9.根据权利要求1-4任一项所述的文章生成方法,其中,所述根据同一聚类的地理区域内不同类别的目标兴趣点生成所述文章,包括:
对同一聚类的地理区域内各类别的目标兴趣点,进行路径规划,以形成所述文章中的路径规划图;
获取每个目标兴趣点的参考信息,并将所述参考信息添加至所述路径规划图中。
10.一种基于知识图谱的文章生成装置,包括:
第一获取模块,用于获取多个兴趣点,并从知识图谱中获取多个兴趣点中每个兴趣点的分类标签;
分类模块,用于根据所述分类标签对所述多个兴趣点进行分类以生成每个所述分类标签对应的兴趣点集合;
第二获取模块,用于获取用户的需求条件;
筛选模块,用于根据所述需求条件对每个所述分类标签对应的兴趣点集合进行筛选以生成满足所述需求条件的兴趣点备选集合;以及
生成模块,用于根据所述兴趣点备选集合中各目标兴趣点所对应的地理区域,对各所述目标兴趣点进行聚类;根据同一聚类的地理区域内不同类别的目标兴趣点生成所述文章。
11.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器执行权利要求1-9中任一项所述的文章生成方法。
12.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-9中任一项所述的文章生成方法。
13.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1-9中任一所述的文章生成方法。
CN202110773707.6A 2018-12-13 2018-12-13 基于知识图谱的文章生成方法和装置 Active CN113590940B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110773707.6A CN113590940B (zh) 2018-12-13 2018-12-13 基于知识图谱的文章生成方法和装置

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201811525724.2A CN109740049B (zh) 2018-12-13 2018-12-13 文章的生成方法和装置
CN202110773707.6A CN113590940B (zh) 2018-12-13 2018-12-13 基于知识图谱的文章生成方法和装置

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201811525724.2A Division CN109740049B (zh) 2018-12-13 2018-12-13 文章的生成方法和装置

Publications (2)

Publication Number Publication Date
CN113590940A true CN113590940A (zh) 2021-11-02
CN113590940B CN113590940B (zh) 2023-10-17

Family

ID=66359299

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201811525724.2A Active CN109740049B (zh) 2018-12-13 2018-12-13 文章的生成方法和装置
CN202110773707.6A Active CN113590940B (zh) 2018-12-13 2018-12-13 基于知识图谱的文章生成方法和装置

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201811525724.2A Active CN109740049B (zh) 2018-12-13 2018-12-13 文章的生成方法和装置

Country Status (1)

Country Link
CN (2) CN109740049B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112348450B (zh) * 2019-08-06 2023-02-17 上海指南猫网络科技有限公司 用于生成日程信息的方法和装置
CN111831898A (zh) * 2019-09-17 2020-10-27 北京嘀嘀无限科技发展有限公司 排序方法、装置、电子设备及可读存储介质
CN110851726B (zh) * 2019-11-18 2022-07-26 百度在线网络技术(北京)有限公司 兴趣点选择方法、装置以及电子设备
CN112115222B (zh) * 2020-09-08 2024-03-08 北京百度网讯科技有限公司 兴趣点显示方法、装置、电子设备和存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107193790A (zh) * 2016-03-14 2017-09-22 阿里巴巴集团控股有限公司 一种电子游记编辑方法及装置
US20170324987A1 (en) * 2013-02-22 2017-11-09 Facebook, Inc. Time-Sensitive Content Update
CN107943774A (zh) * 2017-11-20 2018-04-20 北京百度网讯科技有限公司 文章生成方法和装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100076976A1 (en) * 2008-09-06 2010-03-25 Zlatko Manolov Sotirov Method of Automatically Tagging Image Data
CN104794663A (zh) * 2015-05-15 2015-07-22 北京景行技术有限公司 一种旅行路线的自动生成系统及方法
CN106096785A (zh) * 2016-06-13 2016-11-09 北京游谱科技发展有限公司 一种基于行程规划的线路定制方法、系统
CN107491450A (zh) * 2016-06-13 2017-12-19 北京游谱科技发展有限公司 一种基于poi的行程修改方法及系统
CN107490385A (zh) * 2017-08-21 2017-12-19 百度在线网络技术(北京)有限公司 出行路线规划方法及其装置
CN107818378A (zh) * 2017-09-07 2018-03-20 北京安维讯信息技术有限公司 一种基于互联网地图和日历的行程规划方法及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170324987A1 (en) * 2013-02-22 2017-11-09 Facebook, Inc. Time-Sensitive Content Update
CN107193790A (zh) * 2016-03-14 2017-09-22 阿里巴巴集团控股有限公司 一种电子游记编辑方法及装置
CN107943774A (zh) * 2017-11-20 2018-04-20 北京百度网讯科技有限公司 文章生成方法和装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
宋卿;戚成琳;张鹏洲;: "知识图谱技术在新闻领域中的应用思考", 中国传媒科技, no. 05 *

Also Published As

Publication number Publication date
CN113590940B (zh) 2023-10-17
CN109740049B (zh) 2021-08-20
CN109740049A (zh) 2019-05-10

Similar Documents

Publication Publication Date Title
CN109740049B (zh) 文章的生成方法和装置
Miah et al. A big data analytics method for tourist behaviour analysis
Duckham et al. Including landmarks in routing instructions
Marine-Roig et al. Tourism analytics with massive user-generated content: A case study of Barcelona
JP6569313B2 (ja) 施設特性を更新する方法、施設をプロファイリングする方法、及びコンピュータ・システム
Sherren et al. Digital archives, big data and image-based culturomics for social impact assessment: Opportunities and challenges
CN106681996B (zh) 确定地理范围内兴趣区域、兴趣点的方法和装置
US20170109615A1 (en) Systems and Methods for Automatically Classifying Businesses from Images
Lyu et al. Big data in action: An overview of big data studies in tourism and hospitality literature
Milias et al. Assessing the influence of point-of-interest features on the classification of place categories
Kurata Potential-of-interest maps for mobile tourist information services
CN110659409B (zh) 兴趣点poi的推荐方法和装置
KR20160123617A (ko) 사용자 맞춤형 여행계획 생성방법, 이를 수행하는 사용자 맞춤형 여행계획 생성 서버 및 이를 저장하는 기록매체
CN111191127B (zh) 一种基于关联分析算法的旅行推荐方法和系统
Pereira et al. crowdsensing in the web: Analyzing the citizen experience in the urban space
Zhou et al. Familiarity-dependent computational modelling of indoor landmark selection for route communication: a ranking approach
Vu et al. Exploration of tourist activities in urban destination using venue check-in data
CN112711645B (zh) 一种位置点信息扩展方法、装置、存储介质和电子设备
JP6956232B2 (ja) 探索システム、探索方法、および探索プログラム
CN110609879A (zh) 兴趣点判重方法、装置、计算机设备及存储介质
Xu et al. Kyoto sightseeing map 2.0 for user-experience oriented tourism
CN109815404B (zh) 基于剪贴板数据的搜索处理方法和装置
Shimada et al. On-site likelihood identification of tweets for tourism information analysis
CN116628335A (zh) 个性化旅游路线定制方法及装置
JP7090779B2 (ja) 情報処理装置、情報処理方法及び情報処理システム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant