CN108717403A - 一种处理方法、装置和用于处理的装置 - Google Patents

一种处理方法、装置和用于处理的装置 Download PDF

Info

Publication number
CN108717403A
CN108717403A CN201810450856.7A CN201810450856A CN108717403A CN 108717403 A CN108717403 A CN 108717403A CN 201810450856 A CN201810450856 A CN 201810450856A CN 108717403 A CN108717403 A CN 108717403A
Authority
CN
China
Prior art keywords
product
theme
field
article
content
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810450856.7A
Other languages
English (en)
Other versions
CN108717403B (zh
Inventor
李丽
詹振
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sogou Technology Development Co Ltd
Original Assignee
Beijing Sogou Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sogou Technology Development Co Ltd filed Critical Beijing Sogou Technology Development Co Ltd
Priority to CN201810450856.7A priority Critical patent/CN108717403B/zh
Publication of CN108717403A publication Critical patent/CN108717403A/zh
Application granted granted Critical
Publication of CN108717403B publication Critical patent/CN108717403B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明实施例提供了一种处理方法、装置和用于处理的装置。其中的方法具体包括:依据关键词,确定文章的主题;依据所述主题,确定所述文章包括的结构字段;所述结构字段包括:产品介绍;针对与所述主题相关的目标产品,确定对应的产品介绍内容;依据所述目标产品和对应的所述产品介绍内容,得到所述文章。本发明实施例可以具备目标产品的评测文章的生成功能,可以节省人工编写文章所花费的成本,且可以提高文章的生成效率。

Description

一种处理方法、装置和用于处理的装置
技术领域
本发明涉及互联网技术领域,尤其涉及一种处理方法、装置和用于处理的装置。
背景技术
互联网技术的发展,让产品有了更多的展示渠道和传播渠道。借助于互联网,目前用户可以通过产品文字描述、产品图片介绍、产品代言人的品牌影响力、产品视频介绍等电子形式来了解产品,由于无法看到产品实物,因此仍然无法了解产品的功能、特点、优势等。
产品评测是一个让用户更好地了解产品的一种形式。产品的评测文章,通常包括产品的功能质量性价比等参考信息,上述参考信息通常由产品的使用者通过亲身体验得到,因此具有较高的可信度。
目前,用户往往通过人工方式编写产品的评测文章,具体地,用户从互联网上查询产品的相关信息,并结合亲身体验,进行评测文章的编写。然而,人工编写评测文章,不仅费时费力,而且容易导致评测文章的质量参差不齐。
发明内容
本发明实施例提供一种处理方法、装置和用于处理的装置,可以具备目标产品的评测文章的生成功能,可以节省人工编写文章所花费的成本,且可以提高文章的生成效率。
为了解决上述问题,本发明实施例公开了一种处理方法,包括:
依据关键词,确定文章的主题;
依据所述主题,确定所述文章包括的结构字段;所述结构字段包括:产品介绍;
针对与所述主题相关的目标产品,确定对应的产品介绍内容;
依据所述目标产品和对应的所述产品介绍内容,得到所述文章。
另一方面,本发明实施例公开了一种处理装置,包括:
主题确定模块,用于依据关键词,确定文章的主题;
结构字段确定模块,用于依据所述主题,确定所述文章包括的结构字段;所述结构字段包括:产品介绍;
产品介绍内容确定模块,用于针对与所述主题相关的目标产品,确定对应的产品介绍内容;以及
文章生成模块,用于依据所述目标产品和对应的所述产品介绍内容,得到所述文章。
再一方面,本发明实施例公开了一种用于处理的装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
依据关键词,确定文章的主题;
依据所述主题,确定所述文章包括的结构字段;所述结构字段包括:产品介绍;
针对与所述主题相关的目标产品,确定对应的产品介绍内容;
依据所述目标产品和对应的所述产品介绍内容,得到所述文章。
又一方面,本发明实施例公开了一种机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如前述一个或多个所述的处理方法。
本发明实施例包括以下优点:
本发明实施例可以依据关键词确定文章的主题,并针对该主题自动生成文章,因此可以节省人工编写文章所花费的成本,且可以提高文章的生成效率。
并且,本发明实施例的文章可以包括:目标产品对应的产品介绍内容,该目标产品与主题相关,例如,主题为“游戏”,目标产品为“游戏”相关的“手机”等产品,这样,本发明实施例可以具备目标产品的评测文章的生成功能。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例的一种处理方法的应用环境的示意;
图2是本发明的一种处理方法实施例一的步骤流程图;
图3是本发明的一种处理方法实施例二的步骤流程图;
图4是本发明的一种处理装置实施例的结构框图;
图5是本发明的一种用于处理的装置800的框图;及
图6是本发明的一些实施例中服务器的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供了一种处理方案,该方案可以依据关键词,确定文章的主题;依据所述主题,确定所述文章包括的结构字段;所述结构字段可以包括:产品介绍;针对与所述主题相关的目标产品,确定对应的产品介绍内容;以及依据所述目标产品和对应的产品介绍内容,得到所述文章。
本发明实施例可以依据关键词确定文章的主题,并针对该主题自动生成文章,因此可以节省人工编写文章所花费的成本,且可以提高文章的生成效率。
并且,本发明实施例的文章可以包括:目标产品对应的产品介绍内容,该目标产品与主题相关,例如,主题为“游戏”,目标产品为“游戏”相关的“手机”、“游戏软件”等产品,这样,本发明实施例可以具备目标产品的评测文章的生成功能。
本发明实施例中,产品可以指能够供给市场,被人们使用和消费,并能满足人们某种需求的任何东西,包括有形的物品、无形的服务、组织、观念或它们的组合。产品可以包括但不限于:服务、软件、硬件或流程性材料等。其中,有形的物品可以包括:商品等,可以理解,本发明实施例对于具体的产品不加以限制。
本发明实施例提供的处理方法可应用于图1所示的应用环境中,如图1所示,客户端100与服务器200位于有线或无线网络中,通过该有线或无线网络,客户端100与服务器200进行数据交互。
可选地,客户端100可以运行在终端上,上述终端具体包括但不限于:智能手机、平板电脑、电子书阅读器、MP3(动态影像专家压缩标准音频层面3,Moving Picture ExpertsGroup Audio Layer III)播放器、MP4(动态影像专家压缩标准音频层面4,Moving PictureExperts Group Audio Layer IV)播放器、膝上型便携计算机、车载电脑、台式计算机、机顶盒、智能电视机、可穿戴设备等等。客户端100可以对应于网站、或者APP(应用程序,Application)。
方法实施例
参照图2,示出了本发明的一种处理方法实施例的步骤流程图,具体可以包括如下步骤:
步骤201、依据关键词,确定文章的主题;
步骤202、依据所述主题,确定所述文章包括的结构字段;所述结构字段可以包括:产品介绍;
步骤203、针对与所述主题相关的目标产品,确定每个目标产品对应的产品介绍内容;
步骤204、依据所述目标产品和所述每个目标产品对应的产品介绍内容,得到所述文章。
图2所示实施例的至少一个步骤可由服务器和/或客户端执行,当然本发明实施例对于各个步骤的具体执行主体不加以限制。
在本发明的一种实施例中,客户端可以接收用户输入的关键词,生成该关键词对应的文章,并展示该文章或者该文章对应的信息(如摘要信息、访问入口信息等)。上述生成该关键词对应的文章的过程可由客户端和/或服务器实现。
其中,该关键词可以为用户在预设场景下输入的关键词,预设场景可以包括但不限于:搜索场景、即时通讯(如微信、QQ等)场景、社交场景(如微博场景)等。例如,在搜索场景下,关键词可以为用户输入的搜索词,本发明实施例可以针对该搜索词生成对应的文章,并展示该文章或者该文章对应的信息。可选地,该文章或者该文章对应的信息可以在搜索结果页中与该搜索词对应的搜索结果被共同展示。
步骤201中,可以将关键词与预设主题进行匹配,将与关键词相匹配的预设主题作为文章的主题。其中,预设主题可以与产品相关,其可由本领域技术人员或者用户设置得到,这样可以使得预设主题具备产品的评测文章的生成功能。
可选地,预设主题的确定依据可以包括:已有评测文章的信息、和/或、历史搜索词。
在一种实施例中,已有评测文章的信息可以包括:已有评测文章的标题、摘要、关键词等信息。则,依据已有评测文章的信息确定预设主题可以包括:对已有评测文章的信息进行分词,统计得到的每个分词在所有已有评测文章中的第一出现频率,并将第一出现频率超过第一阈值的分词作为预设主题。
在另一种实施例中,依据历史搜索词确定预设主题可以包括:统计每个历史搜索词在所有历史搜索词中的第二出现频率,并将第二出现频率超过第二阈值的历史搜索词作为预设主题。
当然,上述预设主题的确定依据只是作为可选实施例,实际上,本领域技术人员或者用户可以根据实际应用需求,设置所需的预设主题,本发明实施例对于预设主题的具体确定依据不加以限制。
可选地,可以从本地或者云服务器获取历史群消息,这样,可以方便的从本地或云端中提取出满足用户提取规则的历史群消息,以便用户回顾查看。
步骤202中,结构字段可以指文章的结构组成,也即文章包括的结构部分。文章可以包括多个结构字段,并由其包括的每个结构字段对应的具体内容构成。在本发明的一种实施例中,可以提供至少一种结构字段,这样,步骤202可以包括:依据主题,从至少一种结构字段中选择一种结构字段,作为待生成文章包括的结构字段。
在本发明的另一种实施例中,可以提供每个预设主题对应的至少一种结构字段,这样,步骤202可以包括:向用户提供步骤201中确定的文章主题对应的多种结构字段,供用户选择,进而可以将用户选择的结构字段作为待生成文章包括的结构字段。
本发明实施例对于结构字段的获取方式不加以限制。根据一种实施例,可以从互联网上获取已有评测文章,对获取的已有评测文章进行分析,以得到已有评测文章的结构字段。根据另一种实施例,可以接收用户上传的结构字段。
本发明实施例的结构字段可以包括:产品介绍,也即,该产品介绍为文章的一种结构部分,该产品介绍用于对与所述主题相关的目标产品进行介绍,以使用户更好地了解产品。
可以理解,所述文章还可以包括除了产品介绍之外的其他结构字段,如标题和/或主题介绍等;其中,标题可以指文章的眉目,其可以为文章总体内容的体现;主题介绍可用于对主题进行介绍和描述,例如,可以对主题进行解释或介绍主题的重要性等。或者,结构字段还可以包括:总结等。
需要说明的是,本发明实施例待生成的文章包括的多个结构字段之间可以具有一定的顺序,例如,标题在主题介绍之前,主题介绍在产品介绍之前,产品介绍在总结之前等等。
在本发明的一种可选实施例中,还可以依据所述主题,确定所述文章的结构框架,所述结构框架包括结构字段和结构字段的排布规则。所述结构框架可以为文章的部分与部分、部分与整体之间的内在联系和外部形式的统一,其可以规定文章包括的多个结构字段、以及多个结构字段之间的排列顺序。可选地,上述结构框架还可以包括:结构字段的简要定义。
本发明实施例可以提供结构框架的如下确定方式:
确定方式1、从互联网上获取已有评测文章,对获取的已有评测文章进行分析,以得到已有评测文章的结构框架;和/或
确定方式2、接收用户上传的结构框架;和/或
确定方式3、向用户提供生成接口,以使用户通过该生成接口生成结构框架。例如,该生成接口可以包括:结构字段的名称、编号、描述等信息对应的输入接口,这样,可以根据用户通过该输入接口提交的信息,生成结构框架。
本发明实施例的结构框架还可以与主题相对应,也即,可以建立主题与结构框架之间的映射关系。
可选地,在生成文章的过程中,可以向用户提供至少一个结构框架,供用户选择,并依据用户选择的结构框架,生成文章。
在本发明实施例的一种示例中,文章的结构框架可以包括若干个结构字段,例如依次可以包括:标题、主题介绍、产品介绍和总结等结构字段。
在本发明实施例的另一种示例中,文章的结构框架依次可以包括:标题、测试者介绍、产品介绍、产品第一印象、短期使用反馈、长期使用反馈和总结等结构字段。可以理解,本发明实施例对于具体的结构框架不加以限制。
步骤203中,目标产品可以与主题相关。例如,主题为“游戏”,目标产品为“游戏”相关的“手机”、“游戏软件”等产品。
本发明实施例中,目标产品的类别可以为预设类别,预设类别可以包括但不限于:家用电器、手机、运营商、数码、电脑、办公、家居、服装、美妆、运动、鞋子、箱包、图书、医药、机票、维修、软件等,该预设类别可由本领域技术人员或者用户根据实际应用需求确定,本发明实施例对于目标产品对应的具体类别不加以限制。
在本发明的一种可选实施例中,可以通过如下步骤确定与所述主题相关的目标产品:将所述主题与产品的属性信息进行匹配;依据属性信息与所述主题相匹配的产品,得到与所述主题相关的目标产品。
产品的属性可以指产品具有的性质。例如,产品的属性可以包括:产品的固有属性和/或产品的社会属性。
其中,产品的固有属性可以包括但不限于:产品的材质、处理工艺、种类、样式、风格、包装、产品规格等。以产品为“手机”为例,产品的固有属性可以包括:屏幕信息、拍照信息、电池信息、存储信息、价格信息、处理器信息等。以产品为“服装”为例,产品的固有属性可以包括:风格、款式、面料、品牌等。
产品的社会属性可以指产品与社会之间的关联属性,如价格、热度、时效度等。其中,热度可以指用户对于产品的关心程度,可以通过产品对应的用户关注行为确定热度,上述用户关注行为包括但不限于:浏览行为、搜索行为、分享行为、购买行为、评价行为等。时效度可以反映产品的时效性,也即产品在时间维度上的有效性,例如,“风扇”在夏季的时效性高于在冬季的时效性,又如,“净化器”在冬季的时效性高于在夏季的时效性等。
本发明实施例可以将所述主题与产品的属性信息进行匹配,以得到属性信息与所述主题相匹配的产品。例如,主题为“大屏幕”,则可以将主题与产品“手机”的屏幕信息进行匹配,以得到屏幕尺寸较大的若干款手机。又如,主题为“待机时间长”,则可以将主题与产品“手机”的电池信息进行匹配,以得到电池容量较大的若干款手机。再如,主题为“声音大字体大”,则可以将主题分词为“声音大”和“字体大”,将“声音大”与产品“手机”的音量信息进行匹配,以及将“字体大”与产品“手机”的字体信息进行匹配,以得到音量信息较大且字体信息较大的若干款手机。
在一种实施例中,若属性信息与所述主题相匹配的产品的数量为一个,则可以直接将这个产品作为与所述主题相关的目标产品。
在另一种实施例中,若属性信息与所述主题相匹配的产品的数量为多个,则上述依据属性信息与所述主题相匹配的产品,得到与所述主题相关的目标产品,具体可以包括:依据所述产品的属性信息,从属性信息与所述主题相匹配的多个产品中确定出与所述主题相关的目标产品。
根据一种实施例,产品的第一属性信息与主题相匹配,可以依据该第一属性信息,对第一属性信息与所述主题相匹配的多个产品进行筛选,以得到目标产品。例如,主题为“大屏幕”,第一属性信息为屏幕尺寸,则目标产品可以为屏幕尺寸最大的一款手机。又如,主题为“声音大字体大”,第一属性信息为音量和字体,则目标产品可以为音量和字体最优的一款手机。其中,第一属性信息可以包括:产品的固有属性;或者,第一属性可以包括:产品的社会属性,如销量属性、热度属性等;或者,第一属性信息可以包括:产品的固有属性和产品的社会属性等。
根据另一种实施例,产品的第一属性信息与主题相匹配,可以依据第二属性信息,对第一属性信息与所述主题相匹配的多个产品进行筛选,以得到目标产品。第一属性信息和第二属性信息可以不同,例如,第一属性信息可以为产品的固有属性,第二属性可以为产品的社会属性;当然,第二属性信息可以为产品的固有属性,第一属性可以为产品的社会属性等;另外,第一属性信息和第二属性信息可以为同一产品所对应不同的固有属性,或者,第一属性信息和第二属性信息可以为同一产品所对应不同的社会属性等。
在本发明的一种可选实施例中,可以依据所述产品的热度和/或时效度,从属性信息与所述主题相匹配的多个产品中确定出与所述主题相关的目标产品。热度和/或时效度可以较好地反映产品的导购性能,因此可以提高目标产品的导购性能,例如,可以从属性信息与所述主题相匹配的多个产品中确定出最新最热的目标产品。当然,产品的热度和/或时效度只是作为筛选依据的示例,本领域技术人员可以根据实际应用需求,采用所需的筛选依据,本发明实施例对于目标产品对应的具体筛选依据不加以限制。
在本发明的一种可选实施例中,可以采用产品知识库保存产品与产品属性之间的映射关系,则在确定与所述主题相关的目标产品的过程中,可以利用该产品知识库,将所述主题与产品的属性信息进行匹配;并依据属性信息与所述主题相匹配的产品,得到与所述主题相关的目标产品。
可选地,获取产品的属性信息的过程可以包括:从互联网上(如电商网站)抓取产品的相关数据(如产品的描述数据),并对产品的相关数据进行分析,以得到产品的属性信息。或者,可以从产品的运营商或者生产商获取产品的属性信息。
在本发明的另一种可选实施例中,在确定与所述主题相关的目标产品的过程中,可以依据主题,从互联网上抓取与主题相关、且导购性能较高的产品,作为目标产品。
步骤203中,与所述主题相关的目标产品可以为一个或多个,本发明实施例可以针对每个目标产品,确定对应的产品介绍内容。
该产品介绍内容用于对与所述主题相关的目标产品进行介绍,以使用户更好地了解产品。
在本发明的一种可选实施例中,步骤203针对与所述主题相关的目标产品,确定对应的产品介绍内容的过程具体可以包括:确定所述目标产品对应的至少一个关键字段;针对一个关键字段,确定对应的字段内容;依据所有关键字段分别对应的字段内容,得到所述目标产品对应的产品介绍内容。
本发明实施例中,关键字段可以指介绍产品所需要的字段,通常一个关键字段可以对应一个或多个段落,关键字段对应的字段内容可以作为产品介绍内容。
在本发明的一种可选实施例中,可以预置产品对应的关键字段,预置的关键字段的含义可与前述的属性信息的含义相匹配,上述关键字段可以包括但不限于:产品特色、产品参数、产品特征、产品标准图片、用户评价、涉及主题描述、购买链接、购买链接标题、购买价格等等。
在确定所述目标产品对应的至少一个关键字段的过程中,可以默认为目标产品获取预置的全部关键字段;或者,可以向用户提供关键字段的选择功能,并接收用户选择的关键字段。
在本发明的一种可选实施例中,确定的关键字段与前述主题相关,也即,确定的关键字段可以包括:与前述主题相关的关键字段,这样,可以提高文章内容与主题的相关性。例如,主题为“游戏”,确定的关键字段为目标产品“手机”的“游戏”字段等。
当然,确定的关键字段也可以与主题不相关,这样,可以提高文章内容的丰富性,进而可以使用户更好地理解文章对应的目标产品。例如,主题为“游戏”,确定的关键字段为目标产品“A手机”的“屏幕”字段、“拍照”字段等。
在本发明的一种可选实施例中,上述针对一个关键字段,确定对应的字段内容,具体可以包括:依据一个关键字段、以及产品相关段落的标签和得分,确定所述一个关键字段的字段内容;所述得分用于表征所述产品相关段落与所述标签之间的匹配度。
产品相关段落可以指产品相关的段落,其可以来自语料,上述语料可以源自互联网或者客户端收集的用户资料。可选地,上述语料可以包括但不限于:网页、文章等,尤其地,上述文章可以包括:评测文章或产品说明书等,评测文章通常包括产品相关段落,该产品相关段落可以与产品的某个字段相关,用于介绍该产品的与该字段相关的内容。
本发明实施例可以针对产品相关段落,确定其对应的标签和得分,其中,产品相关段落在内容方面通常具有一个相对完整的思想,产品相关段落对应的标签可以表征产品相关段落的思想、或者相关字段。在实际应用中,可以通过人工方式确定产品相关段落的标签,或者,可以采用段落分析技术,确定产品相关段落的标签。上述段落分析技术可以包括但不限于:机器学习技术、句法分析技术等。
得分用于表征所述产品相关段落与所述标签之间的匹配度,也即,标签在多大程度上可以表征该产品相关段落,或者,标签与产品相关段落的思想之间的匹配度。上述得分可由人工设置,或者,上述得分可由机器确定,例如,可以通过机器学习技术确定产品相关段落的得分。
可以理解,一个产品相关段落可以对应一个标签或者多个标签,其中,一个产品相关段落可以与任一个标签对应有得分,此种情况下,一个产品相关段落可以对应有多个得分。例如,对于一个产品相关段落而言,其对应的标签和得分分别为:“手机特色”和“85分”、或者“拍照”和“25分”、或者“游戏”和“10分”等。
在本发明的一种可选实施例中,上述确定所述一个关键字段的字段内容,具体可以包括:将一个关键字段与产品相关段落的标签进行匹配;依据所述产品相关段落的得分,从匹配成功的至少一个产品相关段落中确定出目标产品相关段落;依据所述目标产品相关段落的内容,得到所述一个关键字段的字段内容。
本发明实施例将一个关键字段与产品相关段落的标签进行匹配,若匹配成功,则可以说明这个关键字段与该产品相关段落的思想是相匹配的,因此,匹配成功的产品相关段落的内容可以作为关键字段的字段内容的确定依据。
需要说明的是,关键字段对应的目标产品与产品相关段落对应的第一产品可以相同或者不同。在目标产品与第一产品相同的情况下,可以通过参考目标产品已有的产品相关段落,得到关键字段的字段内容。在目标产品与第一产品不同的情况下,目标产品与第一产品的类别可以相同,例如,均为手机类别、或者均为家电类别等,由于类别相同的产品可以具有相匹配的关键字段,因此,第一产品的产品相关段落,也可以起到关键字段的字段内容的参考作用。
在匹配成功的产品相关段落为一个的情况下,可以直接将这个匹配成功的产品相关段落,作为目标产品相关段落。
在匹配成功的产品相关段落为多个的情况下,可以依据所述产品相关段落的得分,从匹配成功的多个产品相关段落中选择出目标产品相关段落。具体地,得分越高,则被选择的概率越大,因此,在本发明的一种实施例中,可以从匹配成功的多个产品相关段落中选择出得分最高的产品相关段落,作为目标产品相关段落。
根据一种实施例,上述依据所述目标产品相关段落的内容,得到所述一个关键字段的字段内容,具体可以包括:将所述目标产品相关段落的内容,作为所述一个关键字段的字段内容。
根据另一种实施例,上述依据所述目标产品相关段落的内容,得到所述一个关键字段的字段内容,具体可以包括:将所述目标产品相关段落的内容输入内容生成模型,以得到所述内容生成模型输出的所述一个关键字段的字段内容;其中,所述内容生成模型对应的训练数据包括:若干个段落的内容。
可选地,所述内容生成模型可以对语料库中的数据进行统计,获得大量的转换概率分布,然后对于输入的语料,根据转换概率分布将其转换为对应的输出段落。由于所述内容生成模型依据所述内容生成模型得到,故可以使得输出段落具有较好的句子结构,因此可以提高输出段落的质量。上述语料库中的语料可以包括:若干个段落的内容,本发明实施例对于具体的语料不加以限制。
所述内容生成模型可以为深度学习模型,其可以利用深度学习技术,对若干个段落的内容进行训练,以具备新段落内容的输出能力。深度学习技术可以将词映射到一个向量,越相似的两个词向量会越接近。
所述内容生成模型的类型可以包括但不限于:RNN(循环神经网络,Recurrentneural Network)、GAN(生成式对抗网络,Generative Adversarial Networks)等,可以理解,本发明实施例对于所述内容生成模型的具体类型不加以限制。
在实际应用中,可以将得分较高的若干个目标产品相关段落,输入内容生成模型,以得到内容生成模型输出的新段落内容。由于内容生成模型采用深度学习技术得到,因此可以使得新段落内容与目标产品相关段落的内容不同,因此可以避免对于已有文章内容直接复制带来的雷同问题,提高字段内容的新颖性。
可以理解,上述依据关键字段对应的字段内容,得到所述目标产品对应的产品介绍内容,只是作为确定目标产品对应的产品介绍内容的可选实施例,实际上,本领域技人员可以采用其他实施例确定目标产品对应的产品介绍内容,例如,在一种其他实施例中,可以依据所述目标产品的已有文章,并该已有文章中获取产品介绍内容等,可以理解,本发明实施例对于确定目标产品对应的产品介绍内容的具体过程不加以限制。
步骤204中,可以将所述产品介绍内容添加到文章中。若涉及到多个目标产品的产品介绍内容,则可以在文章中对多个目标产品的产品介绍内容进行顺序排布(先后排布)、或者对比排布。
在本发明的一种实施例中,步骤204可以将所述产品介绍内容填充到待生成文章的结构框架中。也即,步骤204依据所述目标产品和对应的所述产品介绍内容,得到所述文章,具体可以包括:依据所述文章的结构框架包括的结构字段的排布规则和所述产品介绍内容,得到所述文章。
在本发明的另一种实施例中,步骤204可以建立一个新文章,并按照新文章的结构框架的规定(如结构字段之间的顺序),将所述产品介绍内容填充到该新文章中。
本发明实施例对于文章的内容格式不加以限制,上述内容格式可以包括但不限于:文本、表格、图片等。例如,“产品参数”字段所对应字段内容的格式可以包括:表格,也即可以通过表格介绍产品参数。又如,“屏幕”字段、或者“拍照”字段所对应字段内容的格式可以包括:图片,例如可以展示产品的屏幕图片,又如可以展示产品的拍摄效果图等。
综上,本发明实施例的处理方法,可以依据关键词确定文章的主题,并针对该主题自动生成文章,因此可以节省人工编写文章所花费的成本,且可以提高文章的生成效率。
并且,本发明实施例的文章可以包括:目标产品对应的产品介绍内容,该目标产品与主题相关,例如,主题为“游戏”,目标产品为“游戏”相关的“手机”等产品,这样,本发明实施例可以具备目标产品的评测文章的生成功能。
为使本领域技术人员更好地理解本发明实施例,参照图3,示出了本发明的一种处理方法实施例的步骤流程图,该方法具体可以包括:
步骤301、依据用户的关键词,确定文章的主题;
假设用户的关键词为“游戏”,则可以确定文章的主题为“游戏”。
步骤302、依据上述主题,确定上述文章的结构框架,所述结构框架可以包括:结构字段以及结构字段的排布规则;
例如,所述结构框架可以包括依次排布的如下结构字段:标题、主题介绍和产品介绍;
步骤303、确定上述结构字段标题对应的内容和上述结构字段主题介绍对应的内容;
例如,结构字段标题对应的内容可以为“史上最强,最值得买的游戏手机”。结构字段主题介绍对应的内容可以为“玩游戏通常是人们进行放松的一种方式,随着网络和手游的兴起,游戏也成为一部分人的兴趣。工作之余,通过玩电竞游戏进行放松,也成为交友的一种渠道。随着手游的兴起,在对于手机的选择上,部分人更看重手机对于游戏的支持功能”。上述标题的内容和上述主题介绍的内容可以通过抓取相关网页信息得到。
上述标题的内容和上述主题介绍的内容对应的确定依据可以包括:主题;或者,上述标题的内容和上述主题介绍的内容的确定依据可以包括:主题、主题对应的产品类别;或者,上述标题的内容和上述主题介绍的内容的确定依据可以包括:主题、主题对应的目标产品。
步骤304、确定与上述主题相关的目标产品;
在本发明的一种实施例中,可以确定与上述主题相匹配、且导购性能最好的产品,作为目标产品,如在当前时间段内热度和/或时效度较优的N款手机,如手机型号A和手机型号B等,其中,N为自然数。
步骤305、确定所述目标产品对应的至少一个关键字段;针对一个关键字段,确定对应的字段内容;依据所有关键字段分别对应的字段内容,得到所述目标产品对应的产品介绍内容;
在本发明的一种示例中,上述关键字段可以包括:产品特色、产品参数、产品特征、产品标准图片和用户评价等。其中,产品特征可以包括:与主题相关的游戏特征、以及与主题不相关的全面屏特征和拍照特征。
上述关键字段的内容如下:
产品特色:Face Wake面部识别、指纹识别、全面屏和全局护眼模式。
产品参数:
游戏特征:对于手机,硬件性能向来都是消费者关注的焦点,并且这也是影响用户的直观因素之一,vivo Y79全面屏手机搭载了高通骁龙八核处理器,该处理器在确保性能的同时也做到了低功耗的均衡表现。并且配合vivo独特的游戏防扰模式可以防止电话、微信、QQ等强制弹出的信息中断游戏操作,为用户提供专业和专注的游戏体验。这对于喜欢玩游戏的小伙伴们而言算的上是一大福利。
全面屏特征:为了进一步提升日常使用体验,vivo Y79全面屏手机也加入了FaceWake面部识别,该技术可识别用户面部128个特征,从而能够进行多角度解锁,日常使用的过程中,相当便利!
拍照特征:手机型号A仍以拍照作为亮点,前置2400W像素摄像头与柔光灯,让拍照不受昏暗环境的限制。同时,在美颜算法上有所改善,加入的知性美颜功能能够识别男女,制定不同美颜方案,拍出来的照片显得更自然。
用户评价:优点:速度快、外观漂亮、运行流畅、运行速度很快缺点:分辨率有点低、屏幕小。
步骤306、依据所述结构框架中结构字段的排布规则,对所述标题的内容、主题介绍的内容和所述产品介绍内容进行排布,以得到所述文章。
具体地,可以按照所述结构框架中各结构字段的顺序,对所述标题、主题介绍和所述产品介绍内容进行组合,并将组合结果作为文章内容,最终得到所述文章。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的运动动作并不一定是本发明实施例所必须的。
装置实施例
参照图4,示出了本发明的一种处理装置实施例的结构框图,具体可以包括:
主题确定模块401,用于依据关键词,确定文章的主题;
结构字段确定模块402,用于依据所述主题,确定所述文章包括的结构字段;所述结构字段可以包括:产品介绍;
产品介绍内容确定模块403,用于针对与所述主题相关的目标产品,确定对应的产品介绍内容;以及
文章生成模块404,用于依据所述目标产品和对应的所述产品介绍内容,得到所述文章。
可选地,所述装置还可以包括:
匹配模块,用于将所述主题与产品的属性信息进行匹配;
目标产品确定模块,用于依据属性信息与所述主题相匹配的产品,得到与所述主题相关的目标产品。
可选地,所述目标产品确定模块可以包括:
产品确定子模块,用于依据所述产品的属性信息,从属性信息与所述主题相匹配的多个产品中确定出与所述主题相关的目标产品。
可选地,所述产品介绍内容确定模块可以包括:
关键字段确定子模块,用于确定所述目标产品对应的至少一个关键字段;
字段内容确定子模块,用于针对一个关键字段,确定对应的字段内容;以及
介绍内容确定子模块,用于依据所有关键字段分别对应的字段内容,得到所述目标产品对应的产品介绍内容。
可选地,所述字段内容确定子模块可以包括:
确定单元,用于依据一个关键字段、以及产品相关段落的标签和得分,确定所述一个关键字段的字段内容;所述得分用于表征所述产品相关段落与所述标签之间的匹配度。
可选地,所述确定单元可以包括:
标签字段匹配子单元,用于将一个关键字段与产品相关段落的标签进行匹配;
选择子单元,用于依据所述产品相关段落的得分,从匹配成功的至少一个产品相关段落中确定出目标产品相关段落;以及
参考确定子单元,用于依据所述目标产品相关段落的内容,得到所述一个关键字段的字段内容。
可选地,所述参考确定子单元可以包括:
模型确定单元,用于将所述目标产品相关段落的内容输入内容生成模型,以得到所述内容生成模型输出的所述一个关键字段的字段内容;其中,所述内容生成模型对应的训练数据可以包括:若干个段落的内容。
可选地,所述结构字段确定模块可以包括:
结构框架确定子模块,用于依据所述主题,确定所述文章的结构框架,所述结构框架可以包括结构字段和结构字段的排布规则;所述结构字段可以包括:产品介绍;
则,所述文章生成模块可以包括:
生成子模块,用于依据所述文章的结构框架可以包括的结构字段的排布规则和所述产品介绍内容,得到所述文章。
可选地,所述结构字段还可以包括:标题和/或主题介绍;
所述装置还可以包括:
其他内容确定模块,用于确定所述标题对应的内容和所述主题介绍对应的内容;
所述生成子模块可以包括:
排布单元,用于依据所述结构字段的排布规则,对所述标题对应的内容、所述主题介绍对应的内容以及所述产品介绍内容按照规则进行排布,得到所述文章。
可选地,所述文章的主题源自预设主题;
所述装置还可以包括:
第一预设主题确定模块,用于对已有评测文章的信息进行分词,统计得到的分词在所有已有评测文章中的第一出现频率,并将第一出现频率超过第一阈值的分词作为预设主题;或者
第二预设主题确定模块,用于统计历史搜索词在所有历史搜索词中的第二出现频率,并将第二出现频率超过第二阈值的历史搜索词作为预设主题。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
本发明实施例提供了一种用于处理的装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:依据关键词,确定文章的主题;依据所述主题,确定所述文章包括的结构字段;所述结构字段包括:产品介绍;针对与所述主题相关的目标产品,确定对应的产品介绍内容;依据所述目标产品和对应的所述产品介绍内容,得到所述文章。
图5是根据一示例性实施例示出的一种用于处理的装置800的框图。例如,装置800可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图5,装置800可以包括以下一个或多个组件:处理组件802,存储器804,电源组件806,多媒体组件808,音频组件810,输入/输出(I/O)的接口812,传感器组件814,以及通信组件816。
处理组件802通常控制装置800的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理元件802可以包括一个或多个处理器820来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件802可以包括一个或多个模块,便于处理组件802和其他组件之间的交互。例如,处理组件802可以包括多媒体模块,以方便多媒体组件808和处理组件802之间的交互。
存储器804被配置为存储各种类型的数据以支持在设备800的操作。这些数据的示例包括用于在装置800上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件806为装置800的各种组件提供电力。电源组件806可以包括电源管理系统,一个或多个电源,及其他与为装置800生成、管理和分配电力相关联的组件。
多媒体组件808包括在所述装置800和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件808包括一个前置摄像头和/或后置摄像头。当设备800处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件810被配置为输出和/或输入音频信号。例如,音频组件810包括一个麦克风(MIC),当装置800处于操作模式,如呼叫模式、记录模式和语音处理模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中,音频组件810还包括一个扬声器,用于输出音频信号。
I/O接口812为处理组件802和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件814包括一个或多个传感器,用于为装置800提供各个方面的状态评估。例如,传感器组件814可以检测到设备800的打开/关闭状态,组件的相对定位,例如所述组件为装置800的显示器和小键盘,传感器组件814还可以检测装置800或装置800一个组件的位置改变,用户与装置800接触的存在或不存在,装置800方位或加速/减速和装置800的温度变化。传感器组件814可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件814还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件814还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件816被配置为便于装置800和其他设备之间有线或无线方式的通信。装置800可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件816经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件816还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频处理(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置800可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器804,上述指令可由装置800的处理器820执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
图6是本发明的一些实施例中服务器的结构示意图。该服务器1900可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(central processingunits,CPU)1922(例如,一个或一个以上处理器)和存储器1932,一个或一个以上存储应用程序1942或数据1944的存储介质1930(例如一个或一个以上海量存储设备)。其中,存储器1932和存储介质1930可以是短暂存储或持久存储。存储在存储介质1930的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器1922可以设置为与存储介质1930通信,在服务器1900上执行存储介质1930中的一系列指令操作。
服务器1900还可以包括一个或一个以上电源1926,一个或一个以上有线或无线网络接口1950,一个或一个以上输入输出接口1958,一个或一个以上键盘1956,和/或,一个或一个以上操作系统1941,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
一种非临时性计算机可读存储介质,当所述存储介质中的指令由装置(服务器或者终端)的处理器执行时,使得装置能够执行图2或图3所示的处理方法。
一种非临时性计算机可读存储介质,当所述存储介质中的指令由装置(服务器或者终端)的处理器执行时,使得装置能够执行一种处理方法,所述方法包括:依据关键词,确定文章的主题;依据所述主题,确定所述文章包括的结构字段;所述结构字段包括:产品介绍;针对与所述主题相关的目标产品,确定对应的产品介绍内容;依据所述目标产品和对应的所述产品介绍内容,得到所述文章。
本发明实施例公开了A1、一种处理方法,所述方法包括:
依据关键词,确定文章的主题;
依据所述主题,确定所述文章包括的结构字段;所述结构字段包括:产品介绍;
针对与所述主题相关的目标产品,确定对应的产品介绍内容;
依据所述目标产品和对应的所述产品介绍内容,得到所述文章。
A2、根据A1所述的方法,通过如下步骤确定与所述主题相关的目标产品:
将所述主题与产品的属性信息进行匹配;
依据属性信息与所述主题相匹配的产品,得到与所述主题相关的目标产品。
A3、根据A2所述的方法,所述依据属性信息与所述主题相匹配的产品,得到与所述主题相关的目标产品,包括:
依据所述产品的属性信息,从属性信息与所述主题相匹配的多个产品中确定出与所述主题相关的目标产品。
A4、根据A1至A3中任一所述的方法,所述确定对应的产品介绍内容,包括:
确定所述目标产品对应的至少一个关键字段;
针对一个关键字段,确定对应的字段内容;
依据所有关键字段分别对应的字段内容,得到所述目标产品对应的产品介绍内容。
A5、根据A4所述的方法,所述针对一个关键字段,确定对应的字段内容,包括:
依据一个关键字段、以及产品相关段落的标签和得分,确定所述一个关键字段的字段内容;所述得分用于表征所述产品相关段落与所述标签之间的匹配度。
A6、根据A5所述的方法,所述确定所述一个关键字段的字段内容,包括:
将一个关键字段与产品相关段落的标签进行匹配;
依据所述产品相关段落的得分,从匹配成功的至少一个产品相关段落中确定出目标产品相关段落;
依据所述目标产品相关段落的内容,得到所述一个关键字段的字段内容。
A7、根据A6所述的方法,所述依据所述目标产品相关段落的内容,得到所述一个关键字段的字段内容,包括:
将所述目标产品相关段落的内容输入内容生成模型,以得到所述内容生成模型输出的所述一个关键字段的字段内容;其中,所述内容生成模型对应的训练数据包括:若干个段落的内容。
A8、根据A1至A3中任一所述的方法,所述依据所述主题,确定所述文章包括的结构字段包括:依据所述主题,确定所述文章的结构框架,所述结构框架包括结构字段和结构字段的排布规则;所述结构字段包括:产品介绍;
则,所述依据所述目标产品和对应的所述产品介绍内容,得到所述文章,包括:
依据所述文章的结构框架包括的结构字段的排布规则和所述产品介绍内容,得到所述文章。
A9、根据A8所述的方法,所述结构字段还包括:标题和/或主题介绍;
所述方法还包括:确定所述标题对应的内容和所述主题介绍对应的内容;
所述依据所述文章的结构框架包括的结构字段的排布规则和所述产品介绍内容,得到所述文章,包括:
依据所述结构字段的排布规则,对所述标题对应的内容、所述主题介绍对应的内容以及所述产品介绍内容按照规则进行排布,得到所述文章。
A10、根据A1至A3中任一所述的方法,所述文章的主题源自预设主题;
通过如下步骤确定所述预设主题:
对已有评测文章的信息进行分词,统计得到的分词在所有已有评测文章中的第一出现频率,并将第一出现频率超过第一阈值的分词作为预设主题;或者
统计历史搜索词在所有历史搜索词中的第二出现频率,并将第二出现频率超过第二阈值的历史搜索词作为预设主题。
本发明实施例公开了B11、一种处理装置,包括:
主题确定模块,用于依据关键词,确定文章的主题;
结构字段确定模块,用于依据所述主题,确定所述文章包括的结构字段;所述结构字段包括:产品介绍;
产品介绍内容确定模块,用于针对与所述主题相关的目标产品,确定对应的产品介绍内容;以及
文章生成模块,用于依据所述目标产品和对应的所述产品介绍内容,得到所述文章。
B12、根据B11所述的装置,所述装置还包括:
匹配模块,用于将所述主题与产品的属性信息进行匹配;
目标产品确定模块,用于依据属性信息与所述主题相匹配的产品,得到与所述主题相关的目标产品。
B13、根据B12所述的装置,所述目标产品确定模块包括:
产品确定子模块,用于依据所述产品的属性信息,从属性信息与所述主题相匹配的多个产品中确定出与所述主题相关的目标产品。
B14、根据B11至B13中任一所述的装置,所述产品介绍内容确定模块包括:
关键字段确定子模块,用于确定所述目标产品对应的至少一个关键字段;
字段内容确定子模块,用于针对一个关键字段,确定对应的字段内容;以及
介绍内容确定子模块,用于依据所有关键字段分别对应的字段内容,得到所述目标产品对应的产品介绍内容。
B15、根据B14所述的装置,所述字段内容确定子模块包括:
确定单元,用于依据一个关键字段、以及产品相关段落的标签和得分,确定所述一个关键字段的字段内容;所述得分用于表征所述产品相关段落与所述标签之间的匹配度。
B16、根据B15所述的装置,所述确定单元包括:
标签字段匹配子单元,用于将一个关键字段与产品相关段落的标签进行匹配;
选择子单元,用于依据所述产品相关段落的得分,从匹配成功的至少一个产品相关段落中确定出目标产品相关段落;以及
参考确定子单元,用于依据所述目标产品相关段落的内容,得到所述一个关键字段的字段内容。
B17、根据B16所述的装置,所述参考确定子单元包括:
模型确定单元,用于将所述目标产品相关段落的内容输入内容生成模型,以得到所述内容生成模型输出的所述一个关键字段的字段内容;其中,所述内容生成模型对应的训练数据包括:若干个段落的内容。
B18、根据B11至B13中任一所述的装置,所述结构字段确定模块包括:
结构框架确定子模块,用于依据所述主题,确定所述文章的结构框架,所述结构框架包括结构字段和结构字段的排布规则;所述结构字段包括:产品介绍;
则,所述文章生成模块包括:
生成子模块,用于依据所述文章的结构框架包括的结构字段的排布规则和所述产品介绍内容,得到所述文章。
B19、根据B18所述的装置,所述结构字段还包括:标题和/或主题介绍;
所述装置还包括:
其他内容确定模块,用于确定所述标题对应的内容和所述主题介绍对应的内容;
所述生成子模块包括:
排布单元,用于依据所述结构字段的排布规则,对所述标题对应的内容、所述主题介绍对应的内容以及所述产品介绍内容按照规则进行排布,得到所述文章。
B20、根据B11至B13中任一所述的装置,所述文章的主题源自预设主题;
所述装置还包括:
第一预设主题确定模块,用于对已有评测文章的信息进行分词,统计得到的分词在所有已有评测文章中的第一出现频率,并将第一出现频率超过第一阈值的分词作为预设主题;或者
第二预设主题确定模块,用于统计历史搜索词在所有历史搜索词中的第二出现频率,并将第二出现频率超过第二阈值的历史搜索词作为预设主题。
本发明实施例公开了C21、一种用于处理的装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
依据关键词,确定文章的主题;
依据所述主题,确定所述文章包括的结构字段;所述结构字段包括:产品介绍;
针对与所述主题相关的目标产品,确定对应的产品介绍内容;
依据所述目标产品和对应的所述产品介绍内容,得到所述文章。
C22、根据C21所述的装置,所述装置还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
将所述主题与产品的属性信息进行匹配;
依据属性信息与所述主题相匹配的产品,得到与所述主题相关的目标产品。
C23、根据C22所述的装置,所述依据属性信息与所述主题相匹配的产品,得到与所述主题相关的目标产品,包括:
依据所述产品的属性信息,从属性信息与所述主题相匹配的多个产品中确定出与所述主题相关的目标产品。
C24、根据C21至C23中任一所述的装置,所述确定对应的产品介绍内容,包括:
确定所述目标产品对应的至少一个关键字段;
针对一个关键字段,确定对应的字段内容;
依据所有关键字段分别对应的字段内容,得到所述目标产品对应的产品介绍内容。
C25、根据C24所述的装置,所述针对一个关键字段,确定对应的字段内容,包括:
依据一个关键字段、以及产品相关段落的标签和得分,确定所述一个关键字段的字段内容;所述得分用于表征所述产品相关段落与所述标签之间的匹配度。
C26、根据C25所述的装置,所述确定所述一个关键字段的字段内容,包括:
将一个关键字段与产品相关段落的标签进行匹配;
依据所述产品相关段落的得分,从匹配成功的至少一个产品相关段落中确定出目标产品相关段落;
依据所述目标产品相关段落的内容,得到所述一个关键字段的字段内容。
C27、根据C26所述的装置,所述依据所述目标产品相关段落的内容,得到所述一个关键字段的字段内容,包括:
将所述目标产品相关段落的内容输入内容生成模型,以得到所述内容生成模型输出的所述一个关键字段的字段内容;其中,所述内容生成模型对应的训练数据包括:若干个段落的内容。
C28、根据C21至C23中任一所述的装置,所述依据所述主题,确定所述文章包括的结构字段包括:依据所述主题,确定所述文章的结构框架,所述结构框架包括结构字段和结构字段的排布规则;所述结构字段包括:产品介绍;
则,所述依据所述目标产品和对应的所述产品介绍内容,得到所述文章,包括:
依据所述文章的结构框架包括的结构字段的排布规则和所述产品介绍内容,得到所述文章。
C29、根据C28所述的装置,所述结构字段还包括:标题和/或主题介绍;
所述装置还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
确定所述标题对应的内容和所述主题介绍对应的内容;
所述依据所述文章的结构框架包括的结构字段的排布规则和所述产品介绍内容,得到所述文章,包括:
依据所述结构字段的排布规则,对所述标题对应的内容、所述主题介绍对应的内容以及所述产品介绍内容按照规则进行排布,得到所述文章。
C30、根据C21至C23中任一所述的装置,所述文章的主题源自预设主题;
所述装置还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
对已有评测文章的信息进行分词,统计得到的分词在所有已有评测文章中的第一出现频率,并将第一出现频率超过第一阈值的分词作为预设主题;或者
统计历史搜索词在所有历史搜索词中的第二出现频率,并将第二出现频率超过第二阈值的历史搜索词作为预设主题。
本发明实施例公开了D31、一种机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如D1至D10中一个或多个所述的处理方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本发明旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
以上对本发明所提供的一种处理方法、一种处理装置和一种用于处理的装置,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (11)

1.一种处理方法,其特征在于,所述方法包括:
依据关键词,确定文章的主题;
依据所述主题,确定所述文章包括的结构字段;所述结构字段包括:产品介绍;
针对与所述主题相关的目标产品,确定对应的产品介绍内容;
依据所述目标产品和对应的所述产品介绍内容,得到所述文章。
2.根据权利要求1所述的方法,其特征在于,通过如下步骤确定与所述主题相关的目标产品:
将所述主题与产品的属性信息进行匹配;
依据属性信息与所述主题相匹配的产品,得到与所述主题相关的目标产品。
3.根据权利要求2所述的方法,其特征在于,所述依据属性信息与所述主题相匹配的产品,得到与所述主题相关的目标产品,包括:
依据所述产品的属性信息,从属性信息与所述主题相匹配的多个产品中确定出与所述主题相关的目标产品。
4.根据权利要求1至3中任一所述的方法,其特征在于,所述确定对应的产品介绍内容,包括:
确定所述目标产品对应的至少一个关键字段;
针对一个关键字段,确定对应的字段内容;
依据所有关键字段分别对应的字段内容,得到所述目标产品对应的产品介绍内容。
5.根据权利要求4所述的方法,其特征在于,所述针对一个关键字段,确定对应的字段内容,包括:
依据一个关键字段、以及产品相关段落的标签和得分,确定所述一个关键字段的字段内容;所述得分用于表征所述产品相关段落与所述标签之间的匹配度。
6.根据权利要求5所述的方法,其特征在于,所述确定所述一个关键字段的字段内容,包括:
将一个关键字段与产品相关段落的标签进行匹配;
依据所述产品相关段落的得分,从匹配成功的至少一个产品相关段落中确定出目标产品相关段落;
依据所述目标产品相关段落的内容,得到所述一个关键字段的字段内容。
7.根据权利要求6所述的方法,其特征在于,所述依据所述目标产品相关段落的内容,得到所述一个关键字段的字段内容,包括:
将所述目标产品相关段落的内容输入内容生成模型,以得到所述内容生成模型输出的所述一个关键字段的字段内容;其中,所述内容生成模型对应的训练数据包括:若干个段落的内容。
8.根据权利要求1至3中任一所述的方法,其特征在于,所述依据所述主题,确定所述文章包括的结构字段包括:依据所述主题,确定所述文章的结构框架,所述结构框架包括结构字段和结构字段的排布规则;所述结构字段包括:产品介绍;
则,所述依据所述目标产品和对应的所述产品介绍内容,得到所述文章,包括:
依据所述文章的结构框架包括的结构字段的排布规则和所述产品介绍内容,得到所述文章。
9.一种处理装置,其特征在于,包括:
主题确定模块,用于依据关键词,确定文章的主题;
结构字段确定模块,用于依据所述主题,确定所述文章包括的结构字段;所述结构字段包括:产品介绍;
产品介绍内容确定模块,用于针对与所述主题相关的目标产品,确定对应的产品介绍内容;以及
文章生成模块,用于依据所述目标产品和对应的所述产品介绍内容,得到所述文章。
10.一种用于处理的装置,其特征在于,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
依据关键词,确定文章的主题;
依据所述主题,确定所述文章包括的结构字段;所述结构字段包括:产品介绍;
针对与所述主题相关的目标产品,确定对应的产品介绍内容;
依据所述目标产品和对应的所述产品介绍内容,得到所述文章。
11.一种机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如权利要求1至8中一个或多个所述的处理方法。
CN201810450856.7A 2018-05-11 2018-05-11 一种处理方法、装置和用于处理的装置 Active CN108717403B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810450856.7A CN108717403B (zh) 2018-05-11 2018-05-11 一种处理方法、装置和用于处理的装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810450856.7A CN108717403B (zh) 2018-05-11 2018-05-11 一种处理方法、装置和用于处理的装置

Publications (2)

Publication Number Publication Date
CN108717403A true CN108717403A (zh) 2018-10-30
CN108717403B CN108717403B (zh) 2022-07-08

Family

ID=63899769

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810450856.7A Active CN108717403B (zh) 2018-05-11 2018-05-11 一种处理方法、装置和用于处理的装置

Country Status (1)

Country Link
CN (1) CN108717403B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110297906A (zh) * 2019-06-28 2019-10-01 谭浩 生成访谈报告的方法、计算机可读存储介质和终端设备
CN111008522A (zh) * 2019-12-11 2020-04-14 浙江大搜车软件技术有限公司 文章自动撰写方法、装置、计算机设备和存储介质
CN111046645A (zh) * 2019-12-11 2020-04-21 浙江大搜车软件技术有限公司 生成文章的方法、装置、计算机设备和存储介质
CN113919328A (zh) * 2021-09-30 2022-01-11 北京搜狗科技发展有限公司 一种生成文章标题的方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106503255A (zh) * 2016-11-15 2017-03-15 科大讯飞股份有限公司 基于描述文本自动生成文章的方法及系统
CN106874248A (zh) * 2017-01-22 2017-06-20 百度在线网络技术(北京)有限公司 基于人工智能的文章生成方法和装置
CN107133210A (zh) * 2017-04-20 2017-09-05 中国科学院上海高等研究院 方案文本生成方法及系统
CN107145482A (zh) * 2017-03-28 2017-09-08 百度在线网络技术(北京)有限公司 基于人工智能的文章生成方法及装置、设备与可读介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106503255A (zh) * 2016-11-15 2017-03-15 科大讯飞股份有限公司 基于描述文本自动生成文章的方法及系统
CN106874248A (zh) * 2017-01-22 2017-06-20 百度在线网络技术(北京)有限公司 基于人工智能的文章生成方法和装置
CN107145482A (zh) * 2017-03-28 2017-09-08 百度在线网络技术(北京)有限公司 基于人工智能的文章生成方法及装置、设备与可读介质
CN107133210A (zh) * 2017-04-20 2017-09-05 中国科学院上海高等研究院 方案文本生成方法及系统

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110297906A (zh) * 2019-06-28 2019-10-01 谭浩 生成访谈报告的方法、计算机可读存储介质和终端设备
CN110297906B (zh) * 2019-06-28 2021-10-08 谭浩 生成访谈报告的方法、计算机可读存储介质和终端设备
CN111008522A (zh) * 2019-12-11 2020-04-14 浙江大搜车软件技术有限公司 文章自动撰写方法、装置、计算机设备和存储介质
CN111046645A (zh) * 2019-12-11 2020-04-21 浙江大搜车软件技术有限公司 生成文章的方法、装置、计算机设备和存储介质
CN113919328A (zh) * 2021-09-30 2022-01-11 北京搜狗科技发展有限公司 一种生成文章标题的方法及装置

Also Published As

Publication number Publication date
CN108717403B (zh) 2022-07-08

Similar Documents

Publication Publication Date Title
CN110019961A (zh) 视频处理方法和装置、用于视频处理的装置
CN109800325A (zh) 视频推荐方法、装置和计算机可读存储介质
CN108717403A (zh) 一种处理方法、装置和用于处理的装置
CN110188177A (zh) 对话生成方法及装置
CN111638832A (zh) 信息展示方法、装置、系统、电子设备及存储介质
CN110019888A (zh) 一种搜索方法及装置
CN106296690A (zh) 图像素材的质量评估方法及装置
CN108121736A (zh) 一种主题词确定模型的建立方法、装置及电子设备
CN108345667A (zh) 一种搜索方法及相关装置
CN108734096A (zh) 一种数据处理方法、装置和用于数据处理的装置
CN108287921A (zh) 信息推荐方法及装置
CN109961787A (zh) 确定采集结束时间的方法及装置
CN110222256A (zh) 一种信息推荐方法、装置和用于信息推荐的装置
CN108985176A (zh) 图像生成方法及装置
CN107515870A (zh) 一种搜索方法和装置、一种用于搜索的装置
CN109429078A (zh) 视频处理方法和装置、用于视频处理的装置
CN108090206A (zh) 评论信息的排序方法及装置、电子设备
CN109670077A (zh) 视频推荐方法、装置和计算机可读存储介质
CN108664336A (zh) 推荐方法和装置、用于推荐的装置
US20190083886A1 (en) Dynamic Modification of Audio Playback in Games
CN109961094A (zh) 样本获取方法、装置、电子设备及可读存储介质
CN109429077A (zh) 视频处理方法和装置、用于视频处理的装置
CN109582869A (zh) 一种数据处理方法、装置和用于数据处理的装置
CN108924644A (zh) 视频片段提取方法及装置
CN110309327A (zh) 音频生成方法、装置以及用于音频的生成装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant