CN113688604B - 文本生成方法、装置、电子设备和介质 - Google Patents
文本生成方法、装置、电子设备和介质 Download PDFInfo
- Publication number
- CN113688604B CN113688604B CN202010421940.3A CN202010421940A CN113688604B CN 113688604 B CN113688604 B CN 113688604B CN 202010421940 A CN202010421940 A CN 202010421940A CN 113688604 B CN113688604 B CN 113688604B
- Authority
- CN
- China
- Prior art keywords
- information
- target
- target object
- determining
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 42
- 230000006870 function Effects 0.000 description 31
- 238000004590 computer program Methods 0.000 description 11
- 230000006399 behavior Effects 0.000 description 10
- 230000015654 memory Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 8
- 238000004891 communication Methods 0.000 description 7
- 238000012545 processing Methods 0.000 description 5
- 230000014509 gene expression Effects 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 238000012913 prioritisation Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 238000009472 formulation Methods 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 239000000758 substrate Substances 0.000 description 2
- 108010001267 Protein Subunits Proteins 0.000 description 1
- 244000062793 Sorghum vulgare Species 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 235000019713 millet Nutrition 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/34—Browsing; Visualisation therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0641—Shopping interfaces
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- General Engineering & Computer Science (AREA)
- Marketing (AREA)
- Computational Linguistics (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Business, Economics & Management (AREA)
- General Health & Medical Sciences (AREA)
- Development Economics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- User Interface Of Digital Computer (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本公开提供了一种文本生成方法,包括:获取关于目标对象的描述信息,基于描述信息确定关于目标对象的第一目标信息,获取用户信息,基于用户信息和描述信息确定关于目标对象的第二目标信息,其中,不同用户对应的第二目标信息不同,以及基于第一目标信息和第二目标信息,生成目标文本。
Description
技术领域
本公开涉及计算机技术领域,更具体地,涉及一种文本生成方法、装置、电子设备和介质。
背景技术
随着互联网的快速发展和高度普及,电子商务在人们日常生活和工作中占有越来越重要的地位。目前,电子商务平台上的商品越来越丰富,面对商品数量庞大的购物平台,为用户提供有效的商品展示和描述显得尤为重要。
然而,由于终端设备的显示屏尺寸的限制,商品展示页面往往被图片占据大部分位置,只有较小的空间可以用来展示文字信息,不利于用户对于文字信息的接收。尤其对于外观同质化严重的商品(冰箱、洗衣机等),用户通常依赖文字信息进行商品的筛选。为了迅速吸引用户注意力,需要在有限的空间内展示出简明扼要的文字信息。
在实现本发明构思的过程中,发明人发现现有技术中至少存在如下问题。商家在输入商品名称标题时,为了吸引用户注意力,经常在标题里加入各种信息,导致标题冗长。然而,由于展示空间的限制,只能截取部分文字进行展示,反而导致有用的信息被遮掉,难以突出核心内容。并且,展示的文字信息对于所有用户都是相同的,不够个性化,难以吸引用户注意力。
发明内容
有鉴于此,本公开提供了一种文本生成方法、装置、电子设备和介质。
本公开的一个方面提供了一种文本生成方法,包括:获取关于目标对象的描述信息,基于所述描述信息确定关于所述目标对象的第一目标信息,获取用户信息,基于所述用户信息和所述描述信息确定关于所述目标对象的第二目标信息,其中,不同用户对应的第二目标信息不同,以及基于所述第一目标信息和所述第二目标信息,生成目标文本。
根据本公开的实施例,所述基于所述描述信息确定关于所述目标对象的第一目标信息,包括:基于所述描述信息确定所述目标对象的品牌信息,和/或基于所述描述信息确定所述目标对象的型号信息。
根据本公开的实施例,所述基于所述描述信息确定关于所述目标对象的第一目标信息,包括:基于所述描述信息确定所述目标对象的至少一个特色功能,以及确定所述至少一个特色功能分别对应的概率。
根据本公开的实施例,所述基于所述用户信息和所述描述信息确定关于所述目标对象的第二目标信息,包括:基于所述用户的历史行为信息和所述目标对象的至少一个属性信息,确定所述目标对象的至少一个属性信息分别对应的概率。
根据本公开的实施例,所述基于所述用户信息和所述描述信息确定关于所述目标对象的第二目标信息,包括:基于所述用户的标签信息和所述目标对象的至少一个标签信息,确定所述目标对象的至少一个标签信息分别对应的概率。
根据本公开的实施例,所述基于所述第一目标信息和所述第二目标信息,生成目标文本,包括:将所述第一目标信息和所述第二目标信息拼接生成目标文本,所述目标文本的长度小于预设阈值,其中,在目标信息包含多个待选信息的情况下,依次循环选取各类目标信息中的一个待选信息进行拼接。
根据本公开的实施例,所述方法还包括:将所述目标文本展示给所述用户。
本公开的另一个方面提供了一种文本生成装置,该装置包括第一获取模块、第一确定模块、第二获取模块、第二确定模块以及生成模块。其中,第一获取模块用于获取关于目标对象的描述信息。第一确定模块用于基于所述描述信息确定关于所述目标对象的第一目标信息。第二获取模块用于获取用户信息。第二确定模块用于基于所述用户信息和所述描述信息确定关于所述目标对象的第二目标信息,其中,不同用户对应的第二目标信息不同。生成模块用于基于所述第一目标信息和所述第二目标信息,生成目标文本。
根据本公开的实施例,所述基于所述描述信息确定关于所述目标对象的第一目标信息,包括:基于所述描述信息确定所述目标对象的品牌信息,和/或基于所述描述信息确定所述目标对象的型号信息。
根据本公开的实施例,所述基于所述描述信息确定关于所述目标对象的第一目标信息,包括:基于所述描述信息确定所述目标对象的至少一个特色功能,以及确定所述至少一个特色功能分别对应的概率。
根据本公开的实施例,所述基于所述用户信息和所述描述信息确定关于所述目标对象的第二目标信息,包括:基于所述用户的历史行为信息和所述目标对象的至少一个属性信息,确定所述目标对象的至少一个属性信息分别对应的概率。
根据本公开的实施例,所述基于所述用户信息和所述描述信息确定关于所述目标对象的第二目标信息,包括:基于所述用户的标签信息和所述目标对象的至少一个标签信息,确定所述目标对象的至少一个标签信息分别对应的概率。
根据本公开的实施例,所述基于所述第一目标信息和所述第二目标信息,生成目标文本,包括:将所述第一目标信息和所述第二目标信息拼接生成目标文本,所述目标文本的长度小于预设阈值,其中,在目标信息包含多个待选信息的情况下,依次循环选取各类目标信息中的一个待选信息进行拼接。
根据本公开的实施例,所述装置还包括:展示模块,用于将所述目标文本展示给所述用户。
本公开的另一方面提供了一种电子设备,包括:一个或多个处理器,存储装置,用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器执行如上所述的方法。
本公开的另一方面提供了一种计算机可读介质,存储有计算机可执行指令,所述指令在被执行时用于实现如上所述的方法。
本公开的另一方面提供了一种计算机程序,所述计算机程序包括计算机可执行指令,所述指令在被执行时用于实现如上所述的方法。
根据本公开的实施例,可以至少部分地解决相关技术中标题冗长无法全面展示以及展示的文字不够个性化的问题,并因此可以实现在有限的展示空间内展示核心内容,并且对于不同用户生成个性化的展示文本的技术效果。
附图说明
通过以下参照附图对本公开实施例的描述,本公开的上述以及其他目的、特征和优点将更为清楚,在附图中:
图1示意性示出了根据本公开实施例的文本生成方法和装置的系统架构;
图2示意性示出了根据本公开实施例的文本生成方法的流程图;
图3示意性示出了根据本公开实施例的文本生成装置的框图;以及
图4示意性示出了根据本公开实施例的电子设备的方框图。
具体实施方式
以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。
在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。这里使用的词语“一”、“一个(种)”和“该”等也应包括“多个”、“多种”的意思,除非上下文另外明确指出。此外,在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。
在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。
在使用类似于“A、B和C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B和C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。在使用类似于“A、B或C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B或C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。本领域技术人员还应理解,实质上任意表示两个或更多可选项目的转折连词和/或短语,无论是在说明书、权利要求书还是附图中,都应被理解为给出了包括这些项目之一、这些项目任一方、或两个项目的可能性。例如,短语“A或B”应当被理解为包括“A”或“B”、或“A和B”的可能性。
本公开的实施例提供了一种文本生成方法和装置。该方法包括:获取关于目标对象的描述信息,基于描述信息确定关于目标对象的第一目标信息,获取用户信息,基于用户信息和描述信息确定关于目标对象的第二目标信息,其中,不同用户对应的第二目标信息不同,以及基于第一目标信息和第二目标信息,生成目标文本。
图1示意性示出了根据本公开实施例的文本生成方法和装置的系统架构100。
需要注意的是,图1所示仅为可以应用本公开实施例的系统架构的示例,以帮助本领域技术人员理解本公开的技术内容,但并不意味着本公开实施例不可以用于其他设备、系统、环境或场景。
如图1所示,根据该实施例的系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104是用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等(仅为示例)。
终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器105可以是提供各种服务的服务器,例如对用户利用终端设备101、102、103所浏览的网站提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的用户请求等数据进行分析等处理,并将处理结果(例如根据用户请求获取或生成的网页、信息、或数据等)反馈给终端设备。
需要说明的是,本公开实施例所提供的文本生成方法一般可以由服务器105执行。相应地,本公开实施例所提供的文本生成装置一般可以设置于服务器105中。本公开实施例所提供的文本生成方法也可以由不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群执行。相应地,本公开实施例所提供的文本生成装置也可以设置于不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
图2示意性示出了根据本公开实施例的文本生成方法的流程图。
如图2所示,该方法包括操作S201~S205。
在操作S201,获取关于目标对象的描述信息。
根据本公开实施例,目标对象例如可以是电商平台上的商品。关于目标对象的描述信息例如可以是关于该商品的描述信息。例如,可以是商家输入的关于该商品的标题信息,或者也可以是该商品的属性信息,或者还可以是该商品的标签信息等等。
在操作S202,基于描述信息确定关于目标对象的第一目标信息。
根据本公开实施例,第一目标信息例如可以是关于目标对象的公共信息。例如,该第一目标信息对于所有用户均相同,属于该目标对象的公共特征。
在本公开实施例中,可以基于描述信息确定目标对象的品牌信息。例如,可以从商家提供的关于某商品的标题信息中提取该商品的品牌信息。例如,可以使用正向最大匹配算法(Forward Maximum Matching)等方法从标题信息中提取关于商品的品牌信息。
根据本公开实施例,可以关联存储各品牌名称的所有形式。例如,中文形式、外文形式、全称形式和缩写形式等等。例如,“宝洁”和“P&G”是属于同一品牌名称的不同形式。
在本公开实施例中,对于国外品牌可以优先确定其外文名称作为该商品的品牌信息,对于国内品牌可以优先确定其中文名称作为该商品的品牌信息。可以理解,本公开实施例不限定品牌信息的表达形式,本领域技术人员可以根据实际情况设定。
根据本公开实施例,还可以基于描述信息确定目标对象的型号信息。例如,可以从商家提供的关于某商品的标题信息中获取该商品的型号信息。例如可以通过训练好的模型从原始标题信息中提取商品的型号信息。
可以理解,商品的型号信息和品牌以及类别强相关,特定品牌品类的产品往往具有通用的型号系列。例如,苹果手机的型号名称可以是iPhone 5,iPhone 5s,iPhone 6等。在本公开实施例中,型号系列可以用型号模式表达,例如,iPhone<num>[s|plus|pro],表示以iPhone开头,后面跟一个数字(包含罗马数字如X等),还可以再加上s或plus或pro后缀。根据本公开实施例,各品牌的型号模式可以通过模式学习算法进行学习,构成型号模式库。可以结合使用已有型号数据库以及不同品牌品类的型号模式,从原始长标题中获取商品的型号信息。
根据本公开实施例,还可以基于描述信息确定目标对象的至少一个特色功能,以及确定至少一个特色功能分别对应的概率。
在本公开实施例中,特色功能例如可以是该商品与同类商品进行差异性竞争的特色功能。例如,5G手机,可充电书包等。
根据本公开实施例,可以从于商家提供的关于某产品的原始标题信息、该产品的扩展属性信息以及营销人员添加的功能信息中提取该商品的至少一个特色功能,构成特色功能集合。特色功能集合中可以包括提取到的至少一个特色功能和“无特色”元素。例如,提取到k个特色功能,则特色功能集合中可以包括k+1个元素。
在本公开实施例中,由于商品特色功能的文字描述方式多种多样,可以采用语义分析方法进行多类分析。例如,可以先将文字描述进行分词处理,转换为词嵌入(wordembedding),然后构建k+1个分类多层感知器(Multi-Layer Perceptron,简称MLP)神经网络进行训练,输出k+1个特色功能以及该k+1个特色功能的概率。如果“无特色”概率最高,则特色功能集合可以确定为空集。
根据本公开实施例,可以选择概率高于“无特色”概率的特色功能作为关于该产品的特色功能。还可以基于各特色功能分别对应的概率确定各特色功能的优先级排序。概率越高的特色功能对应的优先级越高。
在操作S203,获取用户信息。
根据本公开实施例,为了使关于某商品的文本信息更能吸引用户,可以针对各用户生成个性化的文本信息。因此,可以获取用户信息,以分析各用户的喜好。
在本公开实施例中,用户信息例如可以包括用户历史行为信息以及用户标签信息等。
可以理解,本公开实施例不限定用户信息的类型,本领域技术人员可以根据是需要获取相关的用户信息。
在操作S204,基于用户信息和描述信息确定关于目标对象的第二目标信息,其中,不同用户对应的第二目标信息不同。
根据本公开实施例,第二目标信息例如可以是关于目标对象的个性化信息。例如,该第二目标信息对于不同的用户内容不同,属于该目标对象的个性化特征。
在本公开实施例中,可以基于用户的历史行为信息和目标对象的至少一个属性信息,确定目标对象的至少一个属性信息分别对应的概率。
根据本公开实施例,属性信息例如可以包括商品的规格参数以及功能等信息。可以理解,不同用户对商品的不同属性有不同的偏好,本公开实施例可以基于用户的历史行为信息确定该用户关于该商品各属性信息的偏好概率,从而可以确定该用户对于该商品的哪个属性更感兴趣。
例如,可以统计用户对某品类商品属性的浏览、点击、搜索等行为次数。例如,有些行为是针对属性的,例如搜索等行为,可以直接进行计数。还有一些行为是针对商品的,例如浏览、点击等行为,这种行为可以将次数折算到商品的各个属性类型上,最后构成了该用户的属性行为信息。然后将该商品的至少一个属性信息视为话题,将用户的属性行为信息视为文档,则可以将用户的属性行为信息建模为话题模型,通过判断用户行为的话题分布,取概率由高到低排名前n个的话题对应的该商品的属性作为该用户偏好的属性。还可以基于各属性分别对应的概率确定各属性的优先级排序。概率越高的属性对应的优先级越高。
根据本公开实施例,还可以基于用户的标签信息和目标对象的至少一个标签信息,确定目标对象的至少一个标签信息分别对应的概率。
其中,标签信息例如可以营销标签。营销标签可以是标签平台设计的商品营销标记信息。例如,小清新、欧美风等风格标签。或者,偏男性、偏女性等购物属性标签。
在本公开实施例中,商品的标签信息可以表示该商品是否具有该标签对应的属性或者具有该标签对应的属性的概率。例如,商品A5对应标签“小清新”的概率为20%,对应标签“欧美风”的概率为50%,对应标签“偏男性”的概率为30%,对应标签“偏女性”的概率为70%。
在本公开实施例中,用户的标签信息可以表示用户对该标签的偏好性。例如,用户1对标签“小清新”的偏好性为80%,对标签“欧美风”的偏好性为10%,对标签“偏男性”的概率为0,对应标签“偏女性”的概率为1。
根据本公开实施例,可以获取商品的标签信息和用户对该些标签的偏好性,然后匹配商品和用户,获取对用户有效的标签露出。例如,对于商品的各标签,可以计算商品概率*用户概率作为该标签对应的最终概率。例如,针对用户1关于商品A的标签“小清新”对应的最终概率为20%*80%=16%。
在本公开实施例中,可以选择概率高于预设阈值标签作为该商品的候选标签。还可以基于各标签分别对应的概率确定各标签的优先级排序。概率越高的标签对应的优先级越高。
在操作S205,基于第一目标信息和第二目标信息,生成目标文本。
根据本公开实施例,可以将关于某商品的公共信息和个性化信息进行整合,生成目标文本。该目标文本例如可以作为该商品的标题,展示给用户,该标题中包括该商品的主要公共信息,例如商品的品牌信息、型号信息、特色功能等。该标题中还包括该商品的个性化信息,例如,根据用户的喜好确定的该商品的属性信息和标签信息。
在本公开实施例中,可以将第一目标信息和第二目标信息拼接生成目标文本,目标文本的长度小于预设阈值,其中,在目标信息包含多个待选信息的情况下,依次循环选取各类目标信息中的一个待选信息进行拼接。
例如,对于目标信息仅包含一个待选信息的目标信息(例如,品牌信息和型号信息),可以直接将该待选信息作为待拼接信息。例如,对于品牌信息,仅包含“华为”,则“华为”可以作为待拼接信息。对于型号信息,仅包含“mate20”,则“mate20”可以作为待拼接信息。
例如,对于目标信息包含多个待选信息的目标信息(例如,特色功能信息、属性信息和标签信息),可以依次循环选取各类目标信息中的一个待选信息作为待拼接信息。例如,特色功能包含“5G、全面屏、双摄”,属性信息包含“白色、64G、安卓系统”,标签信息包含“小清新、偏女性”。则可以先选取一个特色功能,例如“5G”作为待拼接信息(可以根据各特色功能对应的概率由高到低依次选取);再选取一个属性,例如“白色”作为待拼接信息(可以根据各属性对应的概率由高到低依次选取);再选取一个标签,例如“小清新”作为待拼接信息(可以根据各标签对应的概率由高到低依次选取);再选取一个特色功能,例如“全面屏”作为待拼接信息,以此类推,直到该类目标信息全被选出或者目标文本长度超过预设阈值。
根据本公开实施例,选取出来的各待拼接信息可以自由组合。以型号信息为例,例如“荣耀(品牌信息)v30(型号信息)5G(特色功能)小清新(标签信息)”,型号信息可以紧跟在品牌信息后面,又例如“膳魔师(品牌信息)500ml(属性信息)保温杯(特色功能)JNL-501PCH(型号信息)”,型号信息可以是放在末尾的。
根据本公开实施例,选取出来的各待拼接信息也可以根据规则进行拼接。例如,拼接规则可以是“品牌信息-型号信息-特色功能-属性信息-标签信息-特色功能……”等。本公开对此不做限定,本领域技术人员那可以根据实际需要进行设定。
在本公开一些实施例中,还可以在目标文本中合理添加品类信息。例如,对于“华为(品牌信息)mate20(型号信息)”不需要添加“手机”品类名称,对于“小米(品牌信息)路由器(品类名称)Pro(型号信息)”则需要添加品类名称。
本公开实施例可以基于用户信息和商品描述信息,生成包含有公共部分和用户个性化部分的标题文本。该标题文本中包含了商品的重要核心信息,并且还能更好地贴合每个用户的个人偏好,在有限的展示空间内展示了核心内容的同时,还吸引了用户的注意力,进而提升了该商品的点击率和转化率,促进了商品的营销。
图3示意性示出了根据本公开实施例的文本生成装置300的框图。
如图3所示,该装置300包括第一获取模块310、第一确定模块320、第二获取模块330、第二确定模块340和生成模块350。
第一获取模块310用于获取关于目标对象的描述信息。
第一确定模块320用于基于描述信息确定关于目标对象的第一目标信息。
第二获取模块330用于获取用户信息。
第二确定模块340用于基于用户信息和描述信息确定关于目标对象的第二目标信息,其中,不同用户对应的第二目标信息不同。
生成模块350用于基于第一目标信息和第二目标信息,生成目标文本。
根据本公开的实施例,所述基于所述描述信息确定关于所述目标对象的第一目标信息,包括:基于所述描述信息确定所述目标对象的品牌信息,和/或基于所述描述信息确定所述目标对象的型号信息。
根据本公开的实施例,所述基于所述描述信息确定关于所述目标对象的第一目标信息,包括:基于所述描述信息确定所述目标对象的至少一个特色功能,以及确定所述至少一个特色功能分别对应的概率。
根据本公开的实施例,所述基于所述用户信息和所述描述信息确定关于所述目标对象的第二目标信息,包括:基于所述用户的历史行为信息和所述目标对象的至少一个属性信息,确定所述目标对象的至少一个属性信息分别对应的概率。
根据本公开的实施例,所述基于所述用户信息和所述描述信息确定关于所述目标对象的第二目标信息,包括:基于所述用户的标签信息和所述目标对象的至少一个标签信息,确定所述目标对象的至少一个标签信息分别对应的概率。
根据本公开的实施例,所述基于所述第一目标信息和所述第二目标信息,生成目标文本,包括:将所述第一目标信息和所述第二目标信息拼接生成目标文本,所述目标文本的长度小于预设阈值,其中,在目标信息包含多个待选信息的情况下,依次循环选取各类目标信息中的一个待选信息进行拼接。
根据本公开的实施例,所述装置还包括:展示模块,用于将所述目标文本展示给所述用户。
根据本公开实施例,装置300例如可以执行上文参考图2描述的方法,在此不再赘述。
根据本公开的实施例的模块、子模块、单元、子单元中的任意多个、或其中任意多个的至少部分功能可以在一个模块中实现。根据本公开实施例的模块、子模块、单元、子单元中的任意一个或多个可以被拆分成多个模块来实现。根据本公开实施例的模块、子模块、单元、子单元中的任意一个或多个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式的硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,根据本公开实施例的模块、子模块、单元、子单元中的一个或多个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
例如,第一获取模块310、第一确定模块320、第二获取模块330、第二确定模块340和生成模块350可以合并在一个模块中实现,或者其中的任意一个模块可以被拆分成多个模块。或者,这些模块中的一个或多个模块的至少部分功能可以与其他模块的至少部分功能相结合,并在一个模块中实现。根据本发明的实施例,第一获取模块310、第一确定模块320、第二获取模块330、第二确定模块340和生成模块350中的至少一个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用集成电路(ASIC),或可以以对电路进行集成或封装的任何其他的合理方式等硬件或固件来实现,或以软件、硬件以及固件三种实现方式的适当组合来实现。或者,第一获取模块310、第一确定模块320、第二获取模块330、第二确定模块340和生成模块350中的至少一个可以至少被部分地实现为计算机程序模块,当该程序被计算机运行时,可以执行相应模块的功能。
图4示意性示出了根据本公开实施例的电子设备的方框图。图4示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图4所示,根据本公开实施例的电子设备400包括处理器401,其可以根据存储在只读存储器(ROM)402中的程序或者从存储部分408加载到随机访问存储器(RAM)403中的程序而执行各种适当的动作和处理。处理器401例如可以包括通用微处理器(例如CPU)、指令集处理器和/或相关芯片组和/或专用微处理器(例如,专用集成电路(ASIC)),等等。处理器401还可以包括用于缓存用途的板载存储器。处理器401可以包括用于执行参考图2描述的根据本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。
在RAM 403中,存储有系统400操作所需的各种程序和数据。处理器401、ROM 402以及RAM 403通过总线404彼此相连。处理器401通过执行ROM 402和/或RAM 403中的程序来执行如上所述的各种操作。需要注意,所述程序也可以存储在除ROM 402和RAM 403以外的一个或多个存储器中。处理器401也可以通过执行存储在所述一个或多个存储器中的程序来执行如上所述的各种操作。
根据本公开的实施例,系统400还可以包括输入/输出(I/O)接口405,输入/输出(I/O)接口405也连接至总线404。系统400还可以包括连接至I/O接口405的以下部件中的一项或多项:包括键盘、鼠标等的输入部分406;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分407;包括硬盘等的存储部分408;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分409。通信部分409经由诸如因特网的网络执行通信处理。驱动器410也根据需要连接至I/O接口405。可拆卸介质411,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器410上,以便于从其上读出的计算机程序根据需要被安装入存储部分408。
根据本公开的实施例,上文参考流程图描述的方法可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分409从网络上被下载和安装,和/或从可拆卸介质411被安装。在该计算机程序被处理器401执行时,执行本公开实施例的系统中限定的上述功能。根据本公开的实施例,上文描述的系统、设备、装置、模块、单元等可以通过计算机程序模块来实现。
需要说明的是,本公开所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。根据本公开的实施例,计算机可读介质可以包括上文描述的ROM 402和/或RAM 403和/或ROM 402和RAM 403以外的一个或多个存储器。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
作为另一方面,本公开还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该设备执行如上所述的方法。
以上对本公开的实施例进行了描述。但是,这些实施例仅仅是为了说明的目的,而并非为了限制本公开的范围。尽管在以上分别描述了各实施例,但是这并不意味着各个实施例中的措施不能有利地结合使用。本公开的范围由所附权利要求及其等同物限定。不脱离本公开的范围,本领域技术人员可以做出多种替代和修改,这些替代和修改都应落在本公开的范围之内。
Claims (10)
1.一种文本生成方法,包括:
获取关于目标对象的描述信息;
基于所述描述信息确定关于所述目标对象的第一目标信息;
获取用户信息;
基于所述用户信息和所述描述信息确定关于所述目标对象的第二目标信息,其中,不同用户对应的第二目标信息不同;以及
基于所述第一目标信息和所述第二目标信息,生成目标文本。
2.根据权利要求1所述的方法,其中,所述基于所述描述信息确定关于所述目标对象的第一目标信息,包括:
基于所述描述信息确定所述目标对象的品牌信息;和/或
基于所述描述信息确定所述目标对象的型号信息。
3.根据权利要求1或2所述的方法,其中,所述基于所述描述信息确定关于所述目标对象的第一目标信息,包括:
基于所述描述信息确定所述目标对象的至少一个特色功能,以及确定所述至少一个特色功能分别对应的概率。
4.根据权利要求1所述的方法,其中,所述基于所述用户信息和所述描述信息确定关于所述目标对象的第二目标信息,包括:
基于所述用户的历史行为信息和所述目标对象的至少一个属性信息,确定所述目标对象的至少一个属性信息分别对应的概率。
5.根据权利要求1或4所述的方法,其中,所述基于所述用户信息和所述描述信息确定关于所述目标对象的第二目标信息,包括:
基于所述用户的标签信息和所述目标对象的至少一个标签信息,确定所述目标对象的至少一个标签信息分别对应的概率。
6.根据权利要求1所述的方法,其中,所述基于所述第一目标信息和所述第二目标信息,生成目标文本,包括:
将所述第一目标信息和所述第二目标信息拼接生成目标文本,所述目标文本的长度小于预设阈值,其中,在目标信息包含多个待选信息的情况下,依次循环选取各类目标信息中的一个待选信息进行拼接。
7.根据权利要求1所述的方法,还包括:
将所述目标文本展示给所述用户。
8.一种文本生成装置,包括:
第一获取模块,用于获取关于目标对象的描述信息;
第一确定模块,用于基于所述描述信息确定关于所述目标对象的第一目标信息;
第二获取模块,用于获取用户信息;
第二确定模块,用于基于所述用户信息和所述描述信息确定关于所述目标对象的第二目标信息,其中,不同用户对应的第二目标信息不同;以及
生成模块,用于基于所述第一目标信息和所述第二目标信息,生成目标文本。
9.一种电子设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器执行根据权利要求1~7中任一项所述的方法。
10.一种计算机可读介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行根据权利要求1~7中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010421940.3A CN113688604B (zh) | 2020-05-18 | 2020-05-18 | 文本生成方法、装置、电子设备和介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010421940.3A CN113688604B (zh) | 2020-05-18 | 2020-05-18 | 文本生成方法、装置、电子设备和介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113688604A CN113688604A (zh) | 2021-11-23 |
CN113688604B true CN113688604B (zh) | 2024-04-16 |
Family
ID=78575712
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010421940.3A Active CN113688604B (zh) | 2020-05-18 | 2020-05-18 | 文本生成方法、装置、电子设备和介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113688604B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108197621A (zh) * | 2017-12-28 | 2018-06-22 | 北京金堤科技有限公司 | 企业信息获取方法及系统和信息处理方法及系统 |
CN109614545A (zh) * | 2018-11-13 | 2019-04-12 | 阿里巴巴集团控股有限公司 | 页面加载方法、装置及设备 |
CN109919721A (zh) * | 2019-02-27 | 2019-06-21 | 上海宝尊电子商务有限公司 | 一种实时自动生成商品描述文本的方法 |
CN110781394A (zh) * | 2019-10-24 | 2020-02-11 | 西北工业大学 | 一种基于多源群智数据的个性化商品描述生成方法 |
CN110851582A (zh) * | 2018-07-25 | 2020-02-28 | 北京京东尚科信息技术有限公司 | 文本处理方法及系统、计算机系统和计算机可读存储介质 |
CN110929021A (zh) * | 2018-08-31 | 2020-03-27 | 阿里巴巴集团控股有限公司 | 文本信息生成方法和文本信息生成装置 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105528459B (zh) * | 2016-01-08 | 2020-07-14 | 腾讯科技(深圳)有限公司 | 一种信息处理方法、服务器及终端 |
CN110147483B (zh) * | 2017-09-12 | 2023-09-29 | 阿里巴巴集团控股有限公司 | 一种标题重建方法及装置 |
-
2020
- 2020-05-18 CN CN202010421940.3A patent/CN113688604B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108197621A (zh) * | 2017-12-28 | 2018-06-22 | 北京金堤科技有限公司 | 企业信息获取方法及系统和信息处理方法及系统 |
CN110851582A (zh) * | 2018-07-25 | 2020-02-28 | 北京京东尚科信息技术有限公司 | 文本处理方法及系统、计算机系统和计算机可读存储介质 |
CN110929021A (zh) * | 2018-08-31 | 2020-03-27 | 阿里巴巴集团控股有限公司 | 文本信息生成方法和文本信息生成装置 |
CN109614545A (zh) * | 2018-11-13 | 2019-04-12 | 阿里巴巴集团控股有限公司 | 页面加载方法、装置及设备 |
CN109919721A (zh) * | 2019-02-27 | 2019-06-21 | 上海宝尊电子商务有限公司 | 一种实时自动生成商品描述文本的方法 |
CN110781394A (zh) * | 2019-10-24 | 2020-02-11 | 西北工业大学 | 一种基于多源群智数据的个性化商品描述生成方法 |
Non-Patent Citations (1)
Title |
---|
个性化推荐中标签系统的建设;张腾;何丰;陈新德;赵小龙;;福建电脑;20180725(07);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN113688604A (zh) | 2021-11-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109522483B (zh) | 用于推送信息的方法和装置 | |
CN107172151B (zh) | 用于推送信息的方法和装置 | |
CN107679217B (zh) | 基于数据挖掘的关联内容提取方法和装置 | |
CN109145280A (zh) | 信息推送的方法和装置 | |
US20230214895A1 (en) | Methods and systems for product discovery in user generated content | |
CN113079417B (zh) | 生成弹幕的方法、装置、设备和存储介质 | |
CN104428805A (zh) | 强化搜索的连接目标锁定 | |
CN107526718B (zh) | 用于生成文本的方法和装置 | |
CN106919711B (zh) | 基于人工智能的标注信息的方法和装置 | |
CN109783741A (zh) | 用于推送信息的方法和装置 | |
CN114154013A (zh) | 视频推荐方法、装置、设备及存储介质 | |
US20230030560A1 (en) | Methods and systems for tagged image generation | |
US9460163B1 (en) | Configurable extractions in social media | |
CN109993619A (zh) | 数据处理方法 | |
CN113935401A (zh) | 物品信息的处理方法、装置、服务器及存储介质 | |
CN111787042B (zh) | 用于推送信息的方法和装置 | |
CN112288461A (zh) | 广告信息推送方法、装置、介质及电子设备 | |
US11763376B2 (en) | System, manufacture, and method for efficiently identifying and segmenting product webpages on an eCommerce website | |
CN112348615A (zh) | 用于审核信息的方法和装置 | |
CN113688604B (zh) | 文本生成方法、装置、电子设备和介质 | |
CN113313542B (zh) | 一种推送频道页面的方法和装置 | |
CN112559853B (zh) | 用户标签的生成方法和装置 | |
CN114036397A (zh) | 数据推荐方法、装置、电子设备和介质 | |
CN110110199B (zh) | 信息输出方法和装置 | |
CN113743973A (zh) | 分析市场热点趋势的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |