CN107861938A - 一种poi文案生成方法及装置,电子设备 - Google Patents

一种poi文案生成方法及装置,电子设备 Download PDF

Info

Publication number
CN107861938A
CN107861938A CN201710862104.7A CN201710862104A CN107861938A CN 107861938 A CN107861938 A CN 107861938A CN 201710862104 A CN201710862104 A CN 201710862104A CN 107861938 A CN107861938 A CN 107861938A
Authority
CN
China
Prior art keywords
poi
descriptor
official documents
correspondence
generation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710862104.7A
Other languages
English (en)
Other versions
CN107861938B (zh
Inventor
张华�
丁长林
陈红生
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sankuai Online Technology Co Ltd
Original Assignee
Beijing Sankuai Online Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to CN201710862104.7A priority Critical patent/CN107861938B/zh
Application filed by Beijing Sankuai Online Technology Co Ltd filed Critical Beijing Sankuai Online Technology Co Ltd
Priority to CA3069365A priority patent/CA3069365A1/en
Priority to US16/622,300 priority patent/US20200132491A1/en
Priority to JP2019568702A priority patent/JP6961727B2/ja
Priority to PCT/CN2017/117428 priority patent/WO2019056628A1/zh
Priority to EP17926304.1A priority patent/EP3623957A4/en
Priority to KR1020197036812A priority patent/KR20200007900A/ko
Priority to TW107110542A priority patent/TWI754033B/zh
Publication of CN107861938A publication Critical patent/CN107861938A/zh
Application granted granted Critical
Publication of CN107861938B publication Critical patent/CN107861938B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01CMEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
    • G01C21/00Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
    • G01C21/26Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 specially adapted for navigation in a road network
    • G01C21/34Route searching; Route guidance
    • G01C21/36Input/output arrangements for on-board computers
    • G01C21/3605Destination input or retrieval
    • G01C21/3611Destination input or retrieval using character input or menus, e.g. menus of POIs
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01CMEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
    • G01C21/00Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
    • G01C21/26Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 specially adapted for navigation in a road network
    • G01C21/34Route searching; Route guidance
    • G01C21/36Input/output arrangements for on-board computers
    • G01C21/3605Destination input or retrieval
    • G01C21/3614Destination input or retrieval through interaction with a road map, e.g. selecting a POI icon on a road map
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01CMEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
    • G01C21/00Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
    • G01C21/26Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 specially adapted for navigation in a road network
    • G01C21/34Route searching; Route guidance
    • G01C21/36Input/output arrangements for on-board computers
    • G01C21/3667Display of a road map
    • G01C21/3673Labelling using text of road map data items, e.g. road names, POI names
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01CMEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
    • G01C21/00Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
    • G01C21/26Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 specially adapted for navigation in a road network
    • G01C21/34Route searching; Route guidance
    • G01C21/36Input/output arrangements for on-board computers
    • G01C21/3679Retrieval, searching and output of POI information, e.g. hotels, restaurants, shops, filling stations, parking facilities
    • G01C21/3682Retrieval, searching and output of POI information, e.g. hotels, restaurants, shops, filling stations, parking facilities output of POI information on a road map
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/258Heading extraction; Automatic titling; Numbering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements

Abstract

本申请提供了一种POI文案生成方法,属于计算机技术领域,用于解决现有技术中的POI文案生成方法存在的文案对POI的表达能力不强、表达准确性不高的问题。所述方法包括:获取用于生成文案的POI信息;对所述POI信息进行主题倾向预测,确定所述POI信息的主题词;根据确定的主题词生成所述POI信息所属POI的文案。本申请公开的POI文案生成方法,通过首先对所述POI信息进行主题倾向预测,得到主题词,并将主题词作为生成文案的输入文本,缩小了生成文案的输入文本的数据范围,使生成文案的输入文本更具备针对性,提高了生成的文案的准确性和表达能力。

Description

一种POI文案生成方法及装置,电子设备
技术领域
本申请涉及计算机技术领域,特别是涉及一种POI文案生成方法及装置,电子设备。
背景技术
生成并展示POI文案作为传递POI关键信息的文本,是提高用户点击率和购买率的有效手段,在产品展示或交易平台中具有广泛应用。对于POI文案的产出,目前主要有:人工编写和从POI的相关描述信息中进行自动抽取两种方式。然而,对于人工编写POI文案的方式,不仅成本高,随着POI数量的增多,实时性也会比较差;对于从POI的相关描述信息中进行自动抽取的方式,虽然提高了文案的抽取效率,但是抽取的内容会受限,只能从POI的描述信息中抽取相关描述文本,得到的文案对POI的表达能力不强,并且表达准确性不高。
可见,现有技术中的POI文案生成方案至少存在得到的文案对POI的表达能力不强,并且表达准确性不高的缺陷。
发明内容
本申请实施例提供一种POI文案生成方法,至少在一定程度上克服由于相关技术的限制和缺陷而导致的一个或者多个问题。
为了解决上述问题,第一方面,本申请实施例提供了一种POI文案生成方法,包括:
获取用于生成文案的POI信息;
对所述POI信息进行主题倾向预测,确定所述POI信息的主题词;
基于确定的主题词生成所述POI信息所属POI的文案。
第二方面,本申请实施例提供了一种POI文案生成装置,包括:
POI信息获取模块,用于获取用于生成文案的POI信息;
主题词确定模块,用于对所述POI信息进行主题倾向预测,确定所述POI信息的主题词;
文案生成模块,用于基于所述主题词确定模块确定的主题词生成所述POI信息所属POI的文案。
第三方面,本申请实施例提供了一种电子设备,包括存储器、处理器及存储在所述存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现本申请实施例所述的POI文案生成方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本申请实施例所述的POI文案生成方法的步骤。
本申请实施例公开的POI文案生成方法,通过获取用于生成文案的POI信息,然后,对所述POI信息进行主题倾向预测,确定所述POI信息的主题词,最后,基于确定的主题词生成所述POI信息所属POI的文案,解决了现有技术中POI文案生成方法存在的得到的文案对POI的表达能力不强,并且表达准确性不高的问题。通过首先对所述POI信息进行主题倾向预测,得到主题词,并将主题词作为生成文案的输入文本,缩小了生成文案的输入文本的数据范围,使生成文案的输入文本更具备针对性,进一步提高了生成的文案的准确性并提升了文案的表达能力。同时,通过自动提取主题词也提高了生成文案的效率。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例一的POI文案生成方法流程图;
图2是本申请实施例二的POI文案生成方法流程图;
图3是本申请实施例二的深度卷积神经网络模型结构示意图;
图4是本申请实施例三的POI文案生成装置结构示意图之一;
图5是本申请实施例三的POI文案生成装置结构示意图之二;
图6是本申请实施例四的POI文案生成装置结构示意图之二。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
实施例一
本申请公开的一种POI文案生成方法,如图1所示,所述方法包括:步骤100至步骤120。
步骤100,获取用于生成文案的POI信息。
POI(Point of Interest信息点)在不同的平台被赋予了不同的实际含义,例如,可以为:旅游景点、一道菜、一个产品等。POI信息包括多种形式,例如图片形式、文本形式,不同形式的POI信息通常用于展示POI不同维度的信息。例如,图片形式的POI信息可以用于展示POI的图片,如首图;文本形式的POI信息可以用于展示POI的名称、描述、评论等信息。
在生成POI文案的过程中,用于生成文案的源数据就是POI信息。以生成一道菜的文案为例,获取的用于生成文案的源数据可以包括这道菜的:图片、名称、味道和食材的描述、用户评论等信息。
步骤110,对所述POI信息进行主题倾向预测,确定所述POI信息的主题词。
具体实施时,可以首先通过词袋模型将文本类型的POI信息标识为实数向量,即提取POI信息的特征,再通过传统的特征提取方法提取图片形式的POI形式的POI信息的特征;然后,将不同形式的POI信息的特征进行融合,得到POI信息的综合特征表示;最后,再利用预先训练的神经网络模型,如SVM分类模型,根据得到POI信息的综合特征表示,确定该POI的主题词。
本申请实施例中,预先训练神经网络模型。然后,在提取某个POI的文案时,将该POI的POI信息,如首图、名称、评论、描述等中的任意一项或多项作为所述神经网络模型的输入,由所述神经网络模型对所述POI信息进行特征提取和确定主题词,完成主题倾向预测,并输出所述POI信息的主题词。
步骤120,基于确定的主题词生成所述POI信息所属POI的文案。
具体实施时,可以采用传统的类似机器翻译的方法基于确定的主题词,生成所述POI信息的文案。本申请在具体实施时,通过深度学习方法预先训练深度神经网络模型,如基于编码-解码的深度神经网络模型。所述基于编码-解码的深度神经网络模型用于将深度卷积神经网络模型输出的主题词作为输入,生成输入至所述深度卷积神经网络模型的POI信息的文案。
本申请实施例中采用的基于编码-解码的神经网络模型,例如基于注意力机制的seq2seq(sequence to sequence)深度神经网络模型。在进行模型训练时,将可能出现的主题词序列作为输入,然后,将对应的文案作为输出,训练seq2seq深度神经网络模型。具体实施时,训练基于编码-解码的深度神经网络模型的训练数据的格式可以为:[input:主题词序列;output:文案],其中,主题词为文本。
seq2seq深度神经网络模型已经在机器翻译、自然语言处理领域取得了很大的进步,基于贝叶斯条件概率公式,seq2seq由一个编码器和一个解码器构成,编码器将源序列A编码成一个固定长度的特征向量,这个向量作为输入被传送到解码器得到目标序列B。其中,所使用的最基本的注意力机制主要分为两种,一种是由Bahdanau提出的加法注意力机制,另外一种是由Luong提出的乘法注意力机制。整个基于注意力机制的seq2seq模型的特点为:编码端使用双向的循环神经网络(或其变体)对输入序列进行编码表示,能够很好的对整个上下文进行建模表示;同时,注意力机制的引入,使得目标序列中的词和输入序列中词的对齐信息被很好利用。由于模型的时序依赖特点(即后续的输出会跟之前的所有输入相关),模型的学习也采用随时间序的反向传播算法。训练seq2seq深度神经网络模型的具体实施方式参见现有技术,此处不再赘述。
在确定了POI信息的主题词之后,将确定的主题词拼接成文本序列输入至基于编码-解码的深度神经网络模型,所述基于编码-解码的深度神经网络模型将输出对应的文案。
本申请实施例公开的POI文案生成方法,通过获取用于生成文案的POI信息,然后,对所述POI信息进行主题倾向预测,确定所述POI信息的主题词,最后,基于确定的主题词生成所述POI信息所属POI的文案,解决了现有技术中POI文案生成方法存在的得到的文案对POI的表达能力不强,并且表达准确性不高的问题。通过首先对所述POI信息进行主题倾向预测,得到主题词,并将主题词作为生成文案的输入文本,缩小了生成文案的输入文本的数据范围,使生成文案的输入文本更具备针对性,进一步提高了生成的文案的准确性并提升了文案的表达能力。同时,通过自动提取主题词也提高了生成文案的效率。
实施例二
如图2所示,基于实施例一,本申请的另一具体实施例中公开的POI文案生成方法包括:步骤200至步骤230。
步骤200,获取用于生成文案的POI信息。
获取用于生成文案的POI信息的具体实施方式参见实施例一,此处不再赘述。
在获取用于生成文案的POI信息之后,首先,对所述POI信息进行主题倾向预测,确定所述POI信息的主题词;然后,基于确定的主题词生成所述POI信息所属POI的文案。具体实施时,分别采用不同的神经网络模型进行主题词提取和文案生成。即,所述对所述POI信息进行主题倾向预测,确定所述POI信息的主题词,包括:通过第一神经网络模型对所述POI信息进行主题倾向预测,确定所述POI信息的主题词;所述基于确定的主题词生成所述POI信息所属POI的文案,包括:通过第二神经网络模型,基于确定的主题词生成所述POI信息所属POI的文案。
步骤210,通过第一神经网络模型对所述POI信息进行主题倾向预测,确定所述POI信息的主题词。
本申请实施例中,首先,需要训练第一神经网络模型。
对于一个POI而言,假设要同时判定其两方面的信息(对应两个主题),如:是否全天营业、是否环境优美,那么对于任何一方面信息的判定来说,都是一个是与否的二分类问题(以“是否全天营业”为例,要么全天,要么非全天)。如果需要确定关于POI的多个主题时,就需要解决多个二分类问题。因此,具体实施时,把多个二分类问题放在一个模型中同时进行解决,即同时预测一个POI的不同主题,需要采用能够解决多目标分类问题的多目标分类模型。本申请实施例中进行主题倾向预测的第一神经网络模型为基于深度卷积神经网络的多目标分类模型。
具体实施时,将根据POI信息人工提取的POI信息作为输入训练数据,将所述POI信息对应的主题词文本序列作为输出训练数据,然后,基于输入训练数据和输出训练数据训练基于卷积神经网络的多目标分类模型。具体实施时,训练数据的格式可以为:[input:图片,文本序列;output:主题词序列],其中,POI信息包括:图片和文本序列。利用训练数据学习深度卷积神经网络模型时,可以使用反向传播算法。
具体实施时,所述深度卷积神经网络模型包括至少一个数据处理通道,如文本处理通道或图片处理通道。优选的,所述深度卷积神经网络模型包括多个数据处理通道,如图3所示,所述数据处理通道包括:文本处理通道310和图片处理通道320。每个数据处理通道是一个独立的卷积模块,用于处理不同形式的POI信息,例如:文本处理通道310用于处理文本形式的POI信息,如名称、描述、评论等POI信息;图片处理通道320用于处理图片形式的POI信息,如POI的首图。在进行模型训练的过程中,两个数据处理通道分别进行训练,即:利用输入训练数据的图片部分训练图片处理通道320,利用输入训练数据的文本序列部分训练文本处理通道310。具体实施时,可以参照现有技术中的深度卷积神经网络模型训练方法训练深度卷积神经网络模型,此处不再赘述。
然后,在提取某个POI的文案时,将该POI的POI信息,如首图、名称、评论、描述等中的任意一项或多项作为所述深度卷积神经网络模型的输入,例如组织成[input:图片,文本序列]的格式输入至所述深度卷积神经网络模型,由所述深度卷积神经网络模型对所述POI信息进行主题倾向预测,并输出所述POI信息的至少一个主题词。具体实施时,通过第一神经网络模型对所述POI信息进行主题倾向预测,确定所述POI信息的主题词,包括:分别确定不同形式的所述POI信息的特征;将所述不同形式的所述POI信息的特征进行融合,确定所述POI信息的综合特征表示;通过所述第一神经网络模型将所述综合特征表示映射成所述POI信息的主题词。所述不同形式的所述POI信息包括:文本形式的POI信息,和/或,图片形式的POI信息。
通过深度卷积神经网络模型对所述POI信息进行主题倾向预测,确定所述POI信息的主题词时,首先,分别确定不同形式的所述POI信息的特征,例如,通过深度卷积神经网络模型(即第一神经网络模型)中的各数据处理通道对相应形式的所述POI信息进行主题倾向预测,分别提取每种形式的所述POI信息的特征。以输入一道菜品的POI信息包括菜品的图片和菜品名称、描述为例,深度卷积神经网络模型首先将菜品的图片分配至图片处理通道进行数据处理,将菜品名称、描述文本分配至文本处理通道进行数据处理。
具体实施时,图片处理通道可以采用二维卷积和最大池化(Maximum Pooling)交替堆叠的网络结构,例如采用vgg16卷积神经网络以及ImageNet数据集预训练的模型。图片处理通道对输入的菜品图片进行处理后,将得到一个实数向量V1,用于表示输入的菜品图片的特征,即图片形式的所述POI信息的特征。在卷积神经网络中,卷积层的作用是提取一个局部区域的特征,每一个滤波器相当于一个特征提取器,当需要提取多种特征时,可以同时使用多个滤波器(也称为卷积核),相应的由每一个特征提取器提取得到的输出,即向量、矩阵、张量等,称之为一个特征映射。而且,同一个滤波器在整个输入数据上采用的是同一套权重,这是卷积层的另外一个重要特性:权值共享,该特性可以显著减少模型中连接的个数。卷积层虽然可以显著减少连接的个数,但是经过卷积操作后得到的每一个特征映射的神经元个数并没有显著减少。这样,如果后面接一个分类器,分类器的输入维数依然很高,很容易出现过拟合。为了解决这个问题,本申请的深度卷积神经网络模型在卷积层之后再加上一个池化(Pooling)操作,也就是子采样(Subsampling),构成一个子采样层。子采样层可以来大大降低特征的维数,避免过拟合。
本申请实施例中,文本处理通道可以采用一层一维卷积加一层最大池化(MaximumPooling)的网络结构,对输入的菜品名称、描述文本进行数据处理后,将得到另一个实数向量V2,用于表示输入的菜品名称、描述文本的特征,即文本形式的所述POI信息的特征。
然后,将所述每种形式的所述POI信息的特征进行融合,确定所述POI信息的综合特征表示。以图片处理通道得到的图片特征V1为一个三维特征向量,表示为[1,2,3]、文本处理通道得到的文本特征V2为一个二维特征向量,表示为[4,5]为例,将图片形式的POI信息的特征[1,2,3]和文本形式的POI信息的特征[4,5]进行融合,拼接为[1,2,3,4,5],作为所述POI信息的综合特征表示。
最后,通过深度卷积神经网络模型的全连接层将所述综合特征表示映射成所述POI信息的主题词。具体实施时,所述深度卷积神经网络模型在卷积层和池化层之后,还有全连接层,如图3中的330。所述深度卷积神经网络模型包括:基于深度卷积神经网络的多目标分类器。全连接层(fully connected layers,FC)在整个卷积神经网络中起到“分类器”的作用。卷积层、池化层的操作是将原始数据映射到隐层特征空间,而全连接层则将隐层特征空间的“分布式特征表示”映射到样本标记空间,即输出空间。
具体实施时,全连接层根据输入的POI信息的综合特征表示,预测出POI信息对应的主题词列表。由于全连接层实现的是一个多目标分类器,所以该层的每一个节点都是一个独立的二分类器,具体实施时,可以采用sigmoid进行激活,且不同节点之间相互独立。相应的整个网络最终的损失函数,可以使用基于sigmoid的交叉熵,在此基础上,使用反向传播算法,学习整个网络。全连接层将根据POI信息的综合特征表示,进一步预测出POI信息对应的主题词列表。例如,根据特征[1,2,3,4,5]预测出所述菜品的POI信息的主题词列表。
具体实施时,每一个POI信息可以对应多个主题词,多个主题词以主题词序列的形式输出。
步骤220,通过第二神经网络模型,基于确定的主题词生成所述POI信息所属POI的文案。
具体实施时,所述第二神经网络模型可以为基于编码-解码的深度神经网络模型。
基于确定的主题词生成所述POI信息所属POI的文案参见实施例一,此处不再赘述。
可选的,如图2所示,在通过第二神经网络模型,基于确定的主题词生成所述POI信息所属POI的文案的步骤之前,所述方法还包括:
步骤230,确定用户定制的主题词。
具体实施时,可以通过对用户信息进行分析后,提取用户兴趣或偏好等相关的主题词作为用户定制的主题词。或者,根据实际需要人为描述主题的词语作为用户定制的主题词。
当系统输入了用户定制的主题词时,通过第二神经网络模型,基于确定的主题词生成所述POI信息所属POI的文案时,确定的主题词包括两部分:第一部分是通过深度卷积神经网络模型对所述POI信息进行主题倾向预测确定的主题词;第二部分是用户定制的主题词。
所述基于确定的主题词生成所述POI信息所属POI的文案包括:基于根据所述POI信息进行预测得到的主题词和所述用户定制的主题词,生成所述POI信息所属POI的文案,即将通过第一神经网络模型模型预测确定的主题词和用户定制的主题词同时输入至第二神经网络模型,用于生成所述POI信息所属POI的文案。例如,通过深度卷积神经网络模型对所述POI信息进行主题倾向预测确定的主题词为“环境干净,口味偏辣”,用户定制的主题词为“口味偏辣”,把通过深度卷积神经网络模型对所述POI信息进行主题倾向预测确定的主题词和用户定制的主题词结合,即将“环境干净,口味偏辣”和“口味偏辣”作为基于编码-解码的深度神经网络模型的输入,用于生成文案,口味部分主题就会得到强化,最终的文案也会更符合用户偏好。
本申请实施例公开的POI文案生成方法,通过获取用于生成文案的POI信息,然后,通过第一神经网络模型对所述POI信息进行主题倾向预测,确定所述POI信息的主题词,并结合用户定制的主题词生成所述POI信息的文案,解决了现有技术中POI文案生成方法存在的得到的文案对POI的表达能力不强,并且表达准确性不高的问题。通过基于深度卷积神经网络模型对所述POI信息进行主题倾向预测,得到主题词,并将主题词作为生成文案的输入文本,缩小了生成文案的输入文本的数据范围,使生成文案的输入文本更具备针对性,进一步提高了生成的文案的准确性并提升了文案的表达能力。同时,通过自动提取主题词也提高了生成文案的效率。
进一步的,通过根据用户的需求灵活补充主题词,使得生成的主题词更符合用户偏好,可以进一步提升POI的点击率。通过在深度卷积神经网络模型中设置多个数据处理通道,每个数据处理通道对应一个独立的卷积模块,可以处理多种形式的POI信息,丰富了生成文案的数据源,进一步提升了生成的文案的准确性和表达能力。
对于每一个POI,首先预测出它的主题倾向,即一系列主题词,然后将主题词序列直接作为编码-解码神经网络的输入,主导最终文案的生成,同时,这个主题词序列能为生成的文案提供直观的来源解释。同时,当需要对基于编码-解码的深度神经网络模型最终输出文案的风格进行迁移时,只需重新训练一个基于编码-解码神经网络模型即可,使得文案风格迁移变得简单,且多风格间可视需要灵活切换。
实施例三
如图4所示,本申请的另一实施例中公开的POI文案生成装置,包括:
POI信息获取模块410,用于获取用于生成文案的POI信息;
主题词确定模块420,用于对所述POI信息进行主题倾向预测,确定所述POI信息的主题词;
文案生成模块430,用于基于所述主题词确定模块420确定的主题词生成所述POI信息所属POI的文案。
可选的,所述主题词确定模块420进一步用于:通过第一神经网络模型对所述POI信息进行主题倾向预测,确定所述POI信息的主题词;
所述文案生成模块430进一步用于:通过第二神经网络模型,基于确定的主题词生成所述POI信息所属POI的文案。
可选的,如图5所示,所述主题词确定模块420包括:
局部特征提取单元4201,用于分别确定不同形式的所述POI信息的特征;
综合特征确定单元4202,用于将所述不同形式的所述POI信息的特征进行融合,确定所述POI信息的综合特征表示;
主题词确定单元4203,用于通过所述第一神经网络模型将所述综合特征表示映射成所述POI信息的主题词。
可选的,所述不同形式的所述POI信息包括:文本形式的POI信息,和/或,图片形式的POI信息。
可选的,所述第一神经网络模型为深度卷积神经网络模型,包括多个数据处理通道,如:文本处理通道和/或图片处理通道。
可选的,所述文本处理通道采用一层一维卷积加一层最大池化的网络结构。
可选的,所述图片处理通道采用二维卷积和最大池化交替堆叠的网络结构。
可选的,所述深度卷积神经网络模型包括:基于深度卷积神经网络的多目标分类器。
可选的,所述文案生成模块430,进一步用于基于所述主题词确定模块420确定的主题词,通过基于编码-解码的深度神经网络模型生成所述POI信息所属POI的文案。
本申请实施例公开的POI文案生成装置,通过获取用于生成文案的POI信息,然后,对所述POI信息进行主题倾向预测,确定所述POI信息的主题词,最后,基于确定的主题词生成所述POI信息所属POI的文案,解决了现有技术中POI文案生成方法存在的得到的文案对POI的表达能力不强,并且表达准确性不高的问题。通过首先对所述POI信息进行主题倾向预测,得到主题词,并将主题词作为生成文案的输入文本,缩小了生成文案的输入文本的数据范围,使生成文案的输入文本更具备针对性,进一步提高了生成的文案的准确性并提升了文案的表达能力。同时,通过自动提取主题词也提高了生成文案的效率。
通过在深度卷积神经网络模型中设置多个数据处理通道,每个数据处理通道对应一个独立的卷积模块,可以处理多种形式的POI信息,丰富了生成文案的数据源,进一步提升了生成的文案的准确性和表达能力。
对于每一个POI,首先预测出它的主题倾向,即一系列主题词,然后将主题词序列直接作为编码-解码神经网络的输入,主导最终文案的生成,同时,这个主题词序列能为生成的文案提供直观的来源解释。同时,当需要对基于编码-解码的深度神经网络模型最终输出文案的风格进行迁移时,只需重新训练一个基于编码-解码的深度神经网络模型即可,使得文案风格迁移变得简单,且多风格间可视需要灵活切换。
实施例四
如图6所示,基于实施例三,本申请的另一实施例中公开的POI文案生成装置,还包括:
用户定制主题词确定模块440,用于确定用户定制的主题词;
所述文案生成模块430进一步用于:基于所述主题词确定模块420确定的主题词和所述用户定制主题词确定模块440确定的主题词,生成所述POI信息所属POI的文案。
本申请实施例公开的POI文案生成装置,通过预测出POI信息的主题倾向,即一系列主题词,然后将主题词序列直接作为编码-解码神经网络的输入,主导最终文案的生成,可以实现根据用户的需求灵活补充主题词,使得生成的主题词更符合用户偏好,可以进一步提升POI的点击率。
相应的,本申请还公开了一种电子设备,包括存储器、处理器及存储在所述存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如本申请实施例一和实施例二所述的POI文案生成方法。所述电子设备可以为移动终端、智能电话、导航仪、个人数字助理、平板电脑等。
本申请还公开了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本申请实施例一和实施例二所述的POI文案生成方法的步骤。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上对本申请提供的一种POI文案生成方法及装置进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件实现。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

Claims (10)

1.一种POI文案生成方法,其特征在于,包括:
获取用于生成文案的POI信息;
对所述POI信息进行主题倾向预测,确定所述POI信息的主题词;
基于确定的主题词生成所述POI信息所属POI的文案。
2.根据权利要求1所述的方法,其特征在于,所述对所述POI信息进行主题倾向预测,确定所述POI信息的主题词的步骤,包括:
通过第一神经网络模型对所述POI信息进行主题倾向预测,确定所述POI信息的主题词;
所述基于确定的主题词生成所述POI信息所属POI的文案的步骤,包括:
通过第二神经网络模型,基于确定的主题词生成所述POI信息所属POI的文案。
3.根据权利要求2所述的方法,其特征在于,所述通过第一神经网络模型对所述POI信息进行主题倾向预测,确定所述POI信息的主题词的步骤,包括:
分别确定不同形式的所述POI信息的特征;
将所述不同形式的所述POI信息的特征进行融合,确定所述POI信息的综合特征表示;
通过所述第一神经网络模型将所述综合特征表示映射成所述POI信息的主题词。
4.根据权利要求3所述的方法,其特征在于,所述不同形式的所述POI信息包括:文本形式的POI信息,和/或,图片形式的POI信息。
5.根据权利要求1至4任一项所述的方法,其特征在于,所述基于确定的主题词生成所述POI信息所属POI的文案的步骤之前,还包括:
确定用户定制的主题词;
所述基于确定的主题词生成所述POI信息所属POI的文案的步骤包括:
基于根据所述POI信息进行预测得到的主题词和所述用户定制的主题词,生成所述POI信息所属POI的文案。
6.一种POI文案生成装置,其特征在于,包括:
POI信息获取模块,用于获取用于生成文案的POI信息;
主题词确定模块,用于对所述POI信息进行主题倾向预测,确定所述POI信息的主题词;
文案生成模块,用于基于所述主题词确定模块确定的主题词生成所述POI信息所属POI的文案。
7.根据权利要求6所述的装置,其特征在于,
所述主题词确定模块进一步用于:通过第一神经网络模型对所述POI信息进行主题倾向预测,确定所述POI信息的主题词;
所述文案生成模块进一步用于:通过第二神经网络模型,基于确定的主题词生成所述POI信息所属POI的文案。
8.根据权利要求6或7所述的装置,其特征在于,还包括:
用户定制主题词确定模块,用于确定用户定制的主题词;
所述文案生成模块进一步用于:基于所述主题词确定模块确定的主题词和所述用户定制主题词确定模块确定的主题词,生成所述POI信息所属POI的文案。
9.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至5任一项所述的POI文案生成方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1至5任一项所述的POI文案生成方法的步骤。
CN201710862104.7A 2017-09-21 2017-09-21 一种poi文案生成方法及装置,电子设备 Active CN107861938B (zh)

Priority Applications (8)

Application Number Priority Date Filing Date Title
CN201710862104.7A CN107861938B (zh) 2017-09-21 2017-09-21 一种poi文案生成方法及装置,电子设备
US16/622,300 US20200132491A1 (en) 2017-09-21 2017-12-20 Generating point of interest copy
JP2019568702A JP6961727B2 (ja) 2017-09-21 2017-12-20 関心点コピーの生成
PCT/CN2017/117428 WO2019056628A1 (zh) 2017-09-21 2017-12-20 关注点文案的生成
CA3069365A CA3069365A1 (en) 2017-09-21 2017-12-20 Generation of point of interest copy
EP17926304.1A EP3623957A4 (en) 2017-09-21 2017-12-20 CREATING A COPY OF A POINT OF INTEREST
KR1020197036812A KR20200007900A (ko) 2017-09-21 2017-12-20 관심 포인트 문안의 생성
TW107110542A TWI754033B (zh) 2017-09-21 2018-03-27 關注點文案的生成

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710862104.7A CN107861938B (zh) 2017-09-21 2017-09-21 一种poi文案生成方法及装置,电子设备

Publications (2)

Publication Number Publication Date
CN107861938A true CN107861938A (zh) 2018-03-30
CN107861938B CN107861938B (zh) 2020-09-25

Family

ID=61699565

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710862104.7A Active CN107861938B (zh) 2017-09-21 2017-09-21 一种poi文案生成方法及装置,电子设备

Country Status (8)

Country Link
US (1) US20200132491A1 (zh)
EP (1) EP3623957A4 (zh)
JP (1) JP6961727B2 (zh)
KR (1) KR20200007900A (zh)
CN (1) CN107861938B (zh)
CA (1) CA3069365A1 (zh)
TW (1) TWI754033B (zh)
WO (1) WO2019056628A1 (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108615036A (zh) * 2018-05-09 2018-10-02 中国科学技术大学 一种基于卷积注意力网络的自然场景文本识别方法
CN108932335A (zh) * 2018-07-10 2018-12-04 北京京东尚科信息技术有限公司 一种生成文案的方法和装置
CN109117485A (zh) * 2018-09-06 2019-01-01 北京京东尚科信息技术有限公司 祝福语文本生成方法和装置、计算机可读存储介质
CN109447706A (zh) * 2018-10-25 2019-03-08 深圳前海微众银行股份有限公司 广告文案生成方法、装置、设备以及可读存储介质
CN109508449A (zh) * 2018-08-07 2019-03-22 上海奇邑文化传播有限公司 一种宣传片文案在线生成系统及其生成方法
CN109544201A (zh) * 2018-10-11 2019-03-29 北京奇虎科技有限公司 一种广告文案的生成方法、装置及电子设备
CN110321537A (zh) * 2019-06-11 2019-10-11 阿里巴巴集团控股有限公司 一种文案生成方法和装置
CN111581926A (zh) * 2020-05-15 2020-08-25 北京字节跳动网络技术有限公司 文案生成方法、装置、设备和计算机可读存储介质
CN113254633A (zh) * 2021-05-10 2021-08-13 中国民生银行股份有限公司 消息文案生成方法和装置

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110162799B (zh) * 2018-11-28 2023-08-04 腾讯科技(深圳)有限公司 模型训练方法、机器翻译方法以及相关装置和设备
TWI739124B (zh) * 2019-04-26 2021-09-11 長佳智能股份有限公司 在被監督狀態下提供類神經網路訓練模型之雲端交易系統及其方法
US11210477B2 (en) * 2019-05-09 2021-12-28 Adobe Inc. Systems and methods for transferring stylistic expression in machine translation of sequence data
US10970598B1 (en) * 2020-05-13 2021-04-06 StradVision, Inc. Learning method and learning device for training an object detection network by using attention maps and testing method and testing device using the same
CN111915608B (zh) * 2020-09-11 2023-08-15 北京百度网讯科技有限公司 建筑物提取方法、装置、设备和存储介质
CN112015439B (zh) * 2020-09-21 2024-01-12 北京百度网讯科技有限公司 用户app兴趣的嵌入方法、装置、设备以及存储介质
CN113688230A (zh) * 2021-07-21 2021-11-23 武汉众智数字技术有限公司 一种文本摘要生成的方法及系统
CN114051273B (zh) * 2021-11-08 2023-10-13 南京大学 一种基于深度学习的大规模网络动态自适应路径规划方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104899339A (zh) * 2015-07-01 2015-09-09 北京奇虎科技有限公司 对poi信息进行分类的方法和装置
CN105930314A (zh) * 2016-04-14 2016-09-07 清华大学 基于编码-解码深度神经网络的文本摘要生成系统及方法
CN106096605A (zh) * 2016-06-02 2016-11-09 史方 一种基于深度学习的图像模糊区域检测方法及装置
CN106202132A (zh) * 2015-04-16 2016-12-07 珀斯特传媒有限公司 用户定制型旅行计划生成方法及旅行计划生成服务器
CN106503255A (zh) * 2016-11-15 2017-03-15 科大讯飞股份有限公司 基于描述文本自动生成文章的方法及系统
CN106776540A (zh) * 2016-11-23 2017-05-31 清华大学 一种自由化文本生成方法
CN106919646A (zh) * 2017-01-18 2017-07-04 南京云思创智信息科技有限公司 中文文本摘要生成系统及方法
CN106980683A (zh) * 2017-03-30 2017-07-25 中国科学技术大学苏州研究院 基于深度学习的博客文本摘要生成方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102142003B (zh) * 2010-07-30 2013-04-24 华为软件技术有限公司 兴趣点信息提供方法及装置
US9165206B2 (en) * 2011-12-12 2015-10-20 Google Inc. Updating point of interest data based on an image
US20140074610A1 (en) * 2012-09-13 2014-03-13 Qualcomm Incorporated Generating a point of interest profile based on third-party social comments
JP6177030B2 (ja) * 2013-07-04 2017-08-09 クラリオン株式会社 Poi情報提供システム、poi情報提供装置、poi情報提供方法、及びプログラム
CN104572645B (zh) * 2013-10-11 2020-07-10 阿里巴巴(中国)有限公司 兴趣点数据关联方法及装置
KR101556743B1 (ko) * 2014-04-07 2015-10-02 주식회사 케이티 웹 수집에 기반한 관심 정보 생성 장치 및 그 방법
CN104537027B (zh) * 2014-12-19 2019-05-10 百度在线网络技术(北京)有限公司 信息推荐方法及装置
CN105224660A (zh) * 2015-09-30 2016-01-06 北京奇虎科技有限公司 一种地图兴趣点poi数据的处理方法和装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106202132A (zh) * 2015-04-16 2016-12-07 珀斯特传媒有限公司 用户定制型旅行计划生成方法及旅行计划生成服务器
CN104899339A (zh) * 2015-07-01 2015-09-09 北京奇虎科技有限公司 对poi信息进行分类的方法和装置
CN105930314A (zh) * 2016-04-14 2016-09-07 清华大学 基于编码-解码深度神经网络的文本摘要生成系统及方法
CN106096605A (zh) * 2016-06-02 2016-11-09 史方 一种基于深度学习的图像模糊区域检测方法及装置
CN106503255A (zh) * 2016-11-15 2017-03-15 科大讯飞股份有限公司 基于描述文本自动生成文章的方法及系统
CN106776540A (zh) * 2016-11-23 2017-05-31 清华大学 一种自由化文本生成方法
CN106919646A (zh) * 2017-01-18 2017-07-04 南京云思创智信息科技有限公司 中文文本摘要生成系统及方法
CN106980683A (zh) * 2017-03-30 2017-07-25 中国科学技术大学苏州研究院 基于深度学习的博客文本摘要生成方法

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108615036B (zh) * 2018-05-09 2021-10-01 中国科学技术大学 一种基于卷积注意力网络的自然场景文本识别方法
CN108615036A (zh) * 2018-05-09 2018-10-02 中国科学技术大学 一种基于卷积注意力网络的自然场景文本识别方法
CN108932335A (zh) * 2018-07-10 2018-12-04 北京京东尚科信息技术有限公司 一种生成文案的方法和装置
CN108932335B (zh) * 2018-07-10 2022-01-07 北京京东尚科信息技术有限公司 一种生成文案的方法和装置
CN109508449A (zh) * 2018-08-07 2019-03-22 上海奇邑文化传播有限公司 一种宣传片文案在线生成系统及其生成方法
CN109117485A (zh) * 2018-09-06 2019-01-01 北京京东尚科信息技术有限公司 祝福语文本生成方法和装置、计算机可读存储介质
CN109117485B (zh) * 2018-09-06 2023-08-08 北京汇钧科技有限公司 祝福语文本生成方法和装置、计算机可读存储介质
CN109544201A (zh) * 2018-10-11 2019-03-29 北京奇虎科技有限公司 一种广告文案的生成方法、装置及电子设备
CN109447706A (zh) * 2018-10-25 2019-03-08 深圳前海微众银行股份有限公司 广告文案生成方法、装置、设备以及可读存储介质
CN109447706B (zh) * 2018-10-25 2022-06-21 深圳前海微众银行股份有限公司 广告文案生成方法、装置、设备以及可读存储介质
CN110321537B (zh) * 2019-06-11 2023-04-07 创新先进技术有限公司 一种文案生成方法和装置
CN110321537A (zh) * 2019-06-11 2019-10-11 阿里巴巴集团控股有限公司 一种文案生成方法和装置
CN111581926A (zh) * 2020-05-15 2020-08-25 北京字节跳动网络技术有限公司 文案生成方法、装置、设备和计算机可读存储介质
CN111581926B (zh) * 2020-05-15 2023-09-01 抖音视界有限公司 文案生成方法、装置、设备和计算机可读存储介质
CN113254633A (zh) * 2021-05-10 2021-08-13 中国民生银行股份有限公司 消息文案生成方法和装置

Also Published As

Publication number Publication date
US20200132491A1 (en) 2020-04-30
WO2019056628A1 (zh) 2019-03-28
JP2020523699A (ja) 2020-08-06
CA3069365A1 (en) 2019-03-28
TW201915790A (zh) 2019-04-16
KR20200007900A (ko) 2020-01-22
TWI754033B (zh) 2022-02-01
EP3623957A1 (en) 2020-03-18
JP6961727B2 (ja) 2021-11-05
CN107861938B (zh) 2020-09-25
EP3623957A4 (en) 2020-04-22

Similar Documents

Publication Publication Date Title
CN107861938A (zh) 一种poi文案生成方法及装置,电子设备
CN110490213B (zh) 图像识别方法、装置及存储介质
CN109271493B (zh) 一种语言文本处理方法、装置和存储介质
CN109344404B (zh) 情境感知的双重注意力自然语言推理方法
CN110489755A (zh) 文本生成方法和装置
CN108959246A (zh) 基于改进的注意力机制的答案选择方法、装置和电子设备
CN109033068A (zh) 基于注意力机制的用于阅读理解的方法、装置和电子设备
CN110060097A (zh) 基于注意力机制和卷积神经网络的用户行为序列推荐方法
CN108334499A (zh) 一种文本标签标注设备、方法和计算设备
CN107870964B (zh) 一种应用于答案融合系统的语句排序方法及系统
CN110084281A (zh) 图像生成方法、神经网络的压缩方法及相关装置、设备
CN110427490A (zh) 一种基于自注意力机制的情感对话生成方法与装置
CN106844442A (zh) 基于fcn特征提取的多模态循环神经网络图像描述方法
CN106202010A (zh) 基于深度神经网络构建法律文本语法树的方法和装置
CN108665055B (zh) 一种图说生成方法及装置
CN107330130A (zh) 一种向人工客服推荐回复内容的对话机器人的实现方法
CN109816438B (zh) 信息推送方法及装置
CN110795571A (zh) 基于深度学习和知识图谱的文化旅游资源推荐方法
CN108280132A (zh) 建立语义图像分割的个性化知识库的方法及系统
CN106897254A (zh) 一种网络表示学习方法
CN110502626A (zh) 一种基于卷积神经网络的方面级情感分析方法
CN113987147A (zh) 样本处理方法及装置
CN108734212A (zh) 一种确定分类结果的方法以及相关装置
CN112015896B (zh) 基于人工智能的情感分类方法、以及装置
CN108304376A (zh) 文本向量的确定方法、装置、存储介质及电子装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1249609

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant