CN110706064A - 菜品推荐信息的生成方法、装置、设备及存储介质 - Google Patents
菜品推荐信息的生成方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN110706064A CN110706064A CN201910894544.XA CN201910894544A CN110706064A CN 110706064 A CN110706064 A CN 110706064A CN 201910894544 A CN201910894544 A CN 201910894544A CN 110706064 A CN110706064 A CN 110706064A
- Authority
- CN
- China
- Prior art keywords
- dish
- comment
- information
- candidate
- name
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 51
- 230000008451 emotion Effects 0.000 claims abstract description 45
- 238000012216 screening Methods 0.000 claims abstract description 40
- 238000001914 filtration Methods 0.000 claims description 9
- 238000012545 processing Methods 0.000 claims description 7
- 230000014509 gene expression Effects 0.000 claims description 6
- 239000012634 fragment Substances 0.000 claims description 5
- 235000021186 dishes Nutrition 0.000 description 33
- 235000019640 taste Nutrition 0.000 description 15
- 235000013305 food Nutrition 0.000 description 10
- 239000000463 material Substances 0.000 description 9
- 238000012552 review Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 4
- 238000002360 preparation method Methods 0.000 description 4
- 241000227653 Lycopersicon Species 0.000 description 3
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 3
- 230000002457 bidirectional effect Effects 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 206010013911 Dysgeusia Diseases 0.000 description 2
- 244000061456 Solanum tuberosum Species 0.000 description 2
- 235000002595 Solanum tuberosum Nutrition 0.000 description 2
- 238000012790 confirmation Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 235000016709 nutrition Nutrition 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 235000012015 potatoes Nutrition 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000002996 emotional effect Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 239000000796 flavoring agent Substances 0.000 description 1
- 235000019634 flavors Nutrition 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0623—Item investigation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/335—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/12—Hotels or restaurants
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Tourism & Hospitality (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Strategic Management (AREA)
- Finance (AREA)
- Economics (AREA)
- Accounting & Taxation (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Human Resources & Organizations (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Development Economics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请公开了一种菜品推荐信息的生成方法、装置、设备及存储介质,该方法包括:通过获取商家的评论信息,评论信息是用户在在线服务程序中对商家进行评论的信息;从商家的评论信息中,筛选出具有菜品名称且情感分类为正向的菜品评论信息;从菜品评论信息中,筛选出符合优质评论条件的优质菜品评论句子;根据优质菜品评论句子生成菜品的菜品推荐信息。该方法通过直接从菜品的评论信息中确定出符合要求的优质菜品评论句子来生成菜品的推荐信息,使菜品推荐信息语句通顺、意思顺畅,而非是套用模板,避免了套用模板导致的推荐信息的生硬刻板的问题。
Description
技术领域
本申请涉及应用程序领域,特别涉及一种菜品推荐信息的生成方法、装置、设备及存储介质。
背景技术
在点菜平台上,每一个商户下有各式各样的店菜,为了让用户更好的了解各个商户下店菜的特点,点菜平台为各个商户提供了店菜的推荐理由的机器生成服务。
现今,存在一种店菜推荐理由的机器生成的方法,通过确定出消费者的情感正向的评论信息中的店菜名称,并将该店菜名称与店菜的完整名称进行匹配,将匹配成功的店菜的完整名称按照预设的不同模板生成推荐理由,从而为消费者展示该店铺菜品的特点。
但是,上述方法中由于店菜推荐理由是按照预设的模板生成的,因此,上述店菜推荐理由生硬刻板。
发明内容
本申请实施例提供了一种菜品推荐信息的生成方法、装置、设备及存储介质,可以由于店菜推荐理由的生成依赖于预设的模板而生硬刻板的问题。所述技术方案如下:
根据本申请的一个方面,提供了一种菜品推荐信息的生成方法,该方法包括:
获取商家的评论信息,评论信息是用户在在线服务程序中对商家进行评论的信息;
从商家的评论信息中,筛选出具有菜品名称且情感分类为正向的菜品评论信息;
从菜品评论信息中,筛选出符合优质评论条件的优质菜品评论句子;
根据优质菜品评论句子生成菜品的菜品推荐信息。
在一些实施例中,从商家的评论信息中,筛选出具有菜品名称且情感分类为正向的菜品评论信息的步骤,包括:
获取商家提供的菜品名称;
根据菜品名称在评论信息中进行菜名识别,得到含有菜品名称的候选评论信息;
对候选评论信息中的句子按照第一标点级别进行粗粒度划分,得到粗粒度子句;
调用情感分析模型对含有菜品名称的粗粒度子句进行情感分类;
将情感分类为正向的粗粒度子句,确定为菜品评论信息。
在一些实施例中,根据店菜名称在评论信息中进行菜名识别,得到含有菜品名称的候选评论信息的步骤,包括:
通过菜品识别模型从评论信息中识别候选菜名;
根据结构化规则和最长公共子序列,计算候选菜名和商家提供的菜品名称之间的相似度;
将相似度大于阈值的候选菜名所属的评论信息,确定为含有菜品名称的候选评论信息。
在一些实施例中,从菜品评论信息中,筛选出符合优质评论条件的优质菜品评论句子的步骤,包括:
对菜品评论信息中的句子按照第二标点级别进行细粒度划分,得到细粒度子句;
在细粒度子句中,筛选含有菜品名称的菜品候选描述;
调用菜品描述判断模型对菜品候选描述进行分类,得到菜品候选描述的分类结果;
将分类结果为不相关的菜品候选描述进行剔除,得到分类结果为相关的菜品候选描述;
将分类结果为相关的菜品候选描述,确定为优质菜品评论句子。
在一些实施例中,在细粒度子句中,筛选含有菜品名称的菜品候选描述的步骤,包括:
在按序排列的多个细粒度子句中,识别离菜品名称最近的其它菜品名称;
根据其它菜品名称截取含有菜品名称的句子片段,作为菜品名称的菜品候选描述。
在一些实施例中,该方法还包括:
对菜品候选描述中的表情进行删除。
在一些实施例中,该方法还包括:
当菜品候选描述中存在否定词或脏词时,过滤菜品候选描述。
在一些实施例中,该方法还包括:
当优质菜品评论句子的长度大于x个字符时,过滤优质菜品评论句子。
在一些实施例中,优质菜品评论句子为至少两组,
根据优质菜品评论句子生成菜品的菜品推荐信息的步骤,包括:
对于每个优质菜品评论句子,识别优质菜品评论句子中的若干个核心词语;
根据预设词典确定若干个核心词语分别对应的权重分数,根据若干个核心词语分别对应的权重分数计算得到优质菜品评论句子的总分数;
将总分数最高的优质菜品评论句子,确定为菜品的菜品推荐信息。
根据本申请的另一方面,提供了一种菜品推荐信息的生成装置,该装置包括:
获取模块,用于获取商家的评论信息,评论信息是用户在在线服务程序中对商家进行评论的信息;
筛选模块,用于从商家的评论信息中,筛选出具有菜品名称且情感分类为正向的菜品评论信息;从菜品评论信息中,筛选出符合优质评论条件的优质菜品评论句子;
生成模块,用于根据优质菜品评论句子生成菜品的菜品推荐信息。
在一些实施例中,筛选模块,包括:
获取子模块,用于获取商家提供的菜品名称;
第一识别子模块,用于根据菜品名称在评论信息中进行菜名识别,得到含有菜品名称的候选评论信息;
划分子模块,用于对候选评论信息中的句子按照第一标点级别进行粗粒度划分,得到粗粒度子句;
分类子模块,用于调用情感分析模型对含有菜品名称的粗粒度子句进行情感分类;
第一确定子模块,用于将情感分类为正向的粗粒度子句,确定为菜品评论信息。
在一些实施例中,第一识别子模块,用于通过菜品识别模型从评论信息中识别候选菜名;根据结构化规则和最长公共子序列,计算候选菜名和商家提供的菜品名称之间的相似度;将相似度大于阈值的候选菜名所属的评论信息,确定为含有菜品名称的候选评论信息。
在一些实施例中,
划分子模块,用于对菜品评论信息中的句子按照第二标点级别进行细粒度划分,得到细粒度子句;
筛选子模块,用于在细粒度子句中,筛选含有菜品名称的菜品候选描述;
分类子模块,用于调用菜品描述判断模型对菜品候选描述进行分类,得到菜品候选描述的分类结果;将分类结果为不相关的菜品候选描述进行剔除,得到分类结果为相关的菜品候选描述;
第一确定子模块,用于将分类结果为相关的菜品候选描述,确定为优质菜品评论句子。
在一些实施例中,筛选子模块,用于在按序排列的多个细粒度子句中,识别离菜品名称最近的其它菜品名称;根据其它菜品名称截取含有菜品名称的句子片段,作为菜品名称的菜品候选描述。
在一些实施例中,筛选模块,还用于对菜品候选描述中的表情进行删除。
在一些实施例中,筛选模块,还用于当菜品候选描述中存在否定词或脏词时,过滤菜品候选描述。
在一些实施例中,筛选模块,还用于当优质菜品评论句子的长度大于x个字符时,过滤优质菜品评论句子。
在一些实施例中,优质菜品评论句子为至少两组;生成模块,包括:
第二识别子模块,用于对于每个优质菜品评论句子,识别优质菜品评论句子中的若干个核心词语;
第二确定子模块,用于根据预设词典确定若干个核心词语分别对应的权重分数,根据若干个核心词语分别对应的权重分数计算得到优质菜品评论句子的总分数;将总分数最高的优质菜品评论句子,确定为菜品的菜品推荐信息。
根据本申请的另一方面,提供了一种计算机设备,该计算机设备包括处理器和存储器,存储器中存储有至少一条指令、至少一段程序、代码集或指令集,上述至少一条指令、至少一段程序、代码集或指令集由处理器加载并执行以实现如上方面所述的菜品推荐信息的生成方法。
根据本申请的另一方面,提供了一种计算机可读存储介质,该计算机可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,上述至少一条指令、至少一段程序、代码集或指令集由处理器加载并执行以实现如上方面所述的菜品推荐信息的生成方法。
本申请实施例提供的技术方案带来的有益效果至少包括:
通过获取商家的评论信息,评论信息是用户在在线服务程序中对商家进行评论的信息;从商家的评论信息中,筛选出具有菜品名称且情感分类为正向的菜品评论信息;从菜品评论信息中,筛选出符合优质评论条件的优质菜品评论句子;根据优质菜品评论句子生成菜品的菜品推荐信息。
该菜品推荐信息的生成方法,通过直接从菜品的评论信息中确定出符合要求的优质菜品评论句子来生成菜品的推荐信息,使菜品推荐信息语句通顺、意思顺畅,而非是套用模板,避免了套用模板导致的推荐信息的生硬刻板的问题。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1本申请一个示例性实施例提供的菜品推荐信息的生成方法的流程图;
图2本申请一个示例性实施例提供的菜品推荐信息的生成装置的结构示意图;
图3是本申请一个示例性实施例提供的服务器的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
在点菜平台上,商家为店菜设置相应的推荐信息,向用户展示店菜的特点,促使用户能够根据推荐信息选择更符合自己喜好的菜品进行下单。本申请中点菜平台为商家提供了一种后台服务,使商家无需自己撰写文案,而是通过本申请提供的菜品推荐信息的生成方法根据用户对菜品的评论信息在后台自动生成菜品的推荐信息,以如下实施例对上述菜品推荐信息的生成方法进行说明。
请参考图1,示出了本申请一个示例性实施例提供的菜品推荐信息的生成方法的流程图,该方法应用于服务器中,该方法包括以下步骤:
步骤201,服务器获取商家的评论信息。
其中,评论信息是用户在在线服务程序中对商家进行评论的信息。示意性的,在线服务程序可以是商家的自主下单程序,或者是外卖程序,或者是在应用程序中运行的点餐小程序等。用户可以通过上述在线服务程序进行点餐,选择自己想要的菜品,并在对上述菜品食用后通过上述在线服务程序上传用餐感受,比如,对商家的服务的评价、对食用菜品的评论。因此,服务器可以获取用户对商家的评论信息,其中,商家的评论信息中包括评论菜品的菜品评论信息。
步骤202,服务器从商家的评论信息中,筛选出具有菜品名称且情感分类为正向的菜品评论信息。
由于用户喜好的不同,针对一个菜品不同用户可能会给出不同的评论信息,一个用户给出该菜品味道极好的评论信息,另一个用户可能给出该菜品味道极差的评论信息,上述给出的菜品味道极好的评论信息即为情感分类为正向的评论信息,上述给出的菜品味道极差的评论信息即为情感分类为负向的评论信息。服务器从商家的评论信息中,筛选出对商家的菜品进行评论的菜品评论信息,进而从菜品评论信息中分析出具有菜品名称且情感分类为正向的菜品评论信息。
可选地,服务器对正向的菜品评论信息的筛选可以通过以下示意性步骤实现:
1)服务器获取商家提供的菜品名称。
商家在上传菜品的时候,会根据菜品的特征为每一道菜品进行命名;每一道菜品的菜品名称可以是根据菜品的属性信息命名的,属性信息包括食材、做法、特色、口味中的至少一种。示意性的,“酸辣土豆丝”即是根据菜品的口味和食材命名的,其中,“酸辣”为这道菜品的口味,“土豆丝”为这道菜品的食材。
2)服务器根据菜品名称在评论信息中进行菜名识别,得到含有菜品名称的候选评论信息。
由于用户在对菜品进行评论时,用户使用的名称可能是用户对该菜品的简称,或者是该菜品的别称,因此,需要对商家提供的菜品名称与评论信息中的菜名进行匹配,确定出该评论信息是针对哪一个道菜品的,从而继续菜品推荐信息的生成。
可选地,服务器中设置有菜品识别模型;服务器识别评价信息中的菜名的可选步骤如下:
a、服务器通过菜品识别模型从评论信息中识别候选菜品。
菜品识别模型可以包括双向长短期记忆网络(Long-Short Term Memory,LSTM)模型与条件随机场(Conditional Random Field,CRF)模型的结合;服务器可以通过上述双向LSTM模型与CRF模型的结合对评论信息进行识别,最终输出识别得到的候选菜品。上述菜品识别模型是将历史评论信息作为样本进行训练得到的。
b、服务器根据结构化规则和最长公共子序列,计算候选菜名和商家提供的菜品名称之间的相似度。
结构化规则是指菜品名称的属性结构,其中,菜品名称中可以包括口味、做法、食材、主食、特色中的至少一个属性信息,比如,“西红柿炒鸡蛋”中“西红柿”和“鸡蛋”均属于食材,“炒”属于做法,因此,菜品名称“西红柿炒鸡蛋”的属性结构为“食材+做法+食材”。
服务器根据结构化规则对候选菜名和商家提供的菜品名称进行相似确认;当确认上述候选菜名和商家提供的菜品名称之间相似时,通过最长公共子序列计算候选菜名和商家提供的菜品名称之间的相似度。
示意性的,服务器对候选菜名和商家提供的菜品名称进行识别,分别识别出候选菜名和商家提供的菜品名称的属性结构;当候选菜名的属性结构与商家提供的菜品名称的属性结构一致时,确认候选菜名和商家提供的菜品名称之间相似,通过最长公共子序列计算候选菜名和商家提供的菜品名称之间的相似度;否则,确认候选菜名和商家提供的菜品名称之间不相似,重新对候选菜名与商家提供的另一菜品名称进行相似确认。
c、服务器将相似度大于阈值的候选菜名所属的评论信息,确定为含有菜品名称的候选评论信息。
服务器中设置有阈值,该阈值用于确定候选菜名与商家提供的菜品名称是否匹配。当上述相似度大于阈值时,确定候选菜名与商家提供的菜品名称匹配,将候选菜名确定为对应的商家提供的菜品名称,并将上述候选菜名所属的评论信息确定为对应的商家提供的菜品名称的评论信息。
3)服务器对候选评论信息中的句子按照第一标点级别进行粗粒度划分,得到粗粒度子句。
示意性的,第一标点级别对应句号、感叹号、问号等,也就是说,第一标点级别对应的是完整的一句话。服务器对候选评论信息中的句子可以按照句号、感叹号、问号中至少一种进行粗粒度划分,得到粗粒度子句。
4)服务器调用情感分析模型对含有菜品名称的粗粒度子句进行情感分类。
可选地,上述情感分析模型是将历史评论信息作为样本进行训练得到的,其中,上述样本中包括正样本和负样本,正样本是指情感分类为正向的历史评论信息,负样本是指情感分类为负向的历史评论信息;对上述样本中的每一条历史评论信息的情感分类进行标记,通过上述标记完成的样本对神经网络模型进行训练,得到上述情感分析模型。可选地,上述情感分析模型可以是双向LSTM模型。
服务器从划分得到的粗粒度子句中获取含有菜品名称的粗粒度子句,对划分得到的每一个含有菜品模型的粗粒度子句进行情感分类,得到情感分类为正向的粗粒度子句。
5)服务器将情感分类为正向的粗粒度子句,确定为菜品评论信息。
步骤203,服务器从菜品评论信息中,筛选出符合优质评论条件的优质菜品评论句子。
服务器从得到的含有菜品名称,且情感分类为正向的菜品评论信息中筛选出符合优质评论条件的评论句子,示意性步骤可以如下:
1)服务器对菜品评论信息中的句子按照第二标点级别进行细粒度划分,得到细粒度子句。
示意性的,第二标点级别对应逗号、分号等,也即第二标点级别对应的是半句话,而不是完整的一句话。服务器对菜品评论信息中的句子按照逗号和分号中的至少一种进行划分,得到细粒度子句。
2)服务器在细粒度子句中,筛选含有菜品名称的菜品候选描述。
服务器从细粒度子句中提取出含有菜品名称的细粒度子句。可选地,服务器在按序排列的多个细粒度子句中,识别离菜品名称最近的其它菜品名称;根据其它菜品名称截取含有菜品名称的句子片段,作为菜品名称的菜品候选描述。
需要说明的是,一个细粒度子句中可以包括两个菜品名称,可选地,服务器确定出细粒度子句中除该菜品名称之外的其它菜品名称,对其它菜品名称进行过滤,防止指代不明造成的错误;之后从其它菜品名称中确定出与该菜品名称距离最近的菜品名称,截取该菜品名称与上述距离最近的菜品名称之间的中间内容作为该菜品名称的菜品候选描述。
3)服务器调用菜品描述判断模型对菜品候选描述进行分类,得到菜品候选描述的分类结果。
示意性的,菜品候选描述的分类种类可以包括食材、外观、口感、口味、做法、价格、营养价值、分量、特点、不相关等等;服务器调用菜品描述判断模型对筛选得到的菜品候选描述按照上述分类种类进行分类,得到分类结果。其中,除不相关这一分类种类之外,食材、外观、口感、口味、做法、价格、营养价值、分量、特点均为菜品的相关的菜品候选描述。
可选地,上述菜品描述判断模型可以是双向LSTM模型与注意力(Attention)模型的结合。服务器通过双向LSTM模型与注意力模型的结合模型对菜品候选描述进行分类,得到菜品候选描述的分类结果。
4)服务器将分类结果为不相关的菜品候选描述进行剔除,得到分类结果为相关的菜品候选描述。
5)服务器将分类结果为相关的菜品候选描述,确定为优质菜品评论句子。
需要说明的是,服务器得到分类后的相关的菜品候选描述之后,对细粒度子句的筛选还包括对细粒度子句中的表情、否定词以及脏词等进行过滤。可选地,服务器对菜品候选描述中的表情进行删除。可选地,当菜品候选描述中存在否定词或脏词时,服务器过滤菜品候选描述;也就是说,服务器将包含否定词或脏词的菜品候选描述进行删除。
可选地,对于优质菜品评论句子的长度,若需要控制在x个字符内,则当优质菜品评论句子的长度大于x个字符时,服务器过滤优质菜品评论句子。也就是说,当优质菜品评论句子的长度大于x个字符时,服务器将该优质菜品评论句子剔除。
步骤204,服务器根据优质菜品评论句子生成菜品的菜品推荐信息。
可选地,优质菜品评论句子为一组,服务器将该组优质菜品评论句子确定为对应菜品的菜品推荐信息。
可选地,优质菜品评论句子为至少两组;对于每个优质菜品评论句子,识别优质菜品评论句子中的若干个核心词语;根据预设词典确定若干个核心词语分别对应的权重分数,根据若干个核心词语分别对应的权重分数计算得到优质菜品评论句子的总分数;将总分数最高的优质菜品评论句子,确定为菜品的菜品推荐信息。
其中,预设词典中对应存储有词语以及对应的权重分数,比如,形容词“好吃”和“很好吃”对应的权重分数分别为0.3和0.7;在预设词典中,“好吃”与权重分数0.3对应存储,“很好吃”与权重分数0.7对应存储。
示意性的,服务器从优质菜品评论句子“口感脆脆的,很好吃”中识别出核心词语“口感”、“脆脆的”、“很好吃”;从预设词典中查询得到“口感”的权重分数为0.2,“脆脆的”的权重分数为0.6,“很好吃”的权重分数为0.8,则计算该优质菜品评论句子的总分数为1.6。服务器从优质菜品评论句子“味道还不错”中识别出核心词语“味道”、“不错”;从预设词典中查询得到“味道”的权重分数为0.2,“不错”的权重分数为0.65,则计算该优质菜品评论句子的总分数为0.85。服务器比较二者的总分数,将优质菜品评论句子“口感脆脆的,很好吃”确定为菜品的菜品推荐信息。
综上所述,本实施例提供的菜品推荐信息的生成方法,通过获取商家的评论信息,评论信息是用户在在线服务程序中对商家进行评论的信息;从商家的评论信息中,筛选出具有菜品名称且情感分类为正向的菜品评论信息;从菜品评论信息中,筛选出符合优质评论条件的优质菜品评论句子;根据优质菜品评论句子生成菜品的菜品推荐信息。
该菜品推荐信息的生成方法通过直接从菜品的评论信息中确定出符合要求的优质菜品评论句子来生成菜品的推荐信息,使菜品推荐信息语句通顺、意思顺畅,而非是套用模板,避免了套用模板导致的推荐信息的生硬刻板的问题。
该菜品推荐信息的生成方法对句子的情感分类的判断是通过对划分得到的粗粒度子句进行判断得到的,对比于通过对整个句子的情感分类判断,能够更准确的得到粗粒度子句的情感方向,避免了对整个句子的情感方向的判断不具有代表性的问题。
该菜品推荐信息的生成方法还通过结构化规则和最长公共子序列来匹配候选菜名和商家提供的菜品名称,由于用户的书写习惯的问题,因此候选菜名可能与商家提供的菜品名称之间有偏差,通过上述匹配方法能够有效的避免遗漏匹配候选菜名和商家提供的菜品名称之间的差异。
以下为本申请的装置实施例,对于装置实施例中未详细描述的细节,可以结合参考上述方法实施例中相应的记载,本文不再赘述。
请参考图2,示出了本申请的一个示例性实施例提供的菜品推荐信息的生成装置的结构示意图。该装置可以通过软件、硬件或者两者的结合实现成为服务器的全部或一部分,该装置包括:
获取模块401,用于获取商家的评论信息,评论信息是用户在在线服务程序中对商家进行评论的信息;
筛选模块402,用于从商家的评论信息中,筛选出具有菜品名称且情感分类为正向的菜品评论信息;从菜品评论信息中,筛选出符合优质评论条件的优质菜品评论句子;
生成模块403,用于根据优质菜品评论句子生成菜品的菜品推荐信息。
在一些实施例中,筛选模块402,包括:
获取子模块4021,用于获取商家提供的菜品名称;
第一识别子模块4022,用于根据菜品名称在评论信息中进行菜名识别,得到含有菜品名称的候选评论信息;
划分子模块4023,用于对候选评论信息中的句子按照第一标点级别进行粗粒度划分,得到粗粒度子句;
分类子模块4024,用于调用情感分析模型对含有菜品名称的粗粒度子句进行情感分类;
第一确定子模块4025,用于将情感分类为正向的粗粒度子句,确定为菜品评论信息。
在一些实施例中,第一识别子模块4022,用于通过菜品识别模型从评论信息中识别候选菜名;根据结构化规则和最长公共子序列,计算候选菜名和商家提供的菜品名称之间的相似度;将相似度大于阈值的候选菜名所属的评论信息,确定为含有菜品名称的候选评论信息。
在一些实施例中,
划分子模块4023,用于对菜品评论信息中的句子按照第二标点级别进行细粒度划分,得到细粒度子句;
筛选子模块4026,用于在细粒度子句中,筛选含有菜品名称的菜品候选描述;
分类子模块4024,用于调用菜品描述判断模型对菜品候选描述进行分类,得到菜品候选描述的分类结果;将分类结果为不相关的菜品候选描述进行剔除,得到分类结果为相关的菜品候选描述;
第一确定子模块4025,用于将分类结果为相关的菜品候选描述,确定为优质菜品评论句子。
在一些实施例中,筛选子模块4026,用于在按序排列的多个细粒度子句中,识别离菜品名称最近的其它菜品名称;根据其它菜品名称截取含有菜品名称的句子片段,作为菜品名称的菜品候选描述。
在一些实施例中,筛选模块402,还用于对菜品候选描述中的表情进行删除。
在一些实施例中,筛选模块402,还用于当菜品候选描述中存在否定词或脏词时,过滤菜品候选描述。
在一些实施例中,筛选模块402,还用于当优质菜品评论句子的长度大于x个字符时,过滤优质菜品评论句子。
在一些实施例中,优质菜品评论句子为至少两组;生成模块403,包括:
第二识别子模块4031,用于对于每个优质菜品评论句子,识别优质菜品评论句子中的若干个核心词语;
第二确定子模块4032,用于根据预设词典确定若干个核心词语分别对应的权重分数,根据若干个核心词语分别对应的权重分数计算得到优质评论句子的总分数;将总分数最高的优质评论句子,确定为菜品的菜品推荐信息。
综上所述,本实施例提供的菜品推荐信息的生成装置,通过获取商家的评论信息,评论信息是用户在在线服务程序中对商家进行评论的信息;从商家的评论信息中,筛选出具有菜品名称且情感分类为正向的菜品评论信息;从菜品评论信息中,筛选出符合优质评论条件的优质菜品评论句子;根据优质菜品评论句子生成菜品的菜品推荐信息。
该菜品推荐信息的生成装置通过直接从菜品的评论信息中确定出符合要求的优质菜品评论句子来生成菜品的推荐信息,使菜品推荐信息语句通顺、意思顺畅,而非是套用模板,避免了套用模板导致的推荐信息的生硬刻板的问题。
该菜品推荐信息的生成装置对句子的情感分类的判断是通过对划分得到的粗粒度子句进行判断得到的,对比于通过对整个句子的情感分类判断,能够更准确的得到粗粒度子句的情感方向,避免了对整个句子的情感方向的判断不具有代表性的问题。
该菜品推荐信息的生成装置还通过结构化规则和最长公共子序列来匹配候选菜名和商家提供的菜品名称,由于用户的书写习惯的问题,因此候选菜名可能与商家提供的菜品名称之间有偏差,通过上述匹配方法能够有效的避免遗漏匹配候选菜名和商家提供的菜品名称之间的差异。
请参考图3,示出了本申请一个示例性实施例提供的服务器的结构示意图。该服务器可以用于执行上述可选实施例中的菜品推荐信息的生成方法,具体来讲:
服务器500包括中央处理单元(CPU)501、包括随机存取存储器(RAM)502和只读存储器(ROM)503的系统存储器504,以及连接系统存储器504和中央处理单元501的系统总线505。服务器500还包括帮助计算机内的各个器件之间传输信息的基本输入/输出系统(I/O系统)506,和用于存储操作系统513、应用程序514和其他程序模块515的大容量存储设备507。
基本输入/输出系统506包括有用于显示信息的显示器508和用于用户输入信息的诸如鼠标、键盘之类的输入设备509。其中显示器508和输入设备509都通过连接到系统总线505的输入输出控制器510连接到中央处理单元501。基本输入/输出系统506还可以包括输入输出控制器510以用于接收和处理来自键盘、鼠标、或电子触控笔等多个其他设备的输入。类似地,输入输出控制器510还提供输出到显示屏、打印机或其他类型的输出设备。
大容量存储设备507通过连接到系统总线505的大容量存储控制器(未示出)连接到中央处理单元501。大容量存储设备507及其相关联的计算机可读介质为服务器500提供非易失性存储。也就是说,大容量存储设备507可以包括诸如硬盘或者CD-ROM驱动器之类的计算机可读介质(未示出)。
不失一般性,计算机可读介质可以包括计算机存储介质和通信介质。计算机存储介质包括以用于存储诸如计算机可读指令、数据结构、程序模块或其他数据等信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动介质。计算机存储介质包括RAM、ROM、EPROM、EEPROM、闪存或其他固态存储其技术,CD-ROM、DVD或其他光学存储、磁带盒、磁带、磁盘存储或其他磁性存储设备。当然,本领域技术人员可知计算机存储介质不局限于上述几种。上述的系统存储器504和大容量存储设备507可以统称为存储器。
根据本申请的各种实施例,服务器500还可以通过诸如因特网等网络连接到网络上的远程计算机运行。也即服务器500可以通过连接在系统总线505上的网络接口单元511连接到网络512,或者说,也可以使用网络接口单元511来连接到其他类型的网络或远程计算机系统(未示出)。
上述存储器还包括一个或者一个以上的程序,一个或者一个以上程序存储于存储器中,被配置由CPU执行。
本申请还提供一种计算机设备,该计算机设备包括:处理器和存储器,该存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,该至少一条指令、至少一段程序、代码集或指令集由处理器加载并执行以实现上述各方法实施例提供的菜品推荐信息的生成方法。
本申请还提供一种计算机可读存储介质,该计算机可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,该至少一条指令、至少一段程序、代码集或指令集由处理器加载并执行以实现上述各方法实施例提供的菜品推荐信息的生成方法。
应当理解的是,在本文中提及的“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本申请的可选实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (12)
1.一种菜品推荐信息的生成方法,其特征在于,所述方法包括:
获取商家的评论信息,所述评论信息是用户在在线服务程序中对所述商家进行评论的信息;
从所述商家的所述评论信息中,筛选出具有菜品名称且情感分类为正向的菜品评论信息;
从所述菜品评论信息中,筛选出符合优质评论条件的优质菜品评论句子;
根据所述优质菜品评论句子生成菜品的菜品推荐信息。
2.根据权利要求1所述的方法,其特征在于,所述从所述商家的评论信息中,筛选出具有菜品名称且情感分类为正向的菜品评论信息的步骤,包括:
获取所述商家提供的菜品名称;
根据所述菜品名称在所述评论信息中进行菜名识别,得到含有所述菜品名称的候选评论信息;
对所述候选评论信息中的句子按照第一标点级别进行粗粒度划分,得到粗粒度子句;
调用情感分析模型对含有所述菜品名称的粗粒度子句进行情感分类;
将所述情感分类为正向的粗粒度子句,确定为所述菜品评论信息。
3.根据权利要求2所述的方法,其特征在于,所述根据所述店菜名称在所述评论信息中进行菜名识别,得到含有菜品名称的候选评论信息的步骤,包括:
通过菜品识别模型从所述评论信息中识别候选菜名;
根据结构化规则和最长公共子序列,计算所述候选菜名和所述商家提供的所述菜品名称之间的相似度;
将所述相似度大于阈值的所述候选菜名所属的评论信息,确定为含有所述菜品名称的所述候选评论信息。
4.根据权利要求1所述的方法,其特征在于,所述从所述菜品评论信息中,筛选出符合优质评论条件的优质菜品评论句子的步骤,包括:
对所述菜品评论信息中的句子按照第二标点级别进行细粒度划分,得到细粒度子句;
在所述细粒度子句中,筛选含有所述菜品名称的菜品候选描述;
调用菜品描述判断模型对所述菜品候选描述进行分类,得到所述菜品候选描述的分类结果;
将所述分类结果为不相关的菜品候选描述进行剔除,得到所述分类结果为相关的菜品候选描述;
将所述分类结果为相关的菜品候选描述,确定为所述优质菜品评论句子。
5.根据权利要求4所述的方法,其特征在于,所述在所述细粒度子句中,筛选含有所述菜品名称的菜品候选描述的步骤,包括:
在按序排列的多个细粒度子句中,识别离所述菜品名称最近的其它菜品名称;
根据所述其它菜品名称截取含有所述菜品名称的句子片段,作为所述菜品名称的菜品候选描述。
6.根据权利要求4所述的方法,其特征在于,所述方法还包括:
对所述菜品候选描述中的表情进行删除。
7.根据权利要求4所述的方法,其特征在于,所述方法还包括:
当所述菜品候选描述中存在否定词或脏词时,过滤所述菜品候选描述。
8.根据权利要求4所述的方法,其特征在于,所述方法还包括:
当所述优质菜品评论句子的长度大于x个字符时,过滤所述优质菜品评论句子。
9.根据权利要求1至8任一所述的方法,其特征在于,所述优质菜品评论句子为至少两组,
所述根据所述优质菜品评论句子生成所述菜品的菜品推荐信息的步骤,包括:
对于每个所述优质菜品评论句子,识别所述优质菜品评论句子中的若干个核心词语;
根据预设词典确定所述若干个核心词语分别对应的权重分数,根据所述若干个核心词语分别对应的权重分数计算得到所述优质菜品评论句子的总分数;
将所述总分数最高的所述优质菜品评论句子,确定为所述菜品的所述菜品推荐信息。
10.一种菜品推荐信息的生成装置,其特征在于,所述装置包括:
获取模块,用于获取商家的评论信息,所述评论信息是用户在在线服务程序中对所述商家进行评论的信息;
筛选模块,用于从所述商家的所述评论信息中,筛选出具有菜品名称且情感分类为正向的菜品评论信息;
所述筛选模块,用于从所述菜品评论信息中,筛选出符合优质评论条件的优质菜品评论句子;
生成模块,用于根据所述优质菜品评论句子生成菜品的菜品推荐信息。
11.一种计算机设备,其特征在于,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或所述指令集由所述处理器加载并执行以实现如权利要求1至9所述的任一项所述的菜品推荐信息的生成方法。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行,以实现如权利要求1至9任一项所述的菜品推荐信息的生成方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910894544.XA CN110706064A (zh) | 2019-09-20 | 2019-09-20 | 菜品推荐信息的生成方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910894544.XA CN110706064A (zh) | 2019-09-20 | 2019-09-20 | 菜品推荐信息的生成方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110706064A true CN110706064A (zh) | 2020-01-17 |
Family
ID=69195695
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910894544.XA Pending CN110706064A (zh) | 2019-09-20 | 2019-09-20 | 菜品推荐信息的生成方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110706064A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112287098A (zh) * | 2020-10-22 | 2021-01-29 | 复旦大学 | 文章的生成方法、装置、设备及存储介质 |
CN113283960A (zh) * | 2021-05-18 | 2021-08-20 | 武汉畅来电子商务有限公司 | 基于大数据分析和云计算的垂直电商平台商品智能推荐方法和云服务平台 |
CN113495942A (zh) * | 2020-04-01 | 2021-10-12 | 百度在线网络技术(北京)有限公司 | 推送信息的方法和装置 |
-
2019
- 2019-09-20 CN CN201910894544.XA patent/CN110706064A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113495942A (zh) * | 2020-04-01 | 2021-10-12 | 百度在线网络技术(北京)有限公司 | 推送信息的方法和装置 |
CN113495942B (zh) * | 2020-04-01 | 2022-07-05 | 百度在线网络技术(北京)有限公司 | 推送信息的方法和装置 |
CN112287098A (zh) * | 2020-10-22 | 2021-01-29 | 复旦大学 | 文章的生成方法、装置、设备及存储介质 |
CN113283960A (zh) * | 2021-05-18 | 2021-08-20 | 武汉畅来电子商务有限公司 | 基于大数据分析和云计算的垂直电商平台商品智能推荐方法和云服务平台 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20240080531A1 (en) | Profiling media characters | |
CN109118336B (zh) | 信息推荐方法、装置、计算机设备及存储介质 | |
Volk et al. | Melodic similarity among folk songs: An annotation study on similarity-based categorization in music | |
CN107578292B (zh) | 一种用户画像构建系统 | |
US10410136B2 (en) | Model-based classification of content items | |
CN110706064A (zh) | 菜品推荐信息的生成方法、装置、设备及存储介质 | |
US20170075978A1 (en) | Model-based identification of relevant content | |
CA3080614C (en) | System and method for obtaining and transforming interactive narrative information | |
EP3547245A1 (en) | System and method for producing a customized video file | |
CN1916895A (zh) | 支持分类规则创建的方法和装置 | |
CN111368075A (zh) | 文章质量预测方法、装置、电子设备及存储介质 | |
CN105894183A (zh) | 项目评价方法及装置 | |
CN114663067A (zh) | 一种职位匹配方法、系统、设备及介质 | |
CN111259223B (zh) | 基于情感分析模型的新闻推荐和文本分类方法 | |
CN116882414A (zh) | 基于大规模语言模型的评语自动生成方法及相关装置 | |
WO2023159766A1 (zh) | 餐饮数据分析方法、装置、电子设备及存储介质 | |
CN116741178A (zh) | 文稿生成方法、装置、设备和存储介质 | |
US20220138259A1 (en) | Automated document intake system | |
JP6178480B1 (ja) | データ分析システム、その制御方法、プログラム、及び、記録媒体 | |
CN114548263A (zh) | 标注数据的校验方法、装置、计算机设备及存储介质 | |
CN113761349A (zh) | 一种推荐信息的挖掘方法和装置 | |
CN113870998A (zh) | 问诊方法、装置、电子设备和存储介质 | |
CN112836138A (zh) | 用户推荐方法及装置 | |
Arora et al. | Evaluation Of Product Reviews Using Deep Learning Classifier Models | |
CN117708545B (zh) | 融合主题提取与余弦相似度的观点贡献度评价方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |