CN111597434A - 基于用户画像的外卖推荐方法、系统、装置及介质 - Google Patents

基于用户画像的外卖推荐方法、系统、装置及介质 Download PDF

Info

Publication number
CN111597434A
CN111597434A CN202010280675.1A CN202010280675A CN111597434A CN 111597434 A CN111597434 A CN 111597434A CN 202010280675 A CN202010280675 A CN 202010280675A CN 111597434 A CN111597434 A CN 111597434A
Authority
CN
China
Prior art keywords
user
information
ordering
portrait
takeaway
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010280675.1A
Other languages
English (en)
Other versions
CN111597434B (zh
Inventor
郑倩如
邹才凤
林岳镔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Mechanical and Electrical College
Original Assignee
Guangdong Mechanical and Electrical College
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Mechanical and Electrical College filed Critical Guangdong Mechanical and Electrical College
Priority to CN202010280675.1A priority Critical patent/CN111597434B/zh
Publication of CN111597434A publication Critical patent/CN111597434A/zh
Application granted granted Critical
Publication of CN111597434B publication Critical patent/CN111597434B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/18File system types
    • G06F16/182Distributed file systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0282Rating or review of business operators or products
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Game Theory and Decision Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Probability & Statistics with Applications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了基于用户画像的外卖推荐方法、系统、装置及介质,方法包括:获取用户信息;根据用户的活跃度,从所述用户信息中识别第一用户和第二用户;对所述第一用户的用户信息进行特征提取,并利用提取到的特征构建用户画像;根据所述用户画像,生成推荐餐厅名单。本发明的实施例能够生成外卖订单中的用户画像,并根据用户画像为用户生成餐厅推荐名单,有助于提高用户的点餐效率,节约用户浏览店铺时间,并能餐厅的成交率,可广泛应用于数据挖掘技术领域。

Description

基于用户画像的外卖推荐方法、系统、装置及介质
技术领域
本发明涉及数据挖掘技术领域,尤其是基于用户画像的外卖推荐方法、系统、装置及介质。
背景技术
随着互联网技术发展,以及现代人们生活节奏加快,外卖点餐、送餐已经成为现代人们的一种重要餐饮方式。随着餐饮商户增加,用户从浏览到选择自己心仪的店铺所需时间也随之增加,用户可能会觉得烦躁,从而影响用户满意度。因此,进一步了解用户喜好,帮助用户快速准确找到符合用户要求的商品变得日趋重要。而且,掌握用户喜好,可以帮助平台、商家有针对性地制定营销策略,提高营销效果。
因此,如何快速准确地为用户推荐喜爱的外卖成为一个急需解决的问题。
发明内容
有鉴于此,本发明实施例提供了一种快速且准确的,基于用户画像的外卖推荐方法、系统、装置及介质。
本发明的第一方面提供了基于用户画像的外卖推荐方法,包括:
获取用户信息,所述用户信息包括用户订单信息、用户账号信息和用户评价信息;
根据用户的活跃度,从所述用户信息中识别第一用户和第二用户;
对所述第一用户的用户信息进行特征提取,并利用提取到的特征构建用户画像,所述用户画像包括以下至少之一:用户背景信息、用户点餐喜好、用户点餐时间分布、用户点餐频率、工作日与节假日的点餐频率分布、收餐地分布、用户点餐金额、餐具选择偏好、用户使用软件以及用户评价;
根据所述用户画像,生成推荐餐厅名单。
在一些实施例中,所述获取用户信息,包括:
从目标平台收集用户信息到大数据平台;
通过sqoop工具将所述用户信息导入HDFS文件系统;
通过Hive集群对HDFS文件系统内的用户信息进行筛选,得到各个用户所属的用户信息。
在一些实施例中,所述根据用户的活跃度,从所述用户信息中识别第一用户和第二用户,包括:
从所述用户信息中获取用户活跃度信息,所述用户活跃度信息包括用户账号的有效性和历史交易次数;
将用户账号有效且历史交易次数不为0的用户确定为第一用户,否则确定为第二用户。
在一些实施例中,在对所述第一用户的用户信息进行特征提取,并利用提取到的特征构建用户画像这一步骤中,包括:
将用户评价进行关键字分析,得到用户评价词云。
在一些实施例中,所述将用户评价进行关键字分析,得到用户评价词云,包括:
将用户评价内容汇总,形成文档集合;
对所述文档集合中的内容进行分词,形成词语集合;
统计所述词语集合中的每个词语在对应文档的出现次数,计算得到每个词语的出现概率;
计算所述词语集合中每个词语的逆文档概率;
根据所述出现概率和逆文档概率,计算每个词语的TF-IDF值;
根据所述TF-IDF值对词语集合中的词语进行排序;
根据排序结果确定关键词;
根据所述关键词,通过词云生成工具生成用户评价词云。
在一些实施例中,还包括将用户画像进行实时展示的步骤。
在一些实施例中,在对所述第一用户的用户信息进行特征提取,并利用提取到的特征构建用户画像这一步骤中,还包括确定各类特征权重大小的步骤,该步骤包括:
确定每类特征对应的分类区间;
统计用户在每个分类区间的点餐次数;
根据所述每个分类区间的点餐次数以及用户的所有点餐次数,计算每类特征的权重大小。
根据本发明的第二方面,还提供了一种基于用户画像的外卖推荐系统,包括:
获取模块,用于获取用户信息,所述用户信息包括用户订单信息、用户账号信息和用户评价信息;
识别模块,用于根据用户的活跃度,从所述用户信息中识别第一用户和第二用户;
构建模块,用于对所述第一用户的用户信息进行特征提取,并利用提取到的特征构建用户画像,所述用户画像包括以下至少之一:用户背景信息、用户点餐喜好、用户点餐时间分布、用户点餐频率、工作日与节假日的点餐频率分布、收餐地分布、用户点餐金额、餐具选择偏好、用户使用软件以及用户评价;
推荐模块,用于根据所述用户画像,生成推荐餐厅名单。
根据本发明的第三方面,还提供了一种装置,包括处理器以及存储器;
所述存储器用于存储程序;
所述处理器用于根据所述程序执行如本发明第一方面所述的方法。
根据本发明的第四方面,还提供了一种存储介质,所述存储介质存储有程序,所述程序被处理器执行完成如本发明第一方面所述的方法。
上述本发明实施例中的一个或多个技术方案具有如下优点:本发明的实施例能够生成外卖订单中的用户画像,并根据用户画像为用户生成餐厅推荐名单,有助于提高用户的点餐效率,节约用户浏览店铺时间,并能餐厅的成交率。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例的步骤流程图。
具体实施方式
下面结合说明书附图和具体实施例对本发明作进一步解释和说明。对于本发明实施例中的步骤编号,其仅为了便于阐述说明而设置,对步骤之间的顺序不做任何限定,实施例中的各步骤的执行顺序均可根据本领域技术人员的理解来进行适应性调整。
为了快速准确地为用户推荐喜爱的外卖,如图1所示,本发明实施例提出了一种基于用户画像的外卖推荐方法,包括:
S1、获取用户信息,所述用户信息包括用户订单信息、用户账号信息和用户评价信息;
在一些实施例中,步骤S1包括S11-S13:
S11、从目标平台收集用户信息到大数据平台;
S12、通过sqoop工具将所述用户信息导入HDFS文件系统;
S13、通过Hive集群对HDFS文件系统内的用户信息进行筛选,得到各个用户所属的用户信息。
具体地,本发明首先通过数据源层采集生成外卖用户画像的数据,可以包括用户中心模块、订单模块和评价模块数据。其中用户中心模块数据包括用户注册时间、用户身份证号、用户出生日期、用户姓名、用户性别、用户电话、用户头像、地址列表、用户每次打开APP时间,用户退出APP时间;订单模块数据包括下单时间、下单商户类别、收餐地址、点餐金额、餐具选择信息;评价模块数据包括用户评价时间、评价分数、评价内容文字。
本实施例通过大数据平台于处理数据源层收集的数据,并生成外卖用户画像。其中处理数据可以通过sqoop工具导入HDFS文件系统。采集后的数据通过Hive 集群对这些数据进行筛选。数据先按用户ID相同来分组,统计各个用户ID的注册有效性和历史购买次数。将注册有效并且至少有一次购买记录的用户数据筛选出来用作计算。指标计算完毕后,存到Hbase数据库系统,Hbase系统具有快速检索的特点,便于用户兴趣画像有效展示。
S2、根据用户的活跃度,从所述用户信息中识别第一用户和第二用户;
具体地,所述步骤S2包括S21和S22:
S21、从所述用户信息中获取用户活跃度信息,所述用户活跃度信息包括用户账号的有效性和历史交易次数;
S22、将用户账号有效且历史交易次数不为0的用户确定为第一用户,否则确定为第二用户。
S3、对所述第一用户的用户信息进行特征提取,并利用提取到的特征构建用户画像,所述用户画像包括以下至少之一:用户背景信息、用户点餐喜好、用户点餐时间分布、用户点餐频率、工作日与节假日的点餐频率分布、收餐地分布、用户点餐金额、餐具选择偏好、用户使用软件以及用户评价;
具体地,一些实施例包括步骤S31:将用户评价进行关键字分析,得到用户评价词云。
所述步骤S31包括S311-S318:
S311、将用户评价内容汇总,形成文档集合;
S312、对所述文档集合中的内容进行分词,形成词语集合;
S313、统计所述词语集合中的每个词语在对应文档的出现次数,计算得到每个词语的出现概率;
S314、计算所述词语集合中每个词语的逆文档概率;
S315、根据所述出现概率和逆文档概率,计算每个词语的TF-IDF值;
S316、根据所述TF-IDF值对词语集合中的词语进行排序;
S317、根据排序结果确定关键词;
S318、根据所述关键词,通过词云生成工具生成用户评价词云。
具体地,本实施例的用户评价明细包括对用户评价内容提取关键字的分析并形成词云。关键字提取可以采用TF-IDF、TextRank等无监督学习算法,其中 TF-IDF算法运行效率较高,适用于工程领域。本实施例采用的TD-IDF算法步骤如下:
1)、首先将第j个用户评价内容汇总,形成文档dj,所有用户的评价汇总文档形成集合D=[d1,d2,...dn];
2)、将D中所有文档分词,进一步形成词语集合[t1,t2...tm]。
3)、统计每个词语ti在每个文档dj出现次数ni,j,计算TFi,j,表示词语ti在文档dj出现的概率TFi,j
Figure RE-GDA0002557758110000061
4)、计算逆文档概率IDFi,表示D中包含词语ti个数的倒数取对数
Figure RE-GDA0002557758110000062
5)、将TFi,j与IDFi相乘,获得词语ti的TF-IDFi,j,如果词语ti的TF-IDFi,j较高,表明词语ti在用户评价dj出现较多,而在其他用户评价当中出现较少,因而具有较好区分能力。
TF-IDFi,j=TFi,j×IDFi
6)、在每个dj中将所有词汇按照TF-IDFi,j降序排序,选取TopN个词语作为用户j的评价关键词。
7)、关键词可以使用相关词云生成工具展示,词云可以表达用户对于外卖的满意程度和情感想法。
在一些实施例中,还包括步骤S32:确定各类特征权重大小,该步骤包括:
S321、确定每类特征对应的分类区间;
S322、统计用户在每个分类区间的点餐次数;
S323、根据所述每个分类区间的点餐次数以及用户的所有点餐次数,计算每类特征的权重大小。
具体地,假设该指标有n个分类/区间,分别是[c1,c2,...cn],用户在各个分类点餐的次数为[Tc1,Tc2,...,Tcn],该分类的百分比为 [Pc1,Pc2,...,Pcn],则Pci的计算方式如下:
Figure RE-GDA0002557758110000071
其中,j=1,2,...n
S4、根据所述用户画像,生成推荐餐厅名单。
S5、将用户画像进行实时展示。
具体地,本实施例把用户画像结果展示给相关工作人员或者用户。用户画像指标可以web网页、PC软件、APP应用等形式展现,以方便使用者可以使用PC 端或者移动端访问。
用户展示分为用户画像概览和用户画像明细,用户概览信息是用户画像综合展示,用户画像明细是各个指标的详细展示。
用户概览是用户画像综合信息,包括用户基本信息、用户点餐喜好、用户点餐时间分布、用户点餐频率工作日与节假日分布、收餐地分布、用户点餐金额、餐具选择偏好、用户使用软件、用户评价汇总信息。
用户画像明细包括用户基本信息、用户点餐喜好、用户点餐时间分布、用户点餐频率工作日与节假日分布、收餐地分布、用户点餐金额、餐具选择偏好、用户使用软件、用户评价明细信息。
用户基本信息包括用户注册时间、用户身份证号、用户出生日期、用户姓名、用户性别、用户电话、用户头像、地址列表,可以表格形式展现。
在一些实施例中,用户点餐喜好将用户点餐次数按照商铺一级分类和二级分类进行分布,其中二级分类是一级分类的细分。一级分类可以分为:美食,甜点饮品、超市便利、生鲜果蔬、送药上门、鲜花绿植。每个一级分类有其二级分类,美食二级分类有:快餐便当、米粉面馆、地方菜系、特色小吃、龙虾烧烤、川湘菜、日料寿司、鸭脖卤味、包子粥店、汉堡薯条、轻食沙拉、麻辣烫冒菜、饺子馄饨、炸鸡炸串、火锅串串、韩式料理、意面披萨、香锅干锅、夹馍饼类、东南亚菜、暖胃粉丝汤;甜点饮品二级分类有:面包蛋糕、奶茶果汁、可口甜品、醒脑咖啡、凉茶冰淇淋;超市便利二级分类有:超市卖场、便利店、茶酒专卖、日用百货、宠物用品、零食干果;生鲜果蔬二级分类有:蔬菜、水果、冷冻速食、肉禽蛋奶、海鲜水产;送药上门二级分类有:成人用品、常用药品;鲜花绿植二级分类有:浪漫鲜花、多肉绿植。该项明细包括两部分:用户点餐次数按照商铺一级分类分布,以及用户点餐次数按照商铺二级分类分布。
点餐商铺一级种类分布能够反映用户购买外卖一级分类中品种的偏好。美食二级分类点餐次数分布可以反映出用户在美食这个类别的下单喜好。甜点饮品二级分类点餐次数分布如可以反映出用户在甜点饮品这个类别的下单喜好。超市便利的二级分类点餐次数分布可以反映出用户在超市便利这个类别的下单喜好。生鲜果蔬二级分类点餐次数可以反映出用户在生鲜果蔬这个类别的下单喜好。送药上门二级分类点餐次数可以反映出用户在送药上门这个类别的下单喜好。鲜花绿植二级分类点餐次数可以反映出用户在鲜花绿植这个类别的下单喜好。
用户点餐时间分布明细将用户点餐次数按照用户点餐时间进行划分,并统计每个时段百分比。点餐时段可以分为:早餐、午餐、下午茶、晚餐、夜宵,反映用户下单时间偏好,也能反映用户进食的习惯。
用户点餐频率工作日与节假日分布明细首先将用户点餐日期判断为工作日或者节假日,其中国家法定节假日和周末算为节假日。然后将用户点餐次数百分比按照工作日与节假日进行分布,能够反映用户在工作日与节假日外卖下单偏好。
用户收餐地分布明细首先将用户收餐地址判断其属性,然后将用户点餐次数百分比按照地址属性进行分布,地址属性可以分为:住宅/公寓、写字楼/CBD商圈、商铺、学校及周边、酒店宾馆、机关单位、医院、餐厅、娱乐场所、其他,能够反映用户在不同属性地址下单偏好。
用户点餐金额分布明细是将用户下单次数根据下单金额区间进行分布:小于等于30元、30元-50元(含50元)、50-70(含70元)、70以上,能够反映用户外卖消费能力以及偏好。
餐具选择偏好明细是讲用户下单次数按照提交订单时所选择的餐具数量分布,餐具数量按照以下标准划分区间:不需要、1份、2份、3份、4份、5份、 6份、7份、8份、9份、10份、10份以上,能够反映用户外卖就餐人数。
用户使用软件明细,包括日均使用次数和使用时长分布。在同一天内,用户最近打开APP直到最近一次退出APP视为一次使用,当天使用次数加1,其持续时间为一次使用时长。将用户一段周期内的日均使用次数按照以下区间进行分布:1次、2次、3-4次(含4次)、5-6次(含6次)、6次以上。将用户一段周期内的使用时长按照以下区间进行分布:1分钟以内(含1分钟)、1-3分钟(含3分钟)、3-5分钟(含5分钟)、5-10分钟(含10分钟)、10分钟以上。日均使用次数和使用时长分布能反映出用户对外卖APP软件粘度、依赖程度、以及忠诚度。
用户画像指标可以web网页、PC软件、APP应用等形式展现,以方便用户或者相关工作人员使用PC端或者移动端访问。用户画像可以每隔一定周期进行更新,如1周、1个月、3个月等,以保证能获取用户最新画像。
通过以上所述方法生成外卖用户画像,进一步了解用户点餐喜好,使得平台可以更准确地为用户推荐匹配的商户或者商品,节约用户在众多商户以及商品浏览搜索的时间;另一方面,用户画像为平台以及商家进行市场营销、策略制定、策略优化提供非常重要的参考。
本发明实施例还提供了一种基于用户画像的外卖推荐系统,包括:
获取模块,用于获取用户信息,所述用户信息包括用户订单信息、用户账号信息和用户评价信息;
识别模块,用于根据用户的活跃度,从所述用户信息中识别第一用户和第二用户;
构建模块,用于对所述第一用户的用户信息进行特征提取,并利用提取到的特征构建用户画像,所述用户画像包括以下至少之一:用户背景信息、用户点餐喜好、用户点餐时间分布、用户点餐频率、工作日与节假日的点餐频率分布、收餐地分布、用户点餐金额、餐具选择偏好、用户使用软件以及用户评价;
推荐模块,用于根据所述用户画像,生成推荐餐厅名单。
本发明实施例还提供了一种装置,包括处理器以及存储器;
所述存储器用于存储程序;
所述处理器用于根据所述程序执行如本发明所述的外卖推荐方法。
本发明实施例还提供了一种存储介质,所述存储介质存储有程序,所述程序被处理器执行完成如本发明第一方面所述的外卖推荐方法。
在一些可选择的实施例中,在方框图中提到的功能/操作可以不按照操作示图提到的顺序发生。例如,取决于所涉及的功能/操作,连续示出的两个方框实际上可以被大体上同时地执行或所述方框有时能以相反顺序被执行。此外,在本发明的流程图中所呈现和描述的实施例以示例的方式被提供,目的在于提供对技术更全面的理解。所公开的方法不限于本文所呈现的操作和逻辑流程。可选择的实施例是可预期的,其中各种操作的顺序被改变以及其中被描述为较大操作的一部分的子操作被独立地执行。
此外,虽然在功能性模块的背景下描述了本发明,但应当理解的是,除非另有相反说明,所述的功能和/或特征中的一个或多个可以被集成在单个物理装置和/或软件模块中,或者一个或多个功能和/或特征可以在单独的物理装置或软件模块中被实现。还可以理解的是,有关每个模块的实际实现的详细讨论对于理解本发明是不必要的。更确切地说,考虑到在本文中公开的装置中各种功能模块的属性、功能和内部关系的情况下,在工程师的常规技术内将会了解该模块的实际实现。因此,本领域技术人员运用普通技术就能够在无需过度试验的情况下实现在权利要求书中所阐明的本发明。还可以理解的是,所公开的特定概念仅仅是说明性的,并不意在限制本发明的范围,本发明的范围由所附权利要求书及其等同方案的全部范围来决定。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM, Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。
计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器 (RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。
以上是对本发明的较佳实施进行了具体说明,但本发明并不限于所述实施例,熟悉本领域的技术人员在不违背本发明精神的前提下还可做作出种种的等同变形或替换,这些等同的变形或替换均包含在本申请权利要求所限定的范围内。

Claims (10)

1.基于用户画像的外卖推荐方法,其特征在于,包括:
获取用户信息,所述用户信息包括用户订单信息、用户账号信息和用户评价信息;
根据用户的活跃度,从所述用户信息中识别第一用户和第二用户;
对所述第一用户的用户信息进行特征提取,并利用提取到的特征构建用户画像,所述用户画像包括以下至少之一:用户背景信息、用户点餐喜好、用户点餐时间分布、用户点餐频率、工作日与节假日的点餐频率分布、收餐地分布、用户点餐金额、餐具选择偏好、用户使用软件以及用户评价;
根据所述用户画像,生成推荐餐厅名单。
2.根据权利要求1所述的基于用户画像的外卖推荐方法,其特征在于,所述获取用户信息,包括:
从目标平台收集用户信息到大数据平台;
通过sqoop工具将所述用户信息导入HDFS文件系统;
通过Hive集群对HDFS文件系统内的用户信息进行筛选,得到各个用户所属的用户信息。
3.根据权利要求1所述的基于用户画像的外卖推荐方法,其特征在于,所述根据用户的活跃度,从所述用户信息中识别第一用户和第二用户,包括:
从所述用户信息中获取用户活跃度信息,所述用户活跃度信息包括用户账号的有效性和历史交易次数;
将用户账号有效且历史交易次数不为0的用户确定为第一用户,否则确定为第二用户。
4.根据权利要求1所述的基于用户画像的外卖推荐方法,其特征在于,在对所述第一用户的用户信息进行特征提取,并利用提取到的特征构建用户画像这一步骤中,包括:
将用户评价进行关键字分析,得到用户评价词云。
5.根据权利要求4所述的基于用户画像的外卖推荐方法,其特征在于,所述将用户评价进行关键字分析,得到用户评价词云,包括:
将用户评价内容汇总,形成文档集合;
对所述文档集合中的内容进行分词,形成词语集合;
统计所述词语集合中的每个词语在对应文档的出现次数,计算得到每个词语的出现概率;
计算所述词语集合中每个词语的逆文档概率;
根据所述出现概率和逆文档概率,计算每个词语的TF-IDF值;
根据所述TF-IDF值对词语集合中的词语进行排序;
根据排序结果确定关键词;
根据所述关键词,通过词云生成工具生成用户评价词云。
6.根据权利要求1所述的基于用户画像的外卖推荐方法,其特征在于,还包括将用户画像进行实时展示的步骤。
7.根据权利要求1所述的基于用户画像的外卖推荐方法,其特征在于,在对所述第一用户的用户信息进行特征提取,并利用提取到的特征构建用户画像这一步骤中,还包括确定各类特征权重大小的步骤,该步骤包括:
确定每类特征对应的分类区间;
统计用户在每个分类区间的点餐次数;
根据所述每个分类区间的点餐次数以及用户的所有点餐次数,计算每类特征的权重大小。
8.基于用户画像的外卖推荐系统,其特征在于,包括:
获取模块,用于获取用户信息,所述用户信息包括用户订单信息、用户账号信息和用户评价信息;
识别模块,用于根据用户的活跃度,从所述用户信息中识别第一用户和第二用户;
构建模块,用于对所述第一用户的用户信息进行特征提取,并利用提取到的特征构建用户画像,所述用户画像包括以下至少之一:用户背景信息、用户点餐喜好、用户点餐时间分布、用户点餐频率、工作日与节假日的点餐频率分布、收餐地分布、用户点餐金额、餐具选择偏好、用户使用软件以及用户评价;
推荐模块,用于根据所述用户画像,生成推荐餐厅名单。
9.一种装置,其特征在于,包括处理器以及存储器;
所述存储器用于存储程序;
所述处理器用于根据所述程序执行如权利要求1-7中任一项所述的方法。
10.一种存储介质,其特征在于,所述存储介质存储有程序,所述程序被处理器执行完成如权利要求1-7中任一项所述的方法。
CN202010280675.1A 2020-04-10 2020-04-10 基于用户画像的外卖推荐方法、系统、装置及介质 Active CN111597434B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010280675.1A CN111597434B (zh) 2020-04-10 2020-04-10 基于用户画像的外卖推荐方法、系统、装置及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010280675.1A CN111597434B (zh) 2020-04-10 2020-04-10 基于用户画像的外卖推荐方法、系统、装置及介质

Publications (2)

Publication Number Publication Date
CN111597434A true CN111597434A (zh) 2020-08-28
CN111597434B CN111597434B (zh) 2023-04-18

Family

ID=72183460

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010280675.1A Active CN111597434B (zh) 2020-04-10 2020-04-10 基于用户画像的外卖推荐方法、系统、装置及介质

Country Status (1)

Country Link
CN (1) CN111597434B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112101873A (zh) * 2020-09-21 2020-12-18 口碑(上海)信息技术有限公司 订单数据的处理方法、装置及系统
CN114372834A (zh) * 2022-03-21 2022-04-19 广州宜推网络科技有限公司 一种基于大数据的电商平台管理系统及方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109583999A (zh) * 2018-11-13 2019-04-05 平安科技(深圳)有限公司 订餐信息推荐方法、装置、电子设备及存储介质
CN110134794A (zh) * 2019-04-17 2019-08-16 北京三快在线科技有限公司 一种实体画像的构建方法和装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109583999A (zh) * 2018-11-13 2019-04-05 平安科技(深圳)有限公司 订餐信息推荐方法、装置、电子设备及存储介质
CN110134794A (zh) * 2019-04-17 2019-08-16 北京三快在线科技有限公司 一种实体画像的构建方法和装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112101873A (zh) * 2020-09-21 2020-12-18 口碑(上海)信息技术有限公司 订单数据的处理方法、装置及系统
CN114372834A (zh) * 2022-03-21 2022-04-19 广州宜推网络科技有限公司 一种基于大数据的电商平台管理系统及方法
CN114372834B (zh) * 2022-03-21 2022-06-03 广州宜推网络科技有限公司 一种基于大数据的电商平台管理系统及方法

Also Published As

Publication number Publication date
CN111597434B (zh) 2023-04-18

Similar Documents

Publication Publication Date Title
King et al. Nutritional labelling for healthier food or non‐alcoholic drink purchasing and consumption
Puranam et al. The effect of calorie posting regulation on consumer opinion: A flexible latent Dirichlet allocation model with informative priors
Miguéis et al. Customer data mining for lifestyle segmentation
KR101552339B1 (ko) 피드백이 가능한 맞춤형 식단 및 식재료 구매 서비스 장치 및 방법
Dana et al. Factors associated with ordering food via online meal ordering services
WO2014059074A2 (en) Wellness and weight management system and method
Lucan et al. Business list vs ground observation for measuring a food environment: saving time or waste of time (or worse)?
Carlson et al. Consumers’ retail source of food: a cluster analysis
CN111597434B (zh) 基于用户画像的外卖推荐方法、系统、装置及介质
Boyle et al. The impact of the COVID‐19 pandemic on grocery shopper behaviour: Analysis of shopper behaviour change using store transaction data
US20150235562A1 (en) Wellness and weight management system and method
Okumus et al. Generation Y's dining out behavior
Luckett et al. Consumer attitudes toward texture and other food attributes
CN105205698A (zh) 一种食物信息的处理方法和装置
CN109036516A (zh) 基于厨房饮食大数据的精准配送食材系统
CN109993623A (zh) 基于图像识别的物品信息展示方法、系统及电子设备
CN115221420A (zh) 一种基于用户画像的饮食推荐方法及系统
Arellano-Covarrubias et al. Pairing beer and food in social media: Is it an image worth more than a thousand words?
Rasmussen et al. Salt content in canteen and fast food meals in Denmark
CN101957937A (zh) 智能型计算机膳食菜单管理系统
McGuirt et al. Associations between shopping patterns, dietary behaviours and geographic information system-assessed store accessibility among small food store customers
Boafo et al. From the kitchen to fast food restaurants: The changing culture of food in urban Ghana
Kumpulainen et al. The effect of freshness in a foodservice context
CN111985985B (zh) 门店信息的提取方法及装置、存储介质、电子装置
Bentley Ketchup as a Vegetable: Condiments and the Politics of School Lunch in Reagan’s America

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant