CN111008333B - 一种基于用户特征信息和产品成分信息的购物系统和方法 - Google Patents
一种基于用户特征信息和产品成分信息的购物系统和方法 Download PDFInfo
- Publication number
- CN111008333B CN111008333B CN201911228429.5A CN201911228429A CN111008333B CN 111008333 B CN111008333 B CN 111008333B CN 201911228429 A CN201911228429 A CN 201911228429A CN 111008333 B CN111008333 B CN 111008333B
- Authority
- CN
- China
- Prior art keywords
- user
- information
- product
- portrait
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明属于电子商务技术领域,具体涉及一种基于用户特征信息和产品成分信息的购物系统和方法,所述系统包括:信息采集子系统,进行产品信息采集和用户信息采集;用户画像构建子系统,用于根据采集到的用户信息构建用户画像;产品画像构建子系统,用于根据采集到的产品信息构建产品画像;数据关联子系统,用于根据构建的用户画像和产品画像,进行数据关联;能够针对不同的用户个性化提供物品推介,基于用户画像和产品画像建立的推送系统,使得推送结果准确性高。
Description
技术领域
本发明属于电子商务技术领域,具体涉及一种基于用户特征信息和产品成分信息的购物系统和方法。
背景技术
近些年来,随着互联网和快递物流的普及与高速发展,网络购物的方式已经变的越来越方便和普便。发达的互联网和电子商务的环境,让广大的网络用户不再受地理位置的限制,只通过互联网就能接触到和购买到更广泛的产品。然而在选购保健品、草药补充剂、美容美妆品、洗护用品、母婴营养品等产品时,因为这些产品具有非常明显的个体差异,不能仅看产品的功效介绍,而忽略成分对每个个体的差别要求。
目前的电子商务平台主流的产品选购或者导购的方式,都只是将产品包装信息或者说明书上的信息展示出来,比如天猫、京东、Amazon、iHerb等电子商务平台,一淘、什么值得买、SlickDeals、Dealmoon等优惠导购平台,都是这种做法。而更为丰富的一些方式,也只是在产品介绍中附加功效和适用人群的介绍,但无论哪种方式,目前互联网平台都没有针对个体差异进行针对性的选购建议。尤其在保健品和护肤品领域,产品成分对使用者的适用性有近乎到医嘱的要求,但是每个用户的教育背景不一样,在没有医学或者营养学知识基础的情况下,很多用户不具备足够的知识能力来识别产品的价值,无法判断产品对自己是否适合。这就给电子商务系统的技术方案选择和实现带来了巨大的挑战,主要总结有以下几个技术难点:
1.无法判断产品成分对人体的适用量。比如一位孕妇选购一件产前综合维生素时,无法知晓产品成分对特定人群的适用量,也就无法判断自己是否有某些成分超标,常见问题是孕妇会单独吃叶酸产品,同时也会吃综合维生素,但是市场上大多综合维生素都包含了叶酸成分,叶酸有非常明确的每日适用量的要求,所以在没有足够知识背景的情况下,孕妇很容易超标食用叶酸成分。
2.无法判断产品成分的作用。用户想在市场上找到适用于敏感肌肤的产品很容易,但搜索出的结果很多,随便选择一种使用后很可能并无功效,甚至有可能导致皮肤新的问题(例如过敏、起痘等等)。敏感肌肤也分很多类型,用户在海量产品中筛选出适用于自己的护肤品或修复类产品就很困难。若是细化到明确产品成分的作用,会更精确找到适合用户的产品(过滤掉或不选择含有某种作用的成分,例如过滤掉含有香精成分或者不选择含有水杨酸成分),但现在市场上的产品,最多只是罗列出了产品有益成分和功效描述,没有完整的成分表和成分作用介绍。
3.专业人士无法根据成分组合或者成分剂量来筛选搜索产品。比如一位营养师,希望为自己的客人选购指定含有某几种成分的产品,或者指定某几种成分不超过多少剂量,但是现在无法按此需求检索。
4.普通用户无法得到省心的推荐。比如一位不想花时间和精力筛选产品的用户,他可以提供自己基本信息或体检信息,希望系统根据他的资料,智能推荐产品并直观的展示推荐理由。
5.用户无法直观了解产品成分明细。现有技术中,互联网平台只展示产品包装信息和说明书,而护肤产品只介绍功效,没有成分信息;用户只能凭通用的功效介绍来选购产品,但是对自己的情况是否适用,无法在选购时判断,也无法了解成分的安全风险。
发明内容
有鉴于此,本发明的主要目的在于提供一种基于用户特征信息和产品成分信息的购物系统和方法,能够针对不同的用户个性化提供物品推介,基于用户画像和产品画像建立的推送系统,使得推送结果准确性高。
为达到上述目的,本发明的技术方案是这样实现的:
一种基于用户特征信息和产品成分信息的购物系统,所述系统包括:信息采集子系统,进行产品信息采集和用户信息采集;用户画像构建子系统,用于根据采集到的用户信息构建用户画像;产品画像构建子系统,用于根据采集到的产品信息构建产品画像;数据关联子系统,用于根据构建的用户画像和产品画像,进行数据关联;其特征在于,所述用户画像构建子系统构建用户画像的方法执行以下步骤:根据采集到的用户信息,提取用户特征,使用如下公式,统计用户特征符合每一个定向用户画像群的次数:
其中,N为符合定向用户画像群的次数,S为用户个数,λi为第i个用户信息的权重,M为每一个定向用户画像群中的特征个数,countj第i个用户信息的用户特征个数;根据统计到的用户信息符合每一个定向用户画像群中的次数,按照从多到少,设置对应用户信息的定向用户画像群从高到低的优先级,完成用户画像构建;所述产品画像构建子系统构建产品画像的方法执行以下步骤:提取产品信息关键词,根据产品信息关键词,并将关键词进行归类划分为不同的关键词库;对关键词库进行归一化处理得到分类关键词矩阵;使用如下公式,将分类关键词矩阵分别与每一个定向产品画像群进行映射匹配:
其中,sim(dj,dk)为映射匹配结果,/>为产品关键词矩阵,wji为矩阵行值,|dj|为对应的矩阵行列式的值;/>为定向产品画像群,wki为矩阵行值,|dk|为对应的矩阵行列式的值;根据最终映射匹配的结果,将匹配映射结果sim(dj,dk)最小的值对应的定向产品画像群作为对应产品信息的产品画像,完成产品画像构建;数据关联子系统,根据构建的产品画像和用户画像,进行混沌模糊匹配,完成产品与用户的数据关联。
进一步的,所述用户画像构建子系统构建用户画像根据采集到的用户信息,提取用户特征的方法执行以下步骤:将获取的用户信息视为文本信息,确定文本信息的开始阶段和结束阶段,分别用begin和end表示;统计文本中的关键词,并根据如下公式,计算最终的关键词得分:
其中,score为关键词得分,
N为关键词个数,λi为关键词匹配度,F(x)为矫正函数,Si为文本信息中除关键词外,删除的信息个数;b为关键词收束度,设置为10,
γ位调整系数,设置为1~1.5;所述所述cur为当前时间,sst为生成关键词时间,hl为半衰期,设置为80s;通过计算得到的得分,若得分在设定的阈值以下,则重新调整文本信息中的信息顺序,进行关键词提取,再次计算得分,直到得分满足预设值为止。
进一步的,所述用户画像构建子系统根据提取的用户特征,构建用户画像的方法还可以使用如下方法:根据提取的用户特征,使用如下公式,进行用户特征分类,其中,所述tf(t,d)为所述用户信息中用户关键词关联度,所述t为用于表征所述关键词,所述d为所述信息中与关键词无关的信息,所述N为关键词个数,ni为与关键词无关的信息的个数;根据得到的T值,与预设的阈值的比较,判断所述用户信息归属于哪一个类别,进而构建用户信息与定向用户画像群的关联。
进一步的,所述数据关联子系统,根据构建的产品画像和用户画像,进行混沌模糊匹配,完成产品与用户的数据关联的方法执行以下步骤:获取用户画像数据和产品画像数据;计算用户画像与产品画像的的相似度值:
σ为用户画像与产品画像的方差;Xi为用户画像矩阵,Xj为产品画像矩阵;根据得到的W的值,与预设的阈值进行比较,若低于预设的阈值,则将该用户画像与产品画像进行关联;若高于预设的阈值,则不进行关联。
进一步的,所述系统还包括:加密子系统,用于对系统内的产品信息和用户信息进行加密;所述加密子系统进行产品信息和用户信息进行加密的方法执行以下步骤:生成两个随机数,作为第一密钥和第二密钥;将第一密钥作为参数A,将第二密钥作为参数B,构建一个加密矩阵:再录入一个已知的加密因子/>将加密矩阵和加密因子/>矩阵相乘,得到一个加密后字符串矩阵X:/>将X作为最终的密钥,对用户信息和产品信息进行对称加密。
步骤3:将字母表中顺序对应于X矩阵中的P参数和Q参数的数值的字母作为最终的加密密钥值,所有的加密密钥值组成最终的加密密钥。
一种基于用户特征信息和产品成分信息的购物方法,所述方法执行以下步骤:信息采集子系统,进行产品信息采集和用户信息采集;用户画像构建子系统,根据采集到的用户信息构建用户画像;产品画像构建子系统,根据采集到的产品信息构建产品画像;数据关联子系统,用于根据构建的用户画像和产品画像,进行数据关联;
进一步的,所述用户画像构建子系统构建用户画像的方法执行以下步骤:根据采集到的用户信息,提取用户特征,使用如下公式,统计用户特征符合每一个定向用户画像群的次数:其中,N为符合定向用户画像群的次数,S为用户个数,λi为第i个用户信息的权重,M为每一个定向用户画像群中的特征个数,countj第i个用户信息的用户特征个数;根据统计到的用户信息符合每一个定向用户画像群中的次数,按照从多到少,设置对应用户信息的定向用户画像群从高到低的优先级,完成用户画像构建;所述产品画像构建子系统构建产品画像的方法执行以下步骤:提取产品信息关键词,根据产品信息关键词,并将关键词进行归类划分为不同的关键词库;对关键词库进行归一化处理得到分类关键词矩阵;使用如下公式,将分类关键词矩阵分别与每一个定向产品画像群进行映射匹配:
其中,sim(dj,dk)为映射匹配结果,/>为产品关键词矩阵,wji为矩阵行值,|dj|为对应的矩阵行列式的值;/>为定向产品画像群,wki为矩阵行值,|dk|为对应的矩阵行列式的值;根据最终映射匹配的结果,将匹配映射结果sim(dj,dk)最小的值对应的定向产品画像群作为对应产品信息的产品画像,完成产品画像构建;数据关联子系统,根据构建的产品画像和用户画像,进行混沌模糊匹配,完成产品与用户的数据关联。
进一步的,所述用户画像构建子系统构建用户画像根据采集到的用户信息,提取用户特征的方法执行以下步骤:将获取的用户信息视为文本信息,确定文本信息的开始阶段和结束阶段,分别用begin和end表示;统计文本中的关键词,并根据如下公式,计算最终的关键词得分:
其中,score为关键词得分,
N为关键词个数,λi为关键词匹配度,F(x)为矫正函数,Si为文本信息中除关键词外,删除的信息个数;b为关键词收束度,设置为10,
γ位调整系数,设置为1~1.5;所述所述cur为当前时间,sst为生成关键词时间,hl为半衰期,设置为80s;通过计算得到的得分,若得分在设定的阈值以下,则重新调整文本信息中的信息顺序,进行关键词提取,再次计算得分,直到得分满足预设值为止。
进一步的,所述用户画像构建子系统根据提取的用户特征,构建用户画像的方法还可以使用如下方法:根据提取的用户特征,使用如下公式,进行用户特征分类,其中,所述tf(t,d)为所述用户信息中用户关键词关联度,所述t为用于表征所述关键词,所述d为所述信息中与关键词无关的信息,所述N为关键词个数,ni为与关键词无关的信息的个数;根据得到的T值,与预设的阈值的比较,判断所述用户信息归属于哪一个类别,进而构建用户信息与定向用户画像群的关联。
进一步的,所述数据关联子系统,根据构建的产品画像和用户画像,进行混沌模糊匹配,完成产品与用户的数据关联的方法执行以下步骤:获取用户画像数据和产品画像数据;计算用户画像与产品画像的的相似度值:
σ为用户画像与产品画像的方差;Xi为用户画像矩阵,Xj为产品画像矩阵;根据得到的W的值,与预设的阈值进行比较,若低于预设的阈值,则将该用户画像与产品画像进行关联;若高于预设的阈值,则不进行关联。
本发明的一种基于用户特征信息和产品成分信息的购物系统和方法,具有如下有益效果:本发明使用基于用户画像和产品画像的建立完成商品的推送,推送准确性高,使用户更高效更省心的选购适合的产品,同时还能了解产品为什么适合。
附图说明
图1为本发明的实施例提供的基于用户特征信息和产品成分信息的购物系统的系统结构示意图;
图2为本发明的实施例提供的基于用户特征信息和产品成分信息的购物方法的方法流程示意图;
图3为本发明的实施例提供的基于用户特征信息和产品成分信息的购物系统的用户画像建立方法的准确率与现有技术中使用聚类分析建立用户画像准确率的对比试验曲线图。
1-本发明用户画像准确率曲线图,2-聚类分析用户画像准确率曲线图。
具体实施方式
下面结合附图及本发明的实施例对本发明的方法作进一步详细的说明。
实施例1
如图1所示,一种基于用户特征信息和产品成分信息的购物系统,所述系统包括:信息采集子系统,进行产品信息采集和用户信息采集;用户画像构建子系统,用于根据采集到的用户信息构建用户画像;产品画像构建子系统,用于根据采集到的产品信息构建产品画像;数据关联子系统,用于根据构建的用户画像和产品画像,进行数据关联;其特征在于,所述用户画像构建子系统构建用户画像的方法执行以下步骤:根据采集到的用户信息,提取用户特征,使用如下公式,统计用户特征符合每一个定向用户画像群的次数:
其中,N为符合定向用户画像群的次数,S为用户个数,λi为第i个用户信息的权重,M为每一个定向用户画像群中的特征个数,countj第i个用户信息的用户特征个数;根据统计到的用户信息符合每一个定向用户画像群中的次数,按照从多到少,设置对应用户信息的定向用户画像群从高到低的优先级,完成用户画像构建;所述产品画像构建子系统构建产品画像的方法执行以下步骤:提取产品信息关键词,根据产品信息关键词,并将关键词进行归类划分为不同的关键词库;对关键词库进行归一化处理得到分类关键词矩阵;使用如下公式,将分类关键词矩阵分别与每一个定向产品画像群进行映射匹配:
其中,sim(dj,dk)为映射匹配结果,/>为产品关键词矩阵,wji为矩阵行值,|dj|为对应的矩阵行列式的值;/>为定向产品画像群,wki为矩阵行值,|dk|为对应的矩阵行列式的值;根据最终映射匹配的结果,将匹配映射结果sim(dj,dk)最小的值对应的定向产品画像群作为对应产品信息的产品画像,完成产品画像构建;数据关联子系统,根据构建的产品画像和用户画像,进行混沌模糊匹配,完成产品与用户的数据关联。
具体的,通过建立用户画像和产品画像,实现了产品特征和用户特征的归一化,提升了两者进行匹配和配对的效率。
用户画像又称用户角色,作为一种勾画目标用户、联系用户诉求与设计方向的有效工具,用户画像在各领域得到了广泛的应用。我们在实际操作的过程中往往会以最为浅显和贴近生活的话语将用户的属性、行为与期待联结起来。作为实际用户的虚拟代表,用户画像所形成的用户角色并不是脱离产品和市场之外所构建出来的,形成的用户角色需要有代表性能代表产品的主要受众和目标群体。
用户画像可以使产品的服务对象更加聚焦,更加的专注。在行业里,我们经常看到这样一种现象:做一个产品,期望目标用户能涵盖所有人,男人女人、老人小孩......通常这样的产品会走向消亡,因为每一个产品都是为特定目标群的共同标准而服务的,当目标群的基数越大,这个标准就越低。换言之,如果这个产品是适合每一个人的,那么其实它是为最低的标准服务的,这样的产品要么毫无特色,要么过于简陋。
实施例2
在上一实施例的基础上,所述用户画像构建子系统构建用户画像根据采集到的用户信息,提取用户特征的方法执行以下步骤:将获取的用户信息视为文本信息,确定文本信息的开始阶段和结束阶段,分别用begin和end表示;统计文本中的关键词,并根据如下公式,计算最终的关键词得分:
其中,score为关键词得分,
N为关键词个数,λi为关键词匹配度,F(x)为矫正函数,Si为文本信息中除关键词外,删除的信息个数;b为关键词收束度,设置为10,
γ位调整系数,设置为1~1.5;所述所述cur为当前时间,sst为生成关键词时间,hl为半衰期,设置为80s;通过计算得到的得分,若得分在设定的阈值以下,则重新调整文本信息中的信息顺序,进行关键词提取,再次计算得分,直到得分满足预设值为止。
具体的,使用关键词判别,使得用户画像的建立更加准确,相较于现有技术,用户画像的建立更加准确,比起现有技术,单纯通过特征词建立用户画像,准确性更高。
具体的,最后,用户画像还可以提高决策效率。在现在的产品设计流程中,各个环节的参与者非常多,分歧总是不可避免,决策效率无疑影响着项目的进度。而用户画像是来自于对目标用户的研究,当所有参与产品的人都基于一致的用户进行讨论和决策,就很容易约束各方能保持在同一个大方向上,提高决策的效率。
实施例3
在上一实施例的基础上,所述用户画像构建子系统根据提取的用户特征,构建用户画像的方法还可以使用如下方法:根据提取的用户特征,使用如下公式,进行用户特征分类,其中,所述tf(t,d)为所述用户信息中用户关键词关联度,所述t为用于表征所述关键词,所述d为所述信息中与关键词无关的信息,所述N为关键词个数,ni为与关键词无关的信息的个数;根据得到的T值,与预设的阈值的比较,判断所述用户信息归属于哪一个类别,进而构建用户信息与定向用户画像群的关联。
具体的,这种用户画像构建方式,使用归类判别的方法,对用户特征进行分类,相较于传统的单纯使用聚类分析的方式构建用户画像,其构建用户画像的效率更高。
具体的,聚类是将数据分类到不同的类或者簇这样的一个过程,所以同一个簇中的对象有很大的相似性,而不同簇间的对象有很大的相异性。
从统计学的观点看,聚类分析是通过数据建模简化数据的一种方法。传统的统计聚类分析方法包括系统聚类法、分解法、加入法、动态聚类法、有序样品聚类、有重叠聚类和模糊聚类等。采用k-均值、k-中心点等算法的聚类分析工具已被加入到许多著名的统计分析软件包中,如SPSS、SAS等。
从机器学习的角度讲,簇相当于隐藏模式。聚类是搜索簇的无监督学习过程。与分类不同,无监督学习不依赖预先定义的类或带类标记的训练实例,需要由聚类学习算法自动确定标记,而分类学习的实例或数据对象有类别标记。聚类是观察式学习,而不是示例式的学习。
聚类分析是一种探索性的分析,在分类的过程中,人们不必事先给出一个分类的标准,聚类分析能够从样本数据出发,自动进行分类。聚类分析所使用方法的不同,常常会得到不同的结论。不同研究者对于同一组数据进行聚类分析,所得到的聚类数未必一致。
从实际应用的角度看,聚类分析是数据挖掘的主要任务之一。而且聚类能够作为一个独立的工具获得数据的分布状况,观察每一簇数据的特征,集中对特定的聚簇集合作进一步地分析。聚类分析还可以作为其他算法(如分类和定性归纳算法)的预处理步骤。
实施例4
在上一实施例的基础上,所述数据关联子系统,根据构建的产品画像和用户画像,进行混沌模糊匹配,完成产品与用户的数据关联的方法执行以下步骤:获取用户画像数据和产品画像数据;计算用户画像与产品画像的的相似度值:
σ为用户画像与产品画像的方差;Xi为用户画像矩阵,Xj为产品画像矩阵;根据得到的W的值,与预设的阈值进行比较,若低于预设的阈值,则将该用户画像与产品画像进行关联;若高于预设的阈值,则不进行关联。
实施例5
在上一实施例的基础上,所述系统还包括:加密子系统,用于对系统内的产品信息和用户信息进行加密;所述加密子系统进行产品信息和用户信息进行加密的方法执行以下步骤:生成两个随机数,作为第一密钥和第二密钥;将第一密钥作为参数A,将第二密钥作为参数B,构建一个加密矩阵:再录入一个已知的加密因子/>将加密矩阵和加密因子/>矩阵相乘,得到一个加密后字符串矩阵X:将X作为最终的密钥,对用户信息和产品信息进行对称加密。
具体的,使用上述加密方式,将两个密钥进行矩阵化,加密结果安全性更高。
步骤3:将字母表中顺序对应于X矩阵中的P参数和Q参数的数值的字母作为最终的加密密钥值,所有的加密密钥值组成最终的加密密钥。
实施例6
一种基于用户特征信息和产品成分信息的购物方法,所述方法执行以下步骤:信息采集子系统,进行产品信息采集和用户信息采集;用户画像构建子系统,根据采集到的用户信息构建用户画像;产品画像构建子系统,根据采集到的产品信息构建产品画像;数据关联子系统,用于根据构建的用户画像和产品画像,进行数据关联。
具体的,数据采集采用标准的HTTP接口/协议,从产品生产商官网、产品包装、说明书、药监局备案数据等渠道采集产品基本信息和成分信息,并存储到关系型数据库和JSON化处理备档。成分数据的专业备注由相关领域的权威从业者逐一撰写和标注,同时在面向终端使用时,用户也可以反馈建议,帮助产品库修正错误和完善更多信息。
产品匹配计算模型是通过计算阈值加权平均的方式,根据用户特征信息(性别、年龄、体重、肤质、常住城市、体检数据等个人特征信息)、行为信息(搜索记录、浏览记录、消费记录等个人行为信息),构建用户需求画像,并根据此画像匹配推荐产品,最终再根据用户浏览和选购的结果,反向训练计算模型的精准度,个性化自我调整计算阈值权重。例1:用户的行为信息预示用户喜好洗护产品,而用户特征信息的常住城市为干燥地区、肤质为油性皮肤,系统计算模型则会基于成分的安全风险和活性成分数量为用户匹配最适合他环境和肤质的产品并展示理由,最终还会基于用户浏览和选购的行为来反向训练计算模型,让计算模型自我成长。例2:用户行为信息预示用户对膳食补充剂感兴趣,但是浏览多个产品后并未选购,基于浏览记录中的成分相似性比较,并结合用户特征信息的年龄、体重等信息,计算模型判断用户可能需要寻找一份不含“糖”成分的膳食补充剂,或者低“卡路里”成分的膳食补充剂,计算系统根据判断推荐相应产品并附推荐理由,最终计算系统会基于用户浏览和选购的行为来反向训练计算模型,让计算模型自我成长。
该方法可通过Browser/Server或者Client/Server结构方式为用户提供服务,可供用户在Web浏览器、iPhone、iPad、Android、Android Pad等终端平台使用。对于未提供个人特征信息的用户以及未登录的游客用户,系统则会基于行为信息(搜索、浏览等行为)的产品成分相关性计算推荐相关产品。同时在浏览产品详情页时,展示产品成分信息及分别对人体产生什么作用(效果)、适用量、适用人群、安全风险等参考信息。
实施例7
在上一实施例的基础上,所述用户画像构建子系统构建用户画像的方法执行以下步骤:根据采集到的用户信息,提取用户特征,使用如下公式,统计用户特征符合每一个定向用户画像群的次数:
其中,N为符合定向用户画像群的次数,S为用户个数,λi为第i个用户信息的权重,M为每一个定向用户画像群中的特征个数,countj第i个用户信息的用户特征个数;根据统计到的用户信息符合每一个定向用户画像群中的次数,按照从多到少,设置对应用户信息的定向用户画像群从高到低的优先级,完成用户画像构建;所述产品画像构建子系统构建产品画像的方法执行以下步骤:提取产品信息关键词,根据产品信息关键词,并将关键词进行归类划分为不同的关键词库;对关键词库进行归一化处理得到分类关键词矩阵;使用如下公式,将分类关键词矩阵分别与每一个定向产品画像群进行映射匹配:
其中,sim(dj,dk)为映射匹配结果,/>为产品关键词矩阵,wji为矩阵行值,|dj|为对应的矩阵行列式的值;/>为定向产品画像群,wki为矩阵行值,|dk|为对应的矩阵行列式的值;根据最终映射匹配的结果,将匹配映射结果sim(dj,dk)最小的值对应的定向产品画像群作为对应产品信息的产品画像,完成产品画像构建;数据关联子系统,根据构建的产品画像和用户画像,进行混沌模糊匹配,完成产品与用户的数据关联。
实施例8
在上一实施例的基础上,所述用户画像构建子系统构建用户画像根据采集到的用户信息,提取用户特征的方法执行以下步骤:将获取的用户信息视为文本信息,确定文本信息的开始阶段和结束阶段,分别用begin和end表示;统计文本中的关键词,并根据如下公式,计算最终的关键词得分:
其中,score为关键词得分,
N为关键词个数,λi为关键词匹配度,F(x)为矫正函数,Si为文本信息中除关键词外,删除的信息个数;b为关键词收束度,设置为10,γ位调整系数,设置为1~1.5;所述所述cur为当前时间,sst为生成关键词时间,hl为半衰期,设置为80s;通过计算得到的得分,若得分在设定的阈值以下,则重新调整文本信息中的信息顺序,进行关键词提取,再次计算得分,直到得分满足预设值为止。
具体的,特征分析是用在我们产品设计面对的用户群,对典型的用户特征做分析。典型用户分析不能为超过3个以上的用户画像设计产品,否则相互冲突的需求就会让我们难以决断。当我们有多个用户画像时,我们需要考虑用户画像的优先级。
实施例9
在上一实施例的基础上,所述用户画像构建子系统根据提取的用户特征,构建用户画像的方法还可以使用如下方法:根据提取的用户特征,使用如下公式,进行用户特征分类,其中,所述tf(t,d)为所述用户信息中用户关键词关联度,所述t为用于表征所述关键词,所述d为所述信息中与关键词无关的信息,所述N为关键词个数,ni为与关键词无关的信息的个数;根据得到的T值,与预设的阈值的比较,判断所述用户信息归属于哪一个类别,进而构建用户信息与定向用户画像群的关联。
实施例10
在上一实施例的基础上,所述数据关联子系统,根据构建的产品画像和用户画像,进行混沌模糊匹配,完成产品与用户的数据关联的方法执行以下步骤:获取用户画像数据和产品画像数据;计算用户画像与产品画像的的相似度值:
σ为用户画像与产品画像的方差;Xi为用户画像矩阵,Xj为产品画像矩阵;根据得到的W的值,与预设的阈值进行比较,若低于预设的阈值,则将该用户画像与产品画像进行关联;若高于预设的阈值,则不进行关联。
以上所述仅为本发明的一个实施例子,但不能以此限制本发明的范围,凡依据本发明所做的结构上的变化,只要不失本发明的要义所在,都应视为落入本发明保护范围之内受到制约。
所属技术领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统的具体工作过程及有关说明,可以参考前述方法实施例中的对应过程,在此不再赘述。
需要说明的是,上述实施例提供的系统,仅以上述各功能模块的划分进行举例说明,在实际应用中,可以根据需要而将上述功能分配由不同的功能模块来完成,即将本发明实施例中的模块或者步骤再分解或者组合,例如,上述实施例的模块可以合并为一个模块,也可以进一步拆分成多个子模块,以完成以上描述的全部或者部分功能。对于本发明实施例中涉及的模块、步骤的名称,仅仅是为了区分各个模块或者步骤,不视为对本发明的不当限定。
所属技术领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的存储装置、处理装置的具体工作过程及有关说明,可以参考前述方法实施例中的对应过程,在此不再赘述。
本领域技术人员应该能够意识到,结合本文中所公开的实施例描述的各示例的模块、方法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,软件模块、方法步骤对应的程序可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。为了清楚地说明电子硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以电子硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。本领域技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
本发明提供的方法,不仅可以基于计算公式给予顾客动态的结果(实时或者定时的运用计算功能),还可以呈现静态的结果(无需运用计算功能,只展示商品成分数据的功效等信息),用户可通过Browser/Server或者Client/Server技术架构方式在电脑或手机上使用服务。动态的使用场景如商品智能匹配和推荐,静态的使用场景如商品的成分功效展示,展示内容有产品成分信息及分别对人体产生什么作用(效果)、适用量、适用人群、安全风险等参考信息。
术语“第一”、“第二”等是用于区别类似的对象,而不是用于描述或表示特定的顺序或先后次序。
术语“包括”或者任何其它类似用语旨在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备/装置不仅包括那些要素,而且还包括没有明确列出的其它要素,或者还包括这些过程、方法、物品或者设备/装置所固有的要素。
至此,已经结合附图所示的优选实施方式描述了本发明的技术方案,但是,本领域技术人员容易理解的是,本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下,本领域技术人员可以对相关技术特征作出等同的更改或替换,这些更改或替换之后的技术方案都将落入本发明的保护范围之内。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。
Claims (10)
1.一种基于用户特征信息和产品成分信息的购物系统,所述系统包括:
信息采集子系统,进行产品信息采集和用户信息采集;
用户画像构建子系统,用于根据采集到的用户信息构建用户画像;
产品画像构建子系统,用于根据采集到的产品信息构建产品画像;
数据关联子系统,用于根据构建的用户画像和产品画像,进行数据关联;
其特征在于,所述用户画像构建子系统构建用户画像的方法执行以下步骤:根据采集到的用户信息,提取用户特征,使用如下公式,统计用户特征符合每一个定向用户画像群的次数: 其中,N为符合定向用户画像群的次数,S为用户个数,λi为第i个用户信息的权重,M为每一个定向用户画像群中的特征个数,countj第i个用户信息的用户特征个数;根据统计到的用户信息符合每一个定向用户画像群中的次数,按照从多到少,设置对应用户信息的定向用户画像群从高到低的优先级,完成用户画像构建;
所述产品画像构建子系统构建产品画像的方法执行以下步骤:提取产品信息关键词,根据产品信息关键词,并将关键词进行归类划分为不同的关键词库;对关键词库进行归一化处理得到分类关键词矩阵;使用如下公式,将分类关键词矩阵分别与每一个定向产品画像群进行映射匹配:其中,sim(dj,dk)为映射匹配结果,/>为产品关键词矩阵,wji为矩阵行值,|dj|为对应的矩阵行列式的值;/>为定向产品画像群,wki为矩阵行值,|dk|为对应的矩阵行列式的值;根据最终映射匹配的结果,将匹配映射结果sim(dj,dk)最小的值对应的定向产品画像群作为对应产品信息的产品画像,完成产品画像构建;
数据关联子系统,根据构建的产品画像和用户画像,进行混沌模糊匹配,完成产品与用户的数据关联;
通过建立用户画像和产品画像,实现了产品特征和用户特征的归一化。
2.如权利要求1所述的系统,其特征在于,所述用户画像构建子系统构建用户画像根据采集到的用户信息,提取用户特征的方法执行以下步骤:将获取的用户信息视为文本信息,确定文本信息的开始阶段和结束阶段,分别用begin和end表示;统计文本中的关键词,并根据如下公式,计算最终的关键词得分: 其中,score为关键词得分,N为关键词个数,λi为关键词匹配度,F(x)为矫正函数,Si为文本信息中除关键词外,删除的信息个数;b为关键词收束度,设置为10,γ位调整系数,设置为1~1.5;所述/>所述cur为当前时间,sst为生成关键词时间,hl为半衰期,设置为80s;通过计算得到的得分,若得分在设定的阈值以下,则重新调整文本信息中的信息顺序,进行关键词提取,再次计算得分,直到得分满足预设值为止。
3.如权利要求2所述的系统,其特征在于,所述用户画像构建子系统根据提取的用户特征,构建用户画像的方法还可以使用如下方法:根据提取的用户特征,使用如下公式,进行用户特征分类, 其中,所述tf(t,d)为所述用户信息中用户关键词关联度,所述t为用于表征所述关键词,所述d为所述信息中与关键词无关的信息,所述N为关键词个数,ni为与关键词无关的信息的个数;根据得到的T值,与预设的阈值的比较,判断所述用户信息归属于哪一个类别,进而构建用户信息与定向用户画像群的关联。
4.如权利要求3所述的系统,其特征在于,所述数据关联子系统,根据构建的产品画像和用户画像,进行混沌模糊匹配,完成产品与用户的数据关联的方法执行以下步骤:获取用户画像数据和产品画像数据;计算用户画像与产品画像的相似度值:σ为用户画像与产品画像的方差;Xi为用户画像矩阵,Xj为产品画像矩阵;根据得到的W的值,与预设的阈值进行比较,若低于预设的阈值,则将该用户画像与产品画像进行关联;若高于预设的阈值,则不进行关联。
5.如权利要求4所述的系统,其特征在于,所述系统还包括:加密子系统,用于对系统内的产品信息和用户信息进行加密;所述加密子系统进行产品信息和用户信息进行加密的方法执行以下步骤:生成两个随机数,作为第一密钥和第二密钥;将第一密钥作为参数A,将第二密钥作为参数B,构建一个加密矩阵:再录入一个已知的加密因子将加密矩阵和加密因子/>矩阵相乘,得到一个加密后字符串矩阵X:将X作为最终的密钥,对用户信息和产品信息进行对称加密;
将字母表中顺序对应于X矩阵中的P参数和Q参数的数值的字母作为最终的加密密钥值,所有的加密密钥值组成最终的加密密钥。
6.一种基于权利要求1至5之一所述基于用户特征信息和产品成分信息的购物系统的方法,其特征在于,所述方法执行以下步骤:
信息采集子系统,进行产品信息采集和用户信息采集;
用户画像构建子系统,根据采集到的用户信息构建用户画像;
产品画像构建子系统,根据采集到的产品信息构建产品画像;
数据关联子系统,用于根据构建的用户画像和产品画像,进行数据关联。
7.如权利要求6所述的系统,其特征在于,所述用户画像构建子系统构建用户画像的方法执行以下步骤:根据采集到的用户信息,提取用户特征,使用如下公式,统计用户特征符合每一个定向用户画像群的次数:其中,N为符合定向用户画像群的次数,S为用户个数,λi为第i个用户信息的权重,M为每一个定向用户画像群中的特征个数,countj第i个用户信息的用户特征个数;根据统计到的用户信息符合每一个定向用户画像群中的次数,按照从多到少,设置对应用户信息的定向用户画像群从高到低的优先级,完成用户画像构建;所述产品画像构建子系统构建产品画像的方法执行以下步骤:提取产品信息关键词,根据产品信息关键词,并将关键词进行归类划分为不同的关键词库;对关键词库进行归一化处理得到分类关键词矩阵;使用如下公式,将分类关键词矩阵分别与每一个定向产品画像群进行映射匹配:/> 其中,sim(dj,dk)为映射匹配结果,/>为产品关键词矩阵,wji为矩阵行值,|dj|为对应的矩阵行列式的值;/>为定向产品画像群,wki为矩阵行值,|dk|为对应的矩阵行列式的值;根据最终映射匹配的结果,将匹配映射结果sim(dj,dk)最小的值对应的定向产品画像群作为对应产品信息的产品画像,完成产品画像构建;数据关联子系统,根据构建的产品画像和用户画像,进行混沌模糊匹配,完成产品与用户的数据关联。
8.如权利要求7所述的方法,其特征在于,所述用户画像构建子系统构建用户画像根据采集到的用户信息,提取用户特征的方法执行以下步骤:将获取的用户信息视为文本信息,确定文本信息的开始阶段和结束阶段,分别用begin和end表示;统计文本中的关键词,并根据如下公式,计算最终的关键词得分: 其中,score为关键词得分,N为关键词个数,λi为关键词匹配度,F(x)为矫正函数,Si为文本信息中除关键词外,删除的信息个数;b为关键词收束度,设置为10,γ位调整系数,设置为1~1.5;所述/>所述cur为当前时间,sst为生成关键词时间,hl为半衰期,设置为80s;通过计算得到的得分,若得分在设定的阈值以下,则重新调整文本信息中的信息顺序,进行关键词提取,再次计算得分,直到得分满足预设值为止。
9.如权利要求8所述的方法,其特征在于,所述用户画像构建子系统根据提取的用户特征,构建用户画像的方法还可以使用如下方法:根据提取的用户特征,使用如下公式,进行用户特征分类, 其中,所述tf(t,d)为所述用户信息中用户关键词关联度,所述t为用于表征所述关键词,所述d为所述信息中与关键词无关的信息,所述N为关键词个数,ni为与关键词无关的信息的个数;根据得到的T值,与预设的阈值的比较,判断所述用户信息归属于哪一个类别,进而构建用户信息与定向用户画像群的关联。
10.如权利要求9所述的方法,其特征在于,所述数据关联子系统,根据构建的产品画像和用户画像,进行混沌模糊匹配,完成产品与用户的数据关联的方法执行以下步骤:获取用户画像数据和产品画像数据;计算用户画像与产品画像的相似度值:σ为用户画像与产品画像的方差;Xi为用户画像矩阵,Xj为产品画像矩阵;根据得到的W的值,与预设的阈值进行比较,若低于预设的阈值,则将该用户画像与产品画像进行关联;若高于预设的阈值,则不进行关联。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911228429.5A CN111008333B (zh) | 2019-12-04 | 2019-12-04 | 一种基于用户特征信息和产品成分信息的购物系统和方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911228429.5A CN111008333B (zh) | 2019-12-04 | 2019-12-04 | 一种基于用户特征信息和产品成分信息的购物系统和方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111008333A CN111008333A (zh) | 2020-04-14 |
CN111008333B true CN111008333B (zh) | 2023-08-25 |
Family
ID=70114828
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911228429.5A Active CN111008333B (zh) | 2019-12-04 | 2019-12-04 | 一种基于用户特征信息和产品成分信息的购物系统和方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111008333B (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111311290B (zh) * | 2020-04-17 | 2023-08-08 | 广州信天翁信息科技有限公司 | 一种物品数字化、验证方法及相关装置 |
CN111581298B (zh) * | 2020-04-29 | 2023-11-14 | 北华航天工业学院 | 大数据仓库的异构数据整合系统及方法 |
CN112085526A (zh) * | 2020-09-04 | 2020-12-15 | 中国平安财产保险股份有限公司 | 基于用户群的信息匹配方法、装置、计算机设备及存储介质 |
CN112380424A (zh) * | 2020-10-19 | 2021-02-19 | 浪潮软件股份有限公司 | 一种加热不燃烧烟草制品信息建立系统及方法 |
CN113344433A (zh) * | 2021-06-28 | 2021-09-03 | 平安信托有限责任公司 | 产品匹配方法、装置、电子设备及可读存储介质 |
CN114723492B (zh) * | 2022-04-15 | 2024-09-17 | 山东浪潮爱购云链信息科技有限公司 | 一种企业画像的生成方法及设备 |
CN117710054B (zh) * | 2023-12-20 | 2024-10-15 | 杭州小鲲科技有限公司 | 线上商城商品智能化展示系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105869001A (zh) * | 2015-01-19 | 2016-08-17 | 苏宁云商集团股份有限公司 | 个性化商品推荐引流方法和系统 |
CN108022116A (zh) * | 2016-11-01 | 2018-05-11 | 北京京东尚科信息技术有限公司 | 对用户建模的方法、系统及终端设备 |
CN109189904A (zh) * | 2018-08-10 | 2019-01-11 | 上海中彦信息科技股份有限公司 | 个性化搜索方法及系统 |
CN109299997A (zh) * | 2018-09-03 | 2019-02-01 | 中国平安人寿保险股份有限公司 | 产品推荐方法、装置及计算机可读存储介质 |
CN109345348A (zh) * | 2018-09-30 | 2019-02-15 | 重庆誉存大数据科技有限公司 | 基于旅行社用户的多维信息画像的推荐方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101565339B1 (ko) * | 2010-11-03 | 2015-11-04 | 네이버 주식회사 | 집단지성을 이용한 추천 시스템 및 방법 |
-
2019
- 2019-12-04 CN CN201911228429.5A patent/CN111008333B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105869001A (zh) * | 2015-01-19 | 2016-08-17 | 苏宁云商集团股份有限公司 | 个性化商品推荐引流方法和系统 |
CN108022116A (zh) * | 2016-11-01 | 2018-05-11 | 北京京东尚科信息技术有限公司 | 对用户建模的方法、系统及终端设备 |
CN109189904A (zh) * | 2018-08-10 | 2019-01-11 | 上海中彦信息科技股份有限公司 | 个性化搜索方法及系统 |
CN109299997A (zh) * | 2018-09-03 | 2019-02-01 | 中国平安人寿保险股份有限公司 | 产品推荐方法、装置及计算机可读存储介质 |
CN109345348A (zh) * | 2018-09-30 | 2019-02-15 | 重庆誉存大数据科技有限公司 | 基于旅行社用户的多维信息画像的推荐方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111008333A (zh) | 2020-04-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111008333B (zh) | 一种基于用户特征信息和产品成分信息的购物系统和方法 | |
CN111784455B (zh) | 一种物品推荐方法及推荐设备 | |
Dzyabura et al. | Visual elicitation of brand perception | |
US9633045B2 (en) | Image ranking based on attribute correlation | |
CN103617230B (zh) | 一种基于微博的广告推荐方法及系统 | |
Strobl et al. | Accounting for individual differences in Bradley-Terry models by means of recursive partitioning | |
Malik et al. | Applied unsupervised learning with R: Uncover hidden relationships and patterns with k-means clustering, hierarchical clustering, and PCA | |
CN107894998B (zh) | 视频推荐方法及装置 | |
CN109146626B (zh) | 一种基于用户动态兴趣分析的时尚服装搭配推荐方法 | |
Selke et al. | Pushing the boundaries of crowd-enabled databases with query-driven schema expansion | |
CN108369674B (zh) | 使用目标聚类方法对具有混合属性类型的客户进行细分的系统和方法 | |
Selosse et al. | Model-based co-clustering for mixed type data | |
CN107193832A (zh) | 相似度挖掘方法及装置 | |
US20140297628A1 (en) | Text Information Processing Apparatus, Text Information Processing Method, and Computer Usable Medium Having Text Information Processing Program Embodied Therein | |
CN103854206B (zh) | 一种分析人群特征的方法和设备 | |
CN112597398B (zh) | 药品推荐模型应用方法及系统 | |
US20190205702A1 (en) | System and method for recommending features for content presentations | |
CN111475731B (zh) | 数据处理方法、装置、存储介质及设备 | |
Getman et al. | Machine learning (ML) for tracking fashion trends: Documenting the frequency of the baseball cap on social media and the runway | |
CN103577473B (zh) | 分类消岐方法、分类消岐装置及其系统 | |
Lee et al. | A content-based skincare product recommendation system | |
Liao et al. | Mining information users’ knowledge for one-to-one marketing on information appliance | |
US20230229937A1 (en) | Ai training data creation support system, ai training data creation support method, and ai training data creation support program | |
KR102425749B1 (ko) | 광고주를 위한 모델 추천 서비스 제공 방법 및 장치 | |
CN108920546A (zh) | 一种基于用户需求的稳态标签开发方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20230719 Address after: 215400 room 801, building 11, University Science Park, 20 Jianxiong Road, science and education new town, Taicang City, Suzhou City, Jiangsu Province Applicant after: Fresens (Suzhou) Technology Co.,Ltd. Address before: Room 504, No. 524, Sunshine100 International City, Huishan District, Wuxi City, Jiangsu Province, 214000 Applicant before: Tang Jie |
|
TA01 | Transfer of patent application right | ||
GR01 | Patent grant | ||
GR01 | Patent grant |