CN113342931A - 基于大数据的用户需求分析方法、装置、设备及存储介质 - Google Patents
基于大数据的用户需求分析方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN113342931A CN113342931A CN202110582240.7A CN202110582240A CN113342931A CN 113342931 A CN113342931 A CN 113342931A CN 202110582240 A CN202110582240 A CN 202110582240A CN 113342931 A CN113342931 A CN 113342931A
- Authority
- CN
- China
- Prior art keywords
- product
- user
- information
- compared
- analyzed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Development Economics (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Economics (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Educational Administration (AREA)
- Computational Linguistics (AREA)
- Game Theory and Decision Science (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Tourism & Hospitality (AREA)
- Artificial Intelligence (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明属于大数据技术领域,公开了一种基于大数据的用户需求分析方法、装置、设备及存储介质。该方法包括:从预设数据库中获取用户发言数据;根据所述用户发言数据得到待比较产品用户画像和待分析产品用户画像;根据所述待比较产品用户画像和所述待分析产品用户画像得到待分析产品的差别指标信息;根据所述差别指标信息得到用户需求信息。通过上述方式,可以使根据大数据获取到的用户的需求信息更加全面,并且与同类型产品进行对比可以获得更多、更准确的用户需求信息。
Description
技术领域
本发明涉及大数据技术领域,尤其涉及一种基于大数据的用户需求分析方法、装置、设备及存储介质。
背景技术
用户画像又称用户角色,作为一种勾画目标用户、联系用户诉求与设计方向的有效工具,用户画像在各领域得到了广泛的应用。在实际操作的过程中往往会以最为浅显和贴近生活的话语将用户的属性、行为与期待的数据转化联结起来。作为实际用户的虚拟代表,用户画像所形成的用户角色并不是脱离产品和市场之外所构建出来的,形成的用户角色需要有代表性能代表产品的主要受众和目标群体。
在车辆制造行业经常是基于向用户询问产品相关信息构建用户画像来获得产品的改进需求信息,但是这种方法获得的产品的改进需求信息样本较少,且不够全面。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
本发明的主要目的在于提供一种基于大数据的用户需求分析方法、装置、设备及存储介质,旨在解决现有技术根据用户画像获取的改进需求信息不够全面的技术问题。
为实现上述目的,本发明提供了一种基于大数据的用户需求分析方法,所述方法包括以下步骤:
从预设数据库中获取用户发言数据;
根据所述用户发言数据得到待比较产品用户画像和待分析产品用户画像;
根据所述待比较产品用户画像和所述待分析产品用户画像得到待分析产品的差别指标信息;
根据所述差别指标信息得到用户需求信息。
可选地,所述根据所述用户发言数据得到待比较产品用户画像和待分析产品用户画像,包括:
根据用户发言数据提取出关键语句信息;
根据所述关键语句信息构建需求指标体系;
根据所述需求指标体系得到待比较产品用户画像和待分析产品用户画像。
可选地,所述根据用户发言数据提取出关键语句信息,包括:
获取车辆知识图谱信息;
将所述用户发言数据与所述车辆知识图谱信息进行比对;
当所述用户发言数据中与所述车辆知识图谱信息中存在重合词语时,将所述重合词语所在的语句作为关键语句信息。
可选地,所述根据所述关键语句信息构建需求指标体系,包括:
根据所述车辆知识图谱信息以及所述重合词语,将所述关键语句信息分为由上位至下位的若干维度,其中,每个维度中包含若干所述关键语句信息以及所述关键语句信息对应的所述重合词语;
根据所述关键语句信息中的重合词语将所述关键语句信息分类为若干关键词语句信息;
根据所述关键词语句信息以及所述维度构建需求指标体系。
可选地,所述根据所述需求指标体系得到待比较产品用户画像和待分析产品用户画像,包括:
根据所述需求指标体系中的关键语句信息提取出待比较产品关键词信息和待分析产品关键词信息;
从所述用户发言数据中提取出包含待比较产品关键词信息的待比较产品的发言数据,将所述待比较产品的发言数据作为待比较产品画像信息;
从所述用户发言数据中提取出包含待分析产品关键词信息的待分析产品的发言数据,将所述待分析产品的发言数据作为待分析产品画像信息;
根据所述待比较产品画像信息和所述待比较产品画像信息得到待比较产品用户画像和所述待分析产品用户画像。
可选地,所述根据所述待比较产品用户画像和所述待分析产品用户画像得到待分析产品的差别指标信息,包括:
获取所述待比较产品用户画像和所述待分析产品用户画像中共有的需求指标;
获取所述待比较产品用户画像和所述待分析产品用户画像中包含所述需求指标对应的第一关键语句和第二关键语句;
将所述第一关键语句与所述第二关键语句代入预设语料库进行分析,当达到预设条件时,将所述第一关键语句与所述第二关键语句对应的需求指标作为差别指标信息。
可选地,所述将所述第一关键语句与所述第二关键语句代入预设语料库进行分析,当达到预设条件时,将所述第一关键语句与所述第二关键语句对应的需求指标作为差别指标,包括:
建立预设语料库,其中,预设语料库包括正向语料库与负向语料库;
将所述第一关键语句与所述第二关键语句代入预设语料库进行比对分析;
当比对分析结果为第二关键语句与所述负向语料库比对有相同部分,且第一关键语句与所述正向语料库比对有相同部分时,将所述第一关键语句与所述第二关键语句对应的需求指标作为差别指标。
此外,为实现上述目的,本发明还提出一种基于大数据的用户需求分析装置,所述基于大数据的用户需求分析装置包括:
获取模块,用于从预设数据库中获取用户发言数据;
画像模块,用于根据所述用户发言数据得到待比较产品用户画像和待分析产品用户画像;
比对模块,用于根据所述待比较产品用户画像和所述待分析产品用户画像得到待分析产品的差别指标信息;
分析模块,用于根据所述差别指标信息得到用户需求信息。
此外,为实现上述目的,本发明还提出一种基于大数据的用户需求分析设备,所述基于大数据的用户需求分析设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于大数据的用户需求分析程序,所述基于大数据的用户需求分析程序配置为实现如上文所述的基于大数据的用户需求分析方法的步骤。
此外,为实现上述目的,本发明还提出一种存储介质,所述存储介质上存储有基于大数据的用户需求分析程序,所述基于大数据的用户需求分析程序被处理器执行时实现如上文所述的基于大数据的用户需求分析方法的步骤。
本发明从预设数据库中获取用户发言数据;根据所述用户发言数据得到待比较产品用户画像和待分析产品用户画像;根据所述待比较产品用户画像和所述待分析产品用户画像得到待分析产品的差别指标信息;根据所述差别指标信息得到用户需求信息。通过从数据库中提取用户发言,并从中找出与本产品和同类型产品相关的发言信息然后构建本产品的用户画像和同类型产品的用户画像,并将本产品的用户画像和同类型产品的用户画像进行对比得到本产品和同类型产品的有差别的指标,然后将有差别的指标进行汇总作为用户需求信息,这样可以使根据大数据获取到的用户的需求信息更加全面,并且与同类型产品进行对比可以获得更多、更准确的用户需求信息。
附图说明
图1是本发明实施例方案涉及的硬件运行环境的基于大数据的用户需求分析设备的结构示意图;
图2为本发明基于大数据的用户需求分析方法第一实施例的流程示意图;
图3为本发明基于大数据的用户需求分析方法第二实施例的流程示意图;
图4为本发明基于大数据的用户需求分析装置第一实施例的结构框图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
参照图1,图1为本发明实施例方案涉及的硬件运行环境的基于大数据的用户需求分析设备结构示意图。
如图1所示,该基于大数据的用户需求分析设备可以包括:处理器1001,例如中央处理器(Central Processing Unit,CPU),通信总线1002、用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如无线保真(Wireless-Fidelity,Wi-Fi)接口)。存储器1005可以是高速的随机存取存储器(RandomAccess Memory,RAM)存储器,也可以是稳定的非易失性存储器(Non-Volatile Memory,NVM),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的结构并不构成对基于大数据的用户需求分析设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及基于大数据的用户需求分析程序。
在图1所示的基于大数据的用户需求分析设备中,网络接口1004主要用于与网络服务器进行数据通信;用户接口1003主要用于与用户进行数据交互;本发明基于大数据的用户需求分析设备中的处理器1001、存储器1005可以设置在基于大数据的用户需求分析设备中,所述基于大数据的用户需求分析设备通过处理器1001调用存储器1005中存储的基于大数据的用户需求分析程序,并执行本发明实施例提供的基于大数据的用户需求分析方法。
本发明实施例提供了一种基于大数据的用户需求分析方法,参照图2,图2为本发明一种基于大数据的用户需求分析方法第一实施例的流程示意图。
本实施例中,所述基于大数据的用户需求分析方法包括以下步骤:
步骤S10:从预设数据库中获取用户发言数据。
需要说明的是,本实施例的执行主体为一个控制器,所述控制器为主要用于控制基于大数据的用户需求分析方法的控制器,也可以为能实现此功能的任意设备,本实施例对此不加以限定。
应理解的是,预设数据库是一个管理员提前设定的任意论坛的数据库,其中包含了该论坛中的所有用户的发言数据,预设数据库可以为任何形式本实施例对此不加以限制。
在具体实施中,用户发言数据指的是在预设数据库中存储的所有的论坛用户的发言记录的数据。
步骤S20:根据所述用户发言数据得到待比较产品用户画像和待分析产品用户画像。
需要说明的是,待分析产品指的是本实施例中需要研究的产品,可以是任何型号与类型的车辆,本实施例对此不加以限制。
应理解的是,待比较产品指的是用户提前选取的作为对照参考的与待分析产品同类型的最相似的车辆,待比较产品可以由管理员自行选取和调整,本实施例对此不加以限制。
在具体实施中,待比较产品用户画像指的是通过对用户发言数据提取出关键语句信息然后构建需求指标体系,最后根据需求指标体系得到的待比较产品的用户画像。
需要说明的是,待分析产品用户画像指的是通过对用户发言数据提取出关键语句信息然后构建需求指标体系,最后根据需求指标体系得到的待分析产品的用户画像。
步骤S30:根据所述待比较产品用户画像和所述待分析产品用户画像得到待分析产品的差别指标信息。
应理解的是,差别指标信息指的是根据待比较产品用户画像和待分析产品用户画像的比较,最后得到的待比较产品和待分析产品在舆情和评价上存在差别的指标。将待分析产品评价差于待比较产品的指标作为差别指标。差别指标信息中包含了差别指标有关的信息,可以为差别指标的名称,也可以为差别指标中待分析产品的具体评价信息,本实施例对此不加以限定。
在具体实施中,根据所述待比较产品用户画像和所述待分析产品用户画像得到待分析产品的差别指标信息指的是,根据待比较产品用户画像和待分析产品用户画像找到存在差别的指标,最后确定差别指标。
步骤S40:根据所述差别指标信息得到用户需求信息。
需要说明的是,用户需求信息中包含了差别指标信息中的差别指标以及每个差别指标对应的用户发言数据,用户需求信息中也可以包括其他从待分析产品用户画像中得到的需要改进的用户发言评价,本实施例对此不加以限制。
本实施例通过从预设数据库中获取用户发言数据;根据所述用户发言数据得到待比较产品用户画像和待分析产品用户画像;根据所述待比较产品用户画像和所述待分析产品用户画像得到待分析产品的差别指标信息;根据所述差别指标信息得到用户需求信息。通过从数据库中提取用户发言,并从中找出与本产品和同类型产品相关的发言信息然后构建本产品的用户画像和同类型产品的用户画像,并将本产品的用户画像和同类型产品的用户画像进行对比得到本产品和同类型产品的有差别的指标,然后将有差别的指标进行汇总作为用户需求信息,这样可以使根据大数据获取到的用户的需求信息更加全面,并且与同类型产品进行对比可以获得更多、更准确的用户需求信息。。
参考图3,图3为本发明一种基于大数据的用户需求分析方法第二实施例的流程示意图。
基于上述第一实施例,本实施例基于大数据的用户需求分析方法在所述步骤S20包括:
步骤S201:根据用户发言数据提取出关键语句信息。
需要说明的是,关键语句信息指的是包含了与车辆知识图谱信息中存在的本领域专业名词的语句信息。
应理解的是,根据用户发言数据提取出关键语句信息指的是,根据用户发言数据中提取出包含了重合词语的语句信息。
进一步地,为了能够准确且全面的获取关键语句信息,步骤S201包括:
获取车辆知识图谱信息;
将所述用户发言数据与所述车辆知识图谱信息进行比对;
当所述用户发言数据中与所述车辆知识图谱信息中存在重合词语时,将所述重合词语所在的语句作为关键语句信息。
在具体实施中,车辆知识图谱信息指的是,预先存储的本领域中所有有关于车辆的名词、知识信息,车辆知识图谱信息中包含了所有评价车辆的专业名词以及相近词语。
需要说明的是,将所述用户发言数据与所述车辆知识图谱信息进行比对指的是,将用户发言数据中的所有词汇与车辆知识图谱信息中的所有词汇进行比对和匹配。
应理解的是,重合词语指的是,用户发言数据中与车辆知识图谱信息中同时存在的词语。
在具体实施中,当所述用户发言数据中与所述车辆知识图谱信息中存在重合词语时,将所述重合词语所在的语句作为关键语句信息指的是,当查询到存在重合词语时,确定重合词语所在的用户的发言记录,然后提取出重合词语所在的用户发言的语句,将重合词语所在的用户发言语句作为关键语句信息。
通过这种方式,将用户发言与车辆知识图谱比对,可以更加全面的获得关键语句信息以用于构建需求指标体系。
步骤S202:根据所述关键语句信息构建需求指标体系。
需要说明的是,指标体系是指由若干个反映社会经济现象总体数量特征的相对独立又相互联系的统计指标所组成的有机整体,所以需求指标体系中则是包含了所有用户需求的指标的指标体系。
进一步地,为了能够建立更加完整的需求指标体系,步骤S202包括:
根据所述车辆知识图谱以及所述重合词语,将所述关键语句信息分为由上位至下位的若干维度,其中,每个维度中包含若干所述关键语句信息以及所述关键语句信息对应的所述重合词语;
根据所述关键语句信息中的重合词语将所述关键语句信息分类为若干关键词语句信息;
根据所述关键词语句信息以及所述维度构建需求指标体系。
应理解的是,根据所述车辆知识图谱以及所述重合词语,将所述关键语句信息分为由上位至下位的若干维度指的是,根据车辆知识图谱信息将重合词语分为由上位至下位的若干维度,然后再将重合词语所在的语句代入,即可得到由上位到下位分为若干维度的关键语句信息。例如:假设重合词语为“配置”、“动力配置”和“变速箱类型”,则“配置”为“动力配置”和“变速箱类型”的上位词,所以“配置”维度为上位维度,包含了下位维度“动力配置”和“变速箱类型”,然后查找到“配置”、“动力配置”和“变速箱类型”对应的关键语句信息,将关键语句信息带入到“配置”、“动力配置”和“变速箱类型”对应的维度。
在具体实施中,每个维度中包含若干所述关键语句信息以及所述关键语句信息对应的所述重合词语指的是,分成若干个维度之后,每个维度的信息中都包括了若干个重合词语的信息以及关键语句的信息。
需要说明的是,根据所述关键语句信息中的重合词语将所述关键语句信息分类为若干关键词语句信息指的是,根据重合词语将关键语句信息进行分类,分类依据为关键语句中是否带有相同的重合词语,最终得到的即为包含了相同重合词语的若干关键词语句信息。其中每一个关键词语句信息中都包含了有相同重合词语的关键语句信息。
应理解的是,根据所述关键词语句信息以及所述维度构建需求指标体系指的是,将关键词语句信息带入到每个维度中,根据关键词语句信息中包含的重合词语,将关键词语句信息代入到重合词语所在的维度,最后得到了需求指标体系。
在具体实施中,需求指标体系中包含了若干个维度,每个维度对应了一个重合词语以及对应的重合词语的关键词语句信息。
步骤S203:根据所述需求指标体系得到待比较产品用户画像和待分析产品用户画像。
需要说明的是,根据所述需求指标体系得到待比较产品用户画像和所述待分析产品用户画像指的是,根据需求指标体系中的维度信息,以及每个维度中包含的重合词语和关键词语句信息,得到待比较产品用户画像和待分析产品用户画像。
进一步地,为了能够准确得到待比较产品用户画像和所述待分析产品用户画像,步骤S203包括:
根据所述需求指标体系中的关键语句信息提取出待比较产品关键词信息和待分析产品关键词信息;
从所述用户发言数据中提取出包含待比较产品关键词信息的待比较产品的发言数据,将所述待比较产品的发言数据作为待比较产品画像信息;
从所述用户发言数据中提取出包含待分析产品关键词信息的待分析产品的发言数据,将所述待分析产品的发言数据作为待分析产品画像信息;
根据所述待比较产品画像信息和所述待比较产品画像信息得到待比较产品用户画像和待分析产品用户画像。
应理解的是,根据所述需求指标体系中的关键语句信息提取出待比较产品关键词信息和待分析产品关键词信息指的是,从需求指标体系中提取出与待比较产品有关的关键词信息,作为待比较产品关键词信息。再从需求指标体系中提取出与待分析产品有关的关键词信息,作为待分析产品关键词信息。
在具体实施中,从所述用户发言数据中提取出包含待比较产品关键词信息的待比较产品的发言数据,将所述待比较产品的发言数据作为待比较产品画像信息指的是,根据待比较产品关键词信息,从所有的用户发言数据中,查询到所有包含了待比较产品关键词的发言数据,然后将包含了待比较产品的发言数据作为待比较产品画像信息进行存储。
需要说明的是,从所述用户发言数据中提取出包含待分析产品关键词信息的待分析产品的发言数据,将所述待分析产品的发言数据作为待分析产品画像信息指的是,根据待分析产品关键词信息,从所有的用户发言数据中,查询到所有包含了待分析产品关键词的发言数据,然后将包含了待分析产品的发言数据作为待分析产品画像信息进行存储。
应理解的是,根据所述待比较产品画像信息和所述待比较产品画像信息得到待比较产品用户画像和待分析产品用户画像指的是,根据待比较产品画像信息对待比较产品进行用户画像,然后得到待比较产品用户画像;根据待分析产品画像信息对待分析产品进行用户画像,然后得到待分析产品用户画像。
通过这种方式可以从大量的用户发言数据中快速锁定与需要构建用户画像的待比较产品和待分析产品相关的信息,然后根据这些发言数据得到用户画像,实现了更加快速、更有效率的构建待比较产品和待分析产品的用户画像。
进一步地,为了能够快速且准确的得到差别指标信息,步骤所述根据所述待比较产品用户画像和所述待分析产品用户画像得到待分析产品的差别指标信息,包括:
获取所述待比较产品用户画像和所述待分析产品用户画像中共有的需求指标;
获取所述待比较产品用户画像和所述待分析产品用户画像中包含所述需求指标对应的第一关键语句和第二关键语句;
将所述第一关键语句与所述第二关键语句代入预设语料库进行分析,当达到预设条件时,将所述第一关键语句与所述第二关键语句对应的需求指标作为差别指标信息。
需要说明的是,获取所述待比较产品用户画像和所述待分析产品用户画像中共有的需求指标指的是,将待比较产品用户画像和待分析产品用户画像进行比较,找出待比较产品用户画像和待分析产品用户画像中共同存在的需求指标。
应理解的是,需求指标指的是用户画像中包含的标签,每个标签只能表示一种含义,避免标签之间的重复和冲突,便于计算机处理,并且标签必须有一定的语义。
在具体实施中,获取所述待比较产品用户画像和所述待分析产品用户画像中包含所述需求指标对应的第一关键语句和第二关键语句指的是,当确定了共有的需求指标之后,根据共有的需求指标在待比较产品用户画像中查询到与共有的需求指标相关的描述语句信息,并且将与共有的需求指标相关的描述语句作为第一关键语句;根据共有的需求指标在待分析产品用户画像中查询到与共有的需求指标相关的描述语句信息,并且将与共有的需求指标相关的描述语句作为第二关键语句。
需要说明的是,预设语料库是提前设定好的语料库,语料库是指经科学取样和加工的大规模电子文本库,其中存放的是在语言的实际使用中真实出现过的语言材料。
应理解的是,预设语料库可以由管理员自行设定与调整,本实施例对此不加以限制。
在具体实施中,将所述第一关键语句与所述第二关键语句代入预设语料库进行分析,当达到预设条件时,将所述第一关键语句与所述第二关键语句对应的需求指标作为差别指标信息指的是,将第一关键语句和第二关键语句代入到预设语料库中,将第一关键语句和第二关键语句中的语料与预设语料库中的语料对比,当比对结果达到预设条件时,将第一关键语句和第二关键语句对应的需求指标作为差别指标,并将差别指标的相关信息作为差别指标信息进行存储。
通过这种方式,可以快速找到待分析产品和待比较产品的差别指标,使得到用户需求信息更加有效率,并且在所有用户发言数据中查找可以使差别指标的确定更加全面。
进一步地,为了能准确的确定差别指标,步骤将所述第一关键语句与所述第二关键语句代入预设语料库进行分析,当达到预设条件时,将所述第一关键语句与所述第二关键语句对应的需求指标作为差别指标,包括:
建立预设语料库,其中,预设语料库包括正向语料库与负向语料库;
将所述第一关键语句与所述第二关键语句代入预设语料库进行比对分析;
当比对分析结果为第二关键语句与所述负向语料库比对有相同部分,且第一关键语句与所述正向语料库比对有相同部分时,将所述第一关键语句与所述第二关键语句对应的需求指标作为差别指标。
需要说明的是,建立预设语料库指的是,根据管理员预先设定的语料建立语料库。
应理解的是,预设语料库包括正向语料库与负向语料库指的是,预设语料库又包括了两个语料库,分别为正向语料库和负向语料库。正向语料库中存储的是描述指标的正向语料和优点描述的语料;而负向语料库中存储的是描述指标的负向语料和缺点描述的语料。
在具体实施中,将所述第一关键语句与所述第二关键语句代入预设语料库进行比对分析指的是,将第一关键语句和第二关键语句分别代入正向语料库和负向语料库进行比对,即将第一关键语句和第二关键语句中的语料和正向语料库和负向语料库中的语料进行比对。
需要说明的是,当比对分析结果为第二关键语句与所述负向语料库比对有相同部分,且第一关键语句与所述正向语料库比对有相同部分时,将所述第一关键语句与所述第二关键语句对应的需求指标作为差别指标指的是,当第二关键语句与负向语料库比对成功,第二关键语句中的语料与负向语料库的语料有相同部分,并且同时第一关键语句的语料与正向语料库的语料有相同部分时,认定此时第一关键语句和第二关键语句对应的需求指标为差别指标。
应理解的是,当同时满足第二关键语句与负向语料库有相同部分,以及第一关键语句与正向语料库有相同部分时,即认定当前第一关键语句和第二关键语句对应的需求指标为差别指标。
通过这种方式,可以使得差别指标的认定更加准确,减少了差别指标的错误认定。
本实施例通过根据用户发言数据提取出关键语句信息;根据所述关键语句信息构建需求指标体系;根据所述需求指标体系得到待比较产品用户画像和所述待分析产品用户画像。通过这种方式,可以通过建立需求指标体系来辅助建立更加全面和完整的待比较产品用户画像和待分析产品用户画像,使得用户画像更加完整和准确,减少了构建用户画像的误差。
此外,本发明实施例还提出一种存储介质,所述存储介质上存储有基于大数据的用户需求分析程序,所述基于大数据的用户需求分析程序被处理器执行时实现如上文所述的基于大数据的用户需求分析方法的步骤。
参照图4,图4为本发明基于大数据的用户需求分析装置第一实施例的结构框图。
如图4所示,本发明实施例提出的基于大数据的用户需求分析装置包括:
获取模块10,用于从预设数据库中获取用户发言数据。
画像模块20,用于根据所述用户发言数据得到待比较产品用户画像和待分析产品用户画像。
比对模块30,用于根据所述待比较产品用户画像和所述待分析产品用户画像得到待分析产品的差别指标信息。
分析模块40,用于根据所述差别指标信息得到用户需求信息。
应当理解的是,以上仅为举例说明,对本发明的技术方案并不构成任何限定,在具体应用中,本领域的技术人员可以根据需要进行设置,本发明对此不做限制。
本实施例通过从预设数据库中获取用户发言数据;根据所述用户发言数据得到待比较产品用户画像和待分析产品用户画像;根据所述待比较产品用户画像和所述待分析产品用户画像得到待分析产品的差别指标信息;根据所述差别指标信息得到用户需求信息。通过从数据库中提取用户发言,并从中找出与本产品和同类型产品相关的发言信息然后构建本产品的用户画像和同类型产品的用户画像,并将本产品的用户画像和同类型产品的用户画像进行对比得到本产品和同类型产品的有差别的指标,然后将有差别的指标进行汇总作为用户需求信息,这样可以使根据大数据获取到的用户的需求信息更加全面,并且与同类型产品进行对比可以获得更多、更准确的用户需求信息。
需要说明的是,以上所描述的工作流程仅仅是示意性的,并不对本发明的保护范围构成限定,在实际应用中,本领域的技术人员可以根据实际的需要选择其中的部分或者全部来实现本实施例方案的目的,此处不做限制。
在本实施例中,所述画像模块20,还用于根据用户发言数据提取出关键语句信息;根据所述关键语句信息构建需求指标体系;根据所述需求指标体系得到待比较产品用户画像和待分析产品用户画像。
在本实施例中,所述画像模块20,还用于获取车辆知识图谱信息;将所述用户发言数据与所述车辆知识图谱信息进行比对;当所述用户发言数据中与所述车辆知识图谱信息中存在重合词语时,将所述重合词语所在的语句作为关键语句信息。
在本实施例中,所述画像模块20,还用于根据所述车辆知识图谱信息以及所述重合词语,将所述关键语句信息分为由上位至下位的若干维度,其中,每个维度中包含若干所述关键语句信息以及所述关键语句信息对应的所述重合词语;根据所述关键语句信息中的重合词语将所述关键语句信息分类为若干关键词语句信息;根据所述关键词语句信息以及所述维度构建需求指标体系。
在本实施例中,所述画像模块20,还用于根据所述需求指标体系中的关键语句信息提取出待比较产品关键词信息和待分析产品关键词信息;从所述用户发言数据中提取出包含待比较产品关键词信息的待比较产品的发言数据,将所述待比较产品的发言数据作为待比较产品画像信息;从所述用户发言数据中提取出包含待分析产品关键词信息的待分析产品的发言数据,将所述待分析产品的发言数据作为待分析产品画像信息;根据所述待比较产品画像信息和所述待比较产品画像信息得到待比较产品用户画像和所述待分析产品用户画像。
在本实施例中,所述比对模块30,还用于获取所述待比较产品用户画像和所述待分析产品用户画像中共有的需求指标;获取所述待比较产品用户画像和所述待分析产品用户画像中包含所述需求指标对应的第一关键语句和第二关键语句;将所述第一关键语句与所述第二关键语句代入预设语料库进行分析,当达到预设条件时,将所述第一关键语句与所述第二关键语句对应的需求指标作为差别指标信息。
在本实施例中,所述比对模块30,还用于建立预设语料库,其中,预设语料库包括正向语料库与负向语料库;将所述第一关键语句与所述第二关键语句代入预设语料库进行比对分析;当比对分析结果为第二关键语句与所述负向语料库比对有相同部分,且第一关键语句与所述正向语料库比对有相同部分时,将所述第一关键语句与所述第二关键语句对应的需求指标作为差别指标。
另外,未在本实施例中详尽描述的技术细节,可参见本发明任意实施例所提供的基于大数据的用户需求分析方法,此处不再赘述。
此外,需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如只读存储器(Read Only Memory,ROM)/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种基于大数据的用户需求分析方法,其特征在于,所述基于大数据的用户需求分析方法包括:
从预设数据库中获取用户发言数据;
根据所述用户发言数据得到待比较产品用户画像和待分析产品用户画像;
根据所述待比较产品用户画像和所述待分析产品用户画像得到待分析产品的差别指标信息;
根据所述差别指标信息得到用户需求信息。
2.如权利要求1所述的方法,其特征在于,所述根据所述用户发言数据得到待比较产品用户画像和待分析产品用户画像,包括:
根据用户发言数据提取出关键语句信息;
根据所述关键语句信息构建需求指标体系;
根据所述需求指标体系得到待比较产品用户画像和待分析产品用户画像。
3.如权利要求2所述的方法,其特征在于,所述根据用户发言数据提取出关键语句信息,包括:
获取车辆知识图谱信息;
将所述用户发言数据与所述车辆知识图谱信息进行比对;
当所述用户发言数据中与所述车辆知识图谱信息中存在重合词语时,将所述重合词语所在的语句作为关键语句信息。
4.如权利要求3所述的方法,其特征在于,所述根据所述关键语句信息构建需求指标体系,包括:
根据所述车辆知识图谱信息以及所述重合词语,将所述关键语句信息分为由上位至下位的若干维度,其中,每个维度中包含若干所述关键语句信息以及所述关键语句信息对应的所述重合词语;
根据所述关键语句信息中的重合词语将所述关键语句信息分类为若干关键词语句信息;
根据所述关键词语句信息以及所述维度构建需求指标体系。
5.如权利要求2所述的方法,其特征在于,所述根据所述需求指标体系得到待比较产品用户画像和待分析产品用户画像,包括:
根据所述需求指标体系中的关键语句信息提取出待比较产品关键词信息和待分析产品关键词信息;
从所述用户发言数据中提取出包含待比较产品关键词信息的待比较产品的发言数据,将所述待比较产品的发言数据作为待比较产品画像信息;
从所述用户发言数据中提取出包含待分析产品关键词信息的待分析产品的发言数据,将所述待分析产品的发言数据作为待分析产品画像信息;
根据所述待比较产品画像信息和所述待比较产品画像信息得到待比较产品用户画像和待分析产品用户画像。
6.如权利要求1至5中任一项所述的方法,其特征在于,所述根据所述待比较产品用户画像和所述待分析产品用户画像得到待分析产品的差别指标信息,包括:
获取所述待比较产品用户画像和所述待分析产品用户画像中共有的需求指标;
获取所述待比较产品用户画像和所述待分析产品用户画像中包含所述需求指标对应的第一关键语句和第二关键语句;
将所述第一关键语句与所述第二关键语句代入预设语料库进行分析,当达到预设条件时,将所述第一关键语句与所述第二关键语句对应的需求指标作为差别指标信息。
7.如权利要求6所述的方法,其特征在于,所述将所述第一关键语句与所述第二关键语句代入预设语料库进行分析,当达到预设条件时,将所述第一关键语句与所述第二关键语句对应的需求指标作为差别指标,包括:
建立预设语料库,其中,预设语料库包括正向语料库与负向语料库;
将所述第一关键语句与所述第二关键语句代入预设语料库进行比对分析;
当比对分析结果为第二关键语句与所述负向语料库比对有相同部分,且第一关键语句与所述正向语料库比对有相同部分时,将所述第一关键语句与所述第二关键语句对应的需求指标作为差别指标。
8.一种基于大数据的用户需求分析装置,其特征在于,所述基于大数据的用户需求分析装置包括:
获取模块,用于从预设数据库中获取用户发言数据;
画像模块,用于根据所述用户发言数据得到待比较产品用户画像和待分析产品用户画像;
比对模块,用于根据所述待比较产品用户画像和所述待分析产品用户画像得到待分析产品的差别指标信息;
分析模块,用于根据所述差别指标信息得到用户需求信息。
9.一种基于大数据的用户需求分析设备,其特征在于,所述设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于大数据的用户需求分析程序,所述基于大数据的用户需求分析程序配置为实现如权利要求1至7中任一项所述的基于大数据的用户需求分析方法。
10.一种存储介质,其特征在于,所述存储介质上存储有基于大数据的用户需求分析程序,所述基于大数据的用户需求分析程序被处理器执行时实现如权利要求1至7任一项所述的基于大数据的用户需求分析方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110582240.7A CN113342931B (zh) | 2021-05-27 | 2021-05-27 | 基于大数据的用户需求分析方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110582240.7A CN113342931B (zh) | 2021-05-27 | 2021-05-27 | 基于大数据的用户需求分析方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113342931A true CN113342931A (zh) | 2021-09-03 |
CN113342931B CN113342931B (zh) | 2022-11-01 |
Family
ID=77471671
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110582240.7A Active CN113342931B (zh) | 2021-05-27 | 2021-05-27 | 基于大数据的用户需求分析方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113342931B (zh) |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105069647A (zh) * | 2015-07-30 | 2015-11-18 | 齐鲁工业大学 | 一种改进的抽取中文商品评论中评价对象的方法 |
WO2017168410A1 (en) * | 2016-03-30 | 2017-10-05 | C-B4 Context Based Forecasting Ltd | System, method and computer program product for data analysis |
CN107943909A (zh) * | 2017-11-17 | 2018-04-20 | 合肥工业大学 | 基于评论数据的用户需求趋势挖掘方法及装置、存储介质 |
CN109189944A (zh) * | 2018-09-27 | 2019-01-11 | 桂林电子科技大学 | 基于用户正负反馈画像编码的个性化景点推荐方法及系统 |
CN109684330A (zh) * | 2018-12-17 | 2019-04-26 | 深圳市华云中盛科技有限公司 | 用户画像库构建方法、装置、计算机设备及存储介质 |
CN110097419A (zh) * | 2019-03-29 | 2019-08-06 | 努比亚技术有限公司 | 商品数据处理方法、计算机设备和存储介质 |
CN111931497A (zh) * | 2020-07-16 | 2020-11-13 | 中国汽车技术研究中心有限公司 | 汽车消费者调研问卷语言的优化方法 |
CN112016961A (zh) * | 2020-08-26 | 2020-12-01 | 北京字节跳动网络技术有限公司 | 推送方法、装置、电子设备和计算机可读存储介质 |
CN112767085A (zh) * | 2021-01-22 | 2021-05-07 | 武汉蔚来能源有限公司 | 商品相似性分析及商品推荐方法、装置及计算机存储介质 |
CN112800109A (zh) * | 2021-01-21 | 2021-05-14 | 蜜兔(杭州)网络科技有限公司 | 一种信息挖掘方法及系统 |
-
2021
- 2021-05-27 CN CN202110582240.7A patent/CN113342931B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105069647A (zh) * | 2015-07-30 | 2015-11-18 | 齐鲁工业大学 | 一种改进的抽取中文商品评论中评价对象的方法 |
WO2017168410A1 (en) * | 2016-03-30 | 2017-10-05 | C-B4 Context Based Forecasting Ltd | System, method and computer program product for data analysis |
US20190073620A1 (en) * | 2016-03-30 | 2019-03-07 | C-B4 Context Based Forecasting Ltd | System, method and computer program product for data analysis |
CN107943909A (zh) * | 2017-11-17 | 2018-04-20 | 合肥工业大学 | 基于评论数据的用户需求趋势挖掘方法及装置、存储介质 |
CN109189944A (zh) * | 2018-09-27 | 2019-01-11 | 桂林电子科技大学 | 基于用户正负反馈画像编码的个性化景点推荐方法及系统 |
CN109684330A (zh) * | 2018-12-17 | 2019-04-26 | 深圳市华云中盛科技有限公司 | 用户画像库构建方法、装置、计算机设备及存储介质 |
CN110097419A (zh) * | 2019-03-29 | 2019-08-06 | 努比亚技术有限公司 | 商品数据处理方法、计算机设备和存储介质 |
CN111931497A (zh) * | 2020-07-16 | 2020-11-13 | 中国汽车技术研究中心有限公司 | 汽车消费者调研问卷语言的优化方法 |
CN112016961A (zh) * | 2020-08-26 | 2020-12-01 | 北京字节跳动网络技术有限公司 | 推送方法、装置、电子设备和计算机可读存储介质 |
CN112800109A (zh) * | 2021-01-21 | 2021-05-14 | 蜜兔(杭州)网络科技有限公司 | 一种信息挖掘方法及系统 |
CN112767085A (zh) * | 2021-01-22 | 2021-05-07 | 武汉蔚来能源有限公司 | 商品相似性分析及商品推荐方法、装置及计算机存储介质 |
Non-Patent Citations (2)
Title |
---|
LIANG YANG等: "Multi-Label Learning with Deep Forest", 《MACHINE LEARNING》 * |
刘凯: "基于屏幕视觉热区的交互收敛式个性化推荐方法研究", 《中国博士学位论文全文数据库 信息科技辑》 * |
Also Published As
Publication number | Publication date |
---|---|
CN113342931B (zh) | 2022-11-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110781276B (zh) | 文本抽取方法、装置、设备及存储介质 | |
CN109284399B (zh) | 相似度预测模型训练方法、设备及计算机可读存储介质 | |
CN109634436B (zh) | 输入法的联想方法、装置、设备及可读存储介质 | |
CN112416778B (zh) | 测试用例推荐方法、装置和电子设备 | |
CN111125343A (zh) | 适用于人岗匹配推荐系统的文本解析方法及装置 | |
CN111639156B (zh) | 一种基于层级标签的查询方法、装置,设备及存储介质 | |
CN108776677B (zh) | 平行语句库的创建方法、设备及计算机可读存储介质 | |
CN110941702A (zh) | 一种法律法规和法条的检索方法及装置、可读存储介质 | |
CN111190946A (zh) | 报告生成方法、装置、计算机设备和存储介质 | |
CN116244410A (zh) | 一种基于知识图谱和自然语言的指标数据分析方法及系统 | |
CN110795942B (zh) | 基于语义识别的关键词确定方法、装置和存储介质 | |
CN110489032B (zh) | 用于电子书的词典查询方法及电子设备 | |
CN113449083B (zh) | 作业安全管理方法、装置、设备及存储介质 | |
CN117725182A (zh) | 基于大语言模型的数据检索方法、装置、设备和存储介质 | |
CN111369294A (zh) | 软件造价估算方法及装置 | |
CN117763126A (zh) | 知识检索方法、设备、存储介质及装置 | |
CN111104422B (zh) | 一种数据推荐模型的训练方法、装置、设备及存储介质 | |
CN116644183A (zh) | 文本分类方法、装置及存储介质 | |
CN113342931B (zh) | 基于大数据的用户需求分析方法、装置、设备及存储介质 | |
CN110929526A (zh) | 样本生成方法、装置以及电子设备 | |
CN114780577A (zh) | Sql语句生成方法、装置、设备及存储介质 | |
CN114154480A (zh) | 信息提取方法、装置、设备和存储介质 | |
CN112818005A (zh) | 结构化数据的搜索方法、装置、设备及存储介质 | |
CN111597791A (zh) | 评论短语的提取方法及设备 | |
CN113312898B (zh) | 语料处理方法、设备、存储介质及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |