CN114445043B - 基于开放生态化云erp异质图用户需求精准发现方法及系统 - Google Patents

基于开放生态化云erp异质图用户需求精准发现方法及系统 Download PDF

Info

Publication number
CN114445043B
CN114445043B CN202210095467.3A CN202210095467A CN114445043B CN 114445043 B CN114445043 B CN 114445043B CN 202210095467 A CN202210095467 A CN 202210095467A CN 114445043 B CN114445043 B CN 114445043B
Authority
CN
China
Prior art keywords
data
user
service
cloud erp
erp
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210095467.3A
Other languages
English (en)
Other versions
CN114445043A (zh
Inventor
张以文
夏新辰
何云飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Anhui University
Original Assignee
Anhui University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Anhui University filed Critical Anhui University
Priority to CN202210095467.3A priority Critical patent/CN114445043B/zh
Publication of CN114445043A publication Critical patent/CN114445043A/zh
Application granted granted Critical
Publication of CN114445043B publication Critical patent/CN114445043B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/103Workflow collaboration or project management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/288Entity relationship models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/253Grammatical analysis; Style critique
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Databases & Information Systems (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Operations Research (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Data Mining & Analysis (AREA)
  • Marketing (AREA)
  • Probability & Statistics with Applications (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种基于开放生态化云ERP异质图用户需求精准发现方法及系统,包括:构建开放生态化云ERP异质图,获取实体数据;利用众包技术采集并预处理反馈信息,据以建立词袋库、提取情感特征,处理所述词袋库和所述情感特征得库特征向量;聚类处理所述库特征向量,据以获取用户云ERP服务需求数据;将所述用户云ERP服务需求数据作为实体插入到开放生态化云ERP异质图中,与用户、服务、服务商建立联系,据以更新所述云ERP异质图;从所述云ERP异质图获取实体关系数据,根据所述实体关系数据获取并发出需求适配推荐信息至所述用户及所述服务商。本发明解决了需求信息匹配性较差以及反馈信息参考价值较低的技术问题。

Description

基于开放生态化云ERP异质图用户需求精准发现方法及系统
技术领域
本发明属于企业服务需求挖掘领域,涉及一种基于开放生态化云ERP异质图用户需求精准发现方法及系统。
背景技术
开放生态化云ERP是一种去中心化的,以信息技术和云计算为基础的企业信息管理系统,种类繁多的开放生态化云ERP组成了开放生态化云ERP平台。随着信息技术和互联网的发展,服务平台能否准确、快速、主动的满足用户需求,已成为服务商实现商业收益的一个关键目标。
基于开放生态化云ERP的需求服务受到广泛应用,例如,申请号为CN201810733930.6的发明专利《一种服装高级定制行业门店ERP经营管理系统》通过ERP运营管理软件与所述的高定ERP数据中心进行数据交流。采用以上设计后,该发明具有如下优点:高级定制服装品牌可以时时通过在线数据提炼出的总额数据为自身的经营与销售提供理论及数据支持,可以对商家日常经营情况时时盘点功能,ERP运营管理软件可以对高级定制店日常经营中的进销存、销售、渠道、市场、会员等众多维度工作进行记录、分析及优化,在线打通高级定制服装各个环节。然而,现有技术中的开放生态化云ERP平台主要是向用户提供他们可能需要的服务,但这过程中仍然存在一些挑战。具体地说,开放生态化云ERP自身难以完全匹配用户个性化的需求,这导致用户难以获得很好的体验,同时又限制了云ERP提供商的发展。其中一个主要原因是用户和开放生态化云ERP服务商之间缺乏一个有效反馈机制,以动态调整和升级云ERP服务。特别的,如何从海量的用户反馈中发现有效和有用的参考信息是一个巨大的挑战。具体地说,少部分用户的反馈信息可能不具有很高的参考价值,而收集了海量的用户反馈则可以发现用户需求的主要方面以及需求的相关性。现有技术中存在需求信息匹配性较差以及反馈信息参考价值较低的技术问题。
发明内容
本发明所要解决的技术问题在于如何解决需求信息匹配性较差以及反馈信息参考价值较低的技术问题。
本发明是采用以下技术方案解决上述技术问题的:一种基于开放生态化云ERP异质图用户需求精准发现方法,其特征在于,应用于需求数据精准挖掘,所述方法包括:
构建开放生态化云ERP异质图,获取用户数据、用户反馈数据、云ERP服务数据、云ERP服务商数据;
利用众包技术采集并预处理服务对象调查表中的用户对服务的打分及评论信息,据以建立词袋库、提取情感特征,处理所述词袋库和情感特征向量;
聚类处理情感特征向量,据以获取用户云ERP服务需求数据;
将所述用户云ERP服务需求数据作为实体插入到开放生态化云ERP异质图中,与用户、服务、服务商建立联系,据以更新所述云ERP异质图;
从所述云ERP异质图获取实体关系数据,根据所述实体关系数据获取并发出需求适配推荐信息至所述用户及所述服务商。
本发明构建开放生态化云ERP异质图,依托众包技术收集用户反馈,智能化处理云ERP平台用户反馈信息,并从中精准发现用户需求,根据需求新增实体间的联系,完善开放生态化云ERP异质图,作为云ERP平台服务适配需求的导向,做到在精准发现用户需求的同时,给用户提供更加适配需求的服务。
在更具体的技术方案中,所述构建开放生态化云ERP异质图,获取用户数据、用户反馈数据、云ERP服务数据、云ERP服务商数据的步骤,包括:
获取实体关联数据;
构建所述开放生态化云ERP异质图:
从后台数据库中获取所述用户数据、所述用户反馈数据、所述云ERP服务数据、所述云ERP服务商数据,据以获取基线特征向量。
本发明以针对企业领域服务的PaaS+SaaS一体化云ERP平台为背景,设计了基于众包模式和异质图的用户需求精准发现方法,实现数据驱动和知识引导的需求分析,基于用户业务需求的主动预测的目的,从海量用户反馈数据中精准发现用户实际需求,为平台需求更新提供数据基础和指导方向。
在更具体的技术方案中,所述利用众包技术采集并预处理反馈信息,据以建立词袋库、提取情感特征,处理所述词袋库和情感特征向量的步骤,包括:
利用用户服务质量调查表采集并存储所述反馈信息至后台数据库;
从所述后台数据库提取用户实体的所述反馈信息;
以所述用户实体的用户信息、所述反馈信息及ERP服务信息生成反馈数据集;
获取所述反馈信息中的语法特征数据,据以生成语法特征向量;
根据内容特征数据生成内容特征向量;
获取所述反馈信息中的情感特征数据,据以生成情感特征向量。
在更具体的技术方案中,所述获取所述反馈信息中的语法特征数据生成语法特征向量,获取所述反馈信息中的内容特征数据获得内容特征向量的步骤,包括:
从所述反馈信息中获取评论数据;
获取每一所述评论数据的语法词汇特征,据以生成所述语法特征向量。
在更具体的技术方案中,所述根据内容特征数据生成内容特征向量的步骤,包括:
根据下述逻辑获取所述反馈信息中的词频内容特征:分析评论间的相关性。
Figure GDA0003910104200000031
根据下述逻辑获取所述反馈信息中的权重特征:
Figure GDA0003910104200000032
根据所述反馈信息中的每一条评论数据Ci的所述词频内容特征及所述权重特征获取所述评论数据Ci的所述内容特征向量coni={TFi,×IDFi}。
在更具体的技术方案中,所述获取所述反馈信息中的情感特征数据,据以生成情感特征向量的步骤,包括:
从所述情感特征数据中获取反馈性质数据和观点情感数据;
获取所述反馈信息中的情感特征数据,根据下述逻辑处理所述反馈性质数据和所述观点情感数据,生成情感特征向量:
Figure GDA0003910104200000033
本发明的异质图不仅能灵活建模多类型实体,还有实体之间的关系。自然语言处理技术目前已经应用到垃圾邮件分类、QA、新闻分类等方面。大量实验证明,提取样本的情感特征加入自然语言处理的模型中对分类的有效性和准确性具有提升作用。本专利依托异质图对开放生态化云ERP进行建模,利用融合情感特征的语义分析技术,挖掘隐藏在用户反馈内容中的信息,实现用户需求精准发现。
在更具体的技术方案中,所述聚类处理所述特征向量,包括语法特征向量、情感特征向量、内容特征向量,据以获取用户云ERP服务需求数据的步骤,包括:
获取一项云ERP服务下所有所述反馈信息的特征向量;
根据下述逻辑将所述反馈信息中的评论数据的语法特征向量、内容特征向量及情感特征向量分别与基线特征向量进行求余弦运算,记为所述评论数据Ci在三个特征维度上的多特征维度得分数据:
Figure GDA0003910104200000041
Figure GDA0003910104200000042
Figure GDA0003910104200000043
其中,SCgrai和SCconi的取值均在[0,1]区间,SCemoi的取值在[-1,1]之间;
根据所述多特征维度得分数据类聚处理每一所述评论数据,据以获取评论相似类数据;
根据下述逻辑处理所述评论类相似数据,据以得到相似类评论权重数据:
Figure GDA0003910104200000044
其中,Need为对所述评论数据Ci划分的类,Ci∈Needj表示样本i所属第j类,对该集合求其大小即可得出此类在整个分类中所占权重;
以下述逻辑根据所述多特征维度得分数据筛选处理所述评论数据Ci,据以得到聚类需求数据:
Figure GDA0003910104200000045
其中参数ε和α均为接近0的参数;
根据所述聚类需求数据获取所述用户云ERP服务需求数据。
在更具体的技术方案中,所述将所述用户云ERP服务需求数据作为实体插入到开放生态化云ERP异质图中,与用户、服务、服务商建立联系,据以更新所述云ERP异质图的步骤,包括:
根据用户与反馈之间的对应关系,将每个用户实体与其所述反馈信息所属的所述用户云ERP服务需求数据建立联系,根据反馈与服务之间的对应关系,将每个所述反馈信息所属的用户云ERP服务需求数据和对应的云ERP服务建立联系,据以获取ERP异质图更新关系数据;
根据所述ERP异质图更新关系数据更新所述云ERP异质图。
本发明及时获得用户的反馈并及时维护和升级云ERP服务。首先构建开放生态化云ERP异质图,该异质图由多个实体及其交互关系组成。然后,依托众包技术收集开放生态化云ERP平台使用方在交互及反馈等渠道留下的信息,这些信息从单个用户来看,可能会因为特殊喜好有一定偏差,但是如果收集了大量用户的反馈信息,就能抓住反馈信息中的主要矛盾。
在更具体的技术方案中,所述从所述云ERP异质图获取实体关系数据,根据所述实体关系数据获取并发出需求适配推荐信息至所述用户及所述服务商的步骤,还包括:
获取根据所述云ERP异质图中需求服务服务商关联数据将用户云ERP服务需求数据反馈给提供对应云ERP服务的服务商。
获取并根据所述云ERP异质图中用户需求关联数据,为客户提供正反馈ERP服务。
在更具体的技术方案中,一种基于开放生态化云ERP异质图用户需求精准发现系统,其特征在于,应用于需求数据精准挖掘,所述系统包括:
云ERP异质图构建模块,用以构建开放生态化云ERP异质图,获取用户数据、用户反馈数据、云ERP服务数据、云ERP服务商数据;
基准特征模块,用以利用众包技术采集并预处理反馈信息,据以建立词袋库、提取情感特征,处理所述词袋库和情感特征向量,所述基准特征模块连接所述云ERP异质图构建模块;
向量聚类模块,用以聚类处理情感特征向量,据以获取用户云ERP服务需求数据,所述向量聚类模块连接所述基准特征模块;
云ERP异质图更新模块,用以将所述用户云ERP服务需求数据作为实体插入到开放生态化云ERP异质图中,与用户、服务、服务商建立联系,据以更新所述云ERP异质图,云ERP异质图更新模块连接所述向量聚类模块;
推荐发送模块,用以从所述云ERP异质图获取实体关系数据,根据所述实体关系数据获取并发出需求适配推荐信息至所述用户及所述服务商,所述推荐发送模块连接所述云ERP异质图更新模块。
本发明相比现有技术具有以下优点:本发明构建开放生态化云ERP异质图,依托众包技术收集用户反馈,智能化处理云ERP平台用户反馈信息,并从中精准发现用户需求,根据需求新增实体间的联系,完善开放生态化云ERP异质图,作为云ERP平台服务适配需求的导向,做到在精准发现用户需求的同时,给用户提供更加适配需求的服务,本发明以针对企业领域服务的PaaS+SaaS一体化云ERP平台为背景,设计了基于众包模式和异质图的用户需求精准发现方法,实现数据驱动和知识引导的需求分析,基于用户业务需求的主动预测的目的,从海量用户反馈数据中精准发现用户实际需求,为平台需求更新提供数据基础和指导方向,本发明的异质图不仅能灵活建模开放生态化云ERP中多类型实体,还有实体之间复杂的交互关系。自然语言处理技术目前已经应用到垃圾邮件分类、QA、新闻分类等方面。大量实验证明,提取样本的情感特征加入自然语言处理的模型中对分类的有效性和准确性具有提升作用。本专利依托异质图对开放生态化云ERP进行建模,利用融合情感特征的语义分析技术,挖掘隐藏在用户反馈内容中的信息,实现用户需求精准发现,发明及时获得用户的反馈并及时维护和升级云ERP服务。首先构建开放生态化云ERP异质图,该异质图由多个实体及其交互关系组成。然后,依托众包技术收集开放生态化云ERP平台使用方在交互及反馈等渠道留下的信息,这些信息从单个用户来看,可能会因为特殊喜好有一定偏差,但是如果收集了大量用户的反馈信息,就能抓住反馈信息中的主要矛盾。解决了现有技术中存在的需求信息匹配性较差以及反馈信息参考价值较低的技术问题。
附图说明
图1为一种基于开放生态化云ERP异质图用户需求精准发现方法流程图;
图2为云ERP异质图结构示意图;
图3为开放生态云ERP异质图构建及实体数据获取步骤流程图;
图4为特征向量获取流程图;
图5为反馈信息聚类流程图;
图6为完善云ERP异质图流程图;
图7为适配需求提供流程图;
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例:
具体实施方案实现方法主要有以下几个步骤构成:
S1:构建开放生态化云ERP异质图,从云ERP平台的后台数据中获取用户数据、用户反馈数据、云ERP服务数据、云ERP服务商数据。
具体步骤如下:
如图3所示,S101:构建开放生态化云ERP异质图。
使用Uid唯一对应某位用户,用户实体用Useri表示,每位用户都会使用多个云ERP服务,也会提出多条反馈信息,针对每项云ERP服务Servicei,不同用户都有可能提出0至n条反馈信息。这些反馈信息不加入到异质图中,在后续的自然语言处理中将用户的反馈转化为对应的用户需求Needi,将它与用户及云ERP服务建立联系,据此构建关于用户-需求-服务-云ERP服务商的开放生态化云ERP异质图。
开放生态化云ERP平台上有多个云ERP的服务商Provideri,每个服务商都会提供一项或多项云ERP服务,据此构建异质图的服务商-服务部分,服务商与服务间的关系为一对多。
S102:在后台数据库中获取用户信息;
S103:在后台数据库中获取云ERP服务信息;
S104:在后台数据库中获取云ERP服务商信息;
S2:依托众包技术收集到的反馈信息,对其进行预处理,通过建立词袋库、提取情感特征等方式库获取特征向量。
如图4所示,步骤S2的具体步骤如下:
S201:对于每位使用过某项云ERP服务的用户,系统都会为其发送服务质量调查表,收集用户对该项服务的打分信息以及评论信息,以下统称反馈信息。这些信息从单个用户来看,可能会因为特殊喜好有一定偏差,但是如果收集了大量用户的反馈信息,就能抓住反馈信息中的主要矛盾,作为云ERP服务未来更新的导向。
S202:在后台数据库中获取用户反馈信息,方法如下:
①、以反馈的时间顺序作为索引信息,得到时间倒序排列的用户评论。ORDER BY‘time’DESC。
②、选择最近某段时间内的用户针对某项云ERP服务发布的反馈作为数据集,该数据集包括用户信息、反馈内容(打分、评论)、云ERP服务信息。
S203:获取每条评论的语法特征。
表1语法特征向量
Figure GDA0003910104200000081
每一条评论数据Ci的语法特征向量grai={xwc,xsc,xn,xv,xadj,xadv}。
其中,xwc表示评论的词数,相比于系统默认评论,具有实际意义的评论用词量会更多,且其中所使用到的名词、动词也会相应增多,可以通过这些标准判断该条评论数据Ci是否具有实际意义。而形容词和副词往往带有感情色彩,可以从侧面反映评论的实际意义以及是否需要尽快解决此相关问题。
S204:获取每条评论的情感特征,用于分析评论的正负反馈性质以及情感强烈程度,可以反映需求是否需要迫切解决的紧急程度。
表2情感特征向量
Figure GDA0003910104200000082
每一条评论数据Ci的情感特征向量emoi={xp,xs}。
xp的获取首先需要定义一个两极化词列表(例如:好、坏),对待处理评论提取情感词,计算情感倾向。对于用户反馈,一般默认“好”作为正反馈的代表,但是若是提出改进的建议,往往评论中并不会明确出现“不好”、“坏”等字样。可以通过对正反馈词列表取反,未出现正反馈词的评论数据可通过实意词密度来体现。对于一个评论,它的长度超出平均值越多,它就越可能作为负面反馈。对数函数的底数为max(grai,)-mean(grai,)保证结果落于[-1,0]区间。
Figure GDA0003910104200000091
xs的获取可以通过构建情感极性词典,根据词性、极性、程度等因素进行加权求和。S203:获取每条评论的TF-IDF内容特征,用于分析评论间的相关性。
Figure GDA0003910104200000092
TF用于衡量单词在全文中出现的频率,而停顿词的出现频率很高,故需要通过逆文档频率IDF来解决词语权重问题:
Figure GDA0003910104200000093
其中分子为数据集中文件总数,分母为包含该词语的文件数。如果一个词越常见,那么分母就越大,取对数后逆向文件频率就越小越接近0。
每一条评论数据Ci的内容特征向量coni={TFi,×IDFi}。
S3:余弦相似度应用到短文本分类,在时间效率和性能效率上都有着出色的表现。S2中我们已经获取了数据集中每条评论的语法特征向量、情感特征向量和内容特征向量,通过多维空间的余弦定理计算两个向量间的夹角的余弦值,以此为标准对数据集进行分类。如图5所示,具体步骤如下:
S301:首先获取某项云ERP服务下所有反馈信息的特征向量,它们的集合用Uj表示。选取基线向量,对于用户反馈系统,我们就以系统默认评论作为基准,如“用户默认给出好评。“计算此评论所对应的语法特征向量gra0,情感特征向量emo0,以及内容特征向量con0
S302:将S2中每条评论数据Ci的三类特征向量分别与S301中的基线特征向量进行求余弦运算,记为Ci在三个特征维度上的得分。公式如下所示:
Figure GDA0003910104200000094
Figure GDA0003910104200000095
Figure GDA0003910104200000096
其中,SCgrai和SCconi的取值均在[0,1]区间,SCemoi的取值在[-1,1]之间。
S303:通过三个维度上的得分数据对每条评论数据Ci分类,这就将问题转化为三维长方体空间内点的聚类问题。由于语法特征和内容特征向量的各维度均为正,故它们的余弦值保持在[0,1]范围内,而情感特征的第一个维度可能取负值,故它的余弦值范围在[-1,1]内。这样设计的作用是突出了情感特征,特别是用户评论的反馈性质——即正反馈还是负反馈——在对后续分类方法中影响的权重。对此三维空间中的各样本点使用聚类算法,得到各个样本点所属的类别,离群点单独成类。
S304:通过公式(4)计算某类相似评论的频度:
Figure GDA0003910104200000101
其中,Need为S3中对Ci划分的类,Ci∈Needj表示样本i所属第j类,对该集合求其大小即可得出此类在整个分类中所占权重。
S305:输出满足公式(5)的评论Ci
Figure GDA0003910104200000102
其中参数ε和α均为接近0的参数,具体数据通过模型预测的准确度情况在一定区间浮动。
S306:根据属于同一云ERP服务Servicei中每条反馈信息中较大的几个聚类,将其作为用户对此服务提出的需求Needj,需求信息包括:1)用户对服务的某个方面的标签,如:价格、质量等;2)用户对该方面的态度,两个极性,如价格的高低、质量的好坏。
S4:将S3中获取到的用户需求作为实体插入到开放生态化云ERP异质图中,与用户、服务、服务商建立联系,完善云ERP异质图。如图6所示,具体步骤如下:
S401:根据用户-反馈之间的对应关系,将每个用户Useri与其反馈所属的需求集合Needj建立联系,每个用户对应的需求可以是0个到n个。
S402:根据反馈-服务之间的对应关系,将每个反馈所属的需求集合Needj和对应的云ERP服务建立联系,每个服务对应的需求可以是0个到n个方面,通过聚类的大小可以为需求划分优先关系排序。
S5:根据S4中实体间的关系,可以将用户需求提交给对应服务商,作为该服务商对提供的服务未来更新的导向,也可以为具有某一需求的用户提供具有相似功能的云ERP服务,做到在精准发现用户需求的同时,给用户提供更加适配需求的服务。
如图7所示,S501:根据异质图中需求-服务-服务商部分,将需求Needi反馈给提供对应云ERP服务的服务商Providerj
S502:根据异质图中用户-需求部分,为具有某种需求但其评论为负反馈的用户Useri提供属于同类需求但正反馈较多的类似云ERP服务Servicej
综上,本发明构建开放生态化云ERP异质图,依托众包技术收集用户反馈,智能化处理云ERP平台用户反馈信息,并从中精准发现用户需求,根据需求新增实体间的联系,完善开放生态化云ERP异质图,作为云ERP平台服务适配需求的导向,做到在精准发现用户需求的同时,给用户提供更加适配需求的服务,本发明以针对企业领域服务的PaaS+SaaS一体化云ERP平台为背景,设计了基于众包模式和异质图的用户需求精准发现方法,实现数据驱动和知识引导的需求分析,基于用户业务需求的主动预测的目的,从海量用户反馈数据中精准发现用户实际需求,为平台需求更新提供数据基础和指导方向,本发明的异质图不仅能灵活建模多类型实体,还有实体之间的关系。自然语言处理技术目前已经应用到垃圾邮件分类、QA、新闻分类等方面。大量实验证明,提取样本的情感特征加入自然语言处理的模型中对分类的有效性和准确性具有提升作用。本专利依托异质图对开放生态化云ERP进行建模,利用融合情感特征的语义分析技术,挖掘隐藏在用户反馈内容中的信息,实现用户需求精准发现,发明及时获得用户的反馈并及时维护和升级云ERP服务。首先构建开放生态化云ERP异质图,该异质图由几个实体及其交互关系组成。然后,依托众包技术收集开放生态化云ERP平台使用方在交互及反馈等渠道留下的信息,这些信息从单个用户来看,可能会因为特殊喜好有一定偏差,但是如果收集了大量用户的反馈信息,就能抓住反馈信息中的主要矛盾。解决了现有技术中存在的需求信息匹配性较差以及反馈信息参考价值较低的技术问题。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种基于开放生态化云ERP异质图用户需求精准发现方法,其特征在于,应用于需求数据精准挖掘,所述方法包括:
构建开放生态化云ERP异质图,获取用户数据、用户反馈数据、云ERP服务数据、云ERP服务商数据;
利用众包技术采集并预处理服务对象调查表中的用户对服务的打分及评论信息,据以建立词袋库,提取语法特征、情感特征、内容特征,处理所述词袋库和所述语法特征、所述情感特征、所述内容特征,以得到语法特征向量、情感特征向量、内容特征向量;
聚类处理所述语法特征向量、所述情感特征向量、所述内容特征向量,据以获取用户云ERP服务需求数据;
将所述用户云ERP服务需求数据作为实体插入到开放生态化云ERP异质图中,与用户、服务、服务商建立联系,据以更新所述云ERP异质图;
从所述云ERP异质图获取实体关系数据,根据所述实体关系数据获取并发出需求适配推荐信息至所述用户及所述服务商。
2.根据权利要求1所述的一种基于开放生态化云ERP异质图用户需求精准发现方法,其特征在于,所述构建开放生态化云ERP异质图,获取用户数据、用户反馈数据、云ERP服务数据、云ERP服务商数据的步骤,包括:
获取实体关联数据;
构建所述开放生态化云ERP异质图:
从后台数据库中获取所述用户数据、所述用户反馈数据、所述云ERP服务数据、所述云ERP服务商数据,据以获取基线特征向量。
3.根据权利要求2所述的一种基于开放生态化云ERP异质图用户需求精准发现方法,其特征在于,所述利用众包技术采集并预处理服务对象调查表中的用户对服务的打分及评论信息,据以建立词袋库、提取语法特征、情感特征、内容特征,处理所述词袋库和所述语法特征、所述情感特征、所述内容特征,以得到所述语法特征向量、所述情感特征向量、所述内容特征向量的步骤,包括:
利用所述服务对象调查表采集并存储所述用户对服务的打分及评论信息至后台数据库;
从所述后台数据库提取用户实体的所述用户对服务的打分及评论信息;
以所述用户实体的用户信息、所述用户对服务的打分及评论信息及ERP服务信息生成反馈数据集;
获取所述用户对服务的打分及评论信息中的语法特征数据,据以生成所述语法特征向量;
获取用户对服务的打分及评论信息中的内容特征数据,据以生成所述内容特征向量;
获取所述用户对服务的打分及评论信息中的情感特征数据,据以生成所述情感特征向量。
4.根据权利要求3所述的一种基于开放生态化云ERP异质图用户需求精准发现方法,其特征在于,获取所述用户对服务的打分及评论信息中的语法特征数据,据以生成语法特征向量,包括:
从所述反馈信息中获取评论数据;
获取每一所述评论数据的语法词汇特征,据以生成所述语法特征向量。
5.根据权利要求3所述的一种基于开放生态化云ERP异质图用户需求精准发现方法,其特征在于,所述根据内容特征数据生成内容特征向量的步骤,包括:
根据下述逻辑获取所述反馈信息中的词频内容特征:
Figure FDA0003910104190000021
根据下述逻辑获取所述反馈信息中的权重特征:
Figure FDA0003910104190000022
根据所述反馈信息中的每一条评论数据Ci的所述词频内容特征及所述权重特征获取所述评论数据Ci的所述内容特征向量coni={TFi,j×IDFi}。
6.根据权利要求3所述的一种基于开放生态化云ERP异质图用户需求精准发现方法,其特征在于,所述获取所述反馈信息中的情感特征数据,据以生成情感特征向量的步骤,包括:
从所述情感特征数据中获取反馈性质数据和观点情感数据;
获取所述反馈信息中的情感特征数据,根据下述逻辑处理所述反馈性质数据和所述观点情感数据,生成情感特征向量:
Figure FDA0003910104190000023
7.根据权利要求1所述的一种基于开放生态化云ERP异质图用户需求精准发现方法,其特征在于,聚类处理所述语法特征向量、所述情感特征向量、所述内容特征向量,据以获取用户云ERP服务需求数据的步骤,包括:
获取一项云ERP服务下所有所述反馈信息的特征向量;
根据下述逻辑将所述反馈信息中的评论数据的语法特征向量、内容特征向量及情感特征向量分别与基线特征向量进行求余弦运算,记为所述评论数据Ci在三个特征维度上的多特征维度得分数据:
Figure FDA0003910104190000031
Figure FDA0003910104190000032
Figure FDA0003910104190000033
根据所述多特征维度得分数据类聚处理每一所述评论数据,据以获取评论相似类数据;
根据下述逻辑处理所述评论类相似数据,据以得到相似类评论权重数据:
Figure FDA0003910104190000034
其中,Need为对所述评论数据Ci划分的类,Ci∈Needj表示样本i所属第j类,对该集合求其大小即可得出此类在整个分类中所占权重;
以下述逻辑根据所述多特征维度得分数据筛选处理所述评论数据Ci,据以得到聚类需求数据:
Figure FDA0003910104190000035
其中参数ε和α均为接近0的参数;
根据所述聚类需求数据获取所述用户云ERP服务需求数据。
8.根据权利要求1所述的一种基于开放生态化云ERP异质图用户需求精准发现方法,其特征在于,所述将所述用户云ERP服务需求数据作为实体插入到开放生态化云ERP异质图中,与用户、服务、服务商建立联系,据以更新所述云ERP异质图的步骤,包括:
根据用户与反馈之间的对应关系,将每个用户实体与其所述反馈信息所属的所述用户云ERP服务需求数据建立联系,根据反馈与服务之间的对应关系,将每个所述反馈信息所属的用户云ERP服务需求数据和对应的云ERP服务建立联系,据以获取ERP异质图更新关系数据;
根据所述ERP异质图更新关系数据更新所述云ERP异质图。
9.根据权利要求7所述的一种基于开放生态化云ERP异质图用户需求精准发现方法,其特征在于,所述从所述云ERP异质图获取实体关系数据,根据所述实体关系数据获取并发出需求适配推荐信息至所述用户及所述服务商的步骤,还包括:
获取根据所述云ERP异质图中需求-服务-服务商关联数据将用户云ERP服务需求数据反馈给提供对应云ERP服务的服务商,获取并根据所述云ERP异质图中用户需求关联数据,为客户提供正反馈ERP服务。
10.一种基于开放生态化云ERP异质图用户需求精准发现系统,其特征在于,应用于需求数据精准挖掘,所述系统包括:
云ERP异质图构建模块,用以构建开放生态化云ERP异质图,获取用户数据、用户反馈数据、云ERP服务数据、云ERP服务商数据;
基准特征模块,用以利用众包技术采集并预处理服务对象调查表中的用户对服务的打分及评论信息,据以建立词袋库,提取语法特征、情感特征、内容特征,处理所述词袋库和所述语法特征、所述情感特征、所述内容特征,以得到语法特征向量、情感特征向量、内容特征向量,所述基准特征模块连接所述云ERP异质图构建模块;
向量聚类模块,用以聚类处理所述语法特征向量、所述情感特征向量、所述内容特征向量,据以获取用户云ERP服务需求数据,所述向量聚类模块连接所述基准特征模块;
云ERP异质图更新模块,用以将所述用户云ERP服务需求数据作为实体插入到开放生态化云ERP异质图中,与用户、服务、服务商建立联系,据以更新所述云ERP异质图,云ERP异质图更新模块连接所述向量聚类模块;
推荐发送模块,用以从所述云ERP异质图获取实体关系数据,根据所述实体关系数据获取并发出需求适配推荐信息至所述用户及所述服务商,所述推荐发送模块连接所述云ERP异质图更新模块。
CN202210095467.3A 2022-01-26 2022-01-26 基于开放生态化云erp异质图用户需求精准发现方法及系统 Active CN114445043B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210095467.3A CN114445043B (zh) 2022-01-26 2022-01-26 基于开放生态化云erp异质图用户需求精准发现方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210095467.3A CN114445043B (zh) 2022-01-26 2022-01-26 基于开放生态化云erp异质图用户需求精准发现方法及系统

Publications (2)

Publication Number Publication Date
CN114445043A CN114445043A (zh) 2022-05-06
CN114445043B true CN114445043B (zh) 2022-12-16

Family

ID=81368918

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210095467.3A Active CN114445043B (zh) 2022-01-26 2022-01-26 基于开放生态化云erp异质图用户需求精准发现方法及系统

Country Status (1)

Country Link
CN (1) CN114445043B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113345590B (zh) * 2021-06-29 2022-12-16 安徽大学 一种基于异质图的用户心理健康监测方法及系统

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109165996B (zh) * 2018-07-18 2022-02-11 浙江大学 基于在线用户评论的产品功能特征重要性分析方法
WO2020076179A1 (ru) * 2018-10-11 2020-04-16 Общество С Ограниченной Ответственностью "Глобус Медиа" Способ определения тегов для отелей и устройство для его осуществления
CN111291255A (zh) * 2018-12-10 2020-06-16 Tcl集团股份有限公司 基于用户情感信息的资源推荐方法、智能设备及存储介质
CN110942337A (zh) * 2019-10-31 2020-03-31 天津中科智能识别产业技术研究院有限公司 一种基于互联网大数据的精准旅游营销方法
CN112508256B (zh) * 2020-12-01 2023-04-14 安徽大学 一种基于众包的用户需求主动预测方法及系统
CN112883170B (zh) * 2021-01-20 2023-08-18 中国人民大学 一种用户反馈引导的自适应对话推荐方法和系统
CN113158023B (zh) * 2021-02-05 2023-03-21 杭州码全信息科技有限公司 基于混合推荐算法的公共数字生活精准分类服务方法
CN113190212B (zh) * 2021-04-26 2024-04-19 深圳易伙科技有限责任公司 一种驱动开放生态化云erp的领域需求建模方法和装置
CN113345590B (zh) * 2021-06-29 2022-12-16 安徽大学 一种基于异质图的用户心理健康监测方法及系统
CN113343712A (zh) * 2021-06-29 2021-09-03 安徽大学 一种基于异质图的社交文本情感倾向分析方法及系统

Also Published As

Publication number Publication date
CN114445043A (zh) 2022-05-06

Similar Documents

Publication Publication Date Title
US11093854B2 (en) Emoji recommendation method and device thereof
Pandarachalil et al. Twitter sentiment analysis for large-scale data: an unsupervised approach
Younis Sentiment analysis and text mining for social media microblogs using open source tools: an empirical study
CA2865186C (en) Method and system relating to sentiment analysis of electronic content
CN110909165B (zh) 数据处理方法、装置、介质及电子设备
Stein et al. Intrinsic plagiarism analysis
US8862591B2 (en) System and method for evaluating sentiment
Ma et al. Finding users preferences from large-scale online reviews for personalized recommendation
US11468342B2 (en) Systems and methods for generating and using knowledge graphs
Chen et al. Mining user requirements to facilitate mobile app quality upgrades with big data
US20100079464A1 (en) Information processing apparatus capable of easily generating graph for comparing of a plurality of commercial products
Perdana et al. Combining likes-retweet analysis and naive bayes classifier within twitter for sentiment analysis
CN108885623A (zh) 基于知识图谱的语意分析系统及方法
US10002187B2 (en) Method and system for performing topic creation for social data
Li et al. A policy-based process mining framework: mining business policy texts for discovering process models
Yang et al. Leveraging semantic features for recommendation: Sentence-level emotion analysis
WO2023129339A1 (en) Extracting and classifying entities from digital content items
CN114445043B (zh) 基于开放生态化云erp异质图用户需求精准发现方法及系统
Saleiro et al. TexRep: A text mining framework for online reputation monitoring
Wei et al. Online education recommendation model based on user behavior data analysis
Dritsas et al. Pre-processing framework for twitter sentiment classification
CN111930949B (zh) 搜索串处理方法、装置、计算机可读介质及电子设备
CN111737607B (zh) 数据处理方法、装置、电子设备以及存储介质
CN110727842B (zh) 基于辅助性知识的Web服务开发者按需推荐方法及系统
Abdi et al. Using an auxiliary dataset to improve emotion estimation in users’ opinions

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant