CN112163093B - 基于特征值的电力居民app多题型问卷得分分类方法 - Google Patents

基于特征值的电力居民app多题型问卷得分分类方法 Download PDF

Info

Publication number
CN112163093B
CN112163093B CN202011090115.6A CN202011090115A CN112163093B CN 112163093 B CN112163093 B CN 112163093B CN 202011090115 A CN202011090115 A CN 202011090115A CN 112163093 B CN112163093 B CN 112163093B
Authority
CN
China
Prior art keywords
same
user
users
question
answers
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011090115.6A
Other languages
English (en)
Other versions
CN112163093A (zh
Inventor
章坚民
黄江
薛禹胜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Dianzi University
Nari Technology Co Ltd
Original Assignee
Hangzhou Dianzi University
Nari Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Dianzi University, Nari Technology Co Ltd filed Critical Hangzhou Dianzi University
Priority to CN202011090115.6A priority Critical patent/CN112163093B/zh
Publication of CN112163093A publication Critical patent/CN112163093A/zh
Application granted granted Critical
Publication of CN112163093B publication Critical patent/CN112163093B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Finance (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Marketing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Game Theory and Decision Science (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Primary Health Care (AREA)
  • Tourism & Hospitality (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于特征值的电力居民APP多题型问卷得分分类方法,本发明获取多个用户数据样本,为每个参考用户数据样本分配分类标签并提取特征值;对分类标签和特征值进行归一化处理并转化为统一格式,获得训练数据;配置分类器训练参数;利用训练数据对分类器进行训练,训练中不断优化训练参数,直到分类器输出精度达到预设精度后,输出模型文件,完成分类器建立。用户数据分类器建立快速、运算量少,训练数据中对分类标签和特征值进行归一化处理并转化为统一格式,有利于提高分类器的训练速度。快速对用户数据进行分类并输出分类标签,便于处理人员选择用户数据做进一步分析,减少了工作量。

Description

基于特征值的电力居民APP多题型问卷得分分类方法
技术领域
本发明属于网络APP用户调查系统的数据分析和挖掘技术领域,具体涉及面向用户侧能源转型的网络APP用户调查系统中单选、多选、排序、五分制打分的问卷数学模型,更进一步涉及单选、多选、排序、五分制问卷基于特征值的得分严格分类方法,从而为进一步分析用户答卷得分分布与用户的特性的关联关系提供条件。
背景技术
通过网络APP用户调查系统来获取用户对设计问卷的应答,从而对应答数据进行分析,挖掘用户对某政策、市场营销、产品功能、产品满意度等响应度,或对某一产品的消费行为特性;政府和相关企业在制度能源政策以及供能价格时,也可通过网络APP用户调查系统来获取用户的消费特性,以便政府和相关企业制定更为科学的政策和供能策略。
发明内容
本发明针对现有技术的不足,提出了一种基于特征值的电力居民APP多题型问卷得分分类方法;主要针对单选、多选、排序、五分制打分问卷的用户答案,给出严格分类方法,以获取用户答案的分布。
一种基于特征值的多题型问卷得分分类方法,该方法具体包括以下步骤:
步骤一、针对多选题问卷:
1.建立多选题的数学模型:
假设第j多选题有Kj个选项,某用户i的应答表示为:
Figure BDA0002721835740000011
则显然形成一个长度为Kj的01序列Xi,j;其中Xi,j表示第i个用户在第j个选择题的答案;xi,j,k表示第k个选项的值;
步骤2.对于Xi,j,按2进制计算得到其特征值σDX(Xi,j):
Figure BDA0002721835740000021
步骤3.判断多个用户的答案是否一样
若不同用户在同一题目的特征值是相同的,则他们的多选题答案是一样的。
步骤4.用户答案统计
通过以上步骤,可以得到该多选题,有多少种答案,且每个答案有多少用户,从而得到用户选择的严格分类。
步骤二、针对排序题问卷,具体包括以下步骤:
步骤1.建立排序题的数学模型:
假设第j排序题有Kj个排序选项,其对应的题目抽象为Kj个符号Ω(Kj),则某用户i的应答表示为:
Figure BDA0002721835740000022
则显然形成一个长度为Kj的Ω(Kj)符号序列Xi,j
步骤2.按Kj进制计算得到其特征值σPX(Xi,j):
Figure BDA0002721835740000023
步骤3.判断2个用户的答案是否一样
若2个用户在同一题目的特征值是相同的,则他们的排序题答案是一样的。
步骤4.用户答案统计
通过以上步骤,得到该排序题,有多少种答案,且每个答案有多少用户,从而得到用户选择的严格分类。
步骤三、针对打分题问卷,该方法包括以下步骤:
步骤1.建立打分题的数学模型:
假设第M分制打分题有Kj个打分选项,其对应的题目抽象为M个符号Ω(M),则某用户i的应答表示为:
Figure BDA0002721835740000024
则显然形成一个长度为Kj的Ω(Kj)符号序列Xi,j
步骤2.按M进制计算得到其特征值:
Figure BDA0002721835740000031
步骤3.判断2个用户的答案是否一样
若两个用户的M分制打分题答案是一样的,则他们在这个题目上具有相同的特征值。因此通过该特征值计算,则得到相同的特征值,也就是若某一个M分制打分题特征值相同的用户具有完全一样的选择,即采取该方法,得到用户选择的严格分类。
步骤4.用户答案统计
通过以上步骤,得到该打分题,有多少种答案,且每个答案有多少用户,从而得到用户选择的严格分类。
本发明相对于现有技术具有的效果:本发明公开了一种基于特征值的多题型问卷得分分类方法。分类器建立方法包括:获取多个用户数据样本,为每个参考用户数据样本分配分类标签并提取特征值;对分类标签和特征值进行归一化处理并转化为统一格式,获得训练数据;配置分类器训练参数;利用训练数据对分类器进行训练,训练中不断优化训练参数,直到分类器输出精度达到预设精度后,输出模型文件,完成分类器建立。用户数据分类器建立快速、运算量少,训练数据中对分类标签和特征值进行归一化处理并转化为统一格式,有利于提高分类器的训练速度。快速对用户数据进行分类并输出分类标签,便于处理人员选择用户数据做进一步分析,减少了工作量。
具体实施方式
一种基于特征值的电力居民APP多题型问卷得分分类方法,该方法具体包括以下步骤:
步骤一、针对多选题问卷:
1.建立多选题的数学模型:
假设第j多选题有Kj个选项,某用户i的应答表示为:
Figure BDA0002721835740000032
则显然形成一个长度为Kj的01序列Xi,j;其中Xi,j表示第i个用户在第j个选择题的答案;xi,j,k表示第k个选项的值;
举例说,第三道多选题有4个选项,用户5答案为AD,则该用户的序列为X5,3=[1,0,0,1]。
步骤2.对于Xi,j,按2进制计算得到其特征值:
Figure BDA0002721835740000041
则上述例子中的用户特征值为
Figure BDA0002721835740000042
步骤3.判断2个用户的答案是否一样
若2个用户在同一题目的特征值是相同的,则他们的多选题答案是一样的。
步骤4.用户答案统计
通过以上步骤,可以得到该多选题,有多少种答案,且每个答案有多少用户,从而得到用户选择的严格分类。
二、针对排序题问卷,本发明方法包括以下步骤:
步骤1.建立排序题的数学模型:
假设第j排序题有Kj个排序选项,其对应的题目抽象为Kj个符号
Ω(Kj),则某用户i的应答可以表示为:
Figure BDA0002721835740000043
则显然形成一个长度为Kj的Ω(Kj)符号序列Xi,j
举例说,第一道排序题有5个排序选项,用户3的答案为ABCDE,则可表示为
X3,1=[x3,1,1,....,x3,1,5]
步骤2.按Kj进制计算得到其特征值:
Figure BDA0002721835740000044
上述例子中用户的特征值为
Figure BDA0002721835740000045
步骤3.判断2个用户的答案是否一样
若2个用户在同一题目的特征值是相同的,则他们的排序题答案是一样的。
步骤4.用户答案统计
通过以上步骤,可以得到该排序题,有多少种答案,且每个答案有多少用户,从而得到用户选择的严格分类。
三、针对打分题问卷,本发明方法包括以下步骤:
步骤1.建立打分题的数学模型:
假设第j5分制打分题有Kj个打分选项,其对应的题目抽象为5个符号Ω(5),则某用户i的应答可以表示为:
Figure BDA0002721835740000051
则显然形成一个长度为Kj的Ω(Kj)符号序列Xi,j
举例说,第一道打分题有三个打分选项,用户6的答案为ABC,则他的符号序列为X6,1=[x6,1,1,x6,1,2,x6,1,3]
步骤2.按5进制计算得到其特征值:
Figure BDA0002721835740000052
上述例子中的用户特征值为
Figure BDA0002721835740000053
步骤3.判断2个用户的答案是否一样
若两个用户的5分制打分题答案是一样的,则他们在这个题目上具有相同的特征值。因此通过该特征值计算,则可以得到相同的特征值,也就是若某一个5分制打分题特征值相同的用户具有完全一样的选择,即采取该方法,可得到用户选择的严格分类。
步骤4.用户答案统计
通过以上步骤,可以得到该打分题,有多少种答案,且每个答案有多少用户,从而得到用户选择的严格分类。

Claims (1)

1.基于特征值的电力居民APP多题型问卷得分分类方法,其特征在于,该方法具体包括以下步骤:
步骤一、针对多选题问卷:
1.建立多选题的数学模型:
假设第j多选题有Kj个选项,某用户i的应答表示为:
Figure FDA0003353847800000011
则显然形成一个长度为Kj的01序列Xi,j;其中Xi,j表示第i个用户在第j个选择题的答案;xi,j,k表示第k个选项的值;
步骤2.对于Xi,j,按2进制计算得到其特征值σDX(Xi,j):
Figure FDA0003353847800000012
步骤3.判断多个用户的答案是否一样
若不同用户在同一题目的特征值是相同的,则他们的多选题答案是一样的;
步骤4.用户答案统计
通过以上步骤,可以得到该多选题,有多少种答案,且每个答案有多少用户,从而得到用户选择的严格分类;
步骤二、针对排序题问卷,具体包括以下步骤:
步骤1.建立排序题的数学模型:
假设第j排序题有Kj个排序选项,其对应的题目抽象为Kj个符号Ω(Kj),则某用户i的应答表示为:
Figure FDA0003353847800000013
则显然形成一个长度为Kj的Ω(Kj)符号序列Xi,j
步骤2.按Kj进制计算得到其特征值σPX(Xi,j):
Figure FDA0003353847800000021
步骤3.判断2个用户的答案是否一样;
若2个用户在同一题目的特征值是相同的,则他们的排序题答案是一样的;
步骤4.用户答案统计
通过以上步骤,得到该排序题,有多少种答案,且每个答案有多少用户,从而得到用户选择的严格分类;
步骤三、针对打分题问卷,该方法包括以下步骤:
步骤1.建立打分题的数学模型:
假设第M分制打分题有Kj个打分选项,其对应的题目抽象为Kj个符号Ω(M),则某用户i的应答表示为:
Figure FDA0003353847800000022
则显然形成一个长度为Kj的Ω(M)符号序列Xi,j
步骤2.按M进制计算得到其特征值:
Figure FDA0003353847800000023
步骤3.判断2个用户的答案是否一样;
若两个用户的M分制打分题答案是一样的,则他们在这个题目上具有相同的特征值;因此通过该特征值计算,则得到相同的特征值,也就是若某一个M分制打分题特征值相同的用户具有完全一样的选择,即采取该方法,得到用户选择的严格分类;
步骤4.用户答案统计
通过以上步骤,得到该打分题,有多少种答案,且每个答案有多少用户,从而得到用户选择的严格分类。
CN202011090115.6A 2020-10-13 2020-10-13 基于特征值的电力居民app多题型问卷得分分类方法 Active CN112163093B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011090115.6A CN112163093B (zh) 2020-10-13 2020-10-13 基于特征值的电力居民app多题型问卷得分分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011090115.6A CN112163093B (zh) 2020-10-13 2020-10-13 基于特征值的电力居民app多题型问卷得分分类方法

Publications (2)

Publication Number Publication Date
CN112163093A CN112163093A (zh) 2021-01-01
CN112163093B true CN112163093B (zh) 2022-04-12

Family

ID=73866672

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011090115.6A Active CN112163093B (zh) 2020-10-13 2020-10-13 基于特征值的电力居民app多题型问卷得分分类方法

Country Status (1)

Country Link
CN (1) CN112163093B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112767916B (zh) * 2021-02-05 2024-03-01 百度在线网络技术(北京)有限公司 智能语音设备的语音交互方法、装置、设备、介质及产品
CN114926060A (zh) * 2022-05-31 2022-08-19 杭州电子科技大学 一种针对网络调查问卷的被调查者满意度结果分析方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109446483A (zh) * 2018-09-30 2019-03-08 大连海事大学 一种用于包含主观信息的客观题的机器判卷方法
CN110348400A (zh) * 2019-07-15 2019-10-18 京东方科技集团股份有限公司 一种评分获取方法、装置及电子设备

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8086483B1 (en) * 2008-10-07 2011-12-27 Accenture Global Services Limited Analysis and normalization of questionnaires
US20120278336A1 (en) * 2011-04-29 2012-11-01 Malik Hassan H Representing information from documents
CN107391713B (zh) * 2017-07-29 2020-04-28 内蒙古工业大学 一种解决协同过滤推荐技术中冷启动问题的方法及系统
CN107977637B (zh) * 2017-12-11 2021-09-28 上海启思教育科技服务有限公司 一种多题型的智能阅卷系统
CN111324692B (zh) * 2020-01-16 2020-12-22 深圳市芥菜种科技有限公司 基于人工智能的主观题自动评分方法和装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109446483A (zh) * 2018-09-30 2019-03-08 大连海事大学 一种用于包含主观信息的客观题的机器判卷方法
CN110348400A (zh) * 2019-07-15 2019-10-18 京东方科技集团股份有限公司 一种评分获取方法、装置及电子设备

Also Published As

Publication number Publication date
CN112163093A (zh) 2021-01-01

Similar Documents

Publication Publication Date Title
CN108182489B (zh) 一种基于在线学习行为分析的个性化学习推荐方法
CN109189901B (zh) 一种智能客服系统中自动发现新分类以及对应语料的方法
CN103399891B (zh) 网络内容自动推荐方法、装置和系统
CN112163093B (zh) 基于特征值的电力居民app多题型问卷得分分类方法
CN109871439B (zh) 一种基于深度学习的问答社区问题路由方法
CN107766371A (zh) 一种文本信息分类方法及其装置
CN106105096A (zh) 用于连续社交通信的系统和方法
CN111125574A (zh) 用于生成信息的方法和装置
CN103020712B (zh) 一种海量微博数据的分布式分类装置及方法
CN109492226B (zh) 一种提高情感倾向占比低文本预断准确率的方法
CN110489649A (zh) 标签关联内容的方法及装置
CN115396389A (zh) 一种基于情绪能量感知的物联网信息技术客服服务系统
CN111179055A (zh) 授信额度调整方法、装置和电子设备
CN116226769A (zh) 一种基于用户行为序列的短视频异常行为识别方法
CN117436679A (zh) 一种元宇宙资源匹配方法及其系统
Gyódi et al. Informing policy with text mining: technological change and social challenges
CN112734142B (zh) 基于深度学习的资源学习路径规划方法及装置
CN109951859B (zh) 无线网络连接推荐方法、装置、电子设备及可读介质
CN111583363A (zh) 一种图文新闻的视觉自动生成方法及系统
Heys Machine learning as a tool to identify critical assignments
Yin et al. The oire method-overview and initial validation
Bratawisnu et al. Association perception customer feedback with text network analysis in social media (case study on internet banking BRI, BCA, Mandiri in Indonesia)
CN112950351A (zh) 用户策略生成方法、装置及电子设备
CN111967251A (zh) 客户声音智慧洞察系统
Frolov et al. Pre-processing of data on the behavior of users of the Moscow Electronic School service

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant