CN114201574A - 一种调查问卷的分析方法、设备、芯片及存储介质 - Google Patents
一种调查问卷的分析方法、设备、芯片及存储介质 Download PDFInfo
- Publication number
- CN114201574A CN114201574A CN202111404680.XA CN202111404680A CN114201574A CN 114201574 A CN114201574 A CN 114201574A CN 202111404680 A CN202111404680 A CN 202111404680A CN 114201574 A CN114201574 A CN 114201574A
- Authority
- CN
- China
- Prior art keywords
- questionnaire
- question
- topic
- questions
- list
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Data Mining & Analysis (AREA)
- Strategic Management (AREA)
- Accounting & Taxation (AREA)
- General Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Human Computer Interaction (AREA)
- Game Theory and Decision Science (AREA)
- Economics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Software Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请实施例公开了一种调查问卷的分析方法、设备、芯片及存储介质,其中,所述方法包括:从索引数据库中查找与目标问卷题目相匹配的问卷题目,得到第一问卷题目列表;对所述第一问卷题目列表中的各个问卷题目进行标准化处理,得到第二问卷题目列表;对所述第二问卷题目列表中的至少部分问卷题目进行时序分析,得到分析结果。
Description
技术领域
本申请涉及问卷分析领域,尤其涉及一种调查问卷的分析方法、设备、芯片及存储介质。
背景技术
近年来,每年都会开展面向全国范围的问卷调查活动,一般是单选、多选或者打分题,这种调查问卷题目,其中好多都是历年重复出现,但因为每年社会热点都不一样,所以每年也会不断设置新的调查问题。在问卷调查结果数据分析过程中,有一种重要分析方法叫时序分析法。其实现原理是,根据选定的某个问卷题目,按指定的时间维度去分析调查受众对该题目的答题样本数据分布情况。但是,从历史数据上发现,同样的问卷题目并没有做到文字上的完全一致,并且也没有对问卷题目进行统一编号管理。所以,想要实现时序分析,必须依赖人工来进行数据整理和调整,不但工作量大,耗时长,效率低,而且还特别容易出错,最终导致时序分析结果不精确。
发明内容
为解决上述技术问题,本申请实施例提供了一种调查问卷的分析方法、设备、芯片及存储介质。
本申请实施例的技术方案是这样实现的:
本申请实施例提供了一种调查问卷的分析方法,包括:
从索引数据库中查找与目标问卷题目相匹配的问卷题目,得到第一问卷题目列表;
对所述第一问卷题目列表中的各个问卷题目进行标准化处理,得到第二问卷题目列表;
对所述第二问卷题目列表中的至少部分问卷题目进行时序分析,得到分析结果。
本申请实施例提供一种调查问卷的分析工具,包括:
查找单元,用于从索引数据库中查找与目标问卷题目相匹配的问卷题目,得到第一问卷题目列表;
标准化处理单元,用于对所述第一问卷题目列表中的各个问卷题目进行标准化处理,得到第二问卷题目列表;
分析单元,用于对所述第二问卷题目列表中的至少部分问卷题目进行时序分析,得到分析结果。
本申请提供一种电子设备,包括:处理器和存储器,该存储器用于存储计算机程序,所述处理器用于调用并运行所述存储器中存储的计算机程序,执行上述调查问卷的分析方法。
本申请提供一种芯片,包括:处理器,用于从存储器中调用并运行计算机程序,使得安装有所述芯片的设备执行上述任意调查问卷的分析方法。
本申请提供一种计算机可读存储介质,用于存储计算机程序,所述计算机程序使得计算机执行上述调查问卷的分析方法。
本申请实施例的技术方案,通过从索引数据库中查找与目标问卷题目相匹配的问卷题目,得到第一问卷题目列表,对所述第一问卷题目列表中的各个问卷题目进行标准化处理,得到第二问卷题目列表,对所述第二问卷题目列表中的至少部分问卷题目进行时序分析,得到分析结果。利用了索引数据库和标准化处理手段,对历史数据自动进行识别与标注,大大减少了人工识别和判断的工作量及工作误差,最终确保了时序分析结果的精确度。
附图说明
图1是本申请实施例调查问卷分析方法的流程示意图;
图2是本申请实施例Lucene的写流程和读流程示意图
图3是本申请实施例分析结果展示示意图;
图4是本申请实施例的分析工具的结构组成示意图;
图5是本申请实施例提供的一种电子设备示意性结构图;
图6是本申请实施例的芯片的示意性结构图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
需要说明的是,本申请实施例中,术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本申请实施例中,字符“/”,一般表示前后关联对象是一种“或”的关系。
在本申请实施例的描述中,术语“对应”可表示两者之间具有直接对应或间接对应的关系,也可以表示两者之间具有关联关系,也可以是指示与被指示、配置与被配置等关系。
为便于理解本申请实施例的技术方案,以下对本申请实施例的相关技术进行说明,以下相关技术作为可选方案与本申请实施例的技术方案可以进行任意结合,其均属于本申请实施例的保护范围。
为了能够更加详尽地了解本申请的特点与技术内容,下面结合附图对本申请的实现进行详细阐述,所附附图仅供参考说明之用,并非用来限定本申请。
图1为本申请实施例提供的一种调查问卷分析方法的实现流程示意图,如图1所示,本申请实施例提供一种调查问卷的分析方法,所述方法包括:
步骤101:从索引数据库中查找与目标问卷题目相匹配的问卷题目,得到第一问卷题目列表。
步骤102:对所述第一问卷题目列表中的各个问卷题目进行标准化处理,得到第二问卷题目列表。
步骤103:对所述第二问卷题目列表中的至少部分问卷题目进行时序分析,得到分析结果。
在步骤101之前,可以将历史问卷按照调查时间导入所述索引数据库,以用于后续查找与分析。
基于此,在一实施例中,所述方法还包括:
采集历史问卷题目,将采集到的所述历史问卷题目导入索引数据库。
这里,所述将采集到的所述历史问卷题目导入索引数据库可以是按照调查年份将每个问卷问题导入索引数据库,也可以是按照月份或者其他定义的时间将每个问卷问题导入索引数据库,此处不做限定。
在步骤101中,所述从索引数据库中查找与目标问卷题目相匹配的问卷题目,其中:
目标问卷题目,即用户需要确定进行分析的问卷题目,该问卷题目可以从从历史问卷题目中选择,用户也可以根据自己所要进行数据分析的方向,自行定义问卷题目,确定为目标问卷题目。
进一步地,索引数据库可以基于Elasticsearch创建,Elasticsearch是一款功能强大的基于Lucene的分布式搜索引擎。它提供了一个分布式,多租户,能够支持全文搜索与HTTP接口协议和JSON数据格式。Lucene是一套用于全文检索和搜寻的开源程序库,它提供了一个简单却强大的应用程序接口(Application Programming Interface,API),能够做全文索引和搜寻。
图2是Lucene的写流程和读流程示意图,如图所示,虚线箭头(A,B,C,D)表示写索引的主要过程,实线箭头(1-9)表示查询的主要过程。
具体地,写索引过程主要包括:将数据从数据源中导入分析单元,分析单元将从数据源导入的数据进行分析解释后将分析结果导入索引单元,索引单元根据分析结果将数据进行分解建立索引,将建立索引导入索引数据库。
读索引过程主要包括:将查询语句导入分析单元,分析单元将查询语句进行分析后得到分析结果,查询解析单元根据分析结果进行查询解析后导入搜索单元,从索引数据库中查找与查询语句相匹配的索引,根据索引再次经过搜索单元得到与查询语句相似的数据,得到搜索结果。
基于此,在本申请另一实施例中,所述从索引数据库中查找与目标问卷题目相匹配的问卷题目,得到第一问卷题目列表。包括:
获得查询操作,所述查询操作用于请求查询与目标问卷题目相匹配的问卷题目;
响应所述查询操作,将所述目标问卷题目与索引数据库中的各个问卷题目进行相似度比对,将相似度大于等于指定阈值的问卷题目确定为与所述目标问卷题目相匹配的问卷题目,其中,与所述目标问卷题目相匹配的一个或多个问卷题目形成第一问卷题目列表。
具体地,预先设置阈值,经过查询操作后,通过将各个问卷题目得到的相似分与预先设定的阈值进行比较,将相似分大于等于指定阈值的问卷题目确定为与所述目标问卷题目相匹配的问卷题目,将这些确定的与所述目标问卷题目相匹配的问题题目,组成第一问卷题目列表。
进一步地,通过查询操作,将所述目标问卷题目与索引数据库中的各个问卷题目进行相似度比对,其中,所述相似度可以通过文本匹配算法确定,文本匹配算法主要用于搜索引擎,问答系统等,是为了找到与目标文本最相关的文本。例如信息检索可以归结成查询项和文档的匹配,问答系统可以归结为问题和候选答案的匹配,对话系统可以归结为对话和回复的匹配,可以通过基于向量空间模型(Vector Space Model,VSM)算法或者基于概率(Best Match 25,BM25)算法确定。
以BM25算法为例,对查询句子Q进行分词,每个词看为qi,然后,对于搜索到的句子d,计算每个词qi与d的相关度得分,最后,将qi与d的相关性得分进行加权求和,从而得到查询句子与检索句子的相关性得分。
BM25算法的公式为其中,Q表示Query,qi表示Q解析之后的一个语素(对中文而言,可以把对Query的分词作为语素分析,每个词看成语素qi。);d表示一个搜索到的语句;Wi表示语素qi的权重;R(qi,d)表示语素qi与搜索到的语句d的相关性得分。
Wi表示语素qi的权重,判断一个词与一个语句的相关性的权重,方法有多种,较常用的是词频—逆文本频率(Term Frequency-Inverse Document Frequency,TF-IDF)算法。
这里以TF-IDF算法为例,计算公式为其中,N是语句总数,n(qi)是含有qi的语句数,根据TF-IDF的定义可以看出来,对于给定的语句集合,包含了qi的语句数越多,qi的权重越低,也就是说,当很多语句都包含qi时,qi的区分度就不高,因此用qi来判断相关性的重要度就比较低。
R(qi,d)表示语素qi与搜索到的语句d的相关性得分,计算公式为其中k1,k2,b为调节因子,fi为qi在d中的出现频率,qfi为qi在Q中的出现频率。dl为语句d的长度,avgdl为所有语句的平均长度。
基于此,在本申请另一实施例中,所述将所述目标问卷题目与索引数据库中的各个问卷题目进行相似度比对,将相似度大于等于指定阈值的问卷题目确定为与所述目标问卷题目相匹配的问卷题目,包括:
对所述目标问卷题目进行分词,得到n个词,n为正整数;
对于索引数据库中的一个问卷题目,计算所述n个词中的每个词与该问卷题目的相关度得分,得到n个相关度得分;对所述n个相关度得分进行加权求和,得到该问卷题目与所述目标问卷题目的相似度值;遍历所述索引数据库中的每个问卷题目,得到每个问卷题目与所述目标问卷题目的相似度值;
将所述索引数据库中的相似度值大于等于指定阈值的问卷题目确定为与所述目标问卷题目相匹配的问卷题目。
对于得到的第一问卷题目列表,可能会存在与目标问卷题目的相似度得分大于或者等于预先设定的阈值,但是与目标问卷题目并不相似的问卷题目,这时,为了保证最后时序分析结果的准确性,就需要将第一问卷题目列表进一步过滤,得到准确的目标问卷题目列表。
具体地,用户对所述第一问卷题目列表进行逐一确认,删除用户确定的与所述目标问卷题目不相似的问卷题目,保留与目标问卷题目相似的问卷题目,使第一问卷题目列表精确。
基于此,在本申请的另一实施例中,所述对所述第一问卷题目列表中的各个问卷题目进行标准化处理之前,还包括:
获得用户操作,所述用户操作用于删除所述第一问卷题目列表中的一个或多个问卷题目;
响应所述用户操作,从所述第一问卷题目列表中删除指定的一个或多个问卷题目;
其中,被删除的一个或多个问卷题目为用户确定的与所述目标问卷题目不相似的问卷题目。
进一步地,可以从第一问卷题目列表中选中一个问卷题目作为第一问卷题目列表的代表题目,经过标准化操作统一处理,即将第一问卷题目列表中的各个问卷题目的文本内容替换为所述代表题目的文本内容,并对各个问卷题目进行统一编号。
这里,对各个问卷题目进行统一编号,即将第一问卷题目列表中的各个问卷题目进行统一编号,达到对相同问题的问卷问题题目进行统一分组的目的,方便后续数据的分析和索引数据库完善。
其中标准化处理操作可以通过触发按钮触发,通过计算机程序实现所述标准化处理。
基于此,本申请另一实施例中,上述步骤102中所述对所述第一问卷题目列表中的各个问卷题目进行标准化处理,包括:
获得选中操作,所述选中操作用于从所述第一问卷题目列表中选择一道问卷题目;
响应所述选中操作,从所述第一问卷题目列表中选择一道问卷题目,作为代表题目;
获得标准化操作,所述标准化操作用于触发对所述第一问卷题目列表中的各个问卷题目进行标准化处理;
响应所述标准化操作,将所述第一问卷题目列表中的各个问卷题目的文本内容替换为所述代表题目的文本内容,并对具有相同文本内容的各个问卷题目进行统一编号。
对于上述步骤103中所述分析结果的展示,本申请并不做限定,示意性的,图3为本申请另一实施例的展示方式,如图3所示,对于您对目前生活感受的幸福度的历年得分及其占比按照年份通过曲线图展示。
以下给出一个具体应用实例对本申请实施例的上述技术方案进行举例说明。
1)用户向索引数据库输入题目A0,作为目标问卷题目;索引数据库查询与题目A相匹配的问卷题目,得到题目A1、题目A2、题目A3、题目A4、题目A5,这5个题目形成第一问卷题目列表。
2)用户删除其中的题目A4,A4是用户确认与A0不相似的题目。
3)对剩下的题目进行标准化处理,选定题目A0作为代表题目,将题目A1、A2、A3、A5的题目内容都替换为题目A0的内容,并进行统一化编号,经过标准化处理的题目A1、A2、A3、A5形成第二问卷题目列表。
4)对第二问卷题目列表具有相同题目内容的题目A1、A2、A3、A5,进行时序分析,得到分析结果。
本申请另又一实施例提供的一种调查问卷的分析工具400,如图4,包括:
查找单元420,用于从索引数据库中查找与目标问卷题目相匹配的问卷题目,得到第一问卷题目列表;
标准化处理单元440,用于对所述第一问卷题目列表中的各个问卷题目进行标准化处理,得到第二问卷题目列表;
分析单元450,用于对所述第二问卷题目列表中的至少部分问卷题目进行时序分析,得到分析结果。
在一些可选实施方式中,所述分析工具400还包括采集导入单元410,用于采集历史问卷题目,将采集到的所述历史问卷题目导入索引数据库。
在一些可选实施方式中,所述查找单元420,还用于获得查询操作,所述查询操作用于请求查询与目标问卷题目相匹配的问卷题目;响应所述查询操作,将所述目标问卷题目与索引数据库中的各个问卷题目进行相似度比对,将相似度大于等于指定阈值的问卷题目确定为与所述目标问卷题目相匹配的问卷题目,其中,与所述目标问卷题目相匹配的一个或多个问卷题目形成第一问卷题目列表。
在一些可选实施方式中,所述查找单元420,还用于对所述目标问卷题目进行分词,得到n个词,n为正整数;对于索引数据库中的一个问卷题目,计算所述n个词中的每个词与该问卷题目的相关度得分,得到n个相关度得分;对所述n个相关度得分进行加权求和,得到该问卷题目与所述目标问卷题目的相似度值;遍历所述索引数据库中的每个问卷题目,得到每个问卷题目与所述目标问卷题目的相似度值;将所述索引数据库中的相似度值大于等于指定阈值的问卷题目确定为与所述目标问卷题目相匹配的问卷题目。
在一些可选实施方式中,所述分析工具400还包括确认单元430,用于获得用户操作,所述用户操作用于删除所述第一问卷题目列表中的一个或多个问卷题目;响应所述用户操作,从所述第一问卷题目列表中删除指定的一个或多个问卷题目;其中,被删除的一个或多个问卷题目为用户确定的与所述目标问卷题目不相似的问卷题目。
在一些可选实施方式中,所述标准化单元440,还用于获得选中操作,所述选中操作用于从所述第一问卷题目列表中选择一道问卷题目;响应所述选中操作,从所述第一问卷题目列表中选择一道问卷题目,作为代表题目;获得标准化操作,所述标准化操作用于触发对所述第一问卷题目列表中的各个问卷题目进行标准化处理;响应所述标准化操作,将所述第一问卷题目列表中的各个问卷题目的文本内容替换为所述代表题目的文本内容,并对具有相同文本内容的各个问卷题目进行统一编号。
本领域技术人员应当理解,图4所示的分析工具中的各单元的实现功能可参照前述方法的相关描述而理解。图4所示的分析工具中的各单元的功能可通过运行于处理器上的程序而实现,也可通过具体的逻辑电路而实现。
图5是本申请实施例提供的一种电子设备500示意性结构图。图5所示的电子设备500包括处理器510,处理器510可以从存储器中调用并运行计算机程序,以实现本申请实施例中的方法。
可选地,如图5所示,电子设备500还可以包括存储器520。其中,处理器510可以从存储器520中调用并运行计算机程序,以实现本申请实施例中的方法。
其中,存储器520可以是独立于处理器510的一个单独的器件,也可以集成在处理器510中。
可选地,如图5所示,电子设备500还可以包括收发器530,处理器510可以控制该收发器530与其他设备进行通信,具体地,可以向其他设备发送信息或数据,或接收其他设备发送的信息或数据。
其中,收发器530可以包括发射机和接收机。收发器530还可以进一步包括天线,天线的数量可以为一个或多个。
该电子设备500具体可为本申请实施例的分析工具,并且该电子设备500可以实现本申请实施例的各个方法中由分析工具实现的相应流程,为了简洁,在此不再赘述。
图6是本申请实施例的芯片的示意性结构图。图6所示的芯片600包括处理器610,处理器610可以从存储器中调用并运行计算机程序,以实现本申请实施例中的方法。
可选地,如图6所示,芯片600还可以包括存储器620。其中,处理器610可以从存储器620中调用并运行计算机程序,以实现本申请实施例中的方法。
其中,存储器620可以是独立于处理器610的一个单独的器件,也可以集成在处理器610中。
可选地,该芯片600还可以包括输入接口630。其中,处理器610可以控制该输入接口630与其他设备或芯片进行通信,具体地,可以获取其他设备或芯片发送的信息或数据。
可选地,该芯片600还可以包括输出接口640。其中,处理器610可以控制该输出接口640与其他设备或芯片进行通信,具体地,可以向其他设备或芯片输出信息或数据。
该芯片可应用于本申请实施例中的分析工具,并且该芯片可以实现本申请实施例的各个方法中由分析工具实现的相应流程,为了简洁,在此不再赘述。
应理解,本申请实施例提到的芯片还可以称为系统级芯片,系统芯片,芯片系统或片上系统芯片等。
应理解,本申请实施例的处理器可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法实施例的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器、数字信号处理器(Digital SignalProcessor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。
可以理解,本申请实施例中的存储器可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(Read-Only Memory,ROM)、可编程只读存储器(Programmable ROM,PROM)、可擦除可编程只读存储器(Erasable PROM,EPROM)、电可擦除可编程只读存储器(Electrically EPROM,EEPROM)或闪存。易失性存储器可以是随机存取存储器(Random Access Memory,RAM),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(Static RAM,SRAM)、动态随机存取存储器(Dynamic RAM,DRAM)、同步动态随机存取存储器(Synchronous DRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(Double Data RateSDRAM,DDR SDRAM)、增强型同步动态随机存取存储器(Enhanced SDRAM,ESDRAM)、同步连接动态随机存取存储器(Synchlink DRAM,SLDRAM)和直接内存总线随机存取存储器(DirectRambus RAM,DR RAM)。应注意,本文描述的系统和方法的存储器旨在包括但不限于这些和任意其它适合类型的存储器。
应理解,上述存储器为示例性但不是限制性说明,例如,本申请实施例中的存储器还可以是静态随机存取存储器(static RAM,SRAM)、动态随机存取存储器(dynamic RAM,DRAM)、同步动态随机存取存储器(synchronous DRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(double data rate SDRAM,DDR SDRAM)、增强型同步动态随机存取存储器(enhanced SDRAM,ESDRAM)、同步连接动态随机存取存储器(synch link DRAM,SLDRAM)以及直接内存总线随机存取存储器(Direct Rambus RAM,DR RAM)等等。也就是说,本申请实施例中的存储器旨在包括但不限于这些和任意其它适合类型的存储器。
本申请实施例还提供了一种计算机可读存储介质,用于存储计算机程序。该计算机可读存储介质可应用于本申请实施例中的分析工具,并且该计算机程序使得计算机执行本申请实施例的各个方法中由分析工具实现的相应流程,为了简洁,在此不再赘述。
本申请实施例还提供了一种计算机程序产品,包括计算机程序指令。该计算机程序产品可应用于本申请实施例中的分析工具,并且该计算机程序指令使得计算机执行本申请实施例的各个方法中由分析工具实现的相应流程,为了简洁,在此不再赘述。
本申请实施例还提供了一种计算机程序。该计算机程序可应用于本申请实施例中的分析工具,当该计算机程序在计算机上运行时,使得计算机执行本申请实施例的各个方法中由分析工具实现的相应流程,为了简洁,在此不再赘述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应所述以权利要求的保护范围为准。
Claims (10)
1.一种调查问卷的分析方法,其特征在于,包括:
从索引数据库中查找与目标问卷题目相匹配的问卷题目,得到第一问卷题目列表;
对所述第一问卷题目列表中的各个问卷题目进行标准化处理,得到第二问卷题目列表;
对所述第二问卷题目列表中的至少部分问卷题目进行时序分析,得到分析结果。
2.根据权利要求1所述的方法,其特征在于,所述从索引数据库中查找与目标问卷题目相匹配的问卷题目之前,所述方法还包括:
采集历史问卷题目,将采集到的所述历史问卷题目导入索引数据库。
3.根据权利要求1所述的方法,其特征在于,所述从索引数据库中查找与目标问卷题目相匹配的问卷题目,得到第一问卷题目列表,包括:
获得查询操作,所述查询操作用于请求查询与目标问卷题目相匹配的问卷题目;
响应所述查询操作,将所述目标问卷题目与索引数据库中的各个问卷题目进行相似度比对,将相似度大于等于指定阈值的问卷题目确定为与所述目标问卷题目相匹配的问卷题目,其中,与所述目标问卷题目相匹配的一个或多个问卷题目形成第一问卷题目列表。
4.根据权利要求3所述的方法,其特征在于,所述将所述目标问卷题目与索引数据库中的各个问卷题目进行相似度比对,将相似度值大于等于指定阈值的问卷题目确定为与所述目标问卷题目相匹配的问卷题目,包括:
对所述目标问卷题目进行分词,得到n个词,n为正整数;
对于索引数据库中的一个问卷题目,计算所述n个词中的每个词与该问卷题目的相关度得分,得到n个相关度得分;对所述n个相关度得分进行加权求和,得到该问卷题目与所述目标问卷题目的相似度值;遍历所述索引数据库中的每个问卷题目,得到每个问卷题目与所述目标问卷题目的相似度值;
将所述索引数据库中的相似度值大于等于指定阈值的问卷题目确定为与所述目标问卷题目相匹配的问卷题目。
5.根据权利要求1所述的方法,其特征在于,所述对所述第一问卷题目列表中的各个问卷题目进行标准化处理之前,所述方法还包括:
获得用户操作,所述用户操作用于删除所述第一问卷题目列表中的一个或多个问卷题目;
响应所述用户操作,从所述第一问卷题目列表中删除指定的一个或多个问卷题目;
其中,被删除的一个或多个问卷题目为用户确定的与所述目标问卷题目不相似的问卷题目。
6.根据权利要求1至5中任一项所述的方法,其特征在于,所述对所述第一问卷题目列表中的各个问卷题目进行标准化处理,包括:
获得选中操作,所述选中操作用于从所述第一问卷题目列表中选择一道问卷题目;
响应所述选中操作,从所述第一问卷题目列表中选择一道问卷题目,作为代表题目;
获得标准化操作,所述标准化操作用于触发对所述第一问卷题目列表中的各个问卷题目进行标准化处理;
响应所述标准化操作,将所述第一问卷题目列表中的各个问卷题目的文本内容替换为所述代表题目的文本内容,并对具有相同文本内容的各个问卷题目进行统一编号。
7.一种调查问卷的分析工具,其特征在于,包括:
查找单元,用于从索引数据库中查找与目标问卷题目相匹配的问卷题目,得到第一问卷题目列表;
标准化处理单元,用于对所述第一问卷题目列表中的各个问卷题目进行标准化处理,得到第二问卷题目列表;
分析单元,用于对所述第二问卷题目列表中的至少部分问卷题目进行时序分析,得到分析结果。
8.一种电子设备,其特征在于,包括:处理器和存储器,该存储器用于存储计算机程序,所述处理器用于调用并运行所述存储器中存储的计算机程序,执行如权利要求1至6中任一项所述的方法。
9.一种芯片,其特征在于,包括:处理器,用于从存储器中调用并运行计算机程序,使得安装有所述芯片的设备执行如权利要求1至6中任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,用于存储计算机程序,所述计算机程序使得计算机执行如权利要求1至6中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111404680.XA CN114201574A (zh) | 2021-11-24 | 2021-11-24 | 一种调查问卷的分析方法、设备、芯片及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111404680.XA CN114201574A (zh) | 2021-11-24 | 2021-11-24 | 一种调查问卷的分析方法、设备、芯片及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114201574A true CN114201574A (zh) | 2022-03-18 |
Family
ID=80648720
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111404680.XA Pending CN114201574A (zh) | 2021-11-24 | 2021-11-24 | 一种调查问卷的分析方法、设备、芯片及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114201574A (zh) |
-
2021
- 2021-11-24 CN CN202111404680.XA patent/CN114201574A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2019263758B2 (en) | Systems and methods for generating a contextually and conversationally correct response to a query | |
CN106649818B (zh) | 应用搜索意图的识别方法、装置、应用搜索方法和服务器 | |
US9146987B2 (en) | Clustering based question set generation for training and testing of a question and answer system | |
US8302197B2 (en) | Identifying data associated with security issue attributes | |
US11372942B2 (en) | Method, apparatus, computer device and storage medium for verifying community question answer data | |
Kousha et al. | An automatic method for extracting citations from Google Books | |
WO2020077824A1 (zh) | 异常问题的定位方法、装置、设备及存储介质 | |
CN110096573B (zh) | 一种文本解析方法及装置 | |
US10810245B2 (en) | Hybrid method of building topic ontologies for publisher and marketer content and ad recommendations | |
CN106407316B (zh) | 基于主题模型的软件问答推荐方法和装置 | |
CN110569419A (zh) | 问答系统优化方法、装置、计算机设备及存储介质 | |
CN112132238A (zh) | 一种识别隐私数据的方法、装置、设备和可读介质 | |
CN111506595B (zh) | 一种数据查询方法、系统及相关设备 | |
CN114842982B (zh) | 一种面向医疗信息系统的知识表达方法、装置及系统 | |
CN111104422A (zh) | 一种数据推荐模型的训练方法、装置、设备及存储介质 | |
CN115952800A (zh) | 命名实体识别方法、装置、计算机设备及可读存储介质 | |
CN110941713A (zh) | 基于主题模型的自优化金融资讯版块分类方法 | |
CN115129864A (zh) | 文本分类方法、装置、计算机设备和存储介质 | |
CN114201574A (zh) | 一种调查问卷的分析方法、设备、芯片及存储介质 | |
CN110909532B (zh) | 用户名称匹配方法、装置、计算机设备和存储介质 | |
CN114550157A (zh) | 弹幕聚集识别方法以及装置 | |
CN110717029A (zh) | 一种信息处理方法和系统 | |
CN111708870A (zh) | 基于深度神经网络的问答方法、装置及存储介质 | |
Nikolić et al. | Modelling the System of Receiving Quick Answers for e-Government Services: Study for the Crime Domain in the Republic of Serbia | |
US11615492B2 (en) | Systems and methods for identifying a risk of impliedly overruled content based on citationally related content |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |