CN117195907B - 应用于市场调查处理系统的调查问卷分析方法及系统 - Google Patents
应用于市场调查处理系统的调查问卷分析方法及系统 Download PDFInfo
- Publication number
- CN117195907B CN117195907B CN202311025201.2A CN202311025201A CN117195907B CN 117195907 B CN117195907 B CN 117195907B CN 202311025201 A CN202311025201 A CN 202311025201A CN 117195907 B CN117195907 B CN 117195907B
- Authority
- CN
- China
- Prior art keywords
- questionnaire
- event
- user
- market
- tuning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 title claims abstract description 92
- 238000004458 analytical method Methods 0.000 title claims abstract description 73
- 238000011835 investigation Methods 0.000 title description 10
- 238000000034 method Methods 0.000 claims description 44
- 230000002441 reversible effect Effects 0.000 claims description 26
- 238000012216 screening Methods 0.000 claims description 18
- 230000008569 process Effects 0.000 claims description 15
- 238000011160 research Methods 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 7
- 230000004927 fusion Effects 0.000 claims description 7
- 238000005065 mining Methods 0.000 claims description 6
- 239000000758 substrate Substances 0.000 claims 1
- 238000007689 inspection Methods 0.000 abstract description 4
- 239000013598 vector Substances 0.000 description 11
- 238000012512 characterization method Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 230000003213 activating effect Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 230000002411 adverse Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- 230000002996 emotional effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000036651 mood Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明实施例提供的应用于市场调查处理系统的调查问卷分析方法及系统,考虑了调查问卷用户与市调问卷事件之间的调查问卷文本碰撞语义,调查问卷文本碰撞语义可以反映调查问卷用户的调查问卷用户属性数据与市调问卷事件的市调问卷事件属性数据之间的文本语义碰撞特征,换言之,考虑了调查问卷用户与市调问卷事件质检的语义碰撞和混淆,从而能够提高识别的市调问卷事件对于调查问卷用户的影响评分的精度,以便依据市调问卷事件对于调查问卷用户的影响评分,在市调问卷事件尽可能精准可靠地定位调查问卷用户的市调问卷关注事件,保障调查问卷文本分析的质量。
Description
技术领域
本发明涉及人工智能技术领域,特别涉及一种应用于市场调查处理系统的调查问卷分析方法及系统。
背景技术
市场调查问卷(Market survey),是用科学的方法系统地搜集、记录、整理和分析有关市场的信息资料,从而了解市场发展变化的现状和趋势,为企业经营决策、广告策划、广告写作提供科学的依据。因此,针对调研问卷的数据挖掘和信息分析是非常重要的一个环节。然而传统技术在对调研问卷进行分析时,难以准确可靠地挖掘问卷用户的关注点。
发明内容
为改善相关技术中存在的技术问题,本发明提供了一种应用于市场调查处理系统的调查问卷分析方法及系统。
第一方面,本发明实施例提供了一种应用于市场调查处理系统的调查问卷分析方法,应用于AI调查问卷分析系统,所述方法包括:
获得反映调查问卷用户的调查问卷用户属性数据的第一调查问卷文本语义,以及获得反映若干个市调问卷事件中每个市调问卷事件的市调问卷事件属性数据的第二调查问卷文本语义;
对所述调查问卷用户的调查问卷用户属性数据与目标市调问卷事件的市调问卷事件属性数据进行语义碰撞处理,得到所述调查问卷用户与所述目标市调问卷事件之间的调查问卷文本碰撞语义;其中,所述目标市调问卷事件是所述若干个市调问卷事件中的任一市调问卷事件,所述调查问卷文本碰撞语义反映所述调查问卷用户的调查问卷用户属性数据与所述目标市调问卷事件的市调问卷事件属性数据之间的文本语义碰撞特征;
依据所述第一调查问卷文本语义、所述目标市调问卷事件的第二调查问卷文本语义以及所述调查问卷文本碰撞语义,对所述调查问卷用户与所述目标市调问卷事件之间的联系权重进行识别,得到所述目标市调问卷事件对于所述调查问卷用户的影响评分;
基于所述若干个市调问卷事件中每个市调问卷事件对于所述调查问卷用户的影响评分,对所述若干个市调问卷事件进行事件筛选,得到所述调查问卷用户的市调问卷关注事件。
在一些示例中,所述对所述调查问卷用户的调查问卷用户属性数据与目标市调问卷事件的市调问卷事件属性数据进行语义碰撞处理,得到所述调查问卷用户与所述目标市调问卷事件之间的调查问卷文本碰撞语义,包括:
对所述调查问卷用户的调查问卷用户属性数据和所述目标市调问卷事件的市调问卷事件属性数据进行特征连接,得到所述调查问卷用户与所述目标市调问卷事件之间的联动属性数据;
对所述联动属性数据进行属性碰撞,得到所述调查问卷用户与所述目标市调问卷事件之间的调查问卷文本碰撞语义。
在一些示例中,所述对所述调查问卷用户的调查问卷用户属性数据和所述目标市调问卷事件的市调问卷事件属性数据进行特征连接,得到所述调查问卷用户与所述目标市调问卷事件之间的联动属性数据,包括:
获得联动属性数据生成策略,所述联动属性数据生成策略用于指示生成所述联动属性数据的调查问卷用户属性数据种类和市调问卷事件种类;
基于所述联动属性数据生成策略,对所述调查问卷用户的调查问卷用户属性数据与所述目标市调问卷事件的市调问卷事件属性数据进行属性拼接,得到所述联动属性数据。
在一些示例中,所述对所述调查问卷用户的调查问卷用户属性数据和所述目标市调问卷事件的市调问卷事件属性数据进行特征连接,得到所述调查问卷用户与所述目标市调问卷事件之间的联动属性数据,包括:
对所述调查问卷用户的调查问卷用户属性数据和所述目标市调问卷事件的市调问卷事件属性数据进行属性拼接,得到所述调查问卷用户与所述目标市调问卷事件之间的若干个基础属性数据;
分别对每个所述基础属性数据进行匹配判别,得到每个所述基础属性数据对应的匹配性;其中,任一所述基础属性数据对应的匹配性用于表征构成所述基础属性数据的调查问卷用户属性数据与市调问卷事件属性数据之间相关权重;
基于每个所述基础属性数据对应的匹配性,对若干个所述基础属性数据进行优化,得到所述联动属性数据。
在一些示例中,所述获得反映调查问卷用户的调查问卷用户属性数据的第一调查问卷文本语义,包括:
获得所述调查问卷用户的调查问卷用户属性数据;
对所述调查问卷用户的调查问卷用户属性数据进行属性碰撞,得到所述第一调查问卷文本语义。
在一些示例中,所述调查问卷用户的调查问卷用户属性数据包括X个用户属性特征场景中的调查问卷用户属性数据,X为不小于2的整数;所述对所述调查问卷用户的调查问卷用户属性数据进行属性碰撞,得到所述第一调查问卷文本语义,包括:
分别对所述X个用户属性特征场景中的每个用户属性特征场景中的调查问卷用户属性数据进行属性碰撞,得到对应用户属性特征场景中的用户问卷文本语义;
对所述X个用户属性特征场景中的用户问卷文本语义进行相似度解析,得到所述第一调查问卷文本语义。
在一些示例中,所述对所述调查问卷用户的调查问卷用户属性数据进行属性碰撞,得到所述第一调查问卷文本语义,包括:
对所述调查问卷用户的调查问卷用户属性数据进行关注点挖掘,得到所述调查问卷用户在若干个关注层面下的用户问卷文本语义;
对所述调查问卷用户在若干个关注层面下的用户问卷文本语义进行联系语义解析,得到所述第一调查问卷文本语义。
在一些示例中,当所述第二调查问卷文本语义的获得步骤包括非实时获取时,所述获得反映若干个市调问卷事件中每个市调问卷事件的市调问卷事件属性数据的第二调查问卷文本语义,包括:
分别依据多种事件检索规则中的每种事件检索规则,确定每种事件检索规则下的初选问卷事件的事件关键词;
合并所述多种事件检索规则下的初选问卷事件的事件关键词,得到所述若干个市调问卷事件的事件关键词;
基于所述若干个市调问卷事件的事件关键词,在问卷事件文本大数据池中遍历所述若干个市调问卷事件中每个市调问卷事件的第二调查问卷文本语义。
在一些示例中,当所述第二调查问卷文本语义的获得步骤包括实时获取时,所述获得反映若干个市调问卷事件中每个市调问卷事件的市调问卷事件属性数据的第二调查问卷文本语义,包括:
分别依据多种事件检索规则中的每种事件检索规则,确定每种事件检索规则下的初选问卷事件的事件关键词;
合并所述多种事件检索规则下的初选问卷事件的事件关键词,得到所述若干个市调问卷事件的事件关键词;
依据所述若干个市调问卷事件的事件关键词,从市调问卷事件集中获得所述若干个市调问卷事件的市调问卷事件属性数据;
对所述若干个市调问卷事件中每个市调问卷事件的市调问卷事件属性数据进行属性碰撞,得到相应市调问卷事件的第二调查问卷文本语义。
在一些示例中,所述依据所述第一调查问卷文本语义、所述目标市调问卷事件的第二调查问卷文本语义以及所述调查问卷文本碰撞语义,对所述调查问卷用户与所述目标市调问卷事件之间的联系权重进行识别,得到所述目标市调问卷事件对于所述调查问卷用户的影响评分,包括:
对所述第一调查问卷文本语义、所述目标市调问卷事件的第二调查问卷文本语义、以及所述调查问卷文本碰撞语义进行语义组合,得到调查问卷文本组合语义;
从调查问卷文本语义的热力层面对所述调查问卷文本组合语义进行处理,得到所述调查问卷用户与所述目标市调问卷事件在所述调查问卷文本语义热力层面下的第一联系权重数据;
从调查问卷文本语义的碰撞层面对所述调查问卷文本组合语义进行处理,得到所述调查问卷用户与所述目标市调问卷事件在所述调查问卷文本语义的碰撞层面下的第二联系权重数据;
基于所述第一联系权重数据和所述第二联系权重数据,识别所述目标市调问卷事件对于所述调查问卷用户的影响评分。
在一些示例中,所述应用于市场调查处理系统的调查问卷分析方法通过文本语义分析网络实现,所述文本语义分析网络包括调查问卷用户处理分支、联动分支和市调问卷事件处理分支;所述文本语义分析网络的调试过程,包括:
获得调试学习信息,所述调试学习信息包括调查问卷用户示例的调查问卷用户属性数据、市调问卷事件示例的市调问卷事件属性数据、以及所述调查问卷用户示例对所述市调问卷事件示例的逆向影响先验评分;
通过所述调查问卷用户处理分支对所述调查问卷用户示例的调查问卷用户属性数据进行属性碰撞,得到所述调查问卷用户示例的用户问卷文本语义;
通过所述市调问卷事件处理分支对所述市调问卷事件示例的市调问卷事件属性数据进行属性碰撞,得到所述市调问卷事件示例的事件问卷文本语义;
通过所述联动分支获得所述调查问卷用户示例与所述市调问卷事件示例之间的调查问卷文本碰撞语义示例;
以及,基于所述调查问卷用户示例的用户问卷文本语义、所述市调问卷事件示例的事件问卷文本语义和所述调查问卷文本碰撞语义示例,对所述调查问卷用户示例和所述市调问卷事件示例进行影响分析,得到所述调查问卷用户示例对所述市调问卷事件示例的逆向影响识别评分;
基于所述逆向影响先验评分与所述逆向影响识别评分之间的区别,对所述文本语义分析网络进行调试。
第二方面,本发明还提供了一种AI调查问卷分析系统,包括处理器和存储器;所述处理器和所述存储器通信连接,所述处理器用于从所述存储器中读取计算机程序并执行,以实现上述的方法。
第三方面,本发明还提供了一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时实现上述的方法。
本发明实施例中,可以依据调查问卷用户的第一调查问卷文本语义,市调问卷事件的第二调查问卷文本语义,以及调查问卷用户与市调问卷事件之间的调查问卷文本碰撞语义,识别市调问卷事件对于调查问卷用户的影响评分;第一调查问卷文本语义可以反映调查问卷用户的调查问卷用户属性数据,第二调查问卷文本语义可以反映市调问卷事件的市调问卷事件属性数据,如果依据第一调查问卷文本语义和第二调查问卷文本语义,识别市调问卷事件对于调查问卷用户的影响评分,则难以将调查问卷用户与市调问卷事件之间的语义碰撞考虑在内,从而难以保障影响评分的精度和可信度。鉴于此,本发明实施例中考虑了调查问卷用户与市调问卷事件之间的调查问卷文本碰撞语义,调查问卷文本碰撞语义可以反映调查问卷用户的调查问卷用户属性数据与市调问卷事件的市调问卷事件属性数据之间的文本语义碰撞特征,换言之,考虑了调查问卷用户与市调问卷事件质检的语义碰撞和混淆,从而能够提高识别的市调问卷事件对于调查问卷用户的影响评分的精度,以便依据市调问卷事件对于调查问卷用户的影响评分,在市调问卷事件尽可能精准可靠地定位调查问卷用户的市调问卷关注事件,保障调查问卷文本分析的质量。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并于说明书一起用于解释本发明的原理。
图1是本发明实施例提供的一种应用于市场调查处理系统的调查问卷分析方法的流程示意图。
实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
本发明实施例所提供的方法实施例可以在AI调查问卷分析系统、计算机设备或者类似的运算装置中执行。以运行在AI调查问卷分析系统上为例,AI调查问卷分析系统可以包括一个或多个处理器(处理器可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)和用于存储数据的存储器,可选地,上述AI调查问卷分析系统还可以包括用于通信功能的传输装置。本领域普通技术人员可以理解,上述结构仅为示意,其并不对上述AI调查问卷分析系统的结构造成限定。例如,AI调查问卷分析系统还可包括比上述所示更多或者更少的组件,或者具有与上述所示不同的配置。
存储器可用于存储计算机程序,例如,应用软件的软件程序以及模块,如本发明实施例中的一种应用于市场调查处理系统的调查问卷分析方法对应的计算机程序,处理器通过运行存储在存储器内的计算机程序,从而执行各种功能应用以及数据处理,即实现上述的方法。存储器可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器可进一步包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至AI调查问卷分析系统。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输装置用于经由一个网络接收或者发送数据。上述的网络具体实例可包括AI调查问卷分析系统的通信供应商提供的无线网络。在一个实例中,传输装置包括一个网络适配器(Network Interface Controller,简称为NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置可以为射频(Radio Frequency,简称为RF)模块,其用于通过无线方式与互联网进行通讯。
基于此,请参阅图1,图1是本发明实施例所提供的一种应用于市场调查处理系统的调查问卷分析方法的流程示意图,该方法应用于AI调查问卷分析系统,进一步可以包括步骤101-步骤105。
步骤101,获得反映调查问卷用户的调查问卷用户属性数据的第一调查问卷文本语义。
本发明实施例提供的应用于市场调查处理系统的调查问卷分析方法中,识别市调问卷事件对于调查问卷用户的影响评分的过程通过文本语义分析网络实现,示例性的,文本语义分析网络可以包括调查问卷用户处理分支、市调问卷事件处理分支、联动分支和语义碰撞处理分支;调查问卷用户处理分支、市调问卷事件处理分支、语义碰撞处理分支和联动分支之间是相互独立的,下面针对调查问卷用户处理分支、市调问卷事件处理分支、语义碰撞处理分支和联动分支分别进行说明。
对于调查问卷用户处理分支而言,调查问卷用户处理分支用作对调查问卷用户的调查问卷用户属性数据进行属性碰撞,得到调查问卷用户的第一调查问卷文本语义。调查问卷用户处理分支可以包括传入单元(也即输入层)、特征择选单元(嵌入层)和可逆单元(也即深度残差层);传入单元用作输入调查问卷用户的调查问卷用户属性数据;特征择选单元用作对调查问卷用户的调查问卷用户属性数据进行特征择选,得到调查问卷用户的基础调查问卷文本语义。可逆单元用作对调查问卷用户的基础调查问卷文本语义进行卷积处理,得到调查问卷用户的第一调查问卷文本语义,可逆单元在抽取调查问卷用户的基础调查问卷文本语义中有价值细节的同时,可以对第一调查问卷文本语义进行下采样处理。
其中,调查问卷用户属性数据是可变的,基于此,调查问卷用户处理分支的配置可以是实时的,由于调查问卷用户处理分支、市调问卷事件处理分支和调查问卷用户处理分支之间互不干扰,当需要识别调查问卷用户对若干个市调问卷事件的逆向影响评分时,调查问卷用户的调查问卷用户属性数据无需和若干个市调问卷事件的市调问卷事件属性数据进行多次输入,也即,调查问卷用户属性数据的属性碰撞仅需一次,识别调查问卷用户对若干个市调问卷事件的逆向影响评分皆利用相同的调查问卷用户的第一调查问卷文本语义,从而减少识别市调问卷事件对于调查问卷用户的影响评分的运算开销,保障整体方案的时效性。
对于市调问卷事件处理分支而言,市调问卷事件处理分支与调查问卷用户处理分支相似,市调问卷事件处理分支用作对市调问卷事件的市调问卷事件属性数据进行属性碰撞,得到市调问卷事件的第二调查问卷文本语义。市调问卷事件处理分支可以包括传入单元、特征择选单元(嵌入层)和可逆单元(深度残差层);传入单元用作输入市调问卷事件的市调问卷事件属性数据;特征择选单元用作对市调问卷事件的市调问卷事件属性数据进行特征择选,得到市调问卷事件的基础调查问卷文本语义。可逆单元用作对市调问卷事件的基础调查问卷文本语义进行卷积处理,得到市调问卷事件的第二调查问卷文本语义,可逆单元在抽取市调问卷事件的基础调查问卷文本语义中有价值细节的同时可以进行下采样处理。
其中,市调问卷事件属性数据通常不会变化,因而市调问卷事件处理分支的配置可以是实时或者非实时的,实时配置可以及时确定市调问卷事件的市调问卷事件属性数据的第二调查问卷文本语义;非实时配置可以利用键值对技术从问卷事件文本大数据池中读取市调问卷事件的第二调查问卷文本语义。这样可以丰富市调问卷事件处理分支的配置方式。
对于语义碰撞处理分支而言,语义碰撞处理分支用作对调查问卷用户与市调问卷事件之间的联动属性数据进行属性碰撞,得到调查问卷用户与市调问卷事件之间的调查问卷文本碰撞语义,调查问卷用户与市调问卷事件之间的联动属性数据可以是依据调查问卷用户的调查问卷用户属性数据和市调问卷事件的市调问卷事件属性数据生成的。语义碰撞处理分支可以包括输入层、特征择选单元(嵌入层)和融合单元(拼接层);传入单元用作输入联动属性数据(交互属性数据或者碰撞属性数据);特征择选单元用作对调查问卷用户与市调问卷事件之间的联动属性数据进行特征择选,得到调查问卷用户与市调问卷事件之间的基础调查问卷文本语义,调查问卷用户与市调问卷事件之间的基础调查问卷文本语义。联动属性数据的个数可以为若干个,联动属性数据对应的基础调查问卷文本语义的个数可以为若干个,融合单元用作对若干个联动属性数据对应的基础调查问卷文本语义进行语义组合,得到调查问卷用户与市调问卷事件之间的调查问卷文本碰撞语义。
对于联动分支而言,联动分支可以依据第一调查问卷文本语义、市调问卷事件的第二调查问卷文本语义以及调查问卷文本碰撞语义,对调查问卷用户与市调问卷事件之间的联系权重进行识别,得到目标市调问卷事件对于调查问卷用户的影响评分。联动分支可以包括融合单元(拼接层)、联系权重分析层和生成单元(输出层);融合单元用作对第一调查问卷文本语义、市调问卷事件的第二调查问卷文本语义和调查问卷文本碰撞语义进行语义组合,得到调查问卷文本组合语义;联系权重分析层用作依据调查问卷文本组合语义,对调查问卷用户与市调问卷事件之间的联系权重进行识别,得到联系权重识别信息;生成单元可以采用RELU对联系权重识别信息进行激活,得到市调问卷事件对于调查问卷用户的影响评分。
依据以上对文本语义分析网络的说明,可以对目标市调问卷事件(任一市调问卷事件)进行处理,从而识别目标市调问卷事件对于调查问卷用户的影响评分。
进一步地,在步骤101中,调查问卷用户的第一调查问卷文本语义,可以是对调查问卷用户的调查问卷用户属性数据(调查问卷用户特征)进行属性碰撞得到的;调查问卷用户的调查问卷用户属性数据可以包括:调查问卷用户的画像特征、调查问卷用户的情绪向量等。调查问卷用户的调查问卷用户属性数据的属性碰撞过程,可以包括如下三种思路中的其中一种。
(1)直接对调查问卷用户的调查问卷用户属性数据进行属性碰撞。在获得到调查问卷用户的调查问卷用户属性数据后,可以通过调查问卷用户处理分支中的特征择选单元对调查问卷用户的调查问卷用户属性数据进行特征择选,得到调查问卷用户的基础调查问卷文本语义,然后,可以通过调查问卷用户处理分支中的可逆单元对调查问卷用户的基础调查问卷文本语义进行卷积处理,得到调查问卷用户的第一调查问卷文本语义。基于此,得到的第一调查问卷文本语义的个数为一个,调查问卷用户的第一调查问卷文本语义可以精准反映调查问卷用户的调查问卷用户属性数据。
(2)分析调查问卷用户在不同用户属性特征场景下的调查问卷用户属性数据之间的相似性(共性)。调查问卷用户的调查问卷用户属性数据可以包括X个用户属性特征场景中的调查问卷用户属性数据,X为不小于2的整数。基于此,可以分别对X个用户属性特征场景中的每个用户属性特征场景中的调查问卷用户属性数据进行属性碰撞,得到对应用户属性特征场景中的用户问卷文本语义;换言之,可以通过调查问卷用户处理分支中的特征择选单元分别对X个用户属性特征场景中的每个用户属性特征场景中的调查问卷用户属性数据进行特征择选,得到对应用户属性特征场景中的基础调查问卷文本语义,然后,可以通过调查问卷用户处理分支中的可逆单元分别对X个用户属性特征场景中的每个用户属性特征场景中的基础调查问卷文本语义进行卷积处理,得到对应用户属性特征场景中的用户问卷文本语义,任一用户属性特征场景中的用户问卷文本语义,可以反映对应用户属性特征场景中的调查问卷用户属性数据。这样,调查问卷用户处理分支中还可以包括相似度解析层,相似度解析层用作对X个用户属性特征场景中的用户问卷文本语义进行相似度解析,得到第一调查问卷文本语义。基于此,X个用户属性特征场景可以从X个不同的特征层面描述调查问卷用户属性数据,换言之,X个用户属性特征场景中的调查问卷用户属性数据属于不同的特征层面,比如,一个用户属性特征场景可以从画像层面描述调查问卷用户属性数据,另一个用户属性特征场景可以从情绪向量层面描述调查问卷用户属性数据,该思路通过挖掘不同用户属性特征场景下的调查问卷用户属性数据的相似性,可以提升第一调查问卷文本语义对调查问卷用户的调查问卷用户属性数据的表征性能,从而使得第一调查问卷文本语义能够精准反映调查问卷用户的调查问卷用户属性数据。
(3)分析调查问卷用户的调查问卷用户属性数据在不同关注层面下的相关性。上述第一种调查问卷用户的调查问卷用户属性数据的属性碰撞方式中,得到的第一调查问卷文本语义的个数为一个,对于关注面交多的调查问卷用户,第一调查问卷文本语义可能难以完全表征调查问卷用户不同关注层面的调查问卷用户属性数据。在此基础上,可以对调查问卷用户的调查问卷用户属性数据进行关注点挖掘,得到调查问卷用户在若干个关注层面下的用户问卷文本语义,然后,可以分析调查问卷用户在若干个关注层面下的用户问卷文本语义之间相关性,得到第一调查问卷文本语义。在通过调查问卷用户处理分支中的特征择选单元对调查问卷用户的调查问卷用户属性数据进行特征择选,得到调查问卷用户的基础调查问卷文本语义后,可以通过调查问卷用户处理分支中的注意力模型对调查问卷用户的基础调查问卷文本语义进行关注点挖掘,得到调查问卷用户在若干个关注层面下的用户问卷文本语义;然后,可以通过调查问卷用户处理分支中的相关性判别层对调查问卷用户在若干个关注层面下用户问卷文本语义进行联系语义解析,得到第一调查问卷文本语义;联系语义解析是针对任一关注层面下的用户问卷文本语义,可以解析这个关注层面下的用户问卷文本语义与各个关注层面下的用户问卷文本语义之间的相关度(包括自身),得到各个关注层面下的用户问卷文本语义的权值,相关度越高,权值越大,然后,可以依据各个关注层面下的用户问卷文本语义的权值,对各个关注层面下的用户问卷文本语义进行全局整理,得到这个关注层面下的第一调查问卷文本语义。这样,可以挖掘调查问卷用户在不同关注层面下的用户问卷文本语义,通过联系语义解析,可以筛选各个关注层面下的用户问卷文本语义中的有价值特征,从而能够提高第一调查问卷文本语义对调查问卷用户的调查问卷用户属性数据的表征性能,从而使得第一调查问卷文本语义能够精准反映调查问卷用户的调查问卷用户属性数据。
步骤102,获得反映若干个市调问卷事件中每个市调问卷事件的市调问卷事件属性数据的第二调查问卷文本语义。
当应用于市场调查处理系统的调查问卷分析方法应用于初筛环节时,若干个市调问卷事件可以是确定环节(召回环节)从市调问卷事件集中确定的市调问卷事件;换言之,确定环节可以依据多种事件检索规则从市调问卷事件集中确定初选问卷事件,合并每种事件检索规则下确定的初选问卷事件,可以得到若干个市调问卷事件。其中,事件检索规则定义了从市调问卷事件集中确定市调问卷事件的方式,多种事件检索规则可以但不限于以下至少两种:热力检索规则,关键词检索规则,AI算法检索规则。多种事件检索规则的市调问卷事件确定过程可以是同步的,从而能够提高市调问卷事件的召回时效性,通过多种确定同步,多种确定结果一并由文本语义分析网络进行逆向影响评分识别,充分引入调查问卷用户的关注特征和市调问卷事件的事件细节,能够尽可能全面地提炼出多种确定结果中的调查问卷用户的市调问卷关注事件。
当应用于市场调查处理系统的调查问卷分析方法应用于二次筛选环节时,若干个市调问卷事件可以是调查问卷用户在初筛环节的市调问卷关注事件,也即,若干个市调问卷事件是初筛环节的输出结果。
市调问卷事件的市调问卷事件属性数据可以包括:市调问卷事件的事件关键词,市调问卷事件的市调问卷事件种类(比如,市调问卷事件的上游判别种类、市调问卷事件的下游判别种类等)、市调问卷事件的调研目的、调研需求等。
步骤103,对调查问卷用户的调查问卷用户属性数据与目标市调问卷事件的市调问卷事件属性数据进行语义碰撞处理,得到调查问卷用户与目标市调问卷事件之间的调查问卷文本碰撞语义。
市调问卷事件的个数为若干个,需要对调查问卷用户的调查问卷用户属性数据与每个市调问卷事件的市调问卷事件属性数据进行语义碰撞处理,得到调查问卷用户与相应市调问卷事件之间的调查问卷文本碰撞语义,以若干个市调问卷事件中的任一市调问卷事件(可以表示为目标市调问卷事件)为例,需要对调查问卷用户的调查问卷用户属性数据与目标市调问卷事件的市调问卷事件属性数据进行语义碰撞处理,得到调查问卷用户与目标市调问卷事件之间的调查问卷文本碰撞语义,调查问卷用户与目标市调问卷事件之间的调查问卷文本碰撞语义可以反映调查问卷用户的调查问卷用户属性数据与目标市调问卷事件的市调问卷事件属性数据之间的文本语义碰撞特征。对调查问卷用户的调查问卷用户属性数据与目标市调问卷事件的市调问卷事件属性数据进行语义碰撞处理的过程,示例性可以包括:对调查问卷用户的调查问卷用户属性数据和目标市调问卷事件的市调问卷事件属性数据进行特征连接,得到调查问卷用户与目标市调问卷事件之间的联动属性数据;对联动属性数据进行属性碰撞,得到调查问卷用户与目标市调问卷事件之间的调查问卷文本碰撞语义。联动属性数据的属性碰撞过程,示例性可以包括:可以通过语义碰撞处理分支中的特征择选单元对调查问卷用户与目标市调问卷事件之间的联动属性数据进行特征择选,得到调查问卷用户与目标市调问卷事件之间的基础调查问卷文本语义,联动属性数据的个数可以为若干个,联动属性数据对应的基础调查问卷文本语义的个数可以为若干个;然后,可以通过语义碰撞处理分支中的融合单元对若干个联动属性数据对应的基础调查问卷文本语义进行语义组合,得到调查问卷用户与目标市调问卷事件之间的调查问卷文本碰撞语义。
调查问卷用户与目标市调问卷事件之间的调查问卷文本碰撞语义,表征调查问卷用户的调查问卷用户属性数据与目标市调问卷事件的市调问卷事件属性数据之间的文本语义碰撞特征的精度,是由调查问卷用户的调查问卷用户属性数据与目标市调问卷事件的市调问卷事件属性数据之间的特征碰撞适应性决定的。联动属性数据示例性可以为K级联动属性数据,K级联动属性数据是指联动属性数据中包含的调查问卷用户属性数据和市调问卷事件属性数据的个数一共为K个,K为不小于2的整数;比如,二级联动属性数据是指联动属性数据中包含的调查问卷用户属性数据和市调问卷事件属性数据的个数一共为两个,二级联动属性数据中调查问卷用户属性数据和市调问卷事件属性数据的整合方式可以包括:调查问卷用户属性数据+市调问卷事件属性数据;又如,三级联动属性数据是指联动属性数据中包含的调查问卷用户属性数据和市调问卷事件属性数据的个数一共为三个,三级联动属性数据中调查问卷用户属性数据和市调问卷事件属性数据的整合方式示例性可以为如下其中一类:调查问卷用户属性数据+市调问卷事件属性数据+调查问卷用户属性数据、调查问卷用户属性数据+市调问卷事件属性数据+市调问卷事件属性数据、市调问卷事件属性数据+调查问卷用户属性数据+市调问卷事件属性数据、以及调查问卷用户属性数据+调查问卷用户属性数据+市调问卷事件属性数据。
接下来,对调查问卷用户的调查问卷用户属性数据与目标市调问卷事件的市调问卷事件属性数据之间的特征连接方式进行说明。
在一些示例下,调查问卷用户的调查问卷用户属性数据与目标市调问卷事件的市调问卷事件属性数据之间的特征连接,可以是依据联动属性数据生成策略实现的。换言之:可以获得联动属性数据生成策略,联动属性数据生成策略可以指示生成联动属性数据的调查问卷用户属性数据种类和市调问卷事件种类;联动属性数据生成策略可以是预先配置的,比如可以通过历史数据判断什么调查问卷用户属性数据种类下的调查问卷用户属性数据和什么市调问卷事件属性数据种类下的市调问卷事件属性数据之间可以生成出适配的联动属性数据;比如,调查问卷用户的情绪向量+市调问卷事件的市调问卷事件种类可以整合得到的联动属性数据,调查问卷用户的画像特征+市调问卷事件的市调问卷事件种类可以整合得到的联动属性数据,前者的适配度高于后者。然后,可以基于联动属性数据生成策略,对调查问卷用户的调查问卷用户属性数据与目标市调问卷事件的市调问卷事件属性数据进行属性拼接,得到联动属性数据。这样,依据基于历史数据确定的联动属性数据生成策略,可以适应性地生成调查问卷用户与目标市调问卷事件之间的联动属性数据,这样可以使得依据联动属性数据提取的调查问卷文本碰撞语义,可以精准反映调查问卷用户的调查问卷用户属性数据与目标市调问卷事件的市调问卷事件属性数据之间的文本语义碰撞特征。
在另一些示例下,联动属性数据可以在匹配判别后获得。换言之:首先,可以对调查问卷用户的调查问卷用户属性数据和目标市调问卷事件的市调问卷事件属性数据进行属性拼接,得到调查问卷用户与目标市调问卷事件之间的若干个基础属性数据。其次,可以分别对每个基础属性数据进行匹配判别,得到每个基础属性数据对应的匹配性;任一基础属性数据对应的匹配性用作表征构成基础属性数据的调查问卷用户属性数据与市调问卷事件属性数据之间相关权重,也即,用作指示组成基础属性数据的调查问卷用户属性数据与市调问卷事件属性数据之间的特征碰撞适应性。然后,可以基于每个基础属性数据对应的匹配性,对若干个基础属性数据进行优化,得到联动属性数据;优化是指剔除若干个基础属性数据中相关权重(特征交互匹配性)较低的基础属性数据,筛选出若干个基础属性数据中相关权重较高的基础属性数据作为联动属性数据,联动属性数据可以是若干个基础属性数据中,匹配性大于匹配限值的基础属性数据。这样,通过对基础属性数据进行匹配判别,可以将相关权重较高的基础属性数据作为联动属性数据,相关权重较高的基础属性数据包括的调查问卷用户属性数据和市调问卷事件属性数据之间的组合较为适配,以便尽可能适配地生成调查问卷用户与目标市调问卷事件之间的联动属性数据,这样可以使得依据联动属性数据提取的调查问卷文本碰撞语义,可以精准反映调查问卷用户的调查问卷用户属性数据与目标市调问卷事件的市调问卷事件属性数据之间的文本语义碰撞特征。
步骤104,依据第一调查问卷文本语义、目标市调问卷事件的第二调查问卷文本语义以及调查问卷文本碰撞语义,对调查问卷用户与目标市调问卷事件之间的联系权重进行识别,得到目标市调问卷事件对于调查问卷用户的影响评分。
本发明实施例中,步骤104可以是通过文本语义分析网络中的联动分支执行的,首先,可以通过联动分支中的融合单元对第一调查问卷文本语义、目标市调问卷事件的第二调查问卷文本语义和调查问卷文本碰撞语义进行语义组合,得到调查问卷文本组合语义;其次,可以通过联动分支中的联系权重分析层依据调查问卷文本组合语义,对调查问卷用户与目标市调问卷事件之间的联系权重进行识别,得到联系权重识别信息;然后,可以通过联动分支中的生成单元采用RELU算子对联系权重识别信息进行激活,得到目标市调问卷事件对于调查问卷用户的影响评分。
通过联动分支中的联系权重分析层依据调查问卷文本组合语义,对调查问卷用户与目标市调问卷事件之间的联系权重进行识别,得到联系权重识别信息,可以包括:从调查问卷文本语义的热力层面对调查问卷文本组合语义进行处理,得到调查问卷用户与目标市调问卷事件在调查问卷文本语义热力层面下的第一联系权重数据;从调查问卷文本语义的碰撞层面对调查问卷文本组合语义进行处理,得到调查问卷用户与目标市调问卷事件在调查问卷文本语义的碰撞层面下的第二联系权重数据,换言之,联系权重识别信息可以包括第一联系权重数据和第二联系权重数据。在此基础上,通过联动分支中的生成单元采用RELU算子对联系权重识别信息进行激活,得到目标市调问卷事件对于调查问卷用户的影响评分,可以包括:通过联动分支中的生成单元采用RELU算子对第一联系权重数据和第二联系权重数据进行激活,得到目标市调问卷事件对于调查问卷用户的影响评分。
步骤105,基于若干个市调问卷事件中每个市调问卷事件对于调查问卷用户的影响评分,对若干个市调问卷事件进行事件筛选,得到调查问卷用户的市调问卷关注事件。
其中,在确定若干个市调问卷事件中每个市调问卷事件对于调查问卷用户的影响评分后,可以基于若干个市调问卷事件中每个市调问卷事件对于调查问卷用户的影响评分,对若干个市调问卷事件进行事件筛选,得到调查问卷用户的市调问卷关注事件;事件筛选是指剔除若干个市调问卷事件中逆向影响评分较低的市调问卷事件,筛选出若干个市调问卷事件中逆向影响评分较高的市调问卷事件作为调查问卷用户的市调问卷关注事件。换言之,逆向影响评分可以采用用户关注系数进行表示,用户关注系数越高,表示逆向影响评分(调查问卷用户对于市调问卷事件的关注度)越高;市调问卷关注事件可以是若干个市调问卷事件中,用户关注系数大于系数限值的基础属性数据。
当应用于市场调查处理系统的调查问卷分析方法应用于初筛环节时,调查问卷用户的市调问卷关注事件可以作为调查问卷用户在初筛环节的市调问卷关注事件输出至二次筛选环节;当应用于市场调查处理系统的调查问卷分析方法应用于二次筛选环节时,调查问卷用户的市调问卷关注事件可以作为调查问卷用户在二次筛选环节的市调问卷关注事件输出至后续任务环节。
本发明实施例中,可以依据调查问卷用户的第一调查问卷文本语义,市调问卷事件的第二调查问卷文本语义,以及调查问卷用户与市调问卷事件之间的调查问卷文本碰撞语义,识别市调问卷事件对于调查问卷用户的影响评分;第一调查问卷文本语义可以反映调查问卷用户的调查问卷用户属性数据,第二调查问卷文本语义可以反映市调问卷事件的市调问卷事件属性数据,如果依据第一调查问卷文本语义和第二调查问卷文本语义,识别市调问卷事件对于调查问卷用户的影响评分,则难以将调查问卷用户与市调问卷事件之间的语义碰撞考虑在内,从而难以保障影响评分的精度和可信度。本发明实施例中考虑了调查问卷用户与市调问卷事件之间的调查问卷文本碰撞语义,调查问卷文本碰撞语义可以反映调查问卷用户的调查问卷用户属性数据与市调问卷事件的市调问卷事件属性数据之间的文本语义碰撞特征,换言之,考虑了调查问卷用户与市调问卷事件质检的语义碰撞和混淆,从而能够提高识别的市调问卷事件对于调查问卷用户的影响评分的精度,以便依据市调问卷事件对于调查问卷用户的影响评分,在市调问卷事件尽可能精准可靠地定位调查问卷用户的市调问卷关注事件,保障调查问卷文本分析的质量。
在另一种设计思路下,应用于市场调查处理系统的调查问卷分析方法包括步骤201-步骤208。
步骤201,获得反映调查问卷用户的调查问卷用户属性数据的第一调查问卷文本语义。
步骤202,获得反映若干个市调问卷事件中每个市调问卷事件的市调问卷事件属性数据的第二调查问卷文本语义。
其中,市调问卷事件的市调问卷事件属性数据的第二调查问卷文本语义可以是非实时获得的,或者可以是实时获得的。
(1)非实时获取:可以分别依据多种事件检索规则中的每种事件检索规则,确定每种事件检索规则下的初选问卷事件的事件关键词,通过合并多种事件检索规则下的初选问卷事件的事件关键词,得到若干个市调问卷事件的事件关键词,然后,可以基于若干个市调问卷事件的事件关键词,在问卷事件文本大数据池中遍历若干个市调问卷事件中每个市调问卷事件的第二调查问卷文本语义。这样可以提高获取第二调查问卷文本语义的效率,减少运算开销。
(2)实时获取:可以分别依据多种事件检索规则中的每种事件检索规则,确定每种事件检索规则下的初选问卷事件的事件关键词,通过合并多种事件检索规则下的初选问卷事件的事件关键词,得到若干个市调问卷事件的事件关键词;然后,可以依据若干个市调问卷事件的事件关键词,从市调问卷事件集中获得市调问卷事件的市调问卷事件属性数据,对若干个市调问卷事件中每个市调问卷事件的市调问卷事件属性数据进行属性碰撞,得到相应市调问卷事件的第二调查问卷文本语义。这样,当市调问卷事件的市调问卷事件属性数据存在更新时,市调问卷事件的第二调查问卷文本语义能够准确反映市调问卷事件最新的市调问卷事件属性数据,从而能够提高市调问卷事件的第二调查问卷文本语义表征市调问卷事件的市调问卷事件属性数据的精度。
其中,实时获得市调问卷事件的第二调查问卷文本语义和非实时获得市调问卷事件的第二调查问卷文本语义都需要对市调问卷事件的市调问卷事件属性数据进行属性碰撞。
步骤203,对调查问卷用户的调查问卷用户属性数据与目标市调问卷事件的市调问卷事件属性数据进行语义碰撞处理,得到调查问卷用户与目标市调问卷事件之间的调查问卷文本碰撞语义。
步骤204,对第一调查问卷文本语义、目标市调问卷事件的第二调查问卷文本语义、以及调查问卷文本碰撞语义进行语义组合,得到调查问卷文本组合语义。
步骤205,从调查问卷文本语义的热力层面对调查问卷文本组合语义进行处理,得到调查问卷用户与目标市调问卷事件在调查问卷文本语义热力层面下的第一联系权重数据。
其中,联系权重数据可以理解为相关性数据。
步骤206,从调查问卷文本语义的碰撞层面对调查问卷文本组合语义进行处理,得到调查问卷用户与目标市调问卷事件在调查问卷文本语义的碰撞层面下的第二联系权重数据。
步骤207,基于第一联系权重数据和第二联系权重数据,识别目标市调问卷事件对于调查问卷用户的影响评分。
在得到第一联系权重数据和第二联系权重数据后,可以对第一联系权重数据和第二联系权重数据进行语义组合,然后可以对语义组合结果进行激活,得到目标市调问卷事件对于调查问卷用户的影响评分。
步骤208,基于若干个市调问卷事件中每个市调问卷事件对于调查问卷用户的影响评分,对若干个市调问卷事件进行事件筛选,得到调查问卷用户的市调问卷关注事件。
在另一些可能的设计思路下,文本语义分析网络的调试过程可以包括:首先,可以获得调试学习信息,调试学习信息包括调查问卷用户示例的调查问卷用户属性数据、市调问卷事件示例的市调问卷事件属性数据、以及调查问卷用户示例对市调问卷事件示例的逆向影响先验评分(可以理解为,调查问卷用户示例对市调问卷事件示例的真实逆向影响评分)。其次,可以通过调查问卷用户处理分支对调查问卷用户示例的调查问卷用户属性数据进行属性碰撞,得到调查问卷用户示例的用户问卷文本语义;通过市调问卷事件处理分支对市调问卷事件示例的市调问卷事件属性数据进行属性碰撞,得到市调问卷事件示例的事件问卷文本语义;通过联动分支获得调查问卷用户示例与所述市调问卷事件示例之间的调查问卷文本碰撞语义示例;以及,基于调查问卷用户示例的用户问卷文本语义、市调问卷事件示例的事件问卷文本语义和调查问卷文本碰撞语义示例,对调查问卷用户示例和市调问卷事件示例进行影响分析,得到调查问卷用户示例对市调问卷事件示例的逆向影响识别评分(可以理解为,识别的调查问卷用户示例对市调问卷事件示例的逆向影响评分预测结果);在文本语义分析网络的调试过程中,调查问卷用户属性数据的属性碰撞、市调问卷事件属性数据的属性碰撞、以及调查问卷用户与市调问卷事件之间的联系权重识别等过程,与文本语义分析网络的应用阶段类似。然后,可以基于逆向影响先验评分与逆向影响识别评分之间的区别,对文本语义分析网络进行调试。
在文本语义分析网络的调试过程中,文本语义分析网络的网络变量可以针对性调整,在此展开说明。
本发明实施例中,可以依据调查问卷用户的第一调查问卷文本语义,市调问卷事件的第二调查问卷文本语义,以及调查问卷用户与市调问卷事件之间的调查问卷文本碰撞语义,识别市调问卷事件对于调查问卷用户的影响评分;第一调查问卷文本语义可以反映调查问卷用户的调查问卷用户属性数据,第二调查问卷文本语义可以反映市调问卷事件的市调问卷事件属性数据,如果依据第一调查问卷文本语义和第二调查问卷文本语义,识别市调问卷事件对于调查问卷用户的影响评分,则难以将调查问卷用户与市调问卷事件之间的语义碰撞考虑在内,从而难以保障影响评分的精度和可信度。
本发明实施例中考虑了调查问卷用户与市调问卷事件之间的调查问卷文本碰撞语义,调查问卷文本碰撞语义可以反映调查问卷用户的调查问卷用户属性数据与市调问卷事件的市调问卷事件属性数据之间的文本语义碰撞特征,换言之,考虑了调查问卷用户与市调问卷事件质检的语义碰撞和混淆,从而能够提高识别的市调问卷事件对于调查问卷用户的影响评分的精度,以便依据市调问卷事件对于调查问卷用户的影响评分,在市调问卷事件尽可能精准可靠地定位调查问卷用户的市调问卷关注事件,保障调查问卷文本分析的质量。
在一些可独立的实施例中,在基于所述若干个市调问卷事件中每个市调问卷事件对于所述调查问卷用户的影响评分,对所述若干个市调问卷事件进行事件筛选,得到所述调查问卷用户的市调问卷关注事件之后,所述方法还包括:基于所述市调问卷关注事件,对所述调查问卷用户的调研问卷大数据进行匿名处理,得到匿名调研问卷报告;将所述匿名调研问卷报告进行发布。
在本发明实施例中,在确定出市调问卷关注事件之后,可以反映调查问卷用户所关注的方面,在此基础上如果直接生成调研问卷报告,可能会造成调查问卷用户的“大数据杀熟”问题,基于此,通过对调查问卷用户的调研问卷大数据(比如调查问卷用户特征以及调查问卷用户对应的调研问卷内容)进行针对性的匿名处理之后再进行发布,一方面可以保障匿名调研问卷报告的可用性,另一方面还可以尽量保护调查问卷用户的隐私安全。
在一些可独立的实施例中,基于所述市调问卷关注事件,对所述调查问卷用户的调研问卷大数据进行匿名处理,包括:获取针对调查问卷用户的市调隐私数据集合,所述市调隐私数据集合包括至少两组市调隐私数据;获得所述市调隐私数据集合中的各组市调隐私数据与所述调查问卷用户之间的隐私表征权重;根据所述各组市调隐私数据对应的隐私表征权重,以及所述各组市调隐私数据的隐私内容向量,对所述各组市调隐私数据进行整理,得到相应的市调隐私数据队列;基于所述市调隐私数据队列生成针对所述调查问卷用户的目标隐私匿名指示队列,所述目标隐私匿名指示队列包括最少两个目标隐私匿名指示;通过所述目标隐私匿名指示队列对所述市调隐私数据集合进行隐私匿名处理。
在一些可独立的实施例中,所述根据所述各组市调隐私数据对应的隐私表征权重,以及所述各组市调隐私数据的隐私内容向量,对所述各组市调隐私数据进行整理,得到相应的市调隐私数据队列,包括:根据所述各组市调隐私数据对应的隐私表征权重,以及所述各组市调隐私数据的隐私内容向量,对所述各组市调隐私数据进行加权,得到最少两个市调隐私数据子簇;对各个市调隐私数据子簇进行整理,并分别对所述各个市调隐私数据子簇中的各组市调隐私数据进行整理,得到所述市调隐私数据队列。
在一些可独立的实施例中,所述根据所述各组市调隐私数据对应的隐私表征权重,以及所述各组市调隐私数据的隐私内容向量,对所述各组市调隐私数据进行加权,得到最少两个市调隐私数据子簇,包括:分别根据所述各组市调隐私数据对应的隐私表征权重,对所述各组市调隐私数据的隐私内容向量进行加权,得到所述各组市调隐私数据的加权隐私内容向量;根据所述各组市调隐私数据的加权隐私内容向量对所述各组市调隐私数据进行分团,得到最少两个市调隐私数据子簇。
本发明实施例中考虑了各组市调隐私数据对应的隐私表征权重,以及各组市调隐私数据的隐私内容向量,这样能够基于市调隐私数据队列生成针对调查问卷用户的目标隐私匿名指示队列,从而通过目标隐私匿名指示队列进行差异化的隐私匿名处理,以保障匿名调研问卷报告的可用性并尽量保护调查问卷用户的隐私安全。
进一步地,还提供了一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时实现上述的方法。
在本发明实施例所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置和方法实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本发明的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本发明各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (9)
1.一种应用于市场调查处理系统的调查问卷分析方法,其特征在于,应用于AI调查问卷分析系统,所述方法包括:
获得反映调查问卷用户的调查问卷用户属性数据的第一调查问卷文本语义,以及获得反映若干个市调问卷事件中每个市调问卷事件的市调问卷事件属性数据的第二调查问卷文本语义;
对所述调查问卷用户的调查问卷用户属性数据与目标市调问卷事件的市调问卷事件属性数据进行语义碰撞处理,得到所述调查问卷用户与所述目标市调问卷事件之间的调查问卷文本碰撞语义;其中,所述目标市调问卷事件是所述若干个市调问卷事件中的任一市调问卷事件,所述调查问卷文本碰撞语义反映所述调查问卷用户的调查问卷用户属性数据与所述目标市调问卷事件的市调问卷事件属性数据之间的文本语义碰撞特征;
依据所述第一调查问卷文本语义、所述目标市调问卷事件的第二调查问卷文本语义以及所述调查问卷文本碰撞语义,对所述调查问卷用户与所述目标市调问卷事件之间的联系权重进行识别,得到所述目标市调问卷事件对于所述调查问卷用户的影响评分;
基于所述若干个市调问卷事件中每个市调问卷事件对于所述调查问卷用户的影响评分,对所述若干个市调问卷事件进行事件筛选,得到所述调查问卷用户的市调问卷关注事件;
其中,所述对所述调查问卷用户的调查问卷用户属性数据与目标市调问卷事件的市调问卷事件属性数据进行语义碰撞处理,得到所述调查问卷用户与所述目标市调问卷事件之间的调查问卷文本碰撞语义,包括:
对所述调查问卷用户的调查问卷用户属性数据和所述目标市调问卷事件的市调问卷事件属性数据进行特征连接,得到所述调查问卷用户与所述目标市调问卷事件之间的联动属性数据;
对所述联动属性数据进行属性碰撞,得到所述调查问卷用户与所述目标市调问卷事件之间的调查问卷文本碰撞语义;
联动属性数据的属性碰撞过程包括:通过语义碰撞处理分支中的特征择选单元对调查问卷用户与目标市调问卷事件之间的联动属性数据进行特征择选,得到调查问卷用户与目标市调问卷事件之间的基础调查问卷文本语义,联动属性数据的个数为若干个,联动属性数据对应的基础调查问卷文本语义的个数为若干个;通过语义碰撞处理分支中的融合单元对若干个联动属性数据对应的基础调查问卷文本语义进行语义组合,得到调查问卷用户与目标市调问卷事件之间的调查问卷文本碰撞语义。
2.根据权利要求1所述的方法,其特征在于,所述对所述调查问卷用户的调查问卷用户属性数据和所述目标市调问卷事件的市调问卷事件属性数据进行特征连接,得到所述调查问卷用户与所述目标市调问卷事件之间的联动属性数据,包括:
获得联动属性数据生成策略,所述联动属性数据生成策略用于指示生成所述联动属性数据的调查问卷用户属性数据种类和市调问卷事件种类;
基于所述联动属性数据生成策略,对所述调查问卷用户的调查问卷用户属性数据与所述目标市调问卷事件的市调问卷事件属性数据进行属性拼接,得到所述联动属性数据。
3.根据权利要求1所述的方法,其特征在于,所述对所述调查问卷用户的调查问卷用户属性数据和所述目标市调问卷事件的市调问卷事件属性数据进行特征连接,得到所述调查问卷用户与所述目标市调问卷事件之间的联动属性数据,包括:
对所述调查问卷用户的调查问卷用户属性数据和所述目标市调问卷事件的市调问卷事件属性数据进行属性拼接,得到所述调查问卷用户与所述目标市调问卷事件之间的若干个基础属性数据;
分别对每个所述基础属性数据进行匹配判别,得到每个所述基础属性数据对应的匹配性;其中,任一所述基础属性数据对应的匹配性用于表征构成所述基础属性数据的调查问卷用户属性数据与市调问卷事件属性数据之间相关权重;
基于每个所述基础属性数据对应的匹配性,对若干个所述基础属性数据进行优化,得到所述联动属性数据。
4.根据权利要求1所述的方法,其特征在于,所述获得反映调查问卷用户的调查问卷用户属性数据的第一调查问卷文本语义,包括:
获得所述调查问卷用户的调查问卷用户属性数据;
对所述调查问卷用户的调查问卷用户属性数据进行属性碰撞,得到所述第一调查问卷文本语义。
5.根据权利要求4所述的方法,其特征在于,所述调查问卷用户的调查问卷用户属性数据包括X个用户属性特征场景中的调查问卷用户属性数据,X为不小于2的整数;所述对所述调查问卷用户的调查问卷用户属性数据进行属性碰撞,得到所述第一调查问卷文本语义,包括:
分别对所述X个用户属性特征场景中的每个用户属性特征场景中的调查问卷用户属性数据进行属性碰撞,得到对应用户属性特征场景中的用户问卷文本语义;
对所述X个用户属性特征场景中的用户问卷文本语义进行相似度解析,得到所述第一调查问卷文本语义。
6.根据权利要求4所述的方法,其特征在于,所述对所述调查问卷用户的调查问卷用户属性数据进行属性碰撞,得到所述第一调查问卷文本语义,包括:
对所述调查问卷用户的调查问卷用户属性数据进行关注点挖掘,得到所述调查问卷用户在若干个关注层面下的用户问卷文本语义;
对所述调查问卷用户在若干个关注层面下的用户问卷文本语义进行联系语义解析,得到所述第一调查问卷文本语义。
7.根据权利要求1所述的方法,其特征在于,
当所述第二调查问卷文本语义的获得步骤包括非实时获取时,所述获得反映若干个市调问卷事件中每个市调问卷事件的市调问卷事件属性数据的第二调查问卷文本语义,包括:分别依据多种事件检索规则中的每种事件检索规则,确定每种事件检索规则下的初选问卷事件的事件关键词;合并所述多种事件检索规则下的初选问卷事件的事件关键词,得到所述若干个市调问卷事件的事件关键词;基于所述若干个市调问卷事件的事件关键词,在问卷事件文本大数据池中遍历所述若干个市调问卷事件中每个市调问卷事件的第二调查问卷文本语义;
当所述第二调查问卷文本语义的获得步骤包括实时获取时,所述获得反映若干个市调问卷事件中每个市调问卷事件的市调问卷事件属性数据的第二调查问卷文本语义,包括:分别依据多种事件检索规则中的每种事件检索规则,确定每种事件检索规则下的初选问卷事件的事件关键词;合并所述多种事件检索规则下的初选问卷事件的事件关键词,得到所述若干个市调问卷事件的事件关键词;依据所述若干个市调问卷事件的事件关键词,从市调问卷事件集中获得所述若干个市调问卷事件的市调问卷事件属性数据;对所述若干个市调问卷事件中每个市调问卷事件的市调问卷事件属性数据进行属性碰撞,得到相应市调问卷事件的第二调查问卷文本语义;
其中,所述依据所述第一调查问卷文本语义、所述目标市调问卷事件的第二调查问卷文本语义以及所述调查问卷文本碰撞语义,对所述调查问卷用户与所述目标市调问卷事件之间的联系权重进行识别,得到所述目标市调问卷事件对于所述调查问卷用户的影响评分,包括:
对所述第一调查问卷文本语义、所述目标市调问卷事件的第二调查问卷文本语义、以及所述调查问卷文本碰撞语义进行语义组合,得到调查问卷文本组合语义;
从调查问卷文本语义的热力层面对所述调查问卷文本组合语义进行处理,得到所述调查问卷用户与所述目标市调问卷事件在所述调查问卷文本语义热力层面下的第一联系权重数据;
从调查问卷文本语义的碰撞层面对所述调查问卷文本组合语义进行处理,得到所述调查问卷用户与所述目标市调问卷事件在所述调查问卷文本语义的碰撞层面下的第二联系权重数据;
基于所述第一联系权重数据和所述第二联系权重数据,识别所述目标市调问卷事件对于所述调查问卷用户的影响评分。
8.根据权利要求1所述的方法,其特征在于,所述应用于市场调查处理系统的调查问卷分析方法通过文本语义分析网络实现,所述文本语义分析网络包括调查问卷用户处理分支、联动分支和市调问卷事件处理分支;所述文本语义分析网络的调试过程,包括:
获得调试学习信息,所述调试学习信息包括调查问卷用户示例的调查问卷用户属性数据、市调问卷事件示例的市调问卷事件属性数据、以及所述调查问卷用户示例对所述市调问卷事件示例的逆向影响先验评分;
通过所述调查问卷用户处理分支对所述调查问卷用户示例的调查问卷用户属性数据进行属性碰撞,得到所述调查问卷用户示例的用户问卷文本语义;
通过所述市调问卷事件处理分支对所述市调问卷事件示例的市调问卷事件属性数据进行属性碰撞,得到所述市调问卷事件示例的事件问卷文本语义;
通过所述联动分支获得所述调查问卷用户示例与所述市调问卷事件示例之间的调查问卷文本碰撞语义示例;
以及,基于所述调查问卷用户示例的用户问卷文本语义、所述市调问卷事件示例的事件问卷文本语义和所述调查问卷文本碰撞语义示例,对所述调查问卷用户示例和所述市调问卷事件示例进行影响分析,得到所述调查问卷用户示例对所述市调问卷事件示例的逆向影响识别评分;
基于所述逆向影响先验评分与所述逆向影响识别评分之间的区别,对所述文本语义分析网络进行调试。
9.一种AI调查问卷分析系统,其特征在于,包括处理器和存储器;所述处理器和所述存储器通信连接,所述处理器用于从所述存储器中读取计算机程序并执行,以实现权利要求1-8任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311025201.2A CN117195907B (zh) | 2023-08-15 | 2023-08-15 | 应用于市场调查处理系统的调查问卷分析方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311025201.2A CN117195907B (zh) | 2023-08-15 | 2023-08-15 | 应用于市场调查处理系统的调查问卷分析方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117195907A CN117195907A (zh) | 2023-12-08 |
CN117195907B true CN117195907B (zh) | 2024-04-02 |
Family
ID=88995183
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311025201.2A Active CN117195907B (zh) | 2023-08-15 | 2023-08-15 | 应用于市场调查处理系统的调查问卷分析方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117195907B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117557005B (zh) * | 2024-01-08 | 2024-05-17 | 北京沃东天骏信息技术有限公司 | 调研数据处理方法、装置和存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110245213A (zh) * | 2019-05-08 | 2019-09-17 | 平安科技(深圳)有限公司 | 调查问卷生成方法、装置、设备和存储介质 |
CN114297476A (zh) * | 2021-12-08 | 2022-04-08 | 苏州众言网络科技股份有限公司 | 基于用户标签的问卷调查方法、系统、电子设备及存储介质 |
CN115438643A (zh) * | 2022-09-30 | 2022-12-06 | 中国建设银行股份有限公司 | 一种问卷模板配置方法、装置、设备、存储介质及产品 |
CN116308497A (zh) * | 2023-02-01 | 2023-06-23 | 上海哔哩哔哩科技有限公司 | 数据处理方法及装置 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3587120B2 (ja) * | 2000-03-15 | 2004-11-10 | 日本電気株式会社 | アンケート回答分析システム |
US20140108095A1 (en) * | 2012-10-15 | 2014-04-17 | Iperceptions Inc. | System and method for generating and providing customized survey questionnaires |
-
2023
- 2023-08-15 CN CN202311025201.2A patent/CN117195907B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110245213A (zh) * | 2019-05-08 | 2019-09-17 | 平安科技(深圳)有限公司 | 调查问卷生成方法、装置、设备和存储介质 |
CN114297476A (zh) * | 2021-12-08 | 2022-04-08 | 苏州众言网络科技股份有限公司 | 基于用户标签的问卷调查方法、系统、电子设备及存储介质 |
CN115438643A (zh) * | 2022-09-30 | 2022-12-06 | 中国建设银行股份有限公司 | 一种问卷模板配置方法、装置、设备、存储介质及产品 |
CN116308497A (zh) * | 2023-02-01 | 2023-06-23 | 上海哔哩哔哩科技有限公司 | 数据处理方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN117195907A (zh) | 2023-12-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Pillai et al. | Misinformation detection using an ensemble method with emphasis on sentiment and emotional analyses | |
US9454528B2 (en) | Method and system for creating ordered reading lists from unstructured document sets | |
CN112256845B (zh) | 意图识别方法、装置、电子设备和计算机可读存储介质 | |
CN112182230B (zh) | 一种基于深度学习的文本数据分类方法和装置 | |
KR101565759B1 (ko) | 토픽 템플릿과 연관어에 기반한 관련토픽 및 경쟁토픽 탐지 시스템, 탐지 방법 및 탐지 장치 | |
CN117195907B (zh) | 应用于市场调查处理系统的调查问卷分析方法及系统 | |
CN112685642A (zh) | 一种标签推荐方法、装置、电子设备及存储介质 | |
US20160217200A1 (en) | Dynamic creation of domain specific corpora | |
CN112528031A (zh) | 一种工单智能派发方法和系统 | |
CN114647627A (zh) | 基于数据属性对数据集进行排序 | |
Azkan et al. | Uncovering research streams in the data economy using text mining algorithms | |
CN118113806A (zh) | 一种大模型检索增强生成的可解释事件脉络生成方法 | |
KR102296420B1 (ko) | 개인정보보호 정책서 분석 기반 개인정보 수집/활용자의 신뢰도 평가 방법 및 장치 | |
CN111259975B (zh) | 分类器的生成方法及装置、文本的分类方法及装置 | |
Silva et al. | Design and development of a custom system of technology surveillance and competitive intelligence in SMEs | |
Panagiotou et al. | Towards selecting informative content for cyber threat intelligence | |
Salih | Explainable Artificial Intelligence and Multicollinearity: A Mini Review of Current Approaches | |
KR102282328B1 (ko) | Lstm을 이용한 국가별 선호도 예측 시스템 및 방법 | |
CN115309854A (zh) | 对抗样本生成方法、装置和计算机设备 | |
CN110717016A (zh) | 一种融合技术领域确定方法、装置、设备及存储介质 | |
KR100918361B1 (ko) | 고속화 검색 모델링 시스템 및 방법 | |
Yang et al. | APPIC: Finding the hidden scene behind description files for Android apps | |
KR102461665B1 (ko) | 워드 임베딩 및 순환 컨볼루션을 이용한 짧은 문장 분류 방법 및 장치 | |
WO2024179152A1 (zh) | 意图识别样本的生成、模型训练、意图识别方法及装置 | |
US11222057B2 (en) | Methods and systems for generating descriptions utilizing extracted entity descriptors |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |