CN117032637A - 基于大数据的软件需求挖掘方法及系统 - Google Patents
基于大数据的软件需求挖掘方法及系统 Download PDFInfo
- Publication number
- CN117032637A CN117032637A CN202311080701.6A CN202311080701A CN117032637A CN 117032637 A CN117032637 A CN 117032637A CN 202311080701 A CN202311080701 A CN 202311080701A CN 117032637 A CN117032637 A CN 117032637A
- Authority
- CN
- China
- Prior art keywords
- user behavior
- sequence
- typical user
- data
- analysis
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000005065 mining Methods 0.000 title claims abstract description 80
- 238000000034 method Methods 0.000 title claims abstract description 46
- 230000006399 behavior Effects 0.000 claims abstract description 568
- 238000012512 characterization method Methods 0.000 claims abstract description 164
- 238000004458 analytical method Methods 0.000 claims abstract description 115
- 238000005457 optimization Methods 0.000 claims abstract description 85
- 238000007405 data analysis Methods 0.000 claims abstract description 47
- 238000013506 data mapping Methods 0.000 claims abstract description 35
- 230000005856 abnormality Effects 0.000 claims abstract description 26
- 238000012545 processing Methods 0.000 claims description 23
- 238000013507 mapping Methods 0.000 claims description 20
- 230000002776 aggregation Effects 0.000 claims description 7
- 238000004220 aggregation Methods 0.000 claims description 7
- 238000004590 computer program Methods 0.000 claims description 6
- 238000012216 screening Methods 0.000 claims description 4
- 238000013473 artificial intelligence Methods 0.000 abstract description 2
- 230000009471 action Effects 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 230000004931 aggregating effect Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000009412 basement excavation Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F8/00—Arrangements for software engineering
- G06F8/10—Requirements analysis; Specification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供的基于大数据的软件需求挖掘方法及系统,涉及人工智能技术领域。在本发明中,构建出用户行为序列表征数据;挖掘出用户行为序列表征数据中的各个表征数据成员对应的成员数据映射特征表示,基于成员数据映射特征表示,确定出待处理特征表示;基于待处理特征表示进行相关数据分析调整操作,依据典型用户行为序列、网络优化指标和相关数据分析调整操作形成的分析调整特征表示进行网络优化操作;依据网络优化操作形成的目标用户行为分析网络,形成行为异常识别结果;基于行为异常识别结果得到目标用户行为序列,基于目标用户行为序列得到目标需求表征数据。基于上述内容,可以在一定程度上提高需求挖掘的可靠度。
Description
技术领域
本发明涉及人工智能技术领域,具体而言,涉及一种基于大数据的软件需求挖掘方法及系统。
背景技术
软件需求的挖掘实际上是对用户需求的挖掘,使得可以基于挖掘出的用户需求,进行相应的软件开发。对于各种网络服务提供平台,用户可以基于网络服务提供平台进行相应的网络行为,从而形成相应的网络行为数据,如此,可以基于这些网络行为数据进行用户需求的挖掘,即挖掘出用户需要的服务等。但是,在现有技术中,存在着挖掘可靠度不佳的问题。
发明内容
有鉴于此,本发明的目的在于提供一种基于大数据的软件需求挖掘方法及系统,以在一定程度上提高需求挖掘的可靠度。
为实现上述目的,本发明实施例采用如下技术方案:
一种基于大数据的软件需求挖掘方法,包括:
基于典型用户行为序列包括的多个典型用户行为子序列和各个典型用户行为子序列的行为描述数据,构建出所述典型用户行为序列对应的用户行为序列表征数据,每一个所述典型用户行为子序列包括至少一个典型用户行为,所述典型用户行为属于相应的典型网络用户的历史网络行为,所述行为描述数据属于文本数据;
利用候选用户行为分析网络,挖掘出所述用户行为序列表征数据中的各个表征数据成员对应的多个成员数据映射特征表示,以及,基于所述多个成员数据映射特征表示,分别确定出各个所述表征数据成员对应的待处理特征表示;
基于各个所述表征数据成员对应的待处理特征表示进行相关数据分析调整操作,以及,依据所述典型用户行为序列、所述候选用户行为分析网络对应的网络优化指标和所述相关数据分析调整操作形成的各个所述表征数据成员对应的分析调整特征表示进行网络优化操作;
依据网络优化操作形成的目标用户行为分析网络,分别对各个待识别用户行为序列进行行为异常识别操作,以形成各个待识别用户行为序列对应的行为异常识别结果,所述行为异常识别结果用于反映各个所述待识别用户行为序列是否具有异常、异常的种类和/或异常的程度;
基于各个待识别用户行为序列对应的行为异常识别结果,对各个待识别用户行为序列进行筛选,以得到至少一个目标用户行为序列,以及,基于所述至少一个目标用户行为序列,对目标软件平台进行需求挖掘操作,以得到所述目标软件平台对应的目标需求表征数据,所述历史网络行为基于所述典型网络用户在所述目标软件平台进行相应的操作以形成。
在一些优选的实施例中,在上述基于大数据的软件需求挖掘方法中,所述基于典型用户行为序列包括的多个典型用户行为子序列和各个典型用户行为子序列的行为描述数据,构建出所述典型用户行为序列对应的用户行为序列表征数据的步骤,包括:
基于各个所述典型用户行为子序列的行为描述数据包括的至少一个局部行为描述数据,确定出各个所述典型用户行为子序列对应的用于反映所述局部行为描述数据的表征数据成员;
基于所述多个典型用户行为子序列在所述典型用户行为序列中的先后关系,将所述多个典型用户行为子序列中的每一个典型用户行为子序列对应的表征数据成员进行合并操作,以形成所述典型用户行为序列对应的用户行为序列表征数据。
在一些优选的实施例中,在上述基于大数据的软件需求挖掘方法中,所述基于典型用户行为序列包括的多个典型用户行为子序列和各个典型用户行为子序列的行为描述数据,构建出所述典型用户行为序列对应的用户行为序列表征数据的步骤,还包括:
基于所述多个典型用户行为子序列中第一典型用户行为子序列在所述典型用户行为序列中的先后关系表征信息,在所述用户行为序列表征数据中配置所述第一典型用户行为子序列对应的先后关系表征符号;
所述先后关系表征符号包括:
在所述典型用户行为序列中的第一个典型用户行为子序列对应的表征数据成员的前面配置的首端坐标表征符号;
在两个典型用户行为子序列对应的表征数据成员之间配置的间隔坐标表征符号,所述两个典型用户行为子序列在所述典型用户行为序列中具有相邻的先后关系;
在所述典型用户行为序列中的最后一个典型用户行为子序列对应的表征数据成员的后面配置的末端坐标表征符号。
在一些优选的实施例中,在上述基于大数据的软件需求挖掘方法中,所述利用候选用户行为分析网络,挖掘出所述用户行为序列表征数据中的各个表征数据成员对应的多个成员数据映射特征表示,以及,基于所述多个成员数据映射特征表示,确定出各个所述表征数据成员对应的待处理特征表示的步骤,包括:
利用候选用户行为分析网络,挖掘出所述用户行为序列表征数据中的各个表征数据成员对应的数据语义映射特征表示、数据坐标映射特征表示和数据范围映射特征表示,所述数据坐标映射特征表示用于反映所述表征数据成员在所述用户行为序列表征数据中的分布信息,所述数据范围映射特征表示用于反映所述表征数据成员在所述用户行为序列表征数据中所属的序列范围;
依据预先配置的聚合操作规则,将各个所述表征数据成员对应的多个成员数据映射特征表示进行聚合操作,以形成各个所述表征数据成员对应的待处理特征表示。
在一些优选的实施例中,在上述基于大数据的软件需求挖掘方法中,所述基于各个所述表征数据成员对应的待处理特征表示进行相关数据分析调整操作,以及,依据所述典型用户行为序列、所述候选用户行为分析网络对应的网络优化指标和所述相关数据分析调整操作形成的各个所述表征数据成员对应的分析调整特征表示进行网络优化操作的步骤,包括:
基于各个所述表征数据成员对应的待处理特征表示进行相关数据分析调整操作,以形成各个所述表征数据成员对应的分析调整特征表示;
将所述典型用户行为序列中第一个典型用户行为子序列以外的其他典型用户行为子序列,按照预先配置的可能性参数分别进行子序列调整处理,以形成对应的调整典型用户行为序列,所述子序列调整处理包括将所述其他典型用户行为子序列调整为预先配置的目标符号或将所述其他典型用户行为子序列调整为确定出的用户行为子序列;
对各个所述表征数据成员对应的分析调整特征表示进行标记,以作为待处理数据,以及,将所述目标符号对应的典型用户行为子序列进行子序列逆向调整为所述典型用户行为序列中的真实典型用户行为子序列,设置为第一网络优化指标对应的优化调整方向,以进行网络优化操作。
在一些优选的实施例中,在上述基于大数据的软件需求挖掘方法中,所述可能性参数包括调整判断可能性参数、符号调整可能性参数和子序列调整可能性参数,所述将所述典型用户行为序列中第一个典型用户行为子序列以外的其他典型用户行为子序列,按照预先配置的可能性参数分别进行子序列调整处理,以形成对应的调整典型用户行为序列的步骤,包括:
将所述典型用户行为序列中第一个典型用户行为子序列以外的每一个其他典型用户行为子序列,按照预先确定的调整判断可能性参数分别判断是否需要进行子序列调整处理;
针对需要进行子序列调整处理的每一个典型用户行为子序列,按照调整为目标符号的符号调整可能性参数、调整为确定出的用户行为子序列的子序列调整可能性参数分别进行子序列调整处理。
在一些优选的实施例中,在上述基于大数据的软件需求挖掘方法中,所述基于各个所述表征数据成员对应的待处理特征表示进行相关数据分析调整操作,以及,依据所述典型用户行为序列、所述候选用户行为分析网络对应的网络优化指标和所述相关数据分析调整操作形成的各个所述表征数据成员对应的分析调整特征表示进行网络优化操作的步骤,包括:
基于各个所述表征数据成员对应的待处理特征表示进行相关数据分析调整操作,以形成各个所述表征数据成员对应的分析调整特征表示;
将所述典型用户行为序列中的排序在后的至少一个典型用户行为子序列,按照预先确定的可能性参数,调整为确定出的用户行为子序列,所述典型用户行为序列在预设的两个典型用户行为子序列之间的位置分割为排序在前的至少一个典型用户行为子序列和排序在后的至少一个典型用户行为子序列;
对所述用户行为序列表征数据中在第一个典型用户行为子序列对应的表征数据成员的前面配置的首端坐标表征符号对应的分析调整特征表示进行标记,以标记为待处理数据,并将所述确定出的用户行为子序列进行子序列逆向调整为所述典型用户行为序列中的排序在后的至少一个典型用户行为子序列,设置为第二网络优化指标对应的优化调整方向,以进行网络优化操作。
在一些优选的实施例中,在上述基于大数据的软件需求挖掘方法中,所述基于各个所述表征数据成员对应的待处理特征表示进行相关数据分析调整操作,以及,依据所述典型用户行为序列、所述候选用户行为分析网络对应的网络优化指标和所述相关数据分析调整操作形成的各个所述表征数据成员对应的分析调整特征表示进行网络优化操作的步骤,包括:
基于各个所述表征数据成员对应的待处理特征表示进行相关数据分析调整操作,以及,依据所述典型用户行为序列、所述候选用户行为分析网络对应的网络优化指标和所述相关数据分析调整操作形成的各个所述表征数据成员对应的分析调整特征表示进行网络优化操作,以形成网络参数经过优化调整的目标用户行为分析网络;
利用所述目标用户行为分析网络,挖掘出各个所述表征数据成员对应的待分析特征表示;
基于各个所述表征数据成员对应的待分析特征表示,确定出所述典型用户行为序列对应的行为序列特征表示;
对所述行为序列特征表示和用于将所述候选用户行为分析网络进行网络优化操作的对比分析数据进行标记,以标记为待处理数据,并结合所述候选用户行为分析网络对应的网络优化指标,将所述目标用户行为分析网络的网络参数进行优化调整操作,以形成最终的目标用户行为分析网络,所述对比分析数据至少包括所述典型用户行为序列对应的行为异常实际结果或行为异常实际结果对应的数据特征表示。
在一些优选的实施例中,在上述基于大数据的软件需求挖掘方法中,所述基于各个所述表征数据成员对应的待分析特征表示,确定出所述典型用户行为序列对应的行为序列特征表示的步骤,包括:
基于所述典型用户行为序列中第一个典型用户行为子序列对应的多个待分析特征表示,确定出所述第一个典型用户行为子序列对应的代表性待分析特征表示;
基于所述典型用户行为序列中包括的多个典型用户行为子序列中的每一个典型用户行为子序列对应的多个待分析特征表示,确定出所述多个典型用户行为子序列对应的代表性待分析特征表示;
基于所述典型用户行为序列中最后一个典型用户行为子序列对应的多个待分析特征表示,确定出所述最后一个典型用户行为子序列对应的代表性待分析特征表示;
基于所述第一个典型用户行为子序列对应的代表性待分析特征表示、所述多个典型用户行为子序列对应的代表性待分析特征表示和所述最后一个典型用户行为子序列对应的代表性待分析特征表示,确定出所述典型用户行为序列对应的行为序列特征表示。
本发明实施例还提供一种基于大数据的软件需求挖掘系统,包括处理器和存储器,所述存储器用于存储计算机程序,所述处理器用于执行所述计算机程序,以实现上述的基于大数据的软件需求挖掘方法。
本发明实施例提供的基于大数据的软件需求挖掘方法及系统,可以先构建出用户行为序列表征数据;挖掘出用户行为序列表征数据中的各个表征数据成员对应的成员数据映射特征表示,基于成员数据映射特征表示,确定出待处理特征表示;基于待处理特征表示进行相关数据分析调整操作,依据典型用户行为序列、网络优化指标和相关数据分析调整操作形成的分析调整特征表示进行网络优化操作;依据网络优化操作形成的目标用户行为分析网络,形成行为异常识别结果;基于行为异常识别结果得到目标用户行为序列,基于目标用户行为序列得到目标需求表征数据。基于前述的内容,由于在进行需求挖掘操作之前,会先进行网络优化操作以形成对应的目标用户行为分析网络,使得可以基于目标用户行为分析网络筛选出目标用户行为序列以进行需求挖掘,也就是说,需求挖掘的依据的可靠度更高,因此,可以在一定程度上提高需求挖掘的可靠度。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
图1为本发明实施例提供的基于大数据的软件需求挖掘系统的结构框图。
图2为本发明实施例提供的基于大数据的软件需求挖掘方法包括的各步骤的流程示意图。
图3为本发明实施例提供的基于大数据的软件需求挖掘装置包括的各模块的示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例只是本发明的一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本发明实施例提供了一种基于大数据的软件需求挖掘系统。其中,所述基于大数据的软件需求挖掘系统可以包括存储器和处理器。
详细地,所述存储器和处理器之间直接或间接地电性连接,以实现数据的传输或交互。例如,相互之间可通过一条或多条通讯总线或信号线实现电性连接。所述存储器中可以存储有至少一个可以以软件或固件(firmware)的形式,存在的软件功能模块(计算机程序)。所述处理器可以用于执行所述存储器中存储的可执行的计算机程序,从而实现本发明实施例提供的基于大数据的软件需求挖掘方法。
应当理解的是,在一些可能的实施方式中,所述存储器可以是,但不限于,随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-Only Memory,PROM),可擦除只读存储器(ErasableProgrammable Read-Only Memory,EPROM),电可擦除只读存储器(Electric ErasableProgrammable Read-Only Memory,EEPROM)等。
应当理解的是,在一些可能的实施方式中,所述处理器可以是一种通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)、片上系统(System on Chip,SoC)等;还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
应当理解的是,在一些可能的实施方式中,所述基于大数据的软件需求挖掘系统可以是一种具备数据处理能力的服务器。
结合图2,本发明实施例还提供一种基于大数据的软件需求挖掘方法,可应用于上述基于大数据的软件需求挖掘系统。其中,所述基于大数据的软件需求挖掘方法有关的流程所定义的方法步骤,可以由所述基于大数据的软件需求挖掘系统实现。下面将对图2所示的具体流程,进行详细阐述。
步骤S110,基于典型用户行为序列包括的多个典型用户行为子序列和各个典型用户行为子序列的行为描述数据,构建出所述典型用户行为序列对应的用户行为序列表征数据。
在本发明实施例中,所述基于大数据的软件需求挖掘系统可以基于典型用户行为序列包括的多个典型用户行为子序列和各个典型用户行为子序列的行为描述数据,构建出所述典型用户行为序列对应的用户行为序列表征数据。每一个所述典型用户行为子序列包括至少一个典型用户行为,例如,在一种示例中,每一个所述典型用户行为子序列包括一个典型用户行为,所述典型用户行为属于相应的典型网络用户的历史网络行为,即在历史上进行的网络行为,所述行为描述数据属于文本数据。
步骤S120,利用候选用户行为分析网络,挖掘出所述用户行为序列表征数据中的各个表征数据成员对应的多个成员数据映射特征表示,以及,基于所述多个成员数据映射特征表示,分别确定出各个所述表征数据成员对应的待处理特征表示。
在本发明实施例中,所述基于大数据的软件需求挖掘系统可以利用候选用户行为分析网络,挖掘出所述用户行为序列表征数据中的各个表征数据成员对应的多个成员数据映射特征表示,以及,基于所述多个成员数据映射特征表示,分别确定出各个所述表征数据成员对应的待处理特征表示。
步骤S130,基于各个所述表征数据成员对应的待处理特征表示进行相关数据分析调整操作,以及,依据所述典型用户行为序列、所述候选用户行为分析网络对应的网络优化指标和所述相关数据分析调整操作形成的各个所述表征数据成员对应的分析调整特征表示进行网络优化操作。
在本发明实施例中,所述基于大数据的软件需求挖掘系统可以基于各个所述表征数据成员对应的待处理特征表示进行相关数据分析调整操作,以及,依据所述典型用户行为序列、所述候选用户行为分析网络对应的网络优化指标和所述相关数据分析调整操作形成的各个所述表征数据成员对应的分析调整特征表示进行网络优化操作。
步骤S140,依据网络优化操作形成的目标用户行为分析网络,分别对各个待识别用户行为序列进行行为异常识别操作,以形成各个待识别用户行为序列对应的行为异常识别结果。
在本发明实施例中,所述基于大数据的软件需求挖掘系统可以依据网络优化操作形成的目标用户行为分析网络,分别对各个待识别用户行为序列进行行为异常识别操作,以形成各个待识别用户行为序列对应的行为异常识别结果。所述行为异常识别结果用于反映各个所述待识别用户行为序列是否具有异常、异常的种类和/或异常的程度。各个待识别用户行为序列可以是一个或多个平台用户在目标软件平台形成的。
步骤S150,基于各个待识别用户行为序列对应的行为异常识别结果,对各个待识别用户行为序列进行筛选,以得到至少一个目标用户行为序列,以及,基于所述至少一个目标用户行为序列,对目标软件平台进行需求挖掘操作,以得到所述目标软件平台对应的目标需求表征数据。
在本发明实施例中,所述基于大数据的软件需求挖掘系统可以基于各个待识别用户行为序列对应的行为异常识别结果,对各个待识别用户行为序列进行筛选,以得到至少一个目标用户行为序列,例如,可以将不具有异常或异常程度小于配置的参考异常程度的待识别用户行为序列筛选出来作为目标用户行为序列,即目标用户行为序列的可靠度更高,以及,基于所述至少一个目标用户行为序列,对目标软件平台进行需求挖掘操作,以得到所述目标软件平台对应的目标需求表征数据。所述历史网络行为基于所述典型网络用户在所述目标软件平台进行相应的操作以形成。示例性地,所述需求挖掘操作可以是基于相应的经过网络优化操作的需求挖掘网络执行,在该需求挖掘网络的网络优化过程中,可以对网络行为和对应的需求标签进行学习,使得所述需求挖掘网络可以基于所述目标用户行为序列,挖掘出对应的目标需求表征数据。所述目标需求表征数据可以是文本数据,用于描述各网络用户整体上对所述目标软件平台的需求。
基于前述的内容,由于在进行需求挖掘操作之前,会先进行网络优化操作以形成对应的目标用户行为分析网络,使得可以基于目标用户行为分析网络筛选出目标用户行为序列以进行需求挖掘,也就是说,需求挖掘的依据的可靠度更高,因此,可以在一定程度上提高需求挖掘的可靠度。
应当理解的是,在一些可能的实施方式中,上述描述中的步骤S110,即所述基于典型用户行为序列包括的多个典型用户行为子序列和各个典型用户行为子序列的行为描述数据,构建出所述典型用户行为序列对应的用户行为序列表征数据的步骤,在一些具体的实施过程中可以包括以下内容:
基于各个所述典型用户行为子序列的行为描述数据包括的至少一个局部行为描述数据,确定出各个所述典型用户行为子序列对应的用于反映所述局部行为描述数据的表征数据成员,例如,在一个所述典型用户行为子序列包括多个典型用户行为时,可以将该典型用户行为子序列对应的行为描述数据中一个典型用户行为对应的局部行为描述数据,作为该典型用户行为子序列的表征数据成员,或者,可以将一个典型用户行为对应的局部行为描述数据中的部分维度的数据,作为表征数据成员,该部分维度的数据可以是指,行为的种类、时间、软件应用中的具体处理模块等;
基于所述多个典型用户行为子序列在所述典型用户行为序列中的先后关系,将所述多个典型用户行为子序列中的每一个典型用户行为子序列对应的表征数据成员进行合并操作,如进行按序排列等操作,以形成所述典型用户行为序列对应的用户行为序列表征数据。
应当理解的是,在一些可能的实施方式中,上述描述中的步骤S110,即所述基于典型用户行为序列包括的多个典型用户行为子序列和各个典型用户行为子序列的行为描述数据,构建出所述典型用户行为序列对应的用户行为序列表征数据的步骤,在一些具体的实施过程中还包括以下内容:
基于所述多个典型用户行为子序列中第一典型用户行为子序列在所述典型用户行为序列中的先后关系表征信息,在所述用户行为序列表征数据中配置所述第一典型用户行为子序列对应的先后关系表征符号;
所述先后关系表征符号包括:在所述典型用户行为序列中的第一个典型用户行为子序列对应的表征数据成员的前面配置的首端坐标表征符号,也就是说,在所述第一典型用户行为子序列为所述典型用户行为序列中的第一个典型用户行为子序列的时候,可以在对应的表征数据成员的前面配置的首端坐标表征符号,以表征数据的起始,便于后续的特征挖掘;在两个典型用户行为子序列对应的表征数据成员之间配置的间隔坐标表征符号,所述两个典型用户行为子序列在所述基于典型用户行为序列中具有相邻的先后关系(进一步地,在所述两个典型用户行为子序列属于所述典型用户行为序列中的指定位置的时候,指定位置可以是中间位置等预先配置的位置,且所述第一典型用户行为子序列属于所述两个典型用户行为子序列中的前一个典型用户行为子序列的时候,可以在所述第一典型用户行为子序列对应的表征数据成员的后面配置的间隔坐标表征符号,如此,可以将所述典型用户行为序列分割为前后两个部分,每一个部分可以包括至少一个典型用户行为子序列);在所述典型用户行为序列中的最后一个典型用户行为子序列对应的表征数据成员的后面配置的末端坐标表征符号,也就是说,在所述第一典型用户行为子序列为所述典型用户行为序列中的最后一个典型用户行为子序列的时候,可以在对应的表征数据成员的后面配置的末端坐标表征符号,以表征数据的结束,便于后续的特征挖掘。
应当理解的是,在一些可能的实施方式中,上述描述中的步骤S120,即所述利用候选用户行为分析网络,挖掘出所述用户行为序列表征数据中的各个表征数据成员对应的多个成员数据映射特征表示,以及,基于所述多个成员数据映射特征表示,确定出各个所述表征数据成员对应的待处理特征表示的步骤,在一些具体的实施过程中可以包括以下内容:
利用候选用户行为分析网络,挖掘出所述用户行为序列表征数据中的各个表征数据成员对应的数据语义映射特征表示(如将表征数据成员表示的行为种类映射到特征空间,以得到数据语义映射特征表示)、数据坐标映射特征表示和数据范围映射特征表示,所述数据坐标映射特征表示用于反映所述表征数据成员在所述用户行为序列表征数据中的分布信息(如属于第一个表征数据成员、第二个表征数据成员、第三个表征数据成员等),所述数据范围映射特征表示用于反映所述表征数据成员在所述用户行为序列表征数据中所属的序列范围(如属于前述的分割为前后两个部分中的前一个部分或属于前述的分割为前后两个部分中的后一个部分);
依据预先配置的聚合操作规则,将各个所述表征数据成员对应的多个成员数据映射特征表示进行聚合操作,以形成各个所述表征数据成员对应的待处理特征表示,例如,可以将一个所述表征数据成员对应的多个成员数据映射特征表示进行叠加等运算操作,以形成所述表征数据成员对应的待处理特征表示,也就是说,可以将一个表征数据成员对应的数据语义映射特征表示、数据坐标映射特征表示和数据范围映射特征表示进行叠加。
其中,应当理解的是,在一些可能的实施方式中,所述依据预先配置的聚合操作规则,将各个所述表征数据成员对应的多个成员数据映射特征表示进行聚合操作,以形成各个所述表征数据成员对应的待处理特征表示的步骤,在一些具体的实施过程中可以包括以下内容:
分别对各所述表征数据成员对应的多个成员数据映射特征表示进行叠加运算,以形成各所述表征数据成员对应的叠加成员数据映射特征表示;
对于各所述表征数据成员中的任意一个表征数据成员,将该表征数据成员确定为第一表征数据成员,以及,在其他的表征数据成员中确定出所述第一表征数据成员对应的相关表征数据成员,并标记为第二表征数据成员,所述第二表征数据成员对应的典型用户行为和所述第一表征数据成员对应的典型用户行为属于同一个典型用户行为子序列或者属于所述典型用户行为序列中相邻的两个典型用户行为子序列;
对所述第二表征数据成员对应的叠加成员数据映射特征表示和所述第一表征数据成员对应的叠加成员数据映射特征表示进行数量积计算操作,以输出对应的特征表示数量积;
对所述第二表征数据成员对应的叠加成员数据映射特征表示和所述第一表征数据成员对应的叠加成员数据映射特征表示进行向量积计算操作,以输出对应的特征表示向量积;
基于所述特征表示数量积,对所述特征表示向量积进行加权处理,以输出对应的加权特征表示,以及,对所述加权特征表示和所述第一表征数据成员对应的叠加成员数据映射特征表示进行叠加或级联组合操作,以形成所述表征数据成员对应的待处理特征表示。
应当理解的是,在一些可能的实施方式中,上述描述中的步骤S130,即所述基于各个所述表征数据成员对应的待处理特征表示进行相关数据分析调整操作,以及,依据所述典型用户行为序列、所述候选用户行为分析网络对应的网络优化指标和所述相关数据分析调整操作形成的各个所述表征数据成员对应的分析调整特征表示进行网络优化操作的步骤,在一些具体的实施过程中可以包括以下内容:
基于各个所述表征数据成员对应的待处理特征表示进行相关数据分析调整操作,以形成各个所述表征数据成员对应的分析调整特征表示;
将所述典型用户行为序列中第一个典型用户行为子序列以外的其他典型用户行为子序列,按照预先配置的可能性参数分别进行子序列调整处理,以形成对应的调整典型用户行为序列,所述子序列调整处理包括将所述其他典型用户行为子序列调整为预先配置的目标符号或将所述其他典型用户行为子序列调整为确定出的用户行为子序列;
对各个所述表征数据成员对应的分析调整特征表示进行标记,以作为待处理数据,以及,将所述目标符号对应的典型用户行为子序列进行子序列逆向调整为所述典型用户行为序列中的真实典型用户行为子序列,设置为第一网络优化指标对应的优化调整方向,以进行网络优化操作;也就是说,可以基于所述分析调整特征表示预测出所述目标符号对应的典型用户行为子序列,然后,基于预测出的典型用户行为子序列和真实典型用户行为子序列之间的误差,对所述候选用户行为分析网络进行网络优化操作,例如,可以沿着降低该误差的方向进行网络优化操作。
其中,应当理解的是,在一些可能的实施方式中,所述基于各个所述表征数据成员对应的待处理特征表示进行相关数据分析调整操作,以形成各个所述表征数据成员对应的分析调整特征表示的步骤,在一些具体的实施过程中可以包括以下内容:
依据对应的典型用户行为之间的先后关系,将各个所述表征数据成员对应的待处理特征表示进行排序,以形成第一特征表示有序集合;
对于所述第一特征表示有序集合中的每一个待处理特征表示,在该待处理特征表示属于所述第一特征表示有序集合中的第一个待处理特征表示的时候,将该待处理特征表示作为初步处理后的待处理特征表示;
对于所述第一特征表示有序集合中的每一个待处理特征表示,在该待处理特征表示属于所述第一特征表示有序集合中的第一个待处理特征表示以外的其他待处理特征表示的时候,基于该其他待处理特征表示在前的每一个待处理特征表示对应的初步处理后的待处理特征表示的均值待处理特征表示,对该其他待处理特征表示进行聚焦特征分析操作,以形成该其他待处理特征表示对应的聚焦特征表示,以及,将该聚焦特征表示和该其他待处理特征表示进行叠加运算或级联组合操作,以形成该其他待处理特征表示对应的初步处理后的待处理特征表示;
将所述第一特征表示有序集合中的每一个待处理特征表示替换为对应的初步处理后的待处理特征表示,以形成第二特征表示有序集合;
对于所述第二特征表示有序集合中的每一个初步处理后的待处理特征表示,在该初步处理后的待处理特征表示属于所述第二特征表示有序集合中的最后一个初步处理后的待处理特征表示的时候,将该初步处理后的待处理特征表示作为对应的分析调整特征表示;
对于所述第二特征表示有序集合中的每一个初步处理后的待处理特征表示,在该初步处理后的待处理特征表示属于所述第二特征表示有序集合中的最后一个初步处理后的待处理特征表示以外的其他初步处理后的待处理特征表示的时候,基于该其他初步处理后的待处理特征表示在后的每一个其他初步处理后的待处理特征表示对应的分析调整特征表示的均值分析调整特征表示,对该其他初步处理后的待处理特征表示进行聚焦特征分析操作,以形成该其他初步处理后的待处理特征表示对应的聚焦特征表示,以及,将该聚焦特征表示和该其他初步处理后的待处理特征表示进行叠加运算或级联组合操作,以形成该其他初步处理后的待处理特征表示对应的分析调整特征表示,基于此,可以形成各个所述表征数据成员对应的分析调整特征表示,聚焦特征分析操作可以参照相关的现有技术。
应当理解的是,在一些可能的实施方式中,所述可能性参数可以包括调整判断可能性参数、符号调整可能性参数和子序列调整可能性参数,基于此,所述将所述典型用户行为序列中第一个典型用户行为子序列以外的其他典型用户行为子序列,按照预先配置的可能性参数分别进行子序列调整处理,以形成对应的调整典型用户行为序列的步骤,在一些具体的实施过程中可以包括以下内容:
将所述典型用户行为序列中第一个典型用户行为子序列以外的每一个其他典型用户行为子序列,按照预先确定的调整判断可能性参数分别判断是否需要进行子序列调整处理,也就是说,在各其他典型用户行为子序列中,确定出的需要进行子序列调整处理的典型用户行为子序列的数量占比可以等于所述调整判断可能性参数;
针对需要进行子序列调整处理的每一个典型用户行为子序列,按照调整为目标符号的符号调整可能性参数、调整为确定出的用户行为子序列的子序列调整可能性参数分别进行子序列调整处理,所述符号调整可能性参数和所述子序列调整可能性参数的和值可以小于40%、50%等数值,也就是说,可以将数量占比等于所述符号调整可能性参数的典型用户行为子序列调整为目标符号,所述目标符号可以不具有任何实际语义信息,可以将数量占比等于所述子序列调整可能性参数的典型用户行为子序列调整为确定出的用户行为子序列,所述确定出的用户行为子序列可以是所述典型用户行为序列中其他的任意一个典型用户行为子序列。
应当理解的是,在一些可能的实施方式中,上述描述中的步骤S130,即所述基于各个所述表征数据成员对应的待处理特征表示进行相关数据分析调整操作,以及,依据所述典型用户行为序列、所述候选用户行为分析网络对应的网络优化指标和所述相关数据分析调整操作形成的各个所述表征数据成员对应的分析调整特征表示进行网络优化操作的步骤,在一些具体的实施过程中可以包括以下内容:
基于各个所述表征数据成员对应的待处理特征表示进行相关数据分析调整操作,以形成各个所述表征数据成员对应的分析调整特征表示;
将所述典型用户行为序列中的排序在后的至少一个典型用户行为子序列,按照预先确定的可能性参数,调整为确定出的用户行为子序列,所述典型用户行为序列在预设的两个典型用户行为子序列之间的位置(如前述的中间位置)分割为排序在前的至少一个典型用户行为子序列和排序在后的至少一个典型用户行为子序列,即分割为前后两个部分;
对所述用户行为序列表征数据中在第一个典型用户行为子序列对应的表征数据成员的前面配置的首端坐标表征符号对应的分析调整特征表示进行标记,以标记为待处理数据,并将所述确定出的用户行为子序列进行子序列逆向调整为所述典型用户行为序列中的排序在后的至少一个典型用户行为子序列,设置为第二网络优化指标对应的优化调整方向,以进行网络优化操作;也就是说,可以基于首端坐标表征符号对应的分析调整特征表示(作为开始),依次进行特征还原操作(如解码),以对所述确定出的用户行为子序列进行调整,即得到调整后的(即解码出的)用户行为子序列,然后,可以计算调整后的用户行为子序列和所述典型用户行为序列中的排序在后的至少一个典型用户行为子序列之间的误差,最后,可以沿着降低该误差的方向,对所述候选用户行为分析网络进行网络优化操作。
应当理解的是,在一些可能的实施方式中,上述描述中的步骤S130,即所述基于各个所述表征数据成员对应的待处理特征表示进行相关数据分析调整操作,以及,依据所述典型用户行为序列、所述候选用户行为分析网络对应的网络优化指标和所述相关数据分析调整操作形成的各个所述表征数据成员对应的分析调整特征表示进行网络优化操作的步骤,在一些具体的实施过程中可以包括以下内容:
基于各个所述表征数据成员对应的待处理特征表示进行相关数据分析调整操作,以及,依据所述典型用户行为序列、所述候选用户行为分析网络对应的网络优化指标和所述相关数据分析调整操作形成的各个所述表征数据成员对应的分析调整特征表示进行网络优化操作,以形成网络参数经过优化调整的目标用户行为分析网络,如前所述;
利用所述目标用户行为分析网络,挖掘出各个所述表征数据成员对应的待分析特征表示,可以参照前文的步骤S120包括的利用候选用户行为分析网络,挖掘出所述用户行为序列表征数据中的各个表征数据成员对应的多个成员数据映射特征表示的步骤的解释说明;
基于各个所述表征数据成员对应的待分析特征表示,确定出所述典型用户行为序列对应的行为序列特征表示;
对所述行为序列特征表示和用于将所述候选用户行为分析网络进行网络优化操作的对比分析数据进行标记,以标记为待处理数据,并结合所述候选用户行为分析网络对应的网络优化指标,将所述目标用户行为分析网络的网络参数进行优化调整操作,以形成最终的目标用户行为分析网络,所述对比分析数据至少包括所述典型用户行为序列对应的行为异常实际结果或行为异常实际结果对应的数据特征表示,例如,可以基于所述行为序列特征表示进行异常识别,以得到对应的异常识别数据,然后,可以基于该异常识别数据和该行为异常识别结果之间的误差,对所述目标用户行为分析网络的网络参数进行优化调整操作,以形成最终的目标用户行为分析网络,或者,可以直接基于所述行为序列特征表示和所述行为异常实际结果对应的数据特征表示之间的误差,如余弦距离等,对所述目标用户行为分析网络的网络参数进行优化调整操作,以形成最终的目标用户行为分析网络,各特征表示的表现形式可以为向量。
应当理解的是,在一些可能的实施方式中,所述基于各个所述表征数据成员对应的待分析特征表示,确定出所述典型用户行为序列对应的行为序列特征表示的步骤,在一些具体的实施过程中可以包括以下内容:
基于所述典型用户行为序列中第一个典型用户行为子序列对应的多个待分析特征表示,确定出所述第一个典型用户行为子序列对应的代表性待分析特征表示,如对第一个典型用户行为子序列对应的多个待分析特征表示进行加权求和,以得到所述第一个典型用户行为子序列对应的代表性待分析特征表示,各待分析特征表示的加权系数可以相等;
基于所述典型用户行为序列中包括的多个典型用户行为子序列中的每一个典型用户行为子序列对应的多个待分析特征表示,确定出所述多个典型用户行为子序列对应的代表性待分析特征表示,如对每一个典型用户行为子序列对应的多个待分析特征表示进行加权求和,以得到每一个典型用户行为子序列对应的代表性待分析特征表示,再对每一个典型用户行为子序列对应的代表性待分析特征表示进行加权求和,以形成所述多个典型用户行为子序列对应的代表性待分析特征表示;
基于所述典型用户行为序列中最后一个典型用户行为子序列对应的多个待分析特征表示,确定出所述最后一个典型用户行为子序列对应的代表性待分析特征表示,如对最后一个典型用户行为子序列对应的多个待分析特征表示进行加权求和,以得到所述最后一个典型用户行为子序列对应的代表性待分析特征表示,各待分析特征表示的加权系数可以相等;
基于所述第一个典型用户行为子序列对应的代表性待分析特征表示、所述多个典型用户行为子序列对应的代表性待分析特征表示和所述最后一个典型用户行为子序列对应的代表性待分析特征表示,确定出所述典型用户行为序列对应的行为序列特征表示,例如,可以将所述第一个典型用户行为子序列对应的代表性待分析特征表示、所述多个典型用户行为子序列对应的代表性待分析特征表示和所述最后一个典型用户行为子序列对应的代表性待分析特征表示进行级联组合,以得到对应的行为序列特征表示。
结合图3,本发明实施例还提供一种基于大数据的软件需求挖掘装置,可应用于上述基于大数据的软件需求挖掘系统。其中,所述基于大数据的软件需求挖掘装置可以包括以下的软件功能模块:
表征数据构建模块,用于基于典型用户行为序列包括的多个典型用户行为子序列和各个典型用户行为子序列的行为描述数据,构建出所述典型用户行为序列对应的用户行为序列表征数据,每一个所述典型用户行为子序列包括至少一个典型用户行为,所述典型用户行为属于相应的典型网络用户的历史网络行为,所述行为描述数据属于文本数据;
表征数据挖掘模块,用于利用候选用户行为分析网络,挖掘出所述用户行为序列表征数据中的各个表征数据成员对应的多个成员数据映射特征表示,以及,基于所述多个成员数据映射特征表示,分别确定出各个所述表征数据成员对应的待处理特征表示;
网络优化模块,用于基于各个所述表征数据成员对应的待处理特征表示进行相关数据分析调整操作,以及,依据所述典型用户行为序列、所述候选用户行为分析网络对应的网络优化指标和所述相关数据分析调整操作形成的各个所述表征数据成员对应的分析调整特征表示进行网络优化操作;
行为异常识别模块,用于依据网络优化操作形成的目标用户行为分析网络,分别对各个待识别用户行为序列进行行为异常识别操作,以形成各个待识别用户行为序列对应的行为异常识别结果,所述行为异常识别结果用于反映各个所述待识别用户行为序列是否具有异常、异常的种类和/或异常的程度;
需求挖掘模块,用于基于各个待识别用户行为序列对应的行为异常识别结果,对各个待识别用户行为序列进行筛选,以得到至少一个目标用户行为序列,以及,基于所述至少一个目标用户行为序列,对目标软件平台进行需求挖掘操作,以得到所述目标软件平台对应的目标需求表征数据,所述历史网络行为基于所述典型网络用户在所述目标软件平台进行相应的操作以形成。
综上所述,本发明提供的基于大数据的软件需求挖掘方法及系统,可以先构建出用户行为序列表征数据;挖掘出用户行为序列表征数据中的各个表征数据成员对应的成员数据映射特征表示,基于成员数据映射特征表示,确定出待处理特征表示;基于待处理特征表示进行相关数据分析调整操作,依据典型用户行为序列、网络优化指标和相关数据分析调整操作形成的分析调整特征表示进行网络优化操作;依据网络优化操作形成的目标用户行为分析网络,形成行为异常识别结果;基于行为异常识别结果得到目标用户行为序列,基于目标用户行为序列得到目标需求表征数据。基于前述的内容,由于在进行需求挖掘操作之前,会先进行网络优化操作以形成对应的目标用户行为分析网络,使得可以基于目标用户行为分析网络筛选出目标用户行为序列以进行需求挖掘,也就是说,需求挖掘的依据的可靠度更高,因此,可以在一定程度上提高需求挖掘的可靠度。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种基于大数据的软件需求挖掘方法,其特征在于,包括:
基于典型用户行为序列包括的多个典型用户行为子序列和各个典型用户行为子序列的行为描述数据,构建出所述典型用户行为序列对应的用户行为序列表征数据,每一个所述典型用户行为子序列包括至少一个典型用户行为,所述典型用户行为属于相应的典型网络用户的历史网络行为,所述行为描述数据属于文本数据;
利用候选用户行为分析网络,挖掘出所述用户行为序列表征数据中的各个表征数据成员对应的多个成员数据映射特征表示,以及,基于所述多个成员数据映射特征表示,分别确定出各个所述表征数据成员对应的待处理特征表示;
基于各个所述表征数据成员对应的待处理特征表示进行相关数据分析调整操作,以及,依据所述典型用户行为序列、所述候选用户行为分析网络对应的网络优化指标和所述相关数据分析调整操作形成的各个所述表征数据成员对应的分析调整特征表示进行网络优化操作;
依据网络优化操作形成的目标用户行为分析网络,分别对各个待识别用户行为序列进行行为异常识别操作,以形成各个待识别用户行为序列对应的行为异常识别结果,所述行为异常识别结果用于反映各个所述待识别用户行为序列是否具有异常、异常的种类和/或异常的程度;
基于各个待识别用户行为序列对应的行为异常识别结果,对各个待识别用户行为序列进行筛选,以得到至少一个目标用户行为序列,以及,基于所述至少一个目标用户行为序列,对目标软件平台进行需求挖掘操作,以得到所述目标软件平台对应的目标需求表征数据,所述历史网络行为基于所述典型网络用户在所述目标软件平台进行相应的操作以形成。
2.如权利要求1所述的基于大数据的软件需求挖掘方法,其特征在于,所述基于典型用户行为序列包括的多个典型用户行为子序列和各个典型用户行为子序列的行为描述数据,构建出所述典型用户行为序列对应的用户行为序列表征数据的步骤,包括:
基于各个所述典型用户行为子序列的行为描述数据包括的至少一个局部行为描述数据,确定出各个所述典型用户行为子序列对应的用于反映所述局部行为描述数据的表征数据成员;
基于所述多个典型用户行为子序列在所述典型用户行为序列中的先后关系,将所述多个典型用户行为子序列中的每一个典型用户行为子序列对应的表征数据成员进行合并操作,以形成所述典型用户行为序列对应的用户行为序列表征数据。
3.如权利要求2所述的基于大数据的软件需求挖掘方法,其特征在于,所述基于典型用户行为序列包括的多个典型用户行为子序列和各个典型用户行为子序列的行为描述数据,构建出所述典型用户行为序列对应的用户行为序列表征数据的步骤,还包括:
基于所述多个典型用户行为子序列中第一典型用户行为子序列在所述典型用户行为序列中的先后关系表征信息,在所述用户行为序列表征数据中配置所述第一典型用户行为子序列对应的先后关系表征符号;
所述先后关系表征符号包括:
在所述典型用户行为序列中的第一个典型用户行为子序列对应的表征数据成员的前面配置的首端坐标表征符号;
在两个典型用户行为子序列对应的表征数据成员之间配置的间隔坐标表征符号,所述两个典型用户行为子序列在所述典型用户行为序列中具有相邻的先后关系;
在所述典型用户行为序列中的最后一个典型用户行为子序列对应的表征数据成员的后面配置的末端坐标表征符号。
4.如权利要求1所述的基于大数据的软件需求挖掘方法,其特征在于,所述利用候选用户行为分析网络,挖掘出所述用户行为序列表征数据中的各个表征数据成员对应的多个成员数据映射特征表示,以及,基于所述多个成员数据映射特征表示,确定出各个所述表征数据成员对应的待处理特征表示的步骤,包括:
利用候选用户行为分析网络,挖掘出所述用户行为序列表征数据中的各个表征数据成员对应的数据语义映射特征表示、数据坐标映射特征表示和数据范围映射特征表示,所述数据坐标映射特征表示用于反映所述表征数据成员在所述用户行为序列表征数据中的分布信息,所述数据范围映射特征表示用于反映所述表征数据成员在所述用户行为序列表征数据中所属的序列范围;
依据预先配置的聚合操作规则,将各个所述表征数据成员对应的多个成员数据映射特征表示进行聚合操作,以形成各个所述表征数据成员对应的待处理特征表示。
5.如权利要求1所述的基于大数据的软件需求挖掘方法,其特征在于,所述基于各个所述表征数据成员对应的待处理特征表示进行相关数据分析调整操作,以及,依据所述典型用户行为序列、所述候选用户行为分析网络对应的网络优化指标和所述相关数据分析调整操作形成的各个所述表征数据成员对应的分析调整特征表示进行网络优化操作的步骤,包括:
基于各个所述表征数据成员对应的待处理特征表示进行相关数据分析调整操作,以形成各个所述表征数据成员对应的分析调整特征表示;
将所述典型用户行为序列中第一个典型用户行为子序列以外的其他典型用户行为子序列,按照预先配置的可能性参数分别进行子序列调整处理,以形成对应的调整典型用户行为序列,所述子序列调整处理包括将所述其他典型用户行为子序列调整为预先配置的目标符号或将所述其他典型用户行为子序列调整为确定出的用户行为子序列;
对各个所述表征数据成员对应的分析调整特征表示进行标记,以作为待处理数据,以及,将所述目标符号对应的典型用户行为子序列进行子序列逆向调整为所述典型用户行为序列中的真实典型用户行为子序列,设置为第一网络优化指标对应的优化调整方向,以进行网络优化操作。
6.如权利要求5所述的基于大数据的软件需求挖掘方法,其特征在于,所述可能性参数包括调整判断可能性参数、符号调整可能性参数和子序列调整可能性参数,所述将所述典型用户行为序列中第一个典型用户行为子序列以外的其他典型用户行为子序列,按照预先配置的可能性参数分别进行子序列调整处理,以形成对应的调整典型用户行为序列的步骤,包括:
将所述典型用户行为序列中第一个典型用户行为子序列以外的每一个其他典型用户行为子序列,按照预先确定的调整判断可能性参数分别判断是否需要进行子序列调整处理;
针对需要进行子序列调整处理的每一个典型用户行为子序列,按照调整为目标符号的符号调整可能性参数、调整为确定出的用户行为子序列的子序列调整可能性参数分别进行子序列调整处理。
7.如权利要求1所述的基于大数据的软件需求挖掘方法,其特征在于,所述基于各个所述表征数据成员对应的待处理特征表示进行相关数据分析调整操作,以及,依据所述典型用户行为序列、所述候选用户行为分析网络对应的网络优化指标和所述相关数据分析调整操作形成的各个所述表征数据成员对应的分析调整特征表示进行网络优化操作的步骤,包括:
基于各个所述表征数据成员对应的待处理特征表示进行相关数据分析调整操作,以形成各个所述表征数据成员对应的分析调整特征表示;
将所述典型用户行为序列中的排序在后的至少一个典型用户行为子序列,按照预先确定的可能性参数,调整为确定出的用户行为子序列,所述典型用户行为序列在预设的两个典型用户行为子序列之间的位置分割为排序在前的至少一个典型用户行为子序列和排序在后的至少一个典型用户行为子序列;
对所述用户行为序列表征数据中在第一个典型用户行为子序列对应的表征数据成员的前面配置的首端坐标表征符号对应的分析调整特征表示进行标记,以标记为待处理数据,并将所述确定出的用户行为子序列进行子序列逆向调整为所述典型用户行为序列中的排序在后的至少一个典型用户行为子序列,设置为第二网络优化指标对应的优化调整方向,以进行网络优化操作。
8.如权利要求1所述的基于大数据的软件需求挖掘方法,其特征在于,所述基于各个所述表征数据成员对应的待处理特征表示进行相关数据分析调整操作,以及,依据所述典型用户行为序列、所述候选用户行为分析网络对应的网络优化指标和所述相关数据分析调整操作形成的各个所述表征数据成员对应的分析调整特征表示进行网络优化操作的步骤,包括:
基于各个所述表征数据成员对应的待处理特征表示进行相关数据分析调整操作,以及,依据所述典型用户行为序列、所述候选用户行为分析网络对应的网络优化指标和所述相关数据分析调整操作形成的各个所述表征数据成员对应的分析调整特征表示进行网络优化操作,以形成网络参数经过优化调整的目标用户行为分析网络;
利用所述目标用户行为分析网络,挖掘出各个所述表征数据成员对应的待分析特征表示;
基于各个所述表征数据成员对应的待分析特征表示,确定出所述典型用户行为序列对应的行为序列特征表示;
对所述行为序列特征表示和用于将所述候选用户行为分析网络进行网络优化操作的对比分析数据进行标记,以标记为待处理数据,并结合所述候选用户行为分析网络对应的网络优化指标,将所述目标用户行为分析网络的网络参数进行优化调整操作,以形成最终的目标用户行为分析网络,所述对比分析数据至少包括所述典型用户行为序列对应的行为异常实际结果或行为异常实际结果对应的数据特征表示。
9.如权利要求8所述的基于大数据的软件需求挖掘方法,其特征在于,所述基于各个所述表征数据成员对应的待分析特征表示,确定出所述典型用户行为序列对应的行为序列特征表示的步骤,包括:
基于所述典型用户行为序列中第一个典型用户行为子序列对应的多个待分析特征表示,确定出所述第一个典型用户行为子序列对应的代表性待分析特征表示;
基于所述典型用户行为序列中包括的多个典型用户行为子序列中的每一个典型用户行为子序列对应的多个待分析特征表示,确定出所述多个典型用户行为子序列对应的代表性待分析特征表示;
基于所述典型用户行为序列中最后一个典型用户行为子序列对应的多个待分析特征表示,确定出所述最后一个典型用户行为子序列对应的代表性待分析特征表示;
基于所述第一个典型用户行为子序列对应的代表性待分析特征表示、所述多个典型用户行为子序列对应的代表性待分析特征表示和所述最后一个典型用户行为子序列对应的代表性待分析特征表示,确定出所述典型用户行为序列对应的行为序列特征表示。
10.一种基于大数据的软件需求挖掘系统,其特征在于,包括处理器和存储器,所述存储器用于存储计算机程序,所述处理器用于执行所述计算机程序,以实现权利要求1-9任意一项所述的基于大数据的软件需求挖掘方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311080701.6A CN117032637A (zh) | 2023-08-25 | 2023-08-25 | 基于大数据的软件需求挖掘方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311080701.6A CN117032637A (zh) | 2023-08-25 | 2023-08-25 | 基于大数据的软件需求挖掘方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117032637A true CN117032637A (zh) | 2023-11-10 |
Family
ID=88622644
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311080701.6A Pending CN117032637A (zh) | 2023-08-25 | 2023-08-25 | 基于大数据的软件需求挖掘方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117032637A (zh) |
-
2023
- 2023-08-25 CN CN202311080701.6A patent/CN117032637A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111652496B (zh) | 基于网络安全态势感知系统的运行风险评估方法及装置 | |
CN115718846B (zh) | 用于智能化交互网络的大数据挖掘方法及系统 | |
CN116310914B (zh) | 基于人工智能的无人机监控方法及系统 | |
CN116109121B (zh) | 基于大数据分析的用户需求挖掘方法及系统 | |
CN112631888A (zh) | 分布式系统的故障预测方法、装置、存储介质及电子设备 | |
CN115964432A (zh) | 基于大数据可视化的用户操作异常分析方法及系统 | |
CN115687674A (zh) | 服务于智慧云服务平台的大数据需求分析方法及系统 | |
CN116664335B (zh) | 基于智能监控的半导体生产系统运行分析方法及系统 | |
CN114020715A (zh) | 一种日志数据的处理方法、装置、介质及设备 | |
CN116361567B (zh) | 应用于云办公的数据处理方法及系统 | |
CN112131274A (zh) | 时间序列异常点的检测方法、装置、设备及可读存储介质 | |
CN117032637A (zh) | 基于大数据的软件需求挖掘方法及系统 | |
CN115757900B (zh) | 应用人工智能模型的用户需求分析方法及系统 | |
CN116361440A (zh) | 基于人工智能的数字金融产品会话交互方法及系统 | |
CN114860608A (zh) | 基于场景构建的系统自动化测试方法、装置、设备及介质 | |
CN115099838A (zh) | 应用于线上广告投放的兴趣定位方法及系统 | |
CN113656256A (zh) | 一种基于芯片异常运行的调控方法及系统 | |
CN116662415B (zh) | 基于数据挖掘的智能匹配方法及系统 | |
CN116501285B (zh) | 基于虚拟数字形象交互的ai对话处理方法及数字化系统 | |
CN117194525A (zh) | 针对多源业务数据的数据分析方法及系统 | |
CN117149846B (zh) | 一种基于数据融合的电力数据分析方法和系统 | |
CN117095689A (zh) | 数字化信号数据去噪方法及系统 | |
CN115908119B (zh) | 基于人工智能的人脸图像美颜处理方法及系统 | |
CN116307218A (zh) | 基于人工智能的元宇宙体验用户行为预测方法及系统 | |
CN117422302A (zh) | 基于风控模型的信息预测方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |