CN116301731A - 一种基于自然语言的需求分析方法、设备及存储设备 - Google Patents
一种基于自然语言的需求分析方法、设备及存储设备 Download PDFInfo
- Publication number
- CN116301731A CN116301731A CN202310137684.9A CN202310137684A CN116301731A CN 116301731 A CN116301731 A CN 116301731A CN 202310137684 A CN202310137684 A CN 202310137684A CN 116301731 A CN116301731 A CN 116301731A
- Authority
- CN
- China
- Prior art keywords
- attribute
- machine learning
- demand
- demand analysis
- natural language
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 40
- 238000010801 machine learning Methods 0.000 claims abstract description 24
- 238000000034 method Methods 0.000 claims abstract description 14
- 238000000605 extraction Methods 0.000 claims abstract description 6
- 238000012549 training Methods 0.000 claims abstract description 5
- 238000004519 manufacturing process Methods 0.000 claims abstract description 4
- 230000009286 beneficial effect Effects 0.000 abstract description 3
- 230000006870 function Effects 0.000 description 4
- 238000013461 design Methods 0.000 description 3
- 238000011835 investigation Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F8/00—Arrangements for software engineering
- G06F8/10—Requirements analysis; Specification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/177—Editing, e.g. inserting or deleting of tables; using ruled lines
- G06F40/18—Editing, e.g. inserting or deleting of tables; using ruled lines of spreadsheets
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于自然语言的需求分析方法、设备及存储设备,方法包括:创建机器学习任务;所述机器学习任务包括:领域判定和属性提取;制作机器学习任务样本,并利用样本训练得到预调模型;对预调模型进行微调得到需求分析机器学习模型;获取用户需求输入,并利用机器学习模型完成需求分析,得到需求表单。本发明有益效果是:降低了人工成本,解决了需求表单因信息交流不对称而造成的相关表单缺失的技术问题。
Description
技术领域
本发明涉及需求分析领域,尤其涉及一种基于自然语言的需求分析方法、设备及存储设备。
背景技术
需求分析一直以来都是软件开发领域的头部问题,良好的需求分析有助于业务人员、开发人员和测试人员高效地完成自己的职能。
没有辅助手段的情况下,对于传统的需求分析来说,一般需要产品经理做市场调研,分析用户需求并设计功能界面。产品经理设计出系统的功能及界面后,由研发人员来实现产品经理设计出的功能。
在这种情况下,产品经理做前期调查需要耗费不少时间。还存在一些情况,负责设计功能的产品经理没有充足的时间做充分的市场调研,或者没有专门的产品经理来进行需求分析,这些情况下开发出来的产品可能会有比较多的地方存在内容的缺失,比如说很可能某些表单缺字段。
发明内容
为了解决目前需求分析辅助手段较为缺乏而造成的一系列问题,本发明提供了一种基于自然语言的需求分析方法,包括以下步骤:
S1:创建机器学习任务;所述机器学习任务包括:领域判定和属性提取;
S2:制作机器学习任务样本,并利用样本训练得到预调模型;
S3:对预调模型进行微调得到需求分析机器学习模型;
S4:获取用户需求输入,并利用机器学习模型完成需求分析,得到用户需求表单。
一种存储设备,所述存储设备存储指令及数据用于实现一种基于自然语言的需求分析方法。
一种基于自然语言的需求分析设备,包括:处理器及所述存储设备;所述处理器加载并执行所述存储设备中的指令及数据用于实现一种基于自然语言的需求分析方法。
本发明提供的有益效果是:降低了人工成本,解决了需求表单因信息交流不对称而造成的相关表单缺失的技术问题。
附图说明
图1是本发明方法流程示意图;
图2是本发明实施例中硬件设备工作的示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地描述。
请参考图1,图1是本发明方法流程图。本发明提供了一种基于自然语言的需求分析方法,包括以下步骤:
S1:创建机器学习任务;所述机器学习任务包括:领域判定和属性提取;
需要说明的是,领域判定任务主要用于确定需求分析的领域,而属性提取任务主要用于确定需求的属性,从而能够根据属性创建需求表单。
S2:制作机器学习任务样本,并利用样本训练得到预调模型;
需要说明的是,步骤S2中,制作机器学习任务样本的具体过程如下:
利用网络爬虫获取样本数据;
获取样本数据类别,并将样本数据类别作为领域类别;
获取样本数据内容,将样本数据内容作为原始样本内容;
在样本数据内容中提取关键信息,作为原始样本标签。
作为一种实施例,样本数据来自于网络爬虫,可以选择几家能把文章投递到正确分类的新闻媒体网站,获取其中的文章数据以及此文章的类别,这些文章类别将作为领域信息的重要来源,那么文章的内容将作为最原始的样本本身,而文章在新闻媒体网站上所述的类别将作为最原始的样本标签。
领域判定任务和属性提取任务同属于NLP任务,对于这类任务,本申请采用“预调模型”+“Fine tuning(微调)”的方式对这类NLP任务的模型做训练。
S3:对预调模型进行微调得到需求分析机器学习模型;
需要说明的是,步骤S3对预调模型进行微调,具体过程如下;
S31、创建关系型数据库,其中一个数据表为领域-属性表,存放领域与属性的关联关系,另一个数据表为属性-组件表,存放属性对应的表单组件;
需要说明的是,领域-属性表最原始的数据来自于人工录入手动分类,可以使用上面两类NLP任务中的数据,使用属性提取任务得到的模型对新闻媒体网站中的文章做属性提取,可以手动得到某个领域内的大量词汇,再手动剔除掉领域指向性不强的词汇,剩余的属性词汇存入领域属性表。而存放“属性”和“表单组件”对应关系的数据表最开始应该是无数据的。
S32、输入样本数据,通过领域-属性表得到表单属性和推荐属性;
S33、对表单属性和推荐属性进行调整,更新样本数据;
S34、利用更新后的样本数据对预调模型进行微调,得到微调后的需求分析机器学习模型。
S4:获取用户需求输入,并利用机器学习模型完成需求分析,得到用户需求表单。
需要说明的是,步骤S4具体如下:
S41、获取用户需求;
S42、将用户需求输入至领域判定任务中,通过领域判定任务和属性提取任务获取用户需求中的领域和属性;
S43、通过领域-属性表判断用户需求领域和属性是否已建立关联,若已建立关联,则通过属性-组件表进一步获取对应表单组件,得到用户需求表单;若未建立关联,进入步骤S44;
S44、建立领域和属性的关联,更新领域-属性表;
S45、根据属性查找属性-组件表,获取对应表单组件,得到用户需求表单;
S46、根据实际情况对用户需求表进行调整,同时实时更新属性-组件表,得到最终的用户需求表单。
作为一种实施例,当用户输入一段文字需求后,把这段文字输入作为领域判定任务的输入,通过这个任务获取需求对应的领域,再把这段文字作为命名实体识别任务的输入,将这段需求中涉及到的属性抽离出来,再通过领域-属性表判断这个领域和属性之间是否已建立关联关系,如果未建立关联关系,则建立关系,如果已建立关联关系,则再通过属性-组件表判断这个属性有没有关联着的组件。
经过上面的步骤,用户输入的文字需求已解析完毕,程序将根据从文字中提取出来的属性创建表单,如果各属性存在对应的组件,则一并将组将也创建进表单中,如果属性没有对应的组件,那么表单中组件的位置留白等待用户进行微调;
如果没有从用户的文字需求中提取到属性,那么就从用户这段文字中对应的领域-属性表中获取用户需求对应的领域中常见的属性,并为这些属性创建组件。
当程序将表单创建完毕后,再从领域-属性表中取出除已展示在表单中的其他属性,作为为用户推荐的表单中的属性。
最终表单创建完毕后,等待用户对表单进行调整,如果用户在表单中新增了表单属性,程序则将用户在表单中创建的属性,以及属性对应的组件存入对应的数据表中。随后,程序会将用户输入的文字需求以及识别出来的领域存入临时数据表中,当数据表的量达到一定的批量后,使用这些数据对两个NLP任务对应的模型进行进一步训练。
因此,通过上述步骤,由产品经理构造出一部分文字需求,借由对这些文字的分析,将此领域一些常见的表单属性以及属性对应的组件反过来推荐给产品经理,这样便可以在一定程度上节省前期对需求进行调研的时间。另外,随着方法的不断运行,从中产生出的数据将会继续作为样本对模型进行训练,从而进一步提高推荐出来的属性和组件跟用户期望的属性和组件的匹配度,因此,由于前期考虑不充分而导致的表单字段缺失的问题也将得到解决。
请参见图2,图2是本发明实施例的硬件设备工作示意图,所述硬件设备具体包括:一种基于自然语言的需求分析设备401、处理器402及存储设备403。
一种基于自然语言的需求分析设备401:所述一种基于自然语言的需求分析设备401实现所述一种基于自然语言的需求分析方法。
处理器402:所述处理器402加载并执行所述存储设备403中的指令及数据用于实现所述一种基于自然语言的需求分析方法。
存储设备403:所述存储设备403存储指令及数据;所述存储设备403用于实现所述一种基于自然语言的需求分析方法。
综合来看,本发明的有益效果是:降低了人工成本,解决了需求表单因信息交流不对称而造成的相关表单缺失的技术问题。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (6)
1.一种基于自然语言的需求分析方法,其特征在于:包括以下步骤:
S1:创建机器学习任务;所述机器学习任务包括:领域判定和属性提取;
S2:制作机器学习任务样本,并利用样本训练得到预调模型;
S3:对预调模型进行微调得到需求分析机器学习模型;
S4:获取用户需求输入,并利用机器学习模型完成需求分析,得到需求表单。
2.如权利要求1所述的一种基于自然语言的需求分析方法,其特征在于:步骤S2中,制作机器学习任务样本的具体过程如下:
利用网络爬虫获取样本数据;
获取样本数据类别,并将样本数据类别作为领域类别;
获取样本数据内容,将样本数据内容作为原始样本内容;
在样本数据内容中提取关键信息,作为原始样本标签。
3.如权利要求1所述的一种基于自然语言的需求分析方法,其特征在于:步骤S3对预调模型进行微调,具体过程如下;
S31、创建关系型数据库,其中一个数据表为领域-属性表,存放领域与属性的关联关系,另一个数据表为属性-组件表,存放属性对应的表单组件;
S32、输入样本数据,通过领域-属性表得到表单属性和推荐属性;;
S33、对表单属性和推荐属性进行调整,更新样本数据;
S34、利用更新后的样本数据对预调模型进行微调,得到微调后的需求分析机器学习模型。
4.如权利要求1所述的一种基于自然语言的需求分析方法,其特征在于:步骤S4具体如下:
S41、获取用户需求;
S42、将用户需求输入至领域判定任务中,通过领域判定任务和属性提取任务获取用户需求中的领域和属性;
S43、通过领域-属性表判断用户需求领域和属性是否已建立关联,若已建立关联,则通过属性-组件表进一步获取对应表单组件,得到用户需求表单;若未建立关联,进入步骤S44;
S44、建立领域和属性的关联,更新领域-属性表;
S45、根据属性查找属性-组件表,获取对应表单组件,得到用户需求表单;
S46、根据实际情况对用户需求表进行调整,同时实时更新属性-组件表,得到最终的用户需求表单。
5.一种存储设备,其特征在于:所述存储设备存储指令及数据用于实现权利要求1~4所述的任意一种基于自然语言的需求分析方法。
6.一种基于自然语言的需求分析设备,其特征在于:包括:处理器及存储设备;所述处理器加载并执行存储设备中的指令及数据用于实现权利要求1~4所述的任意一种基于自然语言的需求分析方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310137684.9A CN116301731A (zh) | 2023-02-17 | 2023-02-17 | 一种基于自然语言的需求分析方法、设备及存储设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310137684.9A CN116301731A (zh) | 2023-02-17 | 2023-02-17 | 一种基于自然语言的需求分析方法、设备及存储设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116301731A true CN116301731A (zh) | 2023-06-23 |
Family
ID=86837037
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310137684.9A Pending CN116301731A (zh) | 2023-02-17 | 2023-02-17 | 一种基于自然语言的需求分析方法、设备及存储设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116301731A (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110058846A (zh) * | 2019-04-19 | 2019-07-26 | 深圳市康拓普信息技术有限公司 | 一种业务应用软件开发系统和方法 |
CN110458383A (zh) * | 2019-06-24 | 2019-11-15 | 平安国际智慧城市科技股份有限公司 | 需求处理服务化的实现方法、装置及计算机设备、存储介质 |
CN112596703A (zh) * | 2020-12-28 | 2021-04-02 | 南方电网深圳数字电网研究院有限公司 | 需求向开发传承的实现方法、系统及存储介质 |
CN113609825A (zh) * | 2021-10-11 | 2021-11-05 | 北京百炼智能科技有限公司 | 一种客户属性标签智能标识方法和装置 |
WO2022252014A1 (zh) * | 2021-05-30 | 2022-12-08 | 浙江省北大信息技术高等研究院 | 一种创新创业服务供给与需求智能匹配的方法 |
-
2023
- 2023-02-17 CN CN202310137684.9A patent/CN116301731A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110058846A (zh) * | 2019-04-19 | 2019-07-26 | 深圳市康拓普信息技术有限公司 | 一种业务应用软件开发系统和方法 |
CN110458383A (zh) * | 2019-06-24 | 2019-11-15 | 平安国际智慧城市科技股份有限公司 | 需求处理服务化的实现方法、装置及计算机设备、存储介质 |
CN112596703A (zh) * | 2020-12-28 | 2021-04-02 | 南方电网深圳数字电网研究院有限公司 | 需求向开发传承的实现方法、系统及存储介质 |
WO2022252014A1 (zh) * | 2021-05-30 | 2022-12-08 | 浙江省北大信息技术高等研究院 | 一种创新创业服务供给与需求智能匹配的方法 |
CN113609825A (zh) * | 2021-10-11 | 2021-11-05 | 北京百炼智能科技有限公司 | 一种客户属性标签智能标识方法和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110275834A (zh) | 用户界面自动化测试系统及方法 | |
CN109408821B (zh) | 一种语料生成方法、装置、计算设备及存储介质 | |
CN110120001B (zh) | 一种基于知识图谱库与记忆曲线结合提分的方法及系统 | |
CN106326307A (zh) | 一种语言交互方法 | |
CN108829682A (zh) | 计算机可读存储介质、智能问答方法及智能问答装置 | |
CN113656805B (zh) | 一种面向多源漏洞信息的事件图谱自动构建方法及系统 | |
CN101452443A (zh) | 逻辑结构模型创建辅助设备和方法,用于其的记录介质 | |
CN111191012A (zh) | 知识图谱产生装置、方法及其计算机程序产品 | |
CN112115252A (zh) | 智能辅助写作处理方法、装置、电子设备及存储介质 | |
CN114549241A (zh) | 合同审查方法、装置、系统与计算机可读存储介质 | |
US20100217781A1 (en) | Optimized method and system for managing proper names to optimize the management and interrogation of databases | |
Kortum et al. | Dissection of AI job advertisements: A text mining-based analysis of employee skills in the disciplines computer vision and natural language processing | |
US20090228794A1 (en) | Business specification comprehension assistance system and method | |
CN113157978A (zh) | 数据的标签建立方法和装置 | |
CN116301731A (zh) | 一种基于自然语言的需求分析方法、设备及存储设备 | |
CN102103502A (zh) | 基于经过遗留系统的踪迹来分析遗留系统的方法和系统 | |
CN111859922A (zh) | 实体关系抽取技术在银行风控中的应用方法 | |
CN111459460A (zh) | 一种业务数据处理方法及系统 | |
CN111709221A (zh) | 一种文书生成方法及系统 | |
CN109165295B (zh) | 一种智能简历评估方法 | |
CN114860901A (zh) | 一种基于古籍信息的知识图谱构建方法及问答系统 | |
US20220156611A1 (en) | Method and apparatus for entering information, electronic device, computer readable storage medium | |
CN115757720A (zh) | 基于知识图谱的项目信息搜索方法、装置、设备和介质 | |
CN113435213B (zh) | 针对用户问题和知识库返回答案的方法和装置 | |
CN115599906A (zh) | 基于知识图谱的工程机械产品软件人员推荐方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |