CN110265024A - 需求文档生成方法及相关设备 - Google Patents
需求文档生成方法及相关设备 Download PDFInfo
- Publication number
- CN110265024A CN110265024A CN201910423035.9A CN201910423035A CN110265024A CN 110265024 A CN110265024 A CN 110265024A CN 201910423035 A CN201910423035 A CN 201910423035A CN 110265024 A CN110265024 A CN 110265024A
- Authority
- CN
- China
- Prior art keywords
- text information
- information
- text
- requirement documents
- equipment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 52
- 238000012986 modification Methods 0.000 claims description 48
- 230000004048 modification Effects 0.000 claims description 48
- 238000012790 confirmation Methods 0.000 claims description 19
- 238000012550 audit Methods 0.000 claims description 15
- 238000004590 computer program Methods 0.000 claims description 14
- 238000004891 communication Methods 0.000 claims description 13
- 238000012545 processing Methods 0.000 claims description 13
- 238000003860 storage Methods 0.000 claims description 7
- 230000015572 biosynthetic process Effects 0.000 abstract description 5
- 238000005516 engineering process Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 4
- 238000010606 normalization Methods 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 210000004556 brain Anatomy 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000001755 vocal effect Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 230000001815 facial effect Effects 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000000151 deposition Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/11—File system administration, e.g. details of archiving or snapshots
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/186—Templates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/04—Segmentation; Word boundary detection
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请实施例公开了一种需求文档方法及相关设备,其中方法包括:接收输入的语音文件;对所述语音文件进行声纹识别,以得到多个语音片段,每一语音片段对应一个身份标识;对每个所述语音片段进行语义识别,以得到多个第一文本信息;对所述多个第一文本信息进行分类,以得到多个第二文本信息;根据每个所述第二文本信息对应的类别生成需求文档。采用本申请,可提高需求文档的生成效率。
Description
技术领域
本申请涉及计算机技术领域,主要涉及了一种需求文档生成方法及相关设备。
背景技术
在大部分的企业,尤其是大型的企业,开发和测试都是处于不同部门的,而部门之间关于产品的沟通基本上都是靠文档来进行的,例如:需求文档。目前需求文档的编写是由需求分析人员通过对需求提出者对需求的描述进行人工编写,并经过开会讨论确认后完成的,耗费大量时间,如何提高需求文档的生成效率是本领域技术人员待解决的技术问题。
发明内容
本申请实施例提供了一种需求文档生成方法及相关设备,可提高需求文档的生成效率。
第一方面,本申请实施例提供一种需求文档生成方法,其中:
接收输入的语音文件;
对所述语音文件进行声纹识别,以得到多个语音片段,每一语音片段对应一个身份标识;
对每个所述语音片段进行语义识别,以得到多个第一文本信息;
对所述多个第一文本信息进行分类,以得到多个第二文本信息;
根据每个所述第二文本信息对应的类别生成需求文档。
第二方面,本申请实施例提供一种需求文档生成装置,其中:
通信单元,用于接收输入的语音文件;
处理单元,用于对所述语音文件进行声纹识别,以得到多个语音片段,每一语音片段对应一个身份标识;对每个所述语音片段进行语义识别,以得到多个第一文本信息;对所述多个第一文本信息进行分类,以得到多个第二文本信息;根据每个所述第二文本信息对应的类别生成需求文档。
第三方面,本申请实施例提供一种电子设备,包括处理器、存储器、通信接口以及一个或多个程序,其中,上述一个或多个程序被存储在上述存储器中,并且被配置由上述处理器执行,所述程序包括用于如第一方面中所描述的部分或全部步骤的指令。
第四方面,本申请实施例提供了一种计算机可读存储介质,其中,所述计算机可读存储介质存储计算机程序,其中,所述计算机程序使得计算机执行如本申请实施例第一方面中所描述的部分或全部步骤。
第五方面,本申请实施例提供了一种计算机程序产品,其中,所述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,所述计算机程序可操作来使计算机执行如本申请实施例第一方面中所描述的部分或全部步骤。该计算机程序产品可以为一个软件安装包。
实施本申请实施例,将具有如下有益效果:
采用了上述的需求文档生成方法及相关设备之后,电子设备接收输入的语音文件,对所述语音文件进行声纹识别,以得到多个语音片段,每一语音片段对应一个身份标识;对每个所述语音片段进行语义识别,以得到多个第一文本信息;对所述多个第一文本信息进行分类,以得到多个第二文本信息;根据每个所述第二文本信息对应的类别生成需求文档。如此,根据语音文件获取不同用户对应的语音信息,并生成对应的需求文档,提高了需求文档的生成效率。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
其中:
图1为本申请实施例提供的一种需求文档生成方法的流程示意图;
图2为本申请实施例提供的一种需求文档生成装置的结构示意图;
图3为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。根据本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
下面对本申请实施例进行详细介绍。
请参照图1,本申请实施例提供一种需求文档生成方法的流程示意图。该需求文档生成方法应用于电子设备,本申请实施例所涉及到的电子设备可以包括各种具有无线通信功能的手持设备、可穿戴设备、计算设备或连接到无线调制解调器的其他处理设备,以及各种形式的用户设备(user equipment,UE),移动台(mobile station,MS),终端设备(terminal device)等等。为方便描述,上面提到的设备统称为电子设备。
具体的,如图1所示,一种需求文档生成方法,应用于电子设备,其中:
S101:接收输入的语音文件。
在本申请中,电子设备可安装需求文档管理应用,在该应用中可接收需求文档的上传、编辑、下载、删除等操作。语音文件可以是用户通过需求文档管理应用对应的文件上传位置录入的文件或导入的文件,即可以提前录入语音文件,也可在该位置启动录音应用,在结束时完成语音文件的录入。该语音文件可以是整个需求文档对应的声音数据,也可以是针对部分需求文档的声音数据。该语音文件可包括一个用户的声音数据,也可以包括多个用户的声音数据,也就是说,本申请还应用于多人讨论的场景中。
S102:对所述语音文件进行声纹识别,以得到多个语音片段,每一语音片段对应一个身份标识。
声纹识别技术,是把声信号转换成电信号,再用计算机进行识别以得到声纹特征,如此,识别用户身份。
在本申请中,身份标识可以是用户的身份证号码、电话号码、邮箱号码、应用标识,也可以是用户登录的电子设备的物理标识等,在此不做限定,需要说明的是,该身份标识具有唯一标识性。
可以理解,每个人的声音不同,若语音文件包括多个用户的声音数据,则通过声纹识别技术对语音文件进行识别,可得到各个用户的语音片段。
S103:对每个所述语音片段进行语义识别,以得到多个第一文本信息。
语音识别技术,是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。目前在许多领域得到广泛的应用,包括语音搜索、音频听写(音频转文本)、智能语音导航系统(用于客服系统)等。
语义识别技术,是在语音识别的基础上,对一句话进行自动分词,它还能进一步整理句子的结构,甚至理解句子的意思。本申请对于语义识别的具体方法不做限定,可包括基于字符串匹配的分词方法、统计语言模型算法、基于序列标注的分词方法、基于深度学习的方法等。
需要说明的是,多个语音片段中可包括同一个用户的多个片段,该语音片段可根据语音文件中的停顿时长和语义的完整性、以及声纹特征进行划分,即若停顿时长大于预设阈值,且该语句为完整的句子,则识别一个文本片段。
在本申请中,第一文本信息为各个语音片段对应的文本信息。也就是说,根据语义识别技术对各个用户的语音片段进行语义识别以得到每一用户对应的第一文本信息。
S104:对所述多个第一文本信息进行分类,以得到多个第二文本信息。
在本申请中,需求文档是产品项目由“准备”阶段进入到“实施”阶段的文档,需求文档可包括需求背景、需求目标、特征列表、主要逻辑、特性功能点、特性需求、性能需求、数据上报、版本号记录等多个类别,在此不做限定。
在本申请中,第二文本信息为各个类别对应的文本信息。可以理解,本申请可根据上述多个类别进行分类以得到多个第二文本信息,如此,可分别整理对应类别的第二文本信息,提高了生成需求文档的效率。
本申请对于如何对多个第一文本信息进行分类的方法也不做限定,在一种可能的方式,所述对所述多个第一文本信息进行分类,以得到多个第二文本信息,包括:获取所述语音文件对应的需求文档类型;根据所述需求文档类型获取所述需求文档对应的多个类别;根据所述多个类别对所述多个第一文本信息进行分类,以得到多个第三文本信息,每一所述第三文本信息集对应一个类别;对每个所述第三文本信息进行规范处理,以得到所述多个第二文本信息。
其中,需求文档类型可包括业务需求、业务优化等,在此不做限定。本申请对于获取语音文件对应的需求文档类型不做限定,可直接根据在输入语音文件之前,用户输入的需求文档类型进行确定;也可根据各个第一文本信息中的关键信息识别该语音文件的需求文档类型。
如前所述,类别可包括需求背景、需求目标、特征列表、主要逻辑、特性功能点、特性需求、性能需求、数据上报、版本号记录等。可以理解,根据需求文档类型获取多个类别,可提高类别分类的准确性。
在本申请中,规范处理可以是将第三文本信息中模糊的词语或表达不准确的词语、或不符合专业术语的词语等进行调整,也可以将第三文本信息按照标准需求文档的格式进行整理,还可将第三文本信息中的否决方案进行删除。如此,可提高需求文档的专业性、规范性和整洁性。
可以理解,该实施例先获取语音文件对应的需求文档类型,再根据该需求文档类型获取多个类别,再根据该多个类别分类多个第一文本信息以得到多个第三文本信息,可提高第一文本信息分类的准确性,便于提高生成需求文档的准确性。然后,在对所述多个第二文本信息进行规范处理以得到所述多个第二文本信息,以提高需求文档的规范性。
本申请对于规范处理的方法不做限定,在一种可能的方式,若所述多个第三文本信息包括目标第三文本信息,则所述对每个所述第三文本信息进行规范处理,以得到所述多个第二文本信息,包括:获取所述目标第三文本信息对应的关键词;在预设数据库中,搜索与所述关键词对应的文档模板;根据所述文档模块修改所述目标第三文本信息,以得到所述目标第三文本信息对应的第二文本信息。
其中,关键词可以直接是目标第三文本信息中的词汇,也可以是根据目标第三文本信息提取的摘要信息等,在此不做限定。
在本申请中,预设数据库包括多个需求文档的文档模板,该文档模板可包括各个需求文档的类别对应的格式要求,也可包括各个需求文档类型对应的格式要求等,应用于不同的需求文档。
可以理解,在该实施例中以目标第三文本信息进行说明,其它的第三文本信息的规范处理方法可参照此方法,在此不再赘述。具体的,先获取目标第三文本信息对应的关键词,再从预设数据库中搜索与该关键词对应的文档模板,然后根据该文档模板修改上述的目标第三文本信息以得到符合规范的目标第三文本信息对应的第二文本信息。如此,依据规范的文档模板修改目标第三文本信息,可提高第二文本信息的规范性,便于提高需求文档的可读性。
在一种可能的方式,所述方法还包括:获取所述关键词对应的关联词;输出所述关联词对应的待添加信息;接收针对所述待添加信息的修改确认指令;根据所述修改确认指令,将所述待添加信息至所述目标第三文本信息对应的第二文本信息中的对应位置。
其中,关联词可以是关键词本身的联想词,也可以是需求文档类型对应的相关词汇,在此不做限定。
待添加信息为该目标第三文本信息中待添加的信息,例如:若目标文本信息为博客网页,若关键词为文章和评论,则待添加信息可为分类和阅读模式。
修改确认指令用于指示电子设备用户允许添加所述待添加信息,可以是用户手段输入的文字信息,也可以是用户输入的修改语音文件,以提高修改操作的灵活性。若为修改确认指令的类型为语音指令,则电子设备先进行语音识别,然后执行添加操作。
可以理解,先获取关键词获取关联词,再输出该关联词对应的待添加信息。如此,输入的语音文件的需求提出者可根据关联词对应的待添加信息,确定是否存在遗漏添加信息,若确定遗漏,可发送针对该待添加信息的修改确认指令,则电子设备根据该修改确认指令,将该待添加信息添加至目标第三文本信息对应的第二文本信息中的对应位置。如此,可提高目标文本信息的完善性,便于提高需求文档的完善性。
进一步的,在一种可能的方式,在所述根据所述修改确认指令,将所述待添加信息至所述目标第三文本信息对应的第二文本信息中的对应位置之前,所述方法还包括:获取所述修改确认指令对应的用户身份信息;若所述用户身份信息验证成功,则确定所述用户身份信息对应的审核用户标识;将所述修改指令和所述需求文档发送给所述审核用户标识对应的第一设备;若接收到所述第一设备发送的允许修改指令,则执行所述根据所述修改确认指令,将所述待添加信息至所述目标第三文本信息对应的第二文本信息中的对应位置的步骤。
其中,用户身份信息可以是面部图像信息、音频信息、视频信息、脑电波信息、指纹信息、眼纹信息等生物信息,用户身份信息也可以是用户的具有唯一性的身份标识,例如:身份证号码、电话号码、邮箱号码、应用标识等,在此也不做限定。
本申请对于获取用户身份信息的方法不做限定,本申请可通过电子设备的摄像头采集面部图像信息、视频信息或眼纹信息;通过电子设备的麦克风采集音频信息;通过电子设备的脑电波传感器采集脑电波信息等,在此不做限定。需要说明的是,该用户身份信息为目标用户在电子设备上输入的。
在本申请中,允许修改指令用于指示该修改指令审核通过;用户身份信息对应的审核用户标识可以该用户身份信息对应的用户的复核人的标识信息,如此,该实施例中,在用户身份信息验证成功之后,还需复核人对该修改指令进行确认,以提高修改的合理性。
第一设备为审核用户标识对应的电子设备,若审核用户标识为电话号码,则可将修改指令和需求文档以短信或彩信的形式发送至电话号码对应的第一设备;若审核用户标识为邮箱号码,则可将修改指令和需求文档以邮件的形式发送至邮箱号码对应的第一设备;若审核用户标识为应用标识,则可将修改指令和需求文档以推送的形式发送至应用标识对应的第一设备等。
可以理解,在该实施例中,先获取修改确认指令对应的用户身份信息,若该用户身份信息验证成功,则确定该用户身份信息对应的审核用户标识,将该修改指令和需求文档发送给该审核用户标识对应的第一设备,若接收该第一设备发送的允许修改指令,则执行所述根据所述修改确认指令,将所述待添加信息至所述目标第三文本信息对应的第二文本信息中的对应位置的步骤。如此,既通过用户身份信息验证了发送修改指令对应的用户的身份的合法性,又通过允许修改指令验证了该修改指令对应的修改合理性,可避免非法和不合理的修改,提高目标第三文本信息对应的第二文本信息的安全性和合理性,便于提高需求文档的安全性和合理性。
S105、根据每个所述第二文本信息对应的类别生成需求文档。
在本申请中,对于需求文档的生成方法不做限定,在一种可能的方式,所述根据每个所述第二文本信息对应的类别生成需求文档,包括:获取每个所述第二文本信息对应的类别的排列序号,以得到多个排列序号;根据所述多个排列序号对所述多个第二文本信息进行组合,以得到所述需求文档。
类别可存在一定的排列顺序,例如:需求背景在需求文档的开端部位,而版本号记录在需求文档的末端部位。举例来说,需求背景对应的排列序号为1、需求目标对应的排列序号为2、特征列表对应的排列序号为3、版本号记录对应的排列序号为4,从而分别按照需求背景、需求目标、特征列表和版本号记录的顺序进行组合以得到需求文档。
可以理解,电子设备先获取各个第二文本信息对应的排列序号以得到多个排列序号,再根据多个排列序号的顺序对多个第二文本信息进行组合以得到需求文档,可提高需要文档的规范性。
在如图1所示的需求文档生成方法中,电子设备接收输入的语音文件,对所述语音文件进行声纹识别,以得到多个语音片段,每一语音片段对应一个身份标识;对每个所述语音片段进行语义识别,以得到多个第一文本信息;对所述多个第一文本信息进行分类,以得到多个第二文本信息;根据每个所述第二文本信息对应的类别生成需求文档。如此,根据语音文件获取不同用户对应的语音信息,并生成对应的需求文档,提高了需求文档的生成效率。
在一种可能的方式,所述方法还包括:根据所述多个语音片段中每一语音片段对应的身份标识获取多个第二设备;将所述需求文档分别发送给所述多个第二设备;若接收到所述多个第二设备中每一第二设备发送的确认指令,则将所述需求文档发往服务器。
其中,第二设备可以为与该身份标识对应的电子设备,具体可参照第一设备的描述,在此不再赘述;第二设备还可以是多个身份标识对应的团队负责人所对应的电子设备,例如:若确定多个身份标识对应的团队为第一部门,则第二设备为第一部门的团队负责人对应的电子设备等,在此不做限定。
在本申请中,上传确认指令用于指示电子设备用户已确认需求文档的信息;服务器可以是该公司指定的用于管理需求文档的服务器,也可以是任一服务器,在此不做限定。
可以理解,根据各个语音片段对应的身份标识获取多个第二设备,再将需求文档分别发送给各个第二设备,若各个第二设备均发送上传确认指令,则将该需求文档发送至服务器。如此,该实施例应用于多人讨论的场景中,并通过各个第二设备确认该需求文档,从而可提高需求文档的合理性,且采用服务器存储该需求文档,则合法用户可在该服务器中获取该需求文档,提高了操作需求文档的便利性。
需要说明的是,在所述根据每个所述第二文本信息对应的类别生成需求文档之后,也可接收其他的修改指令,并可针对该修改指令进行身份验证和合理性验证,以提高需求文档的安全性和合理性。其中,修改指令可以是任一用户针对该需求文档提出的修改请求,在此不做限定。
与图1的实施例一致,请参照图2,图2是本申请实施例提供的一种需求文档生成装置的结构示意图,所述装置应用于电子设备。如图2所示,上述需求文档生成装置200包括:
通信单元201,用于接收输入的语音文件;
处理单元202,用于对所述语音文件进行声纹识别,以得到多个语音片段,每一语音片段对应一个身份标识;对每个所述语音片段进行语义识别,以得到多个第一文本信息;对所述多个第一文本信息进行分类,以得到多个第二文本信息;根据每个所述第二文本信息对应的类别生成需求文档。
可以理解,电子设备接收输入的语音文件,对所述语音文件进行声纹识别,以得到多个语音片段,每一语音片段对应一个身份标识;对每个所述语音片段进行语义识别,以得到多个第一文本信息;对所述多个第一文本信息进行分类,以得到多个第二文本信息;根据每个所述第二文本信息对应的类别生成需求文档。如此,根据语音文件获取不同用户对应的语音信息,并生成对应的需求文档,提高了需求文档的生成效率。
在一个可能的示例中,在所述对所述多个第一文本信息进行分类,以得到多个第二文本信息方面,所述处理单元202具体用于获取所述语音文件对应的需求文档类型;根据所述需求文档类型获取所述需求文档对应的多个类别;根据所述多个类别对所述多个第一文本信息进行分类,以得到多个第三文本信息,每一所述第三文本信息集对应一个类别;对每个所述第三文本信息进行规范处理,以得到所述多个第二文本信息。
在一个可能的示例中,若所述多个第三文本信息包括目标第三文本信息,则在所述对每个所述第三文本信息进行规范处理,以得到所述多个第二文本信息方面,所述处理单元202具体用于获取所述目标第三文本信息对应的关键词;在预设数据库中,搜索与所述关键词对应的文档模板;根据所述文档模块修改所述目标第三文本信息,以得到所述目标第三文本信息对应的第二文本信息。
在一个可能的示例中,所述处理单元202还用于获取所述关键词对应的关联词;所述通信单元201还用于输出所述关联词对应的待添加信息;接收针对所述待添加信息的修改确认指令;所述处理单元202还用于根据所述修改确认指令,将所述待添加信息至所述目标第三文本信息对应的第二文本信息中的对应位置。
在一个可能的示例中,在所述根据所述修改确认指令,将所述待添加信息至所述目标第三文本信息对应的第二文本信息中的对应位置之前,所述处理单元202还用于获取所述修改确认指令对应的用户身份信息;若所述用户身份信息验证成功,则确定所述用户身份信息对应的审核用户标识;所述通信单元201还用于将所述修改指令和所述需求文档发送给所述审核用户标识对应的第一设备;若接收到所述第一设备发送的允许修改指令,则调用所述处理单元202执行所述根据所述修改确认指令,将所述待添加信息至所述目标第三文本信息对应的第二文本信息中的对应位置的步骤。
在一个可能的示例中,所述处理单元202还用于根据所述多个语音片段中每一语音片段对应的身份标识获取多个第二设备;所述通信单元201还用于将所述需求文档分别发送给所述多个第二设备;若接收到所述多个第二设备中每一第二设备发送的上传确认指令,则将所述需求文档发往服务器。
在一个可能的示例中,在所述根据每个所述第二文本信息对应的类别生成需求文档方面,所述处理单元202具体用于获取每个所述第二文本信息对应的类别的排列序号,以得到多个排列序号;根据所述多个排列序号对所述多个第二文本信息进行组合,以得到所述需求文档。
与图1的实施例一致,请参照图3,图3是本申请实施例提供的一种电子设备的结构示意图。如图3所示,该电子设备300包括处理器310、存储器320、通信接口330以及一个或多个程序340,其中,上述一个或多个程序340被存储在上述存储器320中,并且被配置由上述处理器310执行,上述程序340包括用于执行以下步骤的指令:
接收输入的语音文件;
对所述语音文件进行声纹识别,以得到多个语音片段,每一语音片段对应一个身份标识;
对每个所述语音片段进行语义识别,以得到多个第一文本信息;
对所述多个第一文本信息进行分类,以得到多个第二文本信息;
根据每个所述第二文本信息对应的类别生成需求文档。
可以理解,电子设备300接收输入的语音文件,对所述语音文件进行声纹识别,以得到多个语音片段,每一语音片段对应一个身份标识;对每个所述语音片段进行语义识别,以得到多个第一文本信息;对所述多个第一文本信息进行分类,以得到多个第二文本信息;根据每个所述第二文本信息对应的类别生成需求文档。如此,根据语音文件获取不同用户对应的语音信息,并生成对应的需求文档,提高了需求文档的生成效率。
在一个可能的示例中,在所述对所述多个第一文本信息进行分类,以得到多个第二文本信息方面,所述程序340具体用于执行以下步骤的指令:
获取所述语音文件对应的需求文档类型;
根据所述需求文档类型获取所述需求文档对应的多个类别;
根据所述多个类别对所述多个第一文本信息进行分类,以得到多个第三文本信息,每一所述第三文本信息集对应一个类别;
对每个所述第三文本信息进行规范处理,以得到所述多个第二文本信息。
在一个可能的示例中,若所述多个第三文本信息包括目标第三文本信息,则在所述对每个所述第三文本信息进行规范处理,以得到所述多个第二文本信息方面,所述程序340具体用于执行以下步骤的指令:
获取所述目标第三文本信息对应的关键词;
在预设数据库中,搜索与所述关键词对应的文档模板;
根据所述文档模块修改所述目标第三文本信息,以得到所述目标第三文本信息对应的第二文本信息。
在一个可能的示例中,所述程序340还用于执行以下步骤的指令:
获取所述关键词对应的关联词;
输出所述关联词对应的待添加信息;
接收针对所述待添加信息的修改确认指令;
根据所述修改确认指令,将所述待添加信息至所述目标第三文本信息对应的第二文本信息中的对应位置。
在一个可能的示例中,在所述根据所述修改确认指令,将所述待添加信息至所述目标第三文本信息对应的第二文本信息中的对应位置之前,所述程序340还用于执行以下步骤的指令:
获取所述修改确认指令对应的用户身份信息;
若所述用户身份信息验证成功,则确定所述用户身份信息对应的审核用户标识;
将所述修改指令和所述需求文档发送给所述审核用户标识对应的第一设备;
若接收到所述第一设备发送的允许修改指令,则执行所述根据所述修改确认指令,将所述待添加信息至所述目标第三文本信息对应的第二文本信息中的对应位置的步骤。
在一个可能的示例中,所述程序340还用于执行以下步骤的指令:
根据所述多个语音片段中每一语音片段对应的身份标识获取多个第二设备;
将所述需求文档分别发送给所述多个第二设备;
若接收到所述多个第二设备中每一第二设备发送的上传确认指令,则将所述需求文档发往服务器。
在一个可能的示例中,在所述根据每个所述第二文本信息对应的类别生成需求文档方面,所述程序340具体用于执行以下步骤的指令:
获取每个所述第二文本信息对应的类别的排列序号,以得到多个排列序号;
根据所述多个排列序号对所述多个第二文本信息进行组合,以得到所述需求文档。
本申请实施例还提供一种计算机存储介质,其中,该计算机存储介质存储用于存储计算机程序,该计算机程序使得计算机执行如方法实施例中记载的任一方法的部分或全部步骤,计算机包括电子设备。
本申请实施例还提供一种计算机程序产品,计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,计算机程序可操作来使计算机执行如方法实施例中记载的任一方法的部分或全部步骤。该计算机程序产品可以为一个软件安装包,计算机包括电子设备。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模式并不一定是本申请所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件程序模式的形式实现。
集成的单元如果以软件程序模式的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储器中。根据这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例方法的全部或部分步骤。而前述的存储器包括:U盘、只读存储器(read-only memory,ROM)、随机存取存储器(randomaccess memory,RAM)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储器中,存储器可以包括:闪存盘、ROM、RAM、磁盘或光盘等。
以上对本申请实施例进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上,本说明书内容不应理解为对本申请的限制。
Claims (10)
1.一种需求文档生成方法,其特征在于,包括:
接收输入的语音文件;
对所述语音文件进行声纹识别,以得到多个语音片段,每一语音片段对应一个身份标识;
对每个所述语音片段进行语义识别,以得到多个第一文本信息;
对所述多个第一文本信息进行分类,以得到多个第二文本信息;
根据每个所述第二文本信息对应的类别生成需求文档。
2.根据权利要求1所述的方法,其特征在于,所述对所述多个第一文本信息进行分类,以得到多个第二文本信息,包括:
获取所述语音文件对应的需求文档类型;
根据所述需求文档类型获取所述需求文档对应的多个类别;
根据所述多个类别对所述多个第一文本信息进行分类,以得到多个第三文本信息,每一所述第三文本信息集对应一个类别;
对每个所述第三文本信息进行规范处理,以得到所述多个第二文本信息。
3.根据权利要求2所述的方法,其特征在于,若所述多个第三文本信息包括目标第三文本信息,则所述对每个所述第三文本信息进行规范处理,以得到所述多个第二文本信息,包括:
获取所述目标第三文本信息对应的关键词;
在预设数据库中,搜索与所述关键词对应的文档模板;
根据所述文档模块修改所述目标第三文本信息,以得到所述目标第三文本信息对应的第二文本信息。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
获取所述关键词对应的关联词;
输出所述关联词对应的待添加信息;
接收针对所述待添加信息的修改确认指令;
根据所述修改确认指令,将所述待添加信息至所述目标第三文本信息对应的第二文本信息中的对应位置。
5.根据权利要求4所述的方法,其特征在于,在所述根据所述修改确认指令,将所述待添加信息至所述目标第三文本信息对应的第二文本信息中的对应位置之前,所述方法还包括:
获取所述修改确认指令对应的用户身份信息;
若所述用户身份信息验证成功,则确定所述用户身份信息对应的审核用户标识;
将所述修改指令和所述需求文档发送给所述审核用户标识对应的第一设备;
若接收到所述第一设备发送的允许修改指令,则执行所述根据所述修改确认指令,将所述待添加信息至所述目标第三文本信息对应的第二文本信息中的对应位置的步骤。
6.根据权利要求1-5任一项所述的方法,其特征在于,所述方法还包括:
根据所述多个语音片段中每一语音片段对应的身份标识获取多个第二设备;
将所述需求文档分别发送给所述多个第二设备;
若接收到所述多个第二设备中每一第二设备发送的上传确认指令,则将所述需求文档发往服务器。
7.根据权利要求1-5任一项所述的方法,其特征在于,所述根据每个所述第二文本信息对应的类别生成需求文档,包括:
获取每个所述第二文本信息对应的类别的排列序号,以得到多个排列序号;
根据所述多个排列序号对所述多个第二文本信息进行组合,以得到所述需求文档。
8.一种需求文档生成装置,其特征在于,包括:
通信单元,用于接收输入的语音文件;
处理单元,用于对所述语音文件进行声纹识别,以得到多个语音片段,每一语音片段对应一个身份标识;对每个所述语音片段进行语义识别,以得到多个第一文本信息;对所述多个第一文本信息进行分类,以得到多个第二文本信息;根据每个所述第二文本信息对应的类别生成需求文档。
9.一种电子设备,其特征在于,包括处理器、存储器、通信接口以及一个或多个程序,其中,所述一个或多个程序被存储在所述存储器中,并且被配置由所述处理器执行,所述程序包括用于执行权利要求1-7任一项方法中的步骤的指令。
10.一种计算机可读存储介质,其特征在于,其用于存储计算机程序,其中,所述计算机程序使得计算机执行如权利要求1-7任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910423035.9A CN110265024A (zh) | 2019-05-20 | 2019-05-20 | 需求文档生成方法及相关设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910423035.9A CN110265024A (zh) | 2019-05-20 | 2019-05-20 | 需求文档生成方法及相关设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110265024A true CN110265024A (zh) | 2019-09-20 |
Family
ID=67914942
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910423035.9A Pending CN110265024A (zh) | 2019-05-20 | 2019-05-20 | 需求文档生成方法及相关设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110265024A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110851564A (zh) * | 2019-10-10 | 2020-02-28 | 安徽听见科技有限公司 | 一种语音数据处理方法和相关装置 |
CN110956682A (zh) * | 2019-11-26 | 2020-04-03 | 上海秒针网络科技有限公司 | 一种检查结果生成方法及装置 |
CN111339910A (zh) * | 2020-02-24 | 2020-06-26 | 支付宝实验室(新加坡)有限公司 | 文本的处理、文本分类模型的训练方法及装置 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100228693A1 (en) * | 2009-03-06 | 2010-09-09 | phiScape AG | Method and system for generating a document representation |
CN108109444A (zh) * | 2017-12-26 | 2018-06-01 | 重庆大争科技有限公司 | 基于音频教学的文档教案生成方法 |
CN108132995A (zh) * | 2017-12-20 | 2018-06-08 | 北京百度网讯科技有限公司 | 用于处理音频信息的方法和装置 |
CN109190098A (zh) * | 2018-08-15 | 2019-01-11 | 上海唯识律简信息科技有限公司 | 一种基于自然语言处理的文档自动生成方法和系统 |
CN109284427A (zh) * | 2018-08-30 | 2019-01-29 | 上海与德通讯技术有限公司 | 一种文档生成方法、装置、服务器和存储介质 |
CN109388701A (zh) * | 2018-08-17 | 2019-02-26 | 深圳壹账通智能科技有限公司 | 会议记录生成方法、装置、设备和计算机存储介质 |
-
2019
- 2019-05-20 CN CN201910423035.9A patent/CN110265024A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100228693A1 (en) * | 2009-03-06 | 2010-09-09 | phiScape AG | Method and system for generating a document representation |
CN108132995A (zh) * | 2017-12-20 | 2018-06-08 | 北京百度网讯科技有限公司 | 用于处理音频信息的方法和装置 |
CN108109444A (zh) * | 2017-12-26 | 2018-06-01 | 重庆大争科技有限公司 | 基于音频教学的文档教案生成方法 |
CN109190098A (zh) * | 2018-08-15 | 2019-01-11 | 上海唯识律简信息科技有限公司 | 一种基于自然语言处理的文档自动生成方法和系统 |
CN109388701A (zh) * | 2018-08-17 | 2019-02-26 | 深圳壹账通智能科技有限公司 | 会议记录生成方法、装置、设备和计算机存储介质 |
CN109284427A (zh) * | 2018-08-30 | 2019-01-29 | 上海与德通讯技术有限公司 | 一种文档生成方法、装置、服务器和存储介质 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110851564A (zh) * | 2019-10-10 | 2020-02-28 | 安徽听见科技有限公司 | 一种语音数据处理方法和相关装置 |
CN110851564B (zh) * | 2019-10-10 | 2023-06-09 | 安徽听见科技有限公司 | 一种语音数据处理方法和相关装置 |
CN110956682A (zh) * | 2019-11-26 | 2020-04-03 | 上海秒针网络科技有限公司 | 一种检查结果生成方法及装置 |
CN110956682B (zh) * | 2019-11-26 | 2024-04-12 | 上海明胜品智人工智能科技有限公司 | 一种检查结果生成方法及装置 |
CN111339910A (zh) * | 2020-02-24 | 2020-06-26 | 支付宝实验室(新加坡)有限公司 | 文本的处理、文本分类模型的训练方法及装置 |
CN111339910B (zh) * | 2020-02-24 | 2023-11-28 | 支付宝实验室(新加坡)有限公司 | 文本的处理、文本分类模型的训练方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102985965B (zh) | 声纹标识 | |
US10629189B2 (en) | Automatic note taking within a virtual meeting | |
CN109388701A (zh) | 会议记录生成方法、装置、设备和计算机存储介质 | |
CN110335612A (zh) | 基于语音识别的会议记录生成方法、装置及存储介质 | |
CN104252464B (zh) | 信息处理方法和装置 | |
US7415409B2 (en) | Method to train the language model of a speech recognition system to convert and index voicemails on a search engine | |
CN110265024A (zh) | 需求文档生成方法及相关设备 | |
CN110377908B (zh) | 语义理解方法、装置、设备及可读存储介质 | |
CN104485105A (zh) | 一种电子病历生成方法和电子病历系统 | |
CN110866110A (zh) | 基于人工智能的会议纪要生成方法、装置、设备及介质 | |
US20140280186A1 (en) | Crowdsourcing and consolidating user notes taken in a virtual meeting | |
CN106713111B (zh) | 一种添加好友的处理方法、终端及服务器 | |
CN102272789A (zh) | 通过自动语音邮件预览的增强的语音邮件使用 | |
JP2018522303A (ja) | アカウント追加方法、端末、サーバ、およびコンピュータ記憶媒体 | |
CN115427958A (zh) | 语音识别和内容去识别 | |
CN106847256A (zh) | 一种语音转化聊天方法 | |
CN111223487B (zh) | 一种信息处理方法及电子设备 | |
CN108364638A (zh) | 一种语音数据处理方法、装置、电子设备和存储介质 | |
CN113342942B (zh) | 语料自动化获取方法、装置、计算机设备及存储介质 | |
CN108055192A (zh) | 群组生成方法、装置及系统 | |
CN110740212B (zh) | 基于智能语音技术的通话接听方法、装置及电子设备 | |
CN103631780A (zh) | 多媒体记录系统及方法 | |
CN105376143B (zh) | 一种识别发送者身份的方法及装置 | |
CN109147791A (zh) | 一种速记系统和方法 | |
EP4014108A1 (en) | Automated extraction of implicit tasks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |