CN114548063A - 基于全链路语音识别技术的电子表单填写方法及装置 - Google Patents
基于全链路语音识别技术的电子表单填写方法及装置 Download PDFInfo
- Publication number
- CN114548063A CN114548063A CN202210015813.2A CN202210015813A CN114548063A CN 114548063 A CN114548063 A CN 114548063A CN 202210015813 A CN202210015813 A CN 202210015813A CN 114548063 A CN114548063 A CN 114548063A
- Authority
- CN
- China
- Prior art keywords
- voice
- information
- electronic form
- processing
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 80
- 238000005516 engineering process Methods 0.000 title claims abstract description 48
- 230000008569 process Effects 0.000 claims abstract description 36
- 238000012795 verification Methods 0.000 claims description 34
- 230000015654 memory Effects 0.000 claims description 17
- 238000013473 artificial intelligence Methods 0.000 claims description 14
- 238000003058 natural language processing Methods 0.000 claims description 7
- 238000003860 storage Methods 0.000 claims description 6
- 230000009467 reduction Effects 0.000 claims description 5
- 230000002618 waking effect Effects 0.000 claims description 5
- 230000002194 synthesizing effect Effects 0.000 claims description 4
- 238000007689 inspection Methods 0.000 abstract description 51
- 238000004590 computer program Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 238000001514 detection method Methods 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011946 reduction process Methods 0.000 description 1
- 239000004984 smart glass Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/177—Editing, e.g. inserting or deleting of tables; using ruled lines
- G06F40/18—Editing, e.g. inserting or deleting of tables; using ruled lines of spreadsheets
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1815—Semantic context, e.g. disambiguation of the recognition hypotheses based on word meaning
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1822—Parsing for meaning understanding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/183—Speech classification or search using natural language modelling using context dependencies, e.g. language models
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G07—CHECKING-DEVICES
- G07C—TIME OR ATTENDANCE REGISTERS; REGISTERING OR INDICATING THE WORKING OF MACHINES; GENERATING RANDOM NUMBERS; VOTING OR LOTTERY APPARATUS; ARRANGEMENTS, SYSTEMS OR APPARATUS FOR CHECKING NOT PROVIDED FOR ELSEWHERE
- G07C1/00—Registering, indicating or recording the time of events or elapsed time, e.g. time-recorders for work people
- G07C1/20—Checking timed patrols, e.g. of watchman
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Theoretical Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本发明提供了一种基于全链路语音识别技术的电子表单填写方法及装置,该方法包括:接收某一人员输入的第一语音信息;离线识别所述第一语音信息,得到第一识别信息;根据所述第一识别信息,唤醒语音识别设备,并在确定的第一时间段内保持所述语音识别设备处于唤醒状态;在所述语音识别设备处于所述唤醒状态的过程中,接收某一人员输入的第二语音信息,所述第二语音信息包括电子表单的相关内容;基于确定出的语音处理模型对所述第二语音信息进行处理,得到语音处理结果;根据所述语音处理结果,生成完成填写的目标电子表单。可见,本发明能够通过全链路语音识别技术自动填写电子表单,减少巡检人员的工作量,从而提高设备巡检的工作效率。
Description
技术领域
本发明涉及智能语音识别技术领域,尤其涉及一种基于全链路语音识别技术的电子表单填写方法及装置。
背景技术
对于企业来说,在经营生产过程中,存在大量的设备,在使用这些设备进行生产过程中,需要对这些设备进行试验、维护、定期检测等日常巡检工作,在完成日常巡检后,需要通过终端设备将这些设备的检测数据记录在对应的电子表单中,通过对企业中的设备进行日常巡检并记录相关数据后,可及时了解企业设备的运行状况,保证企业运营的稳定性。
当前,在对企业设备(如电力企业设备)的巡检中,在获取到设备的巡检数据后,通常是通过巡检人员手动将巡检数据填写到对应的电子表单中。然而,实践发现,通过目前电子表单的填写方式,在巡检完设备后,需要巡检人员将巡检数据手动填写到对应的电子表单中,巡检人员不能完全释放双手,使得增加了巡检人员的工作量,导致设备巡检的工作效率较低。
发明内容
本发明所要解决的技术问题在于,提供一种基于全链路语音识别技术的电子表单填写方法及装置,能够通过全链路语音识别技术自动填写电子表单,减少巡检人员的工作量,从而提高设备巡检的工作效率。
为了解决上述技术问题,本发明第一方面公开了一种基于全链路语音识别技术的电子表单填写方法,所述方法包括:
接收某一人员输入的第一语音信息;
离线识别所述第一语音信息,得到第一识别信息;
根据所述第一识别信息,唤醒语音识别设备,并在确定的第一时间段内保持所述语音识别设备处于唤醒状态;
在所述语音识别设备处于所述唤醒状态的过程中,接收某一人员输入的第二语音信息,所述第二语音信息包括电子表单的相关内容;
基于确定出的语音处理模型对所述第二语音信息进行处理,得到语音处理结果;
根据所述语音处理结果,生成完成填写的目标电子表单。
作为一种可选的实施方式,在本发明第一方面中,所述基于确定出的语音处理模型对所述第二语音信息进行处理,得到语音处理结果,包括:
基于人工智能模块对所述第二语音信息进行优化,得到优化语音信息;
根据所述优化语音信息,确定第二识别信息,其中,所述第二识别信息包括所述优化语音信息对应的第一关键词信息;
根据所述第二识别信息,结合大数据模块的数据,确定所述第二识别信息对应的目标信息;
对所述目标信息进行自然语言处理,得到语音处理结果。
作为一种可选的实施方式,在本发明第一方面中,所述根据所述第一识别信息,唤醒语音识别设备,包括:
判断所述第一识别信息中是否包括预设唤醒词,其中,所述预设唤醒词用于唤醒语音识别设备;
当判断结果为是时,对所述语音识别设备进行唤醒操作;
以及,所述方法还包括:
检测所述目标电子表单的内容是否填写完毕;
当检测到所述目标电子表单的内容已填写完毕时,对所述目标电子表单中的关键内容执行校验操作,得到校验结果,所述校验操作包括数据类型校验操作、数值校验操作、填写位置校验操作、小数点校验操作中的至少一种;
当所述校验结果表示所述关键内容符合预设填表条件时,结束所述语音识别设备的所述唤醒状态。
作为一种可选的实施方式,在本发明第一方面中,所述根据所述语音处理结果,生成完成填写的目标电子表单之前,所述方法还包括:
根据所述语音处理结果,合成语音输出信息,其中,所述语音输出信息包括所述第二语音信息;
根据所述语音输出信息,生成第一提示信息,其中,所述第一提示信息包括所述语音输出信息,并且所述第一提示信息用于提示对所述语音输出信息的准确性进行反馈;
接收针对所述第一提示信息的第一反馈信息;
当所述第一反馈信息表示所述语音输出信息确认为准确时,触发执行所述的根据所述语音处理结果,生成完成填写的目标电子表单的操作。
作为一种可选的实施方式,在本发明第一方面中,所述根据所述语音处理结果,生成完成填写的目标电子表单,包括:
基于所述人工智能模块抓取所述语音处理结果中的信息,得到抓取目标信息;
根据所述抓取目标信息,确定与所述抓取目标信息相匹配的电子表单模板;
将所述抓取目标信息写入所述电子表单模板中,得到完成填写的目标电子表单;或者,根据所述抓取目标信息以及预先确定出的信息库,生成所述抓取目标信息的语义联想信息,根据所述抓取目标信息以及所述语义联系信息,生成完成填写的目标电子表单。
作为一种可选的实施方式,在本发明第一方面中,所述基于确定出的语音处理模型对所述第二语音信息进行处理,得到语音处理结果之前,所述方法还包括:
对所述第二语音信息进行预设处理,得到处理语音信息,其中,所述预设处理包括降噪处理和/或回声消除处理和/或声源定位处理和/或自动增益处理和/或波束成形处理;
其中,所述基于确定出的语音处理模型对所述第二语音信息进行处理,得到语音处理结果,包括:
基于确定出的语音处理模型对所述处理语音信息进行处理,得到语音处理结果。
作为一种可选的实施方式,在本发明第一方面中,所述方法还包括:
在服务器中获取存储的至少一个所述目标电子表单;
根据每个所述目标电子表单,提取每个所述目标电子表单对应的第二关键词信息;
将所有所述目标电子表单对应的所有所述第二关键词信息导入到大数据模块。
本发明第二方面公开了一种基于全链路语音识别技术的电子表单填写装置,所述装置包括:
语音接收模块,用于接收某一人员输入的第一语音信息;
语音识别模块,用于离线识别所述第一语音信息,得到第一识别信息;
唤醒模块,用于根据所述第一识别信息,唤醒语音识别设备,并在确定的第一时间段内保持所述语音识别设备处于唤醒状态;
所述语音接收模块,还用于在所述语音识别设备处于所述唤醒状态的过程中,接收某一人员输入的第二语音信息,所述第二语音信息包括电子表单的相关内容;
语音处理模块,用于基于确定出的语音处理模型对所述第二语音信息进行处理,得到语音处理结果;
表单生成模块,用于根据所述语音处理结果,生成完成填写的目标电子表单。
作为一种可选的实施方式,在本发明第二方面中,所述语音处理模块基于确定出的语音处理模型对所述第二语音信息进行处理,得到语音处理结果的具体方式为:
基于人工智能模块对所述第二语音信息进行优化,得到优化语音信息;
根据所述优化语音信息,确定第二识别信息,其中,所述第二识别信息包括所述优化语音信息对应的第一关键词信息;
根据所述第二识别信息,结合大数据模块的数据,确定所述第二识别信息对应的目标信息;
对所述目标信息进行自然语言处理,得到语音处理结果。
作为一种可选的实施方式,在本发明第二方面中,所述唤醒模块根据所述第一识别信息,唤醒语音识别设备的具体方式为:
判断所述第一识别信息中是否包括预设唤醒词,其中,所述预设唤醒词用于唤醒语音识别设备;
当判断结果为是时,对所述语音识别设备进行唤醒操作;
以及,所述装置还包括:
检测模块,用于检测所述目标电子表单的内容是否填写完毕;
校验模块,用于当所述检测模块检测到所述目标电子表单的内容已填写完毕时,对所述目标电子表单中的关键内容执行校验操作,得到校验结果,所述校验操作包括数据类型校验操作、数值校验操作、填写位置校验操作、小数点校验操作中的至少一种;
所述唤醒模块,还用于当所述校验模块的校验结果表示所述关键内容符合预设填表条件时,结束所述语音识别设备的所述唤醒状态。
作为一种可选的实施方式,在本发明第二方面中,所述装置还包括:
合成模块,用于在所述表单生成模块根据所述语音处理结果,生成完成填写的目标电子表单之前,根据所述语音处理结果,合成语音输出信息,其中,所述语音输出信息包括所述第二语音信息;
提示模块,用于根据所述语音输出信息,生成第一提示信息,其中,所述第一提示信息包括所述语音输出信息,并且所述第一提示信息用于提示对所述语音输出信息的准确性进行反馈;
所述语音接收模块,还用于接收针对所述第一提示信息的第一反馈信息,当接收的所述第一反馈信息表示所述语音输出信息确认为准确时,触发所述表单生成模块执行所述的根据所述语音处理结果,生成完成填写的目标电子表单的操作。
作为一种可选的实施方式,在本发明第二方面中,所述表单生成模块根据所述语音处理结果,生成完成填写的目标电子表单的具体方式为:
基于所述人工智能模块抓取所述语音处理结果中的信息,得到抓取目标信息;
根据所述抓取目标信息,确定与所述抓取目标信息相匹配的电子表单模板;
将所述抓取目标信息写入所述电子表单模板中,得到完成填写的目标电子表单;或者,根据所述抓取目标信息以及预先确定出的信息库,生成所述抓取目标信息的语义联想信息,根据所述抓取目标信息以及所述语义联系信息,生成完成填写的目标电子表单。
作为一种可选的实施方式,在本发明第二方面中,所述装置还包括:
语音修复模块,在所述语音处理模块基于确定出的语音处理模型对所述第二语音信息进行处理,得到语音处理结果之前,对所述第二语音信息进行预设处理,得到处理语音信息,其中,所述预设处理包括降噪处理和/或回声消除处理和/或声源定位处理和/或自动增益处理和/或波束成形处理;
其中,所述语音处理模块基于确定出的语音处理模型对所述第二语音信息进行处理,得到语音处理结果的具体方式为:
基于确定出的语音处理模型对所述处理语音信息进行处理,得到语音处理结果。
作为一种可选的实施方式,在本发明第二方面中,所述装置还包括:
获取模块,用于在服务器中获取存储的至少一个所述目标电子表单;
提取模块,用于根据每个所述目标电子表单,提取每个所述目标电子表单对应的第二关键词信息;
导入模块,用于将所有所述目标电子表单对应的所有所述第二关键词信息导入到大数据模块。
本发明第三方面公开了一种基于全链路语音识别技术的电子表单填写装置,所述装置包括:
存储有可执行程序代码的存储器;
与所述存储器耦合的处理器;
所述处理器调用所述存储器中存储的所述可执行程序代码,执行本发明第一方面公开的基于全链路语音识别技术的电子表单填写方法中的部分或全部步骤。
本发明第四方面公开了一种计算机存储介质,所述计算机存储介质存储有计算机指令,所述计算机指令被调用时,用于执行本发明第一方面公开的基于全链路语音识别技术的电子表单填写方法中的部分或全部步骤。
与现有技术相比,本发明实施例具有以下有益效果:
本发明实施例中,接收某一人员输入的第一语音信息;离线识别所述第一语音信息,得到第一识别信息;根据所述第一识别信息,唤醒语音识别设备,并在确定的第一时间段内保持所述语音识别设备处于唤醒状态;在所述语音识别设备处于所述唤醒状态的过程中,接收某一人员输入的第二语音信息,所述第二语音信息包括电子表单的相关内容;基于确定出的语音处理模型对所述第二语音信息进行处理,得到语音处理结果;根据所述语音处理结果,生成完成填写的目标电子表单。可见,本发明能够通过第一语音信息唤醒语音识别设备,并在确定的时间段内使该语音识别设备保持唤醒状态,在该时间段内可通过语音识别设备接收电子表单相关的第二语音信息,并通过语音处理模型处理后自动生成目标电子表单,能够通过全链路语音识别技术自动填写电子表单,减少巡检人员的工作量,从而提高设备巡检的工作效率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例公开的一种基于全链路语音识别技术的电子表单填写方法的流程示意图;
图2是本发明实施例公开的另一种基于全链路语音识别技术的电子表单填写方法的流程示意图;
图3是本发明实施例公开的一种基于全链路语音识别技术的电子表单填写装置的结构示意图;
图4是本发明实施例公开的另一种基于全链路语音识别技术的电子表单填写装置的结构示意图;
图5是本发明实施例公开的又一种基于全链路语音识别技术的电子表单填写装置的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、装置、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本发明的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
本发明实施例公开了一种基于全链路语音识别技术的电子表单填写方法及装置,能够通过第一语音信息唤醒语音识别设备,并在确定的时间段内使该语音识别设备保持唤醒状态,在该时间段内可通过语音识别设备接收电子表单相关的第二语音信息,并通过语音处理模型处理后自动生成目标电子表单,能够通过全链路语音识别技术自动填写电子表单,减少巡检人员的工作量,从而提高设备巡检的工作效率。以下分别进行详细说明。
实施例一
请参阅图1,图1是本发明实施例公开的一种基于全链路语音识别技术的电子表单填写方法的流程示意图。如图1所示,该基于全链路语音识别技术的电子表单填写方法可以包括以下操作:
101、接收某一人员输入的第一语音信息。
本发明实施例中,该某一人员为使用该语音识别设备的任一人员,可以为需要填写电子表单的任一巡检人员,也可以为位置处于该语音识别设备的预设距离的任一其他人员,本发明实施例不做限定。
本发明实施例中,该第一语音信息为包括预设内容的语音信息,该预设内容具体可以为关键字、关键词或者关键句,例如,该关键字可以为“开”,也可以为其他任意的字;该关键词可以为“小电”、“小巡”,也可以为其他任意的词;该关键句可以为“打开语音识别设备”、“小巡,打开语音识别设备”,也可以为其他任意的句子。
102、离线识别第一语音信息,得到第一识别信息。
本发明实施例中,该语音识别设备可离线识别该第一语音信息,通过离线识别功能,可保证该语音识别设备在没有网络的环境下也能够进行设备唤醒操作,可提高语音识别设备的可用性。
103、根据第一识别信息,唤醒语音识别设备,并在确定的第一时间段内保持语音识别设备处于唤醒状态。
本发明实施例中,该语音识别设备包括但不限于智能手机、智能平板电脑、智能手环、智能眼镜和智能服装等能够对语音信息进行接收、识别和处理的智能移动终端设备。
本发明实施例中,该第一时间段可根据实际需求进行灵活调整,例如,在电网公司的电网设备日常巡检中,巡检人员使用该语音识别设备进行电网设备巡检工作时,由于整个巡检工作的巡检时间在1小时以内,因此,将该语音识别设备唤醒的第一时间段设置为1小时,即可根据巡检工作的巡检时长来设置该语音识别设别的第一时间段。
本发明实施例中,该语音识别设备处于休眠状态时,不能接收语音信息,在唤醒后的第一时间段内,该语音识别设备可随时接收处于该语音接收设备的语音接收范围内的语音信息。
在一个可选的实施例中,该根据该第一识别信息,唤醒语音识别设备,可以包括:
判断该第一识别信息中是否包括预设唤醒词,其中,该预设唤醒词用于唤醒语音识别设备;
当判断结果为是时,对该语音识别设备进行唤醒操作;
以及,该方法还可以包括:
检测该目标电子表单的内容是否填写完毕;
当检测到该目标电子表单的内容已填写完毕时,对该目标电子表单中的关键内容执行校验操作,得到校验结果,该校验操作包括数据类型校验操作、数值校验操作、填写位置校验操作、小数点校验操作中的至少一种;
当该校验结果表示该关键内容符合预设填表条件时,结束该语音识别设备的该唤醒状态。
在该可选的实施例中,在检测到目标电子表单的内容填写完毕时,对该目标电子表单中的关键内容执行校验操作,其中,校验操作中的数据类型校验操作包括判断目标电子表单中填写的数据类型是否为该电子表单对应需要填写的数据类型;校验操作中的数值校验操作包括判断目标电子表单中填写的数值是否正确;校验操作中的填写位置校验操作包括判断目标电子表单中填写的内容的位置是否正确;校验操作中的小数点校验操作包括判断目标电子表单中填写的数值的小数点是否正确。
在该可选的实施例中,当该校验结果表示该关键内容符合预设填表条件时,可提前结束该语音识别设备的该唤醒状态,也可以不提前结束该语音识别设备的唤醒状态,让该语音识别设备在唤醒后达到第一时间段时自动进入休眠状态。
在该可选的实施例中,进一步的,当该校验结果表示该关键内容不符合预设填表条件时,对该目标电子表单中不符合预设填表条件的关键内容进行标记,并提示相关人员对该标记内容进行确认和修改。
可见,该可选的实施例在该语音识别设备唤醒后,能够对目标电子表单中的填写内容进行校验,可提高该目标电子表单的填写准确性。
104、在语音识别设备处于唤醒状态的过程中,接收某一人员输入的第二语音信息,第二语音信息包括电子表单的相关内容。
本发明实施例中,该某一人员为使用该语音识别设备填写该目标电子表单的任一人员,输出该第二语音信息的人员可以为同一个人员,也可以为不同的多个人员,本发明实施例不做限定。
在另一个可选的实施例中,该基于确定出的语音处理模型对该第二语音信息进行处理,得到语音处理结果之前,该方法还包括:
对该第二语音信息进行预设处理,得到处理语音信息,其中,该预设处理包括降噪处理和/或回声消除处理和/或声源定位处理和/或自动增益处理和/或波束成形处理;
其中,该基于确定出的语音处理模型对该第二语音信息进行处理,得到语音处理结果,包括:
基于确定出的语音处理模型对该处理语音信息进行处理,得到语音处理结果。
在该可选的实施例中,在采集第二语音信息时,由于可能是在户外或者嘈杂环境下进行的,因此采集的第二语音信息可能存在噪声或者回声,通过对第二语音信息进行降噪处理和/或回声消除处理和/或声源定位处理和/或自动增益处理和/或波束成形处理后,可得到质量更高的语音信息。
可见,该可选的实施例能够对语音识别设备采集的语音信息进行预设处理,经过预设处理后的语音信息的语音质量更高,可使得语音处理模型更好的处理相关信息,从而进一步提高电子表单填写的准确性。
105、基于确定出的语音处理模型对第二语音信息进行处理,得到语音处理结果。
106、根据语音处理结果,生成完成填写的目标电子表单。
本发明实施例中,基于确定出的语音处理模型对该语音识别设备接收的第二语音信息进行处理,其中,对该第二语音信息的处理包括对第二语音信息的内容进行逻辑判断,根据逻辑判断的结果匹配该目标电子表单中需要填写的内容,最终生成完成填写的目标电子表单,其中,该电子表单可以为对设备的巡检的隐患表单或者缺陷表单,也可以为其他表单,本发明实施例不做限定。
本发明实施例中,对该基于全链路语音识别技术的电子表单填写系统的整体过程,通过电网企业的日常巡检工作为例进行详细说明,在电网企业的输电线路的日常巡检中,巡检人员小明和小红拿着智能平板电脑出发进行电网线路巡检,小明首先通过说出第一语音信息“小巡,打开语音识别设备”来实现该智能平板电脑的唤醒,此后,该智能平板电脑在未来的1小时内处于唤醒状态,可持续接收语音信息,小明和小红在对电力塔1的巡检中,通过小明或者小红在该智能平板电脑的语音接收范围内语音说出该电力塔相关的巡检参数,该智能平板电脑接收到巡检参数后,经过该智能平板电脑内部的语音处理模型对接收到的巡检参数进行处理,最终,将完成处理的巡检参数填写到对应的目标电子表单中。
可见,实施本发明实施例所描述的基于全链路语音识别技术的电子表单填写方法能够通过第一语音信息唤醒语音识别设备,并在确定的时间段内使该语音识别设备保持唤醒状态,在该时间段内可通过语音识别设备接收电子表单相关的第二语音信息,并通过语音处理模型处理后自动生成目标电子表单,能够通过全链路语音识别技术自动填写电子表单,减少巡检人员的工作量,从而提高设备巡检的工作效率。
实施例二
请参阅图2,图2是本发明实施例公开的另一种基于全链路语音识别技术的电子表单填写方法的流程示意图。如图2所示,该基于全链路语音识别技术的电子表单填写方法可以包括以下操作:
201、接收某一人员输入的第一语音信息。
202、离线识别第一语音信息,得到第一识别信息。
203、根据第一识别信息,唤醒语音识别设备,并在确定的第一时间段内保持语音识别设备处于唤醒状态。
204、在语音识别设备处于唤醒状态的过程中,接收某一人员输入的第二语音信息,第二语音信息包括电子表单的相关内容。
205、基于人工智能模块对第二语音信息进行优化,得到优化语音信息。
本发明实施例中,该人工智能模块通过对第二语音信息进行优化,可对该第二语音信息进行智能化处理,并将第二语音信息的内容转化成该语音识别设备可读的信息。
206、根据优化语音信息,确定第二识别信息,其中,第二识别信息包括优化语音信息对应的第一关键词信息。
本发明实施例中,根据优化语音信息确定第二识别信息,该第二识别信息包括第一关键词信息,该第一关键词信息为该目标电子表单中需要填写内容的关键信息,通过该关键词信息,可实现对目标电子表单的顺利填写。
207、根据第二识别信息,结合大数据模块的数据,确定第二识别信息对应的目标信息。
本发明实施例中,该大数据模块中包括大量的电子表单填写相关的数据,其可在接收到电子表单的相关语音信息后,辅助该语音识别设备进行电子表单的填写,对于具体的过程,通过以下举例进行说明。
举例来说,当巡检电网设备的巡检人员在巡检过程中,该语音识别设备(如智能平板电脑)在其语音接收范围内接收到的语音信息为“智慧广场d栋”,则该语音识别设备会结合大数据模块的数据,通过大数据进行信息匹配,最终输出的信息为“深圳市南山区侨香路211号智慧广场d栋”,即通过大数据模块,可自动将相关的信息“深圳市”、“南山区”和“侨香路211号”进行自动相关信息补充。
208、对目标信息进行自然语言处理,得到语音处理结果。
本发明实施例中,该目标信息的自然语言处理包括但不限于对目标信息的同义词、形、音、义和标点符号断句等信息进行处理,即对目标信息的字、词、句、篇章的输入、输出、识别、分析、理解和生成等操作和加工。
在一个可选的实施例中,该根据该语音处理结果,生成完成填写的目标电子表单之前,该方法还可以包括:
根据该语音处理结果,合成语音输出信息,其中,该语音输出信息包括该第二语音信息;
根据该语音输出信息,生成第一提示信息,其中,该第一提示信息包括该语音输出信息,并且该第一提示信息用于提示对该语音输出信息的准确性进行反馈;
接收针对该第一提示信息的第一反馈信息;
当该第一反馈信息表示该语音输出信息确认为准确时,触发执行该的根据该语音处理结果,生成完成填写的目标电子表单的操作。
在该可选的实施例中,该合成语音信息包括该语音接收设备在唤醒后接收到的所有语音信息,该语音识别设备通过语音处理模型对接收到的所有语音信息进行处理,得到该目标电子表单相关的有效信息后,在根据这些有效信息,最终得到合成语音输出信息。
可见,该可选的实施例能够在语音处理模型对接收的语音信息进行处理后,通过播报合成语音输出信息,来对该语音识别设备识别的语音信息的准确性进行确认,可有效提高目标电子表单填写的准确性。
209、根据语音处理结果,生成完成填写的目标电子表单。
本发明实施例中,针对步骤201-步骤204和步骤209的其它描述,请参照实施例一中针对步骤101-步骤106的详细描述,本发明实施例不再赘述。
本发明实施例中,对该基于全链路语音识别技术的电子表单填写系统的整体过程,通过电网企业的日常巡检工作为例进行详细说明,在电网企业的输电线路的日常巡检中,巡检人员小明和小红拿着智能平板电脑出发进行电网线路巡检,小明首先通过说出第一语音信息“小巡,打开语音识别设备”来实现该智能平板电脑的唤醒,此后,该智能平板电脑在未来的1小时内处于唤醒状态,可持续接收语音信息,小明和小红在对电力塔的巡检中,通过小明或者小红在该智能平板电脑的语音接收范围内语音说出包括该电力塔相关的至少一个巡检参数的语音信息,该智能平板电脑接收到这些包括巡检参数的语音信息后,通过人工智能模块对语音信息进行优化,得到优化语音信息,根据优化语音信息识别关键词信息,结合大数据模块进行处理得到目标信息,对目标信息进行自然语言处理得到语音处理结果,最终,将完成处理的巡检参数填写到对应的目标电子表单中。
可见,实施本发明实施例所描述的基于全链路语音识别技术的电子表单填写方法能够通过第一语音信息唤醒语音识别设备,并在确定的时间段内使该语音识别设备保持唤醒状态,在该时间段内可通过语音识别设备接收电子表单相关的第二语音信息,并通过人工智能模块和大数据模块对第二语音信息进行多次处理后,根据这些处理后的语音信息自动生成目标电子表单,能够通过全链路语音识别技术自动填写电子表单,减少巡检人员的工作量,从而进一步提高设备巡检的工作效率。
在另一个可选的实施例中,该根据该语音处理结果,生成完成填写的目标电子表单,包括:
基于该人工智能模块抓取该语音处理结果中的信息,得到抓取目标信息;
根据该抓取目标信息,确定与该抓取目标信息相匹配的电子表单模板;
将该抓取目标信息写入该电子表单模板中,得到完成填写的目标电子表单;或者,根据该抓取目标信息以及预先确定出的信息库,生成该抓取目标信息的语义联想信息,根据该抓取目标信息以及该语义联系信息,生成完成填写的目标电子表单。
该电子表单填写系统中包括多个电子表单模版,根据使用该电子表单填写系统的巡检人员的巡检类型,可选择与巡检类型对应的电子表单模版进行填写,最终得到完成填写的目标电子表单。
可见,该可选的实施例能够通过从语音处理信息中抓取的目标信息,来确定匹配的电子表单模版,可进一步提高电子表单填写的准确性。
在又一个可选的实施例中,该方法还可以包括:
在服务器中获取存储的至少一个该目标电子表单;
根据每个该目标电子表单,提取每个该目标电子表单对应的第二关键词信息;
将所有该目标电子表单对应的所有该第二关键词信息导入到大数据模块。
在该可选的实施例中,在服务器中存储有历史记录的大量的电子表单,通过对这些电子表单提取关键词信息,并将大量的关键词导入到大数据模块中,可丰富该大数据模块的数据量。
可见,该可选的实施例能够将从多个电子表单中提取的大量的关键词导入到大数据模块中,可丰富大数据模块的有效数据量,提高大数据模块的数据匹配能力,从而进一步提高电子表单的填写准确性。
实施例三
请参阅图3,图3是本发明实施例公开的一种基于全链路语音识别技术的电子表单填写装置的结构示意图。如图3所示,该装置可以包括:
语音接收模块301,用于接收某一人员输入的第一语音信息;
语音识别模块302,用于离线识别该第一语音信息,得到第一识别信息;
唤醒模块303,用于根据该第一识别信息,唤醒语音识别设备,并在确定的第一时间段内保持该语音识别设备处于唤醒状态;
该语音接收模块301,还用于在该语音识别设备处于该唤醒状态的过程中,接收某一人员输入的第二语音信息,该第二语音信息包括电子表单的相关内容;
语音处理模块304,用于基于确定出的语音处理模型对该第二语音信息进行处理,得到语音处理结果;
表单生成模块305,用于根据该语音处理结果,生成完成填写的目标电子表单。
可见,实施本发明实施例所描述的基于全链路语音识别技术的电子表单填写装置能够通过第一语音信息唤醒语音识别设备,并在确定的时间段内使该语音识别设备保持唤醒状态,在该时间段内可通过语音识别设备接收电子表单相关的第二语音信息,并通过语音处理模型处理后自动生成目标电子表单,能够通过全链路语音识别技术自动填写电子表单,减少巡检人员的工作量,从而提高设备巡检的工作效率。
在一个可选的实施例中,该语音处理模块304基于确定出的语音处理模型对该第二语音信息进行处理,得到语音处理结果的具体方式为:
基于人工智能模块对该第二语音信息进行优化,得到优化语音信息;
根据该优化语音信息,确定第二识别信息,其中,该第二识别信息包括该优化语音信息对应的第一关键词信息;
根据该第二识别信息,结合大数据模块的数据,确定该第二识别信息对应的目标信息;
对该目标信息进行自然语言处理,得到语音处理结果。
可见,实施本发明实施例所描述的基于全链路语音识别技术的电子表单填写装置能够通过第一语音信息唤醒语音识别设备,并在确定的时间段内使该语音识别设备保持唤醒状态,在该时间段内可通过语音识别设备接收电子表单相关的第二语音信息,并通过人工智能模块和大数据模块对第二语音信息进行多次处理后,根据这些处理后的语音信息自动生成目标电子表单,能够通过全链路语音识别技术自动填写电子表单,减少巡检人员的工作量,从而进一步提高设备巡检的工作效率。
在另一个可选的实施例中,如图4所示,该唤醒模块303根据该第一识别信息,唤醒语音识别设备的具体方式为:
判断该第一识别信息中是否包括预设唤醒词,其中,该预设唤醒词用于唤醒语音识别设备;
当判断结果为是时,对该语音识别设备进行唤醒操作;
以及,该装置还包括:
检测模块306,用于检测该目标电子表单的内容是否填写完毕;
校验模块307,用于当该检测模块306检测到该目标电子表单的内容已填写完毕时,对该目标电子表单中的关键内容执行校验操作,得到校验结果,该校验操作包括数据类型校验操作、数值校验操作、填写位置校验操作、小数点校验操作中的至少一种;
该唤醒模块303,还用于当该校验模块307的校验结果表示该关键内容符合预设填表条件时,结束该语音识别设备的该唤醒状态。
可见,该可选的实施例在该语音识别设备唤醒后,能够对目标电子表单中的填写内容进行校验,可提高该目标电子表单的填写准确性。
在又一个可选的实施例中,如图4所示,该装置还可以包括:
合成模块308,用于在该表单生成模块305根据该语音处理结果,生成完成填写的目标电子表单之前,根据该语音处理结果,合成语音输出信息,其中,该语音输出信息包括该第二语音信息;
提示模块309,用于根据该语音输出信息,生成第一提示信息,其中,该第一提示信息包括该语音输出信息,并且该第一提示信息用于提示对该语音输出信息的准确性进行反馈;
该语音接收模块301,还用于接收针对该第一提示信息的第一反馈信息,当接收的该第一反馈信息表示该语音输出信息确认为准确时,触发该表单生成模块305执行该的根据该语音处理结果,生成完成填写的目标电子表单的操作。
可见,该可选的实施例能够在语音处理模型对接收的语音信息进行处理后,通过播报合成语音输出信息,来对该语音识别设备识别的语音信息的准确性进行确认,可有效提高目标电子表单填写的准确性。
在又一个可选的实施例中,该表单生成模块305根据该语音处理结果,生成完成填写的目标电子表单的具体方式为:
基于该人工智能模块抓取该语音处理结果中的信息,得到抓取目标信息;
根据该抓取目标信息,确定与该抓取目标信息相匹配的电子表单模板;
将该抓取目标信息写入该电子表单模板中,得到完成填写的目标电子表单;或者,根据该抓取目标信息以及预先确定出的信息库,生成该抓取目标信息的语义联想信息,根据该抓取目标信息以及该语义联系信息,生成完成填写的目标电子表单。
可见,该可选的实施例能够通过从语音处理信息中抓取的目标信息,来确定匹配的电子表单模版,可进一步提高电子表单填写的准确性。
在又一个可选的实施例中,如图4所示,该装置还可以包括:
语音修复模块310,在该语音处理模块304基于确定出的语音处理模型对该第二语音信息进行处理,得到语音处理结果之前,对该第二语音信息进行预设处理,得到处理语音信息,其中,该预设处理包括降噪处理和/或回声消除处理和/或声源定位处理和/或自动增益处理和/或波束成形处理;
其中,该语音处理模块304基于确定出的语音处理模型对该第二语音信息进行处理,得到语音处理结果的具体方式为:
基于确定出的语音处理模型对该处理语音信息进行处理,得到语音处理结果。
可见,该可选的实施例能够对语音识别设备采集的语音信息进行预设处理,经过预设处理后的语音信息的语音质量更高,可使得语音处理模型更好的处理相关信息,从而进一步提高电子表单填写的准确性。
在又一个可选的实施例中,如图4所示,该装置还可以包括:
获取模块311,用于在服务器中获取存储的至少一个该目标电子表单;
提取模块312,用于根据每个该目标电子表单,提取每个该目标电子表单对应的第二关键词信息;
导入模块313,用于将所有该目标电子表单对应的所有该第二关键词信息导入到大数据模块。
可见,该可选的实施例能够将从多个电子表单中提取的大量的关键词导入到大数据模块中,可丰富大数据模块的有效数据量,提高大数据模块的数据匹配能力,从而进一步提高电子表单的填写准确性。
实施例四
请参阅图5,图5是本发明实施例公开的又一种基于全链路语音识别技术的电子表单填写装置的结构示意图。如图5所示,该装置可以包括:
存储有可执行程序代码的存储器401;
与存储器401耦合的处理器402;
处理器402调用存储器401中存储的可执行程序代码,用于执行实施例一或实施例二所描述的基于全链路语音识别技术的电子表单填写方法中的步骤。
实施例五
本发明实施例公开了一种计算机读存储介质,其存储用于电子数据交换的计算机程序,其中,该计算机程序使得计算机执行实施例一或实施例二所描述的基于全链路语音识别技术的电子表单填写方法中的步骤。
实施例六
本发明实施例公开了一种计算机程序产品,该计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,且该计算机程序可操作来使计算机执行实施例一或实施例二所描述的基于全链路语音识别技术的电子表单填写方法中的步骤。
以上所描述的装置实施例仅是示意性的,其中作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施例的具体描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,存储介质包括只读存储器(Read-Only Memory,ROM)、随机存储器(Random Access Memory,RAM)、可编程只读存储器(Programmable Read-only Memory,PROM)、可擦除可编程只读存储器(ErasableProgrammable Read Only Memory,EPROM)、一次可编程只读存储器(One-timeProgrammable Read-Only Memory,OTPROM)、电子抹除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory,EEPROM)、只读光盘(CompactDisc Read-Only Memory,CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。
最后应说明的是:本发明实施例公开的一种基于全链路语音识别技术的电子表单填写方法及装置所揭露的仅为本发明较佳实施例而已,仅用于说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解;其依然可以对前述各项实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或替换,并不使相应的技术方案的本质脱离本发明各项实施例技术方案的精神和范围。
Claims (10)
1.一种基于全链路语音识别技术的电子表单填写方法,其特征在于,所述方法包括:
接收某一人员输入的第一语音信息;
离线识别所述第一语音信息,得到第一识别信息;
根据所述第一识别信息,唤醒语音识别设备,并在确定的第一时间段内保持所述语音识别设备处于唤醒状态;
在所述语音识别设备处于所述唤醒状态的过程中,接收某一人员输入的第二语音信息,所述第二语音信息包括电子表单的相关内容;
基于确定出的语音处理模型对所述第二语音信息进行处理,得到语音处理结果;
根据所述语音处理结果,生成完成填写的目标电子表单。
2.根据权利要求1所述的基于全链路语音识别技术的电子表单填写方法,其特征在于,所述基于确定出的语音处理模型对所述第二语音信息进行处理,得到语音处理结果,包括:
基于人工智能模块对所述第二语音信息进行优化,得到优化语音信息;
根据所述优化语音信息,确定第二识别信息,其中,所述第二识别信息包括所述优化语音信息对应的第一关键词信息;
根据所述第二识别信息,结合大数据模块的数据,确定所述第二识别信息对应的目标信息;
对所述目标信息进行自然语言处理,得到语音处理结果。
3.根据权利要求2所述的基于全链路语音识别技术的电子表单填写方法,其特征在于,所述根据所述第一识别信息,唤醒语音识别设备,包括:
判断所述第一识别信息中是否包括预设唤醒词,其中,所述预设唤醒词用于唤醒语音识别设备;
当判断结果为是时,对所述语音识别设备进行唤醒操作;
以及,所述方法还包括:
检测所述目标电子表单的内容是否填写完毕;
当检测到所述目标电子表单的内容已填写完毕时,对所述目标电子表单中的关键内容执行校验操作,得到校验结果,所述校验操作包括数据类型校验操作、数值校验操作、填写位置校验操作、小数点校验操作中的至少一种;
当所述校验结果表示所述关键内容符合预设填表条件时,结束所述语音识别设备的所述唤醒状态。
4.根据权利要求1-3任一项所述的基于全链路语音识别技术的电子表单填写方法,其特征在于,所述根据所述语音处理结果,生成完成填写的目标电子表单之前,所述方法还包括:
根据所述语音处理结果,合成语音输出信息,其中,所述语音输出信息包括所述第二语音信息;
根据所述语音输出信息,生成第一提示信息,其中,所述第一提示信息包括所述语音输出信息,并且所述第一提示信息用于提示对所述语音输出信息的准确性进行反馈;
接收针对所述第一提示信息的第一反馈信息;
当所述第一反馈信息表示所述语音输出信息确认为准确时,触发执行所述的根据所述语音处理结果,生成完成填写的目标电子表单的操作。
5.根据权利要求4所述的基于全链路语音识别技术的电子表单填写方法,其特征在于,所述根据所述语音处理结果,生成完成填写的目标电子表单,包括:
基于所述人工智能模块抓取所述语音处理结果中的信息,得到抓取目标信息;
根据所述抓取目标信息,确定与所述抓取目标信息相匹配的电子表单模板;
将所述抓取目标信息写入所述电子表单模板中,得到完成填写的目标电子表单;或者,根据所述抓取目标信息以及预先确定出的信息库,生成所述抓取目标信息的语义联想信息,根据所述抓取目标信息以及所述语义联系信息,生成完成填写的目标电子表单。
6.根据权利要求5所述的基于全链路语音识别技术的电子表单填写方法,其特征在于,所述基于确定出的语音处理模型对所述第二语音信息进行处理,得到语音处理结果之前,所述方法还包括:
对所述第二语音信息进行预设处理,得到处理语音信息,其中,所述预设处理包括降噪处理和/或回声消除处理和/或声源定位处理和/或自动增益处理和/或波束成形处理;
其中,所述基于确定出的语音处理模型对所述第二语音信息进行处理,得到语音处理结果,包括:
基于确定出的语音处理模型对所述处理语音信息进行处理,得到语音处理结果。
7.根据权利要求6所述的基于全链路语音识别技术的电子表单填写方法,其特征在于,所述方法还包括:
在服务器中获取存储的至少一个所述目标电子表单;
根据每个所述目标电子表单,提取每个所述目标电子表单对应的第二关键词信息;
将所有所述目标电子表单对应的所有所述第二关键词信息导入到大数据模块。
8.一种基于全链路语音识别技术的电子表单填写装置,其特征在于,所述装置包括:
语音接收模块,用于接收某一人员输入的第一语音信息;
语音识别模块,用于离线识别所述第一语音信息,得到第一识别信息;
唤醒模块,用于根据所述第一识别信息,唤醒语音识别设备,并在确定的第一时间段内保持所述语音识别设备处于唤醒状态;
所述语音接收模块,还用于在所述语音识别设备处于所述唤醒状态的过程中,接收某一人员输入的第二语音信息,所述第二语音信息包括电子表单的相关内容;
语音处理模块,用于基于确定出的语音处理模型对所述第二语音信息进行处理,得到语音处理结果;
表单生成模块,用于根据所述语音处理结果,生成完成填写的目标电子表单。
9.一种基于全链路语音识别技术的电子表单填写装置,其特征在于,所述装置包括:
存储有可执行程序代码的存储器;
与所述存储器耦合的处理器;
所述处理器调用所述存储器中存储的所述可执行程序代码,执行如权利要求1-7任一项所述的基于全链路语音识别技术的电子表单填写方法中的部分或全部步骤。
10.一种计算机存储介质,所述计算机存储介质存储有计算机指令,所述计算机指令被调用时,用于执行如权利要求1-7任一项所述的基于全链路语音识别技术的电子表单填写方法中的部分或全部步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210015813.2A CN114548063A (zh) | 2022-01-07 | 2022-01-07 | 基于全链路语音识别技术的电子表单填写方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210015813.2A CN114548063A (zh) | 2022-01-07 | 2022-01-07 | 基于全链路语音识别技术的电子表单填写方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114548063A true CN114548063A (zh) | 2022-05-27 |
Family
ID=81669020
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210015813.2A Pending CN114548063A (zh) | 2022-01-07 | 2022-01-07 | 基于全链路语音识别技术的电子表单填写方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114548063A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117057325A (zh) * | 2023-10-13 | 2023-11-14 | 湖北华中电力科技开发有限责任公司 | 一种应用于电网领域表单填写方法、系统和电子设备 |
-
2022
- 2022-01-07 CN CN202210015813.2A patent/CN114548063A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117057325A (zh) * | 2023-10-13 | 2023-11-14 | 湖北华中电力科技开发有限责任公司 | 一种应用于电网领域表单填写方法、系统和电子设备 |
CN117057325B (zh) * | 2023-10-13 | 2024-01-05 | 湖北华中电力科技开发有限责任公司 | 一种应用于电网领域表单填写方法、系统和电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110491383B (zh) | 一种语音交互方法、装置、系统、存储介质及处理器 | |
CN103971685B (zh) | 语音命令识别方法和系统 | |
CN108986826A (zh) | 自动生成会议记录的方法、电子装置及可读存储介质 | |
CN101076851B (zh) | 口语识别系统以及用于训练和操作该系统的方法 | |
CN108447471A (zh) | 语音识别方法及语音识别装置 | |
CN111433847B (zh) | 语音转换的方法及训练方法、智能装置和存储介质 | |
US20080294433A1 (en) | Automatic Text-Speech Mapping Tool | |
CN110570873B (zh) | 声纹唤醒方法、装置、计算机设备以及存储介质 | |
CN109326305B (zh) | 一种批量测试语音识别和文本合成的方法和测试系统 | |
CN110111778B (zh) | 一种语音处理方法、装置、存储介质及电子设备 | |
CN111797632A (zh) | 信息处理方法、装置及电子设备 | |
CN110798578A (zh) | 一种来电事务管理方法、装置以及相关设备 | |
CN109785834B (zh) | 一种基于验证码的语音数据样本采集系统及其方法 | |
EP3489951B1 (en) | Voice dialogue apparatus, voice dialogue method, and program | |
CN113674746B (zh) | 人机交互方法、装置、设备以及存储介质 | |
CN111326154A (zh) | 语音交互的方法、装置、存储介质及电子设备 | |
CN113140219A (zh) | 调控指令生成方法、装置、电子设备及存储介质 | |
CN110853669B (zh) | 音频识别方法、装置及设备 | |
CN114548063A (zh) | 基于全链路语音识别技术的电子表单填写方法及装置 | |
CN111724769A (zh) | 一种智能家居语音识别模型的生产方法 | |
CN114783424A (zh) | 文本语料筛选方法、装置、设备及存储介质 | |
CN117251559A (zh) | 基于自然语言大模型的工程标准规范获取方法及系统 | |
CN111048068B (zh) | 语音唤醒方法、装置、系统及电子设备 | |
CN110956958A (zh) | 搜索方法、装置、终端设备及存储介质 | |
CN115691503A (zh) | 语音识别方法、装置、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |