CN109410939A - 基于语音指令集的通用数据维护方法 - Google Patents

基于语音指令集的通用数据维护方法 Download PDF

Info

Publication number
CN109410939A
CN109410939A CN201811450916.1A CN201811450916A CN109410939A CN 109410939 A CN109410939 A CN 109410939A CN 201811450916 A CN201811450916 A CN 201811450916A CN 109410939 A CN109410939 A CN 109410939A
Authority
CN
China
Prior art keywords
model
data
instruction
phonetic order
collection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811450916.1A
Other languages
English (en)
Other versions
CN109410939B (zh
Inventor
刘静涛
周万宁
杨光
时伟
吴茂传
王圣东
张科伟
刘宝华
陈端迎
闫弘毅
李凡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Shipbuilding Digital Information Technology Co ltd
Unit 91977 Of Pla
Original Assignee
LIANYUNGANG JIERUI DEEPSOFT TECHNOLOGY Co Ltd
91977 Troops Of Pla
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LIANYUNGANG JIERUI DEEPSOFT TECHNOLOGY Co Ltd, 91977 Troops Of Pla filed Critical LIANYUNGANG JIERUI DEEPSOFT TECHNOLOGY Co Ltd
Priority to CN201811450916.1A priority Critical patent/CN109410939B/zh
Publication of CN109410939A publication Critical patent/CN109410939A/zh
Application granted granted Critical
Publication of CN109410939B publication Critical patent/CN109410939B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • G10L2015/0631Creating reference templates; Clustering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Document Processing Apparatus (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明是一种基于语音指令集的通用数据维护方法。该方法根据数据维护过程中语音识别使用要求,将复杂多样的数据模型进行分类处理,统计各种数据模型人机交互方式,根据数据维护业务应用情况,建立语音识别指令集;然后建立数据模型人机交互方式和指令集之间映射表;再根据数据模型和指令集之间的映射关系,在数据模型调度之前,注册相应的语音指令模型;最后通过“学习”和“训练”,建立声学模型和语言模型,实现复杂环境的语音通用数据维护。本发明实现了基于语音指令集的通用数据维护,能够广泛地集成、调用数据维护过程中各类数据模型,有效地解决了管理人员无法在复杂环境下数据手动维护的问题,减轻了使用数据维护的复杂度及工作量。

Description

基于语音指令集的通用数据维护方法
技术领域
本发明涉及一种通用数据维护技术;特别是一种基于语音指令集的通用数据维护方法。
背景技术
在当今数字化信息时代,对各类大数据的管理成了至关重要的环节,应运而生的数据管理、信息分析、数据挖掘等软件百花齐放,解决了信息孤岛、数据难于管理等问题,但在复杂环境下,如单兵装备、舰载设备等无法通过手动操作获取有效的信息,随着语音识别技术的发展,通过语音识别对通用数据进行管理,向特定用户提供最自然、最灵活和最经济的人机接口界面,有效解决军用领域中遇到的大量复杂环境的数据录入和信息获取等问题。
虽然语音识别技术越来越成熟,但多数语音识别技术只应用在特定场景下的固定输入和识别,在对复杂的大数据维护软件方面,缺乏有效手段。
发明内容
本发明所要解决的技术问题是针对现有技术的不足,提供一种新的基于语音指令集的通用数据维护方法,该方法通过设计语音指令集,实现对通用数据的语音维护和管理,根据业务设定数据模型,并与语音指令绑定,从而触发UI组件的动作事件,实现在特定环境下多种手段维护数据和信息获取。
本发明所要解决的技术问题是通过以下的技术解决方案来实现的。本发明是一种基于语音指令集的通用数据维护方法,其特点是,其步骤如下:
步骤一:对复杂数据进行模型化处理,根据统一算法封装为通用形式的模型文件,包括数据模型的输入输出参数个数和参数类型、人机界面显示方式;
步骤二:建立语音识别指令集,根据数据模型种类、显示方式、数据的容量信息建立语音识别指令集。
步骤三:建立数据模型和语音指令集之间的映射关系,在调度数据模型之前,注册相应的语音指令,并对数据模型和指令集正确性进行校验;
步骤四:通用数据维护,首先通过“学习”和“训练”,建立识别基本单元的声学模型和进行文法分析的语言模型,之后对数据模型进行解析,并加载相应的语音模型,对数据模型的图形化显示进行语音通用数据维护;
步骤五:语音识别边缘性检测,加载数据模型和调度语音模型后,对语音录入进行边缘化检测,若发现数据识别不匹配时,提供重新录入和手动校正,并加入训练模型库。
本发明所述的基于语音指令集的通用数据维护方法,其进一步优选的技术方案是:步骤一中,对复杂数据建模处理封装为通用形式的模型文件的步骤如下:
(1)复杂数据模型化
首先对复杂数据进行数据分析,并对关联数据进行清洗,最后进行封装为数据模型,其中其中封装配置包括以下内容:
a)封装后的模型接口名称;
b)输入参数列表,包含所有输入参数的输入列表;
c)输出参数列表,包含所有输出参数的输出列表;
d)模型算法输入参数信息;
e)模型算法输出参数信息;
最后将封装好的数据生成算法动态库,并存储到数据模型库中;
(2)实现数据模型调度的通用性
首先建立模型动态调配接口,接口信息包括以下内容:
a)模型文件路径信息;
b)模型文件接口名称;
c)通用输入列表;
d)通用输出列表;
e)模型算法输入输出参数信息;
f)模型显示方式;
g)模型承接数据容量;
h)数据模型绑定的UI组件;
然后通过模型文件路径和模型文件接口名称信息,获取模型文件调配接口的指针,最后将通用输入输出传递给模型文件接口,结合步骤(1)生成的模型动态库,将通用调配接口生成调配动态库。
本发明所述的基于语音指令集的通用数据维护方法,其进一步优选的技术方案是:步骤二中,将根据业务中的数据模型信息建立语音指令集的步骤如下:
(1)建立语音指令集
根据数据模型中的数据显示方式、数据容量信息,建立语音指令集,其中语音指令集包括菜单导航指令、窗口操作指令、树形菜单定位检索指令、表单操作指令、表单项操作指令、系统指令共六类指令集;其中指令集信息包括以下内容:
a)指令集基本信息,包括指令集名称、描述、版本信息;
b)指令集识别模式,为了保证软件使用效果体验,指令集识别模式分为两种方式:一是通过系统定义的编码辅助进行快速的识别和定位;另一种通过汉字意图识别,进行后续处理,此功能需要针对专业词汇进行模型训练,是一个需要逐步提高识别质量的过程;
(2)指令集分类
根据数据模型数据维护特征,将语音指令集分为菜单导航指令、窗口操作指令、树形菜单定位检索指令、表单操作指令、表单项操作指令、系统指令共六类指令集,其中各指令集信息包括以下内容:
a)菜单导航指令,包括序号指令和名称指令;
b)窗口操作指令,包括窗口可见性指令、窗口布局指令、窗口选择指令、面板切换指令、窗口滚动指令、窗口显示适配指令;
c)树形菜单检索指令,包括展开收起指令、选择指令、搜索指令;
d)表单指令,包括行选择指令、单元格选择指令、查看行指令、新增行指令、删除行指令、编辑行指令、导出指令、检索指令;
e)表单项操作指令,包括表单项控制指令——保存或撤销指令、表单项选择指令,另外表单项满足文本框输入组件、下拉框组件、树形选择组件、时间录入组件的指令要求;
f)系统指令,包括操作模式切换指令、退出指令,如果系统识别时发现有歧义指令,会提供多指令选择。
本发明所述的基于语音指令集的通用数据维护方法,其进一步优选的技术方案是:步骤三中,建立数据模型和语音指令集映射关系,注册指令集并进行正确性校验步骤如下:
(1)建立映射关系:首先,根据数据模型的显示方式及数据容量,绑定语音识别指令集,即数据模型实例化时确定显示方式及UI组件,并实现UI组件的语音指令和动作的绑定;
(2)注册指令集并进行正确性校验:在切换语音模式时,注册语音指令对应的语音模型,并对数据模型和语音指令关系进行正确性校验;首先读取数据模型文件路径及名称,查找数据模型库中是否存在,若不存在则发出提示信息,然后对数据模型进行解析,将数据模型输入与绑定的UI组件、指令集进行匹配,若三种类型若不同则发出提示信息,最后校验语音指令和动作触发是否成功。
本发明所述的基于语音指令集的通用数据维护方法,其进一步优选的技术方案是:步骤四中,通用数据维护步骤如下:
(1)建立声学模型和语音模型:首先通过“学习”和“训练”,建立识别基本单元的声学模型和进行文法分析的语言模型,之后对数据模型进行解析,并加载相应的语音模型,对数据模型的图形化显示进行语音通用数据维护;
(2)模型训练及模式匹配:按照一定的准则,从己知模式中获取表征该模式本质特征的模型参数进行模型训练,另外,使待识别样本与通过提取出来的训练样本的本质特征而建立的模型进行对比分析,使未知模式与模型库中的某一个模型获得最佳匹配;
(3)数据维护,首先通过语音识别定位UI组件,再检索指令集中相应的指令,从而触发UI组件相应的动作事件,实现在复杂环境下的基于语音指令集的通用数据维护。
本发明所述的基于语音指令集的通用数据维护方法,其进一步优选的技术方案是:步骤五中:对语音识别进行边缘化处理并提供容错机制,具体过程为,加载数据模型和调度语音模型后,对语音录入进行边缘化检测,若发现数据识别不匹配时,提供重新录入和手动校正;如果系统识别时发现有歧义指令,会提供相近的多指令选择。
本发明是为了提高语音识别在大数据维护中的应用,研究出的基于语音指令集的通用数据维护方法,该方法实现了大型软件的UI组件定位、数据检索、数据录入、数据编辑等功能,此外,随着软件的升级改造,该方法满足动态UI组件的增加以适配语音识别功能。该方法根据数据维护过程中语音识别使用要求,首先将复杂多样的数据模型进行分类处理,统计各种数据模型人机交互的方式,同时,根据数据维护业务应用情况,建立语音识别指令集;然后建立数据模型人机交互方式和指令集之间映射表;再根据数据模型和指令集之间的映射关系,在数据模型调度之前,注册相应的语音指令模型;最后通过“学习”和“训练”,建立识别基本单元的声学模型和进行文法分析的语言模型,实现复杂环境的语音通用数据维护。本发明设计并实现了基于语音指令集的通用数据维护,能够广泛地集成、调用数据维护过程中各类数据模型,有效地解决了管理人员无法在复杂环境下数据手动维护的问题,减轻了管理人员使用数据维护的复杂度及工作量,实现了通用数据维护方法的最优、最科学应用。
本发明通过采用基于语音指令集的通用数据维护方法,有效地解决了数据管理软件在复杂环境下手动操作困难、效率低下、手段单一等问题,该方法已经应用于大型数据维护软件系统,实现了在复杂环境下的多模式数据维护和信息获取功能。
与现有技术相比,本发明方法具有以下显著的有益效果:
(1)创新使用语音识别指令集,制定数据维护全套语音指令,并与数据模型动作事件绑定,大大提高语音识别在数据维护软件中的应用深度和广度,增强数据维护软件在复杂环境下的可操作性、便捷性,同时,缩短了管理员数据维护周期,提高工作效率和可信度。
(2)创新对复杂数据进行模型化处理,提供通用的模型组件方式,使数据模型实现货架式管理,增强系统的扩展性、科学性。
(3)创新对UI组件及子控件进行编码,并建立语音指令集映射关系,实现多种语音识别方式。
(4)不改变软件代码的情况下能够更好地丰富模型库,实现了模型即插即用,降低了系统开发人员的软件维护工作量。
(5)基于语音指令集的通用数据维护方法,实现语音识别轻量化,支持跨平台操作,使管理员可以通过手持终端实现恶劣环境下通用数据语音操作,增强系统的扩展性和移植性。
附图说明
图1是本发明方法中的数据模型文件生成流程示意图;
图2是本发明方法中的指令集映射关系及注册校验流程示意图;
图3是本发明方法中的通用数据维护流程示意图。
具体实施方式
下面结合附图对本发明作进一步详细描述。
实施例1,一种基于语音指令集的通用数据维护方法,其步骤如下:
步骤一:对复杂数据进行模型化处理,根据统一算法封装为通用形式的模型文件,包括数据模型的输入输出参数个数和参数类型、人机界面显示方式;
步骤一中,对复杂数据建模处理封装为通用形式的模型文件的步骤如下:
(1)复杂数据模型化
首先对复杂数据进行数据分析,并对关联数据进行清洗,最后进行封装为数据模型,其中其中封装配置包括以下内容:
a)封装后的模型接口名称;
b)输入参数列表,包含所有输入参数的输入列表;
c)输出参数列表,包含所有输出参数的输出列表;
d)模型算法输入参数信息;
e)模型算法输出参数信息;
最后将封装好的数据生成算法动态库,并存储到数据模型库中;
(2)实现数据模型调度的通用性
首先建立模型动态调配接口,接口信息包括以下内容:
a)模型文件路径信息;
b)模型文件接口名称;
c)通用输入列表;
d)通用输出列表;
e)模型算法输入输出参数信息;
f)模型显示方式;
g)模型承接数据容量;
h)数据模型绑定的UI组件;
然后通过模型文件路径和模型文件接口名称信息,获取模型文件调配接口的指针,最后将通用输入输出传递给模型文件接口,结合步骤(1)生成的模型动态库,将通用调配接口生成调配动态库。
步骤二:建立语音识别指令集,根据数据模型种类、显示方式、数据的容量信息建立语音识别指令集。
步骤二中,将根据业务中的数据模型信息建立语音指令集的步骤如下:
(1)建立语音指令集
根据数据模型中的数据显示方式、数据容量信息,建立语音指令集,其中语音指令集包括菜单导航指令、窗口操作指令、树形菜单定位检索指令、表单操作指令、表单项操作指令、系统指令共六类指令集;其中指令集信息包括以下内容:
a)指令集基本信息,包括指令集名称、描述、版本信息;
b)指令集识别模式,为了保证软件使用效果体验,指令集识别模式分为两种方式:一是通过系统定义的编码辅助进行快速的识别和定位;另一种通过汉字意图识别,进行后续处理,此功能需要针对专业词汇进行模型训练,是一个需要逐步提高识别质量的过程;
(2)指令集分类
根据数据模型数据维护特征,将语音指令集分为菜单导航指令、窗口操作指令、树形菜单定位检索指令、表单操作指令、表单项操作指令、系统指令共六类指令集,其中各指令集信息包括以下内容:
a)菜单导航指令,包括序号指令和名称指令;
b)窗口操作指令,包括窗口可见性指令、窗口布局指令、窗口选择指令、面板切换指令、窗口滚动指令、窗口显示适配指令;
c)树形菜单检索指令,包括展开收起指令、选择指令、搜索指令;
d)表单指令,包括行选择指令、单元格选择指令、查看行指令、新增行指令、删除行指令、编辑行指令、导出指令、检索指令;
e)表单项操作指令,包括表单项控制指令——保存或撤销指令、表单项选择指令,另外表单项满足文本框输入组件、下拉框组件、树形选择组件、时间录入组件的指令要求;
f)系统指令,包括操作模式切换指令、退出指令,如果系统识别时发现有歧义指令,会提供多指令选择。
步骤三:建立数据模型和语音指令集之间的映射关系,在调度数据模型之前,注册相应的语音指令,并对数据模型和指令集正确性进行校验;
步骤三中,建立数据模型和语音指令集映射关系,注册指令集并进行正确性校验步骤如下:
(1)建立映射关系:首先,根据数据模型的显示方式及数据容量,绑定语音识别指令集,即数据模型实例化时确定显示方式及UI组件,并实现UI组件的语音指令和动作的绑定;
(2)注册指令集并进行正确性校验:在切换语音模式时,注册语音指令对应的语音模型,并对数据模型和语音指令关系进行正确性校验;首先读取数据模型文件路径及名称,查找数据模型库中是否存在,若不存在则发出提示信息,然后对数据模型进行解析,将数据模型输入与绑定的UI组件、指令集进行匹配,若三种类型若不同则发出提示信息,最后校验语音指令和动作触发是否成功。
步骤四:通用数据维护,首先通过“学习”和“训练”,建立识别基本单元的声学模型和进行文法分析的语言模型,之后对数据模型进行解析,并加载相应的语音模型,对数据模型的图形化显示进行语音通用数据维护;
步骤四中,通用数据维护步骤如下:
(1)建立声学模型和语音模型:首先通过“学习”和“训练”,建立识别基本单元的声学模型和进行文法分析的语言模型,之后对数据模型进行解析,并加载相应的语音模型,对数据模型的图形化显示进行语音通用数据维护;
(2)模型训练及模式匹配:按照一定的准则,从己知模式中获取表征该模式本质特征的模型参数进行模型训练,另外,使待识别样本与通过提取出来的训练样本的本质特征而建立的模型进行对比分析,使未知模式与模型库中的某一个模型获得最佳匹配;
(3)数据维护,首先通过语音识别定位UI组件,再检索指令集中相应的指令,从而触发UI组件相应的动作事件,实现在复杂环境下的基于语音指令集的通用数据维护。
步骤五:语音识别边缘性检测,加载数据模型和调度语音模型后,对语音录入进行边缘化检测,若发现数据识别不匹配时,提供重新录入和手动校正,并加入训练模型库;
步骤五中:对语音识别进行边缘化处理并提供容错机制,具体过程为,加载数据模型和调度语音模型后,对语音录入进行边缘化检测,若发现数据识别不匹配时,提供重新录入和手动校正;如果系统识别时发现有歧义指令,会提供相近的多指令选择。
实施例2,一种基于语音指令集的通用数据维护方法,包含下列步骤:
第一步,复杂数据模型化处理:根据统一算法封装为通用形式的模型文件,包括数据模型的输入输出参数个数和参数类型、人机界面显示方式、数据容量等信息。要达到数据模型通用化,要制定一个统一的标准,包括模型的接口名称、输入输出参数、表单嵌套等统一性,使数据模型在程序加载时可用做到一致性处理。首先要对数据模型的输入输出制定标准,在数据处理过程中,要剔除输入输出的差异性,因此输入输出以XML格式提供,内容包括接口名称、输入输出参数个数、列表、数据容量等信息,另外支持选择、循环等语句,满足输入输出的动态需求。最后将数据模型生成独立的模型文件并存储到数据模型库中,当程序需要加载数据模型时,解析相应的XML调度数据模型。要生成这样的模型文件,如图1图所示模型文件的生成,详细的步骤如下:
(1)生成数据模型文件:对数据模型应用软件来说,其数据内容、关联表单都有其不确定性,本发明设计统一数据描述规则,在调度数据模型时对描述信息进行解析,从而获取数据模型详细信息。其中数据模型信息以XML格式进行解析,如root节点为数据模型根节点,记录数据模型接口信息;blocks作为数据数据块,子节点block为具体字段,包括字段名称、类型等信息,其中数据块分为实节点和虚节点,虚节点依赖实际数据值或字段值,作为后边数据块的分支、循环,实现表单的嵌套。通过数据转换将模型的输入、输出参数转换为XML格式进行封装,这样既可以实现表单的嵌套,又可以实现多个表单的输入输出。因为对原模型算法进行了封装,整个矩阵转换过程对使用者来说是通用的,也是不可见的。
(2)实现模型的通用性:通过解析统一的XML文件获取模型文件路径和模型文件接口名称信息,获取模型文件调配接口的指针,最后将通用输入输出传递给模型文件接口,生成的模型动态库,将通用调配接口生成调配动态库,采用动态加载模型库与模型指针方式,结合模型动态库路径的映射关系,动态获取模型运算指令名称,最后将这一系列操作打包成为模型动态调用可以识别的构件,结合步骤(1)实现数据模型的通用性、一致性。
第二步,建立语音指令集:根据数据模型中的数据显示方式、数据容量等信息,建立语音指令集,其中语音指令集包括菜单导航指令、窗口操作指令、树形菜单定位检索指令、表单操作指令、表单项操作指令、系统指令等六类指令集。为了保证软件使用效果体验,指令集识别模式分为两种方式:一是通过系统定义的编码辅助进行快速的识别和定位,另一种通过汉字意图识别。
(1)建立语音指令集:首先对数据模型集中的显示方式进行汇总,即对人机界面设计中的UI组件类型、操作方式、数据容量进行收集,并制定总体语音指令集,支持窗口布局、模式切换、定位、选择、检索等指令。然后在UI设计时,设定统一编码规则,对UI组件进行编码,并在语音录入界面进行标注,提供UI组件名称和编码两种方式定位。最后通过语音指令集与UI组件编码相结合,定位具体组件,并执行相应指令。
如:多个Tab Page标签上面除了名字,还会加上(T1~TN)的标示代码,用于快速的命令识别、定位;多个窗口中含有相同的操作指令,可以通过窗口编码加指令集进行操作,如“窗口A向下滚动”;表格中的元素采用一种类似Excel显示方式加上行列序号方式,行号使用A-Z字母,列号采用0-9阿拉伯数字方式表示等。
(2)指令集分类实现:根据数据模型数据维护特征,将语音指令集分为菜单导航指令、窗口操作指令、树形菜单定位检索指令、表单操作指令、表单项操作指令、系统指令等六类指令集,其中各指令集信息包括以下内容:
a)菜单导航指令,包括序号指令和名称指令。其中,序号指令为“打开MO”,菜单编码为MO-Mn;名称指令为“打开菜单1”,“菜单1”位菜单项名称。
b)窗口操作指令,包括窗口可见性指令、窗口布局指令、窗口选择指令、面板切换指令、窗口滚动指令、窗口显示适配指令等。其中窗口编码为FO-Fn,布局编码为LO-Ln,属性页面板编码为PO-Pn(针对Tab Panel界面)。如窗口可见性指令:隐藏/显示FO,隐藏/显示窗口A,“窗口A”为窗口名称;窗口布局指令:显示LO、显示布局一,“布局一”为布局名称;窗口选择指令:选择FO、选择窗口A,“窗口A”为窗口名称;面板切换指令:FOPO、窗口A面板B;窗口滚动指令:FO滚动顶部、FO滚动底部、FO向下翻页、FO向上翻页;窗口适配指令:FO最大化、FO适配显示。
c)树形菜单检索指令,包括展开收起指令、选择指令、搜索指令等。其中树形编码为TO-Tn,节点编码为:NO-Nn。如展开收起指令:展开/收起TO、展开/收起NO;选择指令:选择NO;搜索指令:搜索XX部队,“XX部队”为节点名称。
d)表单指令,包括行选择指令、单元格选择指令、查看行指令、新增行指令、删除行指令、编辑行指令、导出指令、检索指令等。其中表格编码为GO-Gn,表格行编码为RO-Rn,表格列编码为CO-Cn,单元格编码为SO-Sn。如行选择指令:GO选择RO;单元格选择指令:GO选择SO;查看指令:查看RO;新增行指令:GO新增;删除行指令:删除RO;编辑行指令:编辑RO;导出指令:导出GO、导出GO为Excel;检索指令:条件X大于(小于等于)X、条件X检索XX。
e)表单项操作指令,包括表单项控制指令(保存、撤销指令)、表单项选择指令、位置指令等,另外表单项满足文本框输入组件、下拉框组件、树形选择组件、时间录入组件的指令要求。当表单项为选择类组件,如下拉框,通过选择下拉项编号,如“选择第一项”;当表单项为输入框、时间等组件时,可以直接语音录入;位置指令:PO-Pn,当需要对表单项部分内容进行修改时,定义位置指令为:PO-Pn,语音指令为:选择SO,移动到P1(插入)、选择SO,选择P1到P5(删除、修改)。
f)系统指令,包括操作模式切换指令、退出指令等,如果系统识别时发现有歧义指令,会提供多指令选择。
第三步,建立数据模型和语音指令集映射关系,注册指令集并进行正确性校,首先将建立好的数据模型进行实例化,确定显示方式及UI组件,配置UI组件中需要语音操作的操作项,并与语音指令集进行绑定,同时对数据模型和语音指令关系进行校验,校验成功后进行注册、调度、注销等操作。建立指令集映射关系并进行注册校验如图2所示,详细步骤如下所示:
(1)建立映射关系:首先,根据数据模型的显示方式及数据容量,绑定语音识别指令集,即数据模型实例化时确定显示方式及UI组件,并实现UI组件的语音指令和动作的绑定,在此过程中,
(2)注册指令集并进行正确性校验:在切换语音模式时,注册语音指令对应的语音模型,并对数据模型和语音指令关系进行正确性校验。首先读取数据模型文件路径及名称,查找数据模型库中是否存在,若不存在则发出提示信息,然后对数据模型进行解析,将数据模型输入与绑定的UI组件、指令集进行匹配,若三种类型若不同则发出提示信息,最后校验语音指令和动作触发是否成功。
第四步,通用数据维护:首先通过“学习”和“训练”,建立识别基本单元的声学模型和进行文法分析的语言模型,之后对数据模型进行解析,并加载相应的语音模型,对数据模型的图形化显示进行语音通用数据维护。通用数据维护过程如图3所示,详细步骤如下所示:
(1)建立声学模型和语音模型:首先通过“学习”和“训练”,建立识别基本单元的声学模型和进行文法分析的语言模型,之后对数据模型进行解析,并加载相应的语音模型,对数据模型的图形化显示进行语音通用数据维护;
(2)模型训练及模式匹配:按照一定的准则,从己知模式中获取表征该模式本质特征的模型参数进行模型训练,另外,使待识别样本与通过提取出来的训练样本的本质特征而建立的模型进行对比分析,使未知模式与模型库中的某一个模型获得最佳匹配。
(3)数据维护,首先通过语音识别定位UI组件,再检索指令集中相应的指令,从而触发UI组件相应的动作事件,实现在复杂环境下的基于语音指令集的通用数据维护。
第五步,语音识别边缘性检测,加载数据模型和调度语音模型后,对语音录入进行边缘化检测,若发现数据识别不匹配时,提供重新录入和手动校正,并加入训练模型库。例如:从调度语音指令,到最后执行需要经过几个步骤,由于语音的识别率、数据的灵活性等问题,都会出现一些边缘问题,甚至无效指令问题,因此,对边缘性检查的同时,在可信范围内逐步训练语音模型并丰富语音模型库时很有必要的。另外,管理人员由于失误提供错误的模型数据,这样也会导致识别和执行的误差,因此,一方面要在整个模型调度过程中提供容错算法,对语音识别、指令集的匹配、事件动作的执行等进行边缘化处理,给管理员一场提示,另一方,在误操作或者歧义操作指令时,系统提供拟合度最高的多指令选择。
本实施例的基于语音指令集的通用数据维护方法的效果是:
基于语音指令集的通用数据实现后,管理员可采取手工录入和语音录入两种模式,在复杂环境下,如单机装备、舰载设备上,采用语音录入、信息获取,对数据维护增加了手段支持,同时也提高数据维护人员的工作效率、降低工作量。另外基于语音指令集的通用数据方法使数据模型实现货架式管理,增强系统的扩展性、科学性。也实现语音识别轻量化,支持跨平台操作,使管理员可以通过手持终端实现恶劣环境下通用数据语音操作,增强系统的扩展性和移植性。

Claims (6)

1.一种基于语音指令集的通用数据维护方法,其特征在于,其步骤如下:
步骤一:对复杂数据进行模型化处理,根据统一算法封装为通用形式的模型文件,包括数据模型的输入输出参数个数和参数类型、人机界面显示方式;
步骤二:建立语音识别指令集,根据数据模型种类、显示方式、数据的容量信息建立语音识别指令集;
步骤三:建立数据模型和语音指令集之间的映射关系,在调度数据模型之前,注册相应的语音指令,并对数据模型和指令集正确性进行校验;
步骤四:通用数据维护,首先通过“学习”和“训练”,建立识别基本单元的声学模型和进行文法分析的语言模型,之后对数据模型进行解析,并加载相应的语音模型,对数据模型的图形化显示进行语音通用数据维护;
步骤五:语音识别边缘性检测,加载数据模型和调度语音模型后,对语音录入进行边缘化检测,若发现数据识别不匹配时,提供重新录入和手动校正,并加入训练模型库。
2.根据权利要求1所述的基于语音指令集的通用数据维护方法,其特征在于,步骤一中,对复杂数据建模处理封装为通用形式的模型文件的步骤如下:
(1)复杂数据模型化
首先对复杂数据进行数据分析,并对关联数据进行清洗,最后进行封装为数据模型,其中其中封装配置包括以下内容:
封装后的模型接口名称;
输入参数列表,包含所有输入参数的输入列表;
输出参数列表,包含所有输出参数的输出列表;
模型算法输入参数信息;
模型算法输出参数信息;
最后将封装好的数据生成算法动态库,并存储到数据模型库中;
(2)实现数据模型调度的通用性
首先建立模型动态调配接口,接口信息包括以下内容:
模型文件路径信息;
模型文件接口名称;
通用输入列表;
通用输出列表;
模型算法输入输出参数信息;
模型显示方式;
模型承接数据容量;
数据模型绑定的UI组件;
然后通过模型文件路径和模型文件接口名称信息,获取模型文件调配接口的指针,最后将通用输入输出传递给模型文件接口,结合步骤(1)生成的模型动态库,将通用调配接口生成调配动态库。
3.根据权利要求1所述的基于语音指令集的通用数据维护方法,其特征在于,步骤二中,将根据业务中的数据模型信息建立语音指令集的步骤如下:
(1)建立语音指令集
根据数据模型中的数据显示方式、数据容量信息,建立语音指令集,其中语音指令集包括菜单导航指令、窗口操作指令、树形菜单定位检索指令、表单操作指令、表单项操作指令、系统指令共六类指令集;其中指令集信息包括以下内容:
指令集基本信息,包括指令集名称、描述、版本信息;
指令集识别模式,为了保证软件使用效果体验,指令集识别模式分为两种方式:一是通过系统定义的编码辅助进行快速的识别和定位;另一种通过汉字意图识别,进行后续处理,此功能需要针对专业词汇进行模型训练,是一个需要逐步提高识别质量的过程;
(2)指令集分类
根据数据模型数据维护特征,将语音指令集分为菜单导航指令、窗口操作指令、树形菜单定位检索指令、表单操作指令、表单项操作指令、系统指令共六类指令集,其中各指令集信息包括以下内容:
菜单导航指令,包括序号指令和名称指令;
窗口操作指令,包括窗口可见性指令、窗口布局指令、窗口选择指令、面板切换指令、窗口滚动指令、窗口显示适配指令;
树形菜单检索指令,包括展开收起指令、选择指令、搜索指令;
表单指令,包括行选择指令、单元格选择指令、查看行指令、新增行指令、删除行指令、编辑行指令、导出指令、检索指令;
表单项操作指令,包括表单项控制指令——保存或撤销指令、表单项选择指令,另外表单项满足文本框输入组件、下拉框组件、树形选择组件、时间录入组件的指令要求;
系统指令,包括操作模式切换指令、退出指令,如果系统识别时发现有歧义指令,会提供多指令选择。
4.根据权利要求1所述的基于语音指令集的通用数据维护方法,其特征在于,步骤三中,建立数据模型和语音指令集映射关系,注册指令集并进行正确性校验步骤如下:
(1)建立映射关系:首先,根据数据模型的显示方式及数据容量,绑定语音识别指令集,即数据模型实例化时确定显示方式及UI组件,并实现UI组件的语音指令和动作的绑定;
(2)注册指令集并进行正确性校验:在切换语音模式时,注册语音指令对应的语音模型,并对数据模型和语音指令关系进行正确性校验;首先读取数据模型文件路径及名称,查找数据模型库中是否存在,若不存在则发出提示信息,然后对数据模型进行解析,将数据模型输入与绑定的UI组件、指令集进行匹配,若三种类型若不同则发出提示信息,最后校验语音指令和动作触发是否成功。
5.根据权利要求1所述的基于语音指令集的通用数据维护方法,其特征在于,步骤四中,通用数据维护步骤如下:
(1)建立声学模型和语音模型:首先通过“学习”和“训练”,建立识别基本单元的声学模型和进行文法分析的语言模型,之后对数据模型进行解析,并加载相应的语音模型,对数据模型的图形化显示进行语音通用数据维护;
(2)模型训练及模式匹配:按照一定的准则,从己知模式中获取表征该模式本质特征的模型参数进行模型训练,另外,使待识别样本与通过提取出来的训练样本的本质特征而建立的模型进行对比分析,使未知模式与模型库中的某一个模型获得最佳匹配;
(3)数据维护,首先通过语音识别定位UI组件,再检索指令集中相应的指令,从而触发UI组件相应的动作事件,实现在复杂环境下的基于语音指令集的通用数据维护。
6.根据权利要求1所述的基于语音指令集的通用数据维护方法,其特征在于,步骤五中:对语音识别进行边缘化处理并提供容错机制,具体过程为,加载数据模型和调度语音模型后,对语音录入进行边缘化检测,若发现数据识别不匹配时,提供重新录入和手动校正;如果系统识别时发现有歧义指令,会提供相近的多指令选择。
CN201811450916.1A 2018-11-29 2018-11-29 基于语音指令集的通用数据维护方法 Active CN109410939B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811450916.1A CN109410939B (zh) 2018-11-29 2018-11-29 基于语音指令集的通用数据维护方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811450916.1A CN109410939B (zh) 2018-11-29 2018-11-29 基于语音指令集的通用数据维护方法

Publications (2)

Publication Number Publication Date
CN109410939A true CN109410939A (zh) 2019-03-01
CN109410939B CN109410939B (zh) 2022-03-08

Family

ID=65456610

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811450916.1A Active CN109410939B (zh) 2018-11-29 2018-11-29 基于语音指令集的通用数据维护方法

Country Status (1)

Country Link
CN (1) CN109410939B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110428838A (zh) * 2019-08-01 2019-11-08 大众问问(北京)信息科技有限公司 一种语音信息识别方法、装置及设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1323415A (zh) * 1998-10-13 2001-11-21 加拿大柯达根技术公司 基于部件的源代码生成器
US20070016614A1 (en) * 2005-07-15 2007-01-18 Novy Alon R J Method and apparatus for providing structured data for free text messages
CN103559069A (zh) * 2013-11-18 2014-02-05 中国科学院声学研究所 一种基于代数系统的跨文件过程间优化方法
CN103744949A (zh) * 2013-12-31 2014-04-23 金蝶软件(中国)有限公司 数据集成方法和系统
US20170103092A1 (en) * 2015-10-07 2017-04-13 Oracle International Corporation Ddl processing in sharded databases

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1323415A (zh) * 1998-10-13 2001-11-21 加拿大柯达根技术公司 基于部件的源代码生成器
US20070016614A1 (en) * 2005-07-15 2007-01-18 Novy Alon R J Method and apparatus for providing structured data for free text messages
CN103559069A (zh) * 2013-11-18 2014-02-05 中国科学院声学研究所 一种基于代数系统的跨文件过程间优化方法
CN103744949A (zh) * 2013-12-31 2014-04-23 金蝶软件(中国)有限公司 数据集成方法和系统
US20170103092A1 (en) * 2015-10-07 2017-04-13 Oracle International Corporation Ddl processing in sharded databases

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110428838A (zh) * 2019-08-01 2019-11-08 大众问问(北京)信息科技有限公司 一种语音信息识别方法、装置及设备

Also Published As

Publication number Publication date
CN109410939B (zh) 2022-03-08

Similar Documents

Publication Publication Date Title
CN106371829B (zh) 基于模块化思想的模板框架设计方法及系统
CN109918680A (zh) 实体识别方法、装置及计算机设备
Cunningham et al. Software infrastructure for natural language processing
Spyns et al. An ontology engineering methodology for DOGMA
Kohlhase Using as a semantic markup format
Njonko et al. From natural language business requirements to executable models via SBVR
CN107203468A (zh) 一种基于ast的软件版本演化对比分析方法
CN106201480A (zh) 一种座舱显示控制系统软件架构管理平台
CN107767008A (zh) 流程配置方法及装置
CN106326307A (zh) 一种语言交互方法
CN110147544A (zh) 一种基于自然语言的指令生成方法、装置以及相关设备
Andry et al. Making DATR work for speech: lexicon compilation in SUNDIAL
CN115964273A (zh) 基于深度学习的航天器测试脚本自动生成方法
CN109410939A (zh) 基于语音指令集的通用数据维护方法
Stenzhorn Xtragen-a natural language generation system using xml-and java-technologies
CN112307767A (zh) 一种基于Bi-LSTM技术的调控知识建模方法
Owda et al. Information extraction for SQL query generation in the conversation-based interfaces to relational databases (C-BIRD)
Alashqar Automatic generation of uml diagrams from scenario-based user requirements
CN112052652B (zh) 一种电子课件脚本自动生成方法及装置
CN114861646A (zh) 一种面向医学垂直领域的数据标注平台
Rehman et al. ASCII based GUI system for arabic scripted languages: a case of urdu.
Xiao et al. Lightweight natural language driven intent translation mechanism for intent based networking
CN114970733A (zh) 语料生成方法及装置、系统、存储介质和电子设备
CN110727428B (zh) 一种转换业务逻辑层代码的方法、装置和电子设备
CN108766059A (zh) 一种云服务英语教学设备及教学方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 100000 No. 3, Wanshou Road, Haidian District, Beijing

Applicant after: UNIT 91977 OF PLA

Applicant after: CSIC Information Technology Co.,Ltd.

Address before: 100000 No. 3, Wanshou Road, Haidian District, Beijing

Applicant before: UNIT 91977 OF PLA

Applicant before: LIANYUNGANG JARI SHENRUAN TECHNOLOGY Co.,Ltd.

GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder
CP01 Change in the name or title of a patent holder

Address after: 100000 No. 3, Wanshou Road, Haidian District, Beijing

Patentee after: UNIT 91977 OF PLA

Patentee after: China Shipbuilding Digital Information Technology Co.,Ltd.

Address before: 100000 No. 3, Wanshou Road, Haidian District, Beijing

Patentee before: UNIT 91977 OF PLA

Patentee before: CSIC Information Technology Co.,Ltd.