CN114120980A - 一种显控台操控系统和方法 - Google Patents

一种显控台操控系统和方法 Download PDF

Info

Publication number
CN114120980A
CN114120980A CN202111225263.9A CN202111225263A CN114120980A CN 114120980 A CN114120980 A CN 114120980A CN 202111225263 A CN202111225263 A CN 202111225263A CN 114120980 A CN114120980 A CN 114120980A
Authority
CN
China
Prior art keywords
voice
control
display
interface
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111225263.9A
Other languages
English (en)
Inventor
邹长虹
李雷
李思笛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Institute of Electronic System Engineering
Original Assignee
Beijing Institute of Electronic System Engineering
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Institute of Electronic System Engineering filed Critical Beijing Institute of Electronic System Engineering
Priority to CN202111225263.9A priority Critical patent/CN114120980A/zh
Publication of CN114120980A publication Critical patent/CN114120980A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/445Program loading or initiating
    • G06F9/44521Dynamic linking or loading; Link editing at or after load time, e.g. Java class loading
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L2015/088Word spotting
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明的一个实施例公开了一种显控台操控系统和方法,所述显控台操控系统包括:第一显示器和第二显示器,还包括:语音识别模块、操控台面和计算机,其中,所述操控台面配置有语音输入控制按钮,所述语音输入控制按钮响应于操作人员的操作在按下状态录入操控人员语音信息,在松开状态停止语音信息的录入;所述语音识别模块用于通过提前设定好的语法规则识别录入的语音信息,将其转换为操控命令词,通过网络接口与所述计算机进行交互;所述计算机调用语音识别动态链接库,根据操控命令词对所述显控台进行操控。本发明通过语音控制功能操控,提高了操作人员操作装备的准确性和安全性。

Description

一种显控台操控系统和方法
技术领域
本发明涉及显控台操控领域。更具体地,涉及一种显控台操控系统和方法。
背景技术
显控台的操控一般通过标准键盘和硬功能键。在装备车辆移动过程中,特别是通过土路、碎石路路段引起的颠簸容易使操作人员误操作。
发明内容
本发明的一个目的在于提供一种显控台操控系统,解决武器系统操控方式单一,装备车辆移动过程中操作人员容易误操控问题。
本发明的另一个目的在于提供一种显控台操控方法。
为达到上述目的,本发明采用下述技术方案:
第一方面,本发明提供了一种显控台操控系统,包括:第一显示器和第二显示器,还包括:语音识别模块、操控台面和计算机,其中,
所述操控台面配置有语音输入控制按钮,所述语音输入控制按钮响应于操作人员的操作在按下状态录入操控人员语音信息,在松开状态停止语音信息的录入;
所述语音识别模块用于通过提前设定好的语法规则识别录入的语音信息,将其转换为操控命令词,通过网络接口与所述计算机进行交互;
所述计算机调用语音识别动态链接库,根据操控命令词对所述显控台进行操控。
在一个具体示例中,所述语音识别模块与所述语音输入控制按钮之间采用TTS瞬态按键触发信号互连,低电平有效。
在一个具体示例中,所述语音识别模块设置于第一显示器和第二显示器之间,内置麦克风阵列,强化识别60°范围内录入的语音信息。
在一个具体示例中,所述语音识别模块支持常规读法数字串和军用读法数字串语音识别,并提供操控命令词识别结果对应的置信度。
在一个具体示例中,所述语音识别模块支持连续语音识别,操作人员连续输入语音能实现连续语音转文字功能,支持实时输出识别结果,能实现标点预测,语音合成支持GB18030、GB2312、GBK、Big5和Unicode文本字符集格式。
在一个具体示例中,所述语音识别模块具备智能文本处理能力,对设定的语法规则内的特殊符号、专业术语、特定词组和缩写进行智能判断分析与处理。
在一个具体示例中,所述语音识别动态链接库屏蔽了底层UDP网络通信过程,以API接口的形式供用户调用,所有功能均以“请求-应答”的形式与智能传感模组进行交互,所述语音识别动态链接库提供了智能传感模组操控类,该类包含了供用户调用的外部接口以及信号,用户在实例化该类后,调用外部接口以及将类中的信号和用户的槽函数进行链接后能使用全部功能。
在一个具体示例中,所述外部接口包括:链接模块接口、开始语音识别接口、结束语音识别接口、语音识别按键控制接口、标点预测控制接口、健康状态上报控制接口、开始语音转写接口、结束语音转写接口和设置语音转写参数接口。
第二方面,本发明提供了一种利用本发明第一方面所述的显控台操控系统进行显控台操控的方法,包括以下步骤:
S101:响应于操作人员的操控,所述语音输入控制按钮在按下状态记录操控人员语音信息,在松开状态停止语音信息的录入;
S103:所述语音识别模块通过提前设定好的语法规则识别录入的语音信息,将其转换为操控命令词,通过网络接口与所述计算机进行交互;
S105:所述计算机调用语音识别动态链接库,根据操控命令词对所述显控台进行操控。
本发明的有益效果如下:
本发明所述显控台操控系统和方法,通过语音控制功能操控,不仅是一种耳目一新的操控方式,并且在装备车辆移动过程中使用,提高了操作人员操作装备的准确性和安全性,解决了武器系统操控方式单一、装备车辆移动过程中操作人员容易误操控的问题。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出传统的显控台组成示意图。
图2示出本发明一个实施例一种显控台操控系统示意图。
图3示出本发明一个实施例语音识别模块、语音输入控制按钮和计算机的连接图。
图4示出本发明一个实施例一种显控台操控方法的示意图。
具体实施方式
为使本发明的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
传统的显控台组成如图1所示,为解决武器系统操控方式单一,装备车辆移动过程中操作人员容易误操作问题,如图2所示,在传统显控台的操控台面上增加语音输入控制按钮并加装语音识别模块,在计算机应用程序中调用语音识别动态链接库。
本发明第一实施例提供一种显控台操控系统,如图2所示,包括:第一显示器和第二显示器,还包括:语音识别模块、操控台面和计算机,其中,
所述操控台面配置有语音输入控制按钮,所述语音输入控制按钮响应于操作人员的操作在按下状态录入操控人员语音信息,在松开状态停止语音信息的录入;
所述语音识别模块用于识别录入的语音信息,将其转换为操控命令词,内置麦克风阵列,强化识别60°范围内的录入语音信息,以麦克风朝向为水平线,上下左右60°范围内,通过网络接口与所述计算机进行交互;
所述计算机调用语音识别动态链接库,根据操控命令词对所述显控台进行操控。
所述语音识别模块用于通过设定好的语法规则(包含孤立词、带语法规则的命令短句)来识别所述语音信息。
在一个具体实施例中,如图3所示,所述语音识别模块与所述语音输入控制按钮之间采用TTS瞬态按键触发信号互连,低电平有效。
在一个具体实施例中,所述语音识别模块设置于第一显示器和第二显示器之间。
在一个具体实施例中,所述语音识别模块支持常规读法数字串和军用读法数字串语音识别,并提供命令词识别结果对应的置信度。
在一个具体实施例中,所述语音识别模块支持连续语音识别,操作人员连续输入语音即可实现连续语音转文字功能,支持实时输出识别结果,能实现标点预测,语音合成支持GB18030、GB2312、GBK、Big5和Unicode等文本字符集格式。
在一个具体实施例中,所述语音识别模块具备智能文本处理能力,对设定的语法规则内的特殊符号、专业术语、特定词组和缩写进行智能判断分析与处理。
在一个具体实施例中,所述语音识别动态链接库屏蔽了底层UDP网络通信过程,以API接口的形式供用户调用,所有功能均以“请求-应答”的形式与智能传感模组进行交互,所述语音识别动态链接库提供了智能传感模组操控类,该类包含了供用户调用的外部接口以及信号,用户在实例化该类后,调用外部接口以及将类中的信号和用户的槽函数进行链接后即可使用全部功能。
在一个具体实施例中,所述外部接口包括:链接模块接口、开始语音识别接口、结束语音识别接口、语音识别按键控制接口、标点预测控制接口、健康状态上报控制接口、开始语音转写接口、结束语音转写接口和设置语音转写参数接口。
本发明第二实施例提供了一种利用本发明第一实施例所述显控台操控系统进行显控台操控的方法,如图4所示,包括以下步骤:
S101:响应于操作人员的操控,所述语音输入控制按钮在按下状态记录操控人员语音信息,在松开状态停止语音信息的录入;
S103:所述语音识别模块通过提前设定好的语法规则识别录入的语音信息,将其转换为操控命令词,通过网络接口与所述计算机进行交互;
S105:所述计算机调用语音识别动态链接库,根据操控命令词对所述显控台进行操控。
显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定,对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动,这里无法对所有的实施方式予以穷举,凡是属于本发明的技术方案所引伸出的显而易见的变化或变动仍处于本发明的保护范围之列。

Claims (9)

1.一种显控台操控系统,包括:第一显示器和第二显示器,其特征在于,还包括:语音识别模块、操控台面和计算机,其中,
所述操控台面配置有语音输入控制按钮,所述语音输入控制按钮响应于操作人员的操作在按下状态录入操控人员语音信息,在松开状态停止语音信息的录入;
所述语音识别模块用于通过提前设定好的语法规则识别录入的语音信息,将其转换为操控命令词,通过网络接口与所述计算机进行交互;
所述计算机调用语音识别动态链接库,根据操控命令词对所述显控台进行操控。
2.根据权利要求1所述的系统,其特征在于,所述语音识别模块与所述语音输入控制按钮之间采用TTS瞬态按键触发信号互连,低电平有效。
3.根据权利要求1所述的系统,其特征在于,所述语音识别模块设置于第一显示器和第二显示器之间,内置麦克风阵列,强化识别60°范围内录入的语音信息。
4.根据权利要求3所述的系统,其特征在于,所述语音识别模块支持常规读法数字串和军用读法数字串语音识别,并提供操控命令词识别结果对应的置信度。
5.根据权利要求3所述的系统,其特征在于,所述语音识别模块支持连续语音识别,操作人员连续输入语音能实现连续语音转文字功能,支持实时输出识别结果,能实现标点预测,语音合成支持GB18030、GB2312、GBK、Big5和Unicode文本字符集格式。
6.根据权利要求3所述的系统,其特征在于,所述语音识别模块具备智能文本处理能力,对设定的语法规则内的特殊符号、专业术语、特定词组和缩写进行智能判断分析与处理。
7.根据权利要求1所述的系统,其特征在于,所述语音识别动态链接库屏蔽了底层UDP网络通信过程,以API接口的形式供用户调用,所有功能均以“请求-应答”的形式与智能传感模组进行交互,所述语音识别动态链接库提供了智能传感模组操控类,该类包含了供用户调用的外部接口以及信号,用户在实例化该类后,调用外部接口以及将类中的信号和用户的槽函数进行链接后能使用全部功能。
8.根据权利要求7所述的系统,其特征在于,所述外部接口包括:链接模块接口、开始语音识别接口、结束语音识别接口、语音识别按键控制接口、标点预测控制接口、健康状态上报控制接口、开始语音转写接口、结束语音转写接口和设置语音转写参数接口。
9.一种利用权利要求1-8任一项所述的显控台操控系统进行显控台操控的方法,其特征在于,包括以下步骤:
S101:响应于操作人员的操控,所述语音输入控制按钮在按下状态记录操控人员语音信息,在松开状态停止语音信息的录入;
S103:所述语音识别模块通过提前设定好的语法规则识别录入的语音信息,将其转换为操控命令词,通过网络接口与所述计算机进行交互;
S105:所述计算机调用语音识别动态链接库,根据操控命令词对所述显控台进行操控。
CN202111225263.9A 2021-10-21 2021-10-21 一种显控台操控系统和方法 Pending CN114120980A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111225263.9A CN114120980A (zh) 2021-10-21 2021-10-21 一种显控台操控系统和方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111225263.9A CN114120980A (zh) 2021-10-21 2021-10-21 一种显控台操控系统和方法

Publications (1)

Publication Number Publication Date
CN114120980A true CN114120980A (zh) 2022-03-01

Family

ID=80376191

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111225263.9A Pending CN114120980A (zh) 2021-10-21 2021-10-21 一种显控台操控系统和方法

Country Status (1)

Country Link
CN (1) CN114120980A (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160073257A1 (en) * 2014-09-04 2016-03-10 Wedoey, Inc. Console Display Terminal
CN107659847A (zh) * 2016-09-22 2018-02-02 腾讯科技(北京)有限公司 语音互动方法和装置
CN107945789A (zh) * 2017-12-28 2018-04-20 努比亚技术有限公司 语音识别方法、装置及计算机可读存储介质
CN108040272A (zh) * 2017-12-14 2018-05-15 深圳Tcl新技术有限公司 语音采集方法、遥控器及计算机可读存储介质
FR3063565A1 (fr) * 2017-03-03 2018-09-07 Robert Bosch Gmbh Procede et installation de suppression de bruits parasites contenu dans des signaux audio et commande vocale d'appareil
CN108766426A (zh) * 2018-05-31 2018-11-06 中国舰船研究设计中心 一种舰艇用智能语音交互指挥系统
CN110232918A (zh) * 2019-05-22 2019-09-13 成都飞机工业(集团)有限责任公司 一种无人机地面控制站语音控制系统及控制方法
CN110555295A (zh) * 2018-06-01 2019-12-10 通用电气航空系统有限公司 用于运载工具中的可靠命令的系统和方法
CN112017658A (zh) * 2020-08-28 2020-12-01 北京计算机技术及应用研究所 一种基于智能人机交互的操作控制系统
CN112927691A (zh) * 2021-02-23 2021-06-08 中国人民解放军陆军装甲兵学院 一种语音识别控制装置和方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160073257A1 (en) * 2014-09-04 2016-03-10 Wedoey, Inc. Console Display Terminal
CN107659847A (zh) * 2016-09-22 2018-02-02 腾讯科技(北京)有限公司 语音互动方法和装置
FR3063565A1 (fr) * 2017-03-03 2018-09-07 Robert Bosch Gmbh Procede et installation de suppression de bruits parasites contenu dans des signaux audio et commande vocale d'appareil
CN108040272A (zh) * 2017-12-14 2018-05-15 深圳Tcl新技术有限公司 语音采集方法、遥控器及计算机可读存储介质
CN107945789A (zh) * 2017-12-28 2018-04-20 努比亚技术有限公司 语音识别方法、装置及计算机可读存储介质
CN108766426A (zh) * 2018-05-31 2018-11-06 中国舰船研究设计中心 一种舰艇用智能语音交互指挥系统
CN110555295A (zh) * 2018-06-01 2019-12-10 通用电气航空系统有限公司 用于运载工具中的可靠命令的系统和方法
CN110232918A (zh) * 2019-05-22 2019-09-13 成都飞机工业(集团)有限责任公司 一种无人机地面控制站语音控制系统及控制方法
CN112017658A (zh) * 2020-08-28 2020-12-01 北京计算机技术及应用研究所 一种基于智能人机交互的操作控制系统
CN112927691A (zh) * 2021-02-23 2021-06-08 中国人民解放军陆军装甲兵学院 一种语音识别控制装置和方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
杨粤涛等: "车载语音降噪识别系统的设计与实现", 电子技术与软件工程, no. 12, 22 June 2016 (2016-06-22) *
郑力明等: "一种基于语音指令的预案决策方法", 信息通信, no. 05, 15 May 2020 (2020-05-15) *

Similar Documents

Publication Publication Date Title
US10466890B2 (en) Quick gesture input
US6401065B1 (en) Intelligent keyboard interface with use of human language processing
KR101098716B1 (ko) 컴퓨터 판독가능 매체 및 대화형 사용자 인터페이스 제공방법
US6499015B2 (en) Voice interaction method for a computer graphical user interface
KR20000049205A (ko) 문자 입력 장치 및 문자 입력 프로그램을 기억한 기록 매체
KR20040015005A (ko) 데이터 입력 장치
US7417564B2 (en) Enhancing character input in electronic device
EP1692848A1 (en) Apparatus and method for inputting character and numerals to display of a mobile communication terminal
WO2022227507A1 (zh) 唤醒程度识别模型训练方法及语音唤醒程度获取方法
CN101170757A (zh) 一种在移动设备中控制文字输入的方法及其装置
US20040176139A1 (en) Method and wireless communication device using voice recognition for entering text characters
KR101160543B1 (ko) 키워드를 이용한 사용자 인터페이스 제공 방법 및 단말기
CN111414772A (zh) 一种机器翻译方法、装置及介质
CN114120980A (zh) 一种显控台操控系统和方法
CN111881655A (zh) 一种语音输入标点符号快速切换方法
CN109830239B (zh) 语音处理装置、语音识别输入系统及语音识别输入方法
Blenkhorn Requirements for screen access software using synthetic speech
KR100532092B1 (ko) 커서를 이용한 컴퓨터 화면상에서의 영문 대소문자 구분방법 및 그 장치
CN109871195A (zh) 可语音输入及识别的控制方法及装置
JP2001350621A (ja) 表示画面上の座標位置を入力または起動する方法、および表示画面上の座標位置を入力または起動する装置
KR102605774B1 (ko) 스마트 글래스 및 이를 포함하는 음성 인식 시스템
KR100760508B1 (ko) 소프트웨어 로봇과의 대화를 위한 로봇언어 문법처리모듈
JP2001526817A (ja) テキストブロックデータ変更用の音声認識装置及びテキスト変更手段を具備したテキスト処理システム
KR102098683B1 (ko) 터치 키패드 및 이동통신 단말기
EP2806364A2 (en) Method and apparatus for managing audio data in electronic device

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination