CN110335598A - 一种基于语音识别的无线窄带信道话音通信方法 - Google Patents
一种基于语音识别的无线窄带信道话音通信方法 Download PDFInfo
- Publication number
- CN110335598A CN110335598A CN201910558622.9A CN201910558622A CN110335598A CN 110335598 A CN110335598 A CN 110335598A CN 201910558622 A CN201910558622 A CN 201910558622A CN 110335598 A CN110335598 A CN 110335598A
- Authority
- CN
- China
- Prior art keywords
- data
- communication
- speech
- text
- speech recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/225—Feedback of the input speech
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明公开了一种基于语音识别的无线窄带信道话音通信方法,包括:在通信任务节点用户话机端和无线通信设备端之间,增加智能数据解析单元,用以完成语音和文本的相互转换;为了支持无线通信设备原有常规通信文本和语音识别文本的区别,在通信文本中定义类型字段;智能数据解析单元通过模型加注软件以以太网接口的方式将语音模型加注到所选择的模型槽中。在应急通信时,可实现用户携带便携式无线通信装备进入偏远山区、远海等常规通信信号无法覆盖区域中进行超远距离的语音通信;同时通过话音通信的方式,通信用户可再进行按键式数据输入,实现了智能化、自动化数据传输,解放了用户的双手,可以使用户以更好的状态去应对其他事务。
Description
技术领域
本发明涉及一种无线通信领域的通信方法,尤其涉及一种基于语音识别的无线窄带信道话音通信方法。
背景技术
从2010年世界电信日(5.17)开始,不到4M一概称为窄带,只有4M或以上才能被称为宽带。
中国北斗卫星导航系统是中国自行研制的全球卫星导航系统。是继美国全球定位系统、俄罗斯卫星导航系统之后第三个成熟的卫星导航系统。北斗卫星导航系统由空间段、地面段和用户段三部分组成,可在全球范围内为各类用户提供高精度、高可靠定位、导航、授时服务,并具备双向短报文通信功能,用户可以一次一般仅能传送数十个汉字的短信息,该信道是一个窄带信道。
短波通信在军事通信领域具有其他通信手段无法替代的作用,短波通信又称高频通信,使用频率范围3MHZ~30MHZ,主要利用天波经电离层反射通信,无需建立中继站即可实现远距离通信,而且还具有成本低,易开通的优势,但是因其频率低、带宽有限,无法满足现代社会对图像、音频的数据通信需求,其也是一种窄带通信信道。
2008年汶川抗震救灾,在当地通信设施严重损毁的情况下,我国自主研制的北斗卫星导航系统发挥了举足轻重的作用,救灾部队携带北斗设备不断从灾情前线发出各类灾情报告,其中包含精确的地理位置信息,为抗震救灾指挥部根据灾情及时下达抗震救灾任务提供了重要的信息支援。
北斗、短波通信等无线窄带通信设备具有无需架设基站,支持山地通、动中通等特点,在抗灾救灾、应急抢险、军事通信等特殊领域具有极其明显的优势,但受其窄带特性的影响而制约使用,所以需要一种创新方法来解决无线窄带信道通信能力弱的问题;并且在窄带设备上建立语音通信模式,使用户无需手工操作设备,即能够有效的收发信息。
对任务场景做深入分析,可以分析得出在通信任务明确的情况下,单次任务具有任务明确、场景明确、词语素材明确的特点,按不同任务场景可以归纳出每种场景包含的语音可能性数据,且是有限集数据。所以可以训练模型库,模型库中能支持不同任务条件下对应的模型数据,在对应任务时,用户可以注入对应的模型数据进行任务。
发明内容
针对背景技术提出的问题,本发明设计了一种基于语音识别的无线窄带信道话音通信方法。在通信任务节点用户话机端和无线通信设备端之间,增加智能数据解析单元,用以完成语音和文本的相互转换;为了支持无线通信设备原有常规通信文本和语音识别文本的区别,在通信文本中定义类型字段;智能数据解析单元通过模型加注软件以以太网接口的方式将语音模型加注到所选择的模型槽中,步骤为:
1)语音识别模型加注软件通过以太网接口将新语音模型加注到智能数据解析单元的语音模型库阵列中;
2)用户通过话机发起通话,话机将数据传送至智能数据解析单元;
3)智能数据解析单元将话音数据解析为通信文本,并传给无线通信设备;
4)无线通信设备将数据通过无线信道传送给目标通信设备;
5)无线通信设备将从其他通信节点接收到的数据解析提取出文本数据,并转发给本通信节点的智能数据解析单元;
6)智能数据解析单元收到无线通信设备发送的通信文本后,判断数据类型为语音识别类型的数据将通过语音识别转换为音频,并将音频传送给话机。
所诉的模型加注方式,在语音模型库中以替换所加载语音模型阵列对应索引位置的文件。
所述的语音模型库阵列,为文件型阵列,在语音模型库中有保存文件阵列的存储信息。
本发明的有益技术效果是:通过将语音信息通过语音识别为文本后再通过无线信道进行传输,完成了以较小的传输数据量传输同样信息量的数据,从而解决了无线窄带信道传输信息量较小的问题;通过语音模型库的方式,提早录入各种应急、战备的通信要素,将有效提高数据的解析效率;在应急通信时,可实现用户携带便携式无线通信装备进入偏远山区、远海等常规通信信号无法覆盖区域中进行超远距离的语音通信;同时通过话音通信的方式,通信用户可再进行按键式数据输入,实现了智能化、自动化数据传输,解放了用户的双手,可以使用户以更好的状态去应对其他事务。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本发明申请的一部分,本发明的附图说明用来介绍本发明,并不构成对本发明的不当限定,在附图中:
图1 根据本发明实施例的通信原理图;
图2 根据本发明实施例的通信文本格式定义图;
图3 根据本发明实施例的通信节点物理结构图;
图4 根据本发明实施例的智能解析单元发送解析过程图;
图5 根据本发明实施例的智能解析单元接收解析过程图;
图6 根据本发明实施例的语音模型库以太网加注图;
图7 根据本发明实施例的语音模型库阵列示意图。
具体实施方式
在本发明的实施例中,提供了一种基于语音识别的无线窄带信道话音通信方法,主要用于实现通过无线通信设备进行话音数据的收发。
根据图1所示,本发明实施例基于语音识别的无线窄带信道话音通信方法包括:
1)用户通过话机发起通话,话机将数据传送至智能数据解析单元;
2)智能数据解析单元将话音数据解析为通信文本,并传给无线通信设备;
3)无线通信设备将数据通过无线信道传送给目标通信设备;
4)无线通信设备将从其他通信节点接收到的无线数据解析提取出文本数据,并转发给本通信节点的智能数据解析单元;
5)智能数据解析单元收到无线通信设备发送的通信文本后,判断数据类型为语音识别类型的数据将通过语音识别转换为音频,并将音频传送给话机。
上述所诉,指明了通信节点像另一通信节点发送数据的全过程,其种包含发送和接收流程,所指的无线通信设备一般只无线窄带通信设备。且所指的通信节点一般为背复便携式装备节点、车、机、船等平台为单位的节点。
根据图2所示,本发明实施例基于语音识别的无线窄带信道话音通信方法包括:所述的通信文本格式主要有数据类型和数据内容两部分。其中数据类型包含语音识别数据类型、常规报文数据类型,通过在数据类型字段的取值不同而判定。智能数据解析单元在语音转换为文本后,会将语音文本和语音类型特征值打包组成通信文本发送;在数据解析单元在接收到通信文本后,将会对通信文本的数据类型字段做判断,非语音识别类型的数据报文将不继续解析。
本实施例列举了一种取值方案,其中语音识别的数据类型字段值为“#”,数据内容为语音识别文本,常规报文的数据类型字段值为“*”,数据内容为常规报文。
根据图3所示,本发明实施例基于语音识别的无线窄带信道话音通信方法包括:话机、智能数据解析单元、无线通信设备、天线各部分。
其中话机用于在实施例中供用户接收和呼叫语音信息,其类型不限于耳麦、话筒等多种新式的使用方式。
天线用于接收和发送北斗短报文信息,其支持便携独立式、小型、集成式的天线。
智能数据解析单元用于解析从话机接收的语音数据,并将该数据通过语音识别转化为文本数据,也可用于将文本数据转化识别为语音数据,主要用在数据接收端。在无线通信设备信号受遮挡等情况下,智能数据解析单元的通信服务可以设置为存储一定周期内的文本数据,在信号稳定时自动发送存储的数据。
无线通信设备用于将文本数据按照北斗通信格式转发出去,同时从天线接收解析北斗短报文消息。
根据图4所示,本发明实施例基于语音识别的无线窄带信道话音通信方法包括:智能数据解析单元发送过程由预处理、特征提取、模式匹配、通信服务、语音模型库等模块工作,智能数据解析单元通过本单元的预处理模块接收话机信息并对语音数据进行预处理,处理过后将数据发送给特征提取模块,特征提取模块通过对有效数据进行提取,提取后将数据发给模式匹配模块,模式匹配模块通过与语音模型库中的语音数据进行匹配,解析出文本数据,并将该数据传给通信服务模块。通信服务模块通过对数据加上数据类型头,形成通信文本,并将结果转发给无线通信设备。
智能数据解析单元在语音转换为文本的过程中,将加载语音模型库的模型数据并对模型中所有模型的样本数据按语音长度进行排序,比所解析语音数据长度小的样本数据差值越小越靠前。在智能数据解析单元模式匹配时,从前至后依次解析。
智能数据解析单元在文本转换为语音的过程中,将加载语音模型库的模型数据,并对模型中所有模型的样本数据按文本长度进行排序,比所解析文本数据长度小的样本数据差值越小越靠前。在智能数据解析单元模式匹配时,从前至后依次解析。
根据图5所示,本发明实施例基于语音识别的无线窄带信道话音通信方法包括:智能数据解析单元接收过程由模式匹配、通信服务、语音模型库、语音播放等模块工作,智能数据解析单元通过通信服务模块从无线通信设备获取到通信文本数据解析后,将文本数据转发给模式匹配模块,模式匹配模块通过将文本数据与语音模型库中的数据做模式匹配,识别出语音数据,并将语音数据传递给语音播放模块,语音播放模块将语音信号从话机传输出去。
根据图6所示,本发明实施例基于语音识别的无线窄带信道话音通信方法包括:智能数据解析单元的语音模型库支持以太网接口导入功能,用户通过模型加注软件与智能数据解析单元通过以太网互联,并选择对应将更新的语音模型槽索引,进行模型加注,实现动态更换语音模型库。
根据图7所示,本发明实施例基于语音识别的无线窄带信道话音通信方法包括:语音模型库阵列由受控的文件阵列组成,阵列中含有模型槽数量,以及每个模型槽名称、所在索引、文件位置信息。在新模型注入时,加注的数据内容为所加注阵列的位置索引和新的模型数据,模型库将原有模型库阵列对应索引处的模型删除,并将新的模型拷贝到对应位置。
Claims (9)
1.一种基于语音识别的无线窄带信道话音通信方法,其特征在于:在通信任务节点用户话机端和无线通信设备端之间,增加智能数据解析单元,用以完成语音和文本的相互转换;为了支持无线通信设备原有常规通信文本和语音识别文本的区别,在通信文本中定义类型字段;智能数据解析单元通过模型加注软件以以太网接口的方式将语音模型加注到所选择的模型槽中,步骤为:
语音识别模型加注软件通过以太网接口将新语音模型加注到智能数据解析单元的语音模型库阵列中;
用户通过话机发起通话,话机将数据传送至智能数据解析单元;
智能数据解析单元将话音数据解析为通信文本,并传给无线通信设备;
无线通信设备将数据通过无线信道传送给目标通信设备;
无线通信设备将从其他通信节点接收到的数据解析提取出文本数据,并转发给本通信节点的智能数据解析单元;
智能数据解析单元收到无线通信设备发送的通信文本后,判断数据类型为语音识别类型的数据将通过语音识别转换为音频,并将音频传送给话机。
2.根据权利要求1所述的一种基于语音识别的无线窄带信道话音通信方法,其特征在于:智能数据解析单元在语音转换为文本后,会将语音文本和语音类型特征值打包组成通信文本发送;智能数据解析单元在接收到通信文本后,将会对通信文本的数据类型字段做判断,非语音识别类型的数据报文将不继续解析。
3.根据权利要求1所述的一种基于语音识别的无线窄带信道话音通信方法,其特征在于:智能数据解析单元在语音转换为文本的过程中,将加载语音模型库的模型数据并对模型中所有模型的样本数据按语音长度进行排序,比所解析语音数据长度小的样本数据差值越小越靠前;在智能数据解析单元模式匹配时,从前至后依次解析。
4.根据权利要求1所述的一种基于语音识别的无线窄带信道话音通信方法,其特征在于:智能数据解析单元在文本转换为语音的过程中,将加载语音模型库的模型数据,并对模型中所有模型的样本数据按文本长度进行排序,比所解析文本数据长度小的样本数据差值越小越靠前;在智能数据解析单元模式匹配时,从前至后依次解析。
5.根据权利要求1所述的一种基于语音识别的无线窄带信道话音通信方法,其特征在于:所诉的模型加注方式中,加注的数据含有所加注阵列的位置索引和新的模型数据;所述的模型加注方式为模型库将原有模型库阵列对应索引处的模型删除,然后将新的模型拷贝到对应位置。
6.根据权利要求1所述的一种基于语音识别的无线窄带信道话音通信方法,其特征在于:所述的语音模型库阵列,为文件型阵列,在语音模型库阵列属性中有保存文件阵列的存储信息。
7.根据权利要求1所述的一种基于语音识别的无线窄带信道话音通信方法,其特征在于:所述的通信文本格式包含数据类型和数据内容两部分;其中数据类型包含语音识别数据类型、常规报文数据类型,通过在数据类型字段的取值不同而判定。
8.根据权利要求1所述的一种基于语音识别的无线窄带信道话音通信方法,其特征在于:在无线通信设备信号受遮挡等情况下,智能数据解析单元的通信服务可以设置为存储一定周期内的文本数据,在无线信号稳定时自动发送存储的数据。
9.根据权利要求1所述的一种基于语音识别的无线窄带信道话音通信方法,其特征在于:智能数据解析单元包含通信服务、语音模型库、模式匹配、语音播放、预处理、特征提取模块。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910558622.9A CN110335598A (zh) | 2019-06-26 | 2019-06-26 | 一种基于语音识别的无线窄带信道话音通信方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910558622.9A CN110335598A (zh) | 2019-06-26 | 2019-06-26 | 一种基于语音识别的无线窄带信道话音通信方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110335598A true CN110335598A (zh) | 2019-10-15 |
Family
ID=68142384
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910558622.9A Pending CN110335598A (zh) | 2019-06-26 | 2019-06-26 | 一种基于语音识别的无线窄带信道话音通信方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110335598A (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1920948A (zh) * | 2005-08-24 | 2007-02-28 | 富士通株式会社 | 语音识别系统及语音处理系统 |
CN101366074A (zh) * | 2005-08-09 | 2009-02-11 | 移动声控有限公司 | 话音控制式无线通信装置系统 |
CN101593516A (zh) * | 2008-05-28 | 2009-12-02 | 国际商业机器公司 | 语音合成的方法和系统 |
CN101996195A (zh) * | 2009-08-28 | 2011-03-30 | 中国移动通信集团公司 | 音频文件中语音信息的搜索方法、装置及设备 |
CN102411583A (zh) * | 2010-09-20 | 2012-04-11 | 阿里巴巴集团控股有限公司 | 一种文本匹配方法及装置 |
CN202617118U (zh) * | 2012-05-25 | 2012-12-19 | 福建英特莱信息技术咨询有限公司 | 具有语音识别功能的北斗卫星通信设备 |
CN106792581A (zh) * | 2016-12-21 | 2017-05-31 | 福建星海通信科技有限公司 | 一种北斗语音通信方法及系统 |
CN107293307A (zh) * | 2016-03-31 | 2017-10-24 | 阿里巴巴集团控股有限公司 | 音频检测方法及装置 |
CN107578770A (zh) * | 2017-08-31 | 2018-01-12 | 百度在线网络技术(北京)有限公司 | 网络电话语音识别方法、装置、计算机设备和存储介质 |
-
2019
- 2019-06-26 CN CN201910558622.9A patent/CN110335598A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101366074A (zh) * | 2005-08-09 | 2009-02-11 | 移动声控有限公司 | 话音控制式无线通信装置系统 |
CN1920948A (zh) * | 2005-08-24 | 2007-02-28 | 富士通株式会社 | 语音识别系统及语音处理系统 |
CN101593516A (zh) * | 2008-05-28 | 2009-12-02 | 国际商业机器公司 | 语音合成的方法和系统 |
CN101996195A (zh) * | 2009-08-28 | 2011-03-30 | 中国移动通信集团公司 | 音频文件中语音信息的搜索方法、装置及设备 |
CN102411583A (zh) * | 2010-09-20 | 2012-04-11 | 阿里巴巴集团控股有限公司 | 一种文本匹配方法及装置 |
CN202617118U (zh) * | 2012-05-25 | 2012-12-19 | 福建英特莱信息技术咨询有限公司 | 具有语音识别功能的北斗卫星通信设备 |
CN107293307A (zh) * | 2016-03-31 | 2017-10-24 | 阿里巴巴集团控股有限公司 | 音频检测方法及装置 |
CN106792581A (zh) * | 2016-12-21 | 2017-05-31 | 福建星海通信科技有限公司 | 一种北斗语音通信方法及系统 |
CN107578770A (zh) * | 2017-08-31 | 2018-01-12 | 百度在线网络技术(北京)有限公司 | 网络电话语音识别方法、装置、计算机设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20040229656A1 (en) | Display processing device, display control method and display processing program | |
CN101681365A (zh) | 用于分布式语音搜索的方法和装置 | |
CN102238466A (zh) | 一种移动增强现实的手机系统 | |
CN104468941A (zh) | 信息显示方法和装置 | |
CN103020125A (zh) | 提供服务资源的方法、输入的方法及服务器、电子设备 | |
CN108271096A (zh) | 一种任务执行方法、装置、智能音箱及存储介质 | |
CN107241681A (zh) | 同声翻译的实现方法和装置 | |
CN109669741A (zh) | 终端应用动态文案的语言切换方法、服务器及存储介质 | |
CN102193949A (zh) | 一种搜索方法、装置和系统 | |
CN106503907A (zh) | 一种业务评估信息确定方法以及服务器 | |
CN102752744A (zh) | 用于移动终端的问题解决方法和装置 | |
CN101860788A (zh) | 一种利用手机通信实现子母机之间定位的方法及其装置 | |
US6618696B1 (en) | Method of testing and simulating communication equipment over multiple transmission channels | |
CN107071728A (zh) | 一种终端定位方法及装置 | |
CN105653531A (zh) | 数据提取方法及装置 | |
CN102868969A (zh) | 具有自动定位功能的移动终端及移动终端自动定位的方法 | |
CN110335598A (zh) | 一种基于语音识别的无线窄带信道话音通信方法 | |
CN101232703A (zh) | 双机定位信息系统与方法 | |
CN104580300A (zh) | 基于云端运算的图形与实景识别的方法和系统 | |
CN202617118U (zh) | 具有语音识别功能的北斗卫星通信设备 | |
CN102014374A (zh) | 一种预设文件的处理方法及移动终端 | |
CN101404673B (zh) | 一种获取综合信息的方法、系统及装置 | |
KR20060101624A (ko) | 위치 정보에 기반한 통역 서비스 제공 이동 통신 단말기 및그 제공 방법 | |
CN100399329C (zh) | 移动智能导航引擎系统 | |
CN102300149A (zh) | 一种基于gps和电子罗盘的目标识别手机系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20191015 |