CN101388731B - 一种低速率等效语音水声通信技术 - Google Patents

一种低速率等效语音水声通信技术 Download PDF

Info

Publication number
CN101388731B
CN101388731B CN 200710030283 CN200710030283A CN101388731B CN 101388731 B CN101388731 B CN 101388731B CN 200710030283 CN200710030283 CN 200710030283 CN 200710030283 A CN200710030283 A CN 200710030283A CN 101388731 B CN101388731 B CN 101388731B
Authority
CN
China
Prior art keywords
entry
word
code
message
storehouse
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN 200710030283
Other languages
English (en)
Other versions
CN101388731A (zh
Inventor
刘林泉
李宏伟
吴波
尚超
于平
刘百峰
周志强
刘松海
Original Assignee
刘林泉
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 刘林泉 filed Critical 刘林泉
Priority to CN 200710030283 priority Critical patent/CN101388731B/zh
Publication of CN101388731A publication Critical patent/CN101388731A/zh
Application granted granted Critical
Publication of CN101388731B publication Critical patent/CN101388731B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

一种低速率等效语音水声通信技术,先将语音通过语音识别转换成报文,通过转换词条库和信息代码转换匹配算法将报文转换成简短的词条代码串,每个词条代码和多媒体信息数据库中与该词条的多媒体语音记录一一对应,通过水声通信设备将该词条代码串发送到水声信道,收发双方具有相同的转换词条库和多媒体信息数据库,接收端将收到的词条代码串解码成相应的文字并播放出其语音等信息。本发明可显著降低水声报文及语音通信的传输速率要求,接收端又可实时清晰地播放出包括报文和语音甚至图像的信息,既可显著降低水声通信系统的设计技术难度,又可提高系统的可靠性和通信保密性。

Description

一种低速率等效语音水声通信技术
技术领域
本发明涉及属于水声通信技术领域,特别是一种低速率等效语音水声技术。
背景技术
水下声信道是一种复杂的时变、空变、频变的随机多途传输信道,其带宽严重受限、传播损失大、环境噪声高、多途效应严重、信道带宽窄、可适用的载波频率低、传输时延扩展大、信号起伏衰落严重等等,使得有线通信或在空中无线电通信领域很容易实现的语音通信技术,在水声通信领域实现起来非常的困难。
目前,国内外研究者对水声语音通信的研究主要还是集中在将语音信号经A/D采样后,通过源编码压缩算法去除冗余信息,再通过信道编码传输。为保证接收端还原的语音具有一定的清晰度,其传输速率始终难于降到很低。就目前具有通信质量的中、低码率语音编码器而言,16kbps和8kbps的技术已经标准化和产品化,4~8kbps是标准化制定和实用产品竞争的热点,近年来,国际上的许多研究机构已把“1.2kbps速率以下的语音压缩编码”作为未来几年的重点研究课题。
对于水声信道这种低频窄带、衰落及多途效应严重的信道,要保证远程清晰的语音指挥通信,尤其是对水下高速运动中的潜航器进行远程语音通信是很困难的。目前国内外水声通信领域的研究者始终未能有效地解决语音通信质量和通信距离之间的矛盾,按传统的语音通信技术,剥除对音色的要求,要达到基本可听懂语意的语音通信质量,其数据传输速率都要求达到几百bps以上,因此其通信距离难于提高。
申请号为200410039406.7的发明专利公开了一种在电话上实现语音编码通信及常用语分类编码的通信方法,其优点是便于简单拨号就可发送预先编制好的一句或一小段语音,缺点是不能满足任意编制通信信息的语音通信要求;申请号为94100577.1的发明专利公开了一种用汉语拼音代码映射词库的文字输入编码和查找索引方法,实现了代码输入字词内码输出,申请号为200610057552.1的发明专利公开了一种用拨号输入代码向被叫方进行路况等信息查询的方法,申请号为200510001914.0的发明专利公开了一种多语种语音交换装置,通过语音识别系统可将中文语音输入转换成其它语种的语音输出,申请号为02114751.5的发明专利公开了一种通过输入统一编制的代码查询全球旅游景点多媒体信息的方法,输入端输入根据全球旅游信息树状编码方案编制的信息代码,信息服务器返回相应景点的多媒体信息,申请号为02127005.8的发明专利公开了一种用于中文文本处理的中文分词方法,申请号为01123418.0的发明专利公开了一种基于大规模自然语音音库的动态汉语语音合成技术。
上述这些技术都有其各自的优点,但其不足是;1、均未能有效地解决大压缩比的信息编码问题。2、均未能解决低速率语音通信,特别是适用于水声信道的等效语音通信的问题。3、均未能解决文字及其语音用简短的代码串实现等效同时传输的问题。4、均未能解决进行水声通信的双方用语音或文字输入,对方却能收听到文字及其语音信息的问题。
发明内容
本发明的主要目的是提供一种可用很低的数据传输速率等效地实现语音通信的水声通信体制和实现该通信体制的水声通信系统的基本结构。通过建立转换词条库和多媒体信息数据库,并采用语音识别设备将通信语音信息经语音识别转换成对应文字组成的报文,通过转换词条库和信息代码转换匹配算法将该报文切分成最少数量的构成单元,每个构成单元对应转换词条库中的一个词条代码,各词条依其先后次序构成词条代码串;发送端用低速稳健的远程水声通信设备将该词条代码串发送到水声信道,接收端具有和发射端相同的转换词条库和多媒体信息数据库,收到该词条代码串后,根据代码格式分割出一个一个的词条代码,并一一对应地从转换词条库和多媒体信息数据库中取出词条内码及其对应的语音或图形符号,连接还原成通信报文,或由多媒体播放器播放出其语音等信息。
本发明的又一目的是提供一种基于转换词条库的信息代码转换技术。从报文开头的第一个字开始,扫描读入第一个字的机内码,从转换词条库的首字表内找到该字,并建立链表指针指向以该字开头的次级链表。依次读入下一个字的内码,并在能与首字构成双字搭配的次级链表内查找是否存在该字,如果不存在,则取出首字表中对应该字的词条代码,并将其下一个字作为首字重新进行查找匹配;如果存在该字,则将链表指针指向以这两个字开头的再下级链表,再读入报文的下一个字,直至读入的第N+1个字不在由前N个字构成的下级链表内,取出与第N个字对应链表中的词条代码就作为该N字词条的词条代码,第N+1个字又作为首字继续进行匹配,直至报文结束。这样就可将整个报文按转换成简短的代码串。
本发明的再一目的是提供一种通过多媒体信息数据库实现等效语音水声通信转换技术。收发双方设置有相同的转换词条库和多媒体信息数据库,通过建立多媒体信息数据库中的记录与词条代码的一一对应关系,接收端收到词条代码串后,根据代码传输的帧格式分割出一个一个的词条代码,并从多媒体信息数据库中取出与词条代码一一对应的语音或图形符号,并由多媒体信息播放器播放出其语音等信息。
为达到上述目的,本发明的技术方案是该低速率等效语音水声通信技术,包括转换词条库、多媒体信息数据库、信息采集及语音识别设备、信息代码转换匹配算法、显控及信息编辑设备、水声通信设备、多媒体信息播放器,其通信过程如下:
1)建立转换词条库和多媒体信息数据库,转换词条库包含字、词、术语、短语、语句片段、常用语句、图像及符号等,它们统称为词条,每个词条对应一个词条代码,多媒体信息数据库中的记录与转换词条库中的词条的语音或图形符号一一对应,它们都对应一个相同的词条代码;
2)通过语音识别设备将通信语音信息识别转换成对应文字组成的报文,或显控及信息编辑设备直接编辑通信报文,通过转换词条库和信息代码转换匹配算法将该报文切分成最少数量的构成单元,每个构成单元对应转换词条库中的一个词条,每个词条对应一个词条代码,各词条依其先后次序构成词条代码串;
3)发送端用水声通信设备将该词条代码串发送到水声信道,接收端具有相同的转换词条库和多媒体信息数据库,收到该词条代码串后,根据代码格式分割出一个一个的词条代码,并一一对应地从转换词条库和多媒体信息数据库中取出词条内码及其对应的语音或图形符号,根据需要由显控及信息编辑设备连接还原成通信报文,或由多媒体信息播放器播放出其语音等信息。
所述转换词条库是其词条可以是汉语、英语、日语、德语、法语、俄语等语种中的词句;不仅包含通用的字、词、词组和短语,还包含指挥通信常用或专用的术语、语句片断和常用语句等;其词条可采用多级链表结构,将多个字或词链接成一个词条,每个词条对应一个词条代码和词条内码;对于汉语词条中各字的机内码可用GB2312、GB18030内码表示,也可用BIG-5、Unicode内码表示,还可以用其它形式的内码表示,包括多级汉字及某些图形符号;对于由多个字母组成词语种,如英语、法语、俄语,是以多字母组成的词或可独立表意的字母和符号组为基本编码单元;各语种可以独立编码转换词条库,也可以统一编码形成通用的转换词条库。
所述转换词条库中的词条,词的结构可描述为由若干个叶结点、子结点和根结点构成的多叉树结构;每棵多叉树对应词库中的一个多级链表;多叉树的每个结点都对应一个字,结点的内码可用该字的机内码表示;每个结点还对应一个词条代码和词条内码,该词条代码是从根结点到本结点的路径上的若干个字构成的词句,根据其在通信过程中出现的频率高低进行统计编码求得的变长码,该词条内码可用从根结点到本结点的路径上的若干个字的机内码的顺序组合表示。
所述多级链表是首先构建一个包含所需字及符号的字表,每个能以其为首构成词、术语、短语、语句片段、甚至常用语句的字均有一个对应的下级链表,表内包含全部能与其一起构成词句的下一个字的机内码和对应节点的词条代码以及其再下一级链表的信息;以此类推,每个能与前N个字构成词句的第N+1个字也有一个对应的再下级链表,表内包含全部能与这前N+1个字一起构成词句的第N+2个字的机内码和从首字到本级结点字构成的多字词的词条代码,如果还有再下一级的链表则还包括其再下一级链表的信息,如果没有再下一级的链表了,则在其对应下级链表的链表地址或链表索引处给出词条结束标志。
所述多媒体信息数据库是多媒体信息数据库中的记录与转换词条库中的词条一一对应;每个记录至少包含词条代码字段、词条内码字段、词条语音或图形符号的流媒体字段;或者每个记录至少包含词条代码字段、词条内码的链接字段、词条语音或图形符号的流媒体的链接字段;词条内码的链接字段存放词条内码的存储地址信息或词条内码的索引信息,词条语音或图形符号的流媒体的链接字段记录词条的语音或图形符号的流媒体的存储地址信息或该词条的语音或图形符号文件的索引信息。
所述信息代码转换匹配算法是从报文开头的第一个字开始,扫描读入第一个字的机内码,从转换词条库的首字表内找到该字,并建立链表指针指向以该字开头的次级链表。依次读入下一个字的内码,并在能与首字构成双字搭配的次级链表内查找是否存在该字,如果不存在,则取出首字表中对应该字的词条代码,并将其下一个字作为首字重新进行查找匹配;如果存在该字,则将链表指针指向以这两个字开头的再下级链表,再读入报文的下一个字,直至读入的第N+1个字不在由前N个字构成的下级链表内,取出与第N个字对应链表中的词条代码就作为该N字词条的词条代码,第N+1个字又作为首字继续进行匹配,直至报文结束。信息代码转换匹配算法主要包括下列步骤:
(1)设通信报文字符串Q=U0,U1,…,Un,U0,…,Un表示通信报文的第0到第n个字,其对应内码M=M0,M1,…,Mn,字串Qi=Ui,…,Uj,0≤i≤n,i≤j≤n,Qi∈Q且Qi∈ZHCTK,它是通信报文字符串Q的子字符串,也是能在转换词条库ZHCTK中匹配到的最长字串,其对应的词条代码为QMi,相关度函数Ri=int GetRel(Qi,ZHCTK),即Ri=Qi中构成语句片段的字数;
(2)定义报文指针pi指向报文中的第i字Ui,即Pi→Ui,读取其内码为Mi,(0≤i≤n),SZNMB为首字内码表,Mi∈SZNMB表示第i个字Ui的内码Mi存在于首字内码表SZNMB内;链表指针Li指向与字Ui对应的下级链表L(Ui),即Li→L(Ui);
(3)首字索引,将报文指针pi指向报文的第一个字U0,并读取其内码M0和与其对应的词条代码QM0,并将链表指针L1指向与字U0对应的下级链表L(U0),即Li→L(U0),i=i+1,使指针指向下一个字;
(4)次字索引,将报文指针pi指向报文的下一个字Ui,读取其内码Mi,并判断:若Mi∈L(U0),则将链表指针Li指向与字Ui对应的下级链表L(Ui),即Li→L(Ui);若Mi
Figure 2007100302834_2
L(U0),则读取与U0对应的词条代码QM0作为该单字词的编码输出,并将Ui作为下一个编码单元的首字;
(5)若i≥n,则转步骤(7);否则i=i+1,将报文指针pi指向报文的下一个字Ui,读取其内码Mi,并判断:若Mi∈L(Ui-1),则将链表指针Li指向与字Ui对应的下级链表L(Ui),即Li→L(Ui);若Mi L(Ui-1),则读取与Ui-1对应的词条代码QMi-1作为该字串的编码输出,并将Ui作为下一个编码单元的首字;
(6)若i<j,则转步骤(5);否则i=i+1,读取与Uj对应的词条代码QMj作为该单元词条的编码输出,并将Ui作为下一个编码单元的首字,若i<n,则转步骤(5):
(7)读取与Ui对应的词条代码QMi作为该单元词条的编码输出;
通过上述信息匹配和代码转换,将通信报文字符串Q=U0,U1,…,Un转换成简短的词条代码串QM=QM0,QM1,…,QMk,0≤k≤n,且每个词条代码QMi均对应一个多媒体信息数据库中的一个记录,该记录包含字串Qi=Ui,…,Uj中各个字的内码及其语音流媒体的链接信息等。
所述语句片段是由若干个字、词或词组甚至是短句构成,是一种比词或词组的长度大且能在句子中常出现,可表达一定信息的语句构成单元,是语言表达中若干个字和词的常用搭配,并可被编制成转换词条库中的词条,对应一个简短的词条代码。
所述词条代码是它是与转换词条库中的词条一一对应的可变码长的多位二进制编码,其编码长度是根据该词条在整个转换词条库中按其在通信过程中出现概率的大小排序,出现概率越大的词条对应越短的编码位数的词条代码,不常出现的词条对应长的编码位数的词条代码。
所述等效语音是用存储在多媒体信息数据库中的词条的经人工录音得到的语音取代说话者的语音,也可直接用语音合成技术得到报文的合成语音去取代说话者的语音,等效地实现用语音表达所需表达的通信语言信息。若采用语音合成技术播报通信报文的合成语音信息,则在多媒体信息数据库中不必存储各词条的语音多媒体流信息,而是通过通用的语音合成软件直接将报文中的文字播放出其合成语音。接收端可一边接收词条代码一边还原成报文,并直接播放对应词条的语音,也可将通信报文接收完整后再整篇播放报文的语音。
本发明的有益效果是:可显著降低水声报文及语音通信的传输速率要求,接收端又可实时清晰地播放出包括报文和语音甚至图像的信息,既可显著降低水声通信系统的设计技术难度,又可提高系统的可靠性和通信保密性。可用低传输速率的通信设备等效地实现语音通信功能,特别适用于水声信道这种低频窄带、衰落及多途效应严重的信道,进行远程和清晰的语音通信,而且系统结构简单,通信方便且稳定可靠。既可适用于水下蛙人之间,蛙人与水面船之间,水下潜航器之间,水面船与水下潜航器之间进行远程语音通信。
附图说明
图1是本发明等效语音水声通信系统基本结构示意图
图2是转换词条库的多级链表结构示意图
图3是词条构词法中的多叉树结构示意图
图4是信息帧格式示意图
图5是以“一”字开头的词群的多叉树结构示意图
图6是以“英”字开头的词群的多叉树结构示意图
图7是以“中”字开头的词群的多叉树结构示意图
具体实施方式
如图1所示,本等效语音水声通信系统主要由转换词条库、多媒体信息数据库、信息采集及语音识别设备、信息代码转换匹配算法、显控及信息编辑设备、水声通信设备、多媒体信息播放器等构成,其通信方法是:
首先,通过收录相关词典中的词汇,并收录相关短语和术语甚至常用语句,结合词频统计分词等方法加入新词汇,建立包含字、词、术语、短语、语句片段、常用语句、图像及符号等的转换词条库。采用人工录音或语音合成的办法,建立与转换词条库中的每个词条相对应的语音等信息的多媒体信息数据库。收发双方均配置有相同的转换词条库和多媒体信息数据库。
然后,通过语音识别设备将通信语音信息识别转换成对应文字组成的报文,或用显控及信息编辑设备直接编辑通信报文。通过转换词条库和信息代码转换匹配算法将该报文切分成最少数量的构成单元,每个构成单元对应转换词条库中的一个词条,每个词条对应一个词条代码,各词条依其先后次序构成词条代码串。
最后,发送端用水声通信设备将该词条代码串发送到水声信道,发射端和接收端具有相同的转换词条库和多媒体信息数据库,接收端收到该词条代码串后,根据代码格式分割出一个一个的词条代码,并一一对应地从转换词条库和多媒体信息数据库中取出词条内码及其对应的语音或图形符号,根据需要由显控及信息编辑设备连接还原成通信报文,或由多媒体信息播放器播放出其语音等信息。
所述转换词条库的词条可以是汉语、英语、日语、德语、法语、俄语等语种中的词句。转换词条库不仅包含通用的字、词、词组和短语,还包含指挥通信常用或专用的术语、语句片断和常用语句等。其词条可采用多级链表结构,如图2所示,将多个字或词链接成一个词条,每个词条对应一个词条代码和词条内码;对于汉语词条中各字的机内码可用GB2312、GBK、GB18030、BIG-5、BIG-5E内码表示,  还可以用Unicode、ISO 10646的内码表示,包括多级汉字及某些图形符号;对于由多个字母组成词语种,如英语、法语、俄语,是以多字母组成的词或可独立表意的字母和符号组为基本编码单元;各语种可以独立编码转换词条库,也可以统一编码形成通用的转换词条库。
转换词条库中的词条可描述为由若干个叶结点、子结点和根结点构成的多叉树结构,如图2所示。每个结点都对应一个字,结点的内码可用该字的机内码表示;每个结点还对应一个词条代码和词条内码,该词条代码是从根结点到本结点的路径上的若干个字构成的词句,根据其在通信过程中出现的频率高低进行统计编码求得的变长码,该词条内码可用从根结点到本结点的路径上的若干个字的机内码的顺序组合表示。每个词条是以其首字开头的词群中的词之一,其首字登录在转换词条库的首字表中。
词条在词条库中的存储方式可表示为多级链表结构,就是首先构建一个字表,每个能以其为首构成词、术语、短语、语句片段、甚至常用语句的字均有一个对应的下级链表,表内包含全部能与其一起构成词句的下一个字的机内码和对应节点的词条代码以及其再下一级链表的信息;以此类推,每个能与前N个字构成词句的第N+1个字也有一个对应的再下级链表,表内包含全部能与这前N+1个字一起构成词句的第N+2个字的机内码,也包括从本词条的首字到本级结点字构成的多字词的词条代码,如果还有再下一级的链表则还包括其再下一级链表的信息,如果没有再下一级的链表了,则在其对应下级链表的链表地址或链表索引处给出词条结束标志。
多媒体信息数据库是用于构建和存储转换词条库中的各词条的词条内码和语音或图形符号的,多媒体信息数据库中的记录与转换词条库中的词条一一对应;每个记录至少包含词条代码字段、词条内码字段、词条语音或图形符号的流媒体字段;或者每个记录至少包含词条代码字段、词条内码的链接字段、词条语音或图形符号的流媒体的链接字段;词条内码的链接字段存放词条内码的存储地址信息或词条内码的索引信息,词条语音或图形符号的流媒体的链接字段记录词条的语音或图形符号的流媒体的存储地址信息或该词条的语音或图形符号文件的索引信息。
信息代码转换匹配算法采用逐字扫描查表匹配技术,就是从报文开头的第一个字开始,扫描读入第一个字的机内码,从转换词条库的首字表内找到该字,并建立链表指针指向以该字开头的次级链表。依次读入下一个字的内码,并在能与首字构成双字搭配的次级链表内查找是否存在该字,如果不存在,则取出首字表中对应该字的词条代码,并将其下一个字作为首字重新进行查找匹配;如果存在该字,则将链表指针指向以这两个字开头的再下级链表,再读入报文的下一个字,直至读入的第N+1个字不在由前N个字构成的下级链表内,取出与第N个字对应链表中的词条代码就作为该N字词条的词条代码,第N+1个字又作为首字继续进行匹配,直至报文结束。匹配算法主要包括下列步骤:
(1)设通信报文字符串Q=U0,U1,…,Un,U0,…,Un表示通信报文的第0到第n个字,其对应内码M=M0,M1,…,Mn,字串Qi=Ui,…,Uj,0≤i≤n,i≤j≤n,Qi∈Q且Qi∈ZHCTK,它是通信报文字符串Q的子字符串,也是能在转换词条库ZHCTK中匹配到的最长字串,其对应的词条代码为QMi,相关度函数Ri=int GetRel(Qi,ZHCTK),即Ri=Qi中构成语句片段的字数;
(2)定义报文指针pi指向报文中的第i字Ui,即Pi→Ui,读取其内码为Mi,(0≤i≤n),SZNMB为首字内码表,Mi∈SZNMB表示第i个字Ui的内码Mi存在于首字内码表SZNMB内;链表指针Li指向与字Ui对应的下级链表L(Ui),即Li→L(Ui);
(3)首字索引,将报文指针pi指向报文的第一个字U0,并读取其内码M0和与其对应的词条代码QM0,并将链表指针Li指向与字U0对应的下级链表L(U0),即Li→L(U0),i=i+1,使指针指向下一个字;
(4)次字索引,将报文指针pi指向报文的下一个字Ui,读取其内码Mi,并判断:若Mi∈L(U0),则将链表指针Li指向与字Ui对应的下级链表L(Ui),即Li→L(Ui);若Mi
Figure 2007100302834_4
L(U0),则读取与U0对应的词条代码QM0作为该单字词的编码输出,并将Ui作为下一个编码单元的首字;
(5)若i≥n,则转步骤(7);否则i=i+1,将报文指针pi指向报文的下一个字Ui,读取其内码Mi,并判断:若Mi∈L(Ui-1),则将链表指针Li指向与字Ui对应的下级链表L(Ui),即Li→L(Ui);若Mi
Figure 2007100302834_5
L(Ui-1),则读取与Ui-1对应的词条代码QMi-1作为该字串的编码输出,并将Ui作为下一个编码单元的首字;
(6)若i<j,则转步骤(5);否则i=i+1,读取与Uj对应的词条代码QMj作为该单元词条的编码输出,并将Ui作为下一个编码单元的首字,若i<n,则转步骤(5);
(7)读取与Ui对应的词条代码QMi作为该单元词条的编码输出;
通过上述信息匹配和代码转换,将通信报文字符串Q=U0,U1,…,Un转换成简短的词条代码串QM=QM0,QM1,…,QMk,0≤k≤n,且每个词条代码QMi均对应一个多媒体信息数据库中的一个记录,该记录包含字串Qi=Ui,…,Uj中各个字的内码及其语音流媒体的链接信息等。
所述语句片段就是由若干个字、词或词组甚至是短句构成,是一种比词或词组的长度大且能在句子中常出现,可表达一定信息的语句构成单元,是语言表达中若干个字和词的常用搭配,并可被编制成转换词条库中的词条,对应一个简短的词条代码。比如将指挥口令:“各站位注意!请报告三十分钟准备情况”、“各站位注意!请报告十分钟准备情况”、“各站位注意!请报告工作情况”等,这里的“各站位注意!请报告”由于在实际的水声指挥通信中会经常用到,就可把它作为一个常用的语句片段,给予其编制一个用16位二进制数表示的代码,比如:C8D6H,其内码就用该语句片段中各个字的GB2312内码的组合表示。
所述词条代码是用多位二进制数表示的编码,它与转换词条库中的词条一一对应,其编码的长度是根据该词条在通信过程中出现的概率的大小确定的。
通信过程中,为便于区分所传输的是词条代码还是数据,可采用至少包含若干标志位和若干信息位的信息帧结构,如图4所示。标志位用于标识后续的若干信息位携带的是词条代码还是数据,以及词条代码和数据位的长度。数据位的长度分为短数据、中长数据、长数据和特长数据。词条代码的长度分为短代码、中短代码、中长代码、长代码和特长代码。为便于数据的压缩传输,通常可将数据转换成多位二进制数表示的数值,并根据数据的数值大小对应地给其分配数据位的长度。
应用举例:发送语音报文“中国人民解放军是一支英勇善战的队伍,改革开放后中国人民生活水平得到很大提高。”其通信过程为:
假设:在转换词条库中收录了下列词条及其对应的词条代码,多媒体信息数据库中也一一对应地存储有各词条的语音信息:
中国人民解放军——E8D6H,
是——FA6H,
一支——E6A6H
英勇善战的——E4A6H
队伍——E386H
改革开放后——D37B6H
中国人民生活水平——D1F08H
得到——E576H
很大提高——EA7BH
,——F16H
。——F3CH
其中:各词条代码的第一个字符是数据帧的标识位,E表示后面携带的是词条代码,长度为12位二进制数,F表示后面携带的是词条代码,长度8位二进制数,D表示后面携带的是词条代码,长度16位二进制数;H表示用十六进制数表示。
首先,通过语音识别系统将上述语音报文转换成文字报文,或用显控或信息编辑设备直接编辑上述报文,通过信息代码转换匹配算法,将上述报文转换成如下词条代码串:E8D6 FA6 E6A6 E4A6 E386 F16 D37B6 D1F08 E576 EA7B F3C,一共43×4=172bits。
然后,发射端只需将上述172bits的词条代码发送到水声信道,接收端收到上述172bits的词条代码串后,按其信息传输帧格式即可切分出一个一个的词条代码。
最后,由于收发双方均有相同的转换词条库和多媒体信息数据库,接收方根据收到的词条代码,一一对应地从多媒体信息数据库中取出各词条的内码和语音信息,即可还原成上述报文并清晰地播放出上述报文的语音信息。或者收到各词条代码后,先将其还原成文字,再采用通用的语音合成软件直接将报文中的文字播放出其合成语音。接收端可一边接收词条代码一边还原成报文,并直接播放对应词条的语音,也可将通信报文接收完整后再整篇播放报文的语音。

Claims (11)

1.一种低速率等效语音水声通信方法,包括转换词条库、多媒体信息数据库、信息采集及语音识别设备、信息代码转换匹配算法、显控及信息编辑设备、水声通信设备、多媒体信息播放器,其特征是通信过程如下: 
1)建立转换词条库和多媒体信息数据库,转换词条库包含字、词、术语、短语、语句片段、常用语句、图像及符号,它们统称为词条,每个词条对应一个词条代码,多媒体信息数据库中的记录与转换词条库中的词条的语音或图形符号一一对应,它们都对应一个相同的词条代码; 
2)通过语音识别设备将通信语音信息识别转换成对应文字组成的报文,或显控及信息编辑设备直接编辑通信报文,通过转换词条库和信息代码转换匹配算法将该报文切分成最少数量的构成单元,每个构成单元对应转换词条库中的一个词条,每个词条对应一个词条代码,依其先后次序构成词条代码串; 
3)发送端用水声通信设备将该词条代码串发送到水声信道,收发双方具有相同的转换词条库和多媒体信息数据库,接收端收到该词条代码串后,根据代码格式分割出一个一个的词条代码,并一一对应地从转换词条库或多媒体信息数据库中取出词条内码及其对应的语音或图形符号,根据需要由显控及信息编辑设备连接还原成通信报文,或由多媒体信息播放器播放出其语音信息。 
2.根据权利要求1所述低速率等效语音水声通信方法,其特征在于:所述转换词条库是其词条是汉语、英语、日语、德语、法语、俄语语种中的词句;不仅包含通用的字、词、词组和短语,还包含指挥通信常用或专用的术语、语句片断和常用语句;其词条采用多级链表结构,将多个字或词链接成一个词条,每个词条对应一个词条代码和词条内码;对于汉语词条中各字的机内码用GB2312、GB18030内码表示,或用BIG-5、Unicode内码表示,包括多级汉字及图形符号;对于由多个字母组成词的语种,是以多字母组成的词或独立表意的字母和符号组为基本编码单元;各语种采用独立编码转换词条库,或采用统一编码形成通用的转换词条库。 
3.根据权利要求2所述低速率等效语音水声通信方法,其特征在于:所述转换词条库中的词条,词的结构描述为由若干个叶结点、子结点和根结点构成的多叉树结构,它对应以根结点上的字开头的一群词句;每棵多叉树对应词库中的一个多级链表;多叉树的每个结点都对应一个字,结点的内码用该字的机内码表示;每个结点还对应一个词条代码和词条内码,该词条代码是从根结点到本结点的路径上的若干个字构成的词句,根据其在通信过程中出现频率的高低进行统计编码求得的变长码,该词条内码用从根结点到本结点的路径上的若干个字的机内码的顺序组合表示。
4.根据权利要求2或3所述低速率等效语音水声通信方法,其特征在于:所述多级链表是首先构建一个包含所需字及符号的字表,每个能以其为首构成词、术语、短语、语句片段、或常用语句的字均有一个对应的下级链表,表内包含全部能与其一起构成词句的下一个字的机内码和对应节点的词条代码以及其再下一级链表的信息;以此类推,每个能与前N个字构成词句的第N+1个字也有一个对应的再下级链表,表内包含全部能与这前N+1个字一起构成词句的第N+2个字的机内码和从首字到本级结点字构成的多字词的词条代码,如果还有再下一级的链表则还包括其再下一级链表的信息,如果没有再下一级的链表了,则在其对应下级链表的链表地址或链表索引处给出词条结束标志。
5.根据权利要求1所述低速率等效语音水声通信方法,其特征在于:所述多媒体信息数据库是多媒体信息数据库中的记录与转换词条库中的词条一一对应;每个记录至少包含词条代码字段、词条内码字段、词条语音或图形符号的流媒体字段;或者每个记录至少包含词条代码字段、词条内码的链接字段、词条语音或图形符号的流媒体的链接字段;词条内码的链接字段存放词条内码的存储地址信息或词条内码的索引信息,词条语音或图形符号的流媒体的链接字段记录词条的语音或图形符号的流媒体的存储地址信息或该词条的语音或图形符号的流媒体的索引信息。
6.根据权利要求1所述低速率等效语音水声通信方法,其特征在于:所述信息代码转换匹配算法是从报文开头的第一个字开始,扫描读入第一个字的机内码,从转换词条库的首字表内找到该字,并建立链表指针指向以该字开头的一 群词的次级链表;依次读入报文下一个字的内码,并在能与首字构成双字搭配的次级链表内查找是否存在该字,如果不存在,则取出首字表中对应该字的词条代码,并将其下一个字作为首字重新进行查找匹配;如果存在该字,则将链表指针指向以这两个字开头的再下级链表,再读入报文的下一个字,直至读入的第N+1个字不在由前N个字构成的下级链表内,取出与第N个字对应链表中的词条代码就作为该N字词条的词条代码,报文的第N+1个字又作为首字继续进行匹配,直至报文结束;信息代码转换匹配过程主要包括下列步骤:
(1)设通信报文字符串Q=U0,U1,…,Un,U0,…,Un表示通信报文的第0到第n个字,其对应内码M=M0,M1,…,Mn,字串Qi=Ui,…,Uj,0≤i≤n,i≤j≤n,Qi∈Q且Qi∈ZHCTK,它是通信报文字符串Q的子字符串,也是能在转换词条库ZHCTK中匹配到的最长字串,其对应的词条代码为QMi,相关度函数Ri=int GetRel(Qi,ZHCTK),即Ri=Qi中构成语句片段的字数;
(2)定义报文指针pi指向报文中的第i字Ui,即Pi→Ui,读取其内码为Mi,(0≤i≤n),SZNMB为首字内码表,Mi∈SZNMB表示第i个字Ui的内码Mi存在于首字内码表SZNMB内;链表指针Li指向与字Ui对应的下级链表L(Ui),即Li→L(Ui);
(3)首字索引,将报文指针pi指向报文的第一个字U0,并读取其内码M0和与其对应的词条代码QM0,并将链表指针Li指向与字U0对应的下级链表L(U0),即Li→L(U0),i=i+1,使指针指向下一个字;
(4)次字索引,将报文指针pi指向报文的下一个字U1,读取其内码M1,并判断:若M1∈L(U0),则将链表指针Li指向与字U1对应的下级链表L(U1),即Li→L(U1);若 
Figure FSB00000896870600031
则读取与U0对应的词条代码QM0作为该单字词的编码输出,并将U1作为下一个编码单元的首字;
(5)若i≥n,则转步骤(7);否则i=i+1,将报文指针pi指向报文的下一个字Ui,读取其内码Mi,并判断:若Mi∈L(Ui-1),则将链表指针Li指向与字Ui对应的下级链表L(Ui),即Li→L(Ui);若 
Figure FSB00000896870600032
则读取与Ui-1对应的词条代码QMi-1作为该字串的编码输出,并将Ui作为下一个编码单元的首字;
(6)若i<j,则转步骤(5);否则i=i+1,读取与Uj对应的词条代码QMj作 为单元词条的编码输出,并将Ui作为下一个编码单元的首字,若i<n,则转步骤(5);
(7)读取与Ui对应的词条代码QMi作为该单元词条的编码输出;
通过上述信息代码转换匹配算法,将通信报文字符串Q=U0,U1,…,Un转换成简短的词条代码串QM=QM0,QM1,…,QMk,0≤k≤n,且每个词条代码QMi均对应一个多媒体信息数据库中的一个记录,该记录包含字串Qi=Ui,…,Uj中各个字的内码及其语音流媒体的链接信息。
7.根据权利要求1或2所述低速率等效语音水声通信方法,其特征在于:所述语句片段是由若干个字、词或词组或短句构成,是一种比词或词组的长度大且能在句子中常出现,可表达一定信息的语句构成单元,是语言表达中若干个字和词的常用搭配,并可被编制成转换词条库中的词条,每个语句片段对应一个简短的词条代码。
8.根据权利要求1、2、3、5或6所述低速率等效语音水声通信方法,其特征在于;所述词条代码是与转换词条库中的词条一一对应的可变码长的多位二进制编码,其编码长度是根据该词条在整个转换词条库中按其在通信过程中出现概率的大小排序,出现概率越大的词条对应越短的编码位数的词条代码,不常出现的词条对应长的编码位数的词条代码;每个词条代码均包含表示代码属性及其代码长度的标志位。
9.根据权利要求4所述低速率等效语音水声通信方法,其特征在于:所述词条代码是与转换词条库中的词条一一对应的可变码长的多位二进制编码,其编码长度是根据该词条在整个转换词条库中按其在通信过程中出现概率的大小排序,出现概率越大的词条对应越短的编码位数的词条代码,不常出现的词条对应长的编码位数的词条代码;每个词条代码均包含表示代码属性及其代码长度的标志位。
10.根据权利要求7所述低速率等效语音水声通信方法,其特征在于:所述词条代码是与转换词条库中的词条一一对应的可变码长的多位二进制编码,其编码长度是根据该词条在整个转换词条库中按其在通信过程中出现概率的大小排 序,出现概率越大的词条对应越短的编码位数的词条代码,不常出现的词条对应长的编码位数的词条代码;每个词条代码均包含表示代码属性及其代码长度的标志位。
11.根据权利要求7所述低速率等效语音水声通信方法,其特征在于:所述等效语音是用存储在多媒体信息数据库中的词条经人工录音得到的语音取代说话者的语音,或直接用语音合成技术得到报文的合成语音去取代说话者的语音,等效地实现用语音表达所需表达的通信语言信息;若采用语音合成技术播报通信报文的合成语音信息,则在多媒体信息数据库中不必存储各词条的语音多媒体流信息,而是通过通用的语音合成软件直接将报文中的文字播放出其合成语音;接收端一边接收词条代码一边还原成报文,并直接播放对应词条的语音,或将通信报文接收完整后再整篇播放报文的语音。 
CN 200710030283 2007-09-14 2007-09-14 一种低速率等效语音水声通信技术 Expired - Fee Related CN101388731B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 200710030283 CN101388731B (zh) 2007-09-14 2007-09-14 一种低速率等效语音水声通信技术

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 200710030283 CN101388731B (zh) 2007-09-14 2007-09-14 一种低速率等效语音水声通信技术

Publications (2)

Publication Number Publication Date
CN101388731A CN101388731A (zh) 2009-03-18
CN101388731B true CN101388731B (zh) 2013-07-10

Family

ID=40477931

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 200710030283 Expired - Fee Related CN101388731B (zh) 2007-09-14 2007-09-14 一种低速率等效语音水声通信技术

Country Status (1)

Country Link
CN (1) CN101388731B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102693726B (zh) * 2012-05-25 2014-06-04 福建英特莱信息技术咨询有限公司 具有语音识别功能的北斗卫星通信设备
CN105302852A (zh) * 2015-09-17 2016-02-03 成都雅致奢品网络科技有限公司 一种语音与图案个性化关联的方法
US9648472B1 (en) 2016-03-16 2017-05-09 International Business Machines Corporation Voicemail transmission utilizing signals associated with radio band frequencies
CN109982111B (zh) * 2017-12-28 2020-05-22 贵州白山云科技股份有限公司 基于直播网络系统的文本内容传输优化方法、装置
CN111260889B (zh) * 2020-02-27 2021-11-30 厦门大学 一种用于潜水员水下作业的安全监控管理装置
CN113395116A (zh) * 2021-05-28 2021-09-14 西北工业大学 一种基于语义压缩的水声语音数字传输方法
CN117496953B (zh) * 2023-12-29 2024-03-12 山东贝宁电子科技开发有限公司 一种基于语音增强技术的蛙人语音处理方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1101439A (zh) * 1994-01-26 1995-04-12 郭军 面向词的中文文字处理输入装置
CN1592161A (zh) * 2003-08-29 2005-03-09 中国科学院声学研究所 一种M-ary扩频通信方法
WO2006134331A1 (en) * 2005-06-13 2006-12-21 Wireless Fibre Systems Ltd Underwater communications system

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1101439A (zh) * 1994-01-26 1995-04-12 郭军 面向词的中文文字处理输入装置
CN1592161A (zh) * 2003-08-29 2005-03-09 中国科学院声学研究所 一种M-ary扩频通信方法
WO2006134331A1 (en) * 2005-06-13 2006-12-21 Wireless Fibre Systems Ltd Underwater communications system

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
蔡惠智,刘云涛,蔡慧,邓红超,王永丰.第八讲 水声通信及其研究进展.《物理》.2006,全文. *

Also Published As

Publication number Publication date
CN101388731A (zh) 2009-03-18

Similar Documents

Publication Publication Date Title
CN101388731B (zh) 一种低速率等效语音水声通信技术
US4814746A (en) Data compression method
US20030023424A1 (en) Multimedia dictionary
CN107561564B (zh) 一种北斗卫星信息传输的压缩实现方法
JP2531508B2 (ja) デ―タ列圧縮の方法
CN115840799A (zh) 一种基于深度学习的知识产权综合管理系统
CN116610265B (zh) 一种商务信息咨询系统的数据存储方法
CN104081701A (zh) 光网络系统的通信方法、系统及装置
CN111666575B (zh) 基于词元编码的文本无载体信息隐藏方法
CN105630755B (zh) 北斗卫星短报文扩大信息量传输的信源编解码方法及装置
JPS6356726B2 (zh)
CN103701470B (zh) 一种流智能预测差异压缩算法及相应的控制装置
RU2450344C2 (ru) Устройство и метод формирования потока данных и устройство и метод считывания потока данных
CN116032292B (zh) 一种基于翻译文件的大数据高效存储方法
CN110851564B (zh) 一种语音数据处理方法和相关装置
CN115758415A (zh) 一种基于汉字部件组合的文本无载体信息隐藏方法
EP2712089A1 (en) Method for compressing texts and associated equipment
CN101005640A (zh) 文本信息转换成流媒体或多媒体进而被终端接收的方法
CN103905743A (zh) 汉语自动实时标注汉语字幕音像录播方法
CN100382551C (zh) 一种对通信系统消息进行编解码的方法
JP3291451B2 (ja) データ処理システム及び処理方法
Rincy et al. Preprocessed text compression method for Malayalam text files
CN113938745B (zh) 一种视频生成方法、终端及存储介质
CN213718159U (zh) 一种用于具备tts语音播放功能的收费车道系统
JP3887425B2 (ja) 表示歌詞データ受信装置及び表示歌詞データ伝送方式

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20130710

Termination date: 20150914