CN112764535A - 一种实现多语种信息交流的系统 - Google Patents
一种实现多语种信息交流的系统 Download PDFInfo
- Publication number
- CN112764535A CN112764535A CN202110026592.4A CN202110026592A CN112764535A CN 112764535 A CN112764535 A CN 112764535A CN 202110026592 A CN202110026592 A CN 202110026592A CN 112764535 A CN112764535 A CN 112764535A
- Authority
- CN
- China
- Prior art keywords
- information
- unit
- module
- character
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013519 translation Methods 0.000 claims abstract description 71
- 238000012545 processing Methods 0.000 claims abstract description 45
- 238000007781 pre-processing Methods 0.000 claims description 37
- 238000000034 method Methods 0.000 claims description 23
- 238000005516 engineering process Methods 0.000 claims description 10
- 238000003672 processing method Methods 0.000 claims description 9
- 238000005457 optimization Methods 0.000 claims description 8
- 238000004891 communication Methods 0.000 claims description 7
- 238000000605 extraction Methods 0.000 claims description 5
- 238000012015 optical character recognition Methods 0.000 claims description 4
- 238000013135 deep learning Methods 0.000 claims description 3
- 230000004927 fusion Effects 0.000 claims description 2
- 230000014616 translation Effects 0.000 description 54
- 230000005236 sound signal Effects 0.000 description 9
- 238000006243 chemical reaction Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 239000013598 vector Substances 0.000 description 5
- 230000007246 mechanism Effects 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- 230000003321 amplification Effects 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000005352 clarification Methods 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/011—Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/58—Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/005—Language recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- General Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Multimedia (AREA)
- Machine Translation (AREA)
Abstract
本发明公开了一种实现多语种信息交流的系统,包括信息采集模块、微处理模块、算法处理模块和输出模块,所述信息采集模块用于数据的录入和数据的输入,所述微处理模块与所述信息采集模块相连接,用于对所述信息采集模块发送的信息进行处理、存储和翻译,所述算法处理模块与所述微处理模块相连接,用于对所述微处理模块发送的翻译结果进行优化,所述输出模块与所述算法处理模块相连接,用于根据需求对所述算法处理模块发送的信息进行输出,本发明提高了文本识别和语音识别的准确率,同时,翻译精准、翻译准确率稳定,并且,采用结合BabelNet增加语义关联的方法减少语义关联度损失和语义偏离的问题,从而使得翻译结果更符合语言习惯。
Description
技术领域
本发明涉及多语种之间信息处理技术领域,尤其涉及一种实现多语种信息交流的系统。
背景技术
随着经济全球化程度的进一步加深,我国和世界各国之间的交流、合作越来越频繁,各国的沟通合作进一步加强。与此同时,各国人民之间交流互通也越发频繁。面对全球互联网和信息技术的飞速发展,通过互联网的全球无障碍信息沟通成为可能。但由于人工成本和多语种翻译、转换技术的局限,对于跨语种的即时交流、技术和平台仍相对匮乏。
因此,提供一种新的技术方案改善上述问题,是本领域技术人员急需解决的问题。
发明内容
有鉴于此,本发明提供一种实现多语种信息交流的系统,以解决上述技术问题。
为实现上述目的,本发明提供如下技术方案:
一种实现多语种信息交流的系统,包括信息采集模块、微处理模块、算法处理模块和输出模块。
在上述的方案中,所述信息采集模块用于获取用户输入的数据。
在上述的方案中,所述微处理模块与所述信息采集模块相连接,用于对所述信息采集模块发送的信息进行处理、存储和翻译。
在上述的方案中,所述算法处理模块与所述微处理模块相连接,用于对所述微处理模块发送的翻译结果进行优化。
在上述的方案中,所述输出模块与所述算法处理模块相连接,用于根据需求对所述算法处理模块发送的信息进行输出。
在上述的方案中,所述信息采集模块包括信息录入单元和信息输入单元,所述信息录入单元包括语音录入模块和字符录入模块,所述语音录入模块用于录入新的语音信息,所述字符录入模块用于录入新的字符信息,所述信息输入单元包括语音输入模块和字符输入模块,所述语音输入模块用于所要翻译语音信息的输入,所述字符输入模块用于所要翻译字符信息的输入,所述字符输入模块的输入方式包括文本输入和图片输入。
在上述的方案中,所述微处理模块包括预处理单元、存储单元、信息识别单元和翻译单元,所述信息识别单元与所述预处理单元和所述存储单元相连接,所述翻译单元与所述信息识别单元和所述存储单元相连接,所述预处理单元用于对所述信息输入单元输入的信息进行优化处理,所述存储单元用于对所述信息录入单元录入的信息进行存储,所述存储单元包括多种语言的语言信息数据库,所述信息识别单元用于对所述语音输入模块输入的语音信息和所述字符输入模块输入的字符信息进行语种识别,所述翻译单元用于将所述信息识别单元发送的信息进行初步翻译。
在上述的方案中,所述预处理单元包括语音预处理模块和字符预处理模块,所述语音预处理模块用于对所述语音输入模块输入的语音采用数字DSP算法进行优化处理,所述字符预处理模块用于对所述字符输入模块输入的字符信息采用模糊字符处理方法进行优化处理,对于采用图片输入的字符信息先采用图像自动识别技术识别出字符区域再采用模糊字符处理方法进行优化处理。
在上述的方案中,所述信息识别单元包括语音信息识别模块和字符信息识别模块,所述语音信息识别模块用于采用端到端语音识别技术对经过所述语音预处理模块的语音信息进行语种识别,所述字符信息识别模块用于采用融合语言模型的光学字符识别方法对经过所述字符预处理模块的字符信息进行语种识别。
在上述的方案中,所述翻译单元采用基于特征性句干提取的机器翻译方法根据所述存储单元中的多种语言的语言信息数据库对所述信息识别单元发送的信息进行初步翻译。
在上述的方案中,所述算法处理模块将所述翻译单元的初步翻译结果结合BabelNet增加语义关联进一步优化,得到最终翻译结果。
在上述的方案中,所述输出模块包括输出方式选择单元、文字转语音单元、语音转文字单元、目标语音输出单元和目标字符输出单元,所述输出方式选择单元用于根据需求选择所述最终翻译结果的输出方式,所述文字转语音单元用于将文字形式的所述最终翻译结果转换为语音形式,所述语音转文字单元用于将语音形式的所述最终翻译结果转换为文字形式,所述目标语音输出单元用于对所述最终翻译结果采用语音播放的方式输出,所述目标字符输出单元用于对所述最终翻译结果采用文本信息的方式输出。
在上述的方案中,所述输出方式选择单元可选择的输出方式包括语音输出、文本信息输出和语音与文本信息同时输出。
在上述的方案中,所述文字转语音单元与所述语音转文字单元均采用深度学习的算法实现文字与语音的转换。
综上所述,本发明的有益效果是:采用数字DSP算法和模糊字符处理方法对原始语音和字符进行处理,提高了文本识别和语音识别的准确率,同时,采用基于特征性句干提取的机器翻译方法翻译精准、翻译准确率稳定,并且,采用结合BabelNet增加语义关联的方法减少语义关联度损失和语义偏离的问题,从而使得翻译结果更符合语言习惯。
附图说明
构成本申请的一部分的附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
图1为本发明实现多语种信息交流的系统的组成示意图。
图2为信息采集模块的组成示意图。
图3为微处理模块的组成示意图。
图4为输出模块的组成示意图。
图5为不同语种转换的步骤图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,下面结合实施方式和附图,对本发明做进一步详细说明。在此,本发明的示意性实施方式及其说明用于解释本发明,但并不作为对本发明的限定。
如图1所示,本发明的一种实现多语种信息交流的系统,包括信息采集模块、微处理模块、算法处理模块和输出模块。
下面结合附图对本发明上述各模块间的连接关系做进一步详细说明。
在本发明上述的方案中,所述信息采集模块用于获取用户输入的数据。
在本发明上述的方案中,所述微处理模块与所述信息采集模块相连接,用于对所述信息采集模块发送的信息进行处理、存储和翻译。
在本发明上述的方案中,所述算法处理模块与所述微处理模块相连接,用于对所述微处理模块发送的翻译结果进行优化。
在本发明上述的方案中,所述输出模块与所述算法处理模块相连接,用于根据需求对所述算法处理模块发送的信息进行输出。
如图2所示,在本发明上述的方案中,所述信息采集模块包括信息录入单元和信息输入单元,所述信息录入单元包括语音录入模块和字符录入模块,所述语音录入模块用于录入新的语音信息,所述字符录入模块用于录入新的字符信息,所述信息输入单元包括语音输入模块和字符输入模块,所述语音输入模块用于所要翻译语音信息的输入,所述字符输入模块用于所要翻译字符信息的输入,所述字符输入模块的输入方式包括文本输入和图片输入。
如图3所示,在本发明上述的方案中,所述微处理模块包括预处理单元、存储单元、信息识别单元和翻译单元,所述信息识别单元与所述预处理单元和所述存储单元相连接,所述翻译单元与所述信息识别单元和所述存储单元相连接,所述预处理单元用于对所述信息输入单元输入的信息进行优化处理,所述存储单元用于对所述信息录入单元录入的信息进行存储,所述存储单元包括多种语言的语言信息数据库,所述信息识别单元用于对所述语音输入模块输入的语音信息和所述字符输入模块输入的字符信息进行语种识别,所述翻译单元用于将所述信息识别单元发送的信息进行初步翻译。
在本发明上述的方案中,所述预处理单元包括语音预处理模块和字符预处理模块,所述语音预处理模块用于对所述语音输入模块输入的语音采用数字DSP算法进行优化处理,通过模拟的音频信号进行采样,实现模数转换,将模拟音频信号转换为数字音频信号,将转换后的数字信号送入DSP数字处理器,DSP数字处理器将可用的数字音频信号转存至数据存储单元做回授声对比使用,另一方面DSP数字处理器将数字音频信号送至下一级数模转换单元进行处理,数模转换单元将数字音频信号转换成模拟音频信号后,再交由后级信号放大单元对模拟音频信号进行放大输出,声音信号输出后会重新被声频采集设备进行采集,当采集到的信号再次到达DSP数字处理器时,DSP数字处理器自动调取数据存储单元中的原音数字信号进行对比,对比相同的频率不再输出,这样切断整个因声音回授而产生的回授啸叫现象;所述字符预处理模块用于对所述字符输入模块输入的字符信息采用模糊字符处理方法进行优化处理,分析所述字符块中字符的笔画线条,并根据所述笔画线条从预先存储的字符集中识别出与所述字符相似度最高的字符作为清晰字符及将所述模糊字符替换为所述清晰字符,对于采用图片输入的字符信息先采用图像自动识别技术识别出字符区域再采用模糊字符处理方法进行优化处理。
在本发明上述的方案中,所述信息识别单元包括语音信息识别模块和字符信息识别模块,所述语音信息识别模块用于采用端到端语音识别技术对经过所述语音预处理模块的语音信息进行语种识别,采用基于Byte建模的方式,实现多语种建模单元的共享,即将不同语种的每个字或者单词均使用多个Byte单元组合,实现不同语种中的声学数据的共性特征的学习,这种方式能够有效的实现不同语种之间的数据共享,提高识别的准确率;所述字符信息识别模块用于采用融合语言模型的光学字符识别方法对经过所述字符预处理模块的字符信息进行语种识别,通过提取待识别文字图片的视觉特征向量对所述视觉特征向量进行预分类得到预分类文本序列,根据所述预分类文本序列提取语义特征向量,根据所述视觉特征向量和语义特征向量对所述待识别的文字图片进行最终分类,得到待识别图片中的字符。
在本发明上述的方案中,所述翻译单元采用基于特征性句干提取的机器翻译方法根据所述存储单元中的多种语言的语言信息数据库对所述信息识别单元发送的信息进行初步翻译,首先,对语言信息数据库的文本进行词性赋码;然后对赋码后的文本进
行线性切分,得到若干序列,生成多词序列集合,接着对切分好的线性序列进行预加工处理得到多词序列;预加工处理包括删除乱码、删除序列内部标点及统计每个序列的数;在多词序列中搜寻具有主谓结构的句干序列;针对上述主谓搭配类别中不包括的谓语省略的情况进行单独处理,在提取主谓结构的过程中,结合各句式中词类的分布特点,对动词和名词在句中的位置进行限定,经过此步骤,提取出结构上符合句干要求的多词序列,具有主谓结构的句干序列包括有主语类型和无主语类型;在多词序列中识别结构满足句干要求的序列,基于内部粘着力、外部边界独立性及篇章分布域在结构满足句干要求的序列中确定特征性句干;基于MIN-MAX归一化算法和局部最大值消重法对特征性句干进行筛选;将筛选所得的特征性句干译为目标语言,记录各特征性句干与其译文即得特征性句干数据库;将句干与特征性句干数据库中的特征性句干比较,如句干与特征性句干数据库中的特征性句干一样,则该特征性句干的译文即为句干译文;如句干与特征性句干数据库中的特征性句干不一致,则分别翻译组成该句干的各短语,后按照目标语言语序组合各短语得到该句干的译文;翻译句干外的词语,再将句干外的词语的译文按照目标语言的语序组合到句干译文中得到译文。
在本发明上述的方案中,所述算法处理模块将所述翻译单元的初步翻译结果BabelNet增加语义关联进一步优化,得到最终翻译结果,首先通过将初步翻译结果翻译结果与词汇本体结合进行扩展并赋予权值,以保证保证语言映射的过程中减少语义损失,所述本体为概念及概念之间关系的规范化、形式化、可共享和明确化的描述,由于本体具有丰富的语义概念关系,可以保证概念之间通过概念链、关系链互相连接,因此可以用来查询扩展,例如WordNet、HowNet、同义词词林、汉语言框架此类语义型词典称为词汇本体,它们和传统的按字母顺序组织词汇信息的词典不同,其更多地从词汇的概念角度出发,将具有相同、相近含义或具有一定关联度的词汇聚集在一起,从单词、句法的层面提取语义信息,并将这些信息以网状形式呈现,使计算机能像人一样的理解和利用其中的信息;其次,将扩展结果结合BabelNet增加语义关联进一步改变权值,词汇带有的权值即可表示为与用户原始输入的相关程度,再将带有权值的词进行整理,BabelNet提供了多种语言的概念和命名实体,并包含了它们之间的丰富的语义关系,在处理语义相关性、多语词义消歧、丰富了信息检索中的语义关联性方面提供了很大帮助。
如图4所示,在本发明上述的方案中,所述输出模块包括输出方式选择单元、文字转语音单元、语音转文字单元、目标语音输出单元和目标字符输出单元,所述输出方式选择单元用于根据需求选择所述最终翻译结果的输出方式,所述文字转语音单元用于将文字形式的所述最终翻译结果转换为语音形式,所述语音转文字单元用于将语音形式的所述最终翻译结果转换为文字形式,所述目标语音输出单元用于对所述最终翻译结果采用语音播放的方式输出,所述目标字符输出单元用于对所述最终翻译结果采用文本信息的方式输出。
在本发明上述的方案中,所述输出方式选择单元可选择的输出方式包括语音输出、文本信息输出和语音与文本信息同时输出。
在本发明上述的方案中,所述文字转语音单元与所述语音转文字单元均采用深度学习的算法实现文字与语音的转换,当需要文字输出时,在所述最终翻译结果为语音信息时,对语音信息进行识别转换为文字信息并利用模糊匹配方法和内部推理机制进行输出,在所述最终翻译结果为文字信息时直接输出;当需要语音输出时,在所述最终翻译结果为文字信息时,文字信息进行识别转换为语音信息并利用模糊匹配方法和内部推理机制进行输出,在所述最终翻译结果为语音信息时直接输出。
在本发明上述的方案中,利用模糊匹配方法和内部推理机制进行输出的过程为:利用预置的声学模型及语言模型对获取的文字信息和语音信息进行识别,得到识别结果;根据识别结果在语言信息数据库中进行检索得到初选条目,对初选条目和识别结果进行字符串模糊匹配,并通过自学习算法对匹配结果进行推理得到最终结果。
如图5所示,本发明所提供的实现多语种信息交流的系统的不同语种转换过程,包括以下步骤:
步骤S1:信息输入,用户通过信息输入单元输入所需要转换的信息;
步骤S2:信息预处理,所述预处理单元通过所述语音预处理模块对信息输入单元输入的语音信息采用数字DSP算法进行优化处理,通过所述字符预处理模块对信息输入单元输入的字符信息采用模糊字符处理方法进行优化处理,对于采用图片输入的字符信息先采用图像自动识别技术识别出字符区域再采用模糊字符处理方法进行优化处理。
步骤S3:信息识别,所述信息识别单元通过所述语音信息识别模块采用端到端语音识别技术对经过所述语音预处理模块的语音信息进行语种识别,通过字符信息识别模块采用融合语言模型的光学字符识别方法对经过所述字符预处理模块的字符信息进行语种识别。
步骤S4:信息翻译,所述翻译单元采用基于特征性句干提取的机器翻译方法根据所述存储单元中的多种语言的语言信息数据库对所述信息识别单元发送的信息进行初步翻译。
步骤S5:算法处理,所述算法处理模块将所述翻译单元的初步翻译结果结合BabelNet增加语义关联进一步优化,得到最终翻译结果。
步骤S6:结果输出,所述输出模块通过所述目标语音输出单元对所述最终翻译结果采用语音播放的方式输出,通过所述目标字符输出单元对所述最终翻译结果采用文本信息的方式输出。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明实施例可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种实现多语种信息交流的系统,其特征在于,包括:信息采集模块、微处理模块、算法处理模块和输出模块;
所述信息采集模块用于获取用户输入的数据;
所述微处理模块与所述信息采集模块相连接,用于对所述信息采集模块发送的信息进行处理、存储和翻译;
所述算法处理模块与所述微处理模块相连接,用于对所述微处理模块发送的翻译结果进行优化;
所述输出模块与所述算法处理模块相连接,用于根据需求对所述算法处理模块发送的信息进行输出。
2.根据权利要求1所述的实现多语种信息交流的系统,其特征在于,所述信息采集模块包括信息录入单元和信息输入单元,所述信息录入单元包括语音录入模块和字符录入模块,所述语音录入模块用于录入新的语音信息,所述字符录入模块用于录入新的字符信息,所述信息输入单元包括语音输入模块和字符输入模块,所述语音输入模块用于所要翻译语音信息的输入,所述字符输入模块用于所要翻译字符信息的输入,所述字符输入模块的输入方式包括文本输入和图片输入。
3.根据权利要求1所述的实现多语种信息交流的系统,其特征在于,所述微处理模块包括预处理单元、存储单元、信息识别单元和翻译单元,所述信息识别单元与所述预处理单元和所述存储单元相连接,所述翻译单元与所述信息识别单元和所述存储单元相连接,所述预处理单元用于对所述信息输入单元输入的信息进行优化处理,所述存储单元用于对所述信息录入单元录入的信息进行存储,所述存储单元包括多种语言的语言信息数据库,所述信息识别单元用于对所述语音输入模块输入的语音信息和所述字符输入模块输入的字符信息进行语种识别,所述翻译单元用于将所述信息识别单元发送的信息进行初步翻译。
4.根据权利要求3所述的实现多语种信息交流的系统,其特征在于,所述预处理单元包括语音预处理模块和字符预处理模块,所述语音预处理模块用于对所述语音输入模块输入的语音采用数字DSP算法进行优化处理,所述字符预处理模块用于对所述字符输入模块输入的字符信息采用模糊字符处理方法进行优化处理,对于采用图片输入的字符信息先采用图像自动识别技术识别出字符区域再采用模糊字符处理方法进行优化处理。
5.根据权利要求3所述的实现多语种信息交流的系统,其特征在于,所述信息识别单元包括语音信息识别模块和字符信息识别模块,所述语音信息识别模块用于采用端到端语音识别技术对经过所述语音预处理模块的语音信息进行语种识别,所述字符信息识别模块用于采用融合语言模型的光学字符识别方法对经过所述字符预处理模块的字符信息进行语种识别。
6.根据权利要求3所述的实现多语种信息交流的系统,其特征在于,所述翻译单元采用基于特征性句干提取的机器翻译方法根据所述存储单元中的多种语言的语言信息数据库对所述信息识别单元发送的信息进行初步翻译。
7.根据权利要求1所述的实现多语种信息交流的系统,其特征在于,所述算法处理模块将所述翻译单元的初步翻译结果结合BabelNet增加语义关联进一步优化,得到最终翻译结果。
8.根据权利要求1所述的实现多语种信息交流的系统,其特征在于,所述输出模块包括输出方式选择单元、文字转语音单元、语音转文字单元、目标语音输出单元和目标字符输出单元,所述输出方式选择单元用于根据需求选择所述最终翻译结果的输出方式,所述文字转语音单元用于将文字形式的所述最终翻译结果转换为语音形式,所述语音转文字单元用于将语音形式的所述最终翻译结果转换为文字形式,所述目标语音输出单元用于对所述最终翻译结果采用语音播放的方式输出,所述目标字符输出单元用于对所述最终翻译结果采用文本信息的方式输出。
9.根据权利要求1所述的实现多语种信息交流的系统,其特征在于,所述输出方式选择单元可选择的输出方式包括语音输出、文本信息输出和语音与文本信息同时输出。
10.根据权利要求1所述的实现多语种信息交流的系统,其特征在于,所述文字转语音单元与所述语音转文字单元均采用深度学习的算法实现文字与语音的转换。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110026592.4A CN112764535A (zh) | 2021-01-08 | 2021-01-08 | 一种实现多语种信息交流的系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110026592.4A CN112764535A (zh) | 2021-01-08 | 2021-01-08 | 一种实现多语种信息交流的系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112764535A true CN112764535A (zh) | 2021-05-07 |
Family
ID=75701141
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110026592.4A Pending CN112764535A (zh) | 2021-01-08 | 2021-01-08 | 一种实现多语种信息交流的系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112764535A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113238949A (zh) * | 2021-05-19 | 2021-08-10 | 北京仁科互动网络技术有限公司 | 一种测试方法、装置、电子设备及存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103020048A (zh) * | 2013-01-08 | 2013-04-03 | 深圳大学 | 一种语言翻译方法及系统 |
CN103970734A (zh) * | 2014-05-21 | 2014-08-06 | 刘业兴 | 一种交互式多语种自动翻译终端及其实现方法 |
CN206293160U (zh) * | 2016-12-14 | 2017-06-30 | 广州嘉茂电子科技有限公司 | 一种基于数字dsp算法的语音处理系统 |
CN107066455A (zh) * | 2017-03-30 | 2017-08-18 | 唐亮 | 一种多语言智能预处理实时统计机器翻译系统 |
CN108319590A (zh) * | 2018-01-25 | 2018-07-24 | 芜湖应天光电科技有限责任公司 | 一种基于云服务的自适应翻译机 |
CN108763229A (zh) * | 2018-05-31 | 2018-11-06 | 东华大学 | 一种基于特征性句干提取的机器翻译方法及装置 |
CN112101111A (zh) * | 2020-08-13 | 2020-12-18 | 吕梁学院 | 一种英语识别翻译方法 |
-
2021
- 2021-01-08 CN CN202110026592.4A patent/CN112764535A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103020048A (zh) * | 2013-01-08 | 2013-04-03 | 深圳大学 | 一种语言翻译方法及系统 |
CN103970734A (zh) * | 2014-05-21 | 2014-08-06 | 刘业兴 | 一种交互式多语种自动翻译终端及其实现方法 |
CN206293160U (zh) * | 2016-12-14 | 2017-06-30 | 广州嘉茂电子科技有限公司 | 一种基于数字dsp算法的语音处理系统 |
CN107066455A (zh) * | 2017-03-30 | 2017-08-18 | 唐亮 | 一种多语言智能预处理实时统计机器翻译系统 |
CN108319590A (zh) * | 2018-01-25 | 2018-07-24 | 芜湖应天光电科技有限责任公司 | 一种基于云服务的自适应翻译机 |
CN108763229A (zh) * | 2018-05-31 | 2018-11-06 | 东华大学 | 一种基于特征性句干提取的机器翻译方法及装置 |
CN112101111A (zh) * | 2020-08-13 | 2020-12-18 | 吕梁学院 | 一种英语识别翻译方法 |
Non-Patent Citations (2)
Title |
---|
于再富等: "融合BabelNet的多语言智能信息检索模型", 《吉林大学学报(信息科学版)》 * |
张会会等: "模糊匹配在机器翻译中的应用初探", 《科技传播》 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113238949A (zh) * | 2021-05-19 | 2021-08-10 | 北京仁科互动网络技术有限公司 | 一种测试方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11132504B1 (en) | Framework for understanding complex natural language queries in a dialog context | |
US8131539B2 (en) | Search-based word segmentation method and device for language without word boundary tag | |
JP2848458B2 (ja) | 言語翻訳システム | |
US6401061B1 (en) | Combinatorial computational technique for transformation phrase text-phrase meaning | |
KR101762866B1 (ko) | 구문 구조 변환 모델과 어휘 변환 모델을 결합한 기계 번역 장치 및 기계 번역 방법 | |
EP0830668B1 (en) | Systems and methods for word recognition | |
WO2018157789A1 (zh) | 一种语音识别的方法、计算机、存储介质以及电子装置 | |
US20020111792A1 (en) | Document storage, retrieval and search systems and methods | |
US8370130B2 (en) | Speech understanding system using an example-based semantic representation pattern | |
JPH03278174A (ja) | 異言語交信用翻訳方法およびシステム | |
KR101266361B1 (ko) | 구조화된 번역 메모리 기반의 자동 번역 시스템 및 자동 번역 방법 | |
WO1999063456A1 (fr) | Dispositif de preparation de regles de conversion du langage, dispositif de conversion du langage et support d'enregistrement de programme | |
JP2000353161A (ja) | 自然言語生成における文体制御方法及び装置 | |
KR20130123037A (ko) | 양방향 자동 통역 및 번역 서비스 제공 장치 및 그 방법 | |
CN113377897B (zh) | 基于深度对抗学习的多语言医疗术语规范标准化系统及方法 | |
KR20070058953A (ko) | 음성 대화 시스템에서 답변 문장 생성 방법 및 장치 | |
CN110991180A (zh) | 一种基于关键词和Word2Vec的命令识别方法 | |
Vinnarasu et al. | Speech to text conversion and summarization for effective understanding and documentation | |
JP3015223B2 (ja) | 特殊共起を処理する電子化辞書装置、及び機械翻訳装置、並びに情報検索装置 | |
CN114817465A (zh) | 一种用于多语言语义理解的实体纠错方法及智能设备 | |
KR101149521B1 (ko) | 도메인 온톨로지를 이용한 음성 인식 방법 및 그 장치 | |
CN110942767B (zh) | 一种asr语言模型识别标注与优化方法及其装置 | |
CN113761903A (zh) | 一种针对海量高噪音口语化短文本的文本筛选方法 | |
CN112764535A (zh) | 一种实现多语种信息交流的系统 | |
CN103164397A (zh) | 汉哈电子辞典及其自动转译汉哈语的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210507 |