CN109243424A - 一种一键语音翻译终端及翻译方法 - Google Patents
一种一键语音翻译终端及翻译方法 Download PDFInfo
- Publication number
- CN109243424A CN109243424A CN201810990264.4A CN201810990264A CN109243424A CN 109243424 A CN109243424 A CN 109243424A CN 201810990264 A CN201810990264 A CN 201810990264A CN 109243424 A CN109243424 A CN 109243424A
- Authority
- CN
- China
- Prior art keywords
- module
- information
- voice
- server
- terminal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013519 translation Methods 0.000 title claims abstract description 59
- 238000000034 method Methods 0.000 title claims abstract description 18
- 238000004891 communication Methods 0.000 claims abstract description 28
- 239000012190 activator Substances 0.000 claims abstract description 5
- 230000005540 biological transmission Effects 0.000 claims description 41
- 238000000605 extraction Methods 0.000 claims description 22
- 238000012545 processing Methods 0.000 claims description 17
- 230000015572 biosynthetic process Effects 0.000 claims description 7
- 239000000284 extract Substances 0.000 claims description 7
- 238000003786 synthesis reaction Methods 0.000 claims description 7
- 230000015654 memory Effects 0.000 claims description 6
- 238000012549 training Methods 0.000 claims description 6
- 238000013527 convolutional neural network Methods 0.000 claims description 5
- 230000010365 information processing Effects 0.000 claims description 3
- 230000005055 memory storage Effects 0.000 claims description 3
- 230000003134 recirculating effect Effects 0.000 claims description 3
- 230000003321 amplification Effects 0.000 claims description 2
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 2
- 230000006403 short-term memory Effects 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/005—Language recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/58—Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/16—Speech classification or search using artificial neural networks
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Acoustics & Sound (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
Abstract
本发明公开了一种一键语音翻译终端及翻译方法,一种一键语音翻译终端,包括通过通信协议连接于服务器的机体,其中;所述服务器包括识别引擎、翻译引擎和合成引擎;所述机体包括相互匹配设置的第一壳体和第二壳体,所述第一壳体设有显示屏、麦克风和激活按钮,所述第二壳体设有扬声器、充电槽和SIM卡座。本发明:通过终端接入服务器,具有极高的准确率,可以让用户体验更好更快捷的翻译机服务,另外系统和语音识别模型共用网络,降低了计算资源,同时极短时间的语种判别,减少了多语种语音识别的调用时间,多语言的输出结果也增加了语种识别的并发量,而且能够极大简化翻译器的使用流程,避免误按,促进跨语言交流。
Description
技术领域
本发明涉及语音识别技术领域,具体来说,涉及一种一键语音翻译终端及翻译方法。
背景技术
随着经济的快速发展,对外交流越来越广泛,而对于许多人来说语言不通是对外交流的一大障碍。为了解决上述问题,市场上出现了各种各样的语音翻译设备。语音翻译设备凭借着强大的语言翻译功能,深受广大有语言翻译需求的人士的欢迎,同时也是人们学习外语的好帮手。语音翻译设备可以在双方对话的过程中进行翻译,使得使用不同语言的用户可以无障碍交流。
语音翻译设备的大致翻译流程为:语音翻译设备接收用户的原始语音信息,将语音信息发送给语音翻译引擎,语音翻译引擎将原始语音信息翻译为目标语音信息(从一种语言翻译为另一种语言)并返回给语音翻译设备,语音翻译设备再输出目标语音信息。目前的语音翻译引擎主要包括谷歌引擎、微软引擎、IBM引擎、讯飞引擎、百度引擎、金山引擎等,而每个语音翻译引擎又包括语音识别引擎、文本翻译引擎和语音合成引擎,各个引擎能支持的语言种类、计费标准、处理时延、翻译准确度各不相同。
然而,目前的语音翻译设备只支持单一的引擎,例如只支持百度引擎,通过百度引擎的语音识别引擎、文本翻译引擎和语音合成引擎来实现语音翻译。但百度引擎目前只能够对十余种主流语言进行翻译,而针对某些小语种则无法翻译。某些引擎或许可以翻译小语种,但在使用费用、翻译速度、翻译准确度等方面可能又不尽如人意。由此可见,现有的语音翻译设备, 但是翻译过程需要操作多个按键,较为繁琐,容易影响到交流的顺畅性,复杂的操作也不利于翻译器的推广和使用。
针对相关技术中的问题,目前尚未提出有效的解决方案。
发明内容
针对相关技术中的问题,本发明提出一种一键语音翻译终端及翻译方法,以克服现有相关技术所存在的上述技术问题。
本发明的技术方案是这样实现的:
根据本发明的一个方面,提供了一种一键语音翻译终端。
一种一键语音翻译终端,包括通过通信协议连接于服务器的机体,其中;
所述服务器包括识别引擎、翻译引擎和合成引擎;
所述机体包括相互匹配设置的第一壳体和第二壳体,所述第一壳体设有显示屏、麦克风和激活按钮,所述第二壳体设有扬声器、充电槽和SIM卡座,位于所述第一壳体和所述第二壳体之间设有处理模块、语音提取模块、识别模块、通信模块、电源模块、显示模块、存储模块、播放模块和翻译文本生成模块,所述处理模块包括目标语音选择单元,所述识别模块包括声学特征提取单元,所述通信模块包括SIM传输单元、无线网络传输单元和蓝牙传输单元,其中;
所述识别引擎,用于接收识别机体的源语音特征信息和目标语音信息;
所述翻译引擎,用于接收识别引擎信息,并提取语音特征序列;
所述合成引擎,同于接收语音特征序列并通过预先训练完成的语音建模进行合成目标语音信息传输至机体;
所述处理模块,用于信息处理;
所述语音提取模块,用于连接麦克风提取源语音信息;
所述识别模块,用于接收并识别源语音特征语音信息;
所述通信模块,用于连接服务器进行信息传输;
所述电源模块,用于连接充电槽进行供电;
所述显示模块,用于连接显示屏进行目标语言确定以及显示文本信息;
所述存储模块,用于运行内存存储以及信息存储;
所述播放模块,用于连接扬声器进行播放目标语音;
所述翻译文本生成模块,用于源语音信息翻译文本信息和目标语音翻译文本信息,
所述声学特征提取单元,用于识别源语音信息提取声学特征信息;
所述SIM传输单元,用于SIM通信协议与服务器进行信息传输;
所述无线网络传输单元,用于无线网络通信协议与服务器进行信息传输;
所述蓝牙传输单元,用于蓝牙通信协议与PC端和移动端进行信息传输。
进一步的,所述声学特征提取单元包括性别信息和声纹信息。
进一步的,所述显示屏为LED触摸显示屏。
进一步的,所述合成引擎包括ASR识别模型,所述ASR识别模型包括CNN分类模型、FC分类模型和LSTM分类模型。
根据本发明的另一个方面,提供了一种一键语音翻译方法。
一种一键语音翻译方法,包括以下步骤:
建立网络连接,将终端设备通过网络与服务器连接,其中,包括:终端通过SIM传输协议与服务器连接;终端通过无线网络传输协议与服务器连接;终端通过蓝牙传输协议与PC端或手机端连接,PC端或手机端通过无线网络传输协议与服务器连接;
激活休眠,通过显示屏选择并确定要输出的目标语音;
录入语音,按动按钮通过麦克风输入源语音,源语音通过识别模块确定声学信息并传输至处理模块,处理模块将信息分别通过通信模块传输至服务器和通过翻译文本生成模块以及显示屏,显示源语音的文本信息;
翻译语音,服务器将接收的信息提取语音特征序列,将语音特征序列通过语音建模进行合成目标语音传输至终端;
播放语音,终端将接收的目标语音通过翻译文本生成模块和显示屏以及扬声器进行播放和文本信息显示。
其中,所述语音建模包括预先装配训练完成的自动语音识别模型,所述自动语音识别模型包括深度卷积神经网络分类模型、全连接网络分类模型和长短时记忆循环网络分类模型。
本发明的有益效果:本发明通过终端接入服务器,具有极高的准确率,可以让用户体验更好更快捷的翻译机服务,另外系统和语音识别模型共用网络,降低了计算资源,同时极短时间的语种判别,减少了多语种语音识别的调用时间,多语言的输出结果也增加了语种识别的并发量,而且能够极大简化翻译器的使用流程,避免误按,促进跨语言交流。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明实施例的一种一键语音翻译终端的结构示意图之一;
图2是根据本发明实施例的一种一键语音翻译终端的结构示意图之二;
图3是根据本发明实施例的一种一键语音翻译终端的网络拓扑图;
图4是根据本发明实施例的一种一键语音翻译终端的原理框图;
图5是根据本发明实施例的一种一键语音翻译终端的服务器的原理框图;
图6是根据本发明实施例的一种一键语音翻译方法的流程示意图。
图中:
1、服务器;2、机体;3、识别引擎;4、翻译引擎;5、合成引擎;6、第一壳体;7、第二壳体;8、显示屏;9、麦克风;10、激活按钮;11、扬声器;12、充电槽;13、SIM卡座;14、处理模块;15、语音提取模块;16、识别模块;17、通信模块;18、电源模块;19、显示模块;20、存储模块;21、播放模块;22、翻译文本生成模块;23、目标语音选择单元;24、声学特征提取单元;25、SIM传输单元;26、无线网络传输单元;27、蓝牙传输单元。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本发明保护的范围。
根据本发明的实施例,提供了一种一键语音翻译终端。
如图1-5所示,根据本发明实施例的一键语音翻译终端,包括通过通信协议连接于服务器1的机体2,其中;
所述服务器1包括识别引擎3、翻译引擎4和合成引擎5;
所述机体2包括相互匹配设置的第一壳体6和第二壳体7,所述第一壳体6设有显示屏8、麦克风9和激活按钮10,所述第二壳体7设有扬声器11、充电槽12和SIM卡座13,位于所述第一壳体6和所述第二壳体7之间设有处理模块14、语音提取模块15、识别模块16、通信模块17、电源模块18、显示模块19、存储模块20、播放模块21和翻译文本生成模块22,所述处理模块14包括目标语音选择单元23,所述识别模块16包括声学特征提取单元24,所述通信模块17包括SIM传输单元25、无线网络传输单元26和蓝牙传输单元27,其中;
所述识别引擎3,用于接收识别机体2的源语音特征信息和目标语音信息;
所述翻译引擎4,用于接收识别引擎信息,并提取语音特征序列;
所述合成引擎5,同于接收语音特征序列并通过预先训练完成的语音建模进行合成目标语音信息传输至机体2;
所述处理模块14,用于信息处理;
所述语音提取模块15,用于连接麦克风9提取源语音信息;
所述识别模块16,用于接收并识别源语音特征语音信息;
所述通信模块17,用于连接服务器1进行信息传输;
所述电源模块18,用于连接充电槽12进行供电;
所述显示模块19,用于连接显示屏8进行目标语言确定以及显示文本信息;
所述存储模块20,用于运行内存存储以及信息存储;
所述播放模块21,用于连接扬声器11进行播放目标语音;
所述翻译文本生成模块22,用于源语音信息翻译文本信息和目标语音翻译文本信息,
所述声学特征提取单元24,用于识别源语音信息提取声学特征信息;
所述SIM传输单元25,用于SIM通信协议与服务器1进行信息传输;
所述无线网络传输单元26,用于无线网络通信协议与服务器1进行信息传输;
所述蓝牙传输单元27,用于蓝牙通信协议与PC端和移动端进行信息传输。
在一个实施例中,所述声学特征提取单元24包括性别信息和声纹信息。所述显示屏8为LED触摸显示屏。所述显示屏8为LED触摸显示屏。
根据本发明的实施例,提供了一种一键语音翻译方法。
如图6所示,根据本发明实施例的一键语音翻译方法,包括以下步骤:
S101建立网络连接,将终端设备通过网络与服务器连接,其中,包括:终端通过SIM传输协议与服务器连接;终端通过无线网络传输协议与服务器连接;终端通过蓝牙传输协议与PC端或手机端连接,PC端或手机端通过无线网络传输协议与服务器连接;
S103激活休眠,通过显示屏选择并确定要输出的目标语音;
S105录入语音,按动按钮通过麦克风输入源语音,源语音通过识别模块确定声学信息并传输至处理模块,处理模块将信息分别通过通信模块传输至服务器和通过翻译文本生成模块以及显示屏,显示源语音的文本信息;
S107翻译语音,服务器将接收的信息提取语音特征序列,将语音特征序列通过语音建模进行合成目标语音传输至终端;
S109播放语音,终端将接收的目标语音通过翻译文本生成模块和显示屏以及扬声器进行播放和文本信息显示。
另外,在一个实施例中,所述语音建模包括预先装配训练完成的自动语音识别模型,所述自动语音识别模型包括深度卷积神经网络分类模型、全连接网络分类模型和长短时记忆循环网络分类模型。
综上所述,借助于本发明的上述技术方案,通过终端接入服务器,具有极高的准确率,可以让用户体验更好更快捷的翻译机服务,另外系统和语音识别模型共用网络,降低了计算资源,同时极短时间的语种判别,减少了多语种语音识别的调用时间,多语言的输出结果也增加了语种识别的并发量,而且能够极大简化翻译器的使用流程,避免误按,促进跨语言交流。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (6)
1.一种一键语音翻译终端,其特征在于,包括通过通信协议连接于服务器(1)的机体(2),其中;
所述服务器(1)包括识别引擎(3)、翻译引擎(4)和合成引擎(5);
所述机体(2)包括相互匹配设置的第一壳体(6)和第二壳体(7),所述第一壳体(6)设有显示屏(8)、麦克风(9)和激活按钮(10),所述第二壳体(7)设有扬声器(11)、充电槽(12)和SIM卡座(13),位于所述第一壳体(6)和所述第二壳体(7)之间设有处理模块(14)、语音提取模块(15)、识别模块(16)、通信模块(17)、电源模块(18)、显示模块(19)、存储模块(20)、播放模块(21)和翻译文本生成模块(22),所述处理模块(14)包括目标语音选择单元(23),所述识别模块(16)包括声学特征提取单元(24),所述通信模块(17)包括SIM传输单元(25)、无线网络传输单元(26)和蓝牙传输单元(27),其中;
所述识别引擎(3),用于接收识别机体(2)的源语音特征信息和目标语音信息;
所述翻译引擎(4),用于接收识别引擎信息,并提取语音特征序列;
所述合成引擎(5),同于接收语音特征序列并通过预先训练完成的语音建模进行合成目标语音信息传输至机体(2);
所述处理模块(14),用于信息处理;
所述语音提取模块(15),用于连接麦克风(9)提取源语音信息;
所述识别模块(16),用于接收并识别源语音特征语音信息;
所述通信模块(17),用于连接服务器(1)进行信息传输;
所述电源模块(18),用于连接充电槽(12)进行供电;
所述显示模块(19),用于连接显示屏(8)进行目标语言确定以及显示文本信息;
所述存储模块(20),用于运行内存存储以及信息存储;
所述播放模块(21),用于连接扬声器(11)进行播放目标语音;
所述翻译文本生成模块(22),用于源语音信息翻译文本信息和目标语音翻译文本信息,
所述声学特征提取单元(24),用于识别源语音信息提取声学特征信息;
所述SIM传输单元(25),用于SIM通信协议与服务器(1)进行信息传输;
所述无线网络传输单元(26),用于无线网络通信协议与服务器(1)进行信息传输;
所述蓝牙传输单元(27),用于蓝牙通信协议与PC端和移动端进行信息传输。
2.根据权利要求1所述的一键语音翻译终端,其特征在于,所述声学特征提取单元(24)包括性别信息和声纹信息。
3.根据权利要求1所述的一键语音翻译终端,其特征在于,所述显示屏(8)为LED触摸显示屏。
4.根据权利要求1所述的一键语音翻译终端,其特征在于,所述合成引擎(5)包括ASR识别模型,所述ASR识别模型包括CNN分类模型、FC分类模型和LSTM分类模型。
5.一种一键语音翻译方法,其特征在于,用于权利要求1所述的一键语音翻译终端的翻译方法,包括以下步骤:
建立网络连接,将终端设备通过网络与服务器连接,其中,包括:终端通过SIM传输协议与服务器连接;终端通过无线网络传输协议与服务器连接;终端通过蓝牙传输协议与PC端或手机端连接,PC端或手机端通过无线网络传输协议与服务器连接;
激活休眠,通过显示屏选择并确定要输出的目标语音;
录入语音,按动按钮通过麦克风输入源语音,源语音通过识别模块确定声学信息并传输至处理模块,处理模块将信息分别通过通信模块传输至服务器和通过翻译文本生成模块以及显示屏,显示源语音的文本信息;
翻译语音,服务器将接收的信息提取语音特征序列,将语音特征序列通过语音建模进行合成目标语音传输至终端;
播放语音,终端将接收的目标语音通过翻译文本生成模块和显示屏以及扬声器进行播放和文本信息显示。
6.根据权利要求5所述的一键语音翻译方法,其特征在于,所述语音建模包括预先装配训练完成的自动语音识别模型,所述自动语音识别模型包括深度卷积神经网络分类模型、全连接网络分类模型和长短时记忆循环网络分类模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810990264.4A CN109243424A (zh) | 2018-08-28 | 2018-08-28 | 一种一键语音翻译终端及翻译方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810990264.4A CN109243424A (zh) | 2018-08-28 | 2018-08-28 | 一种一键语音翻译终端及翻译方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109243424A true CN109243424A (zh) | 2019-01-18 |
Family
ID=65068538
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810990264.4A Pending CN109243424A (zh) | 2018-08-28 | 2018-08-28 | 一种一键语音翻译终端及翻译方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109243424A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112201224A (zh) * | 2020-10-09 | 2021-01-08 | 北京分音塔科技有限公司 | 用于即时通话同声翻译的方法、设备及系统 |
CN117808013A (zh) * | 2024-02-29 | 2024-04-02 | 济南幼儿师范高等专科学校 | 一种互动式多语言交流系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100185434A1 (en) * | 2009-01-16 | 2010-07-22 | Sony Ericsson Mobile Communications Ab | Methods, devices, and computer program products for providing real-time language translation capabilities between communication terminals |
CN105824807A (zh) * | 2016-03-16 | 2016-08-03 | 安微省新脉科技发展有限公司 | 一种翻译终端和翻译方法 |
CN106328122A (zh) * | 2016-08-19 | 2017-01-11 | 深圳市唯特视科技有限公司 | 一种利用长短期记忆模型递归神经网络的语音识别方法 |
CN107578775A (zh) * | 2017-09-07 | 2018-01-12 | 四川大学 | 一种基于深度神经网络的多任务语音分类方法 |
US20180203850A1 (en) * | 2017-01-17 | 2018-07-19 | Freefly881 Communications Inc. | Method for Multilingual Translation in Network Voice Communications |
CN108319590A (zh) * | 2018-01-25 | 2018-07-24 | 芜湖应天光电科技有限责任公司 | 一种基于云服务的自适应翻译机 |
-
2018
- 2018-08-28 CN CN201810990264.4A patent/CN109243424A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100185434A1 (en) * | 2009-01-16 | 2010-07-22 | Sony Ericsson Mobile Communications Ab | Methods, devices, and computer program products for providing real-time language translation capabilities between communication terminals |
CN105824807A (zh) * | 2016-03-16 | 2016-08-03 | 安微省新脉科技发展有限公司 | 一种翻译终端和翻译方法 |
CN106328122A (zh) * | 2016-08-19 | 2017-01-11 | 深圳市唯特视科技有限公司 | 一种利用长短期记忆模型递归神经网络的语音识别方法 |
US20180203850A1 (en) * | 2017-01-17 | 2018-07-19 | Freefly881 Communications Inc. | Method for Multilingual Translation in Network Voice Communications |
CN107578775A (zh) * | 2017-09-07 | 2018-01-12 | 四川大学 | 一种基于深度神经网络的多任务语音分类方法 |
CN108319590A (zh) * | 2018-01-25 | 2018-07-24 | 芜湖应天光电科技有限责任公司 | 一种基于云服务的自适应翻译机 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112201224A (zh) * | 2020-10-09 | 2021-01-08 | 北京分音塔科技有限公司 | 用于即时通话同声翻译的方法、设备及系统 |
CN117808013A (zh) * | 2024-02-29 | 2024-04-02 | 济南幼儿师范高等专科学校 | 一种互动式多语言交流系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110288077B (zh) | 一种基于人工智能的合成说话表情的方法和相关装置 | |
CN103915095B (zh) | 语音识别的方法、交互设备、服务器和系统 | |
CN103853703B (zh) | 一种信息处理方法及电子设备 | |
CN110427472A (zh) | 智能客服匹配的方法、装置、终端设备及存储介质 | |
KR20190077088A (ko) | 성문 구축 및 등록 방법 및 그 장치 | |
CN107294837A (zh) | 采用虚拟机器人进行对话交互的方法和系统 | |
CN107134279A (zh) | 一种语音唤醒方法、装置、终端和存储介质 | |
CN107623614A (zh) | 用于推送信息的方法和装置 | |
CN108831439A (zh) | 语音识别方法、装置、设备和系统 | |
CN109949071A (zh) | 基于语音情绪分析的产品推荐方法、装置、设备和介质 | |
CN111294471B (zh) | 一种智能电话应答方法和系统 | |
CN108447471A (zh) | 语音识别方法及语音识别装置 | |
CN104010267A (zh) | 支持基于翻译的通信服务方法和系统和支持该服务的终端 | |
CN106230689A (zh) | 一种语音信息交互的方法、装置及服务器 | |
CN107808007A (zh) | 信息处理方法和装置 | |
CN110119514A (zh) | 信息的即时翻译方法、装置和系统 | |
CN111128175B (zh) | 口语对话管理方法及系统 | |
CN111178081A (zh) | 语义识别的方法、服务器、电子设备及计算机存储介质 | |
CN111833907B (zh) | 一种人机交互方法与终端、计算机可读存储介质 | |
CN111862938A (zh) | 一种智能应答方法与终端、计算机可读存储介质 | |
JP6448950B2 (ja) | 音声対話装置及び電子機器 | |
CN109243424A (zh) | 一种一键语音翻译终端及翻译方法 | |
CN116821290A (zh) | 面向多任务对话的大语言模型训练方法和交互方法 | |
CN113763925B (zh) | 语音识别方法、装置、计算机设备及存储介质 | |
CN114064943A (zh) | 会议管理方法、装置、存储介质及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190118 |