CN109686363A - 一种现场会议人工智能同传设备 - Google Patents
一种现场会议人工智能同传设备 Download PDFInfo
- Publication number
- CN109686363A CN109686363A CN201910142081.1A CN201910142081A CN109686363A CN 109686363 A CN109686363 A CN 109686363A CN 201910142081 A CN201910142081 A CN 201910142081A CN 109686363 A CN109686363 A CN 109686363A
- Authority
- CN
- China
- Prior art keywords
- module
- meeting
- languages
- text
- translated
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013473 artificial intelligence Methods 0.000 title claims abstract description 13
- 238000013528 artificial neural network Methods 0.000 claims abstract description 10
- 241000209140 Triticum Species 0.000 claims description 10
- 235000021307 Triticum Nutrition 0.000 claims description 10
- 238000000034 method Methods 0.000 claims description 4
- 238000005266 casting Methods 0.000 claims description 3
- 238000003491 array Methods 0.000 claims description 2
- 230000007812 deficiency Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 210000005036 nerve Anatomy 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/005—Language recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/58—Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L2021/02082—Noise filtering the noise being echo, reverberation of the speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
- G10L2021/02166—Microphone arrays; Beamforming
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Machine Translation (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
本发明公开了一种现场会议人工智能同传设备,其中麦克风阵列可提高各个方向上的拾音能力,让会议桌各个方向说话都能被设备识别;回声消除模块可消除接收语音中的回声,噪声消除模块能够消除接收语音中的各种噪声,提高接收语音的清晰度;声纹识别模块能够通过声纹识别标记是哪个人说话,指明说话者的性别、年龄等特征;ASR语音识别模块能够将用户语音翻译成文字;自动判断语种模块能够将自动判断用户说话的语种,进而每一个人说话时都会翻译成会场各个语种所需要的翻译文字;神经网络翻译模块配合翻译库,给出参会对应国家语种翻译结果的文字,TTS播报模块能够将文字生成对应语种国家人的声音,进而播放出来,显示屏显示最终翻译的文字结果。
Description
技术领域
本发明涉及智能同传翻译设备技术领域,特别是涉及一种现场会议人工智能同传设备。
背景技术
目前市面上逐渐出现了会议翻译机的硬件设备,其集成运用了google、微软等AI人工智能,极大的简化了会议流程,让沟通更加顺畅便捷,相对于人工翻译更加简洁高效,但目前的会议翻译机,一人一个话筒,说A语言的人拿A话筒,说B语言的人拿B话筒,十分不便,且翻译设备还存在种种不足,严重影响了翻译质量,容易对会议造成一定的影响。
发明内容
为了克服现有技术的不足,本发明提供一种现场会议人工智能同传设备,其翻译质量高、能快速同传翻译多国语言文字,并进行同步播报,有利于会议的进行。
为解决上述技术问题,本发明提供如下技术方案:一种现场会议人工智能同传设备,所述设备包括依次连接的麦克风阵列、回声消除模块、噪声消除模块、声纹识别模块、ASR语音识别模块、自动判断语种模块、神经网络翻译模块;所述麦克风阵列为环形麦克风阵列,均匀分布于会议桌外圈,目的是提高各个方向上的拾音能力,让用户在会议桌各个方向说话都能被设备准确识别;所述回声消除模块可消除接收语音中的回声,所述噪声消除模块能够消除接收语音中的各种背景音、背景噪声,提高接收语音的清晰度;所述声纹识别模块能够通过声纹识别标记是哪个人说话,指明说话者的性别、年龄等特征;所述ASR语音识别模块能够将用户语音翻译成文字;所述自动判断语种模块能够将自动判断用户说话的语种,并且标记现场会议有哪几个国家的人,进而每一个人说话时都会翻译成会场各个语种所需要的翻译文字;所述神经网络翻译模块连接有翻译库,所述翻译库内包括各语种专业翻译库,会议开始时切换相应专业翻译库,通过ASR语音识别模块得到文字后,放入神经网络翻译模块得到对应国家语种翻译结果的文字,所述神经网络翻译模块还连接有TTS播报模块和显示器,所述TTS播报模块能够将文字生成对应语种国家人的声音,进而播放出来,所述显示屏显示最终翻译的文字结果。
作为本发明的一种有限技术方案,所述显示屏通过外接接口连接投屏模块,所述投屏模块投影显示最终翻译的文字结果,便于参会人员观看。
作为本发明的一种有限技术方案,所述显示屏通过蓝牙或wifi或HDMI有线或android或Airplay与投屏模块连接,通过多种连接方式的调换,可保证连接顺利,让开会过程实时展现。
作为本发明的一种有限技术方案,所述麦克风阵列为四麦或六麦或八麦等麦克风阵列,可根据参会人数的多少,调整麦克风阵列中麦克风的数量,提高各个方向上的拾音能力。
作为本发明的一种有限技术方案,所述TTS播报模块连接有手动开关,方便手动开关TTS播报模块,若会场需要安静可手动关闭TTS播报模块,通过显示屏呈现最终翻译的文字结果。
与现有技术相比,本发明能达到的有益效果是:
1)本发明能够自动判断语言,一直记录谈话内容,并实时显示在屏幕上,由于能自动判断语言,无需专用语种话筒,会议桌上直接放置麦克风,自由说话,还原开会真实场景;
2)可以实时更换翻译语料库,根据会议性质切换翻译的语料,例如医学翻译语料、电子翻译语料、金融翻译语料,提高会议专业术语的翻译准确度,从而保证翻译质量;
3)可“流式翻译”:一边识别说话者说话,一边显示他说的话,一边立刻显示翻译文字,呈现出来的几乎是说话者吐一个字翻译一个字,并根据上下句实时调整翻译结果;
4)自带声纹识别,不仅会自动判断语种,而且会标记是哪个人说话的话,谁发言的都有详细记录并有对应翻译;
5)自带屏幕,且拥有蓝牙、wifi、HDMI有线、android、Airplay等投屏手段,投放到会议屏幕或电视机上,让开会过程实时展现;
6)拥有环形麦克风阵列,在会场各个角落都能清晰识别说话者声音;
7)拥有回声消除装置、噪声消除装置,在会议封闭环境下,能有效消除会议室回声,从而保证录音效果。
附图说明
图1是本发明的模块结构原理图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
请参照图1所示,一种现场会议人工智能同传设备,设备包括依次连接的麦克风阵列、回声消除模块、噪声消除模块、声纹识别模块、ASR语音识别模块、自动判断语种模块、神经网络翻译模块;麦克风阵列为环形麦克风阵列,均匀分布于会议桌外圈,目的是提高各个方向上的拾音能力,让用户在会议桌各个方向说话都能被设备准确识别;回声消除模块可消除接收语音中的回声,噪声消除模块能够消除接收语音中的各种背景音、背景噪声,提高接收语音的清晰度;声纹识别模块能够通过声纹识别标记是哪个人说话,指明说话者的性别、年龄等特征;ASR语音识别模块能够将用户语音翻译成文字;自动判断语种模块能够将自动判断用户说话的语种,并且标记现场会议有哪几个国家的人,进而每一个人说话时都会翻译成会场各个语种所需要的翻译文字;神经网络翻译模块连接有翻译库,翻译库内包括各语种专业翻译库,会议开始时切换相应专业翻译库,通过ASR语音识别模块得到文字后,放入神经网络翻译模块得到对应国家语种翻译结果的文字,神经网络翻译模块还连接有TTS播报模块和显示器,TTS播报模块能够将文字生成对应语种国家人的声音,进而播放出来,显示屏显示最终翻译的文字结果。
显示屏通过外接接口连接投屏模块,投屏模块投影显示最终翻译的文字结果,便于参会人员观看。
显示屏通过蓝牙或wifi或HDMI有线或android或Airplay与投屏模块连接,通过多种连接方式的调换,可保证连接顺利,让开会过程实时展现。
麦克风阵列为四麦或六麦或八麦等麦克风阵列,可根据参会人数的多少,调整麦克风阵列中麦克风的数量,提高各个方向上的拾音能力。
TTS播报模块连接有手动开关,方便手动开关TTS播报模块,若会场需要安静可手动关闭TTS播报模块,通过显示屏呈现最终翻译的文字结果。
具体的,该装置使用时,会议举办者在会议开始前,在会议机上设置这次会议会有哪几种语言,例如选择中文、英语、法语、日语四种;会议机摆放在会议桌中间,并且会议机投屏到会议屏幕上;会议各人员到达会议室,开始会议,若用户A说中文,B说英语,C说法语,D说日语;A说话时,会议屏幕上记录下A用户说的话,并且下方实时展示将用户A中文翻译成的英语、法语、日语;B说话时,会议屏幕上记录下B用户说的话,并且下方实时展示用户B英文翻译成的中文、法语、日语;依次类推。
本发明的实施方式不限于此,按照本发明的上述实施例内容,利用本领域的常规技术知识和惯用手段,在不脱离本发明上述基本技术思想前提下,以上优选实施例还可以做出其它多种形式的修改、替换或组合,所获得的其它实施例均落在本发明权利保护范围之内。
Claims (5)
1.一种现场会议人工智能同传设备,其特征在于,所述设备包括依次连接的麦克风阵列、回声消除模块、噪声消除模块、声纹识别模块、ASR语音识别模块、自动判断语种模块、神经网络翻译模块;所述麦克风阵列为环形麦克风阵列,均匀分布于会议桌外圈,目的是提高各个方向上的拾音能力,让用户在会议桌各个方向说话都能被设备准确识别;所述回声消除模块可消除接收语音中的回声,所述噪声消除模块能够消除接收语音中的各种背景音、背景噪声,提高接收语音的清晰度;所述声纹识别模块能够通过声纹识别标记是哪个人说话,指明说话者的性别、年龄等特征;所述ASR语音识别模块能够将用户语音翻译成文字;所述自动判断语种模块能够将自动判断用户说话的语种,并且标记现场会议有哪几个国家的人,进而每一个人说话时都会翻译成会场各个语种所需要的翻译文字;所述神经网络翻译模块连接有翻译库,所述翻译库内包括各语种专业翻译库,会议开始时切换相应专业翻译库,通过ASR语音识别模块得到文字后,放入神经网络翻译模块得到对应国家语种翻译结果的文字,所述神经网络翻译模块还连接有TTS播报模块和显示器,所述TTS播报模块能够将文字生成对应语种国家人的声音,进而播放出来,所述显示屏显示最终翻译的文字结果。
2.根据权利要求1所述的一种现场会议人工智能同传设备,其特征在于,所述显示屏通过外接接口连接投屏模块,所述投屏模块投影显示最终翻译的文字结果,便于参会人员观看。
3.根据权利要求2所述的一种现场会议人工智能同传设备,其特征在于,所述显示屏通过蓝牙或wifi或HDMI有线或android或Airplay与投屏模块连接,通过多种连接方式的调换,可保证连接顺利,让开会过程实时展现。
4.根据权利要求1所述的一种现场会议人工智能同传设备,其特征在于,所述麦克风阵列为四麦或六麦或八麦等麦克风阵列,可根据参会人数的多少,调整麦克风阵列中麦克风的数量,提高各个方向上的拾音能力。
5.根据权利要求1所述的一种现场会议人工智能同传设备,其特征在于,所述TTS播报模块连接有手动开关,方便手动开关TTS播报模块,若会场需要安静可手动关闭TTS播报模块,通过显示屏呈现最终翻译的文字结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910142081.1A CN109686363A (zh) | 2019-02-26 | 2019-02-26 | 一种现场会议人工智能同传设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910142081.1A CN109686363A (zh) | 2019-02-26 | 2019-02-26 | 一种现场会议人工智能同传设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109686363A true CN109686363A (zh) | 2019-04-26 |
Family
ID=66197133
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910142081.1A Pending CN109686363A (zh) | 2019-02-26 | 2019-02-26 | 一种现场会议人工智能同传设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109686363A (zh) |
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110083847A (zh) * | 2019-05-10 | 2019-08-02 | 中译语通科技股份有限公司 | 一种实现同步翻译的会议系统 |
CN110191244A (zh) * | 2019-05-17 | 2019-08-30 | 四川易简天下科技股份有限公司 | 远程互动方法及系统 |
CN110189745A (zh) * | 2019-05-10 | 2019-08-30 | 中译语通科技股份有限公司 | 一种智能会议系统与移动设备的链接方法 |
CN110491385A (zh) * | 2019-07-24 | 2019-11-22 | 深圳市合言信息科技有限公司 | 同声传译方法、装置、电子装置及计算机可读存储介质 |
CN110516265A (zh) * | 2019-08-31 | 2019-11-29 | 青岛谷力互联科技有限公司 | 一种基于智能语音的单一识别实时翻译系统 |
CN110648553A (zh) * | 2019-09-26 | 2020-01-03 | 北京声智科技有限公司 | 一种站点提醒方法、电子设备及计算机可读存储介质 |
CN110677406A (zh) * | 2019-09-26 | 2020-01-10 | 上海译牛科技有限公司 | 基于网络的同声传译方法及系统 |
CN110708428A (zh) * | 2019-11-12 | 2020-01-17 | 杨勇 | 一种电话自动应答和显示的智能系统 |
CN111161710A (zh) * | 2019-12-11 | 2020-05-15 | Oppo广东移动通信有限公司 | 同声传译方法、装置、电子设备及存储介质 |
CN111883123A (zh) * | 2020-07-23 | 2020-11-03 | 平安科技(深圳)有限公司 | 基于ai识别的会议纪要生成方法、装置、设备及介质 |
CN112232092A (zh) * | 2020-10-15 | 2021-01-15 | 安徽听见科技有限公司 | 具备机器与人工协同模式的同声传译方法以及系统 |
CN112241632A (zh) * | 2020-10-14 | 2021-01-19 | 国家电网有限公司 | 一种基于语音ai智能会议系统及其实现方法 |
CN113505612A (zh) * | 2021-07-23 | 2021-10-15 | 平安科技(深圳)有限公司 | 多人对话语音实时翻译方法、装置、设备及存储介质 |
WO2021208531A1 (zh) * | 2020-04-16 | 2021-10-21 | 北京搜狗科技发展有限公司 | 一种语音处理方法、装置和电子设备 |
CN116343751A (zh) * | 2023-05-29 | 2023-06-27 | 深圳市泰为软件开发有限公司 | 基于语音翻译的音频分析方法及装置 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05334353A (ja) * | 1992-06-02 | 1993-12-17 | A T R Jido Honyaku Denwa Kenkyusho:Kk | 音声翻訳通信方式 |
FR2852438A1 (fr) * | 2003-03-13 | 2004-09-17 | France Telecom | Systeme de traduction pour audioconference multilingue |
US20100158207A1 (en) * | 2005-09-01 | 2010-06-24 | Vishal Dhawan | System and method for verifying the identity of a user by voiceprint analysis |
US20110213607A1 (en) * | 2010-02-26 | 2011-09-01 | Sharp Kabushiki Kaisha | Conference system, information processor, conference supporting method and information processing method |
WO2014173370A1 (zh) * | 2013-08-22 | 2014-10-30 | 中兴通讯股份有限公司 | 会议纪要的提取方法及装置 |
JP2016218995A (ja) * | 2015-05-25 | 2016-12-22 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 機械翻訳方法、機械翻訳装置及びプログラム |
CN106486125A (zh) * | 2016-09-29 | 2017-03-08 | 安徽声讯信息技术有限公司 | 一种基于语音识别技术的同声传译系统 |
CN107133222A (zh) * | 2017-04-17 | 2017-09-05 | 中译语通科技(北京)有限公司 | 一种基于异质架构的实时语言转换装置及转换方法 |
CN108538284A (zh) * | 2017-03-06 | 2018-09-14 | 北京搜狗科技发展有限公司 | 同声翻译结果的展现方法及装置、同声翻译方法及装置 |
CN108763231A (zh) * | 2018-06-12 | 2018-11-06 | 深圳市合言信息科技有限公司 | 一种多国语言同声传译的聊天室实现方法 |
CN109036416A (zh) * | 2018-07-02 | 2018-12-18 | 腾讯科技(深圳)有限公司 | 同声传译方法和系统、存储介质及电子装置 |
-
2019
- 2019-02-26 CN CN201910142081.1A patent/CN109686363A/zh active Pending
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05334353A (ja) * | 1992-06-02 | 1993-12-17 | A T R Jido Honyaku Denwa Kenkyusho:Kk | 音声翻訳通信方式 |
FR2852438A1 (fr) * | 2003-03-13 | 2004-09-17 | France Telecom | Systeme de traduction pour audioconference multilingue |
US20100158207A1 (en) * | 2005-09-01 | 2010-06-24 | Vishal Dhawan | System and method for verifying the identity of a user by voiceprint analysis |
US20110213607A1 (en) * | 2010-02-26 | 2011-09-01 | Sharp Kabushiki Kaisha | Conference system, information processor, conference supporting method and information processing method |
WO2014173370A1 (zh) * | 2013-08-22 | 2014-10-30 | 中兴通讯股份有限公司 | 会议纪要的提取方法及装置 |
JP2016218995A (ja) * | 2015-05-25 | 2016-12-22 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 機械翻訳方法、機械翻訳装置及びプログラム |
CN106486125A (zh) * | 2016-09-29 | 2017-03-08 | 安徽声讯信息技术有限公司 | 一种基于语音识别技术的同声传译系统 |
CN108538284A (zh) * | 2017-03-06 | 2018-09-14 | 北京搜狗科技发展有限公司 | 同声翻译结果的展现方法及装置、同声翻译方法及装置 |
CN107133222A (zh) * | 2017-04-17 | 2017-09-05 | 中译语通科技(北京)有限公司 | 一种基于异质架构的实时语言转换装置及转换方法 |
CN108763231A (zh) * | 2018-06-12 | 2018-11-06 | 深圳市合言信息科技有限公司 | 一种多国语言同声传译的聊天室实现方法 |
CN109036416A (zh) * | 2018-07-02 | 2018-12-18 | 腾讯科技(深圳)有限公司 | 同声传译方法和系统、存储介质及电子装置 |
Cited By (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110083847A (zh) * | 2019-05-10 | 2019-08-02 | 中译语通科技股份有限公司 | 一种实现同步翻译的会议系统 |
CN110189745A (zh) * | 2019-05-10 | 2019-08-30 | 中译语通科技股份有限公司 | 一种智能会议系统与移动设备的链接方法 |
CN110191244A (zh) * | 2019-05-17 | 2019-08-30 | 四川易简天下科技股份有限公司 | 远程互动方法及系统 |
CN110191244B (zh) * | 2019-05-17 | 2021-08-31 | 四川易简天下科技股份有限公司 | 远程互动方法及系统 |
CN110491385A (zh) * | 2019-07-24 | 2019-11-22 | 深圳市合言信息科技有限公司 | 同声传译方法、装置、电子装置及计算机可读存储介质 |
CN110516265A (zh) * | 2019-08-31 | 2019-11-29 | 青岛谷力互联科技有限公司 | 一种基于智能语音的单一识别实时翻译系统 |
CN110648553B (zh) * | 2019-09-26 | 2021-05-28 | 北京声智科技有限公司 | 一种站点提醒方法、电子设备及计算机可读存储介质 |
CN110677406A (zh) * | 2019-09-26 | 2020-01-10 | 上海译牛科技有限公司 | 基于网络的同声传译方法及系统 |
CN110648553A (zh) * | 2019-09-26 | 2020-01-03 | 北京声智科技有限公司 | 一种站点提醒方法、电子设备及计算机可读存储介质 |
CN110708428A (zh) * | 2019-11-12 | 2020-01-17 | 杨勇 | 一种电话自动应答和显示的智能系统 |
CN111161710A (zh) * | 2019-12-11 | 2020-05-15 | Oppo广东移动通信有限公司 | 同声传译方法、装置、电子设备及存储介质 |
WO2021208531A1 (zh) * | 2020-04-16 | 2021-10-21 | 北京搜狗科技发展有限公司 | 一种语音处理方法、装置和电子设备 |
CN111883123A (zh) * | 2020-07-23 | 2020-11-03 | 平安科技(深圳)有限公司 | 基于ai识别的会议纪要生成方法、装置、设备及介质 |
CN111883123B (zh) * | 2020-07-23 | 2024-05-03 | 平安科技(深圳)有限公司 | 基于ai识别的会议纪要生成方法、装置、设备及介质 |
CN112241632A (zh) * | 2020-10-14 | 2021-01-19 | 国家电网有限公司 | 一种基于语音ai智能会议系统及其实现方法 |
CN112232092A (zh) * | 2020-10-15 | 2021-01-15 | 安徽听见科技有限公司 | 具备机器与人工协同模式的同声传译方法以及系统 |
CN113505612A (zh) * | 2021-07-23 | 2021-10-15 | 平安科技(深圳)有限公司 | 多人对话语音实时翻译方法、装置、设备及存储介质 |
CN116343751A (zh) * | 2023-05-29 | 2023-06-27 | 深圳市泰为软件开发有限公司 | 基于语音翻译的音频分析方法及装置 |
CN116343751B (zh) * | 2023-05-29 | 2023-08-11 | 深圳市泰为软件开发有限公司 | 基于语音翻译的音频分析方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109686363A (zh) | 一种现场会议人工智能同传设备 | |
CN111128126B (zh) | 多语种智能语音对话的方法及系统 | |
Krauss et al. | The communicative value of conversational hand gesture | |
Cooke et al. | Spectral and temporal changes to speech produced in the presence of energetic and informational maskers | |
Nakamura et al. | Speaking-aid systems using GMM-based voice conversion for electrolaryngeal speech | |
Wu et al. | Prosodic focus in Hong Kong Cantonese without post-focus compression | |
US20080059200A1 (en) | Multi-Lingual Telephonic Service | |
JP2005513619A (ja) | リアルタイム翻訳機および多数の口語言語のリアルタイム翻訳を行う方法 | |
CN108133632A (zh) | 英语听力的训练方法及系统 | |
JP2000207170A (ja) | 情報処理装置および情報処理方法 | |
Liao et al. | Formosa speech recognition challenge 2020 and taiwanese across taiwan corpus | |
CN111739536A (zh) | 一种音频处理的方法和装置 | |
Lidestam et al. | Visual phonemic ambiguity and speechreading | |
CN109616116B (zh) | 通话系统及其通话方法 | |
Gimeno-Gómez et al. | Analysis of Visual Features for Continuous Lipreading in Spanish | |
de Gelder et al. | Inter-language differences in the McGurk effects for Dutch and Cantonese listeners | |
Zekveld et al. | The influence of age, hearing, and working memory on the speech comprehension benefit derived from an automatic speech recognition system | |
Gambi et al. | The role of prosody and gaze in turn-end anticipation | |
Davis et al. | Is speech produced in noise more distinct and/or consistent | |
Dohen et al. | Co-production of speech and pointing gestures in clear and perturbed interactive tasks: Multimodal designation strategies | |
KR20140079677A (ko) | 언어 데이터 및 원어민의 발음 데이터를 이용한 연음 학습장치 및 방법 | |
Kabir et al. | A romanian corpus for speech perception and automatic speech recognition | |
Mandal et al. | Bilingual phonology in dichotic perception: A case study of Malayalam and English voicing | |
US20240154833A1 (en) | Meeting inputs | |
Xu et al. | Prosodic focus with post-focus compression in Lan-yin Mandarin |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |