CN109686363A

CN109686363A - 一种现场会议人工智能同传设备

Info

Publication number: CN109686363A
Application number: CN201910142081.1A
Authority: CN
Inventors: 张岩; 代同杰; 熊涛
Original assignee: Shenzhen Heyan Mdt Infotech Ltd
Current assignee: Shenzhen Heyan Mdt Infotech Ltd
Priority date: 2019-02-26
Filing date: 2019-02-26
Publication date: 2019-04-26

Abstract

本发明公开了一种现场会议人工智能同传设备，其中麦克风阵列可提高各个方向上的拾音能力，让会议桌各个方向说话都能被设备识别；回声消除模块可消除接收语音中的回声，噪声消除模块能够消除接收语音中的各种噪声，提高接收语音的清晰度；声纹识别模块能够通过声纹识别标记是哪个人说话，指明说话者的性别、年龄等特征；ASR语音识别模块能够将用户语音翻译成文字；自动判断语种模块能够将自动判断用户说话的语种，进而每一个人说话时都会翻译成会场各个语种所需要的翻译文字；神经网络翻译模块配合翻译库，给出参会对应国家语种翻译结果的文字，TTS播报模块能够将文字生成对应语种国家人的声音，进而播放出来，显示屏显示最终翻译的文字结果。

Description

一种现场会议人工智能同传设备

技术领域

本发明涉及智能同传翻译设备技术领域，特别是涉及一种现场会议人工智能同传设备。

背景技术

目前市面上逐渐出现了会议翻译机的硬件设备，其集成运用了google、微软等AI人工智能，极大的简化了会议流程，让沟通更加顺畅便捷，相对于人工翻译更加简洁高效，但目前的会议翻译机，一人一个话筒，说A语言的人拿A话筒，说B语言的人拿B话筒，十分不便，且翻译设备还存在种种不足，严重影响了翻译质量，容易对会议造成一定的影响。

发明内容

为了克服现有技术的不足，本发明提供一种现场会议人工智能同传设备，其翻译质量高、能快速同传翻译多国语言文字，并进行同步播报，有利于会议的进行。

为解决上述技术问题，本发明提供如下技术方案：一种现场会议人工智能同传设备，所述设备包括依次连接的麦克风阵列、回声消除模块、噪声消除模块、声纹识别模块、ASR语音识别模块、自动判断语种模块、神经网络翻译模块；所述麦克风阵列为环形麦克风阵列，均匀分布于会议桌外圈，目的是提高各个方向上的拾音能力，让用户在会议桌各个方向说话都能被设备准确识别；所述回声消除模块可消除接收语音中的回声，所述噪声消除模块能够消除接收语音中的各种背景音、背景噪声，提高接收语音的清晰度；所述声纹识别模块能够通过声纹识别标记是哪个人说话，指明说话者的性别、年龄等特征；所述ASR语音识别模块能够将用户语音翻译成文字；所述自动判断语种模块能够将自动判断用户说话的语种，并且标记现场会议有哪几个国家的人，进而每一个人说话时都会翻译成会场各个语种所需要的翻译文字；所述神经网络翻译模块连接有翻译库，所述翻译库内包括各语种专业翻译库，会议开始时切换相应专业翻译库，通过ASR语音识别模块得到文字后，放入神经网络翻译模块得到对应国家语种翻译结果的文字，所述神经网络翻译模块还连接有TTS播报模块和显示器，所述TTS播报模块能够将文字生成对应语种国家人的声音，进而播放出来，所述显示屏显示最终翻译的文字结果。

作为本发明的一种有限技术方案，所述显示屏通过外接接口连接投屏模块，所述投屏模块投影显示最终翻译的文字结果，便于参会人员观看。

作为本发明的一种有限技术方案，所述显示屏通过蓝牙或wifi或HDMI有线或android或Airplay与投屏模块连接，通过多种连接方式的调换，可保证连接顺利，让开会过程实时展现。

作为本发明的一种有限技术方案，所述麦克风阵列为四麦或六麦或八麦等麦克风阵列，可根据参会人数的多少，调整麦克风阵列中麦克风的数量，提高各个方向上的拾音能力。

作为本发明的一种有限技术方案，所述TTS播报模块连接有手动开关，方便手动开关TTS播报模块，若会场需要安静可手动关闭TTS播报模块，通过显示屏呈现最终翻译的文字结果。

与现有技术相比，本发明能达到的有益效果是：

1)本发明能够自动判断语言，一直记录谈话内容，并实时显示在屏幕上，由于能自动判断语言，无需专用语种话筒，会议桌上直接放置麦克风，自由说话，还原开会真实场景；

2)可以实时更换翻译语料库，根据会议性质切换翻译的语料，例如医学翻译语料、电子翻译语料、金融翻译语料，提高会议专业术语的翻译准确度，从而保证翻译质量；

3)可“流式翻译”：一边识别说话者说话，一边显示他说的话，一边立刻显示翻译文字，呈现出来的几乎是说话者吐一个字翻译一个字，并根据上下句实时调整翻译结果；

4)自带声纹识别，不仅会自动判断语种，而且会标记是哪个人说话的话，谁发言的都有详细记录并有对应翻译；

5)自带屏幕，且拥有蓝牙、wifi、HDMI有线、android、Airplay等投屏手段，投放到会议屏幕或电视机上，让开会过程实时展现；

6)拥有环形麦克风阵列，在会场各个角落都能清晰识别说话者声音；

7)拥有回声消除装置、噪声消除装置，在会议封闭环境下，能有效消除会议室回声，从而保证录音效果。

附图说明

图1是本发明的模块结构原理图。

具体实施方式

以下结合附图对本发明的优选实施例进行说明，应当理解，此处所描述的优选实施例仅用于说明和解释本发明，并不用于限定本发明。

请参照图1所示，一种现场会议人工智能同传设备，设备包括依次连接的麦克风阵列、回声消除模块、噪声消除模块、声纹识别模块、ASR语音识别模块、自动判断语种模块、神经网络翻译模块；麦克风阵列为环形麦克风阵列，均匀分布于会议桌外圈，目的是提高各个方向上的拾音能力，让用户在会议桌各个方向说话都能被设备准确识别；回声消除模块可消除接收语音中的回声，噪声消除模块能够消除接收语音中的各种背景音、背景噪声，提高接收语音的清晰度；声纹识别模块能够通过声纹识别标记是哪个人说话，指明说话者的性别、年龄等特征；ASR语音识别模块能够将用户语音翻译成文字；自动判断语种模块能够将自动判断用户说话的语种，并且标记现场会议有哪几个国家的人，进而每一个人说话时都会翻译成会场各个语种所需要的翻译文字；神经网络翻译模块连接有翻译库，翻译库内包括各语种专业翻译库，会议开始时切换相应专业翻译库，通过ASR语音识别模块得到文字后，放入神经网络翻译模块得到对应国家语种翻译结果的文字，神经网络翻译模块还连接有TTS播报模块和显示器，TTS播报模块能够将文字生成对应语种国家人的声音，进而播放出来，显示屏显示最终翻译的文字结果。

显示屏通过外接接口连接投屏模块，投屏模块投影显示最终翻译的文字结果，便于参会人员观看。

显示屏通过蓝牙或wifi或HDMI有线或android或Airplay与投屏模块连接，通过多种连接方式的调换，可保证连接顺利，让开会过程实时展现。

麦克风阵列为四麦或六麦或八麦等麦克风阵列，可根据参会人数的多少，调整麦克风阵列中麦克风的数量，提高各个方向上的拾音能力。

TTS播报模块连接有手动开关，方便手动开关TTS播报模块，若会场需要安静可手动关闭TTS播报模块，通过显示屏呈现最终翻译的文字结果。

具体的，该装置使用时，会议举办者在会议开始前，在会议机上设置这次会议会有哪几种语言，例如选择中文、英语、法语、日语四种；会议机摆放在会议桌中间，并且会议机投屏到会议屏幕上；会议各人员到达会议室，开始会议，若用户A说中文，B说英语，C说法语，D说日语；A说话时，会议屏幕上记录下A用户说的话，并且下方实时展示将用户A中文翻译成的英语、法语、日语；B说话时，会议屏幕上记录下B用户说的话，并且下方实时展示用户B英文翻译成的中文、法语、日语；依次类推。

本发明的实施方式不限于此，按照本发明的上述实施例内容，利用本领域的常规技术知识和惯用手段，在不脱离本发明上述基本技术思想前提下，以上优选实施例还可以做出其它多种形式的修改、替换或组合，所获得的其它实施例均落在本发明权利保护范围之内。

Claims

1.一种现场会议人工智能同传设备，其特征在于，所述设备包括依次连接的麦克风阵列、回声消除模块、噪声消除模块、声纹识别模块、ASR语音识别模块、自动判断语种模块、神经网络翻译模块；所述麦克风阵列为环形麦克风阵列，均匀分布于会议桌外圈，目的是提高各个方向上的拾音能力，让用户在会议桌各个方向说话都能被设备准确识别；所述回声消除模块可消除接收语音中的回声，所述噪声消除模块能够消除接收语音中的各种背景音、背景噪声，提高接收语音的清晰度；所述声纹识别模块能够通过声纹识别标记是哪个人说话，指明说话者的性别、年龄等特征；所述ASR语音识别模块能够将用户语音翻译成文字；所述自动判断语种模块能够将自动判断用户说话的语种，并且标记现场会议有哪几个国家的人，进而每一个人说话时都会翻译成会场各个语种所需要的翻译文字；所述神经网络翻译模块连接有翻译库，所述翻译库内包括各语种专业翻译库，会议开始时切换相应专业翻译库，通过ASR语音识别模块得到文字后，放入神经网络翻译模块得到对应国家语种翻译结果的文字，所述神经网络翻译模块还连接有TTS播报模块和显示器，所述TTS播报模块能够将文字生成对应语种国家人的声音，进而播放出来，所述显示屏显示最终翻译的文字结果。

2.根据权利要求1所述的一种现场会议人工智能同传设备，其特征在于，所述显示屏通过外接接口连接投屏模块，所述投屏模块投影显示最终翻译的文字结果，便于参会人员观看。

3.根据权利要求2所述的一种现场会议人工智能同传设备，其特征在于，所述显示屏通过蓝牙或wifi或HDMI有线或android或Airplay与投屏模块连接，通过多种连接方式的调换，可保证连接顺利，让开会过程实时展现。

4.根据权利要求1所述的一种现场会议人工智能同传设备，其特征在于，所述麦克风阵列为四麦或六麦或八麦等麦克风阵列，可根据参会人数的多少，调整麦克风阵列中麦克风的数量，提高各个方向上的拾音能力。

5.根据权利要求1所述的一种现场会议人工智能同传设备，其特征在于，所述TTS播报模块连接有手动开关，方便手动开关TTS播报模块，若会场需要安静可手动关闭TTS播报模块，通过显示屏呈现最终翻译的文字结果。