CN106453043A - 基于多语言转换的即时通信系统 - Google Patents

基于多语言转换的即时通信系统 Download PDF

Info

Publication number
CN106453043A
CN106453043A CN201610867262.7A CN201610867262A CN106453043A CN 106453043 A CN106453043 A CN 106453043A CN 201610867262 A CN201610867262 A CN 201610867262A CN 106453043 A CN106453043 A CN 106453043A
Authority
CN
China
Prior art keywords
module
voice
language
data processing
translation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610867262.7A
Other languages
English (en)
Inventor
虞焰兴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Anhui Voice Communication Information Technology Co Ltd
Original Assignee
Anhui Voice Communication Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Anhui Voice Communication Information Technology Co Ltd filed Critical Anhui Voice Communication Information Technology Co Ltd
Priority to CN201610867262.7A priority Critical patent/CN106453043A/zh
Publication of CN106453043A publication Critical patent/CN106453043A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/04Real-time or near real-time messaging, e.g. instant messaging [IM]
    • H04L51/046Interoperability with other network applications or services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/06Transformation of speech into a non-audible representation, e.g. speech visualisation or speech processing for tactile aids
    • G10L21/10Transforming into visible information

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Quality & Reliability (AREA)
  • Machine Translation (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明公开了一种基于多语言转换的即时通信系统,包括通过通信网络连接的通信终端、语音识别服务器和数据处理服务器;通信终端包括语言选择模块、语音采集模块、文件发送模块、文件下载模块以及语音播放模块;语音识别服务器包括语音识别模块、文字转写模块以及短信推送模块;数据处理服务器包括翻译模块、文字合成模块以及数据存储模块,通过语音识别服务器识别语音信息,并转写为文字信息以短信的形式输出到数据处理服务器,翻译为对应语言种类的文字信息,然后将文字信息合成为对应语言的语音信息,经另一通信终端播放输出,实现用户间使用不同语言在线通信,大大方便了不同国家不同语言的用户进行快速沟通,方便省时。

Description

基于多语言转换的即时通信系统
技术领域
本发明属于语音通信技术领域,涉及一种即时通信系统,具体是一种基于多语言转换的即时通信系统。
背景技术
据统计,全世界共有5000~6000种语言,较常用的有英语、汉语、日语、法语、德语、俄语等。随着通信及交通的发展,各国间的商贸及旅游活动交往日益增多,国际长途电话费用大幅度降低,通话量大幅度增长。中国2000年入境外国旅游者人数已超千万人次,旅游人数位居世界第五位,亚洲首位。由于语言障碍对商贸及旅游造成很大的不便,也影响了商贸及旅游更进一步的发展。为扫除语言障碍,口语翻译成为一种重要的手段。世界上像中国这样一些旅游及投资大国,需要的翻译员数以万计。常用的口语翻译一般借助现场翻译人员,在现有技术中也出现了一些电话翻译方法。
但借助现场翻译人员存在如下缺点:1、现场翻译员要随时跟在身边,成本较高,通常翻译费用较高;2、翻译员工作效率低,机动性差,在某地区出现商务及旅游高峰期时现场翻译员供不应求;3、不容易找到合适专业技术的现场翻译员;4、一些场合翻译员在场不方便等。
发明内容
本发明针对现有技术的不足,提供了一种基于多语言转换的即时通信系统,大大方便了不同国家不同语言的用户进行快速沟通。
本发明的目的可以通过以下技术方案实现:
基于多语言转换的即时通信系统,包括通过通信网络连接的通信终端、语音识别服务器和数据处理服务器;
所述的通信终端包括
语言选择模块,用于用户选择输入和输出的语言种类;
语音采集模块,用于采集用户说话的语音信息,形成音频文件;
文件发送模块,用于将语音采集模块生成的音频文件经通信网络发送到语音识别服务器;
文件下载模块,用于从数据处理服务器下载经过翻译的音频文件;
以及语音播放模块,用于将播放文件下载模块下载的音频文件,输出语音信息;
所述的语音识别服务器包括
语音识别模块,用于根据用户选择的语言种类对接收到音频文件中的语音信息进行识别;
文字转写模块,用于将经过识别的语言信息转写为文字信息;
以及短信推送模块,用于将文字转写模块转写完成的文字信息通过短信的方式发送到数据处理服务器;
所述的数据处理服务器包括
翻译模块,用于对语音识别服务器输出的文字信息进行在线翻译,输出翻译为指定语言的文字信息;
文字合成模块,用于将经过翻译的文字信息合成为对应语言的语音信息,形成音频文件;
以及数据存储模块,用于存储经过翻译的语音信息,供用户下载。
进一步地,所述的通信网络采用移动、联通或电信通信网络。
进一步地,所述的语言种类包括汉语、英语、日语、韩语、俄语、西班牙语、意大利语、葡萄牙语、德语、法语。
本发明的有益效果:本发明提供的即时通信系统,来自不同国家不同语言的用户通过通信终端选择语言种类进行语音通信,通过语音识别服务器识别语音信息,并转写为文字信息以短信的形式输出到数据处理服务器,翻译为对应语言种类的文字信息,然后将文字信息合成为对应语言的语音信息,经另一通信终端播放输出,实现用户间使用不同语言在线通信,大大方便了不同国家不同语言的用户进行快速沟通,方便省时。
附图说明
下面结合附图和具体实施例对本发明作进一步详细描述。
图1是本发明的系统示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
如图1所示,本发明提供了一种基于多语言转换的即时通信系统,包括通过通信网络连接的通信终端、语音识别服务器和数据处理服务器,其中,通信网络采用移动、联通或电信通信网络。
通信终端采用手机,包括语言选择模块、语音采集模块、文件发送模块、文件下载模块和语音播放模块。
语言选择模块,用于用户选择输入和输出的语言种类;其中,语言种类包括汉语、英语、日语、韩语、俄语、西班牙语、意大利语、葡萄牙语、德语、法语等多种语言。
语音采集模块,用于采集用户说话的语音信息,形成音频文件。
文件发送模块,用于将语音采集模块生成的音频文件经通信网络发送到语音识别服务器。
文件下载模块,用于从数据处理服务器下载经过翻译的音频文件。
语音播放模块,用于将播放文件下载模块下载的音频文件,输出语音信息。
语音识别服务器包括语音识别模块、文字转写模块和短信推送模块。
语音识别模块,用于根据用户选择的语言种类对接收到音频文件中的语音信息进行识别。
文字转写模块,用于将经过识别的语言信息转写为文字信息。
短信推送模块,用于将文字转写模块转写完成的文字信息通过短信的方式发送到数据处理服务器。
数据处理服务器包括翻译模块、文字合成模块和数据存储模块。
翻译模块,用于对语音识别服务器输出的文字信息进行在线翻译,输出翻译为指定语言的文字信息。
文字合成模块,用于将经过翻译的文字信息合成为对应语言的语音信息,形成音频文件。
数据存储模块,用于存储经过翻译的语音信息,供用户下载。
本发明工作过程:用户A使用通信终端A与使用通信终端B的用户B进行通话,首先,用户A通过语言选择模块选择自己输入的语言种类,用户B通过语言选择模块选择需要输出的语音种类,然后进行通话。
语音采集模块采集用户A说话的语音信息,形成音频文件,文件发送模块将音频文件经通信网络发送到语音识别服务器,语音识别模块根据用户选择的语言种类对接收到音频文件中的语音信息进行识别,文字转写模块将语音信息转写为文字信息,通过短信推送模块以短信的方式发送到数据处理服务器。
翻译模块对语音识别服务器输出的文字信息进行在线翻译,根据用户B指定的语言种类输出翻译后的文字信息,文字合成模块将经过翻译的文字信息合成为对应语言的语音信息,形成音频文件,存储到数据存储模块,供用户下载。
用户B通过文件下载模块从数据处理服务器下载经过翻译的音频文件,并使用语音播放模块播放该音频文件,输出对应语言的语音信息,实现用户A和用户B使用不同语言在线通信,大大方便了不同国家不同语言的用户进行在线沟通。
本发明提供的即时通信系统,来自不同国家不同语言的用户通过通信终端选择语言种类进行语音通信,通过语音识别服务器识别语音信息,并转写为文字信息以短信的形式输出到数据处理服务器,翻译为对应语言种类的文字信息,然后将文字信息合成为对应语言的语音信息,经另一通信终端播放输出,实现用户间使用不同语言在线通信,大大方便了不同国家不同语言的用户进行快速沟通,方便省时。
为了描述的方便,描述以上装置时以功能分为各种单元、模块分别描述。当然,在实施本申请时可以把各单元、模块的功能在同一个或多个软件和/或硬件中实现。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施方式或者实施方式的某些部分所述的方法。
以上所描述的装置实施方式仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施方式方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
本申请可用于众多通用或专用的计算系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。
本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
在本说明书的描述中,参考术语“一个实施例”、“示例”、“具体示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
以上内容仅仅是对本发明结构所作的举例和说明,所属本技术领域的技术人员对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,只要不偏离发明的结构或者超越本权利要求书所定义的范围,均应属于本发明的保护范围。

Claims (3)

1.基于多语言转换的即时通信系统,其特征在于:包括通过通信网络连接的通信终端、语音识别服务器和数据处理服务器;
所述的通信终端包括
语言选择模块,用于用户选择输入和输出的语言种类;
语音采集模块,用于采集用户说话的语音信息,形成音频文件;
文件发送模块,用于将语音采集模块生成的音频文件经通信网络发送到语音识别服务器;
文件下载模块,用于从数据处理服务器下载经过翻译的音频文件;
以及语音播放模块,用于将播放文件下载模块下载的音频文件,输出语音信息;
所述的语音识别服务器包括
语音识别模块,用于根据用户选择的语言种类对接收到音频文件中的语音信息进行识别;
文字转写模块,用于将经过识别的语言信息转写为文字信息;
以及短信推送模块,用于将文字转写模块转写完成的文字信息通过短信的方式发送到数据处理服务器;
所述的数据处理服务器包括
翻译模块,用于对语音识别服务器输出的文字信息进行在线翻译,输出翻译为指定语言的文字信息;
文字合成模块,用于将经过翻译的文字信息合成为对应语言的语音信息,形成音频文件;
以及数据存储模块,用于存储经过翻译的语音信息,供用户下载。
2.根据权利要求1所述的基于多语言转换的即时通信系统,其特征在于:所述的通信网络采用移动、联通或电信通信网络。
3.根据权利要求1所述的基于多语言转换的即时通信系统,其特征在于:所述的语言种类包括汉语、英语、日语、韩语、俄语、西班牙语、意大利语、葡萄牙语、德语、法语。
CN201610867262.7A 2016-09-29 2016-09-29 基于多语言转换的即时通信系统 Pending CN106453043A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610867262.7A CN106453043A (zh) 2016-09-29 2016-09-29 基于多语言转换的即时通信系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610867262.7A CN106453043A (zh) 2016-09-29 2016-09-29 基于多语言转换的即时通信系统

Publications (1)

Publication Number Publication Date
CN106453043A true CN106453043A (zh) 2017-02-22

Family

ID=58172535

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610867262.7A Pending CN106453043A (zh) 2016-09-29 2016-09-29 基于多语言转换的即时通信系统

Country Status (1)

Country Link
CN (1) CN106453043A (zh)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107343113A (zh) * 2017-06-26 2017-11-10 深圳市沃特沃德股份有限公司 语音通话方法和装置
CN107480146A (zh) * 2017-08-07 2017-12-15 中译语通科技(青岛)有限公司 一种识别语种语音的会议纪要快速翻译方法
CN107731028A (zh) * 2017-11-15 2018-02-23 安徽声讯信息技术有限公司 一种智能语音电子白板
CN107820112A (zh) * 2017-11-15 2018-03-20 安徽声讯信息技术有限公司 一种音频文字直播系统
CN107977365A (zh) * 2017-12-26 2018-05-01 安徽声讯信息技术有限公司 一种智能学习的离线翻译机
CN108197123A (zh) * 2018-02-07 2018-06-22 云南衍那科技有限公司 一种基于智能手表的云翻译系统和方法
CN108733656A (zh) * 2017-04-14 2018-11-02 深圳市领芯者科技有限公司 语音翻译装置、系统和方法
WO2018205072A1 (zh) * 2017-05-08 2018-11-15 深圳市卓希科技有限公司 一种文本转换成语音方法和装置
CN108848019A (zh) * 2018-05-04 2018-11-20 毛勇 一种即时通讯方法及系统
CN110019020A (zh) * 2019-04-03 2019-07-16 海南阿米信息科技有限公司 一种信息处理方法、装置、设备及存储介质
CN110033232A (zh) * 2019-03-25 2019-07-19 深圳市沃特沃德股份有限公司 考勤方法、装置、设备及存储介质
CN110853639A (zh) * 2019-10-23 2020-02-28 天津讯飞极智科技有限公司 语音转写方法及相关装置
CN112005239A (zh) * 2018-03-30 2020-11-27 爱维士软件有限责任公司 消息传递应用中的自动语言选择
CN112837681A (zh) * 2020-08-18 2021-05-25 杭州通友智能通讯有限公司 一种基于即时翻译的在线语音聊天系统
CN113160827A (zh) * 2021-04-07 2021-07-23 深圳鱼亮科技有限公司 一种基于多语言模型的语音转写系统及方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030187650A1 (en) * 2002-04-02 2003-10-02 Worldcom. Inc. Call completion via instant communications client
WO2016055864A1 (en) * 2014-10-08 2016-04-14 Alibek Issaev Computer based translation system and method

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030187650A1 (en) * 2002-04-02 2003-10-02 Worldcom. Inc. Call completion via instant communications client
WO2016055864A1 (en) * 2014-10-08 2016-04-14 Alibek Issaev Computer based translation system and method

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108733656A (zh) * 2017-04-14 2018-11-02 深圳市领芯者科技有限公司 语音翻译装置、系统和方法
WO2018205072A1 (zh) * 2017-05-08 2018-11-15 深圳市卓希科技有限公司 一种文本转换成语音方法和装置
CN107343113A (zh) * 2017-06-26 2017-11-10 深圳市沃特沃德股份有限公司 语音通话方法和装置
WO2019000515A1 (zh) * 2017-06-26 2019-01-03 深圳市沃特沃德股份有限公司 语音通话方法和装置
CN107480146A (zh) * 2017-08-07 2017-12-15 中译语通科技(青岛)有限公司 一种识别语种语音的会议纪要快速翻译方法
CN107731028A (zh) * 2017-11-15 2018-02-23 安徽声讯信息技术有限公司 一种智能语音电子白板
CN107820112A (zh) * 2017-11-15 2018-03-20 安徽声讯信息技术有限公司 一种音频文字直播系统
CN107977365A (zh) * 2017-12-26 2018-05-01 安徽声讯信息技术有限公司 一种智能学习的离线翻译机
CN108197123A (zh) * 2018-02-07 2018-06-22 云南衍那科技有限公司 一种基于智能手表的云翻译系统和方法
CN112005239A (zh) * 2018-03-30 2020-11-27 爱维士软件有限责任公司 消息传递应用中的自动语言选择
CN108848019A (zh) * 2018-05-04 2018-11-20 毛勇 一种即时通讯方法及系统
CN110033232A (zh) * 2019-03-25 2019-07-19 深圳市沃特沃德股份有限公司 考勤方法、装置、设备及存储介质
CN110019020A (zh) * 2019-04-03 2019-07-16 海南阿米信息科技有限公司 一种信息处理方法、装置、设备及存储介质
CN110853639A (zh) * 2019-10-23 2020-02-28 天津讯飞极智科技有限公司 语音转写方法及相关装置
CN110853639B (zh) * 2019-10-23 2023-09-01 天津讯飞极智科技有限公司 语音转写方法及相关装置
CN112837681A (zh) * 2020-08-18 2021-05-25 杭州通友智能通讯有限公司 一种基于即时翻译的在线语音聊天系统
CN113160827A (zh) * 2021-04-07 2021-07-23 深圳鱼亮科技有限公司 一种基于多语言模型的语音转写系统及方法

Similar Documents

Publication Publication Date Title
CN106453043A (zh) 基于多语言转换的即时通信系统
CN106486125A (zh) 一种基于语音识别技术的同声传译系统
TWI711967B (zh) 播報語音的確定方法、裝置和設備
CN106156009A (zh) 语音翻译方法及装置
CN105895090A (zh) 语音信号处理方法及装置
CN102316361B (zh) 基于自然语音识别的音频/视频点播方法和系统
CN109256133A (zh) 一种语音交互方法、装置、设备及存储介质
CN106412032A (zh) 一种远程音频文字转换传输方法及系统
CN105469789A (zh) 一种语音信息的处理方法及终端
CN110992955A (zh) 一种智能设备的语音操作方法、装置、设备及存储介质
CN110321415A (zh) 一种电话套接式电话机器人系统
CN104468941A (zh) 信息显示方法和装置
CN110232921A (zh) 基于生活服务的语音操作方法、装置、智能电视及系统
CN109727592A (zh) 基于自然语言语音交互的运维指令执行方法、介质及终端
CN103474075B (zh) 语音信号发送方法及系统、接收方法及系统
CN102347026B (zh) 基于自然语音识别的音频、视频或音视频点播方法和系统
CN109036387A (zh) 视频语音识别方法及系统
CN108052511A (zh) 基于方言识别的多语言翻译器
Bangalore et al. Balancing data-driven and rule-based approaches in the context of a multimodal conversational system
CN105096945A (zh) 一种终端的语音识别方法和装置
CN111128130B (zh) 语音数据处理方法和装置及电子装置
CN106844357A (zh) 大句库翻译方法
CN115019787A (zh) 一种交互式同音异义词消歧方法、系统、电子设备和存储介质
CN113434663A (zh) 基于边缘计算的会议纪要生成方法及相关设备
CN202587038U (zh) 语音数据处理平台及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20170222

RJ01 Rejection of invention patent application after publication