CN110049200A - 基于会议的语言翻译方法及相关产品 - Google Patents

基于会议的语言翻译方法及相关产品 Download PDF

Info

Publication number
CN110049200A
CN110049200A CN201910173054.0A CN201910173054A CN110049200A CN 110049200 A CN110049200 A CN 110049200A CN 201910173054 A CN201910173054 A CN 201910173054A CN 110049200 A CN110049200 A CN 110049200A
Authority
CN
China
Prior art keywords
terminal
neural network
language
multilingual
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910173054.0A
Other languages
English (en)
Inventor
廖德南
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
YONGDELI SILICONE TECHNOLOGY (SHENZHEN) Co Ltd
Wing Tak Lee Silicone Rubber Technology Shenzhen Co Ltd
Original Assignee
YONGDELI SILICONE TECHNOLOGY (SHENZHEN) Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by YONGDELI SILICONE TECHNOLOGY (SHENZHEN) Co Ltd filed Critical YONGDELI SILICONE TECHNOLOGY (SHENZHEN) Co Ltd
Priority to CN201910173054.0A priority Critical patent/CN110049200A/zh
Publication of CN110049200A publication Critical patent/CN110049200A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/16Speech classification or search using artificial neural networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/56Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities
    • H04M3/568Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities audio processing specific to telephonic conferencing, e.g. spatial distribution, mixing of participants

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Data Mining & Analysis (AREA)
  • Biomedical Technology (AREA)
  • Human Computer Interaction (AREA)
  • Computing Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Acoustics & Sound (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Signal Processing (AREA)
  • Machine Translation (AREA)

Abstract

本申请提供了一种基于会议的语言翻译方法及终端,该方法包括:终端接收会议电话发送的第一语言以及多种语言,该多种语言包括当前会议的第一语言;终端将第一语言以及多种语言发送至网络侧,接收网络侧下发的神经网络模型的第一语言翻译至多种语言的多种参数,终端将多种参数加载至多个神经网络模型;终端将第一语音输入到多个神经网络模型分别执行多层神经网络运算得到符合多种语言的多种语音,将多种语音发送至会议电话。本申请提供的技术方案具有用户体验度高的优点。

Description

基于会议的语言翻译方法及相关产品
技术领域
本申请涉及通信以及终端领域,具体涉及一种基于会议的语言翻译方法及相关产品。
背景技术
终端,例如平板电脑、智能手机等。这里以智能手机为例,智能手机,是指像个人电脑一样,具有独立的操作系统,独立的运行空间,可以由用户自行安装软件、游戏、导航等第三方服务商提供的程序,并可以通过移动通讯网络来实现无线网络接入手机类型的总称。
目前的会议终端仅仅只能够实现对于通话的转发,这样对于用户来说无法实现其他语言的互通,导致用户体验度低。
申请内容
本申请实施例提供了一种基于会议的语言翻译方法及相关产品,实现会议终端的全语通,提高了用户体验度。
第一方面,本申请实施例提供一种基于会议的语言翻译方法,所述方法包括如下步骤:
终端接收会议电话发送的第一语言以及多种语言,该多种语言包括当前会议的第一语言;
终端将第一语言以及多种语言发送至网络侧,接收网络侧下发的神经网络模型的第一语言翻译至多种语言的多种参数,终端将多种参数加载至多个神经网络模型;
终端将第一语音输入到多个神经网络模型分别执行多层神经网络运算得到符合多种语言的多种语音,将多种语音发送至会议电话。
可选的,所述终端将第一语音输入到多个神经网络模型分别执行多层神经网络运算得到符合多种语言的多种语音具体包括:
确定输入数据矩阵【H】【W】,将输入矩阵【H】【W】划分成H/X个数据块,所述H/X个数据块中每个数据块中元素值按H方向相邻存储,将输入矩阵【H】【W】分别与多个神经网络模型分别执行多层神经网络运算得到符合多种语言的多种语音,X为大于等于3的正整数。
可选的,所述终端为多个。
可选的,如所述终端为多核终端,所述方法还包括:
将多个神经网络模型一对一分配给多个神经网络模型。
第二方面,提供一种终端,所述终端包括:
连接端口,用于接收会议电话发送的第一语言以及多种语言,该多种语言包括当前会议的第一语言;
处理单元,用于将第一语言以及多种语言发送至网络侧,接收网络侧下发的神经网络模型的第一语言翻译至多种语言的多种参数,终端将多种参数加载至多个神经网络模型;将第一语音输入到多个神经网络模型分别执行多层神经网络运算得到符合多种语言的多种语音,将多种语音发送至会议电话。
可选的,所述处理单元,具体用于确定输入数据矩阵【H】【W】,将输入矩阵【H】【W】划分成H/X个数据块,所述H/X个数据块中每个数据块中元素值按H方向相邻存储,将输入矩阵【H】【W】分别与多个神经网络模型分别执行多层神经网络运算得到符合多种语言的多种语音,X为大于等于3的正整数。
可选的,所述终端为多个。
可选的,所述处理单元,还用于在所述终端为多核终端时,将多个神经网络模型一对一分配给多个神经网络模型。
可选的,所述终端为:智能手机或平板电脑。
第三方面,提供一种计算机可读存储介质,其存储用于电子数据交换的计算机程序,其中,所述计算机程序使得计算机执行第一方面提供的所述的方法。
第四方面,提供一种计算机程序产品,所述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,所述计算机程序可操作来使计算机执行第一方面提供的方法。
实施本申请实施例,具有如下有益效果:
可以看出,本申请提供的技术方案在接收到第一语言以及多种语言后,确定第一语言以及多种语言的多种参数,然后将该多种参数加载至多个神经网络模型,在执行翻译以后,返回给会议电话,这样即实现了会议的全语通,提高了用户体验度。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种计算装置的结构示意图。
图2是本申请实施例公开的一种基于会议的语言翻译方法的流程示意图。
图3为本申请实施例提供的一种终端的示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书及所述附图中的术语“第一”、“第二”、“第三”和“第四”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
参阅图1,图1为一种会议系统的结构示意图,该会议系统包括:会议电话以及终端,如图1所示,该终端与会议电话连接,该连接可以为有线连接,也可以为无线连接,该终端可以包括:处理器101、存储器102、显示屏103、连接端口104,其中,处理器101通过总线与存储器102、显示屏103、连接端口104连接。该终端通过该连接端口104与该会议电话连接,该连接端口可以为有线端口,例如mico usb端口,当然也可以为无线端口,例如蓝牙端口。
本申请提供的一种基于会议的语言翻译方法,该方法采用如图1所示的终端来实现,该方法如图2所示,包括如下步骤:
步骤S201、终端接收会议电话发送的第一语言以及多种语言,该多种语言包括当前会议的第一语言;
步骤S202、终端将第一语言以及多种语言发送至网络侧,接收网络侧下发的神经网络模型的第一语言翻译至多种语言的多种参数,终端将多种参数加载至多个神经网络模型;
步骤S203、终端将第一语音输入到多个神经网络模型分别执行多层神经网络运算得到符合多种语言的多种语音,将多种语音发送至会议电话。
本申请提供的技术方案在接收到第一语言以及多种语言后,确定第一语言以及多种语言的多种参数,然后将该多种参数加载至多个神经网络模型,在执行翻译以后,返回给会议电话,这样即实现了会议的全语通,提高了用户体验度。
可选的,上述终端将第一语音输入到多个神经网络模型分别执行多层神经网络运算得到符合多种语言的多种语音具体可以包括:
确定输入数据矩阵【H】【W】,将输入矩阵【H】【W】划分成H/X个数据块,所述H/X个数据块中每个数据块中元素值按H方向相邻存储,将输入矩阵【H】【W】分别与多个神经网络模型分别执行多层神经网络运算得到符合多种语言的多种语音,X为大于等于3的正整数。
上述输入数据矩阵【H】【W】中的【H】表示高度方向值,【W】表示宽度方向值。
上述方案虽然具有多个神经网络模型,但是多个神经网络模型的输入数据是相同的,因此这里主要针对输入数据的矩阵对存储的顺序进行排列,这样提高内存数据提取的速度,对于内存的提取来说,每次提取的数据均为128bi t数据,目前单个元素值为16比特或8bit,如果不将输入数据矩阵【H】【W】划分,那么在提取数据时,由于提取的为一个【X】【X】的卷积核,其在H方向以及W方向均具有相应的数据,以16比特为例,这样对于一个【X】【X】的卷积核其需要提取的次数为X次,即每次提取8个元素值,但是丢弃8-X个元素值,但是对于本申请的技术方案,其只需提取2次(假设X不大于4),以X=3为例,即第一次提取8个元素值均是需要的,第二次提取的8个元素值第一个元素值需要,后面7个元素值丢弃;以X=4为例,其提取的也是2次,这样就减少了X-2次数据提取的次数,对于卷积核的提取也能够提高数据提取的效率,这样提高了卷积运算的速度。
可选的,上述终端的数量为多个,在多个终端时,终端的用户可以根据自身的需求对语言种类进行调整。
可选的,如所述终端为多核终端,将多个神经网络模型一对一分配给多个神经网络模型。
参阅图3,图3提供了一种终端,所述终端包括:
连接端口,用于接收会议电话发送的第一语言以及多种语言,该多种语言包括当前会议的第一语言;
处理单元,用于将第一语言以及多种语言发送至网络侧,接收网络侧下发的神经网络模型的第一语言翻译至多种语言的多种参数,终端将多种参数加载至多个神经网络模型;将第一语音输入到多个神经网络模型分别执行多层神经网络运算得到符合多种语言的多种语音,将多种语音发送至会议电话。
上述终端具体可以为智能手机或平板电脑。
本申请实施例还提供一种计算机存储介质,其中,该计算机存储介质存储用于电子数据交换的计算机程序,该计算机程序使得计算机执行如上述方法实施例中记载的任何一种基于会议的语言翻译方法的部分或全部步骤。
本申请实施例还提供一种计算机程序产品,所述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,所述计算机程序可操作来使计算机执行如上述方法实施例中记载的任何一种基于会议的语言翻译方法的部分或全部步骤。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于可选实施例,所涉及的动作和模块并不一定是本申请所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件程序模块的形式实现。
所述集成的单元如果以软件程序模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储器中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储器包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储器中,存储器可以包括:闪存盘、只读存储器(英文:Read-Only Memory,简称:ROM)、随机存取器(英文:Random Access Memory,简称:RAM)、磁盘或光盘等。
以上对本申请实施例进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (10)

1.一种基于会议的语言翻译方法,其特征在于,所述方法包括如下步骤:
终端接收会议电话发送的第一语言以及多种语言,该多种语言包括当前会议的第一语言;
终端将第一语言以及多种语言发送至网络侧,接收网络侧下发的神经网络模型的第一语言翻译至多种语言的多种参数,终端将多种参数加载至多个神经网络模型;
终端将第一语音输入到多个神经网络模型分别执行多层神经网络运算得到符合多种语言的多种语音,将多种语音发送至会议电话。
2.根据权利要求1所述的方法,其特征在于,所述终端将第一语音输入到多个神经网络模型分别执行多层神经网络运算得到符合多种语言的多种语音具体包括:
确定输入数据矩阵【H】【W】,将输入矩阵【H】【W】划分成H/X个数据块,所述H/X个数据块中每个数据块中元素值按H方向相邻存储,将输入矩阵【H】【W】分别与多个神经网络模型分别执行多层神经网络运算得到符合多种语言的多种语音,X为大于等于3的正整数。
3.根据权利要求2所述的方法,其特征在于,所述终端为多个。
4.根据权利要求1所述的方法,其特征在于,如所述终端为多核终端,所述方法还包括:
将多个神经网络模型一对一分配给多个神经网络模型。
5.一种终端,其特征在于,所述终端包括:
连接端口,用于接收会议电话发送的第一语言以及多种语言,该多种语言包括当前会议的第一语言;
处理单元,用于将第一语言以及多种语言发送至网络侧,接收网络侧下发的神经网络模型的第一语言翻译至多种语言的多种参数,终端将多种参数加载至多个神经网络模型;将第一语音输入到多个神经网络模型分别执行多层神经网络运算得到符合多种语言的多种语音,将多种语音发送至会议电话。
6.根据权利要求5所述的终端,其特征在于,
所述处理单元,具体用于确定输入数据矩阵【H】【W】,将输入矩阵【H】【W】划分成H/X个数据块,所述H/X个数据块中每个数据块中元素值按H方向相邻存储,将输入矩阵【H】【W】分别与多个神经网络模型分别执行多层神经网络运算得到符合多种语言的多种语音,X为大于等于3的正整数。
7.根据权利要求6所述的终端,其特征在于,
所述终端为多个。
8.根据权利要求5所述的终端,其特征在于,
所述处理单元,还用于在所述终端为多核终端时,将多个神经网络模型一对一分配给多个神经网络模型。
9.根据权利要求5-8任意一项所述的终端,其特征在于,
所述终端为:智能手机或平板电脑。
10.一种计算机可读存储介质,其特征在于,其存储用于电子数据交换的计算机程序,其中,所述计算机程序使得计算机执行如权利要求1-4任意一项所述的方法。
CN201910173054.0A 2019-03-07 2019-03-07 基于会议的语言翻译方法及相关产品 Pending CN110049200A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910173054.0A CN110049200A (zh) 2019-03-07 2019-03-07 基于会议的语言翻译方法及相关产品

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910173054.0A CN110049200A (zh) 2019-03-07 2019-03-07 基于会议的语言翻译方法及相关产品

Publications (1)

Publication Number Publication Date
CN110049200A true CN110049200A (zh) 2019-07-23

Family

ID=67274623

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910173054.0A Pending CN110049200A (zh) 2019-03-07 2019-03-07 基于会议的语言翻译方法及相关产品

Country Status (1)

Country Link
CN (1) CN110049200A (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108712271A (zh) * 2018-04-02 2018-10-26 深圳市沃特沃德股份有限公司 翻译方法和翻译装置
CN108875926A (zh) * 2017-10-30 2018-11-23 上海寒武纪信息科技有限公司 语言翻译方法及相关产品

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108875926A (zh) * 2017-10-30 2018-11-23 上海寒武纪信息科技有限公司 语言翻译方法及相关产品
CN108712271A (zh) * 2018-04-02 2018-10-26 深圳市沃特沃德股份有限公司 翻译方法和翻译装置

Similar Documents

Publication Publication Date Title
CN109088995A (zh) 支持全球语言翻译的方法及手机
CN109547574A (zh) 一种数据传输方法及相关装置
CN109460412A (zh) 数据聚合方法、装置、设备及存储介质
CN107862352A (zh) 一种二维码分享方法及二维码分享设备
CN110147249A (zh) 一种网络模型的计算方法及装置
CN109327614A (zh) 全球同声传译手机及方法
CN107894945A (zh) 埋点添加方法、移动终端及计算机可读存储介质
CN105159927B (zh) 目标文本主题词的选取方法、装置及终端
CN110163349A (zh) 一种网络模型的计算方法及装置
CN109542878B (zh) 一种列表创建方法及装置
CN109933595A (zh) 一种物联网设备信息共享系统、装置及终端设备
CN113835806A (zh) 一种页面布局方法、装置、电子设备及存储介质
CN110505655A (zh) 数据指令处理方法、存储介质及蓝牙盾
CN108173909A (zh) 数据同步方法、移动终端及计算机可读存储介质
CN110049200A (zh) 基于会议的语言翻译方法及相关产品
CN105429981A (zh) 游戏语音传输方法、终端、语音服务模块及游戏系统
CN111046206A (zh) 头像列表展示方法、装置、电子设备及存储介质
CN114579506A (zh) 处理器之间的通信方法、系统、存储介质以及处理器
CN110047505A (zh) 基于神经网络的全语通的实现方法及相关产品
CN110232393B (zh) 数据的处理方法、装置、存储介质和电子装置
CN111163123A (zh) 一种服务请求的处理方法及装置
CN109739928A (zh) 数据导出方法、装置、计算机设备和存储介质
CN109918374A (zh) 海量数据存储的方法及终端设备
CN105373435B (zh) 一种数据同步处理的方法以及终端
US20200285707A1 (en) Multi-person mode full-language implementation method and related product

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20190723

RJ01 Rejection of invention patent application after publication