CN109088995B - 支持全球语言翻译的方法及手机 - Google Patents

支持全球语言翻译的方法及手机 Download PDF

Info

Publication number
CN109088995B
CN109088995B CN201811211343.7A CN201811211343A CN109088995B CN 109088995 B CN109088995 B CN 109088995B CN 201811211343 A CN201811211343 A CN 201811211343A CN 109088995 B CN109088995 B CN 109088995B
Authority
CN
China
Prior art keywords
dialect
language
voice information
matrix
weight
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811211343.7A
Other languages
English (en)
Other versions
CN109088995A (zh
Inventor
廖德南
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen yongdeli Technology Co.,Ltd.
Original Assignee
Yongdeli Silicone Rubber Technology Shenzhen Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yongdeli Silicone Rubber Technology Shenzhen Co ltd filed Critical Yongdeli Silicone Rubber Technology Shenzhen Co ltd
Priority to CN201811211343.7A priority Critical patent/CN109088995B/zh
Publication of CN109088995A publication Critical patent/CN109088995A/zh
Priority to US16/296,248 priority patent/US10922497B2/en
Application granted granted Critical
Publication of CN109088995B publication Critical patent/CN109088995B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/005Language recognition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72403User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72484User interfaces specially adapted for cordless or mobile telephones wherein functions are triggered by incoming communication events
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/60Substation equipment, e.g. for use by subscribers including speech amplifiers
    • H04M1/6033Substation equipment, e.g. for use by subscribers including speech amplifiers for providing handsfree use or a loudspeaker mode in telephone sets
    • H04M1/6041Portable telephones adapted for handsfree use
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2242/00Special services or facilities
    • H04M2242/12Language recognition, selection or translation arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2242/00Special services or facilities
    • H04M2242/14Special services or facilities with services dependent on location
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2250/00Details of telephonic subscriber devices
    • H04M2250/58Details of telephonic subscriber devices including a multilanguage function

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Theoretical Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本公开提供一种支持全球语言翻译的方法及相关产品,所述方法包括如下步骤:智能手机接收终端发送的通话请求,接通该通话请求,建立通话连接;智能手机接收该通话连接传送的第一语音信息,识别该第一语音信息对应的第一语种以及第一方言,获取第一方言对应翻译模型将该第一方言的第一语音信息翻译成第二方言的第二语音信息;智能手机将该第二方言的第二语音信息通过发声设备播放。本申请提供的技术方案具有用户体验度高的优点。

Description

支持全球语言翻译的方法及手机
技术领域
本发明涉及通信及翻译技术领域,具体涉及一种支持全球语言翻译的方法及手机。
背景技术
翻译是将一种相对陌生的表达方式,转换成相对熟悉的表达方式的过程。其内容有语言、文字、图形、符号的翻译。是增强促进人们社会交流发展的重要手段。
现有的翻译针对不同语种来实现翻译,不发实现同语种的不同地区之间的语言翻译,例如,对于粤语,90%以上的中国人均是听不懂的,另外对于江浙话、上海话等等地方话(俗称:方言),均十分难懂,此种情况,目前手机无法实现翻译,因此无法实现全球语言翻译,影响用户体验度。
发明内容
本发明实施例提供了一种支持全球语言翻译的方法及手机,可以实现方言之间的翻译,提高用户体验度的优点。
第一方面,本发明实施例提供一种支持全球语言翻译的方法,所述方法包括如下步骤:
智能手机接收终端发送的通话请求,接通该通话请求,建立通话连接;
智能手机接收该通话连接传送的第一语音信息,识别该第一语音信息对应的第一语种以及第一方言,获取第一方言对应翻译模型将该第一方言的第一语音信息翻译成第二方言的第二语音信息;
智能手机将该第二方言的第二语音信息通过发声设备播放。
可选的,所述识别该第一语音信息对应的第一语种以及第一方言具体包括:
提取第一语音信息对应的终端的当前位置,识别当前位置的国别为城市,将该国别对应的语言确定为第一语种,将该城市对应的方言确定为第一方言。
可选的,所述识别该第一语音信息对应的第一语种以及第一方言具体包括:
提取第一语言信息对应的终端的号码,确定该号码对应的用户的籍贯,确定该籍贯对应的国家的语言为第一语种,确定该籍贯对应的方言确定为第一方言。
可选的,所述获取第一方言对应翻译模型将该第一方言的第一语音信息翻译成第二方言的第二语音信息的方法具体包括:
如该翻译模型为深度学习模型,确定深度学习模型中第一方言对应的权值的第一位置范围,保留权值的第一位置范围内的元素值,将权值的剩余位置全部置零的该第一方言对应的第一权值,将该第一权值与该第一方言对应的输入数据计算翻译得到第二方言的第二语音信息。
第二方面,提供一种智能手机,所述智能手机包括:处理器、通信单元和发声设备,
所述通信单元,用于接收终端发送的通话请求,接通该通话请求,建立通话连接,接收该通话连接传送的第一语音信息;
所述处理器,用于识别该第一语音信息对应的第一语种以及第一方言,获取第一方言对应翻译模型将该第一方言的第一语音信息翻译成第二方言的第二语音信息,控制所述发声设备将该第二方言的第二语音信息播放。
可选的,所述处理器,具体用于提取第一语音信息对应的终端的当前位置,识别当前位置的国别为城市,将该国别对应的语言确定为第一语种,将该城市对应的方言确定为第一方言。
可选的,所述处理器,具体提取第一语言信息对应的终端的号码,确定该号码对应的用户的籍贯,确定该籍贯对应的国家的语言为第一语种,确定该籍贯对应的方言确定为第一方言。
可选的,所述处理器,具体用于如该翻译模型为深度学习模型,确定深度学习模型中第一方言对应的权值的第一位置范围,保留权值的第一位置范围内的元素值,将权值的剩余位置全部置零的该第一方言对应的第一权值,将该第一权值与该第一方言对应的输入数据计算翻译得到第二方言的第二语音信息。
第三方面,提供一种计算机可读存储介质,其存储用于电子数据交换的程序,其中,所述程序使得终端执行第一方面提供的方法。
实施本发明实施例,具有如下有益效果:
可以看出,本申请提供的技术方案在接收通话请求时,接听该通话请求建立通话连接,依据该通话连接接收第一语音信息后,确定第一语音信息的第一语种以及第一方言,然后提取与第一方言对应的翻译模型来实现对第一方言翻译成第二方言的第二语音信息,这样就实现了同种语种的不同方言的翻译,降低了沟通交流成本,提高了用户体验度。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是一种终端的结构示意图。
图2是一种支持全球语言翻译的方法的流程示意图。
图3是一种输入矩阵与权值矩阵的拆分示意图。
图4是本发明实施例提供的智能手机的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书及所述附图中的术语“第一”、“第二”、“第三”和“第四”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结果或特性可以包含在本发明的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
参阅图1,图1为一种终端结构示意图,如图1所示,该终端包括:处理器101、显示屏105、通信模组102、存储器103和扬声器104。
上述处理器101具体可以包括:多核处理器。
可选的,上述处理器101还可以集成神经网络处理芯片。该神经网络处理芯片自身可以携带内存进行数据存储。
参阅图2,图2提供了一种支持全球语言翻译的方法,该方法由如图1所示的终端执行,该终端具体可以为智能手机,该方法如图2所示,包括如下步骤:
步骤S201、智能手机接收终端发送的通话请求,接通该通话请求,建立通话连接;
上述终端可以为手机、平板电脑、PDA等等智能设备。
可选的,上述通话请求具体可以为基于2G的通话请求,也可以为基于4G的通话请求,即VOLTE,当然还可以是基于5G的通话请求或短距离通话请求,例如对讲机等等。
步骤S202、智能手机接收该通话连接传送的第一语音信息,识别该第一语音信息对应的第一语种以及第一方言,获取第一方言对应翻译模型将该第一方言的第一语音信息翻译成第二方言的第二语音信息;
上述第二方言为预设设定的方言,例如四川话,例如上海话,例如闽南语。例如粤语。
上述识别该第一语音信息对应的第一语种以及第一方言具体可以包括:
提取第一语音信息对应的终端的当前位置,识别当前位置的国别为城市,将该国别对应的语言确定为第一语种,将该城市对应的方言确定为第一方言。
具体的,以一个实际的例子来说,如终端A所在位置为中国广州,那么确定中国对应的语言中文为第一语种,确定广州对应的方言粤语确定为第一方言。
上述识别该第一语音信息对应的第一语种以及第一方言具体可以包括:
提取第一语言信息对应的终端的号码,确定该号码对应的用户的籍贯,确定该籍贯对应的国家的语言为第一语种,确定该籍贯对应的方言确定为第一方言。
具体的,例如,用户A发送的而第一语言信息,用户A的号码为13901234567,则依据该号码确定归属地为用户A的籍贯为中国北京,则确定中文为第一语种,确定北京对应的方言北京话为第一方言。
可选的,上述识别该第一语音信息对应的第一语种以及第一方言具体可以包括:
将该第一语音信息发送至分类器中进行分类处理得到该第一语音信息对应的第一语种以及第一方言。上述分类器具体可以为,神经网络模型,当然还可以为其他的分类器,例如机器学习、深度学习模型等等。
上述获取第一方言对应翻译模型将该第一方言的第一语音信息翻译成第二方言的第二语音信息的方法具体可以包括:
如该翻译模型为深度学习模型,确定深度学习模型中第一方言对应的权值的第一位置范围,保留权值的第一位置范围内的元素值,将权值的剩余位置全部置零的该第一方言对应的第一权值,将该第一权值与该第一方言对应的输入数据计算翻译得到第二方言的第二语音信息。
此基于的原理为,例如一个权值,以一个三维数据为例,其可以为权值CI*H*W,其中,CI为深度值、H为高度值、W为宽度值,对于权值的分布,因为该翻译模型需要涉及很多语言,例如科大讯飞的翻译模型能够涉及40多种语言,对于不同的语言,其使用的权值的范围不同,例如,如果为中文,那么其可能使用权值CI*H*W中的1*H*W、2*H*W、3*H*W,即深度层中的第1、2、3层,当然还可以细分,例如粤语为1*H*W,北京话为2*H*W等等,这里不在一一举例。那么其他的权值的计算不仅会增加计算量,其计算的结果也会对翻译结果干扰,所以这里将其他位置范围进行置零,这样避免了其他层的元素值对有效元素值进行影响,提高了翻译的准确性。
可选的,上述将该将该第一方言的第一语音信息翻译成第二方言的第二语音信息的方法可以采用通用的方法来实现,例如科大讯飞的翻译机器人来实现,当然还可以通过其他的方式,例如谷歌语音、苹果语音(siri)来实现。
步骤S203、智能手机将该第二方言的第二语音信息通过发声设备播放。
本申请提供的技术方案在接收通话请求时,接听该通话请求建立通话连接,依据该通话连接接收第一语音信息后,确定第一语音信息的第一语种以及第一方言,然后提取与第一方言对应的翻译模型来实现对第一方言翻译成第二方言的第二语音信息,这样就实现了同种语种的不同方言的翻译,降低了沟通交流成本,提高了用户体验度。
上述将第一语言信息组成输入矩阵E的方法可以采用现有的分类识别算法的输入矩阵组成方法来得到,例如,采集第一语言信息的波形图(例如可以直接通过录音软件来采集该波形图),将该波形图中采样多个值,将多个值按顺序排列组成该输入矩阵。当然还可以采用其他的方式,本申请并不局限上述输入矩阵的组成方式。
上述确将该第一权值与该第一方言对应的输入数据计算如包括矩阵运算,该矩阵运算具体可以包括:
如输入矩阵E与权值矩阵p的矩阵乘法运算,将输入矩阵E按列数拆分成α个列矩阵,将权值矩阵p按行数拆分成α个行矩阵;将α个列矩阵和α个行矩阵分别发送给α个计算单元进行内积运算得到α个矩阵子结果,将α个矩阵子结果对应位置的值相加即得到计算结果。
为了提高计算速度,这里将输入矩阵E以及权值矩阵p按拆分成α个列矩阵与α个行矩阵,然后将列矩阵以及行矩阵对应分发给一个计算装置来计算,例如第1个列矩阵和第1个行矩阵发送第一计算单元,第2个列矩阵和第2个行矩阵发送第二计算单元,以此类推,即能够实现拆分和计算,从而实现并行计算,提高计算速度。
参阅图3,下面以一个实际的例子,为了方便描述,这里的输入矩阵E为5*10矩阵,该权值矩阵为10*1矩阵,
如果α为5,那么对输入矩阵E1按列切割成5个1*10列矩阵,将该10*1矩阵切割成5个2*1矩阵,将第一个1*10列矩阵以及2*1矩阵分配给第一计算单元,同理,将其他的分配个其他4个计算单元进行计算即能够得到5个结果矩阵,然后将5个结果矩阵对应位置的数值相加即为输入矩阵E与权值矩阵的计算结果。
本申请提供的技术方案通过拆分以及并行计算的方法来实现对输入数据与权值数据的并行计算,不仅提高了计算速度,并且对于多个计算单元的内存的要求也较低,因为拆分数据以后的数据量小了,相对的内存也教小,上述计算单元具体可以为,加法器和乘法器的组合。
参阅图4,图4提供一种智能手机,所述智能手机包括:处理器401、通信单元402和发声设备403(扬声器或听筒),
所述通信单元,用于接收终端发送的通话请求,接通该通话请求,建立通话连接,接收该通话连接传送的第一语音信息;
所述处理器,用于识别该第一语音信息对应的第一语种以及第一方言,获取第一方言对应翻译模型将该第一方言的第一语音信息翻译成第二方言的第二语音信息,控制所述发声设备将该第二方言的第二语音信息播放。
本发明实施例还提供一种计算机存储介质,其中,该计算机存储介质存储用于电子数据交换的计算机程序,该计算机程序使得计算机执行如上述方法实施例中记载的任何一种支持全球语言翻译的方法的部分或全部步骤。
本发明实施例还提供一种计算机程序产品,所述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,所述计算机程序可操作来使计算机执行如上述方法实施例中记载的任何一种支持全球语言翻译的方法的部分或全部步骤。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于可选实施例,所涉及的动作和模块并不一定是本发明所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件程序模块的形式实现。
所述集成的单元如果以软件程序模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储器中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储器包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储器中,存储器可以包括:闪存盘、只读存储器(英文:Read-Only Memory,简称:ROM)、随机存取器(英文:Random Access Memory,简称:RAM)、磁盘或光盘等。
以上对本发明实施例进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (7)

1.一种支持全球语言翻译的方法,其特征在于,所述方法包括如下步骤:
智能手机接收终端发送的通话请求,接通该通话请求,建立通话连接;
智能手机接收该通话连接传送的第一语音信息,识别该第一语音信息对应的第一语种以及第一方言,获取第一方言对应翻译模型将该第一方言的第一语音信息翻译成第二方言的第二语音信息;
智能手机将该第二方言的第二语音信息通过发声设备播放;
所述获取第一方言对应翻译模型将该第一方言的第一语音信息翻译成第二方言的第二语音信息的方法具体包括:
如该翻译模型为深度学习模型,确定深度学习模型中第一方言对应的权值的第一位置范围,保留权值的第一位置范围内的元素值,将权值的剩余位置全部置零的该第一方言对应的第一权值,将该第一权值与该第一方言对应的输入数据计算翻译得到第二方言的第二语音信息;
将该第一权值与该第一方言对应的输入数据计算如包括矩阵运算,该矩阵运算具体包括:
如输入矩阵E与权值矩阵p的矩阵乘法运算,将输入矩阵E按列数拆分成α个列矩阵,将权值矩阵p按行数拆分成α个行矩阵;将α个列矩阵和α个行矩阵分别发送给α个计算单元进行内积运算得到α个矩阵子结果,将α个矩阵子结果对应位置的值相加即得到计算结果。
2.根据权利要求1所述的方法,其特征在于,所述识别该第一语音信息对应的第一语种以及第一方言具体包括:
提取第一语音信息对应的终端的当前位置,识别当前位置的国别为城市,将该国别对应的语言确定为第一语种,将该城市对应的方言确定为第一方言。
3.根据权利要求1所述的方法,其特征在于,所述识别该第一语音信息对应的第一语种以及第一方言具体包括:
提取第一语言信息对应的终端的号码,确定该号码对应的用户的籍贯,确定该籍贯对应的国家的语言为第一语种,确定该籍贯对应的方言确定为第一方言。
4.一种智能手机,所述智能手机包括:处理器、通信单元和发声设备,其特征在于,
所述通信单元,用于接收终端发送的通话请求,接通该通话请求,建立通话连接,接收该通话连接传送的第一语音信息;
所述处理器,用于识别该第一语音信息对应的第一语种以及第一方言,获取第一方言对应翻译模型将该第一方言的第一语音信息翻译成第二方言的第二语音信息,控制所述发声设备将该第二方言的第二语音信息播放;
所述处理器,具体用于如该翻译模型为深度学习模型,确定深度学习模型中第一方言对应的权值的第一位置范围,保留权值的第一位置范围内的元素值,将权值的剩余位置全部置零的该第一方言对应的第一权值,将该第一权值与该第一方言对应的输入数据计算翻译得到第二方言的第二语音信息;
将该第一权值与该第一方言对应的输入数据计算如包括矩阵运算,该矩阵运算具体包括:
如输入矩阵E与权值矩阵p的矩阵乘法运算,将输入矩阵E按列数拆分成α个列矩阵,将权值矩阵p按行数拆分成α个行矩阵;将α个列矩阵和α个行矩阵分别发送给α个计算单元进行内积运算得到α个矩阵子结果,将α个矩阵子结果对应位置的值相加即得到计算结果。
5.根据权利要求4所述的智能手机,其特征在于,
所述处理器,具体用于提取第一语音信息对应的终端的当前位置,识别当前位置的国别为城市,将该国别对应的语言确定为第一语种,将该城市对应的方言确定为第一方言。
6.根据权利要求4所述的智能手机,其特征在于,
所述处理器,具体提取第一语言信息对应的终端的号码,确定该号码对应的用户的籍贯,确定该籍贯对应的国家的语言为第一语种,确定该籍贯对应的方言确定为第一方言。
7.一种计算机可读存储介质,其存储用于电子数据交换的程序,其中,所述程序使得终端执行如权利要求1-3任意一项提供的方法。
CN201811211343.7A 2018-10-17 2018-10-17 支持全球语言翻译的方法及手机 Active CN109088995B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201811211343.7A CN109088995B (zh) 2018-10-17 2018-10-17 支持全球语言翻译的方法及手机
US16/296,248 US10922497B2 (en) 2018-10-17 2019-03-08 Method for supporting translation of global languages and mobile phone

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811211343.7A CN109088995B (zh) 2018-10-17 2018-10-17 支持全球语言翻译的方法及手机

Publications (2)

Publication Number Publication Date
CN109088995A CN109088995A (zh) 2018-12-25
CN109088995B true CN109088995B (zh) 2020-11-13

Family

ID=64843734

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811211343.7A Active CN109088995B (zh) 2018-10-17 2018-10-17 支持全球语言翻译的方法及手机

Country Status (2)

Country Link
US (1) US10922497B2 (zh)
CN (1) CN109088995B (zh)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111476039B (zh) * 2019-01-04 2023-06-30 深圳永德利科技股份有限公司 智能车载系统的即时语言翻译方法及相关产品
CN109660672A (zh) * 2019-01-09 2019-04-19 浙江强脑科技有限公司 语音类型的转换方法、设备及计算机可读存储介质
CN110047505A (zh) * 2019-03-07 2019-07-23 永德利硅橡胶科技(深圳)有限公司 基于神经网络的全语通的实现方法及相关产品
CN110032743A (zh) * 2019-03-07 2019-07-19 永德利硅橡胶科技(深圳)有限公司 多人模式的全语通的实现方法及相关产品
CN109979432B (zh) * 2019-04-02 2021-10-08 科大讯飞股份有限公司 一种方言翻译方法及装置
CN110442881A (zh) * 2019-08-06 2019-11-12 上海祥久智能科技有限公司 一种语音转换的信息处理方法和装置
CN111369973A (zh) * 2020-02-28 2020-07-03 广州三星通信技术研究有限公司 用于在电子终端中选择翻译工具的方法和设备
CN112085090A (zh) * 2020-09-07 2020-12-15 百度在线网络技术(北京)有限公司 翻译方法、装置以及电子设备
CN112818704B (zh) * 2021-01-19 2024-04-02 传神语联网网络科技股份有限公司 基于线程间共识反馈的多语种翻译系统与方法
CN112818703B (zh) * 2021-01-19 2024-02-27 传神语联网网络科技股份有限公司 基于多线程通信的多语种共识翻译系统与方法
CN112818705B (zh) * 2021-01-19 2024-02-27 传神语联网网络科技股份有限公司 基于组间共识的多语种语音翻译系统与方法
US20220293098A1 (en) * 2021-03-15 2022-09-15 Lenovo (Singapore) Pte. Ltd. Dialect correction and training
CN114900724A (zh) * 2022-05-25 2022-08-12 龙宇天下(北京)文化传媒有限公司 一种基于互联网的智能收视终端
CN116416969A (zh) * 2023-06-09 2023-07-11 深圳市江元科技(集团)有限公司 一种基于大数据的多语言实时翻译方法、系统和介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106372065A (zh) * 2016-10-27 2017-02-01 新疆大学 一种多语言网站开发方法及系统
KR20170102737A (ko) * 2016-03-02 2017-09-12 한국전자통신연구원 공유된 개념벡터공간의 학습을 통한 자동번역 시스템 및 방법
CN107818086A (zh) * 2016-09-13 2018-03-20 株式会社东芝 机器翻译方法和装置

Family Cites Families (49)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6807574B1 (en) * 1999-10-22 2004-10-19 Tellme Networks, Inc. Method and apparatus for content personalization over a telephone interface
US20030065504A1 (en) * 2001-10-02 2003-04-03 Jessica Kraemer Instant verbal translator
US20050144012A1 (en) * 2003-11-06 2005-06-30 Alireza Afrashteh One button push to translate languages over a wireless cellular radio
US20080306727A1 (en) * 2005-03-07 2008-12-11 Linguatec Sprachtechnologien Gmbh Hybrid Machine Translation System
US7894596B2 (en) * 2005-09-13 2011-02-22 Language Line Services, Inc. Systems and methods for providing language interpretation
US8898052B2 (en) * 2006-05-22 2014-11-25 Facebook, Inc. Systems and methods for training statistical speech translation systems from speech utilizing a universal speech recognizer
US8972268B2 (en) * 2008-04-15 2015-03-03 Facebook, Inc. Enhanced speech-to-speech translation system and methods for adding a new word
WO2009002336A1 (en) * 2007-06-26 2008-12-31 Jeffrey Therese M Enhanced telecommunication system
US8041555B2 (en) * 2007-08-15 2011-10-18 International Business Machines Corporation Language translation based on a location of a wireless device
US20100082328A1 (en) * 2008-09-29 2010-04-01 Apple Inc. Systems and methods for speech preprocessing in text to speech synthesis
US8868430B2 (en) * 2009-01-16 2014-10-21 Sony Corporation Methods, devices, and computer program products for providing real-time language translation capabilities between communication terminals
US20100299150A1 (en) * 2009-05-22 2010-11-25 Fein Gene S Language Translation System
US9547642B2 (en) * 2009-06-17 2017-01-17 Empire Technology Development Llc Voice to text to voice processing
US8682640B2 (en) * 2009-11-25 2014-03-25 International Business Machines Corporation Self-configuring language translation device
US20120046933A1 (en) * 2010-06-04 2012-02-23 John Frei System and Method for Translation
US20120330643A1 (en) * 2010-06-04 2012-12-27 John Frei System and method for translation
US20120109649A1 (en) * 2010-11-01 2012-05-03 General Motors Llc Speech dialect classification for automatic speech recognition
US8738355B2 (en) * 2011-01-06 2014-05-27 Qualcomm Incorporated Methods and apparatuses for providing predictive translation information services to mobile stations
US20150161114A1 (en) * 2011-06-30 2015-06-11 Google Inc. Rules-based language detection
US20140358516A1 (en) * 2011-09-29 2014-12-04 Google Inc. Real-time, bi-directional translation
WO2013077110A1 (ja) * 2011-11-22 2013-05-30 Necカシオモバイルコミュニケーションズ株式会社 翻訳装置、翻訳システム、翻訳方法およびプログラム
US9257115B2 (en) * 2012-03-08 2016-02-09 Facebook, Inc. Device for extracting information from a dialog
US9842585B2 (en) * 2013-03-11 2017-12-12 Microsoft Technology Licensing, Llc Multilingual deep neural network
US9430465B2 (en) * 2013-05-13 2016-08-30 Facebook, Inc. Hybrid, offline/online speech translation system
US9728202B2 (en) * 2013-08-07 2017-08-08 Vonage America Inc. Method and apparatus for voice modification during a call
US9299358B2 (en) * 2013-08-07 2016-03-29 Vonage America Inc. Method and apparatus for voice modification during a call
US9818397B2 (en) * 2013-08-26 2017-11-14 Google Technology Holdings LLC Method and system for translating speech
JP6178198B2 (ja) * 2013-09-30 2017-08-09 株式会社東芝 音声翻訳システム、方法およびプログラム
US20150347399A1 (en) * 2014-05-27 2015-12-03 Microsoft Technology Licensing, Llc In-Call Translation
US9614969B2 (en) * 2014-05-27 2017-04-04 Microsoft Technology Licensing, Llc In-call translation
US20180013893A1 (en) * 2014-08-05 2018-01-11 Speakez Ltd. Computerized simultaneous interpretation system and network facilitating real-time calls and meetings
US20160170970A1 (en) * 2014-12-12 2016-06-16 Microsoft Technology Licensing, Llc Translation Control
US9477652B2 (en) * 2015-02-13 2016-10-25 Facebook, Inc. Machine learning dialect identification
CN105573988A (zh) * 2015-04-28 2016-05-11 宇龙计算机通信科技(深圳)有限公司 一种语音转换的方法及终端
CN106484682B (zh) * 2015-08-25 2019-06-25 阿里巴巴集团控股有限公司 基于统计的机器翻译方法、装置及电子设备
CN106598955A (zh) * 2015-10-20 2017-04-26 阿里巴巴集团控股有限公司 语音翻译方法及装置
CN106804031B (zh) * 2015-11-26 2020-08-07 中国移动通信集团公司 一种话音转换方法及装置
CN105551480B (zh) * 2015-12-18 2019-10-15 百度在线网络技术(北京)有限公司 方言转换方法及装置
US10067938B2 (en) * 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US20200125643A1 (en) * 2017-03-24 2020-04-23 Jose Rito Gutierrez Mobile translation application and method
KR102329127B1 (ko) * 2017-04-11 2021-11-22 삼성전자주식회사 방언을 표준어로 변환하는 방법 및 장치
US10460746B2 (en) * 2017-10-31 2019-10-29 Motorola Solutions, Inc. System, method, and device for real-time language detection and real-time language heat-map data structure creation and/or modification
WO2019084890A1 (en) * 2017-11-03 2019-05-09 Tencent Technology (Shenzhen) Company Limited Method and system for processing audio communications over a network
CN108009159A (zh) * 2017-11-30 2018-05-08 上海与德科技有限公司 一种同声传译方法和移动终端
US11531779B2 (en) * 2017-12-11 2022-12-20 Digital Guardian Llc Systems and methods for identifying personal identifiers in content
US11404057B2 (en) * 2018-02-23 2022-08-02 Accenture Global Solutions Limited Adaptive interactive voice response system
US11568237B2 (en) * 2018-05-10 2023-01-31 Samsung Electronics Co., Ltd. Electronic apparatus for compressing recurrent neural network and method thereof
CN109327614B (zh) * 2018-10-17 2021-01-26 永德利硅橡胶科技(深圳)有限公司 全球同声传译手机及方法
US11257483B2 (en) * 2019-03-29 2022-02-22 Intel Corporation On-device neural network adaptation with binary mask learning for language understanding systems

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20170102737A (ko) * 2016-03-02 2017-09-12 한국전자통신연구원 공유된 개념벡터공간의 학습을 통한 자동번역 시스템 및 방법
CN107818086A (zh) * 2016-09-13 2018-03-20 株式会社东芝 机器翻译方法和装置
CN106372065A (zh) * 2016-10-27 2017-02-01 新疆大学 一种多语言网站开发方法及系统

Also Published As

Publication number Publication date
CN109088995A (zh) 2018-12-25
US20200125644A1 (en) 2020-04-23
US10922497B2 (en) 2021-02-16

Similar Documents

Publication Publication Date Title
CN109088995B (zh) 支持全球语言翻译的方法及手机
CN109871532B (zh) 文本主题提取方法、装置及存储介质
US20210027788A1 (en) Conversation interaction method, apparatus and computer readable storage medium
CN103077714B (zh) 信息的识别方法和装置
CN105976812B (zh) 一种语音识别方法及其设备
CN110444198B (zh) 检索方法、装置、计算机设备和存储介质
CN112685565A (zh) 基于多模态信息融合的文本分类方法、及其相关设备
US9047868B1 (en) Language model data collection
CN109327614B (zh) 全球同声传译手机及方法
CN109117742B (zh) 手势检测模型处理方法、装置、设备及存储介质
CN105096934A (zh) 构建语音特征库的方法、语音合成方法、装置及设备
JP2020004382A (ja) 音声対話方法及び装置
CN107707404A (zh) 网站在线人数统计方法、装置和网站服务器
CN104915458A (zh) 一种在用户搜索应用时自动联想的方法、系统及移动终端
CN106776543A (zh) 新词发现方法、装置、终端及服务器
CN104038637B (zh) 一种铃声播放方法、装置及移动终端
CN111128130B (zh) 语音数据处理方法和装置及电子装置
CN108090044A (zh) 联系方式的识别方法和装置
CN113051384A (zh) 基于对话的用户画像抽取方法及相关装置
CN107623620B (zh) 随机性交互数据的处理方法、网络服务器及智能对话系统
CN108717851A (zh) 一种语音识别方法及装置
CN111339786B (zh) 语音处理方法、装置、电子设备及存储介质
CN114038451A (zh) 对话数据的质检方法、装置、计算机设备及存储介质
CN111382322B (zh) 字符串相似度的确定方法和装置
CN111126081B (zh) 全球通用语言终端及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP03 Change of name, title or address

Address after: 518000 1st floor (1st floor to 3rd floor), 10th floor (1st floor to 3rd floor), 11th floor (1st floor to 3rd floor), 13th floor, Xiacun community, Gongming street, Guangming District, Shenzhen, Guangdong

Patentee after: Shenzhen yongdeli Technology Co.,Ltd.

Address before: 518000 No.4 and No.11, Xiacun community, Gongming office, Guangming New District, Shenzhen City, Guangdong Province

Patentee before: YONGDELI SILICONE RUBBER TECHNOLOGY (SHENZHEN) Co.,Ltd.

CP03 Change of name, title or address