CN111931521A - 语音翻译方法、可穿戴设备、终端设备及存储介质 - Google Patents
语音翻译方法、可穿戴设备、终端设备及存储介质 Download PDFInfo
- Publication number
- CN111931521A CN111931521A CN201910335237.8A CN201910335237A CN111931521A CN 111931521 A CN111931521 A CN 111931521A CN 201910335237 A CN201910335237 A CN 201910335237A CN 111931521 A CN111931521 A CN 111931521A
- Authority
- CN
- China
- Prior art keywords
- language
- voice
- translation
- target
- translated
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000013519 translation Methods 0.000 title claims abstract description 169
- 238000000034 method Methods 0.000 title claims abstract description 95
- 230000036651 mood Effects 0.000 claims description 31
- 238000004891 communication Methods 0.000 claims description 19
- 238000004590 computer program Methods 0.000 claims description 17
- 230000006870 function Effects 0.000 abstract description 7
- 230000003993 interaction Effects 0.000 abstract description 7
- 230000008569 process Effects 0.000 description 12
- 238000012545 processing Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 239000004984 smart glass Substances 0.000 description 5
- 238000011161 development Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000004622 sleep time Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 230000036760 body temperature Effects 0.000 description 1
- 210000000988 bone and bone Anatomy 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011982 device technology Methods 0.000 description 1
- 230000002996 emotional effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000010030 laminating Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- 230000003238 somatosensory effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Machine Translation (AREA)
Abstract
本申请公开了语音翻译方法、可穿戴设备、终端设备及存储介质,该语音翻译方法,应用于可穿戴设备,包括:生成语音翻译请求,语音翻译请求包括待翻译语音和需翻译成的目标语种;发送语音翻译请求至终端设备,以使终端设备将待翻译语音翻译为以目标语种表述的翻译结果;接收终端设备返回的翻译结果。通过该方法,使得可穿戴设备可以通过与终端设备进行交互实现语音翻译的功能。
Description
技术领域
本申请涉及可穿戴设备技术领域,特别是涉及语音翻译方法、可穿戴设备、终端设备及存储介质。
背景技术
可穿戴设备即直接穿在身上,或是整合到用户的衣服或配件的一种便携式设备。可穿戴设备不仅是一种硬件设备,更可以通过软件支持以及数据交互、云端交互来实现强大的功能。随着移动通信技术的发展和人们生活水平的不断提高,可穿戴设备开始为越来越多的人所接受和使用,成为了不可缺少的娱乐以及通信工具。
随着社会生活的发展,人们跨语言沟通的需求也在急剧增长,当沟通双方无法听懂或使用对方的语言时,就需要借助翻译。
发明内容
本申请主要解决的技术问题提供一种适用于可穿戴设备的语音翻译方法,能够使可穿戴设备实现语音翻译功能。
为解决上述技术问题,本申请采用的一个技术方案是:提供一种语音翻译方法,应用于可穿戴设备,该方法包括:生成语音翻译请求,语音翻译请求包括待翻译语音和需翻译成的目标语种;发送语音翻译请求至终端设备,以使终端设备将待翻译语音翻译成以目标语种表述的翻译结果;接收终端设备返回的翻译结果。
为解决上述技术问题,本申请采用的一个技术方案是:提供一种语音翻译方法,应用于终端设备,该方法包括:接收来自可穿戴设备的语音翻译请求,语音翻译请求包括待翻译语音和需翻译成的目标语种;将待翻译语音翻译成以目标语种表述的翻译结果;发送翻译结果至可穿戴设备。
为解决上述技术问题,本申请采用的另一个技术方案是:提供一种可穿戴设备,该可穿戴设备包括:第一处理器、第一存储器以及第一通信电路,第一处理器耦接第一通信电路和第一存储器,第一存储器中存储有计算机程序,第一处理器执行计算机程序时实现上述语音翻译方法的步骤。
为解决上述技术问题,本申请采用的另一个技术方案是:提供一种终端设备,该终端设备包括:第二处理器、第二存储器以及第二通信电路,第二处理器耦接第二通信电路和第二存储器,第二存储器中存储有计算机程序,第二处理器执行计算机程序时实现上述语音翻译方法的步骤。
为解决上述技术问题,本申请采用的另一个技术方案是:提供一种存储介质,存储有计算机程序,计算机程序能够被执行以实现上述语音翻译方法的步骤。
本申请的有益效果是:区别于现有技术的情况,本申请通过生成语音翻译请求,语音翻译请求包括待翻译语音和需翻译成的目标语种;发送语音翻译请求至终端设备,以使终端设备将待翻译语音翻译成以目标语种表述的翻译结果,最终接收终端设备返回的翻译结果。可使得可穿戴设备将需要翻译的语音请求发送至另一终端设备进行处理,并接收翻译结果,从而不受其自身硬件结构和数据处理能力的限制,通过与终端设备进行交互实现语音翻译的功能。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请语音翻译方法第一实施例的流程示意图;
图2是本申请语音翻译方法第二实施例的流程示意图;
图3是本申请语音翻译方法第三实施例的流程示意图;
图4是本申请语音翻译方法第四实施例的流程示意图;
图5是本申请语音翻译方法第五实施例的流程示意图;
图6是本申请语音翻译方法第六实施例的流程示意图;
图7是本申请语音翻译方法第七实施例的流程示意图;
图8是本申请语音翻译方法第八实施例的流程示意图;
图9是是本申请可穿戴设备第一实施例的结构示意图;
图10是本申请终端设备第一实施例的结构示意图;
图11是本申请存储介质第一实施例的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
请参阅图1,图1是本申请语音翻译方法第一实施例的流程示意图。
本实施例的语音翻译方法,应用于可穿戴设备,该方法包括:
S102:生成语音翻译请求,语音翻译请求包括待翻译语音和需翻译成的目标语种。
所生成的语音翻译请求包括待翻译语音和需翻译成的目标语种,举例说明,若需要将用户用中文表述的语音翻译为用英文表述的翻译结果,则待翻译语音可为中文语音,目标语种为英文。
S104:发送语音翻译请求至终端设备,以使终端设备将待翻译语音翻译成以目标语种表述的翻译结果。
在本实施例中,在发送语音翻译请求至终端设备前,可穿戴设备可按照预设方式与终端设备建立连接。其中,预设方式可以是蓝牙连接、WIFI连接、蜂窝连接或者其他连接方式。
可穿戴设备还可以按照连接方式的优先级顺序,在不同情况下选择不同的方式进行连接。例如,当检测到为有网络状态时,可优先尝试进行WIFI连接,当检测到为无网络状态或者网络状态不稳定时,可优先尝试进行蓝牙连接。
S106:接收终端设备返回的翻译结果。
在本实施例中,可穿戴设备接收的翻译结果,可以是直接用于播放的以目标语种表述的语音,也可以是需要进一步解析该翻译结果后所获得的以目标语种表述的语音。
在本实施例所提供的语音翻译方法中,通过生成语音翻译请求,语音翻译请求包括待翻译语音和需翻译成的目标语种;发送语音翻译请求至终端设备,以使终端设备将待翻译语音翻译为以目标语种表述的翻译结果,最终接收终端设备返回的翻译结果,可使得可穿戴设备将需要翻译的语音请求发送至另一终端设备进行处理,并接收翻译结果,从而不受其自身硬件结构和数据处理能力的限制,通过与终端设备进行交互实现语音翻译的功能。
请参阅图2,图2是本申请语音翻译方法第二实施例中的流程示意图。
本申请语音翻译方法第二实施例是基于本申请语音翻译方法第一实施例的,因此本实施例与第一实施例相同的步骤不再赘述,可以参照第一实施例中的描述。
本实施例中,生成语音翻译请求包括:
S202:识别周边环境中语音信息的主要语种。
本实施例中,在S202之前,可穿戴设备可接收一定时长的语音信息,例如10s,若识别出周边环境中语音信息仅包含一个语种,则将该语种确定为主要语种;若识别出周边环境中语音信息包括多个语种,则可确定在这10s中占时最长的一个语种为主要语种,或者音量最大的一个语种为主要语种。
该周边环境中语音信息可由可穿戴设备进行采集,也可由终端设备进行采集后,发送给可穿戴设备。
对周边环境中语音信息进行语言识别,可以在用户不知道或不确定对方使用的是何种语言的情况下,得到周边环境中他人所使用的语言的主要语种,以便后续翻译,从而与他人进行沟通。
S204:接收待翻译语音。
接收的待翻译语音可以是可穿戴设备自身进行采集所得到的待翻译语音,也可以是由终端设备进行采集后,发送给可穿戴设备的待翻译语音。
在一个应用场景中,例如,可穿戴设备为智能眼镜,终端设备为手机,用户可以选择由智能眼镜采集用户自身所产生的待翻译语音,由手机采集对话方所产生的待翻译语音,此时手机可充当话筒的功能,以达到更好的收音效果。
本实施例中,在接收待翻译语音后,识别待翻译语音的语种,以进行下一步的判断。
S205:判断待翻译语音的语种与常用语种是否一致。
需要说明的是,常用语种是指用户能够识懂的经常使用的语种。
常用语种可以由用户进行设定,举例说明,当用户能够熟练掌握的语种为中文时,可将中文设定为常用语种,当用户能够熟练掌握的语种为中文、英文和日文时,可将中文、英文和日文都常用语种。当常用语种为两个以上时,用户可设定优先级别,如优先使用中文,其次为英文,最后为日文。
当用户未进行设定时,常用语种也可由系统默认生成。例如:当可穿戴设备的系统操作语言为中文时,系统可将中文默认为常用语种。
若待翻译语音的语种与常用语种一致,则执行S206;若待翻译语音的语种与常用语种不一致,则执行S208。
S206:设置主要语种为目标语种。
若待翻译语音的语种与常用语种一致,则可判断是需要翻译用户自己说的话,此时,设置主要语种为目标语种,则会将用户的说的话翻译成以主要语种表述的翻译结果,从而让对方听懂用户说的话。
举例说明,当用户的常用语言包括中文,待翻译语音的语种也是中文,且识别出周边环境中语音信息的主要语种是英文,当判断待翻译语音的语种与常用语种一致时,系统将自动地将中文翻译为英文,使得他人可以听到用英文表述的用户说的话。
S208:设置常用语种为目标语种。
若待翻译语音的语种与常用语种不一致,则可判断是需要翻译除用户以外的其他人说的话,此时,设置常用语种为目标语种,则会将其他人的语音翻译为以常用语种表述的翻译结果,从而让用户听懂对方说的话。
举例说明,当用户的常用语言包括中文,待翻译语音的语种是英文,当判断待翻译语音的语种与常用语种不一致时,系统将自动将英文翻译为中文,使得用户可以通过翻译理解他人说的话。
在本实施例所提供的语音翻译方法中,通过识别周边环境中语音信息的主要语种,并判断待翻译语音的语种与常用语种是否一致,可以自动地将主要语种翻译为常用语种,或者将常用语种翻译为主要语种,从而使用户和他人可以进行实时对话,提高了沟通的效率。
在上述实施例中,步骤S202至S208的顺序是本实施例中的描述顺序,并不限制为本实施例的方法在执行过程中的顺序。在能够实现本方案的前提下,某些步骤可以调换顺序。
请参阅图3,图3是本申请语音翻译方法第三实施例的流程示意图。
本申请语音翻译方法第三实施例是基于本申请语音翻译方法第一实施例的,因此本实施例与第一实施例相同的步骤不再赘述,可以参照第一实施例中的描述。
在可穿戴设备接收终端设备返回的翻译结果之后,本实施例还包括:
S302:解析翻译结果,生成目标语音。
在其他实施例中,解析翻译结果也可在终端设备中进行,即可穿戴设备可直接接收到目标语音。
在生成或者接收到目标语音后,识别待翻译语音的语种,以进行下一步的判断。
S303:判断目标语音的语种与常用语种是否一致。
若目标语音的语种与常用语种一致,则进行步骤S304,若目标语音的语种与常用语种不一致,则进行步骤S306。
S304:使用第一音量播放目标语音。
S306:使用第二音量播放目标语音。
其中,第一音量小于第二音量。
需要说明的是,第一音量和第二音量可以是预设的一定值,也可以根据周围环境中噪音的音量进行调整。
在本实施例中,当目标语音的语种与常用语种一致时,可知目标语音是播放给用户听的,此时可使用第一音量播放目标语音;当目标语音的语种与常用语种不一致时,可知目标语音是播放给除用户之外的他人听的,此时可使用第二音量播放目标语音。且因为可穿戴设备一般都设置在用户身上,相对地距离用户较近,而距离除用户之外的他人较远,因此设置第一音量小于第二音量,一方面可以使用户在倾听目标语音时不产生过大的噪音,另一方面可以使用户之外的他人在倾听目标语音时不至于被周围环境所干扰,能够准确获知信息。
举例说明,如可穿戴设备为智能手表,当使用第一音量播放目标语音时,用户只需要将智能手表放在耳朵附近,就能以周围人难以察觉的音量听到以常用语种表述的目标语音,当使用第二音量播放目标语音时,用户可以将智能手表放置于与他人保持适当距离处,如0.5-1m,他人仍能听到翻译后的目标语音。
当可穿戴设备与人体表面贴合设置时,若目标语音的语种与常用语种一致,还可以使用骨传导的方式将目标语音传输至用户耳朵。
在其他实施例中,若目标语音的语种与常用语种不一致,可穿戴设备还可将目标语音发送至终端设备进行播放,此时,终端设备可以起到音响的效果。
在上述实施例中,步骤S302至S306的顺序是本实施例中的描述顺序,并不限制为本实施例的方法在执行过程中的顺序。在能够实现本方案的前提下,某些步骤可以调换顺序。
本实施例可以与上述本申请语音翻译方法第一实施例和第二实施例相结合。
请参阅图4,图4是本申请语音翻译方法第四实施例的流程示意图。
本申请语音翻译方法第四实施例是基于本申请语音翻译方法第一实施例的,因此本实施例与第一实施例相同的步骤不再赘述,可以参照第一实施例中的描述。
本实施例中,语音翻译方法还包括:检测用户的生理数据,获取用户的心情状态。
从而在解析翻译结果、生成目标语音时,使目标语音具有与心情状态相匹配的音色和音调。
可穿戴设备可通过传感器单元获取用户的生理数据,该生理数据可包括用户的心率数据、血氧数据和体温数据和姿势信息等能够反映用户心情状态的数据。
可选的,请参阅图4,可在采集用户的待翻译语音的同时,检测用户的生理数据,进而获取用户在录入待翻译语音时的心情状态,具体的,可包括以下步骤:
S402:采集用户的待翻译语音,检测用户的生理数据。
需要说明的是,当采集用户的待翻译语音由可穿戴设备执行时,可穿戴设备可在采集待翻译语音的同时控制传感器单元检测用户的生理数据;当采集用户的待翻译语音由终端设备执行时,可穿戴设备可接收终端设备的检测指令,以控制传感器单元在终端设备采集待翻译语音的同时检测用户的生理数据。
在采集用户的待翻译语音的同时检测用户的生理数据,可以准确反映出用户在录入待翻译语音时的心情状态。
S404:生成语音翻译请求,语音翻译请求包括待翻译语音、需翻译成的目标语种和用户的心情状态。
在本实施例中,可穿戴设备可通过处理器利用心情状态模型对采集到的生理数据进行分析和处理,得到用户的心情状态,进而生成包含用户的心情状态的语音翻译请求。
在其他实施例中,也可以将生理数据发送至终端设备,以使终端设备利用心情状态模型对采集到的生理数据进行分析和处理,得到用户的心情状态。也就是说,语音翻译请求可仅包括翻译语音、需翻译成的目标语种和用户的生理数据。
S406:发送语音翻译请求至终端设备,以使终端设备将待翻译语音翻译成以目标语种表述且匹配用户的心情状态的翻译结果。
将待翻译语音翻译成以目标语种表述的语音后,翻译后所得的语音一般不带有感情色彩,为机械朗读声,这样,就会失去语言中部分由音色、音调所传达的讯息。本实施例中,将翻译后所得的语音与用户的心情状态匹配后得到的翻译结果,能够进一步还原用户说话时的心情状态,从而使对方能够更加准确地明白用户所表达的意思。
S408:接收终端设备返回的翻译结果。
翻译结果匹配用户的心情状态。
本实施例中,通过检测用户的生理数据,获取用户的心情状态,以使目标语音具有与心情状态相匹配的音色和音调,可以使一方获知另一方的讲话时的心情状态,提高语言理解的准确性,增加沟通的舒适度。
在上述实施例中,步骤S402至S408的顺序是本实施例中的描述顺序,并不限制为本实施例的方法在执行过程中的顺序。在能够实现本方案的前提下,某些步骤可以调换顺序。
本实施例可以与上述本申请语音翻译方法第一实施例至第三实施例相结合。
在其他实施例中,可以不发送用户的生理数据或用户的心情状态至终端设备,可穿戴设备可通过处理器利用心情状态模型对采集到的生理数据进行分析和处理,得到用户的心情状态,并在接收终端设备返回的翻译结果后,使翻译结果与用户的心情状态相匹配,以使目标语音具有与心情状态相匹配的音色和音调。
在另一实施例中,接收终端设备返回的翻译结果包括:检测用户的生理数据,获取用户的心情状态,以使解析翻译结果后生成的目标语音具有与心情状态相匹配的音色和音调。
具体的,可穿戴设备可在接收终端设备返回的翻译结果的同时,检测用户的生理数据,并获取用户的心情状态。
从而在解析翻译结果后,生成匹配用户的心情状态的目标语音,以使目标语音具有与心情状态相匹配的音色和音调。
通过上述方式,使得用户听到的目标语音具有与用户当时的心情状态相匹配的音色和音调,以增加语言的亲切感。
请参阅图5,图5是本申请语音翻译方法第五实施例的流程示意图。
本申请语音翻译方法第五实施例是基于本申请语音翻译方法第一实施例的,因此本实施例与第一实施例相同的步骤不再赘述,可以参照第一实施例中的描述。
在可穿戴设备接收终端设备返回的翻译结果之后,本实施例还包括以下步骤:
S502:解析翻译结果,生成目标文字和目标语音。
在其他实施例中,解析翻译结果也可在终端设备中进行,即可穿戴设备可直接接收到目标文字和目标语音。
可选的,可穿戴设备还可以只接收目标语音,以使目标文字在终端设备上进行显示。
S504:显示目标文字,播放目标语音。
在一个应用场景中,例如,可穿戴设备为智能眼镜,用户在播放目标语音的同时,可以看到翻译后的目标文字,使得用户在与他人进行跨语言的交流的同时,更加便利的学习语言的翻译和转化。
此外,在嘈杂环境中,若对方或用户自己无法听清楚目标语音,可以通过显示的目标文字获取谈话内容,提高沟通的效率。
本实施例可以与上述本申请语音翻译方法第一实施例至第四实施例相结合。
在本申请所提供的语音翻译方法中,在进行语音翻译时需启动语音翻译程序。而启动语音翻译程序的方法有多种。
如可以是用户主动启动,用户启动语音翻译程序的方式,可以是直接在可穿戴设备的操作界面上选择相应的语音翻译app,打开该语音翻译app即启动语音翻译程序。在可穿戴设备没有操作界面或者用户不便于进行点击操作的情况下,也可以通过体感交互的方式,以特定动作启动语音翻译程序。此外,还可以通过终端设备向可穿戴设备发送控制命令,控制可穿戴设备启动语音翻译程序。
用户可以在启动语音翻译程序的同时,在可穿戴设备或者终端设备的操作界面上选择输入目标语种的名称,也可以在接收到待翻译语音的同时,通过语音输入目标语种的名称,例如,在待翻译语音录入结束时,加上“翻译成中文”等信息。在其他实施例中,用户还可以预先设置一种或多种目标语种,例如,若用户预设英文为目标语种,当用户没有选择目标语种时,则自动将英文作为目标语种。
在其他实施例中,也可以使用其他方式启动语音翻译程序和选择目标语种。
请参阅图6,图6是本申请语音翻译方法第六实施例的流程示意图。
本申请语音翻译方法第六实施例是基于本申请语音翻译方法第一实施例的,因此本实施例与第一实施例相同的步骤不再赘述,可以参照第一实施例中的描述。
在可穿戴设备生成语音翻译请求之前,本实施例还包括:
S602:采集周边环境中的语音信息。
本实施例中,可间隔设置语音信息采集时间和休眠时间,例如每分钟采集10s的语音信息,休眠50s,以降低设备的功耗。
在其他实施例中,也可以是通过与可穿戴设备进行特定的交互后,开始采集一定时长的周边环境中的语音信息。例如:按住可穿戴设备上设置的特定按键,在按键被按下的同时,采集周边环境中的语音信息。
S604:识别语音信息中的主要语种。
可穿戴设备可接收一定时长的语音信息,例如10s,若识别出周边环境中语音信息仅包含一个语种,则将该语种确定为主要语种;若识别出周边环境中语音信息包括多个语种,则可确定在这10s中占时最长的一个语种为主要语种,或者音量最大的一个语种为主要语种。
S605:判断主要语种与常用语种是否一致。
需要说明的是,常用语种是指用户能够识懂的经常使用的语种。
常用语种可以由用户进行设定,举例说明,当用户能够熟练掌握的语种为中文时,可将中文设定为常用语种,当用户能够熟练掌握的语种为中文、英文和日文时,可将中文、英文和日文都常用语种。当常用语种为两个以上时,用户可设定优先级别,如优先使用中文,其次为英文,最后为日文。
当用户未进行设定时,常用语种也可由系统默认生成。例如:当可穿戴设备的系统操作语言为中文时,系统可将中文默认生成常用语种。
若主要语种与常用语种一致,返回执行步骤S602,若主要语种与常用语种不一致,继续执行步骤S606。
S606:启动语音翻译程序。
需要说明的是,S606中,可以是系统自动启动语音翻译程序,也可以是系统提示用户启动语音翻译程序,例如,当判断主要语种与常用语种不一致,系统可以通过弹窗或者语音等方式提示用户启动语音翻译程序,用户可以通过点击屏幕、语音控制或手势控制等方式确认启动语音翻译程序。
本实施例中,通过采集周边环境中的语音信息,并识别语音信息中的主要语种,若主要语种与常用语种不一致,则启动语音翻译程序,使得用户可以更加便捷地启用可穿戴设备上的语音翻译程序,快速进入跨语言交流状态。
在上述实施例中,步骤S602至S606的顺序是本实施例中的描述顺序,并不限制为本实施例的方法在执行过程中的顺序。在能够实现本方案的前提下,某些步骤可以调换顺序。
本实施例可以与上述本申请语音翻译方法第一实施例至第五实施例相结合。
请参阅图7,图7是本申请语音翻译方法第七实施例的流程示意图。
本申请语音翻译方法第二实施例是基于本申请语音翻译方法第一实施例的,因此本实施例与第一实施例相同的步骤不再赘述,可以参照第一实施例中的描述。
在可穿戴设备生成语音翻译请求之前,本实施例还包括:
S702:采集周边环境中的语音信息。
本实施例中,可间隔设置语音信息采集时间和休眠时间,例如每分钟采集10s的语音信息,休眠50s,以降低设备的功耗。
在其他实施例中,也可以是通过与可穿戴设备进行特定的交互后,开始采集一定时长的周边环境中的语音信息。例如:按住可穿戴设备上设置的特定按键,在按键被按下的同时,采集周边环境中的语音信息。
S704:识别语音信息中的语意。
本实施例中,当语音信息是通过常用语种进行表述时,可识别语音信息中的语意,以获取语音信息中的语句、字词。
S705:判断语音信息中是否包含关键词。
关键词包括翻译命令。翻译命令可包括默认的翻译命令和用户自定义的翻译命令。默认的翻译命令可以是:开启翻译、翻译**(**为语种名称)等,默认的翻译命令还包括用几种通用语言如英文、法文、日文等进行表述的命令。用户自定义的翻译命令,以中文举例,可以是:我不会说**(**为语种名称)、我听不懂**(**为语种名称)等等。
可选的,关键词可包括翻译命令和目标语种。例如:将中文翻译为英文,将判断“翻译为”是翻译命令,“英文”为目标语种。
若语音信息中不包含关键词,返回执行步骤S702,若语音信息中包含关键词,继续执行步骤S706。
S706:启动语音翻译程序。
需要说明的是,S706中,可以是系统自动启动语音翻译程序,也可以是系统提示用户启动语音翻译程序,例如,当判断主要语种与常用语种不一致,系统可以通过弹窗或者语音等方式提示用户启动语音翻译程序,用户可以通过点击屏幕、语音控制或手势控制等方式确认启动语音翻译程序。
本实施例中,通过采集周边环境中的语音信息,并识别语音信息中的语意,若语音信息中包含关键词,则启动语音翻译程序,使得用户可以通过语音控制启用可穿戴设备上的语音翻译程序,快速进入跨语言交流状态,且可提高启动控制的准确性。
在上述实施例中,步骤S702至S706的顺序是本实施例中的描述顺序,并不限制为本实施例的方法在执行过程中的顺序。在能够实现本方案的前提下,某些步骤可以调换顺序。
本实施例可以与上述本申请语音翻译方法第一实施例至第六实施例相结合。在其他实施例中,还可以使用其他方式启动语音翻译程序,如可以是通过定位,根据位置信息判断是否启动语音翻译程序,在此不做限定。
请参阅图8,图8是本申请语音翻译方法第八实施例的流程示意图。
本实施例的语音翻译方法,应用于终端设备,该方法包括以下步骤:
S802:接收来自可穿戴设备的语音翻译请求,语音翻译请求包括待翻译语音和需翻译成的目标语种。
S804:将待翻译语音翻译成以目标语种表述的翻译结果。
S806:发送翻译结果至可穿戴设备。
本实施例以终端设备为执行主体,关于更多的步骤和内容,请参见本申请语音翻译方法第一实施例至第七实施例,在此不再赘述。
请参阅图9,图9是本申请可穿戴设备第一实施例的结构示意图。
可穿戴设备100包括第一处理器110、第一存储器120以及第一通信电路130,第一处理器110分别耦接第一存储器120和第一通信电路130,第一存储器120中存储有计算机程序,第一处理器110执行计算机程序时实现上述实施例中的语音翻译方法的步骤。可穿戴设备100中的其他元件及功能与现有可穿戴设备的器件及功能相同,在此不再赘述。
可穿戴设备100具体可以是智能手表、智能眼镜、智能手环、衣物等。
其中,第一处理器110还可以称为CPU(Central Processing Unit,中央处理单元)。第一处理器110可能是一种集成电路芯片,具有信号的处理能力。第一处理器110还可以是通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
请参阅图10,图10是本申请终端设备第一实施例的结构示意图。
终端设备200包括第二处理器210、第二存储器220以及第二通信电路230,第二处理器210分别耦接第二存储器220和第二通信电路230,第二存储器220中存储有计算机程序,第二处理器210执行计算机程序时实现上述实施例的语音翻译方法的步骤。终端设备200中的其他元件及功能与现有终端设备的器件及功能相同,在此不再赘述。
终端设备200具体可以是手机、电脑、服务器等,也可以是可穿戴设备。
其中,第二处理器210还可以称为CPU(Central Processing Unit,中央处理单元)。第二处理器210可能是一种集成电路芯片,具有信号的处理能力。第二处理器210还可以是通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
请参阅图11,图11是本申请存储介质第一实施例的结构示意图。
存储介质300存储有计算机程序310,计算机程序310能够被执行以实现上述语音翻译方法。
其中,该计算机程序310可以以软件产品的形式存储在上述存储介质300中,包括若干指令用以使得一个可穿戴设备或处理器执行本申请各个实施方式方法的全部或部分步骤。
存储介质300是计算机存储器中用于存储某种不连续物理量的媒体。而前述的存储介质300包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质,或者是手表、手环、智能眼镜等可穿戴设备。
以上仅为本申请的实施方式,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。
Claims (10)
1.一种语音翻译方法,应用于可穿戴设备,其特征在于,所述方法包括:
生成语音翻译请求,所述语音翻译请求包括待翻译语音和需翻译成的目标语种;
发送所述语音翻译请求至终端设备,以使所述终端设备将所述待翻译语音翻译成以所述目标语种表述的翻译结果;
接收所述终端设备返回的所述翻译结果。
2.根据权利要求1所述的语音翻译方法,其特征在于,所述生成语音翻译请求包括:
识别周边环境中语音信息的主要语种;
接收所述待翻译语音;
判断所述待翻译语音的语种是否与常用语种一致,所述常用语种为用户能够识懂的语种;
若所述待翻译语音的语种与所述常用语种一致,则设置所述主要语种为所述目标语种;
若所述待翻译语音的语种与所述常用语种不一致,则设置所述常用语种为所述目标语种。
3.根据权利要求1所述的语音翻译方法,其特征在于,所述接收终端设备返回的所述翻译结果,还包括:
解析所述翻译结果,生成目标语音;
判断所述目标语音的语种是否与常用语种一致,所述常用语种为用户能够识懂的语种;
若所述目标语音的语种与所述常用语种一致,则使用第一音量播放所述目标语音;
若所述目标语音的语种与所述常用语种不一致,则使用第二音量播放所述目标语音;
所述第一音量小于所述第二音量。
4.根据权利要求1所述的语音翻译方法,其特征在于,所述方法还包括:
检测用户的生理数据,获取所述用户的心情状态;
解析所述翻译结果,生成目标语音,以使所述目标语音具有与所述心情状态相匹配的音色和音调。
5.根据权利要求1所述的语音翻译方法,其特征在于,所述接收所述终端设备返回的所述翻译结果之后,还包括:
解析所述翻译结果,生成目标文字和目标语音;
显示所述目标文字,播放所述目标语音。
6.根据权利要求1所述的语音翻译方法,其特征在于,所述生成语音翻译请求之前,还包括:
采集周边环境中的语音信息;
识别所述语音信息中的主要语种,并在所述主要语种与常用语种不一致时,启动语音翻译程序,所述常用语种为用户能够识懂的语种;或
识别所述语音信息中的语意,并在所述语音信息中包含关键词时,启动语言翻译程序,所述关键词包括翻译命令。
7.一种语音翻译方法,应用于终端设备,其特征在于,所述方法包括:
接收来自可穿戴设备的语音翻译请求,所述语音翻译请求包括待翻译语音和需翻译成的目标语种;
将所述待翻译语音翻译成以所述目标语种表述的翻译结果;
发送所述翻译结果至所述可穿戴设备。
8.一种可穿戴设备,其特征在于,包括:第一处理器、第一存储器以及第一通信电路,所述第一处理器耦接所述第一通信电路和所述第一存储器,所述第一存储器中存储有计算机程序,所述第一处理器执行所述计算机程序时实现如权利要求1-6任一项所述的语音翻译方法的步骤。
9.一种终端设备,其特征在于,包括:第二处理器、第二存储器以及第二通信电路,所述第二处理器耦接所述第二通信电路和所述第二存储器,所述第二存储器中存储有计算机程序,所述第二处理器执行所述计算机程序时实现如权利要求7所述的语音翻译方法的步骤。
10.一种存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序能够被执行以实现如权利要求1-7中任一项所述的语音翻译方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910335237.8A CN111931521A (zh) | 2019-04-24 | 2019-04-24 | 语音翻译方法、可穿戴设备、终端设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910335237.8A CN111931521A (zh) | 2019-04-24 | 2019-04-24 | 语音翻译方法、可穿戴设备、终端设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111931521A true CN111931521A (zh) | 2020-11-13 |
Family
ID=73282431
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910335237.8A Withdrawn CN111931521A (zh) | 2019-04-24 | 2019-04-24 | 语音翻译方法、可穿戴设备、终端设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111931521A (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106415541A (zh) * | 2014-05-29 | 2017-02-15 | 谷歌公司 | 实时翻译来自发言者计算设备的媒体馈送及分到多个不同语言的多个收听者计算设备的技术 |
CN107729325A (zh) * | 2017-08-29 | 2018-02-23 | 捷开通讯(深圳)有限公司 | 一种智能翻译方法、存储设备及智能终端 |
CN107832309A (zh) * | 2017-10-18 | 2018-03-23 | 广东小天才科技有限公司 | 一种语言翻译的方法、装置、可穿戴设备及存储介质 |
CN108595443A (zh) * | 2018-03-30 | 2018-09-28 | 浙江吉利控股集团有限公司 | 同声翻译方法、装置、智能车载终端及存储介质 |
-
2019
- 2019-04-24 CN CN201910335237.8A patent/CN111931521A/zh not_active Withdrawn
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106415541A (zh) * | 2014-05-29 | 2017-02-15 | 谷歌公司 | 实时翻译来自发言者计算设备的媒体馈送及分到多个不同语言的多个收听者计算设备的技术 |
CN107729325A (zh) * | 2017-08-29 | 2018-02-23 | 捷开通讯(深圳)有限公司 | 一种智能翻译方法、存储设备及智能终端 |
CN107832309A (zh) * | 2017-10-18 | 2018-03-23 | 广东小天才科技有限公司 | 一种语言翻译的方法、装置、可穿戴设备及存储介质 |
CN108595443A (zh) * | 2018-03-30 | 2018-09-28 | 浙江吉利控股集团有限公司 | 同声翻译方法、装置、智能车载终端及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10964300B2 (en) | Audio signal processing method and apparatus, and storage medium thereof | |
US10013977B2 (en) | Smart home control method based on emotion recognition and the system thereof | |
US10270736B2 (en) | Account adding method, terminal, server, and computer storage medium | |
JP2023022150A (ja) | 双方向音声翻訳システム、双方向音声翻訳方法及びプログラム | |
US9570076B2 (en) | Method and system for voice recognition employing multiple voice-recognition techniques | |
EP2770445A2 (en) | Method and system for supporting a translation-based communication service and terminal supporting the service | |
KR101771071B1 (ko) | 통신 방법, 클라이언트, 및 단말 | |
CN102984666B (zh) | 一种通话过程中的通讯录语音信息处理方法及系统 | |
CN106302933B (zh) | 通话语音信息处理方法及终端 | |
KR102628211B1 (ko) | 전자 장치 및 그 제어 방법 | |
EP3444811B1 (en) | Speech recognition method and device | |
CN111696553B (zh) | 一种语音处理方法、装置及可读介质 | |
CN107483736B (zh) | 一种即时通信应用程序的消息处理方法及装置 | |
CN108874904A (zh) | 语音消息搜索方法、装置、计算机设备及存储介质 | |
CN106713111B (zh) | 一种添加好友的处理方法、终端及服务器 | |
CN108073572B (zh) | 信息处理方法及其装置、同声翻译系统 | |
CN111683317B (zh) | 一种应用于耳机的提示方法、装置、终端及存储介质 | |
CN113157240A (zh) | 语音处理方法、装置、设备、存储介质及计算机程序产品 | |
WO2022206704A1 (zh) | 一种语音交互方法及电子设备 | |
WO2022199405A1 (zh) | 一种语音控制方法和装置 | |
CN110866410A (zh) | 多语言转换方法、装置、计算机设备及存储介质 | |
EP4156177A1 (en) | Voice wake-up method, electronic device, wearable device, and system | |
CN104900226A (zh) | 一种信息处理方法和装置 | |
CN113299309A (zh) | 语音翻译方法及装置、计算机可读介质和电子设备 | |
CA3097683C (en) | Speech analysis system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20201113 |
|
WW01 | Invention patent application withdrawn after publication |