CN113660375A - 通话方法、装置及电子设备 - Google Patents
通话方法、装置及电子设备 Download PDFInfo
- Publication number
- CN113660375A CN113660375A CN202110919873.2A CN202110919873A CN113660375A CN 113660375 A CN113660375 A CN 113660375A CN 202110919873 A CN202110919873 A CN 202110919873A CN 113660375 A CN113660375 A CN 113660375A
- Authority
- CN
- China
- Prior art keywords
- information
- call
- terminal equipment
- content
- opposite
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 105
- 230000006854 communication Effects 0.000 claims abstract description 39
- 238000004891 communication Methods 0.000 claims abstract description 37
- 230000015572 biosynthetic process Effects 0.000 claims abstract description 18
- 238000005516 engineering process Methods 0.000 claims abstract description 18
- 238000003786 synthesis reaction Methods 0.000 claims abstract description 18
- 238000006243 chemical reaction Methods 0.000 claims description 8
- 239000000725 suspension Substances 0.000 claims description 4
- 230000006870 function Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000007599 discharging Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/72—Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
- H04M1/724—User interfaces specially adapted for cordless or mobile telephones
- H04M1/72403—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
- H04M1/7243—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages
- H04M1/72433—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages for voice messaging, e.g. dictaphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/72—Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
- H04M1/724—User interfaces specially adapted for cordless or mobile telephones
- H04M1/72403—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
- H04M1/7243—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/72—Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
- H04M1/724—User interfaces specially adapted for cordless or mobile telephones
- H04M1/72403—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
- H04M1/7243—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages
- H04M1/72436—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages for text messaging, e.g. short messaging services [SMS] or e-mails
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/72—Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
- H04M1/724—User interfaces specially adapted for cordless or mobile telephones
- H04M1/72403—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
- H04M1/7243—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages
- H04M1/72439—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages for image or video messaging
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- General Business, Economics & Management (AREA)
- Human Computer Interaction (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Telephone Function (AREA)
Abstract
本申请公开一种通话方法、装置及电子设备,属于通信技术领域,该方法包括:在本端设备与对端设备的通话过程中,获取第一信息,其中,所述第一信息包括以下至少一项:所述本端设备的用户输入的文本信息、图像信息、所述本端设备在历史通话中输入的和/或接收到的通话内容信息,或者所述对端设备在本次通话中输入的通话内容信息;通过语音合成技术,将所述第一信息转换为第二信息,其中,所述第二信息的类型为音频,所述音频的声音为所述本端设备的用户的声音;将所述第二信息发送至所述对端设备。
Description
技术领域
本申请属于通信技术领域,具体涉及一种通话方法、装置及电子设备。
背景技术
随着互联网技术的发展和电子设备硬件配置的升级,电子设备集成了越来越多的功能,例如拍照、支付、购物、出行等功能。虽然电子设备的功能在不断更新,性能在不断提升,外观也越来越精致,但通话始终是其最基本,也是最重要的功能。
现有技术中,在通话过程中,一些场景下,通常需要通话方需要耗费较多的精力陈述,导致通话效率较低。例如,通话方之间涉及的通话信息量较大、较复杂、较繁琐或者涉及一些一串数字或地址等不易记忆的信息等场景。
发明内容
本申请实施例的目的是提供一种通话方法、装置及电子设备,能够解决现有技术中存在的通话效率较低的问题。
第一方面,本申请实施例提供了一种通话方法,所述方法包括:
在本端设备与对端设备的通话过程中,获取第一信息,其中,所述第一信息包括以下至少一项:所述本端设备的用户输入的文本信息、图像信息、所述本端设备在历史通话中输入的和/或接收到的通话内容信息,或者所述对端设备在本次通话中输入的通话内容信息;
通过语音合成技术,将所述第一信息转换为第二信息,其中,所述第二信息的类型为音频,所述音频的声音为所述本端设备的用户的声音;
将所述第二信息发送至所述对端设备。
第二方面,本申请实施例提供了一种通话装置,所述装置包括:
获取模块,用于在本端设备与对端设备的通话过程中,获取第一信息,其中,所述第一信息包括以下至少一项:所述本端设备的用户输入的文本信息、图像信息、所述本端设备在历史通话中输入的和/或接收到的通话内容信息,或者所述对端设备在本次通话中输入的通话内容信息;
转换模块,用于通过语音合成技术,将所述第一信息转换为第二信息,其中,所述第二信息的类型为音频,所述音频的声音为所述本端设备的用户的声音;
发送模块,用于将所述第二信息发送至所述对端设备。
第三方面,本申请实施例提供了一种电子设备,该电子设备包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如第一方面所述的方法的步骤。
第四方面,本申请实施例提供了一种可读存储介质,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如第一方面所述的方法的步骤。
第五方面,本申请实施例提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现如第一方面所述的方法。
本申请实施例中,在本端设备与对端设备的通话过程中,对于需要在本次通话过程中提供给对端设备的第一信息,可以通过语音合成技术,将第一信息转换为第二信息,其中,第二信息的类型为音频,音频的声音为本端设备的用户的声音,之后将第二信息发送至对端设备。与现有技术相比,本申请实施例中,在通话过程中,对于需要提供给对端设备的信息,本端设备可以模拟本端设备的用户的声音,将信息陈述给对端设备,而无需本端设备的用户耗费较多的精力去陈述,可以减轻用户的负担,简化通话过程,进而提高通话效率。
附图说明
图1是本申请实施例提供的一种通话方法的流程图;
图2是本申请实施例提供的另一种通话方法的流程图;
图3是本申请实施例提供的一种通话装置的结构框图;
图4是本申请实施例提供的一种电子设备的结构示意图;
图5是实现本申请各个实施例的一种电子设备的硬件结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施,且“第一”、“第二”等所区分的对象通常为一类,并不限定对象的个数,例如第一对象可以是一个,也可以是多个。此外,说明书以及权利要求中“和/或”表示所连接对象的至少其中之一,字符“/”,一般表示前后关联对象是一种“或”的关系。
本申请实施例提供了一种通话方法、装置及电子设备。
下面结合附图,通过具体的实施例及其应用场景对本申请实施例提供的通话方法进行详细地说明。
图1是本申请实施例提供的一种通话方法的流程图,如图1所示,该方法可以包括以下步骤:步骤101、步骤102和步骤103,其中,
在步骤101中,在本端设备与对端设备的通话过程中,获取第一信息,其中,第一信息包括以下至少一项:本端设备的用户输入的文本信息、图像信息、本端设备在历史通话中输入的和/或接收到的通话内容信息,或者对端设备在本次通话中输入的通话内容信息。
本申请实施例中,涉及到的通话场景可以为双人通话场景,也可以为多人通话场景。当为多人通话场景时,对端设备的个数为多个。
本申请实施例中,通话场景可以为2G通话,也可以为网络语音通话,也可以为网络视频通话。
本申请实施例中,第一信息为本次通话过程中需要提供给对端设备的信息。第一信息的来源可以有多种,例如,可以来源于:本端设备的用户在历史通话中输入的、在一些通话场景中可复用的信息,或者是本端设备的用户通过摄像头采集的信息,如将摄像头对着商品详情页,详情页上写的“型号:xx”,“重量:T kg”等。
在步骤102中,通过语音合成技术,将第一信息转换为第二信息,其中,第二信息的类型为音频,音频的声音为本端设备的用户的声音。
在步骤103中,将第二信息发送至对端设备。
本申请实施例中,在将第一信息转换为第二信息之后,本端设备可以播放第二信息,这样对端设备接收到的就是:以本端设备用户的声音朗读第一信息的一段语音,既不会让对端设备的用户感觉异常,又减轻了本端设备的用户的负担。
本申请实施例中,在将第二信息发送至对端设备的过程中,若检测到对端设备输入通话内容,则暂停发送第二信息。也就是,在本端设备播放第二信息的过程中,若对端设备的用户说话,则本端设备暂停播放第二信息,以避免干扰对端设备的用户输入通话内容。
本申请实施例中,也可以在通话界面中增加“强制停止”按钮和“智能停止”按钮,点击“智能停止”会在这一小段信息而不是所有信息播放完成后暂停,点击“强制停止”会立即暂停信息播放,会进入“强制停止”状态,将线路交于通话者。具体的:在将第二信息发送至对端设备的过程中,若接收到本端设备的用户在通话界面的第二控件上的第二输入,则暂停发送第二信息,其中,第二控件用于触发暂停发送第二信息。也就是,在本端设备播放第二信息的过程中,若本端设备的用户要求暂停播放第二信息,则本端设备暂停播放第二信息。
本申请实施例中,对于视频通话场景,在将第二信息发送至对端设备的的过程中,还可以用AI伪装通话者的口型,提升通话对方的用户体验,具体的:在本端设备与对端设备的通话为视频通话的情况下,在将第二信息发送至对端设备的过程中,根据第二信息,调整本端设备的用户在视频画面中的发音口型。
由上述实施例可见,该实施例中,在本端设备与对端设备的通话过程中,对于需要在本次通话过程中提供给对端设备的第一信息,可以通过语音合成技术,将第一信息转换为第二信息,其中,第二信息的类型为音频,音频的声音为本端设备的用户的声音,之后将第二信息发送至对端设备。与现有技术相比,本申请实施例中,在通话过程中,对于需要提供给对端设备的信息,本端设备可以模拟本端设备的用户的声音,将该信息陈述给对端设备,而无需本端设备的用户耗费较多的精力去陈述,可以减轻用户的负担,简化通话过程,进而提高通话效率。
图2是本申请实施例提供的另一种通话方法的流程图,在本申请实施例中,第一信息包括:对端设备在本次通话中输入的通话内容信息,如图2所示,该方法可以包括以下步骤:步骤201、步骤202、步骤203和步骤204,其中,
在步骤201中,在本端设备与对端设备的通话过程中,识别对端设备输入的第一通话内容信息。
本申请实施例中,第一通话内容信息为本次通话过程中对端设备的用户输入的通话内容信息,第二通话内容信息为本次通话过程中本端设备的用户输入的通话内容信息。
本申请实施例中,在本端设备与对端设备的通话过程中,可以在任意时间点,自动开启识别对端设备输入的第一通话内容信息,例如,在对端设备开始通话的时间点,开启识别对端设备输入的第一通话内容信息。
本申请实施例中,也可以由本端设备的用户开启识别对端设备输入的第一通话内容信息,此时,上述步骤201具体可以包括以下步骤:
在本端设备与对端设备的通话过程中,接收本端设备的用户在通话界面的第三控件上的第三输入,响应于第三输入,识别对端设备输入的第一通话内容信息;其中,第三控件用于触发识别对端设备输入的第一通话内容信息。
在一个例子中,在通话界面中增加第三控件“记录按钮”,本端设备的用户点击“记录按钮”,本端设备开始识别对端设备输入的第一通话内容信息。
此外,在本端设备开始识别对端设备输入的第一通话内容信息后,“记录按钮”可以变为“停止记录按钮”,本端设备的用户可以通过点击“停止记录按钮”,指示本端设备停止识别对端设备输入的第一通话内容信息。在本端设备暂停识别对端设备输入的第一通话内容信息后,“停止记录按钮”又可以变为“记录按钮”。
本申请实施例中,在识别对端设备输入的第一通话内容信息时,可以主要对其进行语义识别。
本申请实施例中,可以在对端设备停止输入通话内容信息时,自动暂停识别对端设备输入的第一通话内容信息;也可以由本端设备的用户结束识别对端设备输入的第一通话内容信息,具体的:若接收到本端设备的用户在通话界面的第四控件上的第四输入,则响应于第四输入,暂停识别对端设备输入的第一通话内容信息,其中,第四控件用于触发暂停识别对端设备输入的第一通话内容信息。
在步骤202中,在识别出第一通话内容信息中包含第一预设内容的情况下,获取第一通话内容信息中与第一预设内容对应的第一信息。
本申请实施例中,第一预设内容可以为信息量较大、较复杂、较繁琐或者涉及一些一串数字或地址等不易记忆的内容,具体的,第一预设内容可以包括以下至少一项:电话号码、联系人、地址、时间、金额和订单编号,其中,订单编号可以为购物订单号、快递单号等。
在一个例子中,当识别到第一通话内容信息中包含“我的手机号码是”、“你联系一下XX同事,他的号码是”、“我的地址是”、“我的快递单号是”等需要详细记录的内容时,可以获取其相应的具体信息,即第一信息。
本申请实施例中,为了便于本端设备的用户核对第一信息,还可以将第一信息通过文字的形式显示在通话界面上,相应的,本申请实施例提供的通话方法,还可以增加以下步骤:将第一信息转换为文本信息,在通话界面上显示文本信息。
本申请实施例中,当第一信息的个数为多条时,可以将转换得到的多条文本信息,分行显示在通话界面上。
本申请实施例中,还可以以音频的方式存储第一信息,或者将第一信息转换为文本,以文本的形式存储。
在步骤203中,在满足预设通话内容复述条件的情况下,通过语音合成技术,将第一信息转换为第二信息,其中,第二信息的类型为音频,音频的声音为本端设备的用户的声音。
本申请实施例中,预设通话内容复述条件,可以包括以下任一项:
第一项,本端设备输入的第二通话内容信息中包含第二预设内容,第二预设内容中包含与复述语义相关的内容;例如,当识别到本端设备输入的第二通话内容信息中包含“我复述一下刚刚的xx,看有没有记错”时,确定满足通话内容复述条件。
第二项,对端设备输入的第一通话内容信息中包含第三预设内容,第三预设内容中包含与复述语义相关的内容;例如,当识别到对端设备输入的第一通话内容信息中包含“刚刚的xx,有记住吗”时,确定满足通话内容复述条件。
第三项,接收到本端设备的用户在通话界面的第一控件上的第一输入,第一控件用于触发向对端设备复述第一信息;例如,可以增加用于复述信息的播放按钮,当本端设备的用户手动操作该播放按钮时,确定满足通话内容复述条件。
在一个例子中,当第一信息的个数为多条时,可以针对每条第一信息设置一个第一控件,本端设备的用户可以通过选择操作哪个第一控件,来选择向对端设备复述哪条第一信息。
在步骤204中,将第二信息发送至对端设备。
本申请实施例中,在通话结束后,还可以将第一信息,直接分享到记事本进行存储,或者分享到社交应用。如果是电话号码信息可以直接拨号,如果是地址类信息可以直接进行快递预约,如果是银行卡信息可以快捷汇款。
由上述实施例可见,该实施例中,在本端设备与对端设备的通话过程中,识别对端设备输入的通话内容,如果对端设备输入的通话内容中包含复杂或不易记忆的内容,则获取对端设备输入的通话内容中复杂或不易记忆的内容,并在需要复述该内容时,模拟本端设备的用户的声音向对端设备的用户复述该内容。与现有技术相比,本申请实施例中,在通话过程中,当通话方之间涉及的通话信息量较大或者涉及一些一串数字或地址等不易记忆的信息时,可以自动识别、记录这类信息,之后模拟本端设备的用户的声音复述给对端设备的用户,而无需通话方之间重复叙述和反复确认,可以减轻用户的记忆负担,简化记录信息的操作,提高记录信息的准确率,从而提高通话效率。
需要说明的是,本申请实施例提供的通话方法,执行主体可以为通话装置,或者该通话装置中的用于执行加载通话方法的控制模块。本申请实施例中以通话装置执行加载通话方法为例,说明本申请实施例提供的通话装置。
图3是本申请实施例提供的一种通话装置的结构框图,如图3所示,通话装置300,可以包括:获取模块301、转换模块302和发送模块303,其中,
获取模块301,用于在本端设备与对端设备的通话过程中,获取第一信息,其中,所述第一信息包括以下至少一项:所述本端设备的用户输入的文本信息、图像信息、所述本端设备在历史通话中输入的和/或接收到的通话内容信息,或者所述对端设备在本次通话中输入的通话内容信息;
转换模块302,用于通过语音合成技术,将所述第一信息转换为第二信息,其中,所述第二信息的类型为音频,所述音频的声音为所述本端设备的用户的声音;
发送模块303,用于将所述第二信息发送至所述对端设备。
由上述实施例可见,该实施例中,在本端设备与对端设备的通话过程中,对于需要在本次通话过程中提供给对端设备的第一信息,可以通过语音合成技术,将第一信息转换为第二信息,其中,第二信息的类型为音频,音频的声音为本端设备的用户的声音,之后将第二信息发送至对端设备。与现有技术相比,本申请实施例中,在通话过程中,对于需要提供给对端设备的信息,本端设备可以模拟本端设备的用户的声音,将该信息陈述给对端设备,而无需本端设备的用户耗费较多的精力去陈述,可以减轻用户的负担,简化通话过程,进而提高通话效率。
可选地,作为一个实施例,所述第一信息包括:所述对端设备在本次通话中输入的通话内容信息;
所述获取模块301,可以包括:
识别子模块,用于在本端设备与对端设备的通话过程中,识别所述对端设备输入的第一通话内容信息;
获取子模块,用于在识别出所述第一通话内容信息中包含第一预设内容的情况下,获取所述第一通话内容信息中与所述第一预设内容对应的第一信息。
可选地,作为一个实施例,所述转换模块302,可以包括:
转换子模块,用于在满足预设通话内容复述条件的情况下,通过语音合成技术,将所述第一信息转换为第二信息;其中,所述预设通话内容复述条件包括以下任一项:
所述本端设备输入的第二通话内容信息中包含第二预设内容,所述第二预设内容中包含与复述语义相关的内容;
所述对端设备输入的第一通话内容信息中包含第三预设内容,所述第三预设内容中包含与复述语义相关的内容;
接收到所述本端设备的用户在通话界面的第一控件上的第一输入,所述第一控件用于触发向所述对端设备复述所述第一信息。
可选地,作为一个实施例,所述通话装置300,还可以包括:
第一暂停模块,用于在将所述第二信息发送至所述对端设备的过程中,若检测到所述对端设备输入通话内容,则暂停发送所述第二信息;或者,
第二暂停模块,用于在将所述第二信息发送至所述对端设备的过程中,若接收到所述本端设备的用户在通话界面的第二控件上的第二输入,则暂停发送所述第二信息,其中,所述第二控件用于触发暂停发送所述第二信息。
可选地,作为一个实施例,所述通话装置300,还可以包括:
调整模块,用于在本端设备与对端设备的通话为视频通话的情况下,在将所述第二信息发送至所述对端设备的过程中,根据所述第二信息,调整所述本端设备的用户在视频画面中的发音口型。
本申请实施例中的通话装置可以是装置,也可以是终端中的部件、集成电路、或芯片。该装置可以是移动电子设备,也可以为非移动电子设备。示例性的,移动电子设备可以为手机、平板电脑、笔记本电脑、掌上电脑、车载电子设备、可穿戴设备、超级移动个人计算机(ultra-mobile personal computer,UMPC)、上网本或者个人数字助理(personaldigital assistant,PDA)等,非移动电子设备可以为服务器、网络附属存储器(NetworkAttached Storage,NAS)、个人计算机(personal computer,PC)、电视机(television,TV)、柜员机或者自助机等,本申请实施例不作具体限定。
本申请实施例中的通话装置可以为具有操作系统的装置。该操作系统可以为安卓(Android)操作系统,可以为ios操作系统,还可以为其他可能的操作系统,本申请实施例不作具体限定。
本申请实施例提供的通话装置能够实现图1方法实施例实现的各个过程,为避免重复,这里不再赘述。
可选地,如图4所示,本申请实施例还提供一种电子设备400,包括处理器401,存储器402,存储在存储器402上并可在所述处理器401上运行的程序或指令,该程序或指令被处理器401执行时实现上述通话方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
需要说明的是,本申请实施例中的电子设备包括上述所述的移动电子设备和非移动电子设备。
图5为实现本申请实施例的一种电子设备的硬件结构示意图。该电子设备500包括但不限于:射频单元501、网络模块502、音频输出单元503、输入单元504、传感器505、显示单元506、用户输入单元507、接口单元508、存储器509、以及处理器510等部件。
本领域技术人员可以理解,电子设备500还可以包括给各个部件供电的电源(比如电池),电源可以通过电源管理系统与处理器510逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。图5中示出的电子设备结构并不构成对电子设备的限定,电子设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置,在此不再赘述。
其中,处理器510,用于在本端设备与对端设备的通话过程中,获取第一信息,其中,所述第一信息包括以下至少一项:所述本端设备的用户输入的文本信息、图像信息、所述本端设备在历史通话中输入的和/或接收到的通话内容信息,或者所述对端设备在本次通话中输入的通话内容信息;通过语音合成技术,将所述第一信息转换为第二信息,其中,所述第二信息的类型为音频,所述音频的声音为所述本端设备的用户的声音;将所述第二信息发送至所述对端设备。
可见,本申请实施例中,在本端设备与对端设备的通话过程中,对于需要在本次通话过程中提供给对端设备的第一信息,可以通过语音合成技术,将第一信息转换为第二信息,其中,第二信息的类型为音频,音频的声音为本端设备的用户的声音,之后将第二信息发送至对端设备。与现有技术相比,本申请实施例中,在通话过程中,对于需要提供给对端设备的信息,本端设备可以模拟本端设备的用户的声音,将该信息陈述给对端设备,而无需本端设备的用户耗费较多的精力去陈述,可以减轻用户的负担,简化通话过程,进而提高通话效率。
可选地,作为一个实施例,处理器510,还用于在本端设备与对端设备的通话过程中,识别所述对端设备输入的第一通话内容信息;在识别出所述第一通话内容信息中包含第一预设内容的情况下,获取所述第一通话内容信息中与所述第一预设内容对应的第一信息。
可选地,作为一个实施例,处理器510,还用于在满足预设通话内容复述条件的情况下,通过语音合成技术,将所述第一信息转换为第二信息;其中,所述预设通话内容复述条件包括以下任一项:
所述本端设备输入的第二通话内容信息中包含第二预设内容,所述第二预设内容中包含与复述语义相关的内容;
所述对端设备输入的第一通话内容信息中包含第三预设内容,所述第三预设内容中包含与复述语义相关的内容;
接收到所述本端设备的用户在通话界面的第一控件上的第一输入,所述第一控件用于触发向所述对端设备复述所述第一信息。
可选地,作为一个实施例,处理器510,还用于在将所述第二信息发送至所述对端设备的过程中,若检测到所述对端设备输入通话内容,则暂停发送所述第二信息;或者,
在将所述第二信息发送至所述对端设备的过程中,若接收到所述本端设备的用户在通话界面的第二控件上的第二输入,则暂停发送所述第二信息,其中,所述第二控件用于触发暂停发送所述第二信息。
可选地,作为一个实施例,处理器510,还用于在本端设备与对端设备的通话为视频通话的情况下,在将所述第二信息发送至所述对端设备的过程中,根据所述第二信息,调整所述本端设备的用户在视频画面中的发音口型。
应理解的是,本申请实施例中,输入单元504可以包括图形处理器(GraphicsProcessing Unit,GPU)5041和麦克风5042,图形处理器5041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。显示单元506可包括显示面板5061,可以采用液晶显示器、有机发光二极管等形式来配置显示面板5061。用户输入单元507包括触控面板5071以及其他输入设备5072。触控面板5071,也称为触摸屏。触控面板5071可包括触摸检测装置和触摸控制器两个部分。其他输入设备5072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆,在此不再赘述。存储器509可用于存储软件程序以及各种数据,包括但不限于应用程序和操作系统。处理器510可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器510中。
电子设备500能够实现前述实施例中电子设备实现的各个过程,为避免重复,这里不再赘述。
本申请实施例还提供一种可读存储介质,所述可读存储介质上存储有程序或指令,该程序或指令被处理器执行时实现上述通话方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
其中,所述处理器为上述实施例中所述的电子设备中的处理器。所述可读存储介质,包括计算机可读存储介质,如计算机只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等。
本申请实施例另提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现上述通话方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
应理解,本申请实施例提到的芯片还可以称为系统级芯片、系统芯片、芯片系统或片上系统芯片等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。此外,需要指出的是,本申请实施方式中的方法和装置的范围不限按示出或讨论的顺序来执行功能,还可包括根据所涉及的功能按基本同时的方式或按相反的顺序来执行功能,例如,可以按不同于所描述的次序来执行所描述的方法,并且还可以添加、省去、或组合各种步骤。另外,参照某些示例所描述的特征可在其他示例中被组合。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以计算机软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,或者网络设备等)执行本申请各个实施例所述的方法。
上面结合附图对本申请的实施例进行了描述,但是本申请并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本申请的启示下,在不脱离本申请宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本申请的保护之内。
Claims (11)
1.一种通话方法,其特征在于,所述方法包括:
在本端设备与对端设备的通话过程中,获取第一信息,其中,所述第一信息包括以下至少一项:所述本端设备的用户输入的文本信息、图像信息、所述本端设备在历史通话中输入的和/或接收到的通话内容信息,或者所述对端设备在本次通话中输入的通话内容信息;
通过语音合成技术,将所述第一信息转换为第二信息,其中,所述第二信息的类型为音频,所述音频的声音为所述本端设备的用户的声音;
将所述第二信息发送至所述对端设备。
2.根据权利要求1所述的方法,其特征在于,所述第一信息包括:所述对端设备在本次通话中输入的通话内容信息;
所述在本端设备与对端设备的通话过程中,获取第一信息,包括:
在本端设备与对端设备的通话过程中,识别所述对端设备输入的第一通话内容信息;
在识别出所述第一通话内容信息中包含第一预设内容的情况下,获取所述第一通话内容信息中与所述第一预设内容对应的第一信息。
3.根据权利要求2所述的方法,其特征在于,所述通过语音合成技术,将所述第一信息转换为第二信息,包括:
在满足预设通话内容复述条件的情况下,通过语音合成技术,将所述第一信息转换为第二信息;其中,所述预设通话内容复述条件包括以下任一项:
所述本端设备输入的第二通话内容信息中包含第二预设内容,所述第二预设内容中包含与复述语义相关的内容;
所述对端设备输入的第一通话内容信息中包含第三预设内容,所述第三预设内容中包含与复述语义相关的内容;
接收到所述本端设备的用户在通话界面的第一控件上的第一输入,所述第一控件用于触发向所述对端设备复述所述第一信息。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在将所述第二信息发送至所述对端设备的过程中,若检测到所述对端设备输入通话内容,则暂停发送所述第二信息;或者,
在将所述第二信息发送至所述对端设备的过程中,若接收到所述本端设备的用户在通话界面的第二控件上的第二输入,则暂停发送所述第二信息,其中,所述第二控件用于触发暂停发送所述第二信息。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在本端设备与对端设备的通话为视频通话的情况下,在将所述第二信息发送至所述对端设备的过程中,根据所述第二信息,调整所述本端设备的用户在视频画面中的发音口型。
6.一种通话装置,其特征在于,所述装置包括:
获取模块,用于在本端设备与对端设备的通话过程中,获取第一信息,其中,所述第一信息包括以下至少一项:所述本端设备的用户输入的文本信息、图像信息、所述本端设备在历史通话中输入的和/或接收到的通话内容信息,或者所述对端设备在本次通话中输入的通话内容信息;
转换模块,用于通过语音合成技术,将所述第一信息转换为第二信息,其中,所述第二信息的类型为音频,所述音频的声音为所述本端设备的用户的声音;
发送模块,用于将所述第二信息发送至所述对端设备。
7.根据权利要求6所述的装置,其特征在于,所述第一信息包括:所述对端设备在本次通话中输入的通话内容信息;
所述获取模块包括:
识别子模块,用于在本端设备与对端设备的通话过程中,识别所述对端设备输入的第一通话内容信息;
获取子模块,用于在识别出所述第一通话内容信息中包含第一预设内容的情况下,获取所述第一通话内容信息中与所述第一预设内容对应的第一信息。
8.根据权利要求7所述的装置,其特征在于,所述转换模块包括:
转换子模块,用于在满足预设通话内容复述条件的情况下,通过语音合成技术,将所述第一信息转换为第二信息;其中,所述预设通话内容复述条件包括以下任一项:
所述本端设备输入的第二通话内容信息中包含第二预设内容,所述第二预设内容中包含与复述语义相关的内容;
所述对端设备输入的第一通话内容信息中包含第三预设内容,所述第三预设内容中包含与复述语义相关的内容;
接收到所述本端设备的用户在通话界面的第一控件上的第一输入,所述第一控件用于触发向所述对端设备复述所述第一信息。
9.根据权利要求6所述的装置,其特征在于,所述装置还包括:
第一暂停模块,用于在将所述第二信息发送至所述对端设备的过程中,若检测到所述对端设备输入通话内容,则暂停发送所述第二信息;或者,
第二暂停模块,用于在将所述第二信息发送至所述对端设备的过程中,若接收到所述本端设备的用户在通话界面的第二控件上的第二输入,则暂停发送所述第二信息,其中,所述第二控件用于触发暂停发送所述第二信息。
10.根据权利要求6所述的装置,其特征在于,所述装置还包括:
调整模块,用于在本端设备与对端设备的通话为视频通话的情况下,在将所述第二信息发送至所述对端设备的过程中,根据所述第二信息,调整所述本端设备的用户在视频画面中的发音口型。
11.一种电子设备,其特征在于,该电子设备包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如权利要求1至5任一项所述的通话方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110919873.2A CN113660375B (zh) | 2021-08-11 | 2021-08-11 | 通话方法、装置及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110919873.2A CN113660375B (zh) | 2021-08-11 | 2021-08-11 | 通话方法、装置及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113660375A true CN113660375A (zh) | 2021-11-16 |
CN113660375B CN113660375B (zh) | 2023-02-03 |
Family
ID=78491423
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110919873.2A Active CN113660375B (zh) | 2021-08-11 | 2021-08-11 | 通话方法、装置及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113660375B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105100482A (zh) * | 2015-07-30 | 2015-11-25 | 努比亚技术有限公司 | 一种实现手语识别的移动终端、系统及其通话实现方法 |
CN106899769A (zh) * | 2017-03-30 | 2017-06-27 | 努比亚技术有限公司 | 移动终端通信装置及方法 |
CN107343113A (zh) * | 2017-06-26 | 2017-11-10 | 深圳市沃特沃德股份有限公司 | 语音通话方法和装置 |
WO2020233556A1 (zh) * | 2019-05-20 | 2020-11-26 | 华为技术有限公司 | 一种通话内容处理方法和电子设备 |
WO2021098708A1 (zh) * | 2019-11-22 | 2021-05-27 | 维沃移动通信有限公司 | 通话方法及终端设备 |
CN112911192A (zh) * | 2021-01-28 | 2021-06-04 | 维沃移动通信有限公司 | 视频处理方法、装置和电子设备 |
CN113037914A (zh) * | 2021-03-01 | 2021-06-25 | 北京百度网讯科技有限公司 | 用于处理呼入电话的方法、相关装置及计算机程序产品 |
-
2021
- 2021-08-11 CN CN202110919873.2A patent/CN113660375B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105100482A (zh) * | 2015-07-30 | 2015-11-25 | 努比亚技术有限公司 | 一种实现手语识别的移动终端、系统及其通话实现方法 |
CN106899769A (zh) * | 2017-03-30 | 2017-06-27 | 努比亚技术有限公司 | 移动终端通信装置及方法 |
CN107343113A (zh) * | 2017-06-26 | 2017-11-10 | 深圳市沃特沃德股份有限公司 | 语音通话方法和装置 |
WO2020233556A1 (zh) * | 2019-05-20 | 2020-11-26 | 华为技术有限公司 | 一种通话内容处理方法和电子设备 |
WO2021098708A1 (zh) * | 2019-11-22 | 2021-05-27 | 维沃移动通信有限公司 | 通话方法及终端设备 |
CN112911192A (zh) * | 2021-01-28 | 2021-06-04 | 维沃移动通信有限公司 | 视频处理方法、装置和电子设备 |
CN113037914A (zh) * | 2021-03-01 | 2021-06-25 | 北京百度网讯科技有限公司 | 用于处理呼入电话的方法、相关装置及计算机程序产品 |
Also Published As
Publication number | Publication date |
---|---|
CN113660375B (zh) | 2023-02-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11158102B2 (en) | Method and apparatus for processing information | |
CN105264485B (zh) | 在多个设备上提供内容 | |
CN107632706B (zh) | 多模态虚拟人的应用数据处理方法和系统 | |
CN110830362B (zh) | 一种生成内容的方法、移动终端 | |
CN107040452B (zh) | 一种信息处理方法、装置和计算机可读存储介质 | |
JP2013020411A (ja) | 情報処理装置、情報処理方法及びプログラム | |
CN108701127A (zh) | 电子设备及其操作方法 | |
CN107918496A (zh) | 一种输入纠错方法和装置、一种用于输入纠错的装置 | |
CN107358953A (zh) | 语音控制方法、移动终端及存储介质 | |
CN108595107B (zh) | 一种界面内容处理方法及移动终端 | |
CN112866469A (zh) | 通话内容的记录方法及装置 | |
CN114374663B (zh) | 消息处理方法和消息处理装置 | |
CN113593614B (zh) | 图像处理方法及装置 | |
CN113709306B (zh) | 会话处理方法、装置及电子设备 | |
CN114374761A (zh) | 信息交互方法、装置、电子设备及介质 | |
CN111597435B (zh) | 一种语音搜索方法、装置及电子设备 | |
CN113253903A (zh) | 操作方法及操作装置 | |
CN113660375B (zh) | 通话方法、装置及电子设备 | |
CN110880330A (zh) | 音频转换方法及终端设备 | |
CN114338572B (zh) | 信息处理方法、相关设备及存储介质 | |
CN113778596A (zh) | 远程协助方法、装置和电子设备 | |
CN113299290A (zh) | 语音识别的方法、装置、电子设备和可读存储介质 | |
CN113010251A (zh) | 信息处理方法、装置和电子设备 | |
CN112866475A (zh) | 图像发送方法、装置和电子设备 | |
CN107050851B (zh) | 一种游戏内容效果的声音加强方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20230725 Address after: 5 / F, building B, No. 25, Andemen street, Yuhuatai District, Nanjing City, Jiangsu Province, 210012 Patentee after: NANJING WEIWO SOFTWARE TECHNOLOGY CO.,LTD. Address before: 523863 No. 1, Weiwo Road, Chang'an Town, Dongguan City, Guangdong Province Patentee before: VIVO MOBILE COMMUNICATION Co.,Ltd. |
|
TR01 | Transfer of patent right |