CN113873078A - 通话控制方法和通话控制装置 - Google Patents

通话控制方法和通话控制装置 Download PDF

Info

Publication number
CN113873078A
CN113873078A CN202111140548.2A CN202111140548A CN113873078A CN 113873078 A CN113873078 A CN 113873078A CN 202111140548 A CN202111140548 A CN 202111140548A CN 113873078 A CN113873078 A CN 113873078A
Authority
CN
China
Prior art keywords
call
information
sound
connection state
electronic equipment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111140548.2A
Other languages
English (en)
Inventor
马若洲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Vivo Mobile Communication Co Ltd
Original Assignee
Vivo Mobile Communication Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Vivo Mobile Communication Co Ltd filed Critical Vivo Mobile Communication Co Ltd
Priority to CN202111140548.2A priority Critical patent/CN113873078A/zh
Publication of CN113873078A publication Critical patent/CN113873078A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72403User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
    • H04M1/7243User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages
    • H04M1/72433User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages for voice messaging, e.g. dictaphones
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Telephone Function (AREA)

Abstract

本申请实施例提供了一种通话控制方法和通话控制装置,属于电子设备技术领域。其中,通话控制方法包括:获取电子设备接收的通话声音信息;在通话声音信息的声音特征在第一声音特征范围内的情况下,确定电子设备处于第一通话接通状态,并输出接通提示信息。

Description

通话控制方法和通话控制装置
技术领域
本申请涉及电子设备技术领域,具体而言,涉及一种通话控制方法和一种通话控制装置。
背景技术
相关技术中,当用户拨打电话时,等待时间有时候会很长,而且偶尔会出现因等待时间过长而重新拨打的情况。用户在等待电话接通过程中,无论电话是采用屏幕扬声器接听或选择外放,用户都要放出一定注意力在电话上,以及时确定电话是否接通,尤其是采用屏幕扬声器接听时,还需要时刻拿着手机,通过听取屏幕扬声器发出的声音,来判断此次呼叫是否接通,很浪费时间,影响用户的使用体验。
发明内容
本申请实施例提供了一种通话控制方法和通话控制装置,能够对电子设备的第一通话接通状态进行提示,无需时刻关注电子设备便可对接通状态做出反应。
第一方面,本申请实施例提供了一种通话控制方法,包括:
获取电子设备接收的通话声音信息;
在通话声音信息的声音特征在第一声音特征范围内的情况下,确定电子设备处于第一通话接通状态,并输出接通提示信息。
第二方面,本申请实施例提供了一种通话控制装置,包括:
获取模块,用于获取电子设备接收的通话声音信息;
确定模块,用于在通话声音信息的声音特征在第一声音特征范围内的情况下,确定电子设备处于第一通话接通状态;
提示模块,用于输出接通提示信息。
第三方面,本申请实施例提供了一种电子设备,包括处理器、存储器及存储在该存储器上并在处理器上运行的程序或指令,该程序或指令被处理器执行时实现如第一方面提供的通话控制方法的步骤。
第四方面,本申请实施例提供了一种电子设备,包括第二方面提供的通话控制装置。
第五方面,本申请实施例提供了一种可读存储介质,可读存储介质上存储程序或指令,该程序或指令被处理器执行时实现如第一方面提供的通话控制方法的步骤。
第六方面,本申请实施例提供了一种芯片,芯片包括处理器和通信接口,通信接口和处理器耦合,处理器用于运行程序或指令,实现如第一方面提供的通话控制方法的步骤。
在本申请实施例中,获取电子设备接收的通话声音信息;在通话声音信息的声音特征在第一声音特征范围内的情况下,确定电子设备处于第一通话接通状态,并输出接通提示信息。在用户拨打电话时,获取电子设备接收到的通话声音信息,通过比对通话声音信息的声音特征和预设的第一声音特征范围,分辨该通话声音信息是否为人发出的声音。若是,则可以确定通话双方已经建立通话连接,且通话对端为人,可正常进行通话交流。此时,输出接通提示信息,以告知用户通话已经接通。从而在电话等待接通的过程中,用户可分心处理其它事务,无需时刻关注电子设备便可对接通状态做出反应,既能防止接听等待时间过长而导致通话被挂断的情况,又能节省用户时间,提高通话效率,而且,电子设备无需放置在用户耳边,有利于减小了电子设备对用户造成的辐射。
附图说明
图1示出了根据本申请的一个实施例的通话控制方法的流程图之一;
图2示出了根据本申请的一个实施例的通话控制方法的流程图之二;
图3示出了根据本申请的一个实施例的通话控制方法的流程图之三;
图4示出了根据本申请的一个实施例的通话控制方法的流程图之四;
图5示出了根据本申请的一个实施例的通话控制方法的流程图之五;
图6示出了根据本申请的一个实施例的通话控制方法的流程图之六;
图7示出了根据本申请的一个实施例的通话控制方法的流程图之七;
图8示出了根据本申请一个实施例的电子设备显示示意图之一;
图9示出了根据本申请一个实施例的电子设备显示示意图之二;
图10示出了根据本申请的一个实施例的通话控制装置的结构框图;
图11示出了根据本申请的一个实施例的电子设备的结构框图;
图12示出了根据本申请的一个实施例的电子设备的硬件结构框图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施,且“第一”、“第二”等所区分的对象通常为一类,并不限定对象的个数,例如第一对象可以是一个,也可以是多个。此外,说明书以及权利要求中“和/或”表示所连接对象的至少其中之一,字符“/”,一般表示前后关联对象是一种“或”的关系。
下面参照图1至图12描述根据本申请一些实施例通话控制方法和通话控制装置。
在本申请的一个实施例中,图1示出了本申请实施例的通话控制方法的流程图之一,包括:
步骤102,获取电子设备接收的通话声音信息;
其中,通话声音信息即正常通话时电子设备扬声器应该播放的声音信号,通话声音信息可以是通过交换机反馈的声音信息,例如,用户通过手机输入电话号码,以向交换机发出通话请求,交换机反馈该通话请求的通话声音信息,此时,接通前通话声音信息为“嘟”声拨号音等,接通后的通话声音信息为通话对端的声音。通话声音信息还可以是通过网络接收到声音信息,例如,聊天应用程序的音频通话或视频通话时传输的声音。
具体地,该通话控制方法适用于电子设备,电子设备包括但不限于移动终端、平板电脑、计算机、笔记本电脑、可穿戴设备或车载终端等。
步骤104,在通话声音信息的声音特征在第一声音特征范围内的情况下,确定电子设备处于第一通话接通状态,并输出接通提示信息。
其中,声音特征包括语音特征(音色、语速、语调等)和语音关键词。第一声音特征范围用于表示人类发出可能发出的声音特征的范围,第一通话接通状态用于表示可实现沟通的人工接听状态,也即通话对端的人接听了通话。
在该实施例中,在用户拨打电话时,获取通话声音信息,通过比对通话声音信息的声音特征和预设的第一声音特征范围,分辨该通话声音信息是否为人发出的声音。若是,则可以确定通话双方已经接通,且通话对端为人,可正常进行通话交流。此时,输出接通提示信息,以告知用户通话已经接通。从而在电话等待接通的过程中,用户可分心处理其它事务,无需时刻关注电子设备便可对接通状态做出反应,既能防止接听等待时间过长而导致通话被挂断的情况,又能节省用户时间,提高通话效率,而且,电子设备无需放置在用户耳边,有利于减小了电子设备对用户造成的辐射。
在一些可能的设计中,输出接通提示信息的步骤包括:执行电子设备的震动程序,以使电子设备震动;和/或播放第一通话接通状态对应的音频信息。
在该实施例中,通过震动提示通话已经接通,不仅能够在不适合播放声音的场景下,达到提醒接通状态的目的,而且保证听力不便的人也能及时对接通状态做出反应,进而提高通话效率。当然,还可以通过播放第一通话接通状态对应的音频信息来进行接通提醒,以便于通过特定的音频对通话接通状态进行准确的识别。音频信息可以是默认配置的、用户个性化设定的或电子设备根据用户偏好习惯等自定义生成的。例如,在通话对端为人,且通话已经接通的情况下,电子设备播放预设的接通铃音,在通话未接通状态,例如,呼叫转移状态、通话忙碌状态或关机状态等无法正常沟通的通话失败情况下,电子设备播放“拨打失败”的声音。
在本申请的一个实施例中,图2示出了本申请实施例的通话控制方法的流程图之二,包括:
步骤202,取消播放通话声音信息;
可以理解的是,电子设备既可以作为被叫端又可以作为主叫端。当电子设备接收到其他电子设备的来电时为被叫端,当电子设备呼叫其他电子设备时为主叫端。
步骤204,对通话声音信息进行处理,以确定通话声音信息对应的文字信息;
步骤206,显示通话声音信息对应的文字信息。
在该实施例中,在电子设备接收到通话声音信息的情况下,将该通话事件转移至后台运行,并取消播放该通话声音信息。为了保证整成的沟通,将采集到的通话声音信息转化成文字信息,并输出文字信息至电子设备的显示屏以进行显示。从而在不方便发出声音的场景下,仍可以通过输出的文字信息进行去电或接听来电,实现了全程无声通话交流,不会对环境造成任何影响,特别是用户为聋哑人时,能够辅助用户进行实时交流,提升电子设备输出信息的效率。
可以理解的是,用户可以预先通过电子设备的设置界面来设定后续的通话事件是否均需要开启后台通话模式,或者在设置界面设定指定的联系人通话时开启后台通话模式,或者当触发通话事件时,在电子设备的屏幕上显示模式设置窗口,用户通过对模式设置窗口的操作控制电子设备是否进入后台通话模式。在后台通话模式,电子设备不会播放接收到的通话声音信息,并且在确认电子设备处于第一接通状态时,可以通过提示信息告知用户通话已接通。
具体举例来说,如图8所示,用户拨打客服电话时,首先进入通话界面,用户在等待人工客服接通过程中可通话界面的模式设置窗口中选择将通话切换至后台,也即进入后台通话模式。当通话被切换至后台同年规划模式后,取消显示通话界面,此时,手机屏幕上显示手机桌面,并在手机屏幕上顶部显示对话框,以及实时显示当前通话状态,例如,接通状态或未接通状态。通过检测等待过程中通话对端的声音,以语气、语速或对面的回复内容为条件,判断人工客服是否接通。待人工客服接通后以铃声或震动的形式提示用户,并更新当前通话状态。此时,将人工客服的发送的语音转换为文字显示在对话框中,用户可以通过文字形式与人工客服进行交流。
具体地,对通话声音信息进行处理,以确定通话声音信息对应的文字信息的步骤,具体包括:确定通话声音信息中噪音的音量信息;在音量信息大于或等于预设音量的情况下,对通话声音信息进行降噪处理;对降噪处理处理后的通话声音信息或音量信息小于预设音量的通话声音信息进行文字转化处理,以确定通话声音信息对应的文字信息。
在该实施例中,在接收到通话声音信息的情况下,进行文字转化处理之前,先识别通话声音信息中噪音,并确定噪音的音量信息,也即噪音的响度。当音量信息大于或等于预设音量,说明噪音可能影响到本次语音通话的质量,无法保证文字信息的转换的准确度。此时,对通话声音信息进行降噪处理,以使噪音的音量信息降低至预设音量,不会影响文字转化的音量,并对通话声音信息进行文字转化处理。当音量信息小于预设音量,则可直接进行文字转化处理。从而实现在用户通话中自动进行降噪处理,消除噪音对文字转化造成的误差,大大提高转化后文字信息的准确度,有利于提升通话的效率和通话体验。
具体地,声音本质上是以声波的形式进行传播,所以可从通过通话声音信息中的声波分离出通话过程中的噪音波形,基于该噪音波形进行具体的波形分析,来确定出所需的该噪音的音量信息,如噪音的音量分贝值。
在本申请的一个实施例中,图3示出了本申请实施例的通话控制方法的流程图之三,包括:
步骤302,在电子设备处于通话接通状态的情况下,显示第一控件;
其中,第一控件用于控制是否播放声音。通话接通状态包括第一通话接通状态和第二通话接通状态,第一通话接通状态即人工接通状态,第二通话接通状态即自动回复的接听状态,例如,机器人客服。
步骤304,接收对第一控件的第一输入;
其中,第一输入包括但不限于点击输入、按键输入、指纹输入、滑动输入、按压输入。按键输入包括但不限于对电子设备的电源键、音量键、主菜单键的单击输入、双击输入、长按输入、组合按键输入等。当然第一输入还可以是用户对电子设备的其它操作,本申请实施例对操作的方式不作具体限定,可为任一可实现的方式。
步骤306,响应于第一输入,取消显示通话声音信息对应的文字信息,并播放通话声音信息。
在该实施例中,用户在通话接通后可通过第一控件随时控制电子设备从后台通话模式切换回正常通话的模式。具体地,当电子设备接收到用户对第一控件的第一输入时,响应该第一输入,触发电子设备退出后台通话模式。此时,开始播放接收到的通话声音信息,并取消显示对应的文字信息,通话双方可通过声音进行交流。从而实现了模式切换的便利性,有利于提升通话效率和通话体验。
在本申请的一个实施例中,图4示出了本申请实施例的通话控制方法的流程图之四,包括:
步骤402,在通话声音信息的声音特征在第二声音特征范围内的情况下,确定电子设备处于第二通话接通状态;
在该实施例中,通过比对通话声音信息的声音特征和预设的第二声音特征范围,分辨该通话声音信息是否为机器合成的声音。若是,则可以确定通话双方已经接通,且通话对端为机器人,此时,确定电子设备处于第二通话接通状态。
步骤404,在电子设备处于第二通话接通状态,且所通话声音信息对应的文字信息的内容包括功能选项的情况下,关联功能选项的第二控件和电子设备的数字键盘;
步骤406,接收对第二控件的第二输入;
步骤408,响应于第二输入,将与第二控件关联的数字发送至通话对端。
在该实施例中,考虑到通话对端为机器人时,常常会出现供用户选择的功能选项,例如,按键1:查询话费、按键2:查询流量。但由于功能选项过多,用户常常会忘记所需功能对应的按键。为此,后台通话模式下,确定通话对端为机器人,也即电子设备处于第二通话接通状态之后,将通话声音信息转化为文字信息并显示,同时,识别通话声音信息的内容,若通话声音信息中存在功能选项,则关联功能选项的第二控件和电子设备的数字键盘。用户可通过对第二控件的第二输入,选择所需的功能。电子设备响应于第二输入将与第二控件关联的数字发送至通话对端,以将用户需求的功能反馈给机器人。一方面,通过文字信息使用户清楚的了解每个第二控件对应的功能选项,有效防止操作失误。另一方面,能够满足不便播放声音的通话场景,实现全程无声的通话。
可以理解的是,在电子设备处于第二通话接通状态的情况下,按照预设格式模板,显示功能选项,从而使得功能选项能够按照用户的使用习惯进行排布,提升用户的使用体验。
例如,如图9所示,将功能选项以列表的形式展示在对话框上供用户选择。用户选择后将用户的选项以机器人客服要求的方式回发给机器人客服,如将选项对应的拨号键盘的特定数字发给机器人客服。
在本申请的一个实施例中,图5示出了本申请实施例的通话控制方法的流程图之五,包括:
步骤502,在通话声音信息的声音特征超出第一声音特征范围和第二声音特征范围的持续时长大于或等于预设时长的情况下,确定电子设备处于通话未接通状态;
步骤504,断开电子设备的通话连接,并输出未接通提示信息。
在该实施例中,若检测到通话声音信息的声音特征不仅超出第一声音特征范围,还超出了第二声音特征范围,则可以确定无论通话对端是人还是机器人均未接通通话。此时,开始计时声音特征超出第一声音特征范围和第二声音特征范围的持续时长,也即未接通的持续时长,一旦检测到持续时长大于或等于预设时长,说明长时间无人接听,则断开通话,输出未接通提示信息以提醒用户通话失败。从而在电话等待接通的过程中,用户可分心处理其它事务,无需时刻关注电子设备便可对未接通状态做出反应,并自动挂断,节省电子设备的通话资源。
在本申请的一个实施例中,图6示出了本申请实施例的通话控制方法的流程图之六,包括:
步骤602,确定第一声音特征范围中语音关键词对应的语音特征范围;
其中,通话声音信息的声音特征包括语音特征和语音关键词。语音特征值包括以下至少一种:语速特征值、语调特征值和音色特征。对应的,第一声音特征范围即人可能发出的声音特征的范围。具体地,语速特征值即每秒能够可能发出声音的字数,语调特征值即通话声音信息中声音波形的频率。音色特征可通过现有的音色识别模型进行检测,本申请不做具体限定。
在该实施例中,预先统计人可能发出的多个预设关键词与语音特征范围之间的对应关系,在辨别出通话声音信息的声音特征存在语音的情况下,识别通话声音信息中出现的语音关键词,在语音关键词与任一预设关键词匹配的情况下,分居上述对应关系,将任一预设关键词对应的语音特征范围作为语音关键词的语音特征范围。从而有针对性的为语音关键词选择合适的语音特征范围,有利于提高接通状态和通话对端的分辨准确度,进而提升通话接通提醒的可靠性。
步骤604,在语音特征在语音特征范围内的情况下,确定语音关键词和第一声音特征范围中的第一语音关键词的相似度;
可以理解的是,在语音特征包括多项的情况下,例如,语音特征为语速特征值和语调特征值。在语速特征值和语调特征值能够分别处于对应的语速特征值特征范围和语调特征值范围内时才判定语音特征在语音特征范围内,换言之,仅有一项特征值满足特征值范围的条件是无法判定语音特征在语音特征范围内的。
步骤606,在相似度大于预设相似度的情况下,确定通话声音信息的声音特征在第一声音特征范围内。
在该实施例中,先通过声音特征分辨出通话对端是人还是机器人。在进一步通过语音关键词匹配,确定语音内容是否为与通话接通相关的内容。从而通过声音特征准确区识别出人声接通通话的情况,为通过电子设备的接通提醒功能提供可靠的数据支持。
需要说明的是,对于通话声音信息的声音特征在第二声音特征范围内,也采用上述方法。
具体举例来说,通过模拟实验统计出人发出“您好,欢迎致电”这个词句的语速为4.2字/s~6字/s,语调大于4KHz~7KHz,而机器人发出“您好,欢迎致电”这个词句的语速为3字/秒~4字/秒,语调大于3KHz~5.5KHz。则确定第一声音特征范围中的“您好,欢迎致电”这个关键词对应的第一语速特征值范围为4.2~6,第一语调特征值范围为4~7;第二声音特征范围中的“您好,欢迎致电”这个关键词对应的第二语速特征值范围为3~4,第一语调特征值范围为3~5.5。当用户拨打客服电话时,采集到的通话声音信息中识别到“您好,今日是xx年xx月xx日,欢迎致电xxx公司”这句话,其中,检测到“您好”和“欢迎致电”语速特征值为5,语调特征值为6.3,则确定通话对端为人,且“您好”和“欢迎致电”属于用于接听电话常用的第一语音关键词,此时可确定人工客服已经接听,手机开始震动,并将“您好,今日是xx年xx月xx日,欢迎致电xxx公司”这句话显示在手机屏幕上。同理,当用户拨打客服电话时,采集到的通话声音信息中识别到“嘟…嘟…嘟”这句话,其中,检测到“嘟”的语速特征值为1,语调特征值为4.5,或者采集到的通话声音信息中识别到“你您好,暂时无法接通”这句话,其中,检测到“您好”的语速特征值为3.6,语调特征值为5,但“暂时无法接通”与预设的第一语音关键词不匹配,可见声音特征既不属于第一声音特征范围也不属于第二声音特征范围,则确定通话未接通,若未接通的时间超过10s,则执行通话挂断程序。
在本申请的一个实施例中,图7示出了本申请实施例的通话控制方法的流程图之七,包括:
步骤702,在电子设备处于第一通话接通状态的情况下,获取待发送信息;
步骤704,在待发送信息为文字信息的情况下,对待发送信息进行处理,以确定待发送信息对应的目标语音信息;
步骤706,在待发送信息为语音信息的情况下,将待发送信息作为目标语音信息;
步骤708,将目标语音信息发送至通话对端。
在该实施例中,当用户开启后台接听模式,通话对端发送的通话声音信息可通过转化成文字的方式显示在电子设备上。若用户需要进行回复,可采用文字或语音的方式进行待发送信息的反馈。具体地,若获取的待发送信息为文字信息时,通过转换处理将文字信息转换为目标语音信息,并发送目标语音信息至通话对端,一方面,用户可不发出任何声音,全程通过文字与通话对端进行交流,使用户在一些不适合直接拨打电话的场合也能够方便的进行交流,另一方面,由于发送至通话对端的目标语音信息是通过文字转换而成的,能够有效规避嘈杂的环境声音对语音通话造成的干扰,保证了语音信息的清晰度。若获取的待发送信息为语音信息时,可直接发送该语音信息至通话对端,节省了用户输入文字信息所需的时间,保证较高的通话效率。
具体地,对待发送信息进行处理可采用文转音(TTS)技术,将获取是文字形式的待发送信息转换成对应的语音信号。其中,其中TTS技术在内置芯片的支持之下,通过神经网络的设计,将单独的文字按照词组和句子的格式进行合并连读,把文字转化为自然语音流。
进一步地,在输入文字形式的待发送信息时,可选择插入保存在预置在电子设备存储单元中的常用短语,例如“好的”、“再见”或“您好”等常用词句。待发送信息的输入方式可以通过键盘输入或触摸屏手写输入,具体方式如普通手机编写短信息的过程类似。输入完毕后,自动转换成语音进行发送。
具体举例来说,在后台通话模式下,用户直接打开通话对话框,输入要通话的对方号码。手机后台向用户输入的号码拨出电话,待电话拨通后将对端的机器人客服自动回复的语音转换为文字显示在对话框上。检测机器人客服自动回复中是否存在供用户选择的功能选项(如按键1:查询话费、按键2:查询流量)。若存在,将该功能选项以列表的形式展示在对话框上供用户选择,选择后将用户的选项以自动客服要求的方式(如在拨号键盘输入特定数字)回发给客服;若不存在,则提示用户输入文字,转换成语音后回发给客服。用户回复后检测对方的回复,以语气、语速或对面的回复语音内容为条件,判断是否接通人工客服或处于等待人工客服接通的状态;若否则继续通过文字与机器人客服进行对话。若处于等待人工客服接通的状态检测等待过程中通话对面的人声,以语气、语速或对面的回复内容为条件,判断人工客服是否接通。在人工客服已接通的情况下,以铃声或震动的形式提示用户。在通话过程中,用户选择是否返回正常电话形式,若用户选择返回电话形式,对话框消失,用户以正常的电话形式与客服进行交流。若用户选择不返回电话形式,继续将客服的语音转换为文字显示在对话框中,以文字形式交流。用户还可输入语音或在对话框中输入文字发送给客服。若用户发送的是语音,直接发送给客服,若发送的是文字,则转换成语音后再发送给客服,直至结束通话。
在本申请的一个实施例中,对待发送信息进行处理,以确定待发送信息对应的目标语音信息的步骤,包括:获取通话对端的用户信息;在用户信息与预设用户信息匹配的情况下,按照预设用户信息对应的语言种类对待发送信息进行语音转化处理,以确定目标语音信息。
在该实施例中,通过通话对端的用户信息匹配出适合该联系人的语言种类,并按照该语言种类进行语音转化处理,使得转换后的目标语音信息能够贴合通话对端的联系人的通话习惯。从而能够为不同的联系人配置不同的语言种类,满足与不同语言种类的联系人进行通话时的需求。
例如,用户给家乡的老乡打电话,通过语音转化处理自动将文字形式的待发送信息转换成家乡方言形式的目标语音信息,从而拉进通信双方之间的距离,使得文字通话更加符合正常语音通话的实际情况,提升用户的使用体验。
在本申请的一个实施例中,如图10所示,通话控制装置1000包括:获取模块1002,获取模块1002用于获取电子设备接收的通话声音信息;确定模块1004,确定模块1004用于在通话声音信息的声音特征在第一声音特征范围内的情况下,确定电子设备处于第一通话接通状态;提示模块1006,提示模块1006用于输出接通提示信息。
在该实施例中,在用户拨打电话时,获取通话声音信息,通过比对通话声音信息的声音特征和预设的第一声音特征范围,分辨该通话声音信息是否为人发出的声音。若是,则可以确定通话双方已经接通,且通话对端为人,可正常进行通话交流。此时,输出接通提示信息,以告知用户通话已经接通。从而在电话等待接通的过程中,用户可分心处理其它事务,无需时刻关注电子设备便可对接通状态做出反应,既能防止接听等待时间过长而导致通话被挂断的情况,又能节省用户时间,提高通话效率,而且,电子设备无需放置在用户耳边,有利于减小了电子设备对用户造成的辐射。
可选的,通话控制装置1000还包括:音频模块(图中未示出),音频模块用于取消播放通话声音信息;第一处理模块(图中未示出),第一处理模块用于对通话声音信息进行处理,以确定通话声音信息对应的文字信息;显示模块(图中未示出),显示模块用于显示通话声音信息对应的文字信息。
可选的,在电子设备处于通话接通状态的情况下,显示模块还用于显示播放控制窗口,通话接通状态包括第一通话接通状态;通话控制装置1000还包括:第一接收模块(图中未示出),第一接收模块用于接收对播放控制窗口的第一输入;显示模块还用于响应于第一输入,取消显示通话声音信息对应的文字信息;音频模块还用于播放通话声音信息。
可选的,确定模块1004还用于确定通话声音信息中噪音的音量信息;通话控制装置1000还包括:降噪模块(图中未示出),降噪模块用于在音量信息大于或等于预设音量的情况下,对通话声音信息进行降噪处理;第一处理模块还用于对降噪处理处理后的通话声音信息或音量信息小于预设音量的通话声音信息进行文字转化处理,以确定通话声音信息对应的文字信息。
可选的,确定模块1004还用于在通话声音信息的声音特征在第二声音特征范围内的情况下,确定电子设备处于第二通话接通状态;通话控制装置1000还包括:关联模块(图中未示出),关联模块用于在电子设备处于第二通话接通状态,且所通话声音信息对应的文字信息的内容包括功能选项的情况下,关联功能选项的第二控件和电子设备的数字键盘;第二接收模块(图中未示出),第二接收模块用于接收对第二控件的第二输入;第一发送模块(图中未示出),第一发送模块用于响应于第二输入,将与第二控件关联的数字发送至通话对端。
可选的,显示模块还用于按照预设格式模板,显示功能选项。
可选的,确定模块1004还用于在通话声音信息的声音特征超出第一声音特征范围和第二声音特征范围的持续时长大于或等于预设时长的情况下,确定电子设备处于通话未接通状态;通话控制装置1000还包括:控制模块(图中未示出),控制模块用于断开电子设备的通话连接;提示模块1006还用于输出未接通提示信息。
可选的,确定模块1004还用于确定第一声音特征范围中语音关键词对应的语音特征范围;在语音特征在语音特征范围内的情况下,确定语音关键词和第一声音特征范围中的第一语音关键词的相似度;在相似度大于预设相似度的情况下,确定通话声音信息的声音特征在第一声音特征范围内;其中,语音特征值包括以下至少一种:语速特征值、语调特征值和音色特征。
可选的,获取模块1002还用于在电子设备处于第一通话接通状态的情况下,获取待发送信息;通话控制装置1000还包括:第二处理模块(图中未示出),第二处理模块用于在待发送信息为文字信息的情况下,对待发送信息进行处理,以确定待发送信息对应的目标语音信息;确定模块1004还用于在待发送信息为语音信息的情况下,将待发送信息作为目标语音信息;第二发送模块(图中未示出),第二发送模块用于将目标语音信息发送至通话对端。
可选的,获取模块1002还用于获取通话对端的用户信息;第二处理模块还用于在用户信息与预设用户信息匹配的情况下,按照预设用户信息对应的语言种类对待发送信息进行语音转化处理,以确定目标语音信息。
可选的,提示模块1006还用于执行电子设备的震动程序,以使电子设备震动;和/或播放第一通话接通状态对应的音频信息。
在该实施例中,通话控制装置1000的各模块执行各自功能时实现第一方面的任一实施例中的通话控制方法的步骤,因此,通话控制装置1000同时也包括第一方面任一实施例中的通话控制方法的全部有益效果,在此不再赘述。
本申请实施例中的通话控制装置可以是装置,也可以是终端中的部件、集成电路、或芯片。该装置可以是移动电子设备,也可以为非移动电子设备。示例性的,移动电子设备可以为手机、平板电脑、笔记本电脑、掌上电脑、车载电子设备、穿戴设备、超级移动个人计算机(ultra-mobile personal computer,UMPC)、上网本或者个人数字助理(personaldigital assistant,PDA)等,非移动电子设备可以为服务器、网络附属存储器(NetworkAttached Storage,NAS)、个人计算机(personal computer,PC)、电视机(television,TV)或者自助机等,本申请实施例不作具体限定。
本申请实施例中的通话控制装置可以为具有操作系统的装置。该操作系统可以为安卓(Android)操作系统,可以为iOS操作系统,还可以为其他能的操作系统,本申请实施例不作具体限定。
在本申请的一个实施例中,如图11所示,提供了一种电子设备1100,包括:处理器1101,存储器1102及存储在存储器1102上并在处理器1101上运行的程序或指令,程序或指令被处理器1101执行时实现如上述任一实施例中提供的通话控制方法的步骤,因此,该电子设备1100包括如上述任一实施例中提供的通话控制方法的全部有益效果,在此不再赘述。
在本申请的一个实施例中,提供了一种电子设备,包括上述任一实施例中提供的通话控制装置。因此,该电子设备包括如上述任一实施例中提供的通话控制装置的全部有益效果,在此不再赘述。
需要说明的是,本申请实施例中的电子设备包括上述的移动电子设备和非移动电子设备。
图12为实现本申请实施例的一种电子设备1200的硬件结构示意图。该电子设备1200包括但不限于:射频单元1201、网络模块1202、音频输出单元1203、输入单元1204、传感器1205、显示单元1206、用户输入单元1207、接口单元1208、存储器1209、以及处理器1210等部件。
本领域技术人员可以理解,电子设备1200还可以包括给各个部件供电的电源(比如电池),电源可以通过电源管理系统与处理器1210逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。图12中示出的电子设备结构并不构成对电子设备的限定,电子设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置,在此不再赘述。
其中,处理器1210用于获取电子设备接收的通话声音信息;在通话声音信息的声音特征在第一声音特征范围内的情况下,确定电子设备处于第一通话接通状态,并输出接通提示信息。
在该实施例中,在用户拨打电话时,获取通话声音信息,通过比对通话声音信息的声音特征和预设的第一声音特征范围,分辨该通话声音信息是否为人发出的声音。若是,则可以确定通话双方已经接通,且通话对端为人,可正常进行通话交流。此时,输出接通提示信息,以告知用户通话已经接通。从而在电话等待接通的过程中,用户可分心处理其它事务,无需时刻关注电子设备便可对接通状态做出反应,既能防止接听等待时间过长而导致通话被挂断的情况,又能节省用户时间,提高通话效率,而且,电子设备无需放置在用户耳边,有利于减小了电子设备对用户造成的辐射。
进一步地,音频输出单元1203用于取消播放通话声音信息;处理器1210还用于对通话声音信息进行处理,以确定通话声音信息对应的文字信息;显示单元1206用于显示通话声音信息对应的文字信息。
进一步地,在电子设备处于通话接通状态的情况下,显示单元1206还用于显示播放控制窗口,通话接通状态包括第一通话接通状态;用户输入单元1207用于接收对播放控制窗口的第一输入;显示单元1206还用于响应于第一输入,取消显示通话声音信息对应的文字信息;音频输出单元1203还用于播放通话声音信息。
进一步地,处理器1210还用于确定通话声音信息中噪音的音量信息;在音量信息大于或等于预设音量的情况下,对通话声音信息进行降噪处理;对降噪处理处理后的通话声音信息或音量信息小于预设音量的通话声音信息进行文字转化处理,以确定通话声音信息对应的文字信息。
进一步地,处理器1210还用于在通话声音信息的声音特征在第二声音特征范围内的情况下,确定电子设备处于第二通话接通状态;在电子设备处于第二通话接通状态,且所通话声音信息对应的文字信息的内容包括功能选项的情况下,关联功能选项的第二控件和电子设备的数字键盘;用户输入单元1207还用于接收对第二控件的第二输入;射频单元1201用于响应于第二输入,将与第二控件关联的数字发送至通话对端。
进一步地,显示单元1206还用于按照预设格式模板,显示功能选项。
进一步地,处理器1210还用于在通话声音信息的声音特征超出第一声音特征范围和第二声音特征范围的持续时长大于或等于预设时长的情况下,确定电子设备处于通话未接通状态;断开电子设备的通话连接,并输出未接通提示信息。
进一步地,处理器1210还用于确定第一声音特征范围中语音关键词对应的语音特征范围;在语音特征在语音特征范围内的情况下,确定语音关键词和第一声音特征范围中的第一语音关键词的相似度;在相似度大于预设相似度的情况下,确定通话声音信息的声音特征在第一声音特征范围内;其中,语音特征值包括以下至少一种:语速特征值、语调特征值和音色特征。
进一步地,处理器1210还用于在电子设备处于第一通话接通状态的情况下,获取待发送信息;在待发送信息为文字信息的情况下,对待发送信息进行处理,以确定待发送信息对应的目标语音信息;在待发送信息为语音信息的情况下,将待发送信息作为目标语音信息;射频单元1201还用于将目标语音信息发送至通话对端。
进一步地,处理器1210还用于获取通话对端的用户信息;在用户信息与预设用户信息匹配的情况下,按照预设用户信息对应的语言种类对待发送信息进行语音转化处理,以确定目标语音信息。
进一步地,处理器1210还用于执行电子设备的震动程序,以使电子设备震动;和/或音频输出单元1203还用于播放第一通话接通状态对应的音频信息。
应理解的是,本申请实施例中,输入单元1204可以包括图形处理器(GraphicsProcessing Unit,GPU)1241和麦克风1242,图形处理器1241对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。显示单元1206可包括显示面板1261,可以采用液晶显示器、有机发光二极管等形式来配置显示面板1261。用户输入单元1207包括触控面板1271以及其他输入设备1272。触控面板1271,也称为触摸屏。触控面板1271可包括触摸检测装置和触摸控制器两个部分。其他输入设备1272可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆,在此不再赘述。存储器1209可用于存储软件程序以及各种数据,包括但不限于应用程序和操作系统。处理器1210可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器1210中。
在本申请的一个实施例中,提供了一种读存储介质,其上存储有程序或指令,该程序或指令被处理器执行时实现如上述任一实施例中提供的通话控制方法的步骤。
在该实施例中,读存储介质能够实现本申请的实施例提供的通话控制方法的各个过程,并能达到相同的技术效果,为避免重复,这里不再赘述。
其中,处理器为上述实施例中的通信设备中的处理器。读存储介质,包括计算机读存储介质,如计算机只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、磁碟或者光盘等。
本申请实施例还提供了一种芯片,芯片包括处理器和通信接口,通信接口和处理器耦合,处理器用于运行程序或指令,实现上述通话控制方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。应理解,本申请实施例提到的芯片还以称为系统级芯片、系统芯片、芯片系统或片上系统芯片等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。此外,需要指出的是,本申请实施方式中的方法和装置的范围不限按示出或讨论的顺序来执行功能,还可包括根据所涉及的功能按基本同时的方式或按相反的顺序来执行功能,例如,可以按不同于所描述的次序来执行所描述的方法,并且还可以添加、省去、或组合各种步骤。另外,参照某些示例所描述的特征可在其他示例中被组合。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以计算机软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,或者网络设备等)执行本申请各个实施例所述的方法。
上面结合附图对本申请的实施例进行了描述,但是本申请并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本申请的启示下,在不脱离本申请宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本申请的保护之内。

Claims (10)

1.一种通话控制方法,其特征在于,包括:
获取电子设备接收的通话声音信息;
在所述通话声音信息的声音特征在第一声音特征范围内的情况下,确定所述电子设备处于第一通话接通状态,并输出接通提示信息。
2.根据权利要求1所述的通话控制方法,其特征在于,还包括:
取消播放所述通话声音信息;
对所述通话声音信息进行处理,以确定所述通话声音信息对应的文字信息;
显示所述通话声音信息对应的文字信息。
3.根据权利要求2所述的通话控制方法,其特征在于,还包括:
在电子设备处于所述通话接通状态的情况下,显示第一控件,所述通话接通状态包括所述第一通话接通状态;
接收对所述第一控件的第一输入;
响应于所述第一输入,取消显示所述通话声音信息对应的文字信息,并播放所述通话声音信息。
4.根据权利要求2所述的通话控制方法,其特征在于,还包括:
在所述通话声音信息的声音特征在第二声音特征范围内的情况下,确定所述电子设备处于第二通话接通状态;
在所述电子设备处于所述第二通话接通状态,且所通话声音信息对应的文字信息的内容包括功能选项的情况下,关联所述功能选项的第二控件和所述电子设备的数字键盘;
接收对所述第二控件的第二输入;
响应于所述第二输入,将与所述第二控件关联的数字发送至通话对端。
5.根据权利要求1至4中任一项所述的通话控制方法,其特征在于,还包括:
在所述电子设备处于所述第一通话接通状态的情况下,获取待发送信息;
在所述待发送信息为文字信息的情况下,对所述待发送信息进行处理,以确定所述待发送信息对应的目标语音信息;
在所述待发送信息为语音信息的情况下,将所述待发送信息作为目标语音信息;
将所述目标语音信息发送至通话对端。
6.一种通话控制装置,其特征在于,包括:
获取模块,用于获取电子设备接收的通话声音信息;
确定模块,用于在所述通话声音信息的声音特征在第一声音特征范围内的情况下,确定所述电子设备处于第一通话接通状态;
提示模块,用于输出接通提示信息。
7.根据权利要求6所述的通话控制装置,其特征在于,还包括:
音频模块,用于取消播放所述通话声音信息;
第一处理模块,用于对所述通话声音信息进行处理,以确定所述通话声音信息对应的文字信息;
显示模块,用于显示所述通话声音信息对应的文字信息。
8.根据权利要求7所述的通话控制装置,其特征在于,
所述显示模块,还用于在电子设备处于所述通话接通状态的情况下,显示第一控件,所述通话接通状态包括所述第一通话接通状态;
所述通话控制装置还包括:
第一接收模块,用于接收对所述第一控件的第一输入;
所述显示模块,还用于响应于所述第一输入,取消显示所述通话声音信息对应的文字信息;
所述音频模块,还用于播放所述通话声音信息。
9.根据权利要求7所述的通话控制装置,其特征在于,
所述确定模块,还用于在所述通话声音信息的声音特征在第二声音特征范围内的情况下,确定所述电子设备处于第二通话接通状态;
所述通话控制装置还包括:
关联模块,用于在所述电子设备处于所述第二通话接通状态,且所通话声音信息对应的文字信息的内容包括功能选项的情况下,关联所述功能选项的第二控件和所述电子设备的数字键盘;
第二接收模块,用于接收对所述第二控件的第二输入;
第一发送模块,用于响应于所述第二输入,将与所述第二控件关联的数字发送至通话对端。
10.根据权利要求6至9中任一项所述的通话控制装置,其特征在于,
所述获取模块,还用于在所述电子设备处于所述第一通话接通状态的情况下,获取待发送信息;
所述通话控制装置还包括:
第二处理模块,用于在所述待发送信息为文字信息的情况下,对所述待发送信息进行处理,以确定所述待发送信息对应的目标语音信息;
在所述待发送信息为语音信息的情况下,将所述待发送信息作为目标语音信息;
第二发送模块,用于将所述目标语音信息发送至通话对端。
CN202111140548.2A 2021-09-28 2021-09-28 通话控制方法和通话控制装置 Pending CN113873078A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111140548.2A CN113873078A (zh) 2021-09-28 2021-09-28 通话控制方法和通话控制装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111140548.2A CN113873078A (zh) 2021-09-28 2021-09-28 通话控制方法和通话控制装置

Publications (1)

Publication Number Publication Date
CN113873078A true CN113873078A (zh) 2021-12-31

Family

ID=78991631

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111140548.2A Pending CN113873078A (zh) 2021-09-28 2021-09-28 通话控制方法和通话控制装置

Country Status (1)

Country Link
CN (1) CN113873078A (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105100512A (zh) * 2015-07-17 2015-11-25 华为技术有限公司 一种提示通话状态改变的方法、用户设备和服务器
CN105472092A (zh) * 2014-07-29 2016-04-06 小米科技有限责任公司 通话控制方法、装置及移动终端
CN107360332A (zh) * 2017-09-12 2017-11-17 广东欧珀移动通信有限公司 通话状态显示方法、装置、移动终端及存储介质
CN111369995A (zh) * 2020-02-24 2020-07-03 宇龙计算机通信科技(深圳)有限公司 通话的方法、装置、电子设备及介质
CN111415665A (zh) * 2020-04-07 2020-07-14 浙江国贸云商控股有限公司 视频通话的语音处理方法、装置及电子设备

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105472092A (zh) * 2014-07-29 2016-04-06 小米科技有限责任公司 通话控制方法、装置及移动终端
CN105100512A (zh) * 2015-07-17 2015-11-25 华为技术有限公司 一种提示通话状态改变的方法、用户设备和服务器
CN107360332A (zh) * 2017-09-12 2017-11-17 广东欧珀移动通信有限公司 通话状态显示方法、装置、移动终端及存储介质
CN111369995A (zh) * 2020-02-24 2020-07-03 宇龙计算机通信科技(深圳)有限公司 通话的方法、装置、电子设备及介质
CN111415665A (zh) * 2020-04-07 2020-07-14 浙江国贸云商控股有限公司 视频通话的语音处理方法、装置及电子设备

Similar Documents

Publication Publication Date Title
US8611508B2 (en) Method an apparatus for converting a voice signal received from a remote telephone to a text signal
KR100678212B1 (ko) 휴대단말기의 감정정보 제어방법
CN108696641B (zh) 通话提示方法、装置、存储介质及移动终端
CN103973877A (zh) 一种在移动终端中利用文字实现实时通话的方法和装置
KR100365860B1 (ko) 이동 단말에서의 메시지 전송방법
CN107274897A (zh) 语音操控方法与移动终端装置
CN107613132A (zh) 语音接听方法与移动终端装置
CN107919138B (zh) 一种语音中的情绪处理方法及移动终端
US6563911B2 (en) Speech enabled, automatic telephone dialer using names, including seamless interface with computer-based address book programs
CN105577882B (zh) 一种信息显示的方法及用户终端
US6671354B2 (en) Speech enabled, automatic telephone dialer using names, including seamless interface with computer-based address book programs, for telephones without private branch exchanges
CN107483736A (zh) 一种即时通信应用程序的消息处理方法及装置
WO2020063451A1 (zh) 通话留言方法、终端和具有存储功能的装置
JPWO2015083741A1 (ja) 中継装置、表示装置および通信システム
US8611883B2 (en) Pre-recorded voice responses for portable communication devices
CN104601832A (zh) 对话系统与语音对话处理方法
CN113873078A (zh) 通话控制方法和通话控制装置
WO2020051881A1 (zh) 信息提示方法及相关产品
US20070286395A1 (en) Intelligent Multimedia Dial Tone
CN113726952A (zh) 通话过程中的同声传译方法及装置、电子设备、存储介质
CN107645604B (zh) 一种通话处理方法及移动终端
CN109587346A (zh) 来电管理方法、移动终端及存储介质
JP3916387B2 (ja) 電話応答コンピュータシステム,該システムの機能を実現するためのボード及び記録媒体
JP2015115926A (ja) 携帯端末装置、読唇通信方法、及びプログラム
CN111935348A (zh) 提供通话处理服务的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination