CN113126876A - 一种语音会话方法、装置、计算机设备和存储介质 - Google Patents
一种语音会话方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN113126876A CN113126876A CN202110529963.0A CN202110529963A CN113126876A CN 113126876 A CN113126876 A CN 113126876A CN 202110529963 A CN202110529963 A CN 202110529963A CN 113126876 A CN113126876 A CN 113126876A
- Authority
- CN
- China
- Prior art keywords
- speed
- voice
- touch
- voice information
- sending
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 56
- 238000003825 pressing Methods 0.000 claims description 43
- 238000010924 continuous production Methods 0.000 claims description 32
- 230000001960 triggered effect Effects 0.000 claims description 30
- 238000012790 confirmation Methods 0.000 claims description 27
- 230000008859 change Effects 0.000 claims description 23
- 238000004590 computer program Methods 0.000 claims description 13
- 230000004044 response Effects 0.000 claims description 11
- 230000005540 biological transmission Effects 0.000 claims description 10
- 230000006870 function Effects 0.000 description 24
- 238000004891 communication Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 8
- 230000003247 decreasing effect Effects 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 238000001514 detection method Methods 0.000 description 5
- 230000009467 reduction Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000007599 discharging Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000001815 facial effect Effects 0.000 description 1
- 210000001145 finger joint Anatomy 0.000 description 1
- 238000012905 input function Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0487—Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser
- G06F3/0488—Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0484—Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本发明公开了一种语音会话方法、装置、计算机设备和存储介质,可显示即时通讯客户端的会话页面,会话页面包括语音消息控件;响应针对语音消息控件的第一触控操作,采集外部的语音信息;响应与第一触控操作连续的第二触控操作,结束语音信息的采集,基于第二触控操作确定语音信息的语速调整参数;响应针对语音信息的变速发送操作,发送根据语速调整参数调整语音信息得到的调整后语音信息,由此,用户通过第二触控操作可设置需要发送的语音信息的语速,避免时长过长、语速过快等给语音接收方带来的不便。
Description
技术领域
本发明涉及即时通讯技术领域,具体涉及一种语音会话方法、装置、计算机设备和存储介质。
背景技术
目前,语音消息是即时通讯技术中经常使用的一种通讯方式,在该通讯方式中一般由语音发送发录制语音信息发送给语音接收方。
实际中,一些特殊用户因为年纪或生理缺陷等原因,会出现发音困难、说话缓慢的情况,这些特殊用户使用语音消息的功能时,发出的语音消息很容易出现时长过长的问题,不利于语音接收方的收听,更会降低利于这些特殊用户对语音消息的使用积极性。
发明内容
本发明实施例提供一种语音会话方法、装置、计算机设备和存储介质,可以在语音信息发送前,自由调整语音信息的语速。
本发明实施例提供一种语音会话方法,该方法包括:
显示即时通讯客户端的会话页面,所述会话页面包括语音消息控件;
响应针对所述语音消息控件的第一触控操作,采集外部的语音信息;
响应与所述第一触控操作连续的第二触控操作,结束语音信息的采集,基于所述第二触控操作确定所述语音信息的语速调整参数;
响应针对所述语音信息的变速发送操作,发送根据所述语速调整参数调整所述语音信息得到的调整后语音信息。
本发明实施例提供一种语音会话装置,该装置包括:
会话页面显示单元,用于显示即时通讯客户端的会话页面,所述会话页面包括语音消息控件;
语音采集单元,用于响应针对所述语音消息控件的第一触控操作,采集外部的语音信息;
调整参数设置单元,用于响应与所述第一触控操作连续的第二触控操作,结束语音信息的采集,基于所述第二触控操作确定所述语音信息的语速调整参数;
发送单元,用于响应针对所述语音信息的变速发送操作,发送根据所述语速调整参数调整所述语音信息得到的调整后语音信息。
在一个可选的示例中,调整参数设置单元,用于在所述第二触控操作的持续过程中,基于所述第二触控操作的变化实时更新所述语音信息的语速调整参数。
在一个可选的示例中,发送单元,用于若所述第二触控操作结束,确定触发了针对所述语音信息的变速发送操作,响应所述变速发送操作,获取所述变速发送操作被触发时的语速调整参数,发送根据所述语速调整参数调整所述语音信息得到的调整后语音信息。
在一个可选的示例中,所述第二触控操作包括滑动操作与长按操作的组合操作;
所述调整参数设置单元,用于:
在所述第二触控操作的持续过程中,确定所述第二触控操作的触控参数;
根据所述触控参数,实时更新所述语音信息的语速调整参数。
在一个可选的示例中,所述第二触控操作包括滑动操作与长按操作的组合操作,所述触控参数包括滑动方向和在触控点的持续按压时长;
所述调整参数设置单元,用于:
在所述滑动操作的持续过程中,确定所述滑动操作的滑动方向;
若检测到所述滑动操作切换为长按操作,获取所述长按操作的触控点的持续按压时长;
基于所述滑动方向更新语速调整参数的语速调整方向,基于所述持续按压时长更新所述语速调整参数的语速调整幅度。
在一个可选的示例中,所述第二触控操作包括滑动操作与长按操作的组合操作,所述触控参数包括滑动方向和在触控点的按压力度;
所述调整参数设置单元,用于:
在所述滑动操作的持续过程中,确定所述滑动操作的滑动方向;
若检测到所述滑动操作切换为长按操作,获取所述长按操作的触控点的按压力度;
基于所述滑动方向更新语速调整参数的语速调整方向,基于所述按压力度更新所述语速调整参数的语速调整幅度。
在一个可选的示例中,所述第二触控操作包括滑动操作,所述触控参数包括:所述滑动操作的触控点的当前触控位置;
所述调整参数设置单元,用于:
在所述滑动操作的持续过程中,确定所述滑动操作的触控点的当前触控位置;
获取所述滑动操作的触控点的起始触控位置;
基于所述起始触控位置和所述当前触控位置的相对位置信息,确定语速调整参数中的语速调整方向;
根据所述起始触控位置与所述当前触控位置的距离,确定所述语速调整参数中的语速调整幅度。
在一个可选的示例中,所述发送单元,用于:
若所述第二触控操作结束,确定触发了针对所述语音信息的变速发送操作,响应所述变速发送操作,显示确认发送子页面,所述确认发送子页面包括确认发送控件和语速重设控件;
若在所述确认发送子页面显示后的预设确认时长内,检测到针对所述确认发送控件的触发操作,获取所述变速发送操作被触发时的语速调整参数,发送根据所述语速调整参数调整所述语音信息得到的调整后语音信息;
若在所述确认发送子页面显示后的预设确认时长内,未检测到针对所述确认发送控件或语速重设控件的触发操作,获取所述变速发送操作被触发时的语速调整参数,发送根据所述语速调整参数调整所述语音信息得到的调整后语音信息。
在一个可选的示例中,所述发送单元,还用于:
若检测到针对所述语速重设控件的触发操作,不执行所述获取所述变速发送操作被触发时的语速调整参数,发送根据所述语速调整参数调整所述语音信息得到的调整后语音信息的步骤,显示语速重设子页面;
响应于针对所述语速重设子页面的语速重设操作,获取重设后语速调整参数;
响应于针对所述语速重设子页面的语音发送操作,发送以所述重设后语速调整参数对所述语音信息进行语速调整得到的调整后语音信息。
在一个可选的示例中,调整参数设置单元,还用于在所述第二触控操作的持续过程中,基于实时更新的语速调整参数对所述语音信息进行语速调整,得到参考语音信息;播放参考语音信息。
在一个可选的示例中,还包括时长提示单元,用于:
在所述第二触控操作的持续过程中,基于实时更新的语速调整参数,以及所述语音信息的原始时长,计算以所述实时更新的语速调整参数对所述语音信息进行语速调整后,得到的语音信息的实际时长;在所述会话页面显示调整后时长提示信息,所述调整后时长提示信息包括所述实际时长的描述信息。
在一个可选的示例中,发送单元,还用于:
将所述变速发送操作时的语音信息作为所述调整后语音信息的原速语音信息,发送给所述即时通讯客户端对应的服务器,以便所述服务器在接收到针对所述调整后语音信息的原速信息获取请求时,将所述原速语音信息发送给所述原速信息获取请求的发送方。
本发明实施例还提供一种计算机设备,包括存储器,处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,所述处理器执行所述计算机程序时实现如上所述方法的步骤。
本发明实施例还提供一种存储介质,其上存储有计算机程序,其中,所述计算机程序被处理器执行时实现如上所述方法的步骤。
本发明实施例提供了一种语音会话方法、装置、计算机设备和存储介质,可显示即时通讯客户端的会话页面,会话页面包括语音消息控件;响应针对语音消息控件的第一触控操作,采集外部的语音信息;响应与第一触控操作连续的第二触控操作,结束语音信息的采集,基于第二触控操作确定语音信息的语速调整参数;响应针对语音信息的变速发送操作,发送根据语速调整参数调整语音信息得到的调整后语音信息,由此,用户可以通过第二触控操作,自由设置待发送的语音信息的语速,从而调整语音信息的时长,避免时长过长或语速过快等情况对语音接收方带来的收听时长过长等问题,也可以避免时长过长或语速过快时,用户重新录制语音信息带来的耗费时间的问题。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1a是本发明实施例提供的语音会话方法的场景示意图;
图1b是本发明实施例提供的一种语音会话方法的流程图;
图2a是本发明实施在发送语音消息的过程中,通过向右滑动手指增大语音信息的语速的示意图;
图2b是本发明实施在发送语音消息的过程中,会话页面的一种显示示意图;
图2c是本发明实施在发送语音消息的过程中,会话页面的另一种显示示意图;
图2d是本发明实施在发送目标语音消息后,会话页面的示意图;
图2e是本发明实施在发送语音消息的过程中,通过向左滑动手指减小语音信息的语速的示意图;
图2f是本发明实施中,在变速语音信息的接收侧,播放原速语音信息的一种示意图;
图2g是本发明实施中,在变速语音信息的接收侧,播放原速语音信息的另一种示意图;
图2h是本发明实施中,在变速语音信息的接收侧,播放原速语音信息的又一种示意图;
图3是本发明实施例提供的一种语音会话装置的结构示意图;
图4是本发明实施例提供的一种计算机设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供一种语音会话方法、装置、计算机设备和存储介质。具体地,本实施例提供适用于语音会话装置的语音会话方法,该语音会话装置可以集成在计算机设备中。该计算机设备可以为终端等设备,例如可以为手机、平板电脑、笔记本电脑、台式电脑等。
本实施例的语音会话方法,可以由终端和服务器共同实现。
参考图1a,本发明实施例提供的语音会话系统包括终端10和服务器20等;终端10与服务器20之间通过网络连接,比如,通过有线或无线网络连接等。
其中,终端10,可以用于显示即时通讯客户端的会话页面,会话页面包括语音消息控件;响应针对语音消息控件的第一触控操作,采集外部的语音信息;响应与第一触控操作连续的第二触控操作,结束语音信息的采集,基于第二触控操作确定语音信息的语速调整参数;响应针对语音信息的变速发送操作,发送根据语速调整参数调整语音信息得到的调整后语音信息。
其中,将所述调整后语音信息发送给所述会话页面的会话用户可以通过服务器20实现,服务器20是即时通信客户端的服务器。可以接收终端10发送的调整后语音信息,将调整后语音信息发送给会话页面中会话用户的终端。
其中,服务器20可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器,但并不局限于此。
以下分别进行详细说明。需说明的是,以下实施例的描述顺序不作为对实施例优选顺序的限定。
本发明实施例的一个方面提供了一种语音会话方法,如图1b所示,本实施例的语音会话方法的流程可以如下:
101、显示即时通讯客户端的会话页面,所述会话页面包括语音消息控件;
其中,即时通讯客户端可以是任意具有即时通讯功能的客户端,当然,在一些实施例中,即时通讯客户端除了即时通讯功能,还可以具有其他的功能,例如可以具有购物、游戏等功能。
上述的会话页面,可以是单聊会话页面,也可以是多聊会话页面,本实施例对此没有限制。
其中,会话页面中的会话用户,可以分为第一会话用户和第二会话用户,第一会话用户为当前的即时通讯客户端的会话用户,第二会话用户,为会话页面中除了第一会话用户之外的其他会话用户。
其中,显示包括语音消息控件的会话页面的步骤可以包括:
显示即时通讯消息的会话页面,所述会话页面包括会话信息输入控件,会话信息输入控件包括语音输入切换子控件和文本输入框子控件;
响应于针对所述语音输入切换子控件的触发操作,将所述文本输入框子控件切换显示为语音消息控件。
其中,通过文本输入框子控件,可以唤起虚拟键盘在会话页面中进行文本信息的输入和发送等操作,实现在会话页面中与第二会话用户的文本会话交流。
例如,图2a中201指示的页面中的名为“按住说话”的控件即为本实施例中的语音消息控件。其作用包括:在被按住时采集用户的语音信息,在针对该控件的操作结束时,将语音信息发送给会话页面中的其他会话用户,并将语音信息显示在会话页面中。
102、响应针对所述语音消息控件的第一触控操作,采集外部的语音信息;
可选的,一个示例中,用户可以通过手指或者触控操作设备如触控笔等来实现针对语音消息控件的第一触控操作,本实施例对此没有限制。
其中,可以在第一触控操作的持续期间,通过终端的麦克风采集终端外部的语音信息。可以理解的是,第一触控操作的持续,指的是用户触碰语音消息控件后,并未控制手指、触控笔等触摸端结束对触摸位置的触摸。例如,以手指按住语音消息控件触发第一触控操作为例,第一触控操作持续,包括手指未离开触摸屏。
其中,可以在检测到针对所述语音消息控件的第一触控操作的同时,开启麦克风采集外部的语音信息。
一个示例中,本实施例的第一触控操作可以是触摸位置不变的定点触控操作。
103、响应与所述第一触控操作连续的第二触控操作,结束语音信息的采集,基于所述第二触控操作确定所述语音信息的语速调整参数;
其中,第一触控操作与第二触控操作连续,即为第一触控操作的最终触控点为第二触控操作的初始触控点。例如,在用户手指(或触控操作设备)未离开语音消息控件的情况下,用户手指从接触屏幕的触控点开始进行第二触控操作(如滑动等)。
其中,本实施例的第二触控操作的具体类型不限,可以是单一的触控操作,也可以是多个触控操作的组合,例如,第二触控操作可以是滑动操作,也可以是滑动操作与长按操作的组合操作,或者,也可以是滑动操作和图形绘制操作的组合操作,或者还可以是滑动操作与针对控件的触发操作的组合操作等,本实施例对此没有限制。
其中,可以理解的是,在检测到第二触控操作时,可以认为第一触控操作结束,终端可以关闭麦克风以结束语音信息的采集。
其中,对于不同的第二触控操作,可以设置不同的语速调整参数确定规则,本实施例对该规则的设置没有限制。
在一个示例中,语速调整参数可以包括语速调整方向和语速调整幅度,其中语速调整方向包括语速增大和缩小,语速调整幅度指的是语音信息在语速调整方向上的语速调整幅度,例如,语音信息的语速调整方向为语速增大,语速调整幅度为2倍,则基于语速调整参数,会将语音信息的语速增大两倍,又例如,语音信息的语速调整方向为语速缩小,语速调整幅度为1.5倍,则基于语速调整参数,会将语音信息的语速缩小1.5倍。
104、响应针对所述语音信息的变速发送操作,发送根据所述语速调整参数调整所述语音信息得到的调整后语音信息。
其中,发送调整后语音信息,可以包括:将调整后语音信息发送给会话页面的会话用户。具体的,可以包括但不限于:将调整后语音信息发送给会话页面的第二会话用户,并在会话页面显示调整后语音信息。
其中,对所述语音信息基于所述语速调整参数进行语速调整的步骤,可以在检测到针对所述语音信息的变速发送操作前进行,也可以在检测到针对所述语音信息的变速发送操作后进行。
在一个示例中,语速调整参数是可以根据第二触控操作实时更新的参数。
一个示例中,当检测到第二触控操作结束时,可以认为触发了针对语音信息的变速发送操作。若第二触控操作包括多个触控操作,则第二触控操作结束,可以理解为第二触控操作中最后一个触控操作结束(例如手指离开触摸屏)。
可选的,在该语速调整参数实时更新的过程中,可以根据每一个更新得到的语速调整参数对语音信息进行语速调整,临时存储语速调整得到的语音信息。在检测到针对所述语音信息的变速发送操作时,将最新的、经过语速调整得到的语音信息作为调整后语音信息进行发送。
可选的,还可以在检测到针对所述语音信息的变速发送操作时,再获取最新的语音调整参数,以该语音调整参数来对语音信息的语速进行调整,得到调整后语音信息。
一个示例中,可选的,步骤“基于所述第二触控操作确定所述语音信息的语速调整参数”,包括:在所述第二触控操作的持续过程中,基于所述第二触控操作的变化实时更新所述语音信息的语速调整参数。
对应的,步骤“响应针对所述语音信息的变速发送操作,发送根据所述语速调整参数调整所述语音信息得到的调整后语音信息”,包括:
若所述第二触控操作结束,确定触发了针对所述语音信息的变速发送操作,响应所述变速发送操作,获取所述变速发送操作被触发时的语速调整参数,发送根据所述语速调整参数调整所述语音信息得到的调整后语音信息。
其中,第二触控操作的结束包括:执行第二触控操作的操作物(如手指或触控操作设备)结束对触控屏的接触。
本实施例中,可以基于第二触控操作的触控参数,来实时更新语音信息的语速调整参数。其中,第二触控操作的触控参数的类型不限,包括但不限于:第二触控操作的触控点的位置、滑动方向、滑动距离、按压力度、按压持续时长等等参数。
其中,不同类型的触控参数,可以用于更新不同的语速调整参数。
可选的,在一个示例中,第二触控操作包括滑动操作与长按操作的组合操作,触控参数可以包括滑动方向和在触控点的持续按压时长;在第二触控操作中,滑动操作和长按操作是连续的,该连续可以理解为:滑动操作的最终触控点为长按操作的初始触控点。
步骤“在所述第二触控操作的持续过程中,确定所述第二触控操作的触控参数”,可以包括:
在所述滑动操作的持续过程中,确定所述滑动操作的滑动方向;
若检测到所述滑动操作切换为长按操作,获取所述长按操作的触控点的持续按压时长;
步骤“根据所述触控参数,实时更新所述语音信息的语速调整参数”,可以包括:
基于所述滑动方向更新语速调整参数的语速调整方向,基于所述持续按压时长更新所述语速调整参数的语速调整幅度。
可以理解的是,滑动操作和长按操作并不是同时进行的,所以语速调整方向在滑动操作的过程中变化,在长按操作的过程中保持不变,语速调整幅度在滑动操作的过程中不变,在长按操作的过程中变化。
可选的,可以预先设置滑动方向与语速调整方向的第一对应关系,在“基于所述滑动方向更新语速调整参数的语速调整方向”的过程中,根据滑动操作的滑动方向和该第一对应关系,确定语速调整参数中的语速调整方向。
其中,滑动操作切换为长按操作时,用户触发第二触控操作的操作端(如手指或触控笔等)并不离开触控屏的表面。
在一个示例中,滑动操作的滑动方向,可以理解为滑动操作的触控点的当前触控位置相较于触控点的初始触控位置的方向,语速调整参数的语速调整方向则理解为语音信息调整后的语速相较于语音信息的原始语速的变化方向(增大或减小)。
例如,第一对应关系中,向左滑动(滑动操作的触控点的当前触控位置在初始触控位置的左侧)对应的语速调整方向是语速增大方向,向右滑动(滑动操作的触控点的当前触控位置在初始触控位置的右侧)对应的语速调整方向是语速减小方向,或者,第一对应关系中,向上滑动(滑动操作的触控点的当前触控位置在初始触控位置的上侧)对应的语速调整方向是语速增大方向,向下滑动(滑动操作的触控点的当前触控位置在初始触控位置的下侧)对应的语速调整方向是语速减小方向等等。
例如,若第二触控操作中的滑动操作的触控点的当前触控位置在初始触控位置的右侧,则对语音信息的语速调整操作是语速减小操作。
在一个示例中,滑动操作的滑动方向,可以理解为滑动操作的触控点的当前触控位置相较于前一刻的触控位置的滑动方向。在滑动方向不发生反向变化的情况下,第一对应关系可以是滑动操作的触控点的当前触控位置相较于前一刻的触控位置的滑动方向,与语速调节方向的对应关系,例如,滑动操作的触控点的当前触控位置相较于前一刻的触控位置的滑动方向为向左滑动,则语速调节方向为语速减小方向等等。
考虑到实际应用中,语速调节方向为语速增加方向使用更为频繁和重要,还可以进一步根据用户单手操作时的惯用持机方式,即用户单手操作时,一般是左手持机还是右手持机,来设置第一对应关系中语速增大方向对应的滑动方向。可选的,本实施例步骤101之前,可以先获取用户单手持机时的更常用的持机方式,将朝着用户持机一侧运动的运动方向设置为语速增大方向对应的滑动方向。即,若用户一般使用右手持机,则设置向右滑动对应语速增大方向,若用户一般使用左手持机,则设置向左滑动对应语速增大方向。
当然,若是某种场景下语速减小方向更为重要,可以将朝着用户持机一侧运动的运动方向,设置为语速减小方向对应的滑动方向。
可选的,还可以预先设置长按操作的持续按压时长与语速调整幅度的第二对应关系,根据第二对应关系和长按操作的持续按压时长,确定语音信息的语速调整参数中的语速调整幅度。
例如,第二对应关系为语速调整幅度F=t/K+1,其中,t为持续按压时长,单位为秒,其中,K为幅度计算参考值,是定值,单位为秒,可以根据需要设置,例如设置为5,10、20等数值。
其中,1为语速调整幅度的初始值,初始值为1表示基于该初始值调整后的语速在语速调整方向上是调整前的一倍(即语速不变)。
本实施例中所描述的滑动操作,可以是直线滑动或曲线滑动操作,本实施例对此没有限制。
一个示例中,终端还可以检测按压屏幕的压力,用户可以通过按压力度的改变来设置语速调整幅度,可选的,第二触控操作包括滑动操作与长按操作的组合操作,所述触控参数包括滑动方向和在触控点的按压力度;
步骤“在所述第二触控操作的持续过程中,确定所述第二触控操作的触控参数”,包括:
在所述滑动操作的持续过程中,确定所述滑动操作的滑动方向;
若检测到所述滑动操作切换为长按操作,获取所述长按操作的触控点的按压力度。
步骤“根据所述触控参数,实时更新所述语音信息的语速调整参数”,包括:
基于所述滑动方向更新语速调整参数的语速调整方向,基于所述按压力度更新所述语速调整参数的语速调整幅度。
可选的,基于所述滑动方向更新语速调整参数的语速调整方向的具体方式,可以参见前述示例的相关描述,在此不再赘述。
本实施例中,可以设置一个参考按压力度,基于长按操作实际的按压力度和参考按压力度,来更新语速调整幅度。
可选的,语速调整幅度的计算公式可以包括:F=N/N0+1,其中,N为按压操作实际的按压力度,单位为兆帕(MPa),其中,N0为参考按压力度,是定值,单位为兆帕(MPa),N0可以根据实际需要设置。
一个示例中,考虑到不同用户手部可输出的力度不同,尤其是手部活动受限的用户,其能实现的按压力度可能比较小,若是统一设置参考按压力度,不便于满足不同用户的需求。所以,终端的系统或即时通讯客户端可以为用户提供参考按压力度设置入口(如以控件形式提供),用户通过参考按压力度设置入口可以进入设置页面,在设置页面中进行至少一次按压操作,来实现参考按压力度的设置。例如,参考按压力度的设置可以是该至少一次按压操作的按压力度的平均值或中间值等。
在一个示例中,第二触控操作包括滑动操作,所述触控参数包括滑动参数,步骤“在所述第二触控操作的持续过程中,确定所述第二触控操作的触控参数”,可以包括:在所述滑动操作的持续过程中,确定所述滑动操作的滑动参数。
可选的,根据所述触控参数,实时更新所述语音信息的语速调整参数,可以包括:
基于所述滑动参数,实时更新语音信息的语速调整参数。
可选的,滑动参数可以包括与滑动操作关联的任意参数信息,例如滑动操作的滑动方向、当前触控位置,滑动路径等等,本实施例对滑动参数没有限制。
一个示例中,滑动参数包括:滑动操作的触控点的当前触控位置。本实施例可以在滑动操作的持续过程中,确定所述滑动操作的触控点的当前触控位置。
步骤“基于所述滑动参数,实时更新语音信息的语速调整参数”,包括:
获取所述滑动操作的触控点的起始触控位置;
基于所述起始触控位置和所述当前触控位置的相对位置信息,确定语速调整参数中的语速调整方向;
根据所述起始触控位置与所述当前触控位置的距离,确定所述语速调整参数中的语速调整幅度。
其中,触控位置可以以坐标进行表示,该坐标的坐标系可以是基于屏幕上的一个点(如屏幕中心点,屏幕四个顶点中的任一个等)为原点建立的平面坐标系。
在基于当前滑动参数确定语速调整参数时,可以基于当前滑动位置和第一触控操作的触摸位置确定语速调整参数。可选的,触摸位置与当前滑动位置可以在相同坐标系下用坐标进行表示。
可选的,可以预先设置滑动操作的起始触控位置和当前触控位置的相对位置信息,与语速调整方向的对应关系,基于该对应关系,以及滑动操作当前对应的该相对位置信息,确定语速调整方向,例如,对应关系包括:滑动操作的触控点的起始触控位置和当前触控位置的相对位置信息为,起始触控位置在当前触控位置的左侧,语速调整方向为语速增大;滑动操作的触控点的起始触控位置和当前触控位置的相对位置信息为,起始触控位置在当前触控位置的右侧,语速调整方向为语速减小。
一个示例中,可以预先设置参考距离,基于滑动操作的起始触控位置与当前触控位置的距离,以及该参考距离,确定所述语速调整参数中的语速调整幅度。
可选的,语速调整幅度的计算公式可以包括:F=l/L+1,其中,l为滑动操作的起始触控位置与当前触控位置的距离,单位为cm,其中,L为参考距离,为定值,单位为cm,L可以根据终端显示屏的宽度或长度等设置。
一个示例中,l可以表示滑动操作的滑动路径的长度。
可选的,本实施例在所述第二触控操作的持续过程中,还可以包括:基于实时更新的语速调整参数,以及所述语音信息的原始时长,计算以所述实时更新的语速调整参数对所述语音信息进行语速调整后,得到的语音信息的实际时长;
在所述会话页面显示调整后时长提示信息,所述调整后时长提示信息包括所述实际时长的描述信息。
例如,参见图2a,图2a的201页面为会话页面,页面中包括会话用户的会话消息如“爸,医生说了什么呀?”,还包括语音消息控件如“按住说话”控件,在202指示的页面中用户的手指21按住屏幕中的语音消息控件,触发语音信息的开始录制。一个示例中,202指示的会话页面中还可以显示录制提示信息2021,在第一触控操作的持续期间,录制提示信息中的文本指示处于语音录制状态,如文本可以为“语音录入中”。
在手指21不离开触摸屏的情况下,当第一触控操作切换为滑动操作时,参见图2a,203页面中的手指相较于202页面中的手指21向屏幕右侧进行了滑动,录音结束,参见203页面,在录制结束时,录制提示信息2031中的文本指示处于语音录制结束状态,如文本为“录入完成,10s”,该10s是语音信息的原始时长,也即该10s为录制结束瞬间显示的调整后时长提示信息。在用户手指的向右移动过程中,语速调整参数根据结束第二触控操作时的当前触控位置以及第一触控操作的触摸位置确定,如参见204指示的页面,在204的页面中,手指如果离开屏幕,基于语速调整参数得到的调整后语音信息是语音信息的2倍速,调整后时长提示信息为5s(参见204页面),其中,在手指21滑动的过程中,录制提示信息的文本中的调整后时长提示信息会基于滑动操作进行切换。
可选的,在一个示例中,图2a中的会话页面中,当手指21按住“按住说话”的控件时,可以显示语速调整子页面,语速调整子页面包括调整区域(参见图2b中的灰色区域2022),该区域中可以显示有参数调整提示信息如“左滑语音减速”,以及“右滑语音加速”等等。一个示例中,调整区域可以是第二触控操作的操作区域,在该区域内的第二触控操作是有效的,在该区域外的第二触控操作是无效的,即当第二触控操作结束时,当前触控位置在操作区域内,才进行语音的语速调整,得到调整后语音信息,否则,将语音信息作为调整后语音信息发送给会话页面的会话用户。可选的,调整区域一般会覆盖语音消息控件的显示位置,其中,语速调整子页面中可以显示调整区域的区域指示信息,该区域指示信息用于指示调整区域的位置,例如,图2b中,以灰色背景和弧形边界指示调整区域2022。
一个示例中,还可以基于调整区域,为用户提供可以修改声音三要素参数中至少一种声音要素参数的方案,提供语音会话的趣味性,吸引用户的使用。
可选的,参见图2c,调整区域包括两种类型的操作区域,一种是原音区域20221,一种是变音区域20222,只要第二触控操作的当前触控位置在原音区域内,语音信息中的声音的三要素就保持不变。而若第二触控操作的当前触控位置在变音区域内,则语音信息的声音的三要素参数即为目标声音三要素参数,其中,需要根据变音区域中各个位置对应设置的声音三要素参数,以及手指的当前触控位置,确定当前触控位置对应的目标声音三要素参数。本实施例中,若第二触控操作结束时,第二触控操作的当前触控位置在变音区域内,则在将调整后语音信息发出去之前,先基于第二触控操作结束时的目标声音三要素参数对调整后语音信息中的声音进行调整,再发出声音调整后的调整后语音信息。
其中,声音的三要素参数包括:响度、音色和音调。
可选的,本实施例还包括:在第二触控操作的持续过程中,获取第二触控操作的当前触控位置,若所述当前触控位置在调整区域的变音区域内,确定当前触控位置对应的目标声音三要素参数;若检测到第二触控操作结束,确定第二触控操作结束时的目标声音三要素参数,在调整后语音信息发送前,将调整后语音信息的声音三要素参数调整为目标声音三要素参数,然后再发送三要素调整后的调整后语音信息。
在一个示例中,步骤“若所述第二触控操作结束,确定触发了针对所述语音信息的变速发送操作,响应所述变速发送操作,获取所述变速发送操作被触发时的语速调整参数,发送根据所述语速调整参数调整所述语音信息得到的调整后语音信息”,包括:
若所述第二触控操作结束,确定触发了针对所述语音信息的变速发送操作,响应所述变速发送操作,显示确认发送子页面,所述确认发送子页面包括确认发送控件和语速重设控件;
若在所述确认发送子页面显示后的预设确认时长内,检测到针对所述确认发送控件的触发操作,获取所述变速发送操作被触发时的语速调整参数,发送根据所述语速调整参数调整所述语音信息得到的调整后语音信息;
若在所述确认发送子页面显示后的预设确认时长内,未检测到针对所述确认发送控件或语速重设控件的触发操作,获取所述变速发送操作被触发时的语速调整参数,发送根据所述语速调整参数调整所述语音信息得到的调整后语音信息。
其中,发送子页面可以以弹窗等形式显示。发送子页面还可以包括倒计时提示信息,倒计时提示信息用于提示距离预设确认时长到达时的时长信息。
可选的,所述显示确认发送子页面后,还可以包括:
若检测到针对所述语速重设控件的触发操作,不执行所述获取所述变速发送操作被触发时的语速调整参数,发送根据所述语速调整参数调整所述语音信息得到的调整后语音信息的步骤,显示语速重设子页面;
响应于针对所述语速重设子页面的语速重设操作,获取重设后语速调整参数;
响应于针对所述语速重设子页面的语音发送操作,发送以所述重设后语速调整参数对所述语音信息进行语速调整得到的调整后语音信息。
其中,语速重设子页面可以包括语速调整控件,语速调整控件可以是选择类型的控件,也可以是输入框控件等等,可以通过选择或文本编辑设置语音信息的语速调整参数。
可选的,语速重设子页面包括语速选择控件,步骤“响应于针对所述语速重设子页面的语速重设操作,获取重设后语速调整参数”,可以包括:响应于针对语速选择控件的触发操作,显示语速列表,所述语速列表包括至少两个候选语速调整参数;响应于针对候选语速调整参数的选择操作,将所选的候选语速调整参数确定为重设后语速调整参数。
可选的,语速重设子页面包括语速输入框控件,步骤“响应于针对所述语速重设子页面的语速重设操作,获取重设后语速调整参数”,可以包括:响应于针对语速输入框控件的输入操作,获取通过所述输入操作输入的重设后语速调整参数。
可选的,在所述第二触控操作的持续过程中,还可以实时播放经过语速调整(以及声音三要素参数调整)后的得到的语音信息,以便用户及时知道语速调整效果(以及声音调整效果),挑选合适的语速调整参数(以及声音三要素参数调整),可选的,本实施例还包括:
基于实时更新的语速调整参数对所述语音信息进行语速调整,得到参考语音信息,播放参考语音信息。
可选的,另一个示例中,在所述第二触控操作的持续过程中,还可以包括:
若第二触控操作的触控点的当前触控位置在变音区域内,则确定当前触控位置上设置的目标声音三要素参数,和实时更新的语速调整参数,基于目标声音三要素参数以及实时更新的语速调整参数对采集到的语音信息进行语速和声音三要素的调整,得到参考语音信息;播放参考语音信息。
其中,可以理解的是,参考语音信息在语音录制结束后至第二触控操作结束前,可以一直处于播放状态,不同时刻的语速调整参数可能有差别。
可选的,本实施例还可以包括:
将变速发送操作时触发时的语音信息,作为所述调整后语音信息的原速语音信息,发送给所述即时通讯客户端对应的服务器,以便所述服务器在接收到针对所述调整后语音信息的原速信息获取请求时,将所述语音信息发送给所述原速信息获取请求的发送方。
参见图2d,手指离开触摸屏后,会话页面显示调整后语音信息的语音消息,该消息的显示区域中显示有其时长“5s”。一个示例中,该调整后语音信息在会话页面中还对应显示有变速指示信息,变速指示信息用于指示所述调整后语音信息为调整过语速的语音信息,可选的,变速指示信息可以是调整后语音信息的显示区域的特定背景色(与非变速语音信息的显示区域的背景色区分显示),或者调整后语音信息的显示区域附近的特定文本信息如图2d中的“+2倍速”。
参见图2e,图2e中指示了手指21沿着左侧滑动时,调整语速的方案。其中,语速调整方向为语速减小方向(以图2e中的“-”号表示),语速调整幅度以“-”号之后的数字表示。
本实施例中,还提供第二会话用户方的语音会话方法,可选的,该方法包括:
显示即时通讯客户端的会话页面,所述会话页面包括变速语音信息,以及所述变速语音信息的变速指示信息,所述变速指示信息用于指示所述变速语音信息为调整过语速的语音信息;
若检测到针对所述变速语音信息的原速信息播放操作,获取所述变速语音信息的原速语音信息,播放所述原速语音信息,其中,所述原速语音信息为所述变速语音信息语速调整前的语音信息。
可选的,在一个示例中,步骤“检测到针对所述变速语音信息的原速信息播放操作,获取所述变速语音信息的原速语音信息,播放所述原速语音信息”,可以包括:
若检测到针对所述变速语音信息的功能控件列表显示操作,显示功能控件列表,所述功能控件列表包括原速播放控件和原速语音获取控件;
响应于针对原速播放控件的触发操作,获取所述变速语音信息的原速语音信息,播放所述原速语音信息。
其中,功能控件列表显示操作包括但不限于针对变速语音信息的长按、双击、指关节双击等触控操作。
可选的,在显示功能控件列表后,还可以包括:
响应于针对原速语音获取控件的触发操作,获取所述变速语音信息的原速语音信息,并在所述会话页面对应于所述变速语音信息显示所述原速语音信息;
响应于针对所述原速语音信息的播放操作,播放所述原速语音信息。
例如,参见图2f,在208指示的会话页面中会话用户“爸爸”发送了一条时长5s的变速语音信息2081,当检测到针对该变速语音信息的长按操作时,显示功能控件列表2091,功能控件列表2091包括原速播放控件如名为“按照原速播放”的控件,以及原速语音获取控件如名为“获取原速语音”的控件;当检测到针对“按照原速播放”的控件的点击操作,获取所述变速语音信息的原速语音信息,播放所述原速语音信息。当检测到针对“获取原速语音”的控件的点击操作,获取所述变速语音信息的原速语音信息,会话页面209变为210,页面上增加显示了原速语音信息2101,当检测到针对原速语音信息2101的播放操作时,播放所述原速语音信息。
一个示例中,变速语音信息的变速指示信息中还可以包括原速播放操作指示信息,用于描述指示原速播放操作,即播放原速语音信息时需要的触控操作,如图2g中变速语音信息2081下显示的“长按3s原速播放”。当检测到针对变速语音信息的原速播放操作时,获取所述变速语音信息的原速语音信息,播放所述原速语音信息。一个示例中,在检测到针对变速语音信息的原速播放操作,获取原速语音信息后,还可以在会话页面上显示该原速语音信息,避免用户需要重复收听原速语音信息时,还需要进行复杂或者耗时长的原速播放操作的问题。例如,在对图2g中的2081信息长按3s后,图2g的页面变为图2f中的210页面。
一个示例中,在会话页面中,变速语音信息可以对应显示有原速播放控件和/或原速语音获取控件,当检测到针对原速播放控件或原速语音获取控件的触发操作时,原速语音信息的播放步骤,或原速语音信息的获取步骤,这些步骤参考前述的相关描述,在此不再赘述。
例如,参见图2h,变速语音信息下对应显示有原速播放控件如名为“原速播放”的控件,当检测到针对该原速播放控件的点击操作时,获取变速语音信息对应的原速语音信息,播放原速语音信息。
采用本实施例,可以显示即时通讯客户端的会话页面,会话页面包括语音消息控件;响应针对语音消息控件的第一触控操作,采集外部的语音信息;响应与第一触控操作连续的第二触控操作,结束语音信息的采集,基于第二触控操作确定语音信息的语速调整参数;响应针对语音信息的变速发送操作,发送根据语速调整参数调整语音信息得到的调整后语音信息,由此,用户可以通过第二触控操作,自由设置待发送的语音信息的语速,从而调整语音信息的时长,避免时长过长等情况对语音接收方带来的收听时长过长等问题。
为了更好地实施以上方法,相应的,本发明实施例还提供一种语音会话装置。参考图3,该语音会话装置包括:
会话页面显示单元301,用于显示即时通讯客户端的会话页面,所述会话页面包括语音消息控件;
语音采集单元302,用于响应针对所述语音消息控件的第一触控操作,采集外部的语音信息;
调整参数设置单元303,用于响应与所述第一触控操作连续的第二触控操作,结束语音信息的采集,基于所述第二触控操作确定所述语音信息的语速调整参数;
发送单元304,用于响应针对所述语音信息的变速发送操作,发送根据所述语速调整参数调整所述语音信息得到的调整后语音信息。
在一个可选的示例中,调整参数设置单元,用于在所述第二触控操作的持续过程中,基于所述第二触控操作的变化实时更新所述语音信息的语速调整参数。
在一个可选的示例中,发送单元,用于若所述第二触控操作结束,确定触发了针对所述语音信息的变速发送操作,响应所述变速发送操作,获取所述变速发送操作被触发时的语速调整参数,发送根据所述语速调整参数调整所述语音信息得到的调整后语音信息。
在一个可选的示例中,所述第二触控操作包括滑动操作与长按操作的组合操作;
所述调整参数设置单元,用于:
在所述第二触控操作的持续过程中,确定所述第二触控操作的触控参数;
根据所述触控参数,实时更新所述语音信息的语速调整参数。
在一个可选的示例中,所述第二触控操作包括滑动操作与长按操作的组合操作,所述触控参数包括滑动方向和在触控点的持续按压时长;
所述调整参数设置单元,用于:
在所述滑动操作的持续过程中,确定所述滑动操作的滑动方向;
若检测到所述滑动操作切换为长按操作,获取所述长按操作的触控点的持续按压时长;
基于所述滑动方向更新语速调整参数的语速调整方向,基于所述持续按压时长更新所述语速调整参数的语速调整幅度。
在一个可选的示例中,所述第二触控操作包括滑动操作与长按操作的组合操作,所述触控参数包括滑动方向和在触控点的按压力度;
所述调整参数设置单元,用于:
在所述滑动操作的持续过程中,确定所述滑动操作的滑动方向;
若检测到所述滑动操作切换为长按操作,获取所述长按操作的触控点的按压力度;
基于所述滑动方向更新语速调整参数的语速调整方向,基于所述按压力度更新所述语速调整参数的语速调整幅度。
在一个可选的示例中,所述第二触控操作包括滑动操作,所述触控参数包括:所述滑动操作的触控点的当前触控位置;
所述调整参数设置单元,用于:
在所述滑动操作的持续过程中,确定所述滑动操作的触控点的当前触控位置;
获取所述滑动操作的触控点的起始触控位置;
基于所述起始触控位置和所述当前触控位置的相对位置信息,确定语速调整参数中的语速调整方向;
根据所述起始触控位置与所述当前触控位置的距离,确定所述语速调整参数中的语速调整幅度。
在一个可选的示例中,所述发送单元,用于:
若所述第二触控操作结束,确定触发了针对所述语音信息的变速发送操作,响应所述变速发送操作,显示确认发送子页面,所述确认发送子页面包括确认发送控件和语速重设控件;
若在所述确认发送子页面显示后的预设确认时长内,检测到针对所述确认发送控件的触发操作,获取所述变速发送操作被触发时的语速调整参数,发送根据所述语速调整参数调整所述语音信息得到的调整后语音信息;
若在所述确认发送子页面显示后的预设确认时长内,未检测到针对所述确认发送控件或语速重设控件的触发操作,获取所述变速发送操作被触发时的语速调整参数,发送根据所述语速调整参数调整所述语音信息得到的调整后语音信息。
在一个可选的示例中,所述发送单元,还用于:
若检测到针对所述语速重设控件的触发操作,不执行所述获取所述变速发送操作被触发时的语速调整参数,发送根据所述语速调整参数调整所述语音信息得到的调整后语音信息的步骤,显示语速重设子页面;
响应于针对所述语速重设子页面的语速重设操作,获取重设后语速调整参数;
响应于针对所述语速重设子页面的语音发送操作,发送以所述重设后语速调整参数对所述语音信息进行语速调整得到的调整后语音信息。
在一个可选的示例中,调整参数设置单元,还用于在所述第二触控操作的持续过程中,基于实时更新的语速调整参数对所述语音信息进行语速调整,得到参考语音信息;播放参考语音信息。
在一个可选的示例中,还包括时长提示单元,用于:
在所述第二触控操作的持续过程中,基于实时更新的语速调整参数,以及所述语音信息的原始时长,计算以所述实时更新的语速调整参数对所述语音信息进行语速调整后,得到的语音信息的实际时长;在所述会话页面显示调整后时长提示信息,所述调整后时长提示信息包括所述实际时长的描述信息。
在一个可选的示例中,发送单元,还用于:
将所述变速发送操作时的语音信息作为所述调整后语音信息的原速语音信息,发送给所述即时通讯客户端对应的服务器,以便所述服务器在接收到针对所述调整后语音信息的原速信息获取请求时,将所述原速语音信息发送给所述原速信息获取请求的发送方。
采用本实施例的装置,用户可以通过第二触控操作,自由设置待发送的语音信息的语速,从而调整语音信息的时长,避免时长过长等情况对语音接收方带来的收听时长过长等问题。
为了更好地实施以上方法,相应的,本发明实施例还提供另一种语音会话装置,该语音会话装置可以集成在第二会话用户的终端上,可选的,该装置可以包括:
第二会话页面显示单元,用于显示即时通讯客户端的会话页面,所述会话页面包括变速语音信息,以及所述变速语音信息的变速指示信息,所述变速指示信息用于指示所述变速语音信息为调整过语速的语音信息;
原速播放单元,用于若检测到针对所述变速语音信息的原速信息播放操作,获取所述变速语音信息的原速语音信息,播放所述原速语音信息,其中,所述原速语音信息为所述变速语音信息语速调整前的语音信息。
可选的,在一个示例中,原速播放单元,用于:
若检测到针对所述变速语音信息的功能控件列表显示操作,显示功能控件列表,所述功能控件列表包括原速播放控件和原速语音获取控件;
响应于针对原速播放控件的触发操作,获取所述变速语音信息的原速语音信息,播放所述原速语音信息。
可选的,原速播放单元,还用于在显示功能控件列表后,响应于针对原速语音获取控件的触发操作,获取所述变速语音信息的原速语音信息,并在所述会话页面对应于所述变速语音信息显示所述原速语音信息;响应于针对所述原速语音信息的播放操作,播放所述原速语音信息。
一个示例中,在会话页面中,变速语音信息可以对应显示有原速播放控件和/或原速语音获取控件,装置还可以包括快捷播放单元,用于当检测到针对原速播放控件或原速语音获取控件的触发操作时,获取变速语音信息对应的原速语音信息,播放原速语音信息。
采用本实施例的装置,在接收到会话用户发送的变速语音信息后,还可以获取原速语音信息,满足用户的多种需求。
此外,本申请实施例还提供一种计算机设备,该计算机设备可以为终端,该终端可以为智能手机、平板电脑、笔记本电脑、触控屏幕、游戏机、个人计算机(PC,PersonalComputer)、个人数字助理(Personal Digital Assistant,PDA)等终端设备。如图4所示,图4为本申请实施例提供的计算机设备的结构示意图。该计算机设备1000包括有一个或者一个以上处理核心的处理器401、有一个或一个以上计算机可读存储介质的存储器402及存储在存储器402上并可在处理器上运行的计算机程序。其中,处理器401与存储器402电性连接。本领域技术人员可以理解,图中示出的计算机设备结构并不构成对计算机设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
处理器401是计算机设备1000的控制中心,利用各种接口和线路连接整个计算机设备1000的各个部分,通过运行或加载存储在存储器402内的软件程序和/或模块,以及调用存储在存储器402内的数据,执行计算机设备1000的各种功能和处理数据,从而对计算机设备1000进行整体监控。
在本申请实施例中,计算机设备1000中的处理器401会按照如下的步骤,将一个或一个以上的应用程序的进程对应的指令加载到存储器402中,并由处理器401来运行存储在存储器402中的应用程序,从而实现各种功能:
显示即时通讯客户端的会话页面,所述会话页面包括语音消息控件;
响应针对所述语音消息控件的第一触控操作,采集外部的语音信息;
响应与所述第一触控操作连续的第二触控操作,结束语音信息的采集,基于所述第二触控操作确定所述语音信息的语速调整参数;
响应针对所述语音信息的变速发送操作,发送根据所述语速调整参数调整所述语音信息得到的调整后语音信息。
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
可选的,如图4所示,计算机设备1000还包括:触控显示屏403、射频电路404、音频电路405、输入单元406以及电源407。其中,处理器401分别与触控显示屏403、射频电路404、音频电路405、输入单元406以及电源407电性连接。本领域技术人员可以理解,图4中示出的计算机设备结构并不构成对计算机设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
触控显示屏403可用于显示图形用户界面以及接收用户作用于图形用户界面产生的操作指令。触控显示屏403可以包括显示面板和触控面板。其中,显示面板可用于显示由用户输入的信息或提供给用户的信息以及计算机设备的各种图形用户接口,这些图形用户接口可以由图形、文本、图标、视频和其任意组合来构成。可选的,可以采用液晶显示器(LCD,Liquid Crystal Display)、有机发光二极管(OLED,Organic Light-EmittingDiode)等形式来配置显示面板。触控面板可用于收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板上或在触控面板附近的操作),并生成相应的操作指令,且操作指令执行对应程序。可选的,触控面板可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器401,并能接收处理器401发来的命令并加以执行。触控面板可覆盖显示面板,当触控面板检测到在其上或附近的触摸操作后,传送给处理器401以确定触摸事件的类型,随后处理器401根据触摸事件的类型在显示面板上提供相应的视觉输出。在本申请实施例中,可以将触控面板与显示面板集成到触控显示屏403而实现输入和输出功能。但是在某些实施例中,触控面板与触控面板可以作为两个独立的部件来实现输入和输出功能。即触控显示屏403也可以作为输入单元406的一部分实现输入功能。
在本申请实施例中,通过处理器401在触控显示屏403上生成会话页面。
射频电路404可用于收发射频信号,以通过无线通信与网络设备或其他计算机设备建立无线通讯,与网络设备或其他计算机设备之间收发信号。
音频电路405可以用于通过扬声器、传声器提供用户与计算机设备之间的音频接口。音频电路405可将接收到的音频数据转换后的电信号,传输到扬声器,由扬声器转换为声音信号输出;另一方面,传声器将收集的声音信号转换为电信号,由音频电路405接收后转换为音频数据,再将音频数据输出处理器401处理后,经射频电路404以发送给比如另一计算机设备,或者将音频数据输出至存储器402以便进一步处理。音频电路405还可能包括耳塞插孔,以提供外设耳机与计算机设备的通信。
输入单元406可用于接收输入的数字、字符信息或用户特征信息(例如指纹、虹膜、面部信息等),以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。
电源407用于给计算机设备1000的各个部件供电。可选的,电源407可以通过电源管理系统与处理器401逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源407还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
尽管图4中未示出,计算机设备1000还可以包括摄像头、传感器、无线保真模块、蓝牙模块等,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,该指令可以存储于一计算机可读存储介质中,并由处理器进行加载和执行。
为此,本申请实施例提供一种计算机可读存储介质,其中存储有多条计算机程序,该计算机程序能够被处理器进行加载,以执行本申请实施例所提供的任一种语音会话方法中的步骤。例如,该计算机程序可以执行如下步骤:
显示即时通讯客户端的会话页面,所述会话页面包括语音消息控件;
响应针对所述语音消息控件的第一触控操作,采集外部的语音信息;
响应与所述第一触控操作连续的第二触控操作,结束语音信息的采集,基于所述第二触控操作确定所述语音信息的语速调整参数;
响应针对所述语音信息的变速发送操作,发送根据所述语速调整参数调整所述语音信息得到的调整后语音信息。
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
其中,该存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,Random Access Memory)、磁盘或光盘等。
由于该存储介质中所存储的计算机程序,可以执行本申请实施例所提供的任一种语音会话方法中的步骤,因此,可以实现本申请实施例所提供的任一种语音会话方法所能实现的有益效果,详见前面的实施例,在此不再赘述。
以上对本申请实施例所提供的一种语音会话方法、装置、存储介质及计算机设备进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上,本说明书内容不应理解为对本申请的限制。
Claims (15)
1.一种语音会话方法,其特征在于,包括:
显示即时通讯客户端的会话页面,所述会话页面包括语音消息控件;
响应针对所述语音消息控件的第一触控操作,采集外部的语音信息;
响应与所述第一触控操作连续的第二触控操作,结束语音信息的采集,基于所述第二触控操作确定所述语音信息的语速调整参数;
响应针对所述语音信息的变速发送操作,发送根据所述语速调整参数调整所述语音信息得到的调整后语音信息。
2.根据权利要求1所述的语音会话方法,其特征在于,所述基于所述第二触控操作确定所述语音信息的语速调整参数,包括:
在所述第二触控操作的持续过程中,基于所述第二触控操作的变化实时更新所述语音信息的语速调整参数。
3.根据权利要求2所述的语音会话方法,其特征在于,所述响应针对所述语音信息的变速发送操作,发送根据所述语速调整参数调整所述语音信息得到的调整后语音信息,包括:
若所述第二触控操作结束,确定触发了针对所述语音信息的变速发送操作,响应所述变速发送操作,获取所述变速发送操作被触发时的语速调整参数,发送根据所述语速调整参数调整所述语音信息得到的调整后语音信息。
4.根据权利要求2所述的语音会话方法,其特征在于,所述在所述第二触控操作的持续过程中,基于所述第二触控操作的变化实时更新所述语音信息的语速调整参数,包括:
在所述第二触控操作的持续过程中,确定所述第二触控操作的触控参数;
根据所述触控参数,实时更新所述语音信息的语速调整参数。
5.根据权利要求4所述的语音会话方法,其特征在于,所述第二触控操作包括滑动操作与长按操作的组合操作,所述触控参数包括滑动方向和在触控点的持续按压时长;
所述在所述第二触控操作的持续过程中,确定所述第二触控操作的触控参数,包括:
在所述滑动操作的持续过程中,确定所述滑动操作的滑动方向;
若检测到所述滑动操作切换为长按操作,获取所述长按操作的触控点的持续按压时长;
所述根据所述触控参数,实时更新所述语音信息的语速调整参数,包括:
基于所述滑动方向更新语速调整参数的语速调整方向,基于所述持续按压时长更新所述语速调整参数的语速调整幅度。
6.根据权利要求4所述的语音会话方法,其特征在于,所述第二触控操作包括滑动操作与长按操作的组合操作,所述触控参数包括滑动方向和在触控点的按压力度;
所述在所述第二触控操作的持续过程中,确定所述第二触控操作的触控参数,包括:
在所述滑动操作的持续过程中,确定所述滑动操作的滑动方向;
若检测到所述滑动操作切换为长按操作,获取所述长按操作的触控点的按压力度;
所述根据所述触控参数,实时更新所述语音信息的语速调整参数,包括:
基于所述滑动方向更新语速调整参数的语速调整方向,基于所述按压力度更新所述语速调整参数的语速调整幅度。
7.根据权利要求4所述的语音会话方法,其特征在于,所述第二触控操作包括滑动操作,所述触控参数包括:所述滑动操作的触控点的当前触控位置;
所述在所述第二触控操作的持续过程中,确定所述第二触控操作的触控参数,包括:
在所述滑动操作的持续过程中,确定所述滑动操作的触控点的当前触控位置;
所述根据所述触控参数,实时更新所述语音信息的语速调整参数,包括:
获取所述滑动操作的触控点的起始触控位置;
基于所述起始触控位置和所述当前触控位置的相对位置信息,确定语速调整参数中的语速调整方向;
根据所述起始触控位置与所述当前触控位置的距离,确定所述语速调整参数中的语速调整幅度。
8.根据权利要求3所述的语音会话方法,其特征在于,所述若所述第二触控操作结束,确定触发了针对所述语音信息的变速发送操作,响应所述变速发送操作,获取所述变速发送操作被触发时的语速调整参数,发送根据所述语速调整参数调整所述语音信息得到的调整后语音信息,包括:
若所述第二触控操作结束,确定触发了针对所述语音信息的变速发送操作,响应所述变速发送操作,显示确认发送子页面,所述确认发送子页面包括确认发送控件和语速重设控件;
若在所述确认发送子页面显示后的预设确认时长内,检测到针对所述确认发送控件的触发操作,获取所述变速发送操作被触发时的语速调整参数,发送根据所述语速调整参数调整所述语音信息得到的调整后语音信息;
若在所述确认发送子页面显示后的预设确认时长内,未检测到针对所述确认发送控件或语速重设控件的触发操作,获取所述变速发送操作被触发时的语速调整参数,发送根据所述语速调整参数调整所述语音信息得到的调整后语音信息。
9.根据权利要求8所述的语音会话方法,其特征在于,所述显示确认发送子页面后,还包括:
若检测到针对所述语速重设控件的触发操作,不执行所述获取所述变速发送操作被触发时的语速调整参数,发送根据所述语速调整参数调整所述语音信息得到的调整后语音信息的步骤,显示语速重设子页面;
响应于针对所述语速重设子页面的语速重设操作,获取重设后语速调整参数;
响应于针对所述语速重设子页面的语音发送操作,发送以所述重设后语速调整参数对所述语音信息进行语速调整得到的调整后语音信息。
10.根据权利要求2-9任一项所述的语音会话方法,其特征在于,在所述第二触控操作的持续过程中,还包括:
基于实时更新的语速调整参数对所述语音信息进行语速调整,得到参考语音信息;
播放参考语音信息。
11.根据权利要求2-9任一项所述的语音会话方法,其特征在于,在所述第二触控操作的持续过程中,还包括:
基于实时更新的语速调整参数,以及所述语音信息的原始时长,计算以所述实时更新的语速调整参数对所述语音信息进行语速调整后,得到的语音信息的实际时长;
在所述会话页面显示调整后时长提示信息,所述调整后时长提示信息包括所述实际时长的描述信息。
12.根据权利要求1-9任一项所述的语音会话方法,其特征在于,还包括:
将所述变速发送操作时的语音信息作为所述调整后语音信息的原速语音信息,发送给所述即时通讯客户端对应的服务器,以便所述服务器在接收到针对所述调整后语音信息的原速信息获取请求时,将所述原速语音信息发送给所述原速信息获取请求的发送方。
13.一种语音会话方法,其特征在于,包括:
会话页面显示单元,用于显示即时通讯客户端的会话页面,所述会话页面包括语音消息控件;
语音采集单元,用于响应针对所述语音消息控件的第一触控操作,采集外部的语音信息;
调整参数设置单元,用于响应与所述第一触控操作连续的第二触控操作,结束语音信息的采集,基于所述第二触控操作确定所述语音信息的语速调整参数;
发送单元,用于响应针对所述语音信息的变速发送操作,发送根据所述语速调整参数调整所述语音信息得到的调整后语音信息。
14.一种计算机设备,包括存储器,处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,所述处理器执行所述计算机程序时实现如权利要求1-12任一项所述方法的步骤。
15.一种存储介质,其上存储有计算机程序,其中,所述计算机程序被处理器执行时实现如权利要求1-12任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110529963.0A CN113126876A (zh) | 2021-05-14 | 2021-05-14 | 一种语音会话方法、装置、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110529963.0A CN113126876A (zh) | 2021-05-14 | 2021-05-14 | 一种语音会话方法、装置、计算机设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113126876A true CN113126876A (zh) | 2021-07-16 |
Family
ID=76781937
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110529963.0A Pending CN113126876A (zh) | 2021-05-14 | 2021-05-14 | 一种语音会话方法、装置、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113126876A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113485670A (zh) * | 2021-07-23 | 2021-10-08 | 维沃移动通信(杭州)有限公司 | 语音信息处理方法、装置和电子设备 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010026099A (ja) * | 2008-07-16 | 2010-02-04 | Nippon Hoso Kyokai <Nhk> | 音声制御装置、音声制御方法及び音声制御プログラム |
CN105068742A (zh) * | 2015-08-26 | 2015-11-18 | 广东欧珀移动通信有限公司 | 一种智能手表的控制方法及智能手表 |
CN109036404A (zh) * | 2018-07-18 | 2018-12-18 | 北京小米移动软件有限公司 | 语音交互方法及装置 |
CN110943908A (zh) * | 2019-11-05 | 2020-03-31 | 上海盛付通电子支付服务有限公司 | 语音消息发送方法、电子设备及介质 |
CN111190567A (zh) * | 2019-12-29 | 2020-05-22 | 歌尔股份有限公司 | 一种音量控制方法、装置和设备及智能眼镜 |
-
2021
- 2021-05-14 CN CN202110529963.0A patent/CN113126876A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010026099A (ja) * | 2008-07-16 | 2010-02-04 | Nippon Hoso Kyokai <Nhk> | 音声制御装置、音声制御方法及び音声制御プログラム |
CN105068742A (zh) * | 2015-08-26 | 2015-11-18 | 广东欧珀移动通信有限公司 | 一种智能手表的控制方法及智能手表 |
CN109036404A (zh) * | 2018-07-18 | 2018-12-18 | 北京小米移动软件有限公司 | 语音交互方法及装置 |
CN110943908A (zh) * | 2019-11-05 | 2020-03-31 | 上海盛付通电子支付服务有限公司 | 语音消息发送方法、电子设备及介质 |
CN111190567A (zh) * | 2019-12-29 | 2020-05-22 | 歌尔股份有限公司 | 一种音量控制方法、装置和设备及智能眼镜 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113485670A (zh) * | 2021-07-23 | 2021-10-08 | 维沃移动通信(杭州)有限公司 | 语音信息处理方法、装置和电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109461117B (zh) | 一种图像处理方法及移动终端 | |
WO2016165568A1 (zh) | 视频图像缩放方法和移动终端 | |
CN106973330B (zh) | 一种屏幕直播方法、装置和系统 | |
EP3691235A1 (en) | Display method and mobile terminal | |
CN109739418B (zh) | 多媒体播放应用程序的交互方法及终端 | |
WO2021104271A1 (zh) | 控制方法、触控笔及电子组件 | |
CN111324235A (zh) | 一种屏幕刷新频率调整方法及电子设备 | |
CN108196815B (zh) | 一种通话声音的调节方法和移动终端 | |
CN111147919A (zh) | 一种播放调整方法、电子设备及计算机可读存储介质 | |
CN111666009A (zh) | 一种界面显示方法及电子设备 | |
CN111078186A (zh) | 一种播放方法及电子设备 | |
CN109189260B (zh) | 一种触控检测方法和装置 | |
CN109189303B (zh) | 文本编辑方法及移动终端 | |
CN109960456B (zh) | 一种虚拟按键布局的生成方法及终端设备 | |
CN109166164B (zh) | 一种表情图片的生成方法及终端 | |
CN113332719B (zh) | 一种虚拟物品的标记方法、装置、终端及存储介质 | |
CN113126875B (zh) | 虚拟礼物的交互方法、装置、计算机设备及存储介质 | |
CN113126876A (zh) | 一种语音会话方法、装置、计算机设备和存储介质 | |
CN112235629B (zh) | 一种弹幕屏蔽方法、装置、计算机设备和存储介质 | |
WO2021098698A1 (zh) | 音频播放方法及终端设备 | |
CN113332726A (zh) | 虚拟角色的处理方法、装置、电子设备和存储介质 | |
CN111694497B (zh) | 页面组合方法和电子设备 | |
CN111061407B (zh) | 视频程序的操作控制方法、电子设备及存储介质 | |
CN111026482B (zh) | 一种应用程序控制方法及电子设备 | |
WO2023246166A1 (zh) | 一种视频进度的调节方法、装置、计算机设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210716 |
|
RJ01 | Rejection of invention patent application after publication |