CN111026358A - 一种语音消息的播放方法、播放装置及可读存储介质 - Google Patents

一种语音消息的播放方法、播放装置及可读存储介质 Download PDF

Info

Publication number
CN111026358A
CN111026358A CN201911350481.8A CN201911350481A CN111026358A CN 111026358 A CN111026358 A CN 111026358A CN 201911350481 A CN201911350481 A CN 201911350481A CN 111026358 A CN111026358 A CN 111026358A
Authority
CN
China
Prior art keywords
playing
voice message
voice
audio
waveform diagram
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911350481.8A
Other languages
English (en)
Other versions
CN111026358B (zh
Inventor
张晨阳
周荣刚
谭北平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beihang University
Beijing Mininglamp Software System Co ltd
Original Assignee
Beihang University
Beijing Mininglamp Software System Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beihang University, Beijing Mininglamp Software System Co ltd filed Critical Beihang University
Priority to CN201911350481.8A priority Critical patent/CN111026358B/zh
Publication of CN111026358A publication Critical patent/CN111026358A/zh
Application granted granted Critical
Publication of CN111026358B publication Critical patent/CN111026358B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/165Management of the audio stream, e.g. setting of volume, audio stream path
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • G06F3/0486Drag-and-drop
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/04Real-time or near real-time messaging, e.g. instant messaging [IM]
    • H04L51/046Interoperability with other network applications or services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • General Health & Medical Sciences (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本申请提供了一种语音消息的播放方法、播放装置及可读存储介质,其中,所述播放方法包括:响应于用户对接收到的语音消息的播放操作,对语音消息进行解析,显示语音消息的音频波形图和与音频波形图对应的音频播放进度条;根据音频波形图中每个时间点的振幅,确定语音消息的多个语音播放节点;获取用户在音频播放进度条上的拖动位置,并将拖动位置确定为音频播放的播放起始位置;从距离播放起始位置最近的语音播放节点开始播放语音消息。这样,用户可以通过调节音频播放进度条的播放位置,选择语音消息的播放起点,从而快速获取语音消息中的重要信息。

Description

一种语音消息的播放方法、播放装置及可读存储介质
技术领域
本申请涉及语音处理技术领域,尤其是涉及一种语音消息的播放方法、播放装置及可读存储介质。
背景技术
随着设备终端和互联网技术的不断发展,互联网即时通信以信息交互速度快、操作便捷等特点被广泛应用于日常生活中,人们可以通过手机与其他已经安装了相应即时通信应用的手机或电脑收发消息。为了满足用户即时收发消息的需求,即时通信应用通常支持文字交流、语音交流、文件传输、音视频等功能。
然而,对于现阶段的即时通信应用中的语音交流功能,用户在收听语音消息的时候,如果被打断,或听不清语音消息的内容,只能从头开始播放语音消息,通常情况下,语音消息中仅有部分语音消息中包含重要信息,如果从头开始播放语音消息,耗费时间较长,且不利于快速获取语音消息中的重要信息。
发明内容
有鉴于此,本申请的目的在于提供一种语音消息的播放方法、播放装置及可读存储介质,通过语音消息的音频波形图中每个时间点的振幅,确定语音消息的多个语音播放节点,并从与用户播放操作相对应的语音播放节点开始播放语音消息,以便于用户根据需要选择语音消息的播放起点,从而快速获取语音消息中的重要信息。
第一方面,本申请实施例提供了一种语音消息的播放方法,所述播放方法包括:
响应于用户对接收到的语音消息的播放操作,对所述语音消息进行解析,显示所述语音消息的音频波形图和与所述音频波形图对应的音频播放进度条;
根据所述音频波形图中每个时间点的振幅,确定所述语音消息的多个语音播放节点;
获取所述用户在所述音频播放进度条上的拖动位置,并将所述拖动位置确定为音频播放的播放起始位置;
从距离所述播放起始位置最近的语音播放节点开始播放所述语音消息。
结合第一方面,本申请实施例提供了第一方面的第一种可能的实施方式,其中,所述所述响应于用户对接收到的语音消息的播放操作,对所述语音消息进行解析,显示所述语音消息的音频波形图和与所述音频波形图对应的音频播放进度条,包括:
响应于用户对接收到的语音消息的播放操作,显示可供用户选择的菜单栏,所述菜单栏包括播放项;
响应于对所述播放项的查看操作,显示所述语音消息的播放界面;
对所述语音消息进行解析,得到所述语音消息的音频波形图,并在所述播放界面上显示所述音频波形图和与所述音频波形图对应的音频播放进度条。
结合第一方面,本申请实施例提供了第一方面的第二种可能的实施方式,其中,所述根据所述音频波形图中每个时间点的振幅,确定所述语音消息的多个语音播放节点,包括:
针对每个时间点,获取所述音频波形图中在该时间点的振幅,以及与该时间点相邻的上一时间点的第一振幅和下一时间点的第二振幅;
若所述振幅小于或等于所述第一振幅,且所述振幅小于所述第二振幅,将所述振幅所在的时间点确定为语音播放节点。
结合第一方面,本申请实施例提供了第一方面的第三种可能的实施方式,其中,通过以下步骤播放所述语音消息:
以距离所述播放起始位置最近的语音播放节点为起点,以与所述播放起始位置最近的语音播放节点相邻的下一个语音播放节点为终点,播放所述起点与所述终点之间的语音消息。
结合第一方面,本申请实施例提供了第一方面的第四种可能的实施方式,其中,在所述根据所述音频波形图中每个时间点的振幅,确定所述语音消息的多个语音播放节点之后,所述播放方法还包括:
将所确定的所述多个语音播放节点标记在所述音频波形图中。
结合第一方面,本申请实施例提供了第一方面的第五种可能的实施方式,其中,在所述从距离所述播放起始位置最近的语音播放节点开始播放所述语音消息之后,所述播放方法还包括:
在所述音频波形图的显示界面上显示文本显示区域;
响应于用户对所述语音消息的回复操作,将所述文本显示区域的内容发送给所述语音消息的发送方。
第二方面,本申请实施例还提供了一种语音消息的播放装置,所述播放装置包括:
解析模块,用于响应于用户对接收到的语音消息的播放操作,对所述语音消息进行解析,显示所述语音消息的音频波形图和与所述音频波形图对应的音频播放进度条;
确定模块,用于根据所述音频波形图中每个时间点的振幅,确定所述语音消息的多个语音播放节点;
获取模块,用于获取所述用户在所述音频播放进度条上的拖动位置,并将所述拖动位置确定为音频播放的播放起始位置;
播放模块,用于从距离所述播放起始位置最近的语音播放节点开始播放所述语音消息。
结合第二方面,本申请实施例提供了第二方面的第一种可能的实施方式,其中,所述解析模块在用于响应于用户对接收到的语音消息的播放操作,对所述语音消息进行解析,显示所述语音消息的音频波形图和与所述音频波形图对应的音频播放进度条时,所述解析模块用于:
响应于用户对接收到的语音消息的播放操作,显示可供用户选择的菜单栏,所述菜单栏包括播放项;
响应于对所述播放项的查看操作,显示所述语音消息的播放界面;
对所述语音消息进行解析,得到所述语音消息的音频波形图,并在所述播放界面上显示所述音频波形图和与所述音频波形图对应的音频播放进度条。
结合第二方面,本申请实施例提供了第二方面的第二种可能的实施方式,其中,所述确定模块在用于根据所述音频波形图中每个时间点的振幅,确定所述语音消息的多个语音播放节点时,所述确定模块用于:
针对每个时间点,获取所述音频波形图中在该时间点的振幅,以及与该时间点相邻的上一时间点的第一振幅和下一时间点的第二振幅;
若所述振幅小于或等于所述第一振幅,且所述振幅小于所述第二振幅,将所述振幅所在的时间点确定为语音播放节点。
结合第二方面,本申请实施例提供了第二方面的第三种可能的实施方式,其中,所述播放模块用于通过以下步骤播放所述语音消息:
以距离所述播放起始位置最近的语音播放节点为起点,以与所述播放起始位置最近的语音播放节点相邻的下一个语音播放节点为终点,播放所述起点与所述终点之间的语音消息。
结合第二方面,本申请实施例提供了第二方面的第四种可能的实施方式,其中,所述播放装置还包括:
标记模块,用于将所确定的所述多个语音播放节点标记在所述音频波形图中。
结合第二方面,本申请实施例提供了第二方面的第五种可能的实施方式,其中,所述播放装置还包括:
显示模块,用于在所述音频波形图的显示界面上显示文本显示区域;
发送模块,用于响应于用户对所述语音消息的回复操作,将所述文本显示区域的内容发送给所述语音消息的发送方。
第三方面,本申请实施例还提供一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如上述的语音消息的播放方法的步骤。
第四方面,本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如上述的语音消息的播放方法的步骤。
本申请实施例提供的一种语音消息的播放方法、播放装置及可读存储介质,响应于用户对接收到的语音消息的播放操作,对所述语音消息进行解析,显示所述语音消息的音频波形图和与所述音频波形图对应的音频播放进度条;根据所述音频波形图中每个时间点的振幅,确定所述语音消息的多个语音播放节点;获取所述用户在所述音频播放进度条上的拖动位置,并将所述拖动位置确定为音频播放的播放起始位置;从距离所述播放起始位置最近的语音播放节点开始播放所述语音消息。这样,通过语音消息的音频波形图确定出语音消息的多个播放节点,并从与用户播放操作相对应的语音播放节点开始播放语音消息。这样,用户可以通过调节音频播放进度条的播放位置,选择语音消息的播放起点,从而快速获取语音消息中的重要信息。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本申请实施例所提供的一种语音消息的播放方法的流程图;
图2示出了本申请另一实施例所提供的一种语音消息的播放方法的流程图;
图3示出了本申请实施例所提供的一种语音消息的播放装置的结构示意图之一;
图4示出了本申请实施例所提供的一种语音消息的播放装置的结构示意图之二;
图5示出了本申请实施例所提供的一种电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的每个其他实施例,都属于本申请保护的范围。
首先,对本申请可适用的应用场景进行介绍。本申请可应用于安装有即时通信软件的设备终端,例如,手机、电脑、智能手环等设备终端。在接收到用户对语音消息的播放操作之后,对语音消息进行解析,显示语音消息的音频波形图,根据音频波形图中每个时间点的振幅,确定语音消息的多个语音播放节点,获取用户在音频播放进度条的播放起始位置,确定出用户选择的播放起点位置对应语句的播放起点,这样,可以为用户提供语音消息的多个播放起点,便于用户根据需要选择语音消息的播放起点,从而快速获取语音消息中的重要信息。
经研究发现,现阶段,如果在语音消息的发送方使用方言、普通话不标准或者声音清晰度不佳的情况下,语音消息的接收方可以通过拖动进度条,从指定时间点开始收听语音消息,然而当用户想要完整地收听不清楚或重要语句时,需要多次拖动进度条,找到想要收听的语句的起始播放位置,其便捷性不足,不利于快速获取语音消息中的重要信息。
基于此,本申请实施例提供了一种语音消息的播放方法,通过语音消息的音频波形图确定语音消息的多个语音播放节点,并从与用户播放操作相对应的语音播放节点开始播放语音消息,以便于用户根据需要选择语音消息的播放起点,从而快速获取语音消息中的重要信息。
请参阅图1,图1示出了本申请实施例所提供的一种语音消息的播放方法的流程图。如图1中所示,本申请实施例提供的语音消息的播放方法,包括:
步骤101,响应于用户对接收到的语音消息的播放操作,对所述语音消息进行解析,显示所述语音消息的音频波形图和与所述音频波形图对应的音频播放进度条。
该步骤中,在获取到用户对语音消息的播放操作之后,将语音消息进行数字信号处理,得到语音消息的音频数据,根据音频数据形成语音消息的音频波形图,并在显示界面上显示音频波形图。根据音频波形图的时长和预设比例规则生成对应长度的音频播放进度条,并在显示界面上对应显示音频播放进度条。
其中,播放操作包括但不限于双击、长按、滑动中的任何一种播放操作,以预先安装有即时通信软件的手机为例,可以采集语音消息显示区域的压力识别用户对语音消息的播放操作,例如,在0.5秒内采集到语音消息显示区域的相同位置采集到两次大于50克的按压力度时,则可以判定为双击;在语音消息显示区域的某固定位置处连续采集到大于100克的按压力度,持续时间超过1秒,则可以判定为长按;在1秒内采集到从语音信息显示区域的任意位置处开始并向右连续移动的按压力度,采集按压力度起始点到按压力度消失点的直线距离大于2厘米,则可以判定为右滑。用户可以预设播放操作,当采集到的播放操作为预设播放操作时,对语音消息进行解析,显示语音消息的音频波形图。音频波形图的横轴可以表示为时间,纵轴可以表示为在每个时间点的振幅。
本申请实施例中,作为一可选实施例,响应于用户对接收到的语音消息的播放操作,对所述语音消息进行解析,显示所述语音消息的音频波形图和与所述音频波形图对应的音频播放进度条,包括:
A11,响应于用户对接收到的语音消息的播放操作,显示可供用户选择的菜单栏,所述菜单栏包括播放项。
该步骤中,在采集到用户对语音消息的播放操作之后,显示菜单栏,菜单栏包括播放项,例如,在采集到的用户的长按操作之后,弹出菜单栏,显示播放项“自定义收听”。
A12,响应于对所述播放项的查看操作,显示所述语音消息的播放界面。
该步骤中,在采集到对播放项的查看操作之后,显示语音消息的播放界面,例如,在用户点击播放项“自定义收听”之后,显示语音消息的播放界面。
其中,查看操作包括但不限于双击、长按、滑动中的任何一种查看操作。
A13,对所述语音消息进行解析,得到所述语音消息的音频波形图,并在所述播放界面上显示所述音频波形图和与所述音频波形图对应的音频播放进度条。
该步骤中,首先将语音消息进行采样、量化、编码,得到语音消息的音频数据,然后将音频数据以特定周期进行离散化处理,得到每个时间点对应的振幅,根据处理后的音频数据形成语音消息的音频波形图,并生成与音频波形图对应的音频播放进度条,将音频波形图和音频语音进度条显示在播放界面上。
这样,便于用户直观的查看语音消息中重要信息的位置,以快速获取想要收听的音频片段的位置。
需要说明的是,在根据处理后的音频数据形成语音消息的音频波形图之前,可以对音频数据进行平滑处理,以消除较小的数据扰动对后续操作的影响。
步骤102,根据所述音频波形图中每个时间点的振幅,确定所述语音消息的多个语音播放节点。
该步骤中,获取音频波形图中每个时间点的振幅,通过振幅确定出语音消息的语音播放节点,其中,振幅用于表征语音消息在每个时间点的音量。
这样,可以通过确定出的语音播放节点将语音消息划分成多个语音片段,便于获取每个语音片段的起始播放点。
本申请实施例中,作为一可选实施例,根据所述音频波形图中每个时间点的振幅,确定所述语音消息的多个语音播放节点,包括:
A21,针对每个时间点,获取所述音频波形图中在该时间点的振幅,以及与该时间点相邻的上一时间点的第一振幅和下一时间点的第二振幅;
该步骤中,通过获取音频波形图中每个时间点的振幅,以当前时间点i为例,获取语音消息在当前时间点i的振幅x(i),并获取该时间点的上一时间点i-1的振幅x(i-1)和下一时间点i+1的振幅x(i+1)。
A22,若所述振幅小于或等于所述第一振幅,且所述振幅小于所述第二振幅,将所述振幅所在的时间点确定为语音播放节点。
当前时间点的振幅x(i)、上一时间点的振幅x(i-1)和下一时间点的振幅x(i+1)之间的关系,可以对应以下几种情况:
(1)当x(i)<x(i-1),且x(i)<x(i+1)时,可以将当前时间点确定为语音消息中音频片段的起始点;
(2)当x(i)<x(i-1),且x(i)=x(i+1)时,可以将当前时间点确定为语音消息中音频片段的结束点;
(3)当x(i)=x(i-1),且x(i)<x(i+1)时,可以将当前时间点确定为语音消息中音频片段的起始点,并且可以确定为语音消息中人声的起始点。
(4)当x(i-1)=x(i)=x(i+1)<C时,其中,C可以为预设振幅阈值,可以确定为当前时间点没有人声。
该步骤中,可以将语音消息中音频片段的起始点确定为语音播放节点。具体的,在语音消息中,尤其对于时间较长的语音消息,通常包括多个语句,每个语句之间会出现短暂的空闲时间,空闲时间点的振幅仅由环境噪声的音量决定,通常会很小甚至为零,因此,可以通过每个时间点的振幅,确定语音消息中每个音频片段的起始位置。同样的,也可以确定出每个音频片段的结束位置。
这样,可以快速获取语音消息中某一条语句的播放起点,便于用户选择收听语音消息中的语句。
步骤103,获取所述用户在所述音频播放进度条上的拖动位置,并将所述拖动位置确定为音频播放的播放起始位置。
该步骤中,在确定语音信息的起始播放节点时,为了方便用户选择起始播放节点,用户可以通过音频播放进度条,拖动滑动组件到想要收听的音频位置点,获取音频播放进度条的起点到用户拖动的音频位置点的长度占音频播放进度条的比例,通过比例确定出音频播放的播放起始位置。
步骤104,从距离所述播放起始位置最近的语音播放节点开始播放所述语音消息。
该步骤中,获取与播放起始位置距离最近的语音播放节点,并从该语音播放节点开始播放语音消息,例如,在音频消息的13秒和20秒处为语音播放节点,如果用户选取的播放起始位置为14秒,则从13秒处开始播放语音消息,如果用户选取的播放起始位置为19秒,则从20秒处开始播放语音消息。
这样,当用户想要收听语音消息中的某一条语句时,尤其对于时间较长的语音消息,无需多次拖动进度条,找到想要收听的语句的起始播放位置,有利于快速获取语音消息中重要语句的起始播放位置,提高重要语句的获取效率。
本申请实施例中,作为一可选实施例,可以通过以下步骤播放所述语音消息:
A41,以距离所述播放起始位置最近的语音播放节点为起点,以与所述播放起始位置最近的语音播放节点相邻的下一个语音播放节点为终点,播放所述起点与所述终点之间的语音消息。
该步骤中,根据用户设置的语音播放位置,确定出语音消息播放的起点和终点,播放起点到终点之间的语音消息,例如,在音频消息的13秒和20秒处为语音播放节点,如果用户选取的播放起始位置为14秒,则从13秒处开始播放语音消息,直到20秒处结束播放。也可以循环播放起点到终点的语音消息,即当播放到终点时,回到起点重新播放起点到终点之间的语音消息,直到用户暂停播放,或选择收听其他语音播放节点。
这样,便于用户多次收听语音消息中的重要信息。
本申请实施例提供的语音消息的播放方法,响应于用户对接收到的语音消息的播放操作,对所述语音消息进行解析,显示所述语音消息的音频波形图和与所述音频波形图对应的音频播放进度条;根据所述音频波形图中每个时间点的振幅,确定所述语音消息的多个语音播放节点;获取所述用户在所述音频播放进度条上的拖动位置,并将所述拖动位置确定为音频播放的播放起始位置;从距离所述播放起始位置最近的语音播放节点开始播放所述语音消息。这样,通过语音消息的音频波形图确定语音消息的多个语音播放节点,并从与用户播放操作相对应的语音播放节点开始播放语音消息,以便于用户通过调节音频播放进度条的播放位置,选择语音消息的播放起点,从而快速获取语音消息中的重要信息。
进一步的,通过在菜单栏设置播放项,当用户点击播放项时,显示语音消息的播放界面,便于用户调节语音消息的进度。通过确定语音消息的播放起点和播放终点,有利于用户多次收听语音消息的重要信息,提高语音信息的获取效率。
请参阅图2,图2示出了本申请另一实施例提供的一种语音消息的播放方法的流程图。如图2中所示,本申请实施例提供的语音消息的播放方法,包括:
步骤201,响应于用户对接收到的语音消息的播放操作,对所述语音消息进行解析,显示所述语音消息的音频波形图和与所述音频波形图对应的音频播放进度条;
步骤202,根据所述音频波形图中每个时间点的振幅,确定所述语音消息的多个语音播放节点;
步骤203,获取所述用户在所述音频播放进度条上的拖动位置,并将所述拖动位置确定为音频播放的播放起始位置;
步骤204,从距离所述播放起始位置最近的语音播放节点开始播放所述语音消息。
其中,步骤201至步骤204的描述可以参照步骤101至步骤104的描述,并且能达到相同的技术效果,对此不做赘述。
本申请实施例中,作为一可选实施例,在步骤202之后,所述播放方法还包括:
将所确定的所述多个语音播放节点标记在所述音频波形图中。
该步骤中,将步骤202所确定的语音播放节点对应标记在音频波形图中,具体的,可以用分割点或符号标记在音频波形图中对应时间轴上。
这样,用户可以直观地了解到语音消息中音频片段的起始播放位置,有利于快速获取语音消息中音频片段的播放起点。
本申请实施例中,作为一可选实施例,在所述从距离所述播放起始位置最近的语音播放节点开始播放所述语音消息之后,所述播放方法还包括:
步骤205,在所述音频波形图的显示界面上显示文本显示区域;
该步骤中,在音频波形图的显示界面上创建文本显示区域,可以将用户选择的音频片段转化成文本,对应显示在文本显示区域,用户可以通过多次收听音频片段,编辑整理文本显示区域中的文本内容,也可以根据文本内容重新编辑文本。
步骤206,响应于用户对所述语音消息的回复操作,将所述文本显示区域的内容发送给所述语音消息的发送方。
该步骤中,当用户点击“回复”时,将文本显示区域的文本内容发送给语音消息的发送方,也可以将文本显示区域的文本内容转化成语音,将转化的语音发送给语音消息的发送方。
本申请实施例提供的语音消息的播放方法,响应于用户对接收到的语音消息的播放操作,对所述语音消息进行解析,显示所述语音消息的音频波形图和与所述音频波形图对应的音频播放进度条;根据所述音频波形图中每个时间点的振幅,确定所述语音消息的多个语音播放节点;获取所述用户在所述音频播放进度条上的拖动位置,并将所述拖动位置确定为音频播放的播放起始位置;从距离所述播放起始位置最近的语音播放节点开始播放所述语音消息。这样,通过语音消息的音频波形图确定语音消息的多个语音播放节点,并从与用户播放操作相对应的语音播放节点开始播放语音消息,以便于用户通过调节音频播放进度条的播放位置,选择语音消息的播放起点,从而快速获取语音消息中的重要信息。
进一步的,通过在音频波形图中标记所确定的语音播放节点,用户可以直观地获取语音消息中各音频片段的起始播放位置,便于选择音频片段的播放起点;通过在音频波形图的显示界面上创建文本显示区域,并可以将文本显示区域的内容发送给语音消息的发送方,便于用户在语音消息的播放界面上进行消息回复。
请参阅图3、图4,图3示出了本申请实施例所提供的一种语音消息的播放装置的结构示意图之一,图4示出了本申请实施例所提供的一种语音消息的播放装置的结构示意图之二。如图3中所示,所述播放装置300包括:
解析模块310,用于响应于用户对接收到的语音消息的播放操作,对所述语音消息进行解析,显示所述语音消息的音频波形图和与所述音频波形图对应的音频播放进度条。
其中,播放操作包括但不限于双击、长按、滑动中的任何一种播放操作;音频波形图的横轴可以表示为时间,纵轴可以表示为在每个时间点的振幅。
本申请实施例中,作为一可选实施例,解析模块310,具体用于:
响应于用户对接收到的语音消息的播放操作,显示可供用户选择的菜单栏,所述菜单栏包括播放项;
响应于对所述播放项的查看操作,显示所述语音消息的播放界面;
对所述语音消息进行解析,得到所述语音消息的音频波形图,并在所述播放界面上显示所述音频波形图和与所述音频波形图对应的音频播放进度条。
这样,通过在菜单栏设置播放项,当用户点击播放项时,显示语音消息的播放界面,便于用户调节语音消息的进度。
确定模块320,用于根据所述音频波形图中每个时间点的振幅,确定所述语音消息的多个语音播放节点。
本申请实施例中,作为一可选实施例,确定模块320,具体用于:
针对每个时间点,获取所述音频波形图中在该时间点的振幅,以及与该时间点相邻的上一时间点的第一振幅和下一时间点的第二振幅;
若所述振幅小于或等于所述第一振幅,且所述振幅小于所述第二振幅,将所述振幅所在的时间点确定为语音播放节点。
获取模块330,用于获取所述用户在所述音频播放进度条上的拖动位置,并将所述拖动位置确定为音频播放的播放起始位置。
播放模块340,用于从距离所述播放起始位置最近的语音播放节点开始播放所述语音消息。
本申请实施例中,作为一可选实施例,播放模块340,具体用于:
以距离所述播放起始位置最近的语音播放节点为起点,以与所述播放起始位置最近的语音播放节点相邻的下一个语音播放节点为终点,播放所述起点与所述终点之间的语音消息。
本申请实施例中,作为一可选实施例,如图4所示,所述播放装置还包括:
标记模块350,用于将所确定的所述多个语音播放节点标记在所述音频波形图中。
这样,通过在音频波形图中标记所确定的语音播放节点,用户可以直观地获取语音消息中各音频片段的起始播放位置,便于选择音频片段的播放起点。
本申请实施例中,作为一可选实施例,所述播放装置还包括:
显示模块360,用于在所述音频波形图的显示界面上显示文本显示区域;
发送模块370,用于响应于用户对所述语音消息的回复操作,将所述文本显示区域的内容发送给所述语音消息的发送方。
这样,通过在音频波形图的显示界面上创建文本显示区域,并可以将文本显示区域的内容发送给语音消息的发送方,便于用户在语音消息的播放界面上进行消息回复。
本申请实施例提供的语音消息的播放装置,响应于用户对接收到的语音消息的播放操作,对所述语音消息进行解析,显示所述语音消息的音频波形图和与所述音频波形图对应的音频播放进度条;根据所述音频波形图中每个时间点的振幅,确定所述语音消息的多个语音播放节点;获取所述用户在所述音频播放进度条上的拖动位置,并将所述拖动位置确定为音频播放的播放起始位置;从距离所述播放起始位置最近的语音播放节点开始播放所述语音消息。这样,通过语音消息的音频波形图确定语音消息的多个语音播放节点,并从与用户播放操作相对应的语音播放节点开始播放语音消息,以便于通过调节音频播放进度条的播放位置,选择语音消息的播放起点,从而快速获取语音消息中的重要信息。
请参阅图5,图5示出了本申请实施例所提供的一种电子设备的结构示意图。如图5中所示,所述电子设备500包括处理器510、存储器520和总线530。
所述存储器520存储有所述处理器510可执行的机器可读指令,当电子设备500运行时,所述处理器510与所述存储器520之间通过总线530通信,所述机器可读指令被所述处理器510执行时,可以执行如上述图1以及图2所示方法实施例中的语音消息的播放方法的步骤,具体实现方式可参见方法实施例,在此不再赘述。
本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时可以执行如上述图1以及图2所示方法实施例中的语音消息的播放方法的步骤,具体实现方式可参见方法实施例,在此不再赘述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上所述实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

Claims (11)

1.一种语音消息的播放方法,其特征在于,所述播放方法包括:
响应于用户对接收到的语音消息的播放操作,对所述语音消息进行解析,显示所述语音消息的音频波形图和与所述音频波形图对应的音频播放进度条;
根据所述音频波形图中每个时间点的振幅,确定所述语音消息的多个语音播放节点;
获取所述用户在所述音频播放进度条上的拖动位置,并将所述拖动位置确定为音频播放的播放起始位置;
从距离所述播放起始位置最近的语音播放节点开始播放所述语音消息。
2.根据权利要求1所述的播放方法,其特征在于,所述响应于用户对接收到的语音消息的播放操作,对所述语音消息进行解析,显示所述语音消息的音频波形图和与所述音频波形图对应的音频播放进度条,包括:
响应于用户对接收到的语音消息的播放操作,显示可供用户选择的菜单栏,所述菜单栏包括播放项;
响应于对所述播放项的查看操作,显示所述语音消息的播放界面;
对所述语音消息进行解析,得到所述语音消息的音频波形图,并在所述播放界面上显示所述音频波形图和与所述音频波形图对应的音频播放进度条。
3.根据权利要求1所述的播放方法,其特征在于,所述根据所述音频波形图中每个时间点的振幅,确定所述语音消息的多个语音播放节点,包括:
针对每个时间点,获取所述音频波形图中在该时间点的振幅,以及与该时间点相邻的上一时间点的第一振幅和下一时间点的第二振幅;
若所述振幅小于或等于所述第一振幅,且所述振幅小于所述第二振幅,将所述振幅所在的时间点确定为语音播放节点。
4.根据权利要求1所述的播放方法,其特征在于,通过以下步骤播放所述语音消息:
以距离所述播放起始位置最近的语音播放节点为起点,以与所述播放起始位置最近的语音播放节点相邻的下一个语音播放节点为终点,播放所述起点与所述终点之间的语音消息。
5.根据权利要求1所述的播放方法,其特征在于,在所述根据所述音频波形图中每个时间点的振幅,确定所述语音消息的多个语音播放节点之后,所述播放方法还包括:
将所确定的所述多个语音播放节点标记在所述音频波形图中。
6.根据权利要求1所述的播放方法,其特征在于,在所述从距离所述播放起始位置最近的语音播放节点开始播放所述语音消息之后,所述播放方法还包括:
在所述音频波形图的显示界面上显示文本显示区域;
响应于用户对所述语音消息的回复操作,将所述文本显示区域的内容发送给所述语音消息的发送方。
7.一种语音消息的播放装置,其特征在于,所述播放装置包括:
解析模块,用于响应于用户对接收到的语音消息的播放操作,对所述语音消息进行解析,显示所述语音消息的音频波形图和与所述音频波形图对应的音频播放进度条;
确定模块,用于根据所述音频波形图中每个时间点的振幅,确定所述语音消息的多个语音播放节点;
获取模块,用于获取所述用户在所述音频播放进度条上的拖动位置,并将所述拖动位置确定为音频播放的播放起始位置;
播放模块,用于从距离所述播放起始位置最近的语音播放节点开始播放所述语音消息。
8.根据权利要求7所述的播放装置,其特征在于,所述播放装置还包括:
标记模块,用于将所确定的所述多个语音播放节点标记在所述音频波形图中。
9.根据权利要求7所述的播放装置,其特征在于,所述播放装置还包括:
显示模块,用于在所述音频波形图的显示界面上显示文本显示区域;
发送模块,用于响应于用户对所述语音消息的回复操作,将所述文本显示区域的内容发送给所述语音消息的发送方。
10.一种电子设备,其特征在于,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如权利要求1至6中任一项所述的语音消息的播放方法的步骤。
11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如权利要求1至6中任一项所述的语音消息的播放方法的步骤。
CN201911350481.8A 2019-12-24 2019-12-24 一种语音消息的播放方法、播放装置及可读存储介质 Active CN111026358B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911350481.8A CN111026358B (zh) 2019-12-24 2019-12-24 一种语音消息的播放方法、播放装置及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911350481.8A CN111026358B (zh) 2019-12-24 2019-12-24 一种语音消息的播放方法、播放装置及可读存储介质

Publications (2)

Publication Number Publication Date
CN111026358A true CN111026358A (zh) 2020-04-17
CN111026358B CN111026358B (zh) 2023-05-02

Family

ID=70213071

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911350481.8A Active CN111026358B (zh) 2019-12-24 2019-12-24 一种语音消息的播放方法、播放装置及可读存储介质

Country Status (1)

Country Link
CN (1) CN111026358B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113936697A (zh) * 2020-07-10 2022-01-14 北京搜狗智能科技有限公司 语音处理方法、装置以及用于语音处理的装置
CN115499401A (zh) * 2022-10-18 2022-12-20 康键信息技术(深圳)有限公司 一种播放语音数据的方法、系统、计算机设备及介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8271003B1 (en) * 2007-03-23 2012-09-18 Smith Micro Software, Inc Displaying visual representation of voice messages
CN109245997A (zh) * 2018-09-26 2019-01-18 北京小米移动软件有限公司 语音消息播放方法及装置
CN109379497A (zh) * 2018-12-28 2019-02-22 努比亚技术有限公司 语音信息播放方法、移动终端及计算机可读存储介质
CN109994126A (zh) * 2019-03-11 2019-07-09 北京三快在线科技有限公司 音频消息分段方法、装置、存储介质和电子设备
CN110365574A (zh) * 2019-05-24 2019-10-22 珠海格力电器股份有限公司 一种语音信息的播放方法、装置及存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8271003B1 (en) * 2007-03-23 2012-09-18 Smith Micro Software, Inc Displaying visual representation of voice messages
CN109245997A (zh) * 2018-09-26 2019-01-18 北京小米移动软件有限公司 语音消息播放方法及装置
CN109379497A (zh) * 2018-12-28 2019-02-22 努比亚技术有限公司 语音信息播放方法、移动终端及计算机可读存储介质
CN109994126A (zh) * 2019-03-11 2019-07-09 北京三快在线科技有限公司 音频消息分段方法、装置、存储介质和电子设备
CN110365574A (zh) * 2019-05-24 2019-10-22 珠海格力电器股份有限公司 一种语音信息的播放方法、装置及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113936697A (zh) * 2020-07-10 2022-01-14 北京搜狗智能科技有限公司 语音处理方法、装置以及用于语音处理的装置
CN115499401A (zh) * 2022-10-18 2022-12-20 康键信息技术(深圳)有限公司 一种播放语音数据的方法、系统、计算机设备及介质

Also Published As

Publication number Publication date
CN111026358B (zh) 2023-05-02

Similar Documents

Publication Publication Date Title
US11683278B2 (en) Spectrogram and message bar generation based on audio data in an instant messaging application
CN108847214B (zh) 语音处理方法、客户端、装置、终端、服务器和存储介质
CN107070779B (zh) 一种信息处理方法和装置
CN111106995B (zh) 一种消息显示方法、装置、终端及计算机可读存储介质
CN107463247B (zh) 一种文本阅读处理的方法、装置以及终端
US10387717B2 (en) Information transmission method and transmission apparatus
CN108874904B (zh) 语音消息搜索方法、装置、计算机设备及存储介质
EP2490213A1 (en) Method for converting character text messages to audio files with respective titles for their selection and reading aloud with mobile devices
CN112073294B (zh) 通知消息的语音播放方法、装置、电子设备及介质
CN104078038B (zh) 一种页面内容朗读方法和装置
CN107770380B (zh) 信息处理方法和装置
CN110704647B (zh) 一种内容处理方法及装置
CN111026358B (zh) 一种语音消息的播放方法、播放装置及可读存储介质
JP2018513511A (ja) メッセージ送信方法、メッセージ処理方法及び端末
CN105827516A (zh) 消息处理方法和装置
CN114023301A (zh) 音频编辑方法、电子设备及存储介质
CN106899486B (zh) 一种消息显示方法及装置
JP5881647B2 (ja) 判定装置、判定方法及び判定プログラム
CN109525725B (zh) 一种基于情绪状态的信息处理方法和装置
CN112416116B (zh) 计算机设备的震动控制方法和系统
CN104866477B (zh) 一种信息处理方法及电子设备
CN110109597B (zh) 一种歌单切换方法、装置、系统、终端和存储介质
CN113096689A (zh) 一种歌曲演唱的评价方法、设备及介质
CN107479723B (zh) 一种表情符号的插入方法、装置和电子设备
CN111064844A (zh) 消息提示方法、装置、电子设备、计算机可读介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant