CN105827516A - 消息处理方法和装置 - Google Patents
消息处理方法和装置 Download PDFInfo
- Publication number
- CN105827516A CN105827516A CN201610302467.0A CN201610302467A CN105827516A CN 105827516 A CN105827516 A CN 105827516A CN 201610302467 A CN201610302467 A CN 201610302467A CN 105827516 A CN105827516 A CN 105827516A
- Authority
- CN
- China
- Prior art keywords
- message
- speech data
- play
- speech
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003672 processing method Methods 0.000 title abstract 3
- 238000000034 method Methods 0.000 claims abstract description 48
- 230000008859 change Effects 0.000 claims description 30
- 230000009471 action Effects 0.000 claims description 19
- 239000000284 extract Substances 0.000 claims description 19
- 230000008569 process Effects 0.000 claims description 19
- 230000001174 ascending effect Effects 0.000 claims description 10
- 238000000605 extraction Methods 0.000 claims description 6
- 238000011084 recovery Methods 0.000 claims description 3
- 230000010365 information processing Effects 0.000 claims description 2
- 238000004891 communication Methods 0.000 description 14
- 230000004069 differentiation Effects 0.000 description 7
- 238000006243 chemical reaction Methods 0.000 description 5
- 230000007704 transition Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L51/00—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
- H04L51/04—Real-time or near real-time messaging, e.g. instant messaging [IM]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L51/00—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
- H04L51/06—Message adaptation to terminal or network requirements
- H04L51/066—Format adaptation, e.g. format conversion or compression
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L51/00—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
- H04L51/07—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail characterised by the inclusion of specific contents
- H04L51/10—Multimedia information
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L51/00—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
- H04L51/52—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail for supporting social networking services
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/12—Messaging; Mailboxes; Announcements
- H04W4/14—Short messaging services, e.g. short message services [SMS] or unstructured supplementary service data [USSD]
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Computing Systems (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本发明涉及一种消息处理方法和装置,该方法包括:获取消息类型为语音消息的第一消息;获取与所述第一消息对应的播放指令;根据所述播放指令播放所述第一消息;获取在所述第一消息之后产生的第二消息;当所述第二消息的消息类型为非语音消息时,从所述第二消息中提取消息内容并转化为第一语音数据,并在播放所述第一消息结束后播放所述第一语音数据。采用本发明提供的消息处理方法和装置,减少了获取消息中的内容所需的操作,提高了消息处理效率,提高了操作便利性。
Description
技术领域
本发明涉及通信技术领域,特别是涉及一种消息处理方法和装置。
背景技术
随着通信技术的普及应用,用户之间可以通过通信应用彼此发送消息,使得人们彼此之间的交流变的更加便捷。而为了避免输入文字的繁琐过程,通信应用可以支持语音消息,消息发送方的终端可以通过通信应用录制语音消息,并将语音消息发送至消息接收方的终端,消息接收方的终端可通过通信应用展示该语音消息,并在用户点击该语音消息后播放语音消息的语音内容。
然而,目前语音消息的播放需要用户触发,当存在包括语音消息在内的多种消息时,比如既包括语音消息又包括文字消息,既需要用户点击语音消息进行播放,又需要用户查看其它非语音消息,才能使用户获得整个会话的内容,操作繁琐,导致消息处理效率低,需要改进。
发明内容
基于此,有必要针对上述技术问题,提供一种可提高消息处理效率的消息处理方法和装置。
一种消息处理方法,包括:
获取消息类型为语音消息的第一消息;
获取与所述第一消息对应的播放指令;
根据所述播放指令播放所述第一消息;
获取在所述第一消息之后产生的第二消息;
当所述第二消息的消息类型为非语音消息时,从所述第二消息中提取消息内容并转化为第一语音数据,并在播放所述第一消息结束后播放所述第一语音数据。
一种消息处理装置,包括:
第一消息处理模块,用于获取消息类型为语音消息的第一消息;获取与所述第一消息对应的播放指令;根据所述播放指令播放所述第一消息;
第二消息处理模块,用于获取在所述第一消息之后产生的第二消息;当所述第二消息的消息类型为非语音消息时,从所述第二消息中提取消息内容并转化为第一语音数据,并在播放所述第一消息结束后播放所述第一语音数据。
上述消息处理方法和装置,在播放消息类型为语音消息的第一消息后,继续播放消息类型为非语音消息的第二消息,这样可以在用户触发第一消息的播放后,自动连续播放第一消息和第二消息。用户可以通过语音播放方式知晓第一消息和第二消息的语义关联,不必先听取语音消息类型的第一消息后再查看非语音消息类型的第二消息,减少了获取消息中的内容所需的操作,提高了消息处理效率,提高了操作便利性。
附图说明
图1为一个实施例中消息处理系统的应用环境图;
图2为一个实施例中终端的结构示意图;
图3为一个实施例中消息处理方法的流程示意图;
图4为一个实施例中当第二消息的消息类型为非语音消息时,从第二消息中提取消息内容并转化为第一语音数据,并在播放第一消息结束后播放第一语音数据的步骤的流程示意图;
图5为一个实施例中拼接播放的步骤的流程示意图;
图6为一个实施例中转换和还原消息内容的步骤的流程示意图;
图7为一个实施例中将消息内容中的关键字进行差异化播放的步骤的流程示意图;
图8为一个实施例中终端展示的会话页面的示意图之一;
图9为一个实施例中终端展示的会话页面的示意图之二;
图10为一个实施例中消息处理装置的结构框图;
图11为另一个实施例中消息处理装置的结构框图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
可以理解,本发明所使用的术语“第一”、“第二”等可在本文中用于描述各种元件,但这些元件不受这些术语限制。这些术语仅用于将第一个元件与另一个元件区分。举例来说,在不脱离本发明的范围的情况下,可以将第一消息称为第二消息,且类似地,可将第二消息称为第一消息。第一消息和第二消息两者都是消息,但其不是同一消息。
如图1所示,在一个实施例中,提供了一种消息处理系统,包括第一终端110、第二终端120和服务器130。第一终端110和第二终端120可以是相同类型的终端也可以是不同类型的终端。服务器130可以是独立的物理服务器也可以是服务器集群。第一终端110和第二终端120上运行有通信应用,第一终端110通过其上运行的通信应用向服务器130发送消息,服务器130将消息转发至第二终端120,第二终端120通过其上运行的通信应用接收来自于第一终端110的消息。在其它实施例中,第一终端110也可以直接向第二终端120发送消息。通信应用是可通过消息交互来传递信息的应用,可以是即时通信应用、SNS(SocialNetworkService,社交网络服务)应用或者短信应用等。
图2为一个实施例中终端的内部结构示意图。如图2所示,该终端包括通过系统总线连接的处理器、非易失性存储介质、内存储器、网络接口、声音采集装置、扬声器、显示屏和输入装置。其中,终端的非易失性存储介质存储有操作系统,还存储有一种消息处理装置,该消息处理装置用于实现一种消息处理方法。该处理器用于提供计算和控制能力,支撑整个终端的运行。终端中的内存储器为非易失性存储介质中的消息处理装置提供运行环境,该内存储器中可储存有计算机可读指令,该计算机可读指令被所述处理器执行时,可使得所述处理器执行一种消息处理方法。网络接口用于连接到网络进行通信,如发送消息和接收消息等。终端的显示屏可以是液晶显示屏或者电子墨水显示屏等,输入装置可以是显示屏上覆盖的触摸层,也可以是终端外壳上设置的按键、轨迹球或触控板,也可以是外接的键盘、触控板或鼠标等。该终端可以是手机、平板电脑、个人数字助理或穿戴式设备等。本领域技术人员可以理解,图2中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的终端的限定,具体的终端可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
如图3所示,在一个实施例中,提供了一种消息处理方法,本实施例以该方法应用于上述图1中的第二终端120来举例说明。该方法具体包括如下步骤:
步骤302,获取消息类型为语音消息的第一消息。
具体地,第一终端和第二终端上运行有通信应用,第一终端通过通信应用以第一用户标识登录到服务器,第二终端通过通信应用以第二用户标识登录到服务器。第一终端和第二终端之间建立了会话,并通过该会话传递消息。该会话可以是双人会话、临时多人会话或者群组会话。其中多人是指三人或三人以上,群组会话是群组内的群组成员之间的多人会话。群组包括至少一个的群组成员,群组可表示该群组中群组成员之间具有网络社交关系,通过群组可以实现各群组成员之间的通信以及资源共享。这里第一终端和第二终端用来区分不同的终端,在不引起歧义的前提下第一终端和第二终端都可以称为终端。
第一终端发送的第一消息可携带有表示消息类型的消息类型标志位,第二终端在接收到第一终端发送的第一消息后,检测第一消息中的消息类型标志位,从而判断出第一消息的消息类型是语音消息。第二终端也可以根据第一消息的消息内容判断出第一消息的消息类型是语音消息。
步骤304,获取与第一消息对应的播放指令。
具体地,第二终端在获取到第一消息后,可展示与第一消息对应的消息提示,并检测作用于该消息提示的用户操作,当检测到该用户操作时触发与该第一消息对应的播放指令。消息提示可以通过顶部系统通知栏或者下拉通知栏进行展示。
第二终端也可以在获取到第一消息后,在会话页面中将第一消息按照语音消息类型的消息展示方式进行展示,并检测作用于展示的第一消息的用户操作,当检测到该用户操作时触发与该第一消息对应的播放指令。
步骤306,根据播放指令播放第一消息。
具体地,第二终端在获取到播放指令后,获取第一消息所指定的音频数据,从而将该音频数据转化为电信号,将电信号通过第二终端的扬声器输出为声波,这样用户便可以听到第一消息所指定的语音内容。第一消息所指定的音频数据可以是第一消息所携带的音频数据。第一消息所指定的音频数据也可以是第一消息中的链接地址所对应的存储于服务器上的音频数据,该音频数据可由第一终端上传到服务器。
步骤308,获取在第一消息之后产生的第二消息。
具体地,第二终端可将当前的会话页面中的消息按照消息产生时间升序排序后,确定第一消息在排序的消息中的位置,从而获取从该位置起到排序的消息最后一个消息,获取的消息便是在第一消息之后产生的第二消息。这里第一消息和第二消息用来区分不同的消息,第一消息和第二消息在不引起歧义的前提下都可以称为消息。
消息的产生是指当前会话存在该消息。消息产生时间可以是生成消息的时间、发出消息的时间或者接收消息的时间。第一消息既可以是第一终端发起的,也可以是第二终端发起的;第二消息既可以是第一终端发起的,也可以是第二终端发起的。
步骤310,当第二消息的消息类型为非语音消息时,从第二消息中提取消息内容并转化为第一语音数据,并在播放第一消息结束后播放第一语音数据。
具体地,第二终端检测第二消息的消息类型,若第二消息的消息类型为语音消息,则可以直接播放第二消息。若第二消息的消息类型为非语音消息,则可从第二消息中提取非语音的消息内容,将提取的消息内容转化为第一语音数据,并且在第一消息播放结束后继续播放该第一语音数据。
非语音消息的消息类型,比如文本消息、表情消息、图片消息或者视频消息等。文本消息是指含有文本内容的消息,表情消息是指含有表情内容的消息,图片消息是指还有图片的消息,视频消息则是指还有视频链接地址的消息。
提取的消息内容可以是第二消息的全部或部分消息内容。提取的消息内容可以是文字内容、表情文件或者图片等。消息内容可以直接提取自第二消息中,也可以从第二消息所指定的存储位置获得,比如第二消息可携带有新闻网页的链接地址,则可以提取该链接地址对应的新闻网页的标题名称,或比如第二消息可携带有表情标识,则可以提取该表情标识所表示的文本内容。
在将消息内容转化为第一语音数据时,若消息内容包括文本内容,可将文本内容逐字或逐词转化为相应词对应的语音片段,再将语音片段拼接得到第一语音数据。在将消息内容转化为第一语音数据时,若消息内容包括表情文件,可将表情文件对应的表情描述文本转换为第一语音数据,比如“笑脸”,或者直接获得该表情文件对应的预设语音数据作为第一语音数据。在将消息内容转化为第一语音数据时,若消息内容包括图片,则可以对图片进行文字识别或者语义分析得到相应的文字内容,再将该文字内容转化为第一语音数据。
上述消息处理方法,在播放消息类型为语音消息的第一消息后,继续播放消息类型为非语音消息的第二消息,这样可以在用户触发第一消息的播放后,自动连续播放第一消息和第二消息。用户可以通过语音播放方式知晓第一消息和第二消息的语义关联,不必先听取语音消息类型的第一消息后再查看非语音消息类型的第二消息,减少了获取消息中的内容所需的操作,提高了消息处理效率,提高了操作便利性。而且合理利用率接收消息的一端的语音硬件资源,可减少对视觉硬件的依赖。
如图4所示,在一个实施例中,步骤310包括如下步骤:
步骤402,按照消息产生时间升序遍历获取到的第二消息。
具体地,第二终端获取第二消息以及各第二消息对应的消息产生时间,按照消息产生时间从早到晚的顺序遍历获取到的第二消息。
步骤404,若遍历的第二消息的消息类型为非语音消息,则从遍历的第二消息中提取消息内容并转化为第一语音数据。
步骤406,若遍历的第二消息的消息类型为语音消息,则直接获取遍历的语音消息所指定的第二语音数据。
具体地,第二终端可在遍历第二消息时,判断当前遍历的第二消息的消息类型。若判断出消息类型为非语音消息,则第二终端从当前遍历的第二消息中提取消息内容,并将提取的消息内容转化为与当前遍历的第二消息对应的第一语音数据。若判断出消息类型为语音消息,该第二消息可直接作为语音消息播放,则直接获取该语音消息所指定的第二语音数据,不需要通过转化得到第二语音数据。第一消息所指定的第二音频数据可以是第一消息所携带的音频数据,也可以是第一消息中的链接地址所对应的存储于服务器上的音频数据。
步骤408,在播放第一消息结束后,按照第二消息对应的消息产生时间升序依次播放相应的第一语音数据或者第二语音数据。
具体地,第二终端在播放第一消息结束后,接着按照消息产生时间从早到晚的顺序播放相应第二消息对应的语音数据,若第二消息是非语音消息,则播放相应的第一语音数据,若第二消息是语音消息,则播放相应的第二语音数据。
本实施例中,当存在多条第二消息时,第二消息既可以包括语音消息又可以包括非语音消息,而且在播放第一消息后,按顺序播放各第二消息对应的语音数据,适用于多种消息类型的消息共存时的连续播放。用户可以在触发播放第一消息后,通过听觉知晓第一消息之后产生的第二消息的消息内容,并且可以知晓消息之间的语义关联。
在一个实施例中,该方法还包括拼接播放的步骤,如图5所示,具体包括如下步骤:
步骤502,获取第二消息对应的消息发送方标识。
其中,消息发送方标识是用于标识出发起第二消息的用户标识。具体地,第二终端可从第二消息中提取出消息发送方标识;第二终端也可以根据消息标识与消息发送方标识的对应关系,查询与该第二消息的消息标识存在对应关系的消息发送方标识。
步骤504,获取消息发送方标识对应的身份信息。
其中,身份信息是指标识出用户身份的信息,比如用户昵称、用户姓名、用户账号或者匿名代号等。具体地,第二终端可在本地查询与消息发送方标识对应的身份信息,也可以从服务器查询与消息发送方标识对应的身份信息。
步骤506,将身份信息转化为第三语音数据。具体地,第二终端可将文本形式的身份信息转化为可播放的第三语音数据。
步骤508,在播放第一消息结束后,将第三语音数据和第一语音数据拼接播放。
具体地,第二终端可将第三语音数据和第一语音数据拼接后,得到拼接的语音数据,从而在第一消息播放结束后播放该拼接的语音数据。具体第二终端在拼接时可将第三语音数据和第一语音数据直接拼接。第二终端也可以在第三语音数据和第一语音数据间增加过渡语音数据,使得第三语音数据和第一语音数据在播放时过渡自然。过渡语音数据可以是空语音数据,使得第三语音数据和第一语音数据间存在停顿。过渡语音数据可以是预设的表示第二消息的消息发送方和第二消息的消息内容之间关联的语音数据,比如“发送消息”或者“说道”等。第三语音数据和第一语音数据的顺序可根据需要调整。
举例说明,若消息发送方的用户昵称为“张三”,第二消息的消息内容为“大家好”,则第二终端拼接得到的拼接语音数据所表达的内容可以是“张三大家好”;若过渡语音数据所表达的内容为“发送消息”,则第二终端拼接得到的拼接语音数据所表达的内容可以是“张三发送消息大家好”。
本实施例中,当第二消息的消息类型为非语音消息时,将第二消息中提取的消息内容转化为第一语音数据,将第二消息的消息发送方的身份信息转化成的第三语音数据与第一语音数据拼接播放。用户在听取连续的消息时不仅可以知晓消息之间的语义关联,还可以知晓相应的消息发送方的身份信息,从而可以更加方便地了解到整个会话的进展,进一步提高操作便利性。
在一个实施例中,从第二消息中提取消息内容并转化为第一语音数据的步骤具体包括:获取第二消息对应的消息发送方标识;获取消息发送方标识对应的性别属性;从第二消息中提取出消息内容后,根据性别属性将提取的消息内容转化为第一语音数据。
其中,性别属性是表示第二消息的消息发送方的性别的数据,比如男性、女性或者性别未知等。若获取的性别属性为男性,则第二终端可采用男性嗓音的语音片段构成第一语音数据。若获取的性别属性为女性,则第二终端可采用女性嗓音的语音片段构成第一语音数据。若获取的性别属性为性别位置,则第二终端可采用中性嗓音的语音片段构成第一语音数据。
本实施例中,根据第二消息的消息发送方的性别属性,将从第二消息中提取的消息内容转化为第一语音数据,在播放第一语音数据时用户可以进一步得知会话成员的性别属性,从而可以更加方便地了解到整个会话的进展以及语义环境,进一步提高操作便利性。
在一个实施例中,该消息处理方法还包括:对第一语音数据进行变声处理。变声处理包括改变声音频率和改变语速中的至少一种。
具体地,第二终端可在生成第一语音数据时进行变声处理得到经过变声处理的第一语音数据,也可以在生成第一语音数据后进行变声处理得到经过变声处理的第一语音数据。第二终端还可以对第一语音数据和第二语音数据分别进行不同的变声处理,不同的变声处理比如变声处理方式不同或者变声处理程度不同等。经过变声处理的语音数据与变声处理前的语音数据在播放时声音会有不同。第二终端具体可通过改变声音频率和/或改变语速来进行变声处理。改变声音频率比如增大或减少声音频率,改变语速比如加快或减慢语速。
本实施例中,将第一语音数据进行变声处理,在播放第一语音数据时用户可以听到差异化的声音,方便用户了解会话中消息的变化动态,进一步提高操作便利性。
在一个实施例中,该消息处理方法还包括转换和还原消息内容的步骤,参照图6,具体包括如下步骤:
步骤602,当第二消息的消息类型为非语音消息时,将第二消息作为语音消息类型的消息进行展示。
具体地,语音消息主要内容是语音数据,语音消息的展示方式与非语音数据的展示方式不同。第二终端将非语音消息的第二消息按照语音消息类型的消息展示方式进行展示,表示该第二消息是可播放语音的消息。
步骤604,展示与第二消息对应的提示标志。
其中,提示标志用来表示该第二消息是经过转化可播放语音的非语音消息。提示标志具体可以是预设形状的图形或者文字等。
步骤606,检测对展示的第二消息或提示标志的触发操作。
步骤608,根据触发操作展示第二消息的消息内容。
具体地,第二终端可检测对第二消息的触发操作,从而在检测到该触发操作后展示第二消息的消息内容。第二终端也可以检测对提示标志的触发操作,从而在检测到该触发操作后展示第二消息的消息内容。触发操作比如点击操作、长按操作等触控操作,还比如鼠标点击操作等。
本实施例中,第二消息的消息内容被转换为第一语音数据后,可按照语音消息类型的消息展示方式进行展示,并通过提示标志识别出该第二消息经过转化,用户还可以通过触发操作将消息内容还原,可在听觉方式和视觉方式之间切换来获取第二消息的内容,进一步提高操作便利性。
在一个实施例中,第二终端可以在检测到对展示的第二消息的第一触发操作时,播放该第二消息对应的语音数据;在检测到对展示的第二消息的第二触发操作时,展示第二消息的消息内容;其中第一触发操作和第二触发操作不同。
在一个实施例中,该消息处理方法还包括将消息内容中的关键字进行差异化播放的步骤,如图7所示,具体包括如下步骤:
步骤702,获取消息内容中的关键字。
其中,关键字可以是单字、词或者词组。第二终端具体可从消息内容中获取存在于关键字库中的关键字,也可以通过语义分析得到消息内容中语义重要度最高的关键字。语义重要度可采用TF-IDF(termfrequency–inversedocumentfrequency,词频-逆向文件频率)算法计算得到。关键字比如人名、地名、事件名称或者时间信息等。
步骤704,确定第一语音数据中与关键字对应的第一语音片段,以及第一语音数据中除去第一语音片段的第二语音片段。
具体地,消息内容与第一语音数据中的各个语音片段是对应的,确定关键字后,第二终端便可以确定第一语音数据中与关键字对应的第一语音片段,以及第一语音数据中除去第一语音片段后剩余的第二语音片段。
步骤706,在播放第一语音数据时,将第一语音片段和第二语音片段采用不同播放方式进行播放。
具体地,第二终端在播放第一语音数据时,可将第一语音片段和第二语音片段进行差异化的播放。在一个实施例中,步骤706包括:按照第一音量播放第一语音片段,并按照第二音量播放第二语音片段,且第一音量高于第二音量;和/或,将第一语音片段播放第一次数,并将第二语音片段播放第二次数,且第一次数高于第二次数。其中第一次数比如1次,第二次数比如2次。
本实施例中,在播放第一语音数据时,可将消息内容中关键字所表达的重要内容采用与其它内容不同的播放方式进行差异化播放,用户可以在听取消息内容时辨识出重要内容,进一步提高操作便利性。
在一个实施例中,第二终端还可以在根据播放指令播放第一消息后,检测语音转换功能是否开启,若是则执行步骤308;若否则直接获取在第一消息之后产生的语音类型的消息,并在播放第一消息结束后按照消息产生时间升序播放获取到的语音类型的消息。本实施例中,用户可以自定义语音转换功能的开启和关闭,可以根据需要选择合适的方式获取消息中的内容,提高了操作便利性。
下面用一个具体应用场景来说上述消息处理方法的原理。参照图8,第二终端通过即时通信应用展示会话页面,第二终端获取到在该会话页面中的消息,按照消息产生时间从早到晚依次为:消息801、消息802、消息803、消息804、消息805以及消息806,其中消息802和消息806的消息类型是语音消息,消息801、消息803、消息804和消息805的消息类型是非语音消息。用户点击消息802,第二终端会播放消息802,并且将消息803、消息804和消息805的消息内容转化为语音数据,在播放消息802结束后,自动依次播放消息803、消息804、消息805以及消息806对应的语音数据。而且参照图9,终端可将经过转换的消息按照语音消息类型的消息展示方式展示,并显示提示标志902,用户点击提示标志902可以使得相应的消息将消息内容还原并展示。
如图10所示,在一个实施例中,提供了一种消息处理装置1000,包括:第一消息处理模块1010和第二消息处理模块1020。
第一消息处理模块1010,用于获取消息类型为语音消息的第一消息;播放第一消息。
第二消息处理模块1020,用于获取在第一消息之后产生的第二消息;当第二消息的消息类型为非语音消息时,从第二消息中提取消息内容并转化为第一语音数据,并在播放第一消息结束后播放第一语音数据。
上述消息处理装置1000,在播放消息类型为语音消息的第一消息后,继续播放消息类型为非语音消息的第二消息,这样可以在用户触发第一消息的播放后,自动连续播放第一消息和第二消息。用户可以通过语音播放方式知晓第一消息和第二消息的语义关联,不必先听取语音消息类型的第一消息后再查看非语音消息类型的第二消息,减少了获取消息中的内容所需的操作,提高了消息处理效率,提高了操作便利性。而且合理利用率接收消息的一端的语音硬件资源,可减少对视觉硬件的依赖。
如图11所示,在一个实施例中,第二消息处理模块1020包括:语音数据获取模块1021和播放模块1022。
语音数据获取模块1021,用于按照消息产生时间升序遍历获取到的第二消息;若遍历的第二消息的消息类型为非语音消息,则从遍历的第二消息中提取消息内容并转化为第一语音数据;若遍历的第二消息的消息类型为语音消息,则直接获取遍历的语音消息所指定的第二语音数据。
播放模块1022,用于在播放第一消息结束后,按照第二消息对应的消息产生时间升序依次播放相应的第一语音数据或者第二语音数据。
本实施例中,当存在多条第二消息时,第二消息既可以包括语音消息又可以包括非语音消息,而且在播放第一消息后,按顺序播放各第二消息对应的语音数据,适用于多种消息类型的消息共存时的连续播放。用户可以在触发播放第一消息后,通过听觉知晓第一消息之后产生的第二消息的消息内容,并且可以知晓消息之间的语义关联。
在一个实施例中,消息处理装置1000还包括:身份信息处理模块1030,用于获取第二消息对应的消息发送方标识;获取消息发送方标识对应的身份信息;将身份信息转化为第三语音数据。
第二消息处理模块1020还用于在播放第一消息结束后,将第三语音数据和第一语音数据拼接播放。
本实施例中,当第二消息的消息类型为非语音消息时,将第二消息中提取的消息内容转化为第一语音数据,将第二消息的消息发送方的身份信息转化成的第三语音数据与第一语音数据拼接播放。用户在听取连续的消息时不仅可以知晓消息之间的语义关联,还可以知晓相应的消息发送方的身份信息,从而可以更加方便地了解到整个会话的进展,进一步提高操作便利性。
在一个实施例中,第二消息处理模块1020还用于获取第二消息对应的消息发送方标识;获取消息发送方标识对应的性别属性;从第二消息中提取出消息内容后,根据性别属性将提取的消息内容转化为第一语音数据。
本实施例中,根据第二消息的消息发送方的性别属性,将从第二消息中提取的消息内容转化为第一语音数据,在播放第一语音数据时用户可以进一步得知会话成员的性别属性,从而可以更加方便地了解到整个会话的进展以及语义环境,进一步提高操作便利性。
在一个实施例中,消息处理装置1000还包括:变声处理模块1040,用于对第一语音数据进行变声处理;变声处理包括改变声音频率和改变语速中的至少一种。
本实施例中,将第一语音数据进行变声处理,在播放第一语音数据时用户可以听到差异化的声音,方便用户了解会话中消息的变化动态,进一步提高操作便利性。
在一个实施例中,消息处理装置1000还包括:展示模块1050和消息内容还原模块1060。
展示模块1050,用于当第二消息的消息类型为非语音消息时,将第二消息作为语音消息类型的消息进行展示;展示与第二消息对应的提示标志。
消息内容还原模块1060,用于检测对展示的第二消息或提示标志的触发操作;根据触发操作展示第二消息的消息内容。
本实施例中,第二消息的消息内容被转换为第一语音数据后,可按照语音消息类型的消息展示方式进行展示,并通过提示标志识别出该第二消息经过转化,用户还可以通过触发操作将消息内容还原,可在听觉方式和视觉方式之间切换来获取第二消息的内容,进一步提高操作便利性。
在一个实施例中,消息处理装置1000还包括:语音片段处理模块1070。
语音片段处理模块1070,用于获取消息内容中的关键字;确定第一语音数据中与关键字对应的第一语音片段,以及第一语音数据中除去第一语音片段的第二语音片段。
本实施例中,在播放第一语音数据时,可将消息内容中关键字所表达的重要内容采用与其它内容不同的播放方式进行差异化播放,用户可以在听取消息内容时辨识出重要内容,进一步提高操作便利性。
第二消息处理模块1020还用于在播放第一语音数据时,将第一语音片段和第二语音片段采用不同播放方式进行播放。
在一个实施例中,第二消息处理模块1020还用于按照第一音量播放第一语音片段,并按照第二音量播放第二语音片段,且第一音量高于第二音量;和/或,将第一语音片段播放第一次数,并将第二语音片段播放第二次数,且第一次数高于第二次数。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,前述的存储介质可为磁碟、光盘、只读存储记忆体(Read-OnlyMemory,ROM)等非易失性存储介质,或随机存储记忆体(RandomAccessMemory,RAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
Claims (16)
1.一种消息处理方法,包括:
获取消息类型为语音消息的第一消息;
获取与所述第一消息对应的播放指令;
根据所述播放指令播放所述第一消息;
获取在所述第一消息之后产生的第二消息;
当所述第二消息的消息类型为非语音消息时,从所述第二消息中提取消息内容并转化为第一语音数据,并在播放所述第一消息结束后播放所述第一语音数据。
2.根据权利要求1所述的方法,其特征在于,所述当所述第二消息的消息类型为非语音消息时,从所述第二消息中提取消息内容并转化为第一语音数据,并在播放所述第一消息结束后播放所述第一语音数据,包括:
按照消息产生时间升序遍历获取到的第二消息;
若遍历的第二消息的消息类型为非语音消息,则从遍历的第二消息中提取消息内容并转化为第一语音数据;
若遍历的第二消息的消息类型为语音消息,则直接获取遍历的语音消息所指定的第二语音数据;
在播放所述第一消息结束后,按照所述第二消息对应的消息产生时间升序依次播放相应的第一语音数据或者第二语音数据。
3.根据权利要求1所述的方法,其特征在于,还包括:
获取所述第二消息对应的消息发送方标识;
获取所述消息发送方标识对应的身份信息;
将所述身份信息转化为第三语音数据;
在播放所述第一消息结束后,将所述第三语音数据和所述第一语音数据拼接播放。
4.根据权利要求1所述的方法,其特征在于,所述从所述第二消息中提取消息内容并转化为第一语音数据,包括:
获取所述第二消息对应的消息发送方标识;
获取所述消息发送方标识对应的性别属性;
从所述第二消息中提取出消息内容后,根据所述性别属性将提取的消息内容转化为第一语音数据。
5.根据权利要求1所述的方法,其特征在于,还包括:
对所述第一语音数据进行变声处理;所述变声处理包括改变声音频率和改变语速中的至少一种。
6.根据权利要求1所述的方法,其特征在于,还包括:
当所述第二消息的消息类型为非语音消息时,将所述第二消息作为语音消息类型的消息进行展示;
展示与所述第二消息对应的提示标志;
检测对展示的第二消息或所述提示标志的触发操作;
根据所述触发操作展示所述第二消息的消息内容。
7.根据权利要求1所述的方法,其特征在于,还包括:
获取所述消息内容中的关键字;
确定所述第一语音数据中与所述关键字对应的第一语音片段,以及所述第一语音数据中除去所述第一语音片段的第二语音片段;
在播放所述第一语音数据时,将所述第一语音片段和所述第二语音片段采用不同播放方式进行播放。
8.根据权利要求7所述的方法,其特征在于,所述将所述第一语音片段和所述第二语音片段采用不同播放方式进行播放,包括:
按照第一音量播放所述第一语音片段,并按照第二音量播放所述第二语音片段,且所述第一音量高于所述第二音量;和/或,
将所述第一语音片段播放第一次数,并将所述第二语音片段播放第二次数,且所述第一次数高于所述第二次数。
9.一种消息处理装置,其特征在于,包括:
第一消息处理模块,用于获取消息类型为语音消息的第一消息;获取与所述第一消息对应的播放指令;根据所述播放指令播放所述第一消息;
第二消息处理模块,用于获取在所述第一消息之后产生的第二消息;当所述第二消息的消息类型为非语音消息时,从所述第二消息中提取消息内容并转化为第一语音数据,并在播放所述第一消息结束后播放所述第一语音数据。
10.根据权利要求9所述的装置,其特征在于,所述第二消息处理模块包括:
语音数据获取模块,用于按照消息产生时间升序遍历获取到的第二消息;若遍历的第二消息的消息类型为非语音消息,则从遍历的第二消息中提取消息内容并转化为第一语音数据;若遍历的第二消息的消息类型为语音消息,则直接获取遍历的语音消息所指定的第二语音数据;
播放模块,用于在播放所述第一消息结束后,按照所述第二消息对应的消息产生时间升序依次播放相应的第一语音数据或者第二语音数据。
11.根据权利要求9所述的装置,其特征在于,还包括:
身份信息处理模块,用于获取所述第二消息对应的消息发送方标识;获取所述消息发送方标识对应的身份信息;将所述身份信息转化为第三语音数据;
所述第二消息处理模块还用于在播放所述第一消息结束后,将所述第三语音数据和所述第一语音数据拼接播放。
12.根据权利要求9所述的装置,其特征在于,所述第二消息处理模块还用于获取所述第二消息对应的消息发送方标识;获取所述消息发送方标识对应的性别属性;从所述第二消息中提取出消息内容后,根据所述性别属性将提取的消息内容转化为第一语音数据。
13.根据权利要求9所述的装置,其特征在于,还包括:
变声处理模块,用于对所述第一语音数据进行变声处理;所述变声处理包括改变声音频率和改变语速中的至少一种。
14.根据权利要求9所述的装置,其特征在于,还包括:
展示模块,用于当所述第二消息的消息类型为非语音消息时,将所述第二消息作为语音消息类型的消息进行展示;展示与所述第二消息对应的提示标志;
消息内容还原模块,用于检测对展示的第二消息或所述提示标志的触发操作;根据所述触发操作展示所述第二消息的消息内容。
15.根据权利要求9所述的装置,其特征在于,还包括:
语音片段处理模块,用于获取所述消息内容中的关键字;确定所述第一语音数据中与所述关键字对应的第一语音片段,以及所述第一语音数据中除去所述第一语音片段的第二语音片段;
所述第二消息处理模块还用于在播放所述第一语音数据时,将所述第一语音片段和所述第二语音片段采用不同播放方式进行播放。
16.根据权利要求15所述的装置,其特征在于,所述第二消息处理模块还用于按照第一音量播放所述第一语音片段,并按照第二音量播放所述第二语音片段,且所述第一音量高于所述第二音量;和/或,将所述第一语音片段播放第一次数,并将所述第二语音片段播放第二次数,且所述第一次数高于所述第二次数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610302467.0A CN105827516B (zh) | 2016-05-09 | 2016-05-09 | 消息处理方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610302467.0A CN105827516B (zh) | 2016-05-09 | 2016-05-09 | 消息处理方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105827516A true CN105827516A (zh) | 2016-08-03 |
CN105827516B CN105827516B (zh) | 2019-06-21 |
Family
ID=56528528
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610302467.0A Active CN105827516B (zh) | 2016-05-09 | 2016-05-09 | 消息处理方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105827516B (zh) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106302134A (zh) * | 2016-09-29 | 2017-01-04 | 努比亚技术有限公司 | 一种消息播放装置和方法 |
CN109147814A (zh) * | 2018-09-07 | 2019-01-04 | 青岛黄海学院 | 基于多人语音通信中的通信控制方法 |
CN109167720A (zh) * | 2018-08-17 | 2019-01-08 | 飞救医疗科技(赣州)有限公司 | 一种语音讯息回放时连续播放的方法和系统 |
CN110519636A (zh) * | 2019-09-04 | 2019-11-29 | 腾讯科技(深圳)有限公司 | 语音信息播放方法、装置、计算机设备及存储介质 |
CN110781344A (zh) * | 2018-07-12 | 2020-02-11 | 上海掌门科技有限公司 | 一种语音消息合成的方法、设备和计算机存储介质 |
CN111261139A (zh) * | 2018-11-30 | 2020-06-09 | 上海擎感智能科技有限公司 | 文字拟人化播报方法及系统 |
CN111399797A (zh) * | 2020-03-09 | 2020-07-10 | 北京达佳互联信息技术有限公司 | 语音消息播放方法、装置、电子设备及存储介质 |
CN112073294A (zh) * | 2020-07-31 | 2020-12-11 | 北京三快在线科技有限公司 | 通知消息的语音播放方法、装置、电子设备及介质 |
CN112712825A (zh) * | 2020-12-30 | 2021-04-27 | 维沃移动通信有限公司 | 音频处理方法、装置及电子设备 |
CN113364665A (zh) * | 2021-05-24 | 2021-09-07 | 维沃移动通信有限公司 | 信息播报方法和电子设备 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101222542A (zh) * | 2005-10-21 | 2008-07-16 | 华为技术有限公司 | 一种实现文语转换功能的方法 |
CN102436807A (zh) * | 2011-09-14 | 2012-05-02 | 苏州思必驰信息科技有限公司 | 自动生成重读音节语音的方法和系统 |
CN103095557A (zh) * | 2012-12-18 | 2013-05-08 | 上海量明科技发展有限公司 | 即时通信消息进行语音输出的方法及系统 |
US20140019135A1 (en) * | 2012-07-16 | 2014-01-16 | General Motors Llc | Sender-responsive text-to-speech processing |
CN104270531A (zh) * | 2014-10-22 | 2015-01-07 | 广州三星通信技术研究有限公司 | 连续播放多条消息的方法和装置 |
CN104836916A (zh) * | 2015-05-25 | 2015-08-12 | 广东欧珀移动通信有限公司 | 一种语音播报聊天信息的方法、系统及移动终端 |
-
2016
- 2016-05-09 CN CN201610302467.0A patent/CN105827516B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101222542A (zh) * | 2005-10-21 | 2008-07-16 | 华为技术有限公司 | 一种实现文语转换功能的方法 |
CN102436807A (zh) * | 2011-09-14 | 2012-05-02 | 苏州思必驰信息科技有限公司 | 自动生成重读音节语音的方法和系统 |
US20140019135A1 (en) * | 2012-07-16 | 2014-01-16 | General Motors Llc | Sender-responsive text-to-speech processing |
CN103095557A (zh) * | 2012-12-18 | 2013-05-08 | 上海量明科技发展有限公司 | 即时通信消息进行语音输出的方法及系统 |
CN104270531A (zh) * | 2014-10-22 | 2015-01-07 | 广州三星通信技术研究有限公司 | 连续播放多条消息的方法和装置 |
CN104836916A (zh) * | 2015-05-25 | 2015-08-12 | 广东欧珀移动通信有限公司 | 一种语音播报聊天信息的方法、系统及移动终端 |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106302134A (zh) * | 2016-09-29 | 2017-01-04 | 努比亚技术有限公司 | 一种消息播放装置和方法 |
CN110781344A (zh) * | 2018-07-12 | 2020-02-11 | 上海掌门科技有限公司 | 一种语音消息合成的方法、设备和计算机存储介质 |
CN109167720A (zh) * | 2018-08-17 | 2019-01-08 | 飞救医疗科技(赣州)有限公司 | 一种语音讯息回放时连续播放的方法和系统 |
CN109167720B (zh) * | 2018-08-17 | 2021-09-03 | 飞救医疗科技(赣州)有限公司 | 一种语音讯息回放时连续播放的方法和系统 |
CN109147814A (zh) * | 2018-09-07 | 2019-01-04 | 青岛黄海学院 | 基于多人语音通信中的通信控制方法 |
CN111261139A (zh) * | 2018-11-30 | 2020-06-09 | 上海擎感智能科技有限公司 | 文字拟人化播报方法及系统 |
CN111261139B (zh) * | 2018-11-30 | 2023-12-26 | 上海擎感智能科技有限公司 | 文字拟人化播报方法及系统 |
CN110519636A (zh) * | 2019-09-04 | 2019-11-29 | 腾讯科技(深圳)有限公司 | 语音信息播放方法、装置、计算机设备及存储介质 |
CN111399797A (zh) * | 2020-03-09 | 2020-07-10 | 北京达佳互联信息技术有限公司 | 语音消息播放方法、装置、电子设备及存储介质 |
CN111399797B (zh) * | 2020-03-09 | 2023-11-14 | 北京达佳互联信息技术有限公司 | 语音消息播放方法、装置、电子设备及存储介质 |
CN112073294B (zh) * | 2020-07-31 | 2023-01-17 | 北京三快在线科技有限公司 | 通知消息的语音播放方法、装置、电子设备及介质 |
CN112073294A (zh) * | 2020-07-31 | 2020-12-11 | 北京三快在线科技有限公司 | 通知消息的语音播放方法、装置、电子设备及介质 |
CN112712825B (zh) * | 2020-12-30 | 2022-09-23 | 维沃移动通信有限公司 | 音频处理方法、装置及电子设备 |
CN112712825A (zh) * | 2020-12-30 | 2021-04-27 | 维沃移动通信有限公司 | 音频处理方法、装置及电子设备 |
CN113364665A (zh) * | 2021-05-24 | 2021-09-07 | 维沃移动通信有限公司 | 信息播报方法和电子设备 |
CN113364665B (zh) * | 2021-05-24 | 2023-10-24 | 维沃移动通信有限公司 | 信息播报方法和电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN105827516B (zh) | 2019-06-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105827516A (zh) | 消息处理方法和装置 | |
CN110381389B (zh) | 一种基于人工智能的字幕生成方法和装置 | |
US10522146B1 (en) | Systems and methods for recognizing and performing voice commands during advertisement | |
CN103327181B (zh) | 可提高用户获知语音信息效率的语音聊天方法 | |
EP3133546A1 (en) | Assistant redirection for customer service agent processing | |
KR20140091236A (ko) | 전자 기기 및 전자 기기의 제어 방법 | |
WO2016115716A1 (zh) | 一种语音播放方法和语音播放设备 | |
US11783808B2 (en) | Audio content recognition method and apparatus, and device and computer-readable medium | |
WO2023029904A1 (zh) | 文本内容匹配方法、装置、电子设备及存储介质 | |
CN104144108A (zh) | 一种消息响应方法、装置及系统 | |
CN109165292A (zh) | 数据处理方法、装置以及移动终端 | |
CN113889113A (zh) | 分句方法、装置、存储介质及电子设备 | |
CN108055617A (zh) | 一种麦克风的唤醒方法、装置、终端设备及存储介质 | |
CN103973542B (zh) | 一种语音信息处理方法及装置 | |
CN109036398A (zh) | 语音交互方法、装置、设备及存储介质 | |
CN110830368A (zh) | 即时通讯消息发送方法及电子设备 | |
US20220391058A1 (en) | Interaction information processing method and apparatus, electronic device and storage medium | |
CN110379406B (zh) | 语音评论转换方法、系统、介质和电子设备 | |
CN105139848A (zh) | 数据转换方法和装置 | |
WO2022228377A1 (zh) | 录音方法、装置、电子设备和可读存储介质 | |
CN109670109A (zh) | 信息获取方法、装置、服务器、终端和介质 | |
CN109547632B (zh) | 辅助呼叫应答方法、用户终端装置和服务器 | |
EP2913822B1 (en) | Speaker recognition | |
CN112259076B (zh) | 语音交互方法、装置、电子设备及计算机可读存储介质 | |
CN109597996A (zh) | 一种语义解析方法、装置、设备和介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |