CN112650420B - 一种语音处理方法、装置和介质 - Google Patents

一种语音处理方法、装置和介质 Download PDF

Info

Publication number
CN112650420B
CN112650420B CN201910960198.0A CN201910960198A CN112650420B CN 112650420 B CN112650420 B CN 112650420B CN 201910960198 A CN201910960198 A CN 201910960198A CN 112650420 B CN112650420 B CN 112650420B
Authority
CN
China
Prior art keywords
voice
strip
information
voice strip
sending
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910960198.0A
Other languages
English (en)
Other versions
CN112650420A (zh
Inventor
王姣
周旭
吴声暖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sogou Technology Development Co Ltd
Original Assignee
Beijing Sogou Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sogou Technology Development Co Ltd filed Critical Beijing Sogou Technology Development Co Ltd
Priority to CN201910960198.0A priority Critical patent/CN112650420B/zh
Publication of CN112650420A publication Critical patent/CN112650420A/zh
Application granted granted Critical
Publication of CN112650420B publication Critical patent/CN112650420B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0481Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • G06F3/04847Interaction techniques to control parameter settings, e.g. interaction with sliders or dials
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephone Function (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明实施例提供了一种语音处理方法、装置和介质,其中的方法具体包括:显示悬浮窗;所述悬浮窗中包括:至少一个语音包类别对应的至少一个语音条,所述语音条的信息包括:语音文本;响应于针对所述语音条的触发操作,播放所述语音条;若待发送的语音条或接收到的语音条中存在符合预设条件的信息,则输出对应的警示信息。本发明实施例可以提高语音条的丰富度,可以提高用户选择语音条的便捷性,且可以提高语音条传输的安全性和健康度。

Description

一种语音处理方法、装置和介质
技术领域
本发明涉及通信技术领域,尤其涉及一种语音处理方法、一种语音处理装置、一种用于语音处理的装置和一种机器可读介质。
背景技术
随着通信技术的发展,越来越多的社交网络能够为用户提供联系和交流的交互通道。文字和图片是早期社交网络的用户之间进行信息交互的主要载体。相较于文字和图片,语音对于感情色彩的表达更为直接生动,因此,在目前的社交网络中,越来越多的用户选择通过语音进行交流,即发送端将希望传达的信息以语音形式发送给接收端。
目前的社交网络,可以在界面上提供语音采集控件,以通过该语音采集控件采集用户输入的语音,并向接收端发送采集的语音。或者,目前的社交网络可以支持向接收端发送语音文件,语音文件可以为用户预先录制的文件、或者预先下载的文件。
在实际应用中,通过语音采集控件采集语音,通常需要用户耗费较多的语音采集成本,且采集得到的语音往往较为单调。而向接收端发送语音文件,对于发送端而言将需要花费较长的时间来寻找和加载该语音文件,对于接收端而言将需要通过专门的应用打开该语音文件,也即接收端需要花费较长的时间来收听该语音文件对应的语音。
发明内容
本发明实施例提供一种语音处理方法、语音处理装置、用于语音处理的装置、以及一种机器可读介质,可以提高语音条的丰富度,可以提高用户选择语音条的便捷性,且可以提高语音条传输的安全性和健康度。
为了解决上述问题,本发明实施例公开了一种语音处理方法,包括:
显示悬浮窗;所述悬浮窗中包括:至少一个语音包类别对应的至少一个语音条,所述语音条的信息包括:语音文本;
响应于针对所述语音条的触发操作,播放所述语音条;
若待发送的语音条或接收到的语音条中存在符合预设条件的信息,则输出对应的警示信息。
另一方面,本发明实施例公开了一种语音处理装置,包括:
显示模块,用于显示悬浮窗;所述悬浮窗中包括:至少一个语音包类别对应的至少一个语音条,所述语音条的信息包括:语音文本;
播放模块,用于响应于针对所述语音条的触发操作,播放所述语音条;以及
警示模块,用于在待发送的语音条或接收到的语音条中存在符合预设条件的信息的情况下,输出对应的警示信息。
再一方面,本发明实施例公开了一种用于语音处理的装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
显示悬浮窗;所述悬浮窗中包括:至少一个语音包类别对应的至少一个语音条,所述语音条的信息包括:语音文本;
响应于针对所述语音条的触发操作,播放所述语音条;
若待发送的语音条或接收到的语音条中存在符合预设条件的信息,则输出对应的警示信息。
又一方面,本发明实施例公开了一个或多个机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行前述一个或多个所述的语音处理方法。
本发明实施例包括以下优点:
本发明实施例中悬浮窗可以悬浮于当前应用的界面之上,向用户提供语音条的语音文本,供用户选择;且可以响应于针对上述语音条的触发操作,播放上述语音条,可以实现在任意的应用场景下提供语音,因此可以提高语音操作的便捷性。例如,在语音聊天的场景下,开启有麦克风和扬声器,播放的语音可被发送至接收端。又如,在制作音视频的场景下,播放的语音可以作为背景音。当然,播放的语音可以作为用户是否使用语音条的依据。
并且,本发明实施例可以对语音条进行归类,以得到语音包类别。并且,本发明实施例可以按照语音包类别进行语音条的显示,以供用户选择,不仅可以提高语音条的丰富度,而且可以提高用户选择语音条的便捷性。
另外,本发明实施例在待发送或接收到的语音条中存在符合预设条件的信息的情况下,输出对应的警示信息;一方面可以规范语音条的传输,提高语音条的传输的规范性、健康度和安全性,另一方面可以降低敏感信息对于接收端用户的影响。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明的一种语音处理方法实施例一的步骤流程图;
图2是本发明的一种语音处理方法实施例二的步骤流程图;
图3是本发明的另一种语音处理装置实施例的结构框图;
图4是本发明的一种用于语音处理的装置900的框图;及
图5是本发明的一些实施例中服务器的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供了一种语音处理方案,该方案可以便捷地向用户提供语音条,并且可以实现语音条传输的安全性和健康度。
该方案具体可以包括:显示悬浮窗;上述悬浮窗中可以包括:至少一个语音包类别对应的至少一个语音条,上述语音条的信息包括:语音文本;响应于针对上述语音条的触发操作,播放上述语音条;以及若待发送的语音条或接收到的语音条中存在符合预设条件的信息,则输出对应的警示信息。
本发明实施例的悬浮窗可以指位于窗口最上方的窗口,其可以显示于任意APP(应用程序,Application)的界面之上,以快捷地向用户提供对应的功能。
本发明实施例的悬浮窗中可以包括:至少一个语音包类别对应的至少一个语音条。语音条可以指语音条目,其可以作为本发明实施例的语音处理的最小单位。本发明实施例的语音处理可以包括:语音条的创建、语音条的展示、语音条的播放、语音条的发送、或者语音条的分享等。
本发明实施例可以对语音条进行归类,以得到语音包类别。并且,本发明实施例可以按照语音包类别进行语音条的显示,以供用户选择,不仅可以提高语音条的丰富度,而且可以提高用户选择语音条的便捷性。
本发明实施例可以显示语音条的信息,如语音文本,语音文本可以作为用户选择语音条的依据。
本发明实施例可以响应于针对上述语音条的触发操作,播放上述语音条,可以实现在任意的应用场景下提供语音。例如,在语音聊天的场景下,开启有麦克风和扬声器,播放的语音可被发送至接收端。又如,在制作音视频的场景下,播放的语音可以作为背景音。当然,播放的语音可以作为用户是否使用语音条的依据。
本发明实施例提供的语音处理方法可应用于客户端和服务端对应的应用环境中,客户端与服务端位于有线或无线网络中,通过该有线或无线网络,客户端与服务端进行数据交互。
可选地,客户端可以运行在终端上,上述终端具体包括但不限:智能手机、平板电脑、电子书阅读器、MP3(动态影像专家压缩标准音频层面3,Moving Picture ExpertsGroup Audio Layer III)播放器、MP4(动态影像专家压缩标准音频层面4,Moving PictureExperts Group Audio Layer IV)播放器、膝上型便携计算机、车载电脑、台式计算机、机顶盒、智能电视机、可穿戴设备等等。
可选地,客户端可以对应任意的应用程序,如输入法应用程序、即时通信应用程序等。输入法应用程序具有寄宿特性,可以寄宿于宿主应用程序的应用环境下,宿主应用程序的例子可以包括:即时通信应用程序、音视频制作应用程序等。输入法应用程序可以提供键盘,键盘上可以包括多个按键,按键的类型可以包括:字母按键、数字按键、符号按键、或者功能按键等。
在宿主应用程序的应用环境下,输入法应用程序可以响应于用户的调起操作,显示键盘。上述调起操作可以包括:针对输入框的触发操作等。
方法实施例一
参照图1,示出了本发明的一种语音处理方法实施例一的步骤流程图,具体可以包括:
步骤101、显示悬浮窗;上述悬浮窗中可以包括:至少一个语音包类别对应的至少一个语音条,上述语音条的信息可以包括:语音文本;
步骤102、响应于针对上述语音条的触发操作,播放上述语音条;
步骤103、若待发送的语音条或接收到的语音条中存在符合预设条件的信息,则输出对应的警示信息。
图1所示方法实施例一可由客户端执行,当然本发明实施例对于方法实施例一对应的具体执行主体不加以限制。
步骤101中,悬浮窗可以显示于任意应用程序的界面之上。
本发明实施例中,应用程序可以包括:第一应用程序和第二应用程序。
其中,第一应用程序可以支持键盘形式的语音条,则可以通过键盘的界面展示语音条,第一应用程序的例子可以包括:即时通信应用程序,如微信等。
第二应用程序不支持键盘形式的语音条。在本发明的一种可选实施例中,所处的应用程序为第二应用程序的情况下,可以输出悬浮窗开启提示信息,悬浮窗开启提示信息可用于提示当前应用不支持键盘形式的语音条、请开启悬浮窗。可选地,还可以提供悬浮窗的操作控件,该操作控件可以为开关控件等,以使用户通过开关控件实现悬浮窗的开启或关闭。当前应用可以指当前处于前端的应用程序。
在开启悬浮窗的情况下,悬浮窗可以悬浮在当前应用的界面之上,且可以具有移动特性。相应地,上述方法还可以包括:响应于针对上述悬浮窗的触发操作,移动上述悬浮窗。针对上述悬浮窗的触发操作可以包括:针对悬浮窗的拖动操作等,例如,可以支持用户通过长按悬浮窗的任意位置、将悬浮窗拖动至任意位置。
步骤101可以在当前应用开启悬浮窗的情况下,显示悬浮窗。上述悬浮窗中可以包括:至少一个语音包类别对应的至少一个语音条。
在本发明的一种可选实施例中,可以针对语音包类别设置对应的标签(tab)选项,可以依据用户针对标签选项的选择操作,对语音包类别对应的语音条进行切换。
可选地,上述语音包类别具体包括:自定义类别、或者推荐类别。自定义类别可以为用户自定义得到,推荐类别可以为系统提供的类别。
可选地,自定义类别对应的语音条可以为依据用户针对语音文本指定的音色得到。可以依据用户上传的音频、或者用户指定的发声用户的关键词,确定指定的音色。发声用户可以指音色的发声者,发声用户的身份可以为主播、演员等,可以理解,本发明实施例对于具体的发声用户不加以限制。
本发明实施例依据用户针对语音文本指定的音色,得到自定义类别对应的语音条,可以提高语音的丰富度。
本发明实施例的语音文本可由系统提供,或者,本发明实施例的语音文本可由用户提供。可选地,语音文本可以包括:经典台词、经典语录等。
本发明实施例在依据针对语音文本指定的音色得到语音条后,可以将对应的语音条添加到自定义类别,自定义类别的标识可以为“我的语音包”等。
本发明实施例可以依据语音条的发声用户或语言风格,确定推荐类别。推荐类别的例子可以包括:李云龙吃鸡、嘴强萌妹、萝莉日常撩等,可以理解,本发明实施例对于具体的推荐类别不加以限制。
一个语音包类别可以对应至少一个语音条。本发明实施例可以显示语音条对应的语音文本,以供用户选择。
本发明实施例中,可选的是,可以依据语音条中的信息,对语音条进行过滤,以提高语音条的规范性。例如,若语音条中存在符合预设条件的信息,则对相应的语音条进行过滤。
预设条件可用于约束语音条中包含的信息。可选地,预设条件可以包括:语音条中包括敏感信息。敏感信息可以包括如下信息中的至少一种:色情信息、财产信息、政治信息等,可以理解,本发明实施例对于具体的预设条件和敏感信息不加以限制。
步骤102中,针对上述语音条的触发操作可以包括:针对语音文本中任意位置的触发操作等,针对上述语音条的触发操作的类型可以包括:点击操作等。
本发明实施例可以响应于针对上述语音条的触发操作,播放上述语音条,供用户收听和选择。
在本发明的一种可选实施例中,上述语音条的信息还可以包括:发送控件,发送控件可以位于语音文本的周围区域,如右侧区域。相应地,上述方法还可以包括:响应于针对上述发送控件的操作,发送上述语音条。上述发送上述语音条,具体可以包括:向接收端发送上述语音条。例如,在例如微信的即时通信程序的环境下,可以将语音条上屏至通信窗口中,上屏形式为即时通信程序对应的语音条,对于接收端而言,可以直接通过点击即时通信程序对应的语音条,收听该语音条,故可以提高接收端收听语音的便捷性。
步骤103中,本发明实施例可以对待发送的语音条或接收到的语音条中的信息进行检测,若待发送或接收到的语音条中存在符合预设条件的信息,则输出对应的警示信息。上述警示信息一方面可以规范语音条的传输,提高语音条的传输的规范性和安全性,另一方面可以降低敏感信息对于接收端用户的影响。
可选地,上述输出对应的警示信息,具体可以包括:
在接收到针对上述语音条的发送操作后,若待发送的语音条中存在符合预设条件的信息,则输出对应的第一警示信息;和/或
若通信对端发送的语音条中存在符合预设条件的信息,则输出对应的第二警示信息。
本发明实施例分别从发送端和接收端的角度,对语音条中的信息进行检测,若发送或接收到的语音条中存在符合预设条件的信息,则输出对应的警示信息。上述警示信息一方面可以规范语音条的传输,提高语音条的传输的规范性和安全性,另一方面可以降低敏感信息对于接收端用户的影响。
在本发明的一种应用示例中,假设待发送的语音条中包含例如“给我转点钱吧”的信息,则可以输出对应的第一警示信息、以及对应的操作控件。例如,第一警示信息中可以包括“要发送的语音条中包含财产信息,请确认是否坚持发送”。操作控件可以包括:坚持发送控件和取消发送控件。若接收到针对坚持发送控件的触发操作,则可以发送语音条;或者,若接收到针对取消发送控件的触发操作,则可以不发送语音条。
在本发明的一种应用示例中,假设接收到的语音条中包含例如“给我转点钱吧”的信息,则可以输出对应的第二警示信息。例如,第二警示信息可以为“您接收到的语音条并不是实时的语音,而是系统提供的语音条功能,请不要惊慌”。第二警示信息可以降低敏感信息对于接收端用户的影响。
综上,本发明实施例的语音处理方法,悬浮窗可以悬浮于当前应用的界面之上,向用户提供语音条的语音文本,供用户选择;且可以响应于针对上述语音条的触发操作,播放上述语音条,可以实现在任意的应用场景下提供语音,因此可以提高语音操作的便捷性。例如,在语音聊天的场景下,开启有麦克风和扬声器,播放的语音可被发送至接收端。又如,在制作音视频的场景下,播放的语音可以作为背景音。当然,播放的语音可以作为用户是否使用语音条的依据。
并且,本发明实施例可以对语音条进行归类,以得到语音包类别。并且,本发明实施例可以按照语音包类别进行语音条的显示,以供用户选择,不仅可以提高语音条的丰富度,而且可以提高用户选择语音条的便捷性。
另外,本发明实施例在待发送或接收到的语音条中存在符合预设条件的信息的情况下,输出对应的警示信息;一方面可以规范语音条的传输,提高语音条的传输的规范性、健康度和安全性,另一方面可以降低敏感信息对于接收端用户的影响。
方法实施例二
参照图2,示出了本发明的一种语音处理方法实施例二的步骤流程图,具体可以包括:
步骤201、显示悬浮窗;上述悬浮窗中可以包括:至少一个语音包类别对应的至少一个语音条,上述语音条的信息可以包括:语音文本;
步骤202、响应于针对上述语音条的触发操作,播放上述语音条;
步骤203、若待发送的语音条或接收到的语音条中存在符合预设条件的信息,则输出对应的警示信息;
相对于图1所示方法实施例一,上述方法还可以包括:
步骤204、在接收到针对上述语音条的发送操作后,对语音采集操作进行监测;
步骤205、若监测到上述语音采集操作,则播放上述发送操作对应的语音条。
对于某些应用程序(简称第三应用程序)而言,其可以允许第三方应用程序利用其通道进行语音条的发送。则本发明实施例在第三应用程序的应用环境下,可以响应于针对语音条的发送操作,发送上述语音条,例如,上述发送上述语音条,具体可以包括:将上述语音条上屏至通信窗口中,以在通信环境下实现语音条的发送。
对于某些应用程序(简称第四应用程序)而言,其并不允许第三方应用程序利用其通道进行语音条的发送。
针对第四应用程序不允许第三方应用程序利用其通道进行语音条的发送的问题,本发明实施例在第四应用程序的应用环境下,利用技术手段监测用户的实际操作行为,在监测到语音采集操作的情况下,播放上述发送操作对应的语音条,可以向第四应用程序的语音采集过程提供环境音,因此可以实现在第四应用程序的应用环境下发送语音条。
本发明实施例中,可选的是,可以在接收到针对上述语音条的发送操作后,提供语音采集操作对应的引导控件。引导控件可以包括:语音图标控件和按住说话控件,可以首先显示语音图标控件,并响应于针对语音图标控件的触发操作,显示按住说话控件,并可以将针对按住说话控件的操作作为语音采集操作。
当然,用户在触发针对上述语音条的发送操作后,可以自行寻找和触发语音采集操作对应的引导控件。可以理解,本发明实施例对于语音采集操作的具体实现过程不加以限制。
综上,本发明实施例的语音处理方法,利用技术手段监测用户的实际操作行为,在监测到语音采集操作的情况下,播放上述发送操作对应的语音条,可以向第四应用程序的语音采集过程提供环境音,因此可以实现在不允许利用通道发送语音条的应用环境下、快捷地发送语音条。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的运动动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的运动动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的运动动作并不一定是本发明实施例所必须的。
装置实施例
参照图3,示出了本发明的一种语音处理装置实施例的结构框图,具体可以包括:
显示模块301,用于显示悬浮窗;上述悬浮窗中包括:至少一个语音包类别对应的至少一个语音条,上述语音条的信息包括:语音文本;
播放模块302,用于响应于针对上述语音条的触发操作,播放上述语音条;以及
警示模块303,用于在待发送的语音条或接收到的语音条中存在符合预设条件的信息的情况下,输出对应的警示信息。
可选地,上述警示模块303可以包括:
第一警示模块,用于在接收到针对上述语音条的发送操作后,若待发送的语音条中存在符合预设条件的信息,则输出对应的第一警示信息;和/或
第二警示模块,用于若通信对端发送的语音条中存在符合预设条件的信息,则输出对应的第二警示信息。
可选地,上述语音包类别可以包括:自定义类别、或者推荐类别。
可选地,上述自定义类别对应的语音条为依据用户针对语音文本指定的音色得到。
可选地,上述语音条的信息还可以包括:发送控件;上述装置还可以包括:
发送模块,用于响应于针对上述发送控件的操作,发送上述语音条。
可选地,上述装置还可以包括:
监测模块,用于在接收到针对上述语音条的发送操作后,对语音采集操作进行监测;
监测播放模块,用于若监测到上述语音采集操作,则播放上述发送控件对应的语音条。
可选地,上述装置还可以包括:
移动模块,用于响应于针对上述悬浮窗的触发操作,移动上述悬浮窗。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
本发明实施例还提供了一种用于语音处理的装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:显示悬浮窗;所述悬浮窗中包括:至少一个语音包类别对应的至少一个语音条,所述语音条的信息包括:语音文本;响应于针对所述语音条的触发操作,播放所述语音条;若待发送的语音条或接收到的语音条中存在符合预设条件的信息,则输出对应的警示信息。
图4是根据一示例性实施例示出的一种用于语音处理的装置900作为终端时的结构框图。例如,装置900可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图4,装置900可以包括以下一个或多个组件:处理组件902,存储器904,电源组件906,多媒体组件908,音频组件910,输入/输出(I/O)的接口912,传感器组件914,以及通信组件916。
处理组件902通常控制装置900的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理元件902可以包括一个或多个处理器920来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件902可以包括一个或多个模块,便于处理组件902和其他组件之间的交互。例如,处理组件902可以包括多媒体模块,以方便多媒体组件908和处理组件902之间的交互。
存储器904被配置为存储各种类型的数据以支持在设备900的操作。这些数据的示例包括用于在装置900上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器904可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件906为装置900的各种组件提供电力。电源组件906可以包括电源管理系统,一个或多个电源,及其他与为装置900生成、管理和分配电力相关联的组件。
多媒体组件908包括在所述装置900和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件908包括一个前置摄像头和/或后置摄像头。当设备900处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件910被配置为输出和/或输入音频信号。例如,音频组件910包括一个麦克风(MIC),当装置900处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器904或经由通信组件916发送。在一些实施例中,音频组件910还包括一个扬声器,用于输出音频信号。
I/O接口912为处理组件902和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件914包括一个或多个传感器,用于为装置900提供各个方面的状态评估。例如,传感器组件914可以检测到设备900的打开/关闭状态,组件的相对定位,例如所述组件为装置900的显示器和小键盘,传感器组件914还可以检测装置900或装置900一个组件的位置改变,用户与装置900接触的存在或不存在,装置900方位或加速/减速和装置900的温度变化。传感器组件914可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件914还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件914还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件916被配置为便于装置900和其他设备之间有线或无线方式的通信。装置900可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件916经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件916还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置900可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器904,上述指令可由装置900的处理器920执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
图5是本发明的一些实施例中服务器的结构示意图。该服务器1900可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(central processingunits,CPU)1922(例如,一个或一个以上处理器)和存储器1932,一个或一个以上存储应用程序1942或数据1944的存储介质1930(例如一个或一个以上海量存储设备)。其中,存储器1932和存储介质1930可以是短暂存储或持久存储。存储在存储介质1930的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器1922可以设置为与存储介质1930通信,在服务器1900上执行存储介质1930中的一系列指令操作。
服务器1900还可以包括一个或一个以上电源1926,一个或一个以上有线或无线网络接口1950,一个或一个以上输入输出接口1958,一个或一个以上键盘1956,和/或,一个或一个以上操作系统1941,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
一种非临时性计算机可读存储介质,当所述存储介质中的指令由装置(终端或者服务器)的处理器执行时,使得装置能够执行一种语音处理方法,所述方法包括:显示悬浮窗;所述悬浮窗中包括:至少一个语音包类别对应的至少一个语音条,所述语音条的信息包括:语音文本;响应于针对所述语音条的触发操作,播放所述语音条;若待发送的语音条或接收到的语音条中存在符合预设条件的信息,则输出对应的警示信息。
本发明实施例公开了A1、一种语音处理方法,包括:
显示悬浮窗;所述悬浮窗中包括:至少一个语音包类别对应的至少一个语音条,所述语音条的信息包括:语音文本;
响应于针对所述语音条的触发操作,播放所述语音条;
若待发送的语音条或接收到的语音条中存在符合预设条件的信息,则输出对应的警示信息。
A2、根据A1所述的方法,所述输出对应的警示信息,包括:
在接收到针对所述语音条的发送操作后,若待发送的语音条中存在符合预设条件的信息,则输出对应的第一警示信息;和/或
若通信对端发送的语音条中存在符合预设条件的信息,则输出对应的第二警示信息。
A3、根据A1所述的方法,所述语音包类别包括:自定义类别、或者推荐类别。
A4、根据A3所述的方法,所述自定义类别对应的语音条为依据用户针对语音文本指定的音色得到。
A5、根据A1至A4中任一所述的方法,所述语音条的信息还包括:发送控件;所述方法还包括:
响应于针对所述发送控件的操作,发送所述语音条。
A6、根据A1至A4中任一所述的方法,所述方法还包括:
在接收到针对所述语音条的发送操作后,对语音采集操作进行监测;
若监测到所述语音采集操作,则播放所述发送控件对应的语音条。
A7、根据A1至A4中任一所述的方法,所述方法还包括:
响应于针对所述悬浮窗的触发操作,移动所述悬浮窗。
本发明实施例公开了B8、一种语音处理装置,所述装置包括:
显示模块,用于显示悬浮窗;所述悬浮窗中包括:至少一个语音包类别对应的至少一个语音条,所述语音条的信息包括:语音文本;
播放模块,用于响应于针对所述语音条的触发操作,播放所述语音条;以及
警示模块,用于在待发送的语音条或接收到的语音条中存在符合预设条件的信息的情况下,输出对应的警示信息。
B9、根据B8所述的装置,所述警示模块包括:
第一警示模块,用于在接收到针对所述语音条的发送操作后,若待发送的语音条中存在符合预设条件的信息,则输出对应的第一警示信息;和/或
第二警示模块,用于若通信对端发送的语音条中存在符合预设条件的信息,则输出对应的第二警示信息。
B10、根据B9所述的装置,所述语音包类别包括:自定义类别、或者推荐类别。
B11、根据B10所述的装置,所述自定义类别对应的语音条为依据用户针对语音文本指定的音色得到。
B12、根据B8至B11中任一所述的装置,所述语音条的信息还包括:发送控件;所述装置还包括:
发送模块,用于响应于针对所述发送控件的操作,发送所述语音条。
B13、根据B8至B11中任一所述的装置,所述装置还包括:
监测模块,用于在接收到针对所述语音条的发送操作后,对语音采集操作进行监测;
监测播放模块,用于若监测到所述语音采集操作,则播放所述发送控件对应的语音条。
B14、根据B8至B11中任一所述的装置,所述装置还包括:
移动模块,用于响应于针对所述悬浮窗的触发操作,移动所述悬浮窗。
本发明实施例公开了C15、一种用于语音处理的装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
显示悬浮窗;所述悬浮窗中包括:至少一个语音包类别对应的至少一个语音条,所述语音条的信息包括:语音文本;
响应于针对所述语音条的触发操作,播放所述语音条;
若待发送的语音条或接收到的语音条中存在符合预设条件的信息,则输出对应的警示信息。
C16、根据C15所述的装置,所述输出对应的警示信息,包括:
在接收到针对所述语音条的发送操作后,若待发送的语音条中存在符合预设条件的信息,则输出对应的第一警示信息;和/或
若通信对端发送的语音条中存在符合预设条件的信息,则输出对应的第二警示信息。
C17、根据C15所述的装置,所述语音包类别包括:自定义类别、或者推荐类别。
C18、根据C17所述的装置,所述自定义类别对应的语音条为依据用户针对语音文本指定的音色得到。
C19、根据C15至C18中任一所述的装置,所述语音条的信息还包括:发送控件;所述装置还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
响应于针对所述发送控件的操作,发送所述语音条。
C20、根据C15至C18中任一所述的装置,所述装置还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
在接收到针对所述语音条的发送操作后,对语音采集操作进行监测;
若监测到所述语音采集操作,则播放所述发送控件对应的语音条。
C21、根据C15至C18中任一所述的装置,所述装置还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
响应于针对所述悬浮窗的触发操作,移动所述悬浮窗。
本发明实施例公开了D22、一个或多个机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如A1至A7中一个或多个所述的语音处理方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本发明旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
以上对本发明所提供的一种语音处理方法、一种语音处理装置和一种用于语音处理的装置、以及一种机器可读介质,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (14)

1.一种语音处理方法,其特征在于,所述方法包括:
显示悬浮窗;所述悬浮窗中包括:至少一个语音包类别对应的至少一个语音条,所述语音条的信息包括:语音文本;
响应于针对所述语音条的触发操作,播放所述语音条;
若待发送的语音条或接收到的语音条中存在符合预设条件的信息,则输出对应的警示信息;
所述方法还包括:
在接收到针对所述语音条的发送操作后,对语音采集操作进行监测;
若监测到所述语音采集操作,则播放所述发送操作对应的语音条。
2.根据权利要求1所述的方法,其特征在于,所述输出对应的警示信息,包括:
在接收到针对所述语音条的发送操作后,若待发送的语音条中存在符合预设条件的信息,则输出对应的第一警示信息;和/或
若通信对端发送的语音条中存在符合预设条件的信息,则输出对应的第二警示信息。
3.根据权利要求1所述的方法,其特征在于,所述语音包类别包括:自定义类别、或者推荐类别。
4.根据权利要求3所述的方法,其特征在于,所述自定义类别对应的语音条为依据用户针对语音文本指定的音色得到。
5.根据权利要求1至4中任一所述的方法,其特征在于,所述语音条的信息还包括:发送控件;所述方法还包括:
响应于针对所述发送控件的操作,发送所述语音条。
6.根据权利要求1至4中任一所述的方法,其特征在于,所述方法还包括:
响应于针对所述悬浮窗的触发操作,移动所述悬浮窗。
7.一种语音处理装置,其特征在于,所述装置包括:
显示模块,用于显示悬浮窗;所述悬浮窗中包括:至少一个语音包类别对应的至少一个语音条,所述语音条的信息包括:语音文本;
播放模块,用于响应于针对所述语音条的触发操作,播放所述语音条;以及
警示模块,用于在待发送的语音条或接收到的语音条中存在符合预设条件的信息的情况下,输出对应的警示信息;
所述装置还包括:
监测模块,用于在接收到针对所述语音条的发送操作后,对语音采集操作进行监测;
监测播放模块,用于若监测到所述语音采集操作,则播放所述发送操作对应的语音条。
8.根据权利要求7所述的装置,其特征在于,所述警示模块包括:
第一警示模块,用于在接收到针对所述语音条的发送操作后,若待发送的语音条中存在符合预设条件的信息,则输出对应的第一警示信息;和/或
第二警示模块,用于若通信对端发送的语音条中存在符合预设条件的信息,则输出对应的第二警示信息。
9.根据权利要求8所述的装置,其特征在于,所述语音包类别包括:自定义类别、或者推荐类别。
10.根据权利要求8所述的装置,其特征在于,所述自定义类别对应的语音条为依据用户针对语音文本指定的音色得到。
11.根据权利要求7至10中任一所述的装置,其特征在于,所述语音条的信息还包括:发送控件;所述装置还包括:
发送模块,用于响应于针对所述发送控件的操作,发送所述语音条。
12.根据权利要求7至10中任一所述的装置,其特征在于,所述装置还包括:
移动模块,用于响应于针对所述悬浮窗的触发操作,移动所述悬浮窗。
13.一种用于语音处理的装置,其特征在于,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且所述程序被一个或者一个以上处理器执行时,实现权利要求1至6中任一所述方法的步骤。
14.一个或多个机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如权利要求1至6中一个或多个所述的语音处理方法。
CN201910960198.0A 2019-10-10 2019-10-10 一种语音处理方法、装置和介质 Active CN112650420B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910960198.0A CN112650420B (zh) 2019-10-10 2019-10-10 一种语音处理方法、装置和介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910960198.0A CN112650420B (zh) 2019-10-10 2019-10-10 一种语音处理方法、装置和介质

Publications (2)

Publication Number Publication Date
CN112650420A CN112650420A (zh) 2021-04-13
CN112650420B true CN112650420B (zh) 2022-06-21

Family

ID=75343269

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910960198.0A Active CN112650420B (zh) 2019-10-10 2019-10-10 一种语音处理方法、装置和介质

Country Status (1)

Country Link
CN (1) CN112650420B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102917119A (zh) * 2012-09-19 2013-02-06 东莞宇龙通信科技有限公司 一种移动终端基于语音识别处理音乐的方法及系统
CN104811540A (zh) * 2015-03-26 2015-07-29 努比亚技术有限公司 一种移动终端及其语音通信的声音设置方法和装置
CN105847939A (zh) * 2016-05-12 2016-08-10 乐视控股(北京)有限公司 弹幕播放方法、播放装置及播放系统
CN106663065A (zh) * 2014-07-01 2017-05-10 株式会社得那 允许音频聊天的系统、方法和程序
CN108769399A (zh) * 2018-05-21 2018-11-06 维沃移动通信有限公司 一种消息处理方法及终端设备
CN109547651A (zh) * 2018-10-22 2019-03-29 北京奇虎科技有限公司 一种提示方法、装置及计算机存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102917119A (zh) * 2012-09-19 2013-02-06 东莞宇龙通信科技有限公司 一种移动终端基于语音识别处理音乐的方法及系统
CN106663065A (zh) * 2014-07-01 2017-05-10 株式会社得那 允许音频聊天的系统、方法和程序
CN104811540A (zh) * 2015-03-26 2015-07-29 努比亚技术有限公司 一种移动终端及其语音通信的声音设置方法和装置
CN105847939A (zh) * 2016-05-12 2016-08-10 乐视控股(北京)有限公司 弹幕播放方法、播放装置及播放系统
CN108769399A (zh) * 2018-05-21 2018-11-06 维沃移动通信有限公司 一种消息处理方法及终端设备
CN109547651A (zh) * 2018-10-22 2019-03-29 北京奇虎科技有限公司 一种提示方法、装置及计算机存储介质

Also Published As

Publication number Publication date
CN112650420A (zh) 2021-04-13

Similar Documents

Publication Publication Date Title
CN106605224B (zh) 信息搜索方法、装置、电子设备及服务器
US10152207B2 (en) Method and device for changing emoticons in a chat interface
US10509540B2 (en) Method and device for displaying a message
JP6121621B2 (ja) 音声通話方法、装置、プログラム、及び記録媒体
CN105786507B (zh) 显示界面切换的方法及装置
CN105404401A (zh) 输入处理方法、装置及设备
CN109922098B (zh) 一种内容分享方法、装置以及用于内容分享的装置
CN106331328B (zh) 信息提示的方法及装置
CN105677023A (zh) 信息呈现方法及装置
CN105516457A (zh) 通讯消息的处理方法及装置
CN108984098B (zh) 基于社交软件的信息显示的控制方法及装置
CN112130719B (zh) 页面显示方法、装置、系统、电子设备及存储介质
CN107295167B (zh) 信息显示方法及装置
CN106919302B (zh) 移动终端的操作控制方法及装置
CN106447747B (zh) 图像处理方法及装置
CN110213062B (zh) 处理消息的方法及装置
CN105101121A (zh) 一种信息发送的方法及装置
CN103970831A (zh) 推荐图标的方法和装置
CN112650420B (zh) 一种语音处理方法、装置和介质
CN107026941B (zh) 未读消息的回复处理方法和装置
CN105677406A (zh) 应用操作方法及装置
CN106789943B (zh) 蓝牙设备的播放方法及装置
CN110798721B (zh) 一种剧集管理方法、装置及电子设备
CN113127613B (zh) 聊天信息处理方法及装置
CN115221444A (zh) 数据处理方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant