CN103973542B - 一种语音信息处理方法及装置 - Google Patents
一种语音信息处理方法及装置 Download PDFInfo
- Publication number
- CN103973542B CN103973542B CN201310041481.6A CN201310041481A CN103973542B CN 103973542 B CN103973542 B CN 103973542B CN 201310041481 A CN201310041481 A CN 201310041481A CN 103973542 B CN103973542 B CN 103973542B
- Authority
- CN
- China
- Prior art keywords
- voice messaging
- line
- text message
- information processing
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Telephonic Communication Services (AREA)
Abstract
本发明涉及一种语音信息处理方法,应用于线上通信接收终端中,包括以下步骤:接收线上通信发送终端发送的语音信息;检测针对所述语音信息的用户操作;以及在检测到预定的用户操作后则将所述语音信息转换成文本信息并显示所述文本信息。本发明还提供一种语音信息处理装置。利用本发明可以将接收到的语音信息根据用户的要求转换为文本信息显示,可以减少用户的时间成本以提升交流效率。
Description
技术领域
本发明涉及线上通信领域,特别涉及一种线上通信的语音信息处理方法及装置。
背景技术
线上通信服务是一种基于互联网的通信服务,一般以实现网络上的即时通信功能为主。目前,线上通信服务已经在互联网上得到了广泛的应用和认可,线上通信服务可以通过线上通信系统来实现。线上通信系统以速度快、功能丰富、使用稳定等优点而获得了广大网民的认可和喜爱。在现有的线上通信服务中,用户之间可以通过线上通信系统,例如QQ、微信等进行文本信息交互、语音信息交互、视频交互、文件交互等。
同文本信息交互相比,语音信息交互能够省去文本输入的繁琐,具有方便快捷的优势。然而,现有的线上通信接收终端只能根据发送者设定的信息形式展示信息。例如,若发送者以文本形式发送信息,则线上通信接收终端只能以文本形式显示所述信息。若发送者以语音形式发送信息,则线上通信接收终端只能以语音形式播放所述信息。但是在某些场景下,接收者可能不方便直接收听语音信息,或者接收到的语音信息太多,语音信息逐条点击播放极不方便。这样发送者语音输入的便捷,却给接收者带来收听过程的不便。
发明内容
有鉴于此,有必要提供一种语音信息处理方法及装置,可以将接收到的语音信息根据用户的要求转换为文本信息显示,在语音信息输入便捷的同时达到文本信息输出“所见即所得”的效果。
一种语音信息处理方法,应用于线上通信接收终端中,包括以下步骤:接收线上通信发送终端发送的语音信息;检测针对所述语音信息的用户操作;以及在检测到预定的用户操作后则将所述语音信息转换成文本信息并显示所述文本信息。
一种语音信息处理装置,运行于线上通信接收终端中,包括:接收模块,用于接收线上通信发送终端发送的语音信息;检测模块,用于检测针对所述语音信息的用户操作;转换模块,用于在检测到预定的用户操作后则将所述语音信息转换成文本信息;以及第一显示模块,用于显示所述文本信息。
一种语音信息处理方法,应用于服务器中,包括以下步骤:接收线上通信发送终端发送的语音信息;向线上通信接收终端发送通知信息,以使所述线上通信接收终端可显示表示接收到语音信息的第一界面元素;若接收到所述线上通信接收终端返回的语音信息转换请求则将所述语音信息转换为文本信息,并将所述文本信息发送至线上通信接收终端,以在所述线上通信接收终端上显示所述文本信息。
一种语音信息处理装置,运行于服务器中,包括:接收模块,用于接收线上通信发送终端发送的语音信息;通知模块,用于向线上通信接收终端发送通知信息,以使所述线上通信接收终端可显示表示接收到语音信息的第一界面元素;转换模块,若接收到所述线上通信接收终端返回的语音信息转换请求则将所述语音信息转换为文本信息;以及发送模块,用于将所述文本信息发送至所述线上通信接收终端,以在所述线上通信接收终端上显示所述文本信息。
相对于现有技术,本发明的有益效果是:本发明可以在不方便收听语音信息或接收到的语音信息太多时,将接收到的语音信息根据用户的要求转换为文本信息显示,在语音信息输入便捷的同时达到文本信息输出“所见即所得”的效果,减少用户在处理语音信息时的时间成本,提升交流效率。
为让本发明的上述和其他目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附图式,作详细说明如下。
附图说明
图1为本发明第一实施例提供的语音信息处理方法的流程图。
图2为应用第一实施例的语音信息处理方法时的交互示意图。
图3和图4为应用第一实施例的语音信息处理方法的界面的示意图。
图5为本发明第二实施例提供的语音信息处理装置的框图。
图6为本发明第三实施例提供的语音信息处理方法的流程图。
图7为本发明第四实施例提供的语音信息处理装置的框图。
具体实施方式
为更进一步阐述本发明为实现预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明的具体实施方式、结构、特征及其功效,详细说明如后。
第一实施例
参阅图1所示,本发明第一实施例提供一种语音信息处理方法,所述语音信息处理方法应用于线上通信接收终端中,其包括以下步骤:
步骤S11,接收线上通信发送终端发送的语音信息;
步骤S12,检测针对所述语音信息的用户操作;以及
步骤S13,在检测到预定的用户操作后则将所述语音信息转换成文本信息并显示所述文本信息。
以下结合具体实例作进一步详细说明:
步骤S11所述的线上通信发送终端和所述线上通信接收终端可以为运行于手机、平板电脑、笔记型电脑或台式电脑等硬件终端内的线上通信应用。在用户打开相应的线上通信应用后(参见图2),线上通信发送终端将接收发送方用户输入的语音信息。具体地,线上通信发送终端可以在所显示的线上通信对话界面(参见图3)中显示用于输入语音信息的图标1。发送方用户可以在对所述图标1执行预设操作,例如长按手势的同时说话,从而使线上通信发送终端接收到发送方用户输入的语音信息。
而对于接收方来说,在接收到发送方发送的语音信息后,需要进行显示,例如,如图3所示,显示一个第一界面元素2,如一个图标,以表示接收到一段语音信息。第一界面元素可用于接收用户操作。例如在一般的语音通信应用中,一般根据“按下”或者说“点击”的操作播放接收到的语音信息。本实施例的方法同样可包括此机制,可将要播放语音信息的操作定义为第一用户操作,如上所述,第一用户操作可包括多种具体的操作,本实施并不做出具体限制。但除此之外,本实施例的步骤S12中还检测第二用户操作,第二用户操作是用来触发步骤S13中的将语音信息转化为文本信息的过程。
在具体的实现,第二用户操作可以是由第一界面元素所接收的,例如,针对第一界面元素的拖动、双击等不同于第一用户操作的用户操作。
此外,如图3所示,除了第一界面元素2外,还可在第一界面元素2旁显示第二界面元素3。第二界面元素3用于表示此语音信息可以转化成文本信息,并且可接收用户的第三用户操作。例如,针对第二界面元素3的用户操作如点击、按下、滑动、拖动、双击等均可视为上述的第三用户操作。
上述的第二用户操作以及第三用户操作均可视为上述的预定的用户操作,在检测到预定的用户操作后则发出语音信息转换请求,将语音信息提交至转换模块进行文本转换(参阅图2)。图2所示的转换模块可以是运行于本机,还可以是运行于服务器中。
在获取返回的转换的文本信息后,可以进行输出显示。具体地,例如可以将文本信息显示于第一界面元素2的下方,还可以采用浮层的方式显示转换后的文本信息。例如,在用户按下第二界面元素3后,采用浮层的方式显示转换后的文本信息,并且在用户松开后,或者松开第二界面元素3一段时间后隐藏所述浮层。采用此种方式可以在最大程度的保持原用线上通信应用的界面风格的情形下实现文本信息的显示。
此外,可以理解,步骤S13中的转换过程并不限于根据用户操作触发。例如,可以根据预存的设定信息判断是否需要将所述语音信息转换为文本信息,若是则发出语音信息转换请求。所述设定信息由线上通信接收终端预先设定,并存储于本机或者服务器中。线上通信接收终端可以提供相关的设定界面供用户进行相关设置。所述服务器可以用于连接线上通信发送终端和线上通信接收终端之间的通信,例如中转线上通信发送终端和线上通信接收终端之间的所述语音信息。
进一步地,如图4所示,在语音信息旁边,除了显示转换后的文本信息外,还可显示第三界面元素4,如一个图标或者文字,表示这段文本信息是由语音信息自动转换得来,使得界面更加直观。进一步地,突出文本信息是自动转换的方式并不限于上述实例,例如还可以采用不同的颜色、字体输出自动转换后的文本信息。
通过本实施例的方法,无需播放所述语音信息即可让接收方用户通过查看所述文本信息获悉所述语音信息的内容,即实现“所见即所得”的效果。
第二实施例
参阅图5所示,本发明第二实施例提供一种语音信息处理装置100,运行于线上通信接收终端中。所述语音信息处理装置100包括接收模块101、检测模块102、转换模块103、播放模块104、第一显示模块105、第二显示模块106和第三显示模块107。可以理解,上述的各模块是指计算机程序或者程序段,用于执行某一项或多项特定的功能。此外,上述各模块的区分并不代表实际的程序代码也必须是分开的。
接收模块101,用于接收线上通信发送终端发送的语音信息;检测模块102,用于检测针对所述语音信息的用户操作;转换模块103,用于在检测到预定的用户操作后则将所述语音信息转换成文本信息;播放模块104用于根据用户的第一用户操作播放接收到的语音信息;第一显示模块104,用于显示所述文本信息。
第二显示模块105用于在线上通信对话界面中显示表示所述语音信息的第一界面元素。所述检测模块102还用于监测针对所述第一界面元素的用户操作,若接收到预定的第一用户操作则发出所述语音信息转换请求。
此外,第三显示模块106用于在线上通信对话界面中显示表示将所述语音信息转换为文本信息的第二界面元素。所述检测模块102还用于监测针对所述第二界面元素的用户操作,若接收到预定的第二用户操作则发出所述语音信息转换请求。
对于以上各模块的具体工作过程,可进一步参考本发明第一实施例提供的语音信息处理方法,在此不再重复。
第三实施例
参阅图6所示,本发明第三实施例提供一种语音信息处理方法,所述语音信息处理方法应用于服务器中,其包括以下步骤:
步骤S21,接收线上通信发送终端发送的语音信息;
步骤S22,向线上通信接收终端发送通知信息,以使所述线上通信接收终端可显示表示接收到语音信息的第一界面元素;以及
步骤S23,若接收到所述线上通信接收终端返回的语音信息转换请求则将所述语音信息转换为文本信息,并将所述文本信息发送至线上通信接收终端,以在所述线上通信接收终端上显示所述文本信息。
以下结合具体实例作进一步详细说明:
步骤S11所述的线上通信发送终端和所述线上通信接收终端可以为运行于手机、平板电脑、笔记型电脑或台式电脑等硬件终端内的线上通信应用。在用户打开相应的线上通信应用后(参见图2),线上通信发送终端将接收发送方用户输入的语音信息。具体地,线上通信发送终端可以在所显示的线上通信对话界面(参见图3)中显示用于输入语音信息的图标1。发送方用户可以在对所述图标1执行预设操作,例如长按手势的同时说话,从而使线上通信发送终端接收到发送方用户输入的语音信息。
在用户发送语音信息后,语音信息即被发送至服务器中,相应地,服务器接收线上通信发送终端发送的语音信息,即进行步骤S21。按语音通信应用的一般情形,语音信息需要被推送至接收方。在本实施例的方法中,并不是直接将语音信息推送至接收方,而是如步骤S22所述,先发送通知信息至接收终端。此通知信息是用于表示有一段语音信息将要发送至接收终端。接收终端在接收到通知信息后即可获知将有语音信息发送过来。
接下来在接收终端中的处理过程类似于第一实施例中所述,例如可显示表示此将可能接收到的语音信息的第一界面元素、表示可进行语音转换的第二界面元素,并且检测用户操作。在检测到第一用户操作后可再向服务器请求语音信息本身,而在检测到预定的用户操作,例如第二用户操作以及第三用户操作后即向服务器发送语音信息转换请求,由服务器将语音信息直接转换为文本信息后返回。相应地,在步骤S23中,在获取到文本信息后进行输出显示。
根据本实施例的方法,可以减少语音信息本身造成的网络流量,另外,可以让用户直接查看语音信息的文本,减少了时间成本,提升了交流效率。
第四实施例
参阅图7所示,本发明第四实施例提供一种语音信息处理装置200,运行于服务器中。所述语音信息处理装置200包括接收模块201、通知模块202、转换模块203和发送模块204。可以理解,上述的各模块是指计算机程序或者程序段,用于执行某一项或多项特定的功能。此外,上述各模块的区分并不代表实际的程序代码也必须是分开的。
接收模块201,用于接收线上通信发送终端发送的语音信息;
通知模块202,用于向线上通信接收终端发送通知信息,以使所述线上通信接收终端可显示表示接收到语音信息的第一界面元素;
转换模块203,用于若接收到所述线上通信接收终端返回的语音信息转换请求则将所述语音信息转换为文本信息;以及
发送模块204,用用于将所述文本信息发送至所述线上通信接收终端,以在所述线上通信接收终端上显示所述文本信息。
对于以上各模块的具体工作过程,可进一步参考本发明第三实施例提供的语音信息处理方法,在此不再重复。
根据本实施例的方法,可以减少语音信息本身造成的网络流量,另外,可以让用户直接查看语音信息的文本,减少了时间成本,提升了交流效率。
此外,本发明实施例还提供一种计算机可读存储介质,其内存储有计算机可执行指令,上述的计算机可读存储介质例如为非易失性存储器例如光盘、硬盘、或者闪存。上述的计算机可执行指令用于让计算机或者类似的运算装置完成上述的语音信息处理方法中的各种操作。
以上所述,仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制,虽然本发明已以较佳实施例揭示如上,然而并非用以限定本发明,任何本领域技术人员,在不脱离本发明技术方案范围内,当可利用上述揭示的技术内容做出些许更动或修饰为等同变化的等效实施例,但凡是未脱离本发明技术方案内容,依据本发明的技术实质对以上实施例所作的任何简介修改、等同变化与修饰,均仍属于本发明技术方案的范围内。
Claims (10)
1.一种语音信息处理方法,应用于线上通信接收终端中,其特征在于,所述方法包括以下步骤:
接收线上通信发送终端发送的语音信息;
在线上通信对话界面中显示表示所述语音信息的第一界面元素;
检测针对所述语音信息的用户操作;以及
在检测到针对所述第一界面元素的第二用户操作后则将所述语音信息转换成文本信息并显示所述文本信息。
2.如权利要求1所述的语音信息处理方法,其特征在于,还包括:
在检测到针对所述第一界面元素的第一用户操作后则播放所述语音信息,所述第一用户操作不同于所述第二用户操作。
3.如权利要求1所述的语音信息处理方法,其特征在于,还包括:
在线上通信对话界面中显示表示将所述语音信息转换为文本信息的第二界面元素;
在检测到针对所述第二界面元素的第三用户操作后则将所述语音信息转换成文本信息并显示所述文本信息。
4.如权利要求1所述的语音信息处理方法,其特征在于,所述文本信息是以浮层的形式显示的,或者显示于所述第一界面元素的下方。
5.一种语音信息处理装置,运行于线上通信接收终端中,其特征在于,所述装置包括:
接收模块,用于接收线上通信发送终端发送的语音信息;
检测模块,用于检测针对所述语音信息的用户操作;
转换模块,用于在检测到针对第一界面元素的第二用户操作后则将所述语音信息转换成文本信息;
第一显示模块,用于显示所述文本信息;
第二显示模块,用于在线上通信对话界面中显示表示所述语音信息的第一界面元素。
6.如权利要求5所述的语音信息处理装置,其特征在于,还包括播放模块,用于在检测到针对所述第一界面元素的第一用户操作后则播放所述语音信息,所述第一用户操作不同于所述第二用户操作。
7.如权利要求5所述的语音信息处理装置,其特征在于,所述转换模块还用于在检测到针对第二界面元素的第三用户操作后则将所述语音信息转换成所述文本信息;
所述语音信息处理装置还包括:第三显示模块,用于在线上通信对话界面中显示表示将所述语音信息转换为文本信息的第二界面元素。
8.如权利要求5所述的语音信息处理装置,其特征在于,所述第一显示模块用于以浮层方式显示所述文本信息,或者将所述文本信息显示于所述第一界面元素的下方。
9.一种语音信息处理方法,应用于服务器中,其特征在于,所述方法包括以下步骤:
接收线上通信发送终端发送的语音信息;
向线上通信接收终端发送通知信息,以使所述线上通信接收终端可显示表示接收到语音信息的第一界面元素;
若接收到所述线上通信接收终端在检测到针对所述第一界面元素的第二用户操作后返回的语音信息转换请求,则将所述语音信息转换为文本信息,并将所述文本信息发送至线上通信接收终端,以在所述线上通信接收终端上显示所述文本信息。
10.一种语音信息处理装置,运行于服务器中,其特征在于,所述装置包括:
接收模块,用于接收线上通信发送终端发送的语音信息;
通知模块,用于向线上通信接收终端发送通知信息,以使所述线上通信接收终端可显示表示接收到语音信息的第一界面元素;
转换模块,若接收到所述线上通信接收终端在检测到针对所述第一界面元素的第二用户操作后返回的语音信息转换请求则将所述语音信息转换为文本信息;以及
发送模块,用于将所述文本信息发送至所述线上通信接收终端,以在所述线上通信接收终端上显示所述文本信息。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310041481.6A CN103973542B (zh) | 2013-02-01 | 2013-02-01 | 一种语音信息处理方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310041481.6A CN103973542B (zh) | 2013-02-01 | 2013-02-01 | 一种语音信息处理方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103973542A CN103973542A (zh) | 2014-08-06 |
CN103973542B true CN103973542B (zh) | 2017-06-13 |
Family
ID=51242604
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310041481.6A Active CN103973542B (zh) | 2013-02-01 | 2013-02-01 | 一种语音信息处理方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103973542B (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104409077A (zh) * | 2014-10-17 | 2015-03-11 | 广州三星通信技术研究有限公司 | 获取终端中的对话语音对应的文本的方法和装置 |
CN104468730A (zh) * | 2014-11-17 | 2015-03-25 | 合肥华凌股份有限公司 | 语音录入食品信息的方法、装置和智能终端 |
CN105939250A (zh) * | 2016-05-25 | 2016-09-14 | 珠海市魅族科技有限公司 | 音频处理方法和装置 |
CN105869458A (zh) * | 2016-06-16 | 2016-08-17 | 汤美 | 基于学校的多媒体教育方法及系统 |
CN106209583A (zh) * | 2016-06-30 | 2016-12-07 | 乐视控股(北京)有限公司 | 一种消息输入方法、装置及其用户终端 |
CN106550146A (zh) * | 2016-10-28 | 2017-03-29 | 努比亚技术有限公司 | 一种聊天信息发送装置和方法 |
CN107608718B (zh) * | 2017-09-07 | 2021-02-19 | 三星电子(中国)研发中心 | 信息处理方法和装置 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101115245A (zh) * | 2006-07-25 | 2008-01-30 | 陈修志 | 具有语音识别及翻译功能的移动终端 |
US20100030557A1 (en) * | 2006-07-31 | 2010-02-04 | Stephen Molloy | Voice and text communication system, method and apparatus |
GB0702150D0 (en) * | 2007-02-05 | 2007-03-14 | Amegoworld Ltd | A Communication Network and Devices |
EP2031841B1 (en) * | 2007-08-29 | 2017-04-19 | BlackBerry Limited | Voicemail system for a handheld device |
US8345832B2 (en) * | 2009-01-09 | 2013-01-01 | Microsoft Corporation | Enhanced voicemail usage through automatic voicemail preview |
-
2013
- 2013-02-01 CN CN201310041481.6A patent/CN103973542B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN103973542A (zh) | 2014-08-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103973542B (zh) | 一种语音信息处理方法及装置 | |
CN105915436B (zh) | 基于主题的即时消息隔离的系统和方法 | |
JP6414241B2 (ja) | インタラクティブ・ホワイトボード機器の音声制御 | |
RU2667717C2 (ru) | Диалоговые политики на основе параметров окружающей среды и генерация ответа | |
US9479911B2 (en) | Method and system for supporting a translation-based communication service and terminal supporting the service | |
RU2494444C2 (ru) | Способы и устройство для осуществления распределенных многомодальных приложений | |
KR101633208B1 (ko) | 인스턴트 통신 음성 인식 방법 및 단말기 | |
US9794209B2 (en) | User interface for multi-modality communication | |
KR20190075800A (ko) | 지능형 개인 보조 인터페이스 시스템 | |
CN103222247B (zh) | 通信会话的处理 | |
CN107995101A (zh) | 一种用于将语音消息转为文本信息的方法与设备 | |
CN107481721A (zh) | 用于可穿戴电子设备的语音交互方法和可穿戴电子设备 | |
US20150025882A1 (en) | Method for operating conversation service based on messenger, user interface and electronic device using the same | |
CA2484246A1 (en) | Sequential multimodal input | |
US20230138804A1 (en) | Enhanced video call method and system, and electronic device | |
CN108829325A (zh) | 用于动态地调整音频输出的呈现的设备、方法和图形用户界面 | |
WO2019071808A1 (zh) | 视频画面显示的方法、装置、系统、终端设备及存储介质 | |
CN112751971A (zh) | 语音播放方法、装置及电子设备 | |
JP2023522092A (ja) | インタラクション記録生成方法、装置、デバイス及び媒体 | |
WO2022135323A1 (zh) | 图像生成方法、装置和电子设备 | |
CN107071512A (zh) | 一种配音方法、装置及系统 | |
KR101584887B1 (ko) | 통신 단말기에서 음성 인식 서비스의 멀티태스킹을 지원하는 방법 및 시스템 | |
US11042587B2 (en) | Performing behavior analysis on audio track data to obtain a name of an application | |
WO2020215704A1 (zh) | 能够实现桌面共享的即时通信方法及相关装置 | |
KR20150088532A (ko) | 통화 중 서비스 제공 장치 및 이를 이용하는 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |