CN110312040A - 信息处理的方法、装置和系统 - Google Patents
信息处理的方法、装置和系统 Download PDFInfo
- Publication number
- CN110312040A CN110312040A CN201910588050.9A CN201910588050A CN110312040A CN 110312040 A CN110312040 A CN 110312040A CN 201910588050 A CN201910588050 A CN 201910588050A CN 110312040 A CN110312040 A CN 110312040A
- Authority
- CN
- China
- Prior art keywords
- text
- information
- target text
- speech audio
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 41
- 230000010365 information processing Effects 0.000 title claims abstract description 32
- 230000009471 action Effects 0.000 claims abstract description 39
- 230000004044 response Effects 0.000 claims abstract description 30
- 230000007704 transition Effects 0.000 claims abstract description 14
- 230000005540 biological transmission Effects 0.000 claims description 17
- 238000006243 chemical reaction Methods 0.000 claims description 8
- 238000003672 processing method Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 9
- 206010048865 Hypoacusis Diseases 0.000 description 7
- 230000011218 segmentation Effects 0.000 description 7
- 230000006399 behavior Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 241000406668 Loxodonta cyclotis Species 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 210000004556 brain Anatomy 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/72—Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
- H04M1/724—User interfaces specially adapted for cordless or mobile telephones
- H04M1/72403—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
- H04M1/7243—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/72—Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
- H04M1/724—User interfaces specially adapted for cordless or mobile telephones
- H04M1/72403—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
- H04M1/7243—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages
- H04M1/72433—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages for voice messaging, e.g. dictaphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/72—Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
- H04M1/724—User interfaces specially adapted for cordless or mobile telephones
- H04M1/72403—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
- H04M1/7243—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages
- H04M1/72436—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages for text messaging, e.g. short messaging services [SMS] or e-mails
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/72—Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
- H04M1/724—User interfaces specially adapted for cordless or mobile telephones
- H04M1/72469—User interfaces specially adapted for cordless or mobile telephones for operating the device by selecting functions from two or more displayed items, e.g. menus or icons
- H04M1/72472—User interfaces specially adapted for cordless or mobile telephones for operating the device by selecting functions from two or more displayed items, e.g. menus or icons wherein the items are sorted according to specific criteria, e.g. frequency of use
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/72—Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
- H04M1/724—User interfaces specially adapted for cordless or mobile telephones
- H04M1/72484—User interfaces specially adapted for cordless or mobile telephones wherein functions are triggered by incoming communication events
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/72—Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
- H04M1/724—User interfaces specially adapted for cordless or mobile telephones
- H04M1/72403—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
- H04M1/72427—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality for supporting games or graphical animations
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2201/00—Electronic components, circuits, software, systems or apparatus used in telephone systems
- H04M2201/42—Graphical user interfaces
Landscapes
- Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Business, Economics & Management (AREA)
- General Business, Economics & Management (AREA)
- User Interface Of Digital Computer (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本发明公开了一种信息处理的方法、装置和系统。该方法包括:响应针对语音信息对象的转换触发操作,将语音信息对象对应的语音音频信息转换为文本信息;响应针对文本信息的文本选择操作,从文本信息中确定至少一目标文本,其中,目标文本至少包含一个文本字符;根据目标文本在文本收纳区域提供一目标文本指示对象;响应针对目标文本指示对象的播放触发操作,播放语音音频信息。本发明解决了现有的记录语音的关键信息的方式费时费力的技术问题。
Description
技术领域
本发明涉及计算机领域,具体而言,涉及一种信息处理的方法、装置和系统。
背景技术
随着互联网技术快速的发展,如何获取更有价值的信息显得越来越重要。一些社交产品为人们提交了交流平台,使人们能够通过交流就能够获取有价值的信息,其中,人们可以通过群聊语音的形式来获取信息。
现有的社交产品可针对大量群聊语音信息对关键信息进行记录,主要采用以下两种方式:
方式一:收藏语音方式,即用户通过重听语音的方式回顾语音内容,该方案非常耗时,而且由于语音内容通常不直接显示,用户在视觉上无法直接分辨多个语音内容,进而无法直观的获取语音内容所包含的信息。
方式二:用户自主通过文字记录语音中的内容的方式,该方式需要用户主动记录文字,费时费力,而且当语音内容包含的信息较多时,用户可能无法完整记录语音内容中的所有关键信息。
同样的,在游戏领域,例如,在跑团类游戏中,游戏玩家也需要从其他人大量的语音发言中记录关键信息,以确保对游戏进程的感知,这些关键信息也可以作为游戏玩家的主要线索,用于在进行游戏时对游戏进行讨论。在游戏领域,对语音内容中的关键信息进行记录的方式通常也是采用上述两种方式,然而,采用上述两种方式对关键信息进行记录存在费时费力的缺陷。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种信息处理的方法、装置和系统,以至少解决现有的记录语音的关键信息的方式费时费力的技术问题。
根据本发明实施例的一个方面,提供了一种信息处理的方法,应用于终端设备,终端设备包含显示屏幕,显示屏幕上显示图形用户界面,图形用户界面中包含一信息展示区域及一文本收纳区域,信息展示区域至少包含一语音信息对象,包括:响应针对语音信息对象的转换触发操作,将语音信息对象对应的语音音频信息转换为文本信息;响应针对文本信息的文本选择操作,从文本信息中确定至少一目标文本,其中,目标文本至少包含一个文本字符;根据目标文本在文本收纳区域提供一目标文本指示对象;响应针对目标文本指示对象的播放触发操作,播放语音音频信息。
进一步地,信息处理的方法还包括:响应针对目标文本指示对象的发送触发操作,发送目标文本指示对象,以使得接收方根据目标文本指示对象播放语音音频信息。
进一步地,信息处理的方法还包括:发送目标文本指示对象对应的语音音频信息。
进一步地,信息处理的方法还包括:发送目标文本指示对象对应的语音音频信息的索引信息。
进一步地,针对目标文本指示对象的发送触发操作,包括:作用于目标文本指示对象的第一发送触发操作。
进一步地,图形用户界面包含一信息输入框;针对目标文本指示对象的发送触发操作,包括:针对信息输入框中待发送信息的第二发送触发操作,其中,待发送信息至少包含目标文本指示对象。
进一步地,信息处理的方法还包括:响应针对语音信息对象的转换触发操作,对语音音频信息进行语音识别和分词处理,显示处理后的文本信息。
进一步地,文本信息包含至少一分词文本;其中,信息处理的方法还包括:响应针对文本信息的文本选择操作,从至少一分词文本中确定至少一目标文本。
根据本发明实施例的另一方面,还提供了一种信息处理的系统,包括:语音采集设备,用于采集语音音频信息;显示设备,用于显示与语音音频信息对应的语音信息对象,并显示语音音频信息转换后的文本信息以及从文本信息中确定的至少一目标文本,其中,目标文本至少包含一个文本字符;显示设备还显示文本收纳区中的目标文本指示对象,其中,目标文本指示对象至少包括目标文本;播放设备,用于播放语音音频信息。
根据本发明实施例的另一方面,还提供了一种信息处理的装置,应用于终端设备,终端设备包含显示屏幕,显示屏幕上显示图形用户界面,图形用户界面中包含一信息展示区域及一文本收纳区域,信息展示区域至少包含一语音信息对象,包括:第一响应模块,用于响应针对语音信息对象的转换触发操作,将语音信息对象对应的语音音频信息转换为文本信息;第二响应模块,用于响应针对文本信息的文本选择操作,从文本信息中确定至少一目标文本,其中,目标文本至少包含一个文本字符;处理模块,用于根据目标文本在文本收纳区域提供一目标文本指示对象;第三响应模块,用于响应针对目标文本指示对象的播放触发操作,播放语音音频信息。
根据本发明实施例的另一方面,还提供了一种存储介质,该存储介质包括存储的程序,其中,在程序运行时控制存储介质所在设备执行上述的信息处理的方法。
根据本发明实施例的另一方面,还提供了一种处理器,该处理器用于运行程序,其中,程序运行时执行上述的信息处理的方法。
在本发明实施例中,采用对语音对应的目标文本进行操作的方式,在对语音信息对象对应的语音音频信息进行文本转换得到文本信息之后,根据文本选择操作从文本信息中确定目标文本,并根据目标文本在文本收纳区域中提供目标文本指示对象,最后响应针对目标文本指示对象的播放触发操作,以播放语音音频信息。容易注意到的是,上述目标文本指示对象可以作为语音音频信息的索引,因此,当用户对目标文本指示对象进行选中操作(例如,点击操作)时,可以播放该目标文本指示对象对应的语音音频信息,用户无需再重听语音,达到了节省时间的目的。此外,目标文本指示对象还可用于对发言对象进行索引,通过目标文本指示对象即可确定该目标文本对应的发言对象,无需再通过重听语音的方式来确定提及该目标文本的发言对象,同样达到了节省时间的目的。
由此可见,本申请所提供的方案达到了节省关键信息的记录时间的目的,从而实现了提高关键信息的记录效率的技术效果,进而解决了现有的记录语音的关键信息的方式费时费力的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的一种信息处理的方法流程图;
图2是根据本发明实施例的一种可选的用户界面的示意图;
图3是根据本发明实施例的一种可选的用户界面的示意图;
图4是根据本发明实施例的一种可选的用户界面的示意图;
图5是根据本发明实施例的一种可选的用户界面的示意图;
图6是根据本发明实施例的一种可选的用户界面的示意图;
图7是根据本发明实施例的一种可选的用户界面的示意图;
图8是根据本发明实施例的一种可选的用户界面的示意图;以及
图9是根据本发明实施例的一种信息处理的装置示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例1
根据本发明实施例,提供了一种信息处理的方法实施例,需要说明的是,该方法应用于终端设备,其中,终端设备包含显示屏幕,显示屏幕上显示图像用户界面,可选的,终端设备可以为移动终端设备(例如,手机、平板等),也可以为非移动终端设备(例如,台式电脑等)。另外,图形用户界面中包含一信息展示区域及文本收纳区域,其中,信息展示区域至少包含一语音信息对象。可选的,在如图6所示图形用户界面中,文本收纳区域显示有多个文本,文本展示区域位于文本收纳区域的上方,文本展示区域内包含多个语音信息对象,其中,语音信息对象为语音音频信息在图形用户界面中的视觉展示。
具体的,图1是根据本发明实施例的信息处理的方法流程图,如图1所示,该方法包括如下步骤:
步骤S102,响应针对语音信息对象的转换触发操作,将语音信息对象对应的语音音频信息转换为文本信息。
在一种可选的实施例中,以多人在同一个交流平台中进行交流为例进行说明,交流平台可以为安装在终端设备上的平台,该交流平台可以为已有的交流平台,例如,微信、QQ等,也可以为游戏中的交流平台,例如,跑团类游戏中对剧情进行讨论的平台。其中,在交流平台中,多人在同一个交流群中进行群聊。在群聊中,发言对象为多个,每个发言对象可能发出多个语音音频信息,用户可以选择对需要进行关键信息记录的语音音频信息。
可选的,用户在看到图形用户界面上存在多个语音信息对象时,可以选择对某一个语音信息对象进行触发操作,此时,终端设备响应针对语音信息对象的触发操作,并播放语音信息对象对应的语音音频信息,其中,上述触发操作可以为但不限于长按操作、多次点击操作、点击预设控件,另外,上述用户为群聊中的多个对象中的任意一个。例如,终端设备检测到对象A对对象B发出的第二条语音进行了触发操作,则终端设备获取对象B发出的第二条语音,并确定该语音为用户需要进行处理的语音。
需要说明的是,上述触发操作用于从多个语音信息对象中确定用户需要进行处理的语音信息对象,因此,终端设备在检测到触发操作时,可以不播放语音信息对象对应的语音音频信息,仅对语音信息对象进行选中。此时,在图形用户界面中可以对选中的语音信息对象进行突出显示,例如,改变语音信息对象的颜色、边框,或者使语音信息对象进行闪烁显示等。此外,还可以在图像用户界面中选中的语音信息对象的周围弹出控件,例如,在图2所示的图形用户界面中,当用户选中语音信息对象之后,在语音信息对象的下方弹出“关键信息记录”的控件。
进一步地,在从多个语音信息对象中确定要处理的语音信息对象之后,终端设备检测是否接收到用户对语音信息对象的转换触发操作,例如,在图2中,终端设备检测用户是否对图2中的控件进行了点击操作,或者点击时长是否达到预设时长等,如果用户对图2中的控件进行了点击操作,或者点击时长达到了预设时长,则终端设备响应转换触发操作,将语音音频信息转换为文本信息。
具体的,终端设备响应针对语音信息对象的转换触发操作,对语音音频信息进行语音识别和分词处理,显示处理后的文本信息,其中,文本信息包含至少一分词文本。可选的,终端设备对语音信息对象对应的语音音频信息进行特征提取,并将提取到的特征值输入至预设模型库,预设模型库可根据特征值输出对应的文本,从而得到语音音频信息对应的待处理文本。进一步地,在得到待处理文本之后,终端设备对待处理文本进行分词处理,得到文本信息。例如,在图2所示的图形用户界面中,用户点击了图2中的控件,则终端设备确定需要对图2中所示的语音音频信息进行处理。首先,终端设备对该语音音频信息进行文本转换,得到该语音音频信息所包含的文本内容为:“他穿着一件红色风衣,还带着一个形状古怪的耳环”,然后终端设备对该文本进行分词处理,得到图3所示的分词结果。
步骤S104,响应针对文本信息的文本选择操作,从文本信息中确定至少一目标文本,其中,目标文本至少包含一个文本字符。
在步骤S104中,文本信息包含至少一分词文本,如图3中,每个小矩形框表示一个分词文本,例如,“他”、“风衣”、“耳环”等。
在一种可选的实施例中,终端设备响应针对文本信息的文本选择操作,从至少一分词文本中确定至少一目标文本,其中,文本选择操作可以为但不限于点击操作、长按操作等。例如,在图3中,用户通过点击操作选中了“风衣”和“耳环”两个分词文本,选中的分词文本作为目标文本以区别于其他分词文本的展现方式进行展示,例如,在图3中,虚线框中的分词文本表示目标文本,此外,还可对选中的分词文本设置不同的字体颜色、底色、文本框形状等方式进行展示。
在一种可选的实施例中,可以在语音信息对象的预设范围内显示确定的目标文本。例如,如图4所示,可以在语音信息对象的下方预设位置显示确定的目标文本“风衣”和“耳环”。
步骤S106,根据目标文本在文本收纳区域提供一目标文本指示对象。
在步骤S106中,目标文本指示对象为文本收纳区域中显示的对象,例如,在图5中,文本收纳区域中的“洞穴”、“图腾”等为目标文本指示对象。
可选的,在从至少一分词文本中确定至少一目标文本之后,终端设备将目标文本存储在预设词库中,并在图形用户界面的文本收纳区域进行展示,例如,在图5中,文本收纳区域为信息输入框的上方,在信息输入框的上方展示了用户所选中的至少一个目标文本。其中,预设词库中的字词在图形用户界面的文本收纳区域进行显示。
可选的,群组中的每个用户具有一个预设词库,每个用户对应的预设词库具有唯一标识,例如,群组中具有三个用户A、B和C,终端设备自动为用户A、B和C分别分配一个预设词库,每个预设词库与用户A、B和C分别对应,不同的用户将确定的目标文本存储至对应的预设词库中,例如,用户A将其确定的目标文本存储至用户A所关联的预设词库中。
可选的,预设词库还可根据不同用户的操作来自动生成,例如,在用户首次从文本信息中选择目标文本之后,自动生成对应的预设词库,如果用户在整个交流平台未从文本信息中选择过目标文本,则该用户没有对应的预设词库。
需要说明的是,由于目标文本是从文本信息中选择得到的,因此,目标文本表征了文本信息对应的语音音频信息的关键信息,即通过步骤S106用户无需手工记录即可确定语音音频信息的关键信息,省时省力。
步骤S108,响应针对目标文本指示对象的播放触发操作,播放语音音频信息。
可选的,终端设备将每个目标文本指示对象设置为对应的语音音频信息的第一索引,以及对应发言对象的第二索引。
在一种可选的实施例中,终端设备可将每个目标文本指示对象设置为对应语音音频信息的第一索引。具体的,终端设备首先确定每个目标文本指示对象对应的语音音频信息,然后将每个目标文本指示对象与对应的语音音频信息进行关联,得到关联关系,最后,将关联关系以及对应的目标文本指示对象设置为第一索引。容易注意到的是,由于目标文本指示对象与语音音频信息相关联,因此,当用户对目标文本指示对象进行操作(例如,点击操作)时,可播放该目标文本指示对象对应的语音音频信息,从而用户无需再对每个语音音频信息进行重听,节省了用户的时间。
可选的,终端设备可将每个目标文本指示对象设置为对应发言对象的第二索引。具体的,终端设备首先确定每个目标文本指示对象的发言对象,然后确定发言对象对应的显示标识,其中,显示标识用于区分不同的发言对象。最后,将显示标识以及对应的目标文本指示对象设置为第二索引。上述显示标识包括如下至少之一:文本字体颜色、形状、文本字体、文本底色等。例如,不同发言对象所对应的目标文本指示对象的文本底色不同,发言对象A对应的颜色为红色,发言对象B对应的颜色为蓝色,用户可根据目标文本指示对象的文本底色来确定该目标文本指示对象的发言对象。
通过步骤S108,将目标文本指示对象与语音音频信息相关联,以及将目标文本指示对象与发言对象相关联,用户通过对目标文本指示对象进行操作即可获取该目标文本指示对象对应的语音音频信息,并能确定该语音音频信息的发言对象,从而无需通过人工记录即可实现对语音音频信息的关键信息的记录以及对语音音频信息的查询,节省了人力,提高了用户体验。
基于上述步骤S102至步骤S108所限定的方案,可以获知,采用对语音对应的目标文本进行操作的方式,在对语音信息对象对应的语音音频信息进行文本转换得到文本信息之后,根据文本选择操作从文本信息中确定目标文本,并根据目标文本在文本收纳区域中提供目标文本指示对象,最后响应针对目标文本指示对象的播放触发操作,以播放语音音频信息。
容易注意到的是,上述目标文本指示对象可以作为语音音频信息的索引,因此,当用户对目标文本指示对象进行选中操作(例如,点击操作)时,可以播放该目标文本指示对象对应的语音音频信息,用户无需再重听语音,达到了节省时间的目的。此外,目标文本指示对象还可用于对发言对象进行索引,通过目标文本指示对象即可确定该目标文本对应的发言对象,无需再通过重听语音的方式来确定提及该目标文本的发言对象,同样达到了节省时间的目的。
由此可见,本申请所提供的方案达到了节省关键信息的记录时间的目的,从而实现了提高关键信息的记录效率的技术效果,进而解决了现有的记录语音的关键信息的方式费时费力的技术问题。
在一种可选的实施例中,终端设备还响应针对目标文本指示对象的发送触发操作,发送目标文本指示对象,以使得接收方根据目标文本指示对象播放语音音频信息。
可选的,终端设备可以发送目标文本指示对象对应的语音音频信息,例如,在图6中,在发送目标文本指示对象之后,用户在文本展示区域内对目标文本指示对象进行操作(例如,点击操作)时,目标文本指示对象即可播放对应的语音音频信息,例如,图6中,点击目标文本指示对象“图腾”,则播放“图腾”对应的语音音频信息。
可选的,终端设备还可以发送目标文本指示对象对应的语音音频信息的索引信息。其中,索引信息包括上述在步骤S108对应的实施例中的第一索引和/或第二索引,通过设置语音音频信息的索引信息,游戏或者聊天群组中的用户即可获知该语音音频信息的发言对象。
在一种可选的实施例中,针对目标文本指示对象的发送触发操作,包括作用于目标文本指示对象的第一发送触发操作,其中,第一发送触发操作可以为但不限于拖动操作。可选的,终端设备检测用户对文本收纳区域中的至少一个目标文本指示对象的选择操作,然后检测用户对目标文本指示对象的拖动操作(即第一发送触发操作),最后根据拖动操作确定目标文本指示对象的展示位置,其中,展示位置用于对目标文本指示对象进行展示。
在上述过程中,选择操作用于从文本收纳区域中确定目标文本指示对象,例如,在图6所示的图形用户界面中,选择操作为点击操作,即用户选中了“图腾”这个目标文本指示对象。可选的,用户可以选择同时选择多个目标文本指示对象,此时,终端设备将多个目标文本指示对象作为整体通过第一发送触发操作拖动至文本展示区域中。
在另一种可选的实施例中,图形用户界面包含一信息输入框,其中,针对目标文本指示对象的发送触发操作,包括针对信息输入框中待发送信息的第二发送触发操作,其中,待发送信息至少包含目标文本指示对象。例如,在图7所示的图形用户界面中,用户将目标文本指示对象“耳环”插入到信息输入框中,作为“我突然觉得耳环和它相关”这个语句中的一部分。
还存在一种可选的方案,用户还可从文本展示区域中拖动目标文本指示对象至信息输入框或者预设词库中。例如,在游戏中,用户A将目标文本指示对象“耳环”拖入至文本展示区域,用户B认为用户A选择的这个字词很重要,或者用户B也需要在信息输入框中输入该目标文本指示对象,则用户B可以通过点击、长按等操作选中该目标文本指示对象,并将该目标文本指示对象拖入至信息输入框中作为文本输入,或者将该目标文本指示对象拖入至文本收纳区域对应的预定位置上,该目标文本指示对象自动存入用户B的预设词库中,供用户B使用。
需要说明的是,在预设词库根据用户的操作自动创建的场景中,如果用户B没有对应的预设词库,例如,用户B一直未从语音音频信息对应的文本信息中选择目标文本,则当用户B将目标文本对应的目标文本指示对象拖入至预设词库对应的文本收纳区域中之后,终端设备自动创建用户B的预设词库,并将该目标文本输入至预设词库中。
在一种可选的实施例中,终端设备还检测用户对至少一个目标文本指示对象的第一操作,然后基于第一索引确定目标文本指示对象对应的语音音频信息,并播放语音音频信息。例如,在图8所示的图形用户界面中,用户点击了用户2输入的文本中的目标文本指示对象“耳环”,其中,目标文本指示对象“耳环”为用户2从用户1的第二个语音音频信息中提取到的目标文本指示对象,则终端设备播放用户1的第二个语音段落。
在另一种可选的实施例中,在多个用户从不同的语音音频信息对应的文本信息中选择出同一个目标文本的情况下,终端设备可首先确定该目标文本对应的显示标识来确定第一对象,然后再根据该目标文本在第一对象的预设词库中所对应的语音音频信息,即可确定需要播放的语音音频信息。例如,用户A的语音音频信息中包含“耳环”,用户B从这段语音音频信息中提取了目标文本“耳环”;同样,用户C的语音音频信息中也包含“耳环”,并且,用户D也提取了目标文本“耳环”,则当用户B在信息输入框中输入目标文本对应的目标文本指示对象“耳环”时,用户D点击用户B的目标文本指示对象“耳环”时,播放的是用户A的语音音频信息。
由上述内容可知,本申请所提供的方案从语音中提取出目标文本,该目标文本可作为游戏中的线索词汇,并允许用户在对话过程中便捷的使用线索词汇,极大的降低了用户从繁杂的语音信息中摘录关键信息以用于讨论的工作量与操作难度,有利于群组沟通。
实施例2
根据本发明实施例,还提供了一种信息处理的系统实施例,需要说明的是,该系统可执行实施例1中的信息处理的方法,该系统包括:语音采集设备、显示设备以及播放设备。
其中,语音采集设备,用于采集语音音频信息;显示设备,用于显示与语音音频信息对应的语音信息对象,并显示语音音频信息转换后的文本信息以及从文本信息中确定的至少一目标文本,其中,目标文本至少包含一个文本字符;显示设备还显示文本收纳区中的目标文本指示对象,其中,目标文本指示对象至少包括目标文本;播放设备,用于播放语音音频信息。
在一种可选的实施例中,上述系统还包括处理器,其中,处理器可接收语音采集设备采集到的语音音频信息,并将语音音频信息进行文本转换,得到文本信息,然后从文本信息中确定至少包含一个文本字符的目标文本,并根据目标文本在文本收纳区域提供目标文本指示对象,最后在接收到对目标文本指示对象的播放触发操作时,对语音信息对象对应的语音音频信息进行播放。
可选的,处理器还响应针对语音信息对象的转换触发操作,对语音音频信息进行语音识别和分词处理,并控制显示设备显示处理后的文本信息,然后处理器响应针对文本信息的文本选择操作,并从至少一分词文本中确定至少一目标文本。其中,文本信息包含至少一分词文本。
在一种可选的实施例中,处理器响应针对目标文本指示对象的发送触发操作,发送目标文本指示对象,以使得接收方根据目标文本指示对象播放语音音频信息。可选的,处理器可以发送目标文本指示对象对应的语音音频信息,也可以发送目标文本指示对象对应的语音音频信息的索引信息。
可选的,针对目标文本指示对象的发送触发操作包括作用于目标文本指示对象的第一发送触发操作。
可选的,图形用户界面包含一信息输入框,针对目标文本指示对象的发送触发操作包括针对信息输入框中待发送信息的第二发送触发操作,其中,待发送信息至少包含目标文本指示对象。
容易注意到的是,上述目标文本指示对象可以作为语音音频信息的索引,因此,当用户对目标文本指示对象进行选中操作(例如,点击操作)时,可以播放该目标文本指示对象对应的语音音频信息,用户无需再重听语音,达到了节省时间的目的。此外,目标文本指示对象还可用于对发言对象进行索引,通过目标文本指示对象即可确定该目标文本对应的发言对象,无需再通过重听语音的方式来确定提及该目标文本的发言对象,同样达到了节省时间的目的。
由此可见,本申请所提供的方案达到了节省关键信息的记录时间的目的,从而实现了提高关键信息的记录效率的技术效果,进而解决了现有的记录语音的关键信息的方式费时费力的技术问题。
实施例3
根据本发明实施例,还提供了一种信息处理的装置实施例,需要说明的是,该装置应用于终端设备,其中,终端设备包含显示屏幕,显示屏幕上显示图像用户界面,可选的,终端设备可以为移动终端设备(例如,手机、平板等),也可以为非移动终端设备(例如,台式电脑等)。另外,图形用户界面中包含一信息展示区域及文本收纳区域,其中,信息展示区域至少包含一语音信息对象。该装置可执行实施例1中的信息处理的方法,其中,图9是根据本发明实施例的信息处理的装置示意图,如图9所示,该装置包括:第一响应模块901、第二响应模块903、处理模块905以及第三响应模块907。
其中,第一响应模块901,用于响应针对语音信息对象的转换触发操作,将语音信息对象对应的语音音频信息转换为文本信息;第二响应模块903,用于响应针对文本信息的文本选择操作,从文本信息中确定至少一目标文本,其中,目标文本至少包含一个文本字符;处理模块905,用于根据目标文本在文本收纳区域提供一目标文本指示对象;第三响应模块907,用于响应针对目标文本指示对象的播放触发操作,播放语音音频信息。
此处需要说明的是,上述第一响应模块901、第二响应模块903、处理模块905以及第三响应模块907对应于上述实施例的步骤S102至步骤S108,四个模块与对应的步骤所实现的实例和应用场景相同,但不限于上述实施例所公开的内容。
在一种可选的实施例中,信息处理的装置还包括:发送模块。其中,发送模块,用于响应针对目标文本指示对象的发送触发操作,发送目标文本指示对象,以使得接收方根据目标文本指示对象播放语音音频信息。
在一种可选的实施例中,发送模块包括:第一发送模块。其中,第一发送模块,用于发送目标文本指示对象对应的语音音频信息。
在一种可选的实施例中,发送模块包括:第二发送模块。其中,第二发送模块,用于发送目标文本指示对象对应的语音音频信息的索引信息。
可选的,针对目标文本指示对象的发送触发操作包括:作用于目标文本指示对象的第一发送触发操作。
可选的,图形用户界面包含一信息输入框;针对目标文本指示对象的发送触发操作包括:针对信息输入框中待发送信息的第二发送触发操作,其中,待发送信息至少包含目标文本指示对象。
在一种可选的实施例中,第一响应模块包括:第四响应模块。其中,第四响应模块,用于响应针对语音信息对象的转换触发操作,对语音音频信息进行语音识别和分词处理,显示处理后的文本信息。
在一种可选的实施例中,文本信息包含至少一分词文本;其中,第二响应模块包括:第五响应模块。其中,第五响应模块,用于响应针对文本信息的文本选择操作,从至少一分词文本中确定至少一目标文本。
实施例4
根据本发明实施例的另一方面,还提供了一种存储介质,该存储介质包括存储的程序,其中,在程序运行时控制存储介质所在设备执行上述实施例1中的信息处理的方法。
实施例5
根据本发明实施例的另一方面,还提供了一种处理器,该处理器用于运行程序,其中,程序运行时执行上述实施例1中的信息处理的方法。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (12)
1.一种信息处理的方法,应用于终端设备,所述终端设备包含显示屏幕,所述显示屏幕上显示图形用户界面,其特征在于,所述图形用户界面中包含一信息展示区域及一文本收纳区域,所述信息展示区域至少包含一语音信息对象,所述方法包括:
响应针对所述语音信息对象的转换触发操作,将所述语音信息对象对应的语音音频信息转换为文本信息;
响应针对所述文本信息的文本选择操作,从所述文本信息中确定至少一目标文本,其中,所述目标文本至少包含一个文本字符;
根据所述目标文本在所述文本收纳区域提供一目标文本指示对象;
响应针对所述目标文本指示对象的播放触发操作,播放所述语音音频信息。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
响应针对所述目标文本指示对象的发送触发操作,发送所述目标文本指示对象,以使得接收方根据所述目标文本指示对象播放所述语音音频信息。
3.根据权利要求2所述的方法,其特征在于,所述发送所述目标文本指示对象,包括:
发送所述目标文本指示对象对应的所述语音音频信息。
4.根据权利要求2所述的方法,其特征在于,所述发送所述目标文本指示对象,包括:
发送所述目标文本指示对象对应的所述语音音频信息的索引信息。
5.根据权利要求2所述的方法,其特征在于,所述针对所述目标文本指示对象的发送触发操作,包括:
作用于所述目标文本指示对象的第一发送触发操作。
6.根据权利要求2所述的方法,其特征在于,所述图形用户界面包含一信息输入框;
所述针对所述目标文本指示对象的发送触发操作,包括:
针对所述信息输入框中待发送信息的第二发送触发操作,其中,所述待发送信息至少包含所述目标文本指示对象。
7.根据权利要求1所述的方法,其特征在于,所述响应针对所述语音信息对象的转换触发操作,将所述语音信息对象对应的语音音频信息转换为文本信息,包括:
响应针对所述语音信息对象的转换触发操作,对所述语音音频信息进行语音识别和分词处理,显示处理后的文本信息。
8.根据权利要求7所述的方法,其特征在于,所述文本信息包含至少一分词文本;
所述响应针对所述文本信息的文本选择操作,从所述文本信息中确定至少一目标文本,包括:
响应针对所述文本信息的文本选择操作,从所述至少一分词文本中确定所述至少一目标文本。
9.一种信息处理的系统,其特征在于,包括:
语音采集设备,用于采集语音音频信息;
显示设备,用于显示与所述语音音频信息对应的语音信息对象,并显示所述语音音频信息转换后的文本信息以及从所述文本信息中确定的至少一目标文本,其中,所述目标文本至少包含一个文本字符;
所述显示设备还显示文本收纳区中的目标文本指示对象,其中,所述目标文本指示对象至少包括所述目标文本;
播放设备,用于播放所述语音音频信息。
10.一种信息处理的装置,应用于终端设备,所述终端设备包含显示屏幕,所述显示屏幕上显示图形用户界面,其特征在于,所述图形用户界面中包含一信息展示区域及一文本收纳区域,所述信息展示区域至少包含一语音信息对象,所述装置包括:包括:
第一响应模块,用于响应针对所述语音信息对象的转换触发操作,将所述语音信息对象对应的语音音频信息转换为文本信息;
第二响应模块,用于响应针对所述文本信息的文本选择操作,从所述文本信息中确定至少一目标文本,其中,所述目标文本至少包含一个文本字符;
处理模块,用于根据所述目标文本在所述文本收纳区域提供一目标文本指示对象;
第三响应模块,用于响应针对所述目标文本指示对象的播放触发操作,播放所述语音音频信息。
11.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行权利要求1至8中任意一项所述的信息处理的方法。
12.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1至8中任意一项所述的信息处理的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910588050.9A CN110312040B (zh) | 2019-07-02 | 2019-07-02 | 信息处理的方法、装置和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910588050.9A CN110312040B (zh) | 2019-07-02 | 2019-07-02 | 信息处理的方法、装置和系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110312040A true CN110312040A (zh) | 2019-10-08 |
CN110312040B CN110312040B (zh) | 2021-02-19 |
Family
ID=68078732
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910588050.9A Active CN110312040B (zh) | 2019-07-02 | 2019-07-02 | 信息处理的方法、装置和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110312040B (zh) |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103247289A (zh) * | 2012-02-01 | 2013-08-14 | 鸿富锦精密工业(深圳)有限公司 | 记录系统及方法、声音输入装置和语音记录装置及方法 |
US20140289303A1 (en) * | 2012-05-09 | 2014-09-25 | Twilio, Inc. | System and method for managing media in a distributed communication network |
CN104318923A (zh) * | 2014-11-06 | 2015-01-28 | 广州三星通信技术研究有限公司 | 一种语音处理方法、装置及终端 |
KR101646753B1 (ko) * | 2015-03-30 | 2016-08-08 | 주식회사 지투모터테크 | 콜백 메시징 서비스 방법 및 시스템 |
CN105957530A (zh) * | 2016-04-28 | 2016-09-21 | 海信集团有限公司 | 一种语音控制方法、装置和终端设备 |
CN106791015A (zh) * | 2016-11-29 | 2017-05-31 | 维沃移动通信有限公司 | 一种消息播放和回复方法及装置 |
CN107391702A (zh) * | 2017-07-28 | 2017-11-24 | 广东欧珀移动通信有限公司 | 语音消息转存方法、移动终端及计算机可读存储介质 |
CN107888479A (zh) * | 2017-10-31 | 2018-04-06 | 深圳云之家网络有限公司 | 语音通信方法、装置、计算机设备及存储介质 |
CN108337357A (zh) * | 2017-04-19 | 2018-07-27 | 腾讯科技(深圳)有限公司 | 音频播放方法及装置 |
CN108540373A (zh) * | 2018-03-22 | 2018-09-14 | 北京云知声信息技术有限公司 | 即时聊天中语音数据的摘要生成方法、服务器及系统 |
CN109245997A (zh) * | 2018-09-26 | 2019-01-18 | 北京小米移动软件有限公司 | 语音消息播放方法及装置 |
-
2019
- 2019-07-02 CN CN201910588050.9A patent/CN110312040B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103247289A (zh) * | 2012-02-01 | 2013-08-14 | 鸿富锦精密工业(深圳)有限公司 | 记录系统及方法、声音输入装置和语音记录装置及方法 |
US20140289303A1 (en) * | 2012-05-09 | 2014-09-25 | Twilio, Inc. | System and method for managing media in a distributed communication network |
CN104318923A (zh) * | 2014-11-06 | 2015-01-28 | 广州三星通信技术研究有限公司 | 一种语音处理方法、装置及终端 |
KR101646753B1 (ko) * | 2015-03-30 | 2016-08-08 | 주식회사 지투모터테크 | 콜백 메시징 서비스 방법 및 시스템 |
CN105957530A (zh) * | 2016-04-28 | 2016-09-21 | 海信集团有限公司 | 一种语音控制方法、装置和终端设备 |
CN106791015A (zh) * | 2016-11-29 | 2017-05-31 | 维沃移动通信有限公司 | 一种消息播放和回复方法及装置 |
CN108337357A (zh) * | 2017-04-19 | 2018-07-27 | 腾讯科技(深圳)有限公司 | 音频播放方法及装置 |
CN107391702A (zh) * | 2017-07-28 | 2017-11-24 | 广东欧珀移动通信有限公司 | 语音消息转存方法、移动终端及计算机可读存储介质 |
CN107888479A (zh) * | 2017-10-31 | 2018-04-06 | 深圳云之家网络有限公司 | 语音通信方法、装置、计算机设备及存储介质 |
CN108540373A (zh) * | 2018-03-22 | 2018-09-14 | 北京云知声信息技术有限公司 | 即时聊天中语音数据的摘要生成方法、服务器及系统 |
CN109245997A (zh) * | 2018-09-26 | 2019-01-18 | 北京小米移动软件有限公司 | 语音消息播放方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN110312040B (zh) | 2021-02-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110381388B (zh) | 一种基于人工智能的字幕生成方法和装置 | |
CN108764141B (zh) | 一种游戏场景描述方法、装置、设备及其存储介质 | |
CN104731881B (zh) | 一种基于通信应用的聊天记录方法及其移动终端 | |
CN104615334B (zh) | 一种清除移动终端通知栏信息的快捷方法及系统 | |
CN103853852B (zh) | 电子试卷的导入方法 | |
CN107423809A (zh) | 应用于视频直播平台的虚拟机器人多模态交互方法和系统 | |
CN106648535A (zh) | 直播客户端语音输入方法及终端设备 | |
CN104951807B (zh) | 股市情绪的确定方法和装置 | |
CN110377908A (zh) | 语义理解方法、装置、设备及可读存储介质 | |
CN110490428A (zh) | 空中交通管制工作质量评估方法及相关装置 | |
CN103077207A (zh) | 一种微博开心指数分析方法及系统 | |
CN113672086A (zh) | 一种页面处理方法、装置、设备及介质 | |
CN109800418A (zh) | 文本处理方法、装置和存储介质 | |
CN109782997A (zh) | 一种数据处理方法、装置及存储介质 | |
CN110347608A (zh) | 一种交互式应用的测试方法及相关装置 | |
CN109529344A (zh) | 游戏过程中的输入方法及装置 | |
CN110362971A (zh) | 一种内容自适应的屏幕水印显示方法 | |
CN105786378B (zh) | 一种缩放草稿纸界面的方法和装置 | |
CN105550237B (zh) | 一种基于移动终端信息处理方法及移动终端 | |
CN109725798A (zh) | 智能角色的切换方法及相关装置 | |
CN110312040A (zh) | 信息处理的方法、装置和系统 | |
CN117313675A (zh) | 文本修改方法、装置、计算机设备及计算机可读存储介质 | |
CN112417095A (zh) | 语音消息处理方法和装置 | |
CN112270166A (zh) | 一种快速制作创建5g消息的方法 | |
CN105430188B (zh) | 一种选曲方法及移动终端 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |