CN104423980A - 信息处理方法和信息处理设备 - Google Patents

信息处理方法和信息处理设备 Download PDF

Info

Publication number
CN104423980A
CN104423980A CN201310375629.XA CN201310375629A CN104423980A CN 104423980 A CN104423980 A CN 104423980A CN 201310375629 A CN201310375629 A CN 201310375629A CN 104423980 A CN104423980 A CN 104423980A
Authority
CN
China
Prior art keywords
audio
predetermined audio
application
predetermined
voice data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201310375629.XA
Other languages
English (en)
Other versions
CN104423980B (zh
Inventor
柯海滨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lenovo Beijing Ltd
Original Assignee
Lenovo Beijing Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lenovo Beijing Ltd filed Critical Lenovo Beijing Ltd
Priority to CN201310375629.XA priority Critical patent/CN104423980B/zh
Publication of CN104423980A publication Critical patent/CN104423980A/zh
Application granted granted Critical
Publication of CN104423980B publication Critical patent/CN104423980B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • User Interface Of Digital Computer (AREA)
  • Telephone Function (AREA)

Abstract

本发明提供了一种信息处理方法和信息处理设备,应用于一电子设备,所述信息处理方法包括:当所述电子设备中存储有包含至少一个音频文件的应用时,采集音频数据;判断所述音频数据是否与预定音频匹配,其中,所述预定音频与所述音频文件相关联;以及当判断所述音频数据与所述预定音频匹配时,对所述应用执行相应的操作。

Description

信息处理方法和信息处理设备
技术领域
本发明涉及信息处理的领域,更具体地,本发明涉及一种信息处理方法和信息处理设备。
背景技术
当前,语音控制作为一种人机交互方式已经越来越普遍。在目前的语音控制的方法中,通常,用户需要预先人为地、专门地进行语音输入,以生成用于进行相应控制的预设语音,并且在此后的语音控制过程中,用户需要回忆起之前所设置的预设语音并机械地发出与所述预设语音一致的语音,以实现语音控制。
这样的语音控制方式需要耗费用户大量时间以进行专门的设置,比较低效。此外,这样的语音控制方式不够自然和智能,需要用户机械记忆相关控制命令,不符合用户使用和认知习惯,用户体验相对较差。
发明内容
有鉴于上述情况,本发明提供了一种信息处理方法和信息处理设备,其能够使得用户以符合自身认知习惯、且便于记忆的简单方式进行语音控制,改进了用户体验。
此外,本发明提供了一种信息处理方法和信息处理设备,其能够进行自动、智能的语音控制相关的设置,从而简化了用户操作,改进了用户体验。
根据本发明一实施例,提供了一种信息处理方法,应用于一电子设备,所述信息处理方法包括:当所述电子设备中存储有包含至少一个音频文件的应用时,采集音频数据;判断所述音频数据是否与预定音频匹配,其中,所述预定音频与所述音频文件相关联;以及当判断所述音频数据与所述预定音频匹配时,对所述应用执行相应的操作。
在采集音频数据的步骤之前,所述信息处理方法还包括:基于所述音频文件,生成所述预定音频。
生成所述预定音频的步骤包括:至少运行所述应用的所述音频文件,以输出与所述音频文件对应的音频;接收输入操作;响应于所述输入操作,确定所述音频中的至少一部分作为所述预定音频;以及将所述预定音频与所述应用相关联地存储在所述电子设备中。
生成所述预定音频的步骤包括:运行所述应用,以输出与所述音频文件对应的音频;基于预定策略,采集所述音频的至少一部分作为所述预定音频;以及将所述预定音频与所述应用相关联地存储在所述电子设备中。
生成所述预定音频的步骤包括:提取所述音频文件,作为所述预定音频;以及将所述预定音频与所述应用相关联地存储在所述电子设备中。
所述应用为通讯录,所述通讯录具有联系人条目,所述联系人条目包含所述音频文件,并且,生成所述预定音频的步骤包括:在与所述联系人条目对应的联系人的历史通信中,采集所述联系人的语音;基于所述语音,生成所述预定音频;以及将所述预定音频作为所述联系人条目的音频文件而存储。
所述预定音频具有预定音频特征信息,所述判断所述音频数据是否与预定音频匹配的步骤包括:基于所述音频数据,生成所述音频数据的音频特征信息;以及判断所述音频特征信息是否与所述预定音频特征信息相匹配。
所述预定音频与一预定文本信息相关联,所述判断所述音频数据是否与预定音频匹配的步骤包括:对所述音频数据进行音频识别,以生成一文本信息;以及判断所述文本信息是否与所述预定文本信息相匹配。
所述预定音频包括主要分量和次要分量,所述判断所述音频数据是否与预定音频匹配的步骤包括:判断所述音频数据是否与所述主要分量相匹配。
所述应用为播放器应用并且当前正播放所述音频文件,所述音频文件的第一部分与所述预定音频相关联,所述对所述应用执行相应的操作的步骤包括:将当前的播放切换至所述音频文件的所述第一部分。
所述应用为播放器应用,用于播放所述电子设备中的第一音频文件和第二音频文件,所述第一音频文件与所述预定音频相关联,所述第二音频文件与第二预定音频相关联,并且所述应用当前正播放所述第二音频文件,所述对所述应用执行相应的操作的步骤包括:将当前的播放切换至所述第一音频文件。
所述应用能够执行第一操作和第二操作,所述预定音频包括第一预定音频和第二预定音频,所述第一操作与所述第一预定音频相关联,所述第二操作与第二预定音频相关联,并且,所述对所述应用执行相应的操作的步骤包括:当判断所述音频数据与所述第一预定音频相关联时,执行所述第一操作;当判断所述音频数据与所述第二预定音频相关联时,执行所述第二操作。
所述电子设备中存储有第一应用和第二应用,所述第一应用至少具有与第一预定音频相关联的第一音频文件,所述第二应用至少具有与第二预定音频相关联的第二音频文件;所述判断所述音频数据是否与预定音频匹配的步骤包括:判断所述音频数据与所述第一预定音频和所述第二预定音频中的哪一个相匹配;所述对所述应用执行相应的操作的步骤包括:当判断所述音频数据与所述第一预定音频相匹配时,选中所述第一应用以执行相应的操作;当判断所述音频数据与所述第二预定音频相匹配时,选中所述第二应用以执行相应的操作。
根据本发明另一实施例,提供了一种信息处理设备,应用于一电子设备,所述信息处理设备包括:采集单元,当所述电子设备中存储有包含至少一个音频文件的应用时,采集音频数据;判断单元,判断所述音频数据是否与预定音频匹配,其中,所述预定音频与所述音频文件相关联;以及执行单元,当判断所述音频数据与所述预定音频匹配时,对所述应用执行相应的操作。
所述信息处理设备还包括:生成单元,在采集音频数据之前,基于所述音频文件,生成所述预定音频。
所述生成单元配置为执行以下操作之一:至少运行所述应用的所述音频文件以输出与所述音频文件对应的音频,接收输入操作,响应于所述输入操作,确定所述音频中的至少一部分作为所述预定音频,以及将所述预定音频与所述应用相关联地存储在所述电子设备中;或运行所述应用以输出与所述音频文件对应的音频,基于预定策略,采集所述音频的至少一部分作为所述预定音频,以及将所述预定音频与所述应用相关联地存储在所述电子设备中;或提取所述音频文件作为所述预定音频,以及将所述预定音频与所述应用相关联地存储在所述电子设备中。
所述判断单元配置为执行以下操作之一:当所述预定音频具有预定音频特征信息时,基于所述音频数据,生成所述音频数据的音频特征信息,以及判断所述音频特征信息是否与所述预定音频特征信息相匹配;或当所述预定音频与一预定文本信息相关联时,对所述音频数据进行音频识别以生成一文本信息,以及判断所述文本信息是否与所述预定文本信息相匹配;或当所述预定音频包括主要分量和次要分量时,判断所述音频数据是否与所述主要分量相匹配。
所述执行单元配置为执行以下操作之一:在所述应用为播放器应用并且当前正播放所述音频文件、所述音频文件的第一部分与所述预定音频相关联的情况下,将当前的播放切换至所述音频文件的所述第一部分;或在所述应用为播放器应用用于播放所述电子设备中的第一音频文件和第二音频文件、所述第一音频文件与所述预定音频相关联、所述第二音频文件与第二预定音频相关联、并且所述应用当前正播放所述第二音频文件的情况下,将当前的播放切换至所述第一音频文件;或在所述应用能够执行第一操作和第二操作、所述预定音频包括第一预定音频和第二预定音频、所述第一操作与所述第一预定音频相关联、所述第二操作与第二预定音频相关联的情况下,当判断所述音频数据与所述第一预定音频相关联时,执行所述第一操作,当判断所述音频数据与所述第二预定音频相关联时,执行所述第二操作。
所述电子设备中存储有第一应用和第二应用,所述第一应用至少具有与第一预定音频相关联的第一音频文件,所述第二应用至少具有与第二预定音频相关联的第二音频文件;所述判断单元配置为判断所述音频数据与所述第一预定音频和所述第二预定音频中的哪一个相匹配;所述执行单元配置为当判断所述音频数据与所述第一预定音频相匹配时,选中所述第一应用以执行相应的操作;当判断所述音频数据与所述第二预定音频相匹配时,选中所述第二应用以执行相应的操作。
在本发明实施例的信息处理方法和信息处理设备中,在用户输入的音频数据匹配与应用相关联的音频文件时,对所述应用执行相应的操作。由于用户的语音控制命令与应用所关联的音频文件相匹配,因此,便于用户记忆,使得能够用户以符合自身认知习惯、且便于记忆的简单方式进行语音控制,改进了用户体验。
此外,在本发明实施例的信息处理方法和信息处理设备中,基于应用的音频文件生成所述预定音频,从而能够在之前应用的运行过程当中自动、智能地进行预定音频的生成,或者在之前应用的运行当中由用户顺便进行简单的预定音频的设置,而不必用户进行专门的繁琐的设置操作,从而极大简化了用户操作,改进了用户体验。
附图说明
图1是图示根据本发明实施例的信息处理方法的流程图;以及
图2是图示根据本发明实施例的信息处理设备的主要配置的框图。
具体实施方式
以下将参考附图详细描述本发明实施例。
首先,将描述本发明实施例的信息处理方法。
本发明实施例的信息处理方法应用于一电子设备。所述电子设备诸如手机、平板电脑、个人计算机等等。所述电子设备具有存储单元,用于存储诸如系统应用和用户应用的应用等和应用相关数据。所述电子设备还可具有处理单元,用于例如执行所述应用等。此外,所述电子设备还可具有诸如麦克风的音频输入(采集)单元,用于采集音频数据。替代地,所述电子设备也可与外设音频输入单元可分离地连接。此外,所述电子设备还可具有诸如扬声器的音频输出单元,用于输出音频。
下面,将参照图1描述根据本发明实施例的信息处理方法。
在本发明实施例的信息处理方法开始时,所述电子设备中已经存储有至少一个应用,并且所述应用包含至少一个音频文件。所述音频文件可以是所述应用生成并安装时已经包含的文件,如游戏的音效文件。替代地,所述音频文件也可以是用户为所述应用所配置或关联的文件,如音乐播放器中可通过播放器播放的音频文件。
此外,所述音频文件与一预定音频相关联。在一实施例中,所述预定音频在本发明实施例的信息处理方法开始之前已经由例如所述应用的制造者或发布者预先设置好并与所述应用相关联,从而与所述应用关联存储在所述电子设备中。在另一实施例中,本发明实施例的信息处理方法还可在如下所述的步骤S101之前,基于所述音频文件,生成所述预定音频。
具体地,本发明实施例的信息处理方法可以在步骤S101之前,在至少部分地运行所述应用的同时,生成所述预定音频。所述“至少部分地运行所述应用”意味着可以完整地运行所述应用,替代地,也可以运行所述应用的一部分,例如,所述应用的音频文件部分。
更具体地,在第一示例中,所述信息处理方法至少运行所述应用的所述音频文件,以输出与所述音频文件对应的音频。接下来,所述信息处理方法可以接收用户的输入操作,并响应于所述输入操作,确定所述音频中的至少一部分作为所述预定音频。由此,所述信息处理方法将所述预定音频与所述应用相关联地存储在所述电子设备中。
也就是说,在此示例中,用户可以在运行所述应用的音频文件的同时,指定所述音频文件中的至少一个片段作为所述预定音频。以所述应用为一游戏的情况为例,用户可以在为欣赏目的而播放游戏音乐的同时顺便按自己喜好指定其中的一个片段(如代表性的旋律或歌声)作为所述预定音频,从而不需要专门的、枯燥的设置语音控制命令的操作,方便了用户操作,改进了用户体验。而且,所设置的预定音频是与所述应用自身的音频文件相关联的,从而方便用户记忆,符合用户使用习惯。
在第二示例中,所述信息处理方法可以完整地运行所述应用,以输出与所述音频文件对应的音频。此后,所述信息处理方法基于预定策略,采集所述音频的至少一部分作为所述预定音频,并将所述预定音频与所述应用相关联地存储在所述电子设备中。
例如,所述信息处理方法可以将所述音频文件划分为多个片段,并确定多个片段中重复次数最高的特定片段(即,通常的代表性片段或副歌片段),从而将所述特定片段作为所述预定音频。
又例如,所述信息处理方法可以将所述音频文件的开头的预定长度的部分或结尾的预定长度的部分确定为所述预定音频。
当然,上述的预定策略仅为示例。本领域技术人员完全可以在此基础之上设计其他各种预定策略,以确定所述预定音频。
此外,在确定了所述预定音频之后,所述信息处理方法可以向所述用户提示已确定所述预定音频和/或播放所确定的预定音频,以告知用户并方便用户记忆。
也就是说,在此示例中,可以在用户运行所述应用的同时,自动指定所述音频文件中的至少一个片段作为所述预定音频。同样以所述应用为一游戏的情况为例,可以在用户为游戏目的而运行所述应用的同时自动为用户确定所述应用的音频文件的一个片段(如代表性的旋律或歌声)作为所述预定音频,从而不需要用户手动设置语音控制命令的操作,简化了用户操作,改进了用户体验。而且,所设置的预定音频是与所述应用自身的音频文件相关联的,从而方便用户记忆,符合用户使用习惯。
当然,本领域技术人员能够理解,上述第一示例和第二示例可以适当地进行组合或替换。例如,所述信息处理方法也可在运行所述应用的音频文件的同时自动确定预定音频。替代地,所述信息处理方法也可在运行所述应用整体的同时基于用户的输入操作而确定预定音频。
在第三示例中,与上述第一示例和第二示例中需要至少部分地运行所述应用的情况不同,在此示例中,所述信息处理方法可以直接提取所述音频文件作为所述预定音频,并且将所述预定音频与所述应用相关联地存储在所述电子设备中。
也就是说,在此示例中,所述信息处理方法自动将所述应用的音频文件自身确定为预定音频。从而,不需要用户手动设置语音控制命令的操作,简化了用户操作,改进了用户体验。而且,同样,所设置的预定音频是与所述应用自身的音频文件相关联的,从而方便用户记忆,符合用户使用习惯。
在第四示例中,所述应用为一特定应用,即,通讯录。所述通讯录具有联系人条目。所述联系人条目除联系人标识(如姓名等)外,还包含所述音频文件。
在此示例中,所述信息处理方法在所述电子设备的用户与所述联系人条目对应的联系人的历史通信中,采集所述联系人的语音。此后,所述信息处理方法基于所述语音生成所述预定音频,并将所述预定音频作为所述联系人条目的音频文件而存储。
更具体地,例如,所述信息处理方法可以基于所述语音,确定重复次数最多的片段(即,所述联系人的口头禅)作为所述预定音频。又例如,所述信息处理方法可以回放所述语音,并基于用户的输入选择操作,而确定所述语音中的至少一部分作为所述预定音频。当然,上述的方式仅为示例。本领域技术人员完全可以在此基础上设计其他方式而基于所述语音生成预定音频。
在此示例中,所述信息处理方法可以基于用户与联系人的通话过程自动确定预定音频。从而,简化了用户操作,改进了用户体验。而且,所设置的预定音频是与所述联系人的语音特征相关联的,从而方便用户记忆,便于用户再次调用。
在通过如上所述的处理确定了预定音频之后,如图1所示,首先,在步骤S101,所述信息处理方法采集音频数据。具体地,所述信息处理方法可通过如上所述的音频采集单元来采集音频数据。所述音频数据例如为用户输入的语音或其他声音。
接下来,在步骤S102,所述信息处理方法判断所述音频数据是否与预定音频匹配。所述预定音频是与所述应用的音频文件相关联的音频。所述预定音频的生成已经在上面详细描述,在此不再重复。
在一实施例中,所述预定音频具有预定音频特征信息。所述信息处理方法基于所述音频数据,生成所述音频数据的音频特征信息,并判断所述音频特征信息是否与所述预定音频特征信息相匹配。所述音频特征信息的生成与匹配的处理为本领域技术人员所知,在此不再详述。
由此,用户输入的音频数据不必与所述预定音频完全精确相同,而是仅需要频率特征相匹配。从而,降低了用户语音输入的难度,提高了语音输入的成功率,改进了用户体验。
在另一实施例中,所述预定音频与一预定文本信息相关联。例如,在所述预定音频为歌曲片段的情况下,所述预定文本信息例如为此歌曲片段的歌词信息。由此,所述信息处理方法对所述音频数据进行音频识别,以生成一文本信息,并判断所述文本信息是否与所述预定文本信息相匹配。所述音频识别与匹配的处理为本领域技术人员所知,在此不再详述。
由此,即便用户输入的音频数据的频率特征与所述预定音频的频率特征不完全一致,例如,在预定音频为歌曲片段,而用户输入的音频数据仅为念出歌词的语音的情况下,所述信息处理方法也可以成功地将其进行匹配。从而,降低了用户语音输入的难度,提高了语音输入的成功率,改进了用户体验。
在又一实施例中,所述预定音频包括主要分量和次要分量。例如,所述预定音频为包含背景音乐和人声的歌曲,所述人声例如为所述主要分量,所述背景音乐例如为所述次要分量。由此,所述信息处理方法可以仅判断所述音频数据是否与所述主要分量相匹配。本领域技术人员能够理解,所述信息处理方法可通过与上述任一实施例类似的处理来判断所述音频数据与所述主要分量是否匹配。即,所述主要分量具有主要分量特征信息。所述信息处理方法判断所述音频特征信息是否与所述主要分量特征信息相匹配。替代地,所述主要分量与主要分量文本信息相关联。所述信息处理方法判断所述文本信息是否与所述主要分量文本信息相匹配。
由此,在所述预定音频包含多种分量的声音的情况下,用户不必精确输入每一种声音,而是可以仅输入主要分量的声音,从而,降低了用户语音输入的难度,提高了语音输入的成功率,改进了用户体验。
当然,上述的判断方式仅为示例。本领域技术人员可以在此基础上通过其他各种方式来判断所述音频数据与所述预定音频数据是否匹配,其都包含在本发明的范围内。
当判断所述音频数据与所述预定音频不匹配时,所述信息处理方法结束。
另一方面,当判断所述音频数据与所述预定音频匹配时,所述信息处理方法进行到步骤S103。在步骤S103,所述信息处理方法对所述应用执行相应的操作。
具体地,例如,当所述应用尚未启动时,所述信息处理方法在判断所述音频数据与所述预定音频匹配时,启动所述应用。
进一步地,当所述电子设备中存储有多个应用时,所述信息处理方法可以基于所述音频数据,选中所述多个应用中的特定应用并执行相应操作。例如,所述信息处理方法可以基于所述音频数据,选中与其匹配的所有应用并将所有应用显示在一起,从而实现语音搜索的效果。
具体地,假设所述电子设备中存储有第一应用和第二应用,所述第一应用至少具有与第一预定音频相关联的第一音频文件,所述第二应用至少具有与第二预定音频相关联的第二音频文件。由此,所述信息处理方法判断所述音频数据与所述第一预定音频和所述第二预定音频中的哪一个相匹配。当判断所述音频数据与所述第一预定音频相匹配时,所述信息处理方法选中所述第一应用以执行相应的操作。当判断所述音频数据与所述第二预定音频相匹配时,选中所述第二应用以执行相应的操作。
上面以启动操作为例进行了描述,本领域技术人员能够理解,对所述应用执行的操作不限于启动操作。例如,在已经启动所述应用的情况下,所述信息处理方法可以对所述应用执行诸如暂停、关闭等的操作。
此外,在所述应用包含多个音频文件的情况下,所述信息处理方法可以响应于与不同音频文件相匹配的音频数据,对所述应用执行不同的操作。
具体地,假设所述应用能够执行第一操作和第二操作。所述预定音频包括第一预定音频和第二预定音频,所述第一操作与所述第一预定音频相关联,所述第二操作与第二预定音频相关联。由此,当判断所述音频数据与所述第一预定音频相关联时,所述信息处理方法执行所述第一操作。当判断所述音频数据与所述第二预定音频相关联时,所述信息处理方法执行所述第二操作。
本领域技术人员可以根据所述应用而具体设计所述第一操作和所述第二操作,在此不作具体限定。需要指出的是,所述第一操作和所述第二操作的类型可以是相同的,也可以是不同的。
以播放器应用为例,假设当前正在运行所述播放器应用以播放所述音频文件。此外,所述音频文件的第一部分与所述预定音频相关联。由此,在步骤S103,所述信息处理方法将当前的播放切换至所述音频文件的所述第一部分。
也就是说,所述信息处理方法可以实现基于语音而在音频文件内的不同片段之间进行切换的功能,从而不必用户手动调整进度,方便了用户操作。而且,所述信息处理方法可以将所述音频文件的播放精确地调整到用户所期望的片段,从而避免了用户手动调整时所出现的不断尝试的过程,提高了操作效率和准确率。
在另一实施例中,同样以播放器应用为例,所述播放器应用能够播放所述电子设备中的第一音频文件和第二音频文件。所述第一音频文件与所述预定音频相关联,所述第二音频文件与第二预定音频相关联。假设所述应用当前正播放所述第二音频文件。由此,在步骤S103,所述信息处理方法将当前的播放切换至所述第一音频文件。
也就是说,所述信息处理方法可以实现基于语音而在音乐播放器能够播放的多个音频文件之间进行切换的功能,从而不必用户手动切换音频文件,方便了用户操作。而且,所述信息处理方法可以精确地切换到用户所期望的音频文件,从而避免了用户手动切换时例如由于音频文件的错误命名而出现的困惑和失败,提高了操作效率和准确率。
本领域技术人员能够理解,上述示例可以适当地进行组合。例如,在上述的两个播放器的示例中,当运行所述播放器并播放例如第一音频文件时,所述信息处理方法在判断所述音频数据与第一预定音频(其与所述第一音频文件中的至少一部分相关联)时,执行第一操作,即,将当前的播放切换至所述第一音频文件中的所述至少一部分。另一方面,所述信息处理方法在判断所述音频数据与第二预定音频(其与第二音频文件中的至少一部分相关联)时,执行第二操作,即,将当前的播放从所述第一音频文件切换至所述第二音频文件,具体地,切换至所述第二音频文件中的所述至少一部分。即,所述第一操作为在同一音频文件内切换的操作,所述第二操作为在音频文件之间切换的操作。所述第一操作和所述第二操作的类型不同。
从而,所述信息处理方法可以实现基于语音而在音乐播放器能够播放的多个音频文件之间或特定音频文件内进行切换的功能,从而不必用户手动切换音频文件,方便了用户操作。而且,所述信息处理方法可以精确地切换到用户所期望的音频文件的特定部分,从而提高了操作效率和准确率。
以上,描述了本发明实施例的信息处理方法。
在本发明实施例的信息处理方法中,在用户输入的音频数据匹配与应用相关联的音频文件时,对所述应用执行相应的操作。由于用户用于进行语音控制的音频数据与应用所关联的音频文件相匹配,因此,便于用户记忆,使得能够用户以符合自身认知习惯、且便于记忆的简单方式进行语音控制,改进了用户体验。
此外,在本发明实施例的信息处理方法中,基于应用的音频文件生成所述预定音频,从而能够在之前应用的运行过程当中自动、智能地进行预定音频的生成,或者在之前应用的运行当中由用户顺便进行简单的预定音频的设置,而不必用户进行专门的繁琐的设置操作,从而极大简化了用户操作,改进了用户体验。
下面,将参照图2描述本发明实施例的信息处理设备。
本发明实施例的信息处理设备应用于一电子设备。
如图2所示,本发明实施例的信息处理设备200包括:采集单元201、判断单元202和执行单元203。
所述采集单元201当所述电子设备中存储有包含至少一个音频文件的应用时,采集音频数据。所述判断单元202判断所述音频数据是否与预定音频匹配,其中,所述预定音频与所述音频文件相关联。所述执行单元203当判断所述音频数据与所述预定音频匹配时,对所述应用执行相应的操作。
在一实施例中,所述信息处理设备200还包括:生成单元(未示出),在采集音频数据之前,基于所述音频文件,生成所述预定音频。
在另一实施例中,所述生成单元配置为执行以下操作之一:至少运行所述应用的所述音频文件以输出与所述音频文件对应的音频,接收输入操作,响应于所述输入操作,确定所述音频中的至少一部分作为所述预定音频,以及将所述预定音频与所述应用相关联地存储在所述电子设备中;或运行所述应用以输出与所述音频文件对应的音频,基于预定策略,采集所述音频的至少一部分作为所述预定音频,以及将所述预定音频与所述应用相关联地存储在所述电子设备中;或提取所述音频文件作为所述预定音频,以及将所述预定音频与所述应用相关联地存储在所述电子设备中。
具体地,在一示例中,所述生成单元包括:运行单元,至少运行所述应用的所述音频文件,以输出与所述音频文件对应的音频;接收单元,接收输入操作;确定单元,响应于所述输入操作,确定所述音频中的至少一部分作为所述预定音频;以及存储单元,将所述预定音频与所述应用相关联地存储在所述电子设备中。
在另一示例中,所述生成单元包括:运行单元,运行所述应用,以输出与所述音频文件对应的音频;第二采集单元,基于预定策略,采集所述音频的至少一部分作为所述预定音频;以及存储单元,将所述预定音频与所述应用相关联地存储在所述电子设备中。
在另一示例中,所述生成单元包括:提取单元,提取所述音频文件,作为所述预定音频;以及存储单元,将所述预定音频与所述应用相关联地存储在所述电子设备中。
在另一示例中,所述应用为通讯录,所述通讯录具有联系人条目,所述联系人条目包含所述音频文件,并且,所述生成单元包括:第三采集单元,在与所述联系人条目对应的联系人的历史通信中,采集所述联系人的语音;生成单元,基于所述语音,生成所述预定音频;以及存储单元,将所述预定音频作为所述联系人条目的音频文件而存储。
在另一实施例中,所述判断单元202配置为执行以下操作之一:当所述预定音频具有预定音频特征信息时,基于所述音频数据,生成所述音频数据的音频特征信息,以及判断所述音频特征信息是否与所述预定音频特征信息相匹配;或当所述预定音频与一预定文本信息相关联时,对所述音频数据进行音频识别以生成一文本信息,以及判断所述文本信息是否与所述预定文本信息相匹配;或当所述预定音频包括主要分量和次要分量时,判断所述音频数据是否与所述主要分量相匹配。
具体地,在一示例中,所述预定音频具有预定音频特征信息。所述判断单元202包括:特征信息生成单元,基于所述音频数据,生成所述音频数据的音频特征信息;以及匹配单元,判断所述音频特征信息是否与所述预定音频特征信息相匹配。
在另一示例中,所述预定音频与一预定文本信息相关联。所述判断单元202包括:识别单元,对所述音频数据进行音频识别,以生成一文本信息;以及匹配单元,判断所述文本信息是否与所述预定文本信息相匹配。
在另一示例中,所述预定音频包括主要分量和次要分量。所述判断单元202包括:匹配单元,判断所述音频数据是否与所述主要分量相匹配。
在另一实施例中,所述执行单元203配置为执行以下操作之一:在所述应用为播放器应用并且当前正播放所述音频文件、所述音频文件的第一部分与所述预定音频相关联的情况下,将当前的播放切换至所述音频文件的所述第一部分;或在所述应用为播放器应用用于播放所述电子设备中的第一音频文件和第二音频文件、所述第一音频文件与所述预定音频相关联、所述第二音频文件与第二预定音频相关联、并且所述应用当前正播放所述第二音频文件的情况下,将当前的播放切换至所述第一音频文件;或在所述应用能够执行第一操作和第二操作、所述预定音频包括第一预定音频和第二预定音频、所述第一操作与所述第一预定音频相关联、所述第二操作与第二预定音频相关联的情况下,当判断所述音频数据与所述第一预定音频相关联时,执行所述第一操作,当判断所述音频数据与所述第二预定音频相关联时,执行所述第二操作。
具体地,在一示例中,所述应用为播放器应用并且当前正播放所述音频文件,所述音频文件的第一部分与所述预定音频相关联,所述执行单元203包括:切换单元,将当前的播放切换至所述音频文件的所述第一部分。
在另一示例中,所述应用为播放器应用,用于播放所述电子设备中的第一音频文件和第二音频文件。所述第一音频文件与所述预定音频相关联,所述第二音频文件与第二预定音频相关联。所述应用当前正播放所述第二音频文件。所述执行单元203包括:切换单元,将当前的播放切换至所述第一音频文件。
在另一实施例中,所述电子设备中存储有第一应用和第二应用,所述第一应用至少具有与第一预定音频相关联的第一音频文件,所述第二应用至少具有与第二预定音频相关联的第二音频文件;所述判断单元202配置为判断所述音频数据与所述第一预定音频和所述第二预定音频中的哪一个相匹配。所述执行单元203配置为当判断所述音频数据与所述第一预定音频相匹配时,选中所述第一应用以执行相应的操作;当判断所述音频数据与所述第二预定音频相匹配时,选中所述第二应用以执行相应的操作。
在另一实施例中,所述应用能够执行第一操作和第二操作。所述预定音频包括第一预定音频和第二预定音频。所述第一操作与所述第一预定音频相关联,所述第二操作与第二预定音频相关联。所述执行单元203配置为当判断所述音频数据与所述第一预定音频相关联时,执行所述第一操作;当判断所述音频数据与所述第二预定音频相关联时,执行所述第二操作。
在另一实施例中,所述电子设备中存储有第一应用和第二应用,所述第一应用至少具有与第一预定音频相关联的第一音频文件,所述第二应用至少具有与第二预定音频相关联的第二音频文件。所述判断单元202配置为:判断所述音频数据与所述第一预定音频和所述第二预定音频中的哪一个相匹配。所述执行单元203配置为:当判断所述音频数据与所述第一预定音频相匹配时,选中所述第一应用以执行相应的操作;当判断所述音频数据与所述第二预定音频相匹配时,选中所述第二应用以执行相应的操作。
所述信息处理设备200的各个单元的配置和操作已经在参照图1的信息处理方法中详细描述,在此不再重复。
以上,描述了本发明实施例的信息处理设备。
在本发明实施例的信息处理设备中,在用户输入的音频数据匹配与应用相关联的音频文件时,对所述应用执行相应的操作。由于用户用于进行语音控制的音频数据与应用所关联的音频文件相匹配,因此,便于用户记忆,使得能够用户以符合自身认知习惯、且便于记忆的简单方式进行语音控制,改进了用户体验。
此外,在本发明实施例的信息处理设备中,基于应用的音频文件生成所述预定音频,从而能够在之前应用的运行过程当中自动、智能地进行预定音频的生成,或者在之前应用的运行当中由用户顺便进行简单的预定音频的设置,而不必用户进行专门的繁琐的设置操作,从而极大简化了用户操作,改进了用户体验。
以上,参照图1和图2描述了根据本发明实施例的信息处理方法和信息处理设备。
需要说明的是,在本说明书中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
此外,需要说明的是,在本说明书中,类似“第一…单元”、“第二...单元”的表述仅为了在描述时方便区分,而并不意味着其必须实现为物理分离的两个或多个单元。事实上,根据需要,所述单元可以整体实现为一个单元,也可以实现为多个单元。
最后,还需要说明的是,上述一系列处理不仅包括以这里所述的顺序按时间序列执行的处理,而且包括并行或分别地、而不是按时间顺序执行的处理。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本发明可借助软件加必需的硬件平台的方式来实现,当然也可以全部通过硬件来实施。基于这样的理解,本发明的技术方案对背景技术做出贡献的全部或者部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。
在本发明实施例中,单元/模块可以用软件实现,以便由各种类型的处理器执行。举例来说,一个标识的可执行代码模块可以包括计算机指令的一个或多个物理或者逻辑块,举例来说,其可以被构建为对象、过程或函数。尽管如此,所标识模块的可执行代码无需物理地位于一起,而是可以包括存储在不同位里上的不同的指令,当这些指令逻辑上结合在一起时,其构成单元/模块并且实现该单元/模块的规定目的。
在单元/模块可以利用软件实现时,考虑到现有硬件工艺的水平,所以可以以软件实现的单元/模块,在不考虑成本的情况下,本领域技术人员都可以搭建对应的硬件电路来实现对应的功能,所述硬件电路包括常规的超大规模集成(VLSI)电路或者门阵列以及诸如逻辑芯片、晶体管之类的现有半导体或者是其它分立的元件。模块还可以用可编程硬件设备,诸如现场可编程门阵列、可编程阵列逻辑、可编程逻辑设备等实现。
以上对本发明进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (19)

1.一种信息处理方法,应用于一电子设备,所述信息处理方法包括:
当所述电子设备中存储有包含至少一个音频文件的应用时,采集音频数据;
判断所述音频数据是否与预定音频匹配,其中,所述预定音频与所述音频文件相关联;以及
当判断所述音频数据与所述预定音频匹配时,对所述应用执行相应的操作。
2.如权利要求1所述的信息处理方法,在采集音频数据的步骤之前,所述信息处理方法还包括:
基于所述音频文件,生成所述预定音频。
3.如权利要求2所述的信息处理方法,其中,生成所述预定音频的步骤包括:
至少运行所述应用的所述音频文件,以输出与所述音频文件对应的音频;
接收输入操作;
响应于所述输入操作,确定所述音频中的至少一部分作为所述预定音频;以及
将所述预定音频与所述应用相关联地存储在所述电子设备中。
4.如权利要求2所述的信息处理方法,其中,生成所述预定音频的步骤包括:
运行所述应用,以输出与所述音频文件对应的音频;
基于预定策略,采集所述音频的至少一部分作为所述预定音频;以及
将所述预定音频与所述应用相关联地存储在所述电子设备中。
5.如权利要求2所述的信息处理方法,其中,生成所述预定音频的步骤包括:
提取所述音频文件,作为所述预定音频;以及
将所述预定音频与所述应用相关联地存储在所述电子设备中。
6.如权利要求2所述的信息处理方法,其中,所述应用为通讯录,所述通讯录具有联系人条目,所述联系人条目包含所述音频文件,并且,生成所述预定音频的步骤包括:
在与所述联系人条目对应的联系人的历史通信中,采集所述联系人的语音;
基于所述语音,生成所述预定音频;以及
将所述预定音频作为所述联系人条目的音频文件而存储。
7.如权利要求1所述的信息处理方法,其中,所述预定音频具有预定音频特征信息,所述判断所述音频数据是否与预定音频匹配的步骤包括:
基于所述音频数据,生成所述音频数据的音频特征信息;以及
判断所述音频特征信息是否与所述预定音频特征信息相匹配。
8.如权利要求1所述的信息处理方法,其中,所述预定音频与一预定文本信息相关联,所述判断所述音频数据是否与预定音频匹配的步骤包括:
对所述音频数据进行音频识别,以生成一文本信息;以及
判断所述文本信息是否与所述预定文本信息相匹配。
9.如权利要求1所述的信息处理方法,其中,所述预定音频包括主要分量和次要分量,所述判断所述音频数据是否与预定音频匹配的步骤包括:
判断所述音频数据是否与所述主要分量相匹配。
10.如权利要求1所述的信息处理方法,其中,所述应用为播放器应用并且当前正播放所述音频文件,所述音频文件的第一部分与所述预定音频相关联,所述对所述应用执行相应的操作的步骤包括:
将当前的播放切换至所述音频文件的所述第一部分。
11.如权利要求1所述的信息处理方法,其中,所述应用为播放器应用,用于播放所述电子设备中的第一音频文件和第二音频文件,所述第一音频文件与所述预定音频相关联,所述第二音频文件与第二预定音频相关联,并且所述应用当前正播放所述第二音频文件,所述对所述应用执行相应的操作的步骤包括:
将当前的播放切换至所述第一音频文件。
12.如权利要求1所述的信息处理方法,其中,所述应用能够执行第一操作和第二操作,所述预定音频包括第一预定音频和第二预定音频,所述第一操作与所述第一预定音频相关联,所述第二操作与第二预定音频相关联,并且,所述对所述应用执行相应的操作的步骤包括:
当判断所述音频数据与所述第一预定音频相关联时,执行所述第一操作;
当判断所述音频数据与所述第二预定音频相关联时,执行所述第二操作。
13.如权利要求1所述的信息处理方法,其中,所述电子设备中存储有第一应用和第二应用,所述第一应用至少具有与第一预定音频相关联的第一音频文件,所述第二应用至少具有与第二预定音频相关联的第二音频文件;
所述判断所述音频数据是否与预定音频匹配的步骤包括:
判断所述音频数据与所述第一预定音频和所述第二预定音频中的哪一个相匹配;
所述对所述应用执行相应的操作的步骤包括:
当判断所述音频数据与所述第一预定音频相匹配时,选中所述第一应用以执行相应的操作;
当判断所述音频数据与所述第二预定音频相匹配时,选中所述第二应用以执行相应的操作。
14.一种信息处理设备,应用于一电子设备,所述信息处理设备包括:
采集单元,当所述电子设备中存储有包含至少一个音频文件的应用时,采集音频数据;
判断单元,判断所述音频数据是否与预定音频匹配,其中,所述预定音频与所述音频文件相关联;以及
执行单元,当判断所述音频数据与所述预定音频匹配时,对所述应用执行相应的操作。
15.如权利要求14所述的信息处理设备,还包括:
生成单元,在采集音频数据之前,基于所述音频文件,生成所述预定音频。
16.如权利要求15所述的信息处理设备,其中,所述生成单元配置为执行以下操作之一:
至少运行所述应用的所述音频文件以输出与所述音频文件对应的音频,接收输入操作,响应于所述输入操作,确定所述音频中的至少一部分作为所述预定音频,以及将所述预定音频与所述应用相关联地存储在所述电子设备中;或
运行所述应用以输出与所述音频文件对应的音频,基于预定策略,采集所述音频的至少一部分作为所述预定音频,以及将所述预定音频与所述应用相关联地存储在所述电子设备中;或
提取所述音频文件作为所述预定音频,以及将所述预定音频与所述应用相关联地存储在所述电子设备中。
17.如权利要求14所述的信息处理设备,其中,所述判断单元配置为执行以下操作之一:
当所述预定音频具有预定音频特征信息时,基于所述音频数据,生成所述音频数据的音频特征信息,以及判断所述音频特征信息是否与所述预定音频特征信息相匹配;或
当所述预定音频与一预定文本信息相关联时,对所述音频数据进行音频识别以生成一文本信息,以及判断所述文本信息是否与所述预定文本信息相匹配;或
当所述预定音频包括主要分量和次要分量时,判断所述音频数据是否与所述主要分量相匹配。
18.如权利要求14所述的信息处理设备,其中,所述执行单元配置为执行以下操作之一:
在所述应用为播放器应用并且当前正播放所述音频文件、所述音频文件的第一部分与所述预定音频相关联的情况下,将当前的播放切换至所述音频文件的所述第一部分;或
在所述应用为播放器应用用于播放所述电子设备中的第一音频文件和第二音频文件、所述第一音频文件与所述预定音频相关联、所述第二音频文件与第二预定音频相关联、并且所述应用当前正播放所述第二音频文件的情况下,将当前的播放切换至所述第一音频文件;或
在所述应用能够执行第一操作和第二操作、所述预定音频包括第一预定音频和第二预定音频、所述第一操作与所述第一预定音频相关联、所述第二操作与第二预定音频相关联的情况下,当判断所述音频数据与所述第一预定音频相关联时,执行所述第一操作,当判断所述音频数据与所述第二预定音频相关联时,执行所述第二操作。
19.如权利要求14所述的信息处理设备,其中,所述电子设备中存储有第一应用和第二应用,所述第一应用至少具有与第一预定音频相关联的第一音频文件,所述第二应用至少具有与第二预定音频相关联的第二音频文件;
所述判断单元配置为判断所述音频数据与所述第一预定音频和所述第二预定音频中的哪一个相匹配;
所述执行单元配置为当判断所述音频数据与所述第一预定音频相匹配时,选中所述第一应用以执行相应的操作;当判断所述音频数据与所述第二预定音频相匹配时,选中所述第二应用以执行相应的操作。
CN201310375629.XA 2013-08-26 2013-08-26 信息处理方法和信息处理设备 Active CN104423980B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310375629.XA CN104423980B (zh) 2013-08-26 2013-08-26 信息处理方法和信息处理设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310375629.XA CN104423980B (zh) 2013-08-26 2013-08-26 信息处理方法和信息处理设备

Publications (2)

Publication Number Publication Date
CN104423980A true CN104423980A (zh) 2015-03-18
CN104423980B CN104423980B (zh) 2018-12-14

Family

ID=52973062

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310375629.XA Active CN104423980B (zh) 2013-08-26 2013-08-26 信息处理方法和信息处理设备

Country Status (1)

Country Link
CN (1) CN104423980B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105139853A (zh) * 2015-08-13 2015-12-09 深圳市双平泰科技有限公司 一种体征检测装置的控制方法及装置
CN106611603A (zh) * 2015-10-26 2017-05-03 腾讯科技(深圳)有限公司 一种音频处理方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6185535B1 (en) * 1998-10-16 2001-02-06 Telefonaktiebolaget Lm Ericsson (Publ) Voice control of a user interface to service applications
CN101668085A (zh) * 2009-09-16 2010-03-10 宇龙计算机通信科技(深圳)有限公司 一种调节移动终端语音输出的方法及移动终端
CN102568478A (zh) * 2012-02-07 2012-07-11 合一网络技术(北京)有限公司 一种基于语音识别的视频播放控制方法和系统
CN103035274A (zh) * 2011-09-30 2013-04-10 富泰华工业(深圳)有限公司 具有暂停播放多媒体文件功能的电子装置及方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6185535B1 (en) * 1998-10-16 2001-02-06 Telefonaktiebolaget Lm Ericsson (Publ) Voice control of a user interface to service applications
CN101668085A (zh) * 2009-09-16 2010-03-10 宇龙计算机通信科技(深圳)有限公司 一种调节移动终端语音输出的方法及移动终端
CN103035274A (zh) * 2011-09-30 2013-04-10 富泰华工业(深圳)有限公司 具有暂停播放多媒体文件功能的电子装置及方法
CN102568478A (zh) * 2012-02-07 2012-07-11 合一网络技术(北京)有限公司 一种基于语音识别的视频播放控制方法和系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105139853A (zh) * 2015-08-13 2015-12-09 深圳市双平泰科技有限公司 一种体征检测装置的控制方法及装置
CN106611603A (zh) * 2015-10-26 2017-05-03 腾讯科技(深圳)有限公司 一种音频处理方法及装置

Also Published As

Publication number Publication date
CN104423980B (zh) 2018-12-14

Similar Documents

Publication Publication Date Title
US10097884B2 (en) Media playback method, client and system
CN104934048A (zh) 音效调节方法及装置
CN107025906A (zh) 扩展语音识别的周期的方法和产品以及信息处理设备
CN103988256A (zh) 声音处理装置、声音处理方法、程序、记录介质、服务器装置、声音再现装置以及声音处理系统
JP6783339B2 (ja) 音声を処理する方法及び装置
CN103218034A (zh) 一种应用对象调整方法及电子设备
CN104811777A (zh) 智能电视的语音处理方法、处理系统及智能电视
CN104732989B (zh) 智能音乐播放控制系统及其控制方法
CN107656977A (zh) 多媒体文件的获取及播放方法以及装置
CN102280132A (zh) 基于http协议的在线流式音频播放方法
CN110867188A (zh) 内容服务的提供方法、装置、存储介质及电子装置
CN105578274A (zh) 智能电视的音量调整方法及装置
CN105159492A (zh) 一种音乐播放控制方法及终端设备
CN103474080A (zh) 基于码率切换的音频数据的处理方法及装置、系统
CN105406894A (zh) 一种通信终端的载波聚合模式设定方法及通信终端
CN104898821A (zh) 一种信息处理的方法及电子设备
US9552813B2 (en) Self-adaptive intelligent voice device and method
CN104423980A (zh) 信息处理方法和信息处理设备
CN104376859A (zh) 一种播放列表自动调整的方法和网络音乐播放器
CN108687779A (zh) 一种家用机器人的舞蹈开发方法和系统
CN109903762B (zh) 一种语音控制方法、装置、存储介质及语音设备
CN104281249B (zh) 一种多媒体文件的状态切换方法及电子设备
CN108234768A (zh) 资源切换控制方法、装置及终端设备
CN202289477U (zh) 一种通过无线网络进行语音播放的语音玩具终端设备
CN207966489U (zh) 一种歌曲点播系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant