CN103970793A - 信息查询方法、客户端及服务器 - Google Patents
信息查询方法、客户端及服务器 Download PDFInfo
- Publication number
- CN103970793A CN103970793A CN201310042406.1A CN201310042406A CN103970793A CN 103970793 A CN103970793 A CN 103970793A CN 201310042406 A CN201310042406 A CN 201310042406A CN 103970793 A CN103970793 A CN 103970793A
- Authority
- CN
- China
- Prior art keywords
- information
- audio data
- client
- server
- audio file
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 90
- 230000007613 environmental effect Effects 0.000 claims abstract description 186
- 238000007906 compression Methods 0.000 claims description 47
- 230000006835 compression Effects 0.000 claims description 47
- 238000013144 data compression Methods 0.000 claims description 36
- 238000012544 monitoring process Methods 0.000 claims description 12
- 239000000284 extract Substances 0.000 claims description 10
- 238000000605 extraction Methods 0.000 claims description 10
- 230000005484 gravity Effects 0.000 claims description 6
- 238000010586 diagram Methods 0.000 description 18
- 238000004422 calculation algorithm Methods 0.000 description 8
- 230000005540 biological transmission Effects 0.000 description 7
- 230000006870 function Effects 0.000 description 6
- 230000006837 decompression Effects 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 238000013139 quantization Methods 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/68—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/63—Querying
- G06F16/632—Query formulation
- G06F16/634—Query by example, e.g. query by humming
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/63—Querying
- G06F16/638—Presentation of query results
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/54—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for retrieval
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Library & Information Science (AREA)
- Mathematical Physics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本发明提供一种信息查询方法、客户端及服务器,其中的方法可包括:客户端监测到信息查询触发事件时,采集环境音频数据;所述客户端将所述环境音频数据传输至服务器进行信息查询,并获取所述服务器查询到的所述环境音频数据对应的音频文件的属性信息;所述客户端将所述音频文件的属性信息作为查询结果进行输出。本发明可自动采集环境音频数据进行信息查询,提升信息查询的效率,提升信息查询的有效性和智能性。
Description
技术领域
本发明涉及一种互联网技术领域,具体涉及即时通信技术领域,尤其涉及一种信息查询方法、客户端及服务器。
背景技术
随着互联网的发展,互联网已成为人们生活必不可少的信息获取工具,利用互联网设备实现音频信息查询,成为一种新的应用趋势。传统的关于音频的信息查询方法主要包括以下步骤,首先,用户人工输入未知音频的基本信息,例如:输入未知音频包含的歌词、输入未知音频的名称、输入未知音频的演唱者等等基本信息;其次,基于输入的基本信息,通过互联网设备(例如:互联网中的客户端或服务器)查找该未知音频完整信息。上述方法需要人工输入基本信息,信息查询效率较低;另外,大部分情况下,用户可能并不知道未知音频的基本信息,或者用户获得的未知音频的基本信息有误,从而无法实现有效的信息查询,例如:用户可能听到周围环境中的一小段音乐,但并不清楚该音乐的其他信息,无法进行有效查询,降低了互联网设备的智能性。
发明内容
本发明实施例提供一种信息查询方法、客户端及服务器,可自动采集环境音频数据进行信息查询,提升信息查询的效率,提升信息查询的有效性和智能性。
本发明第一方面提供一种信息查询方法,可包括:
客户端监测到信息查询触发事件时,采集环境音频数据;
所述客户端将所述环境音频数据传输至服务器进行信息查询,并获取所述服务器查询到的所述环境音频数据对应的音频文件的属性信息;
所述客户端将所述音频文件的属性信息作为查询结果进行输出。
本发明第二方面提供另一种信息查询方法,可包括:
服务器接收客户端传输的环境音频数据;
所述服务器根据所述环境音频数据,从预置数据库中查询与所述环境音频数据相对应的音频文件的属性信息;
所述服务器向所述客户端返回所述音频文件的属性信息。
本发明第三方面提供一种客户端,可包括:
采集模块,用于在监测到信息查询触发事件时,采集环境音频数据;
查询模块,用于将所述环境音频数据传输至服务器进行信息查询;
信息获取模块,用于获取所述服务器查询到的所述环境音频数据对应的音频文件的属性信息;
输出模块,用于将所述音频文件的属性信息作为查询结果进行输出。
本发明第四方面提供一种服务器,可包括:
接收模块,用于接收客户端传输的环境音频数据;
查询模块,用于根据所述环境音频数据,从预置数据库中查询与所述环境音频数据相对应的音频文件的属性信息;
信息返回模块,用于向所述客户端返回所述音频文件的属性信息。
实施本发明实施例,具有如下有益效果:
本发明实施例的客户端在监测到信息查询触发事件时,自动采集环境音频数据,并将该环境音频数据发送至服务器中进行音频文件的属性信息的查询,查询操作简单快速,无需用户人工输入待查询音频的基本信息,提升了信息查询的效率,同时提升信息查询的有效性和智能性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种信息查询方法的流程图;
图2为本发明实施例提供的另一种信息查询方法的流程图;
图3为本发明实施例提供的又一种信息查询方法的流程图;
图4为本发明实施例提供的又一种信息查询方法的流程图;
图5为本发明实施例提供的又一种信息查询方法的流程图;
图6为本发明实施例提供的又一种信息查询方法的流程图;
图7a为本发明实施例提供的信息查询过程的第一示意图;
图7b为本发明实施例提供的信息查询过程的第二示意图;
图7c为本发明实施例提供的信息查询过程的第三示意图;
图7d为本发明实施例提供的信息查询过程的第四示意图;
图8为本发明实施例提供的一种客户端的结构示意图;
图9为本发明实施例提供的另一种客户端的结构示意图;
图10为本发明实施例提供的客户端的查询模块的结构示意图;
图11为本发明实施例提供的一种服务器的结构示意图;
图12为本发明实施例提供的服务器的查询模块的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例中,客户端为可以为:手机、智能手机、平板电脑、电子阅读器、笔记本电脑等设备中的任一种。
下面将结合附图1-附图7,对本发明实施例提供的信息查询方法进行详细介绍。
请参见图1,为本发明实施例提供的一种信息查询方法的流程图;本实施例从客户端侧阐述信息查询方法的流程;该方法可包括以下步骤S101-步骤S104。
S101,客户端监测到信息查询触发事件时,采集环境音频数据。
其中,所述环境音频数据指所述客户端所在环境中的音频数据,可以包括但不限于:电影中的环境音频数据、电视剧中的环境音频数据、电视节目中的环境音频数据、音乐电台播放的环境音频数据或所述客户端所在环境中的人发出的环境音频数据(例如:哼唱的音乐、歌曲片段)等。
本发明的一种可行的实施方式中,信息查询触发事件可以为重力感应事件。具体实现中,用户欲进行信息查询时,可在客户端的即时通信应用中执行触发操作以产生重力感应事件,以触发客户端采集环境音频数据;例如:假设客户端为手机,手机用户正在收看电视节目,想要查询当前播放的电视节目中的音乐对应的音频文件的属性信息时,可使用手机的即时通信应用中的“摇一摇搜歌”的功能,摇晃手机以产生重力感应事件,触发手机采集当前播放的电视节目中的音乐的环境音频数据。
本发明的另一种可行的实施方式中,信息查询触发事件可以为特定按键事件。具体实现中,用户欲进行信息查询时,可在客户端的即时通信应用中执行触发操作以产生特定按键事件,以触发客户端采集环境音频数据;例如:假设客户端为手机,手机用户听到周围环境中的一段音乐,想要查询该音乐对应的音频文件的属性信息时,可进入手机的即时通信应用中,点击该即时通信应用提供的特定功能按键,如“搜歌”功能按键,产生特定按键事件,触发手机采集欲查询的音乐的环境音频数据。
本步骤中,客户端的采集过程可以包括:在监测到信息查询触发事件时,客户端可启动录音功能,录制用户所请求识别的环境音频数据。优选地,所述客户端采集到的环境音频数据为8KHz采样频率、16bit量化的PCM(Pulse-codemodulation,脉冲编码调制)格式的数字音频。
S102,所述客户端将所述环境音频数据传输至服务器进行信息查询。
本步骤中,所述客户端可对采集到的环境音频数据进行处理,并将处理后的环境音频数据传输至服务器进行信息查询。由客户端对采集到的环境音频数据先处理再传输,可有效地减小客户端与服务器之间的传输数据量。
S103,所述客户端获取所述服务器查询到的所述环境音频数据对应的音频文件的属性信息。
其中,所述音频文件的属性信息包括但不限于以下信息中的任一种:音频文件名称、音频文件对应的演唱者信息、音频文件所属的专辑信息、音频文件的链接地址、音频文件的歌词。
S104,所述客户端将所述音频文件的属性信息作为查询结果进行输出。
本步骤可将步骤S103获得的音频文件的属性信息作为查询结果进行输出,用户根据所述查询结果,可获知所请求查询的环境音频数据的完整信息,例如:用户可获知所请求查询的音乐所属的歌曲名称、演唱者、专辑名称、歌词等信息。
本发明实施例的客户端在监测到信息查询触发事件时,自动采集环境音频数据,并将该环境音频数据发送至服务器中进行音频文件的属性信息的查询,查询操作简单快速,无需用户人工输入待查询音频的基本信息,提升了信息查询的效率,同时提升信息查询的有效性和智能性。
请参见图2,为本发明实施例提供的另一种信息查询方法的流程图;本实施例从客户端侧阐述信息查询方法的流程;该方法可包括以下步骤S201-步骤S206。
S201,客户端监测到信息查询触发事件时,采集环境音频数据。本实施例中,步骤S201可参见图1所示实施例的步骤S101,在此不赘述。
S202,所述客户端对所述环境音频数据进行压缩处理,生成数据压缩包。
S203,所述客户端将所述数据压缩包传输至服务器进行信息查询。
本实施例的步骤S201-步骤S203可以为图1所示实施例中的步骤S102的具体细化步骤。步骤S202中,所述客户端对采集到的环境音频数据进行压缩处理,生成数据压缩包,该数据压缩包与压缩处理前的环境音频数据所包含的数据内容相同,但数据压缩包减小了比特和字节总数,从而减小了待传输的数据总量。步骤S203将数据压缩包传输至服务器,可提升数据传输效率;另外,服务器进行信息查询时,对数据压缩包进行解压缩处理即可还原环境音频数据的数据内容,保证信息查询的准确性。
S204,所述客户端获取所述服务器查询到的所述环境音频数据对应的音频文件的属性信息。
S205,所述客户端将所述音频文件的属性信息作为查询结果进行输出。
本实施例中,步骤S204-步骤S205可参见图1所示实施例的步骤S103-步骤S104,在此不赘述。
S206,所述客户端检测到分享操作时,根据所述分享操作将所述音频文件的属性信息分享至目标应用中。
其中,目标应用可以为SNS(Social Networking Services,社会性网络服务)应用,包括:微博、个人空间、互动网站、论坛等SNS应用平台。本步骤中,用户可通过所述客户端输出的查询结果,获知所请求查询的环境音频数据的完整信息,如果用户想要将查询到的信息进行分享,则可以在所述客户端的即时通信应用中执行分享操作,例如:点击所述即时通信应用提供的分享按钮;所述客户端则根据所述分享操作将所述音频文件的属性信息分享至目标应用中。需要说明的是,用户在分享操作中可以指定信息分享的目标应用,本步骤中,所述客户端则将所述音频文件的属性信息分享至用户指定的目标应用中。用户在分享操作中也可以不指定信息分享的目标应用,本步骤中,所述客户端则将所述音频文件的属性信息分享至所述即时通信应用预置的目标应用中。
本发明实施例的客户端在监测到信息查询触发事件时,自动采集环境音频数据,并将该环境音频数据发送至服务器中进行音频文件的属性信息的查询,查询操作简单快速,无需用户人工输入待查询音频的基本信息,提升了信息查询的效率,同时提升信息查询的有效性和智能性。另外,本发明实施例还可进一步将查询到的音频文件的属性信息进行快速分享,提升了社交活动的便捷性。
请参见图3,为本发明实施例提供的又一种信息查询方法的流程图;本实施例从客户端侧阐述信息查询方法的流程;该方法可包括以下步骤S301-步骤S307。
S301,客户端监测到信息查询触发事件时,采集环境音频数据。
S302,所述客户端提取所述环境音频数据的指纹信息。
其中,音频数据的指纹信息指可以代表所述音频数据的重要声学特征,且基于该音频数据内容的紧致数字签名;音频数据的指纹信息要求感知(或内容)相似性,具备区分性、鲁棒性、粒度等基本特征。其中,区分性指不同音频数据的指纹信息应具有较大的差异,而同一音频数据的原始记录的指纹信息和失真记录的指纹信息之间应该具有较小的差异;鲁棒性指音频数据在经历各种音频格式变换、信道噪声干扰等处理后,仍然能够被识别出来;粒度指即使针对短音频(即音频的长度较短,如5s,或5s-10s),也能够顺利识别。另外,音频数据的指纹信息在各种应用场景中,还具备更多的特征,例如:客户端应用场景中,音频数据的指纹信息要求具备易计算性,在计算资源受限的客户端中能够实现快速实时的指纹计算;再如:在无线网络应用场景中,音频数据的指纹信息要求具备数据紧致性,即要求数据量较小,以适应无线网络传输。本步骤中,所述客户端对所述环境音频数据的指纹信息的提取可以采用相应的提取算法进行,该提取算法包括但不限于:基于帧信息特征向量的音频指纹提取算法,或基于峰值特征点的音频指纹提取算法。本步骤提取到的所述环境音频数据的指纹信息可以表示为一个指纹序列,该指纹序列中的每个指纹项可表示为(t,hashcode),其中,hashcode为一个固定比特数的哈希编码,可表征所述环境音频数据的重要声学特征,t指该hashcode出现的时间点。
S303,所述客户端对提取的所述环境音频数据的指纹信息进行压缩处理,生成指纹压缩包。
S304,所述客户端将所述指纹压缩包传输至服务器进行信息查询。
本实施例的步骤S302-步骤S304可以为图1所示实施例中的步骤S102的具体细化步骤。步骤S302中,所述客户端提取所述环境音频数据的指纹信息,所述环境音频数据的指纹信息指代表所述环境音频数据的重要声学特征、且基于所述环境音频数据的内容的紧致数字签名。一般地,所述环境音频数据的指纹信息的数据总量小于所述环境音频数据的数据总量。步骤S303中,所述客户端对提取的所述环境音频数据的指纹信息进行压缩处理,生成指纹压缩包,该指纹压缩包与压缩处理前的指纹信息所包含的数据内容相同,但指纹压缩包减小了比特和字节总数,从而进一步减小了待传输的数据总量。步骤S304将指纹压缩包传输至服务器,可提升数据传输效率;另外,服务器进行信息查询时,对指纹压缩包进行解压缩处理即可获得所述环境音频数据的指纹信息,该指纹信息表征了采集到的原始环境音频数据的数据内容特征,从而可保证信息查询的准确性。
S305,所述客户端获取所述服务器查询到的所述环境音频数据对应的音频文件的属性信息。
S306,所述客户端将所述音频文件的属性信息作为查询结果进行输出。
S307,所述客户端检测到分享操作时,根据所述分享操作将所述音频文件的属性信息分享至目标应用中。
本实施例中,步骤S301、步骤S305-步骤S307可分别参见图2所示实施例中的步骤S201、步骤S204-步骤S206,在此不赘述。
本发明实施例的客户端在监测到信息查询触发事件时,自动采集环境音频数据,并将该环境音频数据发送至服务器中进行音频文件的属性信息的查询,查询操作简单快速,无需用户人工输入待查询音频的基本信息,提升了信息查询的效率,同时提升信息查询的有效性和智能性。另外,本发明实施例还可进一步将查询到的音频文件的属性信息进行快速分享,提升了社交活动的便捷性。
图2所示实施例与图3所示实施例的区别在于:客户端在向服务器传输数据之前,对采集的环境音频数据所执行的处理过程不同。图2所示实施例中,客户端执行的处理过程仅包含对环境音频数据的压缩处理过程;而图3所示实施例中,客户端执行的处理过程包含:对环境音频数据的指纹信息的提取过程,以及对指纹信息的压缩处理过程。采用图2所示实施例,客户端的处理负荷相对较小,适用于处理能力有限的低端客户端;采用图3所示实施例,客户端需要计算环境音频数据的指纹信息,使得客户端的处理负荷相对较大,但可更为有效地降低传输的数据量,提升传输效率。综上,实际应用中可根据实际情况,例如:根据客户端的实际处理能力、或根据网络的带宽资源、或根据用户的选择,灵活选取上述图1-图3所示的任一实施例进行信息查询。
需要说明的是,图1-图3所示实施例中,所述服务器向客户端返回的音频文件的属性信息中,可以包含一个音频文件(例如:一首歌曲、或一段电视节目中的音频片段)的属性信息,也可以包含多个音频文件(例如:多首歌曲、或多个电视节目中的音频片段)的属性信息,当包含多个音频文件的属性信息时,所述客户端可以选择将全部的音频文件的属性信息进行输出,也可以选择部分的音频文件的属性信息进行输出。另外,如果服务器根据客户端发送的环境音频数据未查找到任何与所述环境音频数据相对应的音频文件的属性信息,则可向客户端返回查询失败的提示信息,所述客户端可输出所述提示信息,以提示用户信息查询失败。
请参见图4,为本发明实施例提供的又一种信息查询方法的流程图;本实施例从服务器侧阐述信息查询方法的流程;该方法可包括以下步骤S401-步骤S403。
S401,服务器接收客户端传输的环境音频数据。
本步骤中,所述服务器接收所述客户端传输的数据压缩包,所述数据压缩包为所述客户端对所述环境音频数据进行压缩处理后生成的压缩包;或者,所述服务器接收所述客户端传输的指纹压缩包,所述指纹压缩包为所述客户端对所述环境音频数据的指纹信息进行压缩处理后生成的压缩包。
S402,所述服务器根据所述环境音频数据,从预置数据库中查询与所述环境音频数据相对应的音频文件的属性信息。
所述预置数据库中存储至少一个音频文件的标识、所述至少一个音频文件的指纹信息、以及所述至少一个音频文件的属性信息。本发明实施例中,所述预置数据库中存储的音频文件可以包括:电影中的音频片段、电视剧中的音频片段、电视节目中的音频片段、歌曲、音乐等。其中,音频文件的标识可以用TrackID表示,例如:音频文件1的标识可表示为TrackID-1,音频文件2的标识可表示为TrackID-2;一个TrackID用于唯一标识一个音频文件。其中,音频文件的指纹信息为代表音频文件的重要声学特征、且基于所述音频文件的内容的紧致数字签名。其中,所述音频文件的属性信息包括但不限于以下信息中的任一种:音频文件名称、音频文件对应的演唱者信息、音频文件所属的专辑信息、音频文件的链接地址、音频文件的歌词。
S403,所述服务器向所述客户端返回所述音频文件的属性信息。
所述服务器向所述客户端返回所述环境音频数据对应的音频文件的属性信息,则所述客户端可将此音频文件的属性信息作为查询结果进行输出,使得用户根据所述查询结果,可获知所请求查询的环境音频数据的完整信息。
本发明实施例的服务器在接收到客户端传输的环境音频数据时,基于预置数据库对该环境音频数据进行信息查询,获得环境音频数据对应的音频文件的属性信息并返回给客户端,查询过程在后台服务器进行,且无需用户人工输入待查询音频的基本信息,提升了信息查询的效率,同时提升信息查询的有效性和智能性。
请参见图5,为本发明实施例提供的又一种信息查询方法的流程图;本实施例从服务器侧阐述信息查询方法的流程;该方法可包括以下步骤S501-步骤S506。
S501,服务器接收客户端传输的数据压缩包,所述数据压缩包为所述客户端对环境音频数据进行压缩处理后生成的压缩包。
S502,所述服务器对接收到的数据压缩包进行解压缩处理,获得所述环境音频数据。
可以理解的是,本步骤中,所述服务器对数据压缩包的解压缩处理过程与所述客户端对采集到的环境音频数据的压缩处理过程为相互可逆的过程。经过本步骤处理后获得的环境音频数据,为所述客户端采集到的所述客户端所在环境的环境音频数据,该环境音频数据优选为8KHz采样频率、16bit量化的PCM格式的数字音频。
S503,所述服务器提取所述环境音频数据的指纹信息。
本步骤中,所述服务器对所述环境音频数据的指纹信息的提取可以采用相应的提取算法进行,该提取算法包括但不限于:基于帧信息特征向量的音频指纹提取算法,或基于峰值特征点的音频指纹提取算法。本步骤提取到的所述环境音频数据的指纹信息可以表示为一个指纹序列,该指纹序列中的每个指纹项可表示为(t,hashcode),其中,hashcode为一个固定比特数的哈希编码,可表征所述环境音频数据的重要声学特征,t指该hashcode出现的时间点。
S504,所述服务器从预置数据库中查找与所述环境音频数据的指纹信息相匹配的音频文件的指纹信息。
所述预置数据库中存储至少一个音频文件的标识、所述至少一个音频文件的指纹信息、以及所述至少一个音频文件的属性信息。本步骤中,查找到的相匹配的音频文件的指纹信息可以为:与所述环境音频数据的指纹信息完全相同的音频文件的指纹信息;或者,与所述环境音频数据的指纹信息的相似度达到预设相似度值的音频文件的指纹信息,例如:预设相似度值为90%,若预置数据库中存在一音频文件的指纹信息与所述环境音频数据的指纹信息的相似度达到90%或90%以上,则该音频文件的指纹信息与所述环境音频数据的指纹信息相匹配。
S505,所述服务器获取查找到的相匹配的音频文件的指纹信息所对应的音频文件的属性信息,将获取的所述音频文件的属性信息作为所述环境音频数据相对应的音频文件的属性信息。
S506,所述服务器向所述客户端返回所述音频文件的属性信息。本实施例的步骤S506可参见图4所示实施例中的步骤S403,在此不赘述。
本发明实施例的服务器在接收到客户端传输的环境音频数据时,基于预置数据库对该环境音频数据进行信息查询,获得环境音频数据对应的音频文件的属性信息并返回给客户端,查询过程在后台服务器进行,且无需用户人工输入待查询音频的基本信息,提升了信息查询的效率,同时提升信息查询的有效性和智能性。
请参见图6,为本发明实施例提供的又一种信息查询方法的流程图;本实施例从服务器侧阐述信息查询方法的流程;该方法可包括以下步骤S601-步骤S605。
S601,服务器接收客户端传输的指纹压缩包,所述指纹压缩包为所述客户端对环境音频数据的指纹信息进行压缩处理后生成的压缩包。
S602,所述服务器对接收到的指纹压缩包进行解压缩处理,获得所述环境音频数据的指纹信息。
可以理解的是,本步骤中,所述服务器对指纹压缩包的解压缩处理过程与所述客户端对环境音频数据的指纹信息的压缩处理过程为相互可逆的过程。经过本步骤的处理获得的所述环境音频数据的指纹信息可以表示为一个指纹序列,该指纹序列中的每个指纹项可表示为(t,hashcode),其中,hashcode为一个固定比特数的哈希编码,可表征所述环境音频数据的重要声学特征,t指该hashcode出现的时间点。
S603,所述服务器从预置数据库中查找与所述环境音频数据的指纹信息相匹配的音频文件的指纹信息。
S604,所述服务器获取查找到的相匹配的音频文件的指纹信息所对应的音频文件的属性信息,将获取的所述音频文件的属性信息作为所述环境音频数据相对应的音频文件的属性信息。
S605,所述服务器向所述客户端返回所述音频文件的属性信息。
本实施例中,步骤S603-步骤S605可参见图5所示的步骤S504-步骤S506,在此不赘述。
本发明实施例的服务器在接收到客户端传输的环境音频数据时,基于预置数据库对该环境音频数据进行信息查询,获得环境音频数据对应的音频文件的属性信息并返回给客户端,查询过程在后台服务器进行,且无需用户人工输入待查询音频的基本信息,提升了信息查询的效率,同时提升信息查询的有效性和智能性。
图5所示实施例可对应图2所示实施例,图6所示实施例可对应图3所示实施例。图5所示实施例与图6所示实施例的区别在于:服务器进行信息查询之前所执行的处理过程不同。图5所示实施例中,由于从客户端接收到数据压缩包,服务器执行的处理过程包含对数据压缩包的解压缩处理过程,以及对解压缩获得的环境音频数据的指纹信息的提取过程;而图6所示实施例中,由于从客户端接收到指纹压缩包,服务器执行的处理过程仅包含对指纹压缩包的解压缩处理过程。
需要说明的是,图4-图6所示实施例中,所述服务器向客户端返回的音频文件的属性信息中,可以包含一个音频文件(例如:一首歌曲、或一段电视节目中的音频片段)的属性信息,也可以包含多个音频文件(例如:多首歌曲、或多个电视节目中的音频片段)的属性信息,当包含多个音频文件的属性信息时,所述客户端可以选择将全部的音频文件的属性信息进行输出,也可以选择部分的音频文件的属性信息进行输出。另外,如果服务器根据客户端发送的环境音频数据未查找到任何与所述环境音频数据相对应的音频文件的属性信息,则可向客户端返回查询失败的提示信息,所述客户端可输出所述提示信息,以提示用户信息查询失败。
下面将结合附图7,以一个具体实例来说明本发明的信息查询方法的流程。下述图7所示实例中,假设客户端为手机。
请参见图7a,为本发明实施例提供的信息查询过程的第一示意图;如图7a所示,手机用户正在收看电视节目,想要查询当前播放的电视节目中的音乐对应的音频文件的属性信息时,手机用户使用手机的即时通信应用中的“摇一摇搜歌”的功能,摇晃手机以产生重力感应事件,触发手机采集当前播放的电视节目中的音乐的音频数据。手机对采集到的音频数据进行压缩处理,生成数据压缩包传输至服务器进行信息查询,或手机提取采集到音频数据的指纹信息并进行压缩处理,生成指纹压缩包传输至服务器进行信息查询。服务器基于接收到的数据压缩包或指纹压缩包,从预置数据库中查找所述音频数据对应的歌曲的属性信息并返回至手机。
请参见图7b,为本发明实施例提供的信息查询过程的第二示意图;手机将服务器返回的歌曲的属性信息作为查询结果进行输出,用户可在手机中浏览该音乐的具体信息。
请参见图7c,为本发明实施例提供的信息查询过程的第三示意图;如果用户想要将查询到的信息进行分享,则可以手机的即时通信应用中执行点击分享按钮。请一并参见图7d,为本发明实施例提供的信息查询过程的第四示意图;手机根据用户的分享操作将所述歌曲的属性信息分享至目标应用中。
通过上述实施例的描述,本发明实施例的客户端在监测到信息查询触发事件时,自动采集环境音频数据,并将该环境音频数据发送至服务器中进行音频文件的属性信息的查询,查询操作简单快速,无需用户人工输入待查询音频的基本信息,提升了信息查询的效率,同时提升信息查询的有效性和智能性。另外,本发明实施例还可进一步将查询到的音频文件的属性信息进行快速分享,提升了社交活动的便捷性。
下面将结合附图8-附图10,对本发明实施例提供的客户端的结构进行详细介绍。需要说明的是,下述的客户端可以应用于上述方法中。
请参见图8,为本发明实施例提供的一种客户端的结构示意图;该客户端可包括:采集模块101、查询模块102、信息获取模块103和输出模块104。
采集模块101,用于在监测到信息查询触发事件时,采集环境音频数据。
其中,所述环境音频数据指所述客户端所在环境中的音频数据,可以包括但不限于:电影中的环境音频数据、电视剧中的环境音频数据、电视节目中的环境音频数据、音乐电台播放的环境音频数据或所述客户端所在环境中的人发出的环境音频数据(例如:哼唱的音乐、歌曲片段)等。
其中,所述信息查询触发事件包括:重力感应事件或特定按键事件。所述采集模块101的采集过程可以包括:在监测到信息查询触发事件时,客户端可启动录音功能,录制用户所请求识别的环境音频数据。优选地,所述客户端采集到的环境音频数据为8KHz采样频率、16bit量化的PCM格式的数字音频。
查询模块102,用于将所述环境音频数据传输至服务器进行信息查询。
所述查询模块102可对采集到的环境音频数据进行处理,并将处理后的环境音频数据传输至服务器进行信息查询。所述查询模块102对采集到的环境音频数据先处理再传输,可有效地减小客户端与服务器之间的传输数据量。
信息获取模块103,用于获取所述服务器查询到的所述环境音频数据对应的音频文件的属性信息。其中,所述音频文件的属性信息包括但不限于以下信息中的任一种:音频文件名称、音频文件对应的演唱者信息、音频文件所属的专辑信息、音频文件的链接地址、音频文件的歌词。
输出模块104,用于将所述环境音频数据对应的音频文件的属性信息作为查询结果进行输出。
所述输出模块104可将获得的音频文件的属性信息作为查询结果进行输出,用户根据所述查询结果,可获知所请求查询的环境音频数据的完整信息,例如:用户可获知所请求查询的音乐所属的歌曲名称、演唱者、专辑名称、歌词等信息。
需要说明的是,所述服务器向客户端返回的音频文件的属性信息中,可以包含一个音频文件的属性信息,也可以包含多个音频文件的属性信息,当包含多个音频文件的属性信息时,所述输出模块104可以选择将全部的音频文件的属性信息进行输出,也可以选择部分的音频文件的属性信息进行输出。另外,如果服务器根据客户端发送的环境音频数据未查找到任何与所述环境音频数据相对应的音频文件的属性信息,则可向客户端返回查询失败的提示信息,所述输出模块104可输出所述提示信息,以提示用户信息查询失败。
本发明实施例的客户端在监测到信息查询触发事件时,自动采集环境音频数据,并将该环境音频数据发送至服务器中进行音频文件的属性信息的查询,查询操作简单快速,无需用户人工输入待查询音频的基本信息,提升了信息查询的效率,同时提升信息查询的有效性和智能性。
请参见图9,为本发明实施例提供的另一种客户端的结构示意图;该客户端可包括:采集模块101、查询模块102、信息获取模块103、输出模块104和分享模块105。其中,采集模块101、查询模块102、信息获取模块103和输出模块104的结构可参见图8所示实施例的相关描述,在此不赘述。
分享模块105,用于在检测到分享操作时,根据所述分享操作将所述音频文件的属性信息分享至目标应用中。
其中,目标应用可以为SNS应用,包括:微博、个人空间、互动网站、论坛等SNS应用平台。用户可通过所述客户端输出的查询结果,获知所请求查询的音频的完整信息,如果用户想要将查询到的信息进行分享,则可以在所述客户端的即时通信应用中执行分享操作,例如:点击所述即时通信应用提供的分享按钮;所述分享模块105则根据所述分享操作将所述音频文件的属性信息分享至目标应用中。需要说明的是,用户在分享操作中可以指定信息分享的目标应用,所述分享模块105则将音频文件的属性信息分享至用户指定的目标应用中。用户在分享操作中也可以不指定信息分享的目标应用,所述分享模块105则将音频文件的属性信息分享至所述即时通信应用预置的目标应用中。
本发明实施例的客户端在监测到信息查询触发事件时,自动采集环境音频数据,并将该环境音频数据发送至服务器中进行音频文件的属性信息的查询,查询操作简单快速,无需用户人工输入待查询音频的基本信息,提升了信息查询的效率,同时提升信息查询的有效性和智能性。另外,本发明实施例还可进一步将查询到的音频文件的属性信息进行快速分享,提升了社交活动的便捷性。
请参见图10,为本发明实施例提供的客户端的查询模块的结构示意图;该查询模块102可包括:处理单元1201和查询单元1202。
处理单元1201,用于对所述环境音频数据进行压缩处理,生成数据压缩包;或者,用于提取所述环境音频数据的指纹信息,并对所述环境音频数据的指纹信息进行压缩处理,生成指纹压缩包。
在本发明的一种可行的实施方式中,所述处理单元1201对所述环境音频数据进行压缩处理,生成数据压缩包,该数据压缩包与压缩处理前的环境音频数据所包含的数据内容相同,但数据压缩包减小了比特和字节总数,从而减小了待传输的数据总量。
在本发明的另一种可行的实施方式中,所述处理单元1201提取所述环境音频数据的指纹信息,所述环境音频数据的指纹信息指代表所述环境音频数据的重要声学特征、且基于所述环境音频数据的内容的紧致数字签名。一般地,所述环境音频数据的指纹信息的数据总量小于所述环境音频数据的数据总量。所述处理单元1201对提取的所述环境音频数据的指纹信息进行压缩处理,生成指纹压缩包,该指纹压缩包与压缩处理前的指纹信息所包含的数据内容相同,但指纹压缩包减小了比特和字节总数,从而进一步减小了待传输的数据总量,提升传输效率。
查询单元1202,用于将所述数据压缩包或所述指纹压缩包传输至服务器进行信息查询。
本发明实施例的客户端在监测到信息查询触发事件时,自动采集环境音频数据,并将该环境音频数据发送至服务器中进行音频文件的属性信息的查询,查询操作简单快速,无需用户人工输入待查询音频的基本信息,提升了信息查询的效率,同时提升信息查询的有效性和智能性。另外,本发明实施例还可进一步将查询到的音频文件的属性信息进行快速分享,提升了社交活动的便捷性。
下面将结合附图11-附图12,对本发明实施例提供的服务器的结构进行详细介绍。需要说明的是,下述的服务器可以应用于上述方法中。
请参见图11,为本发明实施例提供的一种服务器的结构示意图;该服务器可包括:接收模块201、查询模块202和信息返回模块203。
接收模块201,用于接收客户端传输的环境音频数据。
所述接收模块201接收所述客户端传输的数据压缩包,所述数据压缩包为所述客户端对所述环境音频数据进行压缩处理后生成的压缩包;或者,所述接收模块201接收所述客户端传输的指纹压缩包,所述指纹压缩包为所述客户端对所述环境音频数据的指纹信息进行压缩处理后生成的压缩包。
查询模块202,用于根据所述环境音频数据,从预置数据库中查询与所述环境音频数据相对应的音频文件的属性信息。
所述预置数据库中存储至少一个音频文件的标识、所述至少一个音频文件的指纹信息、以及所述至少一个音频文件的属性信息。本发明实施例中,所述预置数据库中存储的音频文件可以包括:电影中的音频片段、电视剧中的音频片段、电视节目中的音频片段、歌曲、音乐等。其中,音频文件的标识可以用TrackID表示,例如:音频文件1的标识可表示为TrackID-1,音频文件2的标识可表示为TrackID-2;一个TrackID用于唯一标识一个音频文件。其中,音频文件的指纹信息为代表音频文件的重要声学特征、且基于所述音频文件的内容的紧致数字签名。其中,所述音频文件的属性信息包括但不限于以下信息中的任一种:音频文件名称、音频文件对应的演唱者信息、音频文件所属的专辑信息、音频文件的链接地址、音频文件的歌词。
信息返回模块203,用于向所述客户端返回所述音频文件的属性信息。
所述信息返回模块203向所述客户端返回所述音频文件的属性信息,则所述客户端可将此音频文件的属性信息作为查询结果进行输出,使得用户根据所述查询结果,可获知所请求查询的环境音频数据的完整信息。
需要说明的是,所述信息返回模块203向客户端返回的音频文件的属性信息中,可以包含一个音频文件的属性信息,也可以包含多个音频文件的属性信息,当包含多个音频文件的属性信息时,所述客户端可以选择将全部的音频文件的属性信息进行输出,也可以选择部分的音频文件的属性信息进行输出。另外,如果服务器根据客户端发送的环境音频数据未查找到任何与所述环境音频数据相对应的音频文件的属性信息,则可向客户端返回查询失败的提示信息,所述客户端可输出所述提示信息,以提示用户信息查询失败。
本发明实施例的服务器在接收到客户端传输的环境音频数据时,基于预置数据库对该环境音频数据进行信息查询,获得环境音频数据对应的音频文件的属性信息并返回给客户端,查询过程在后台服务器进行,且无需用户人工输入待查询音频的基本信息,提升了信息查询的效率,同时提升信息查询的有效性和智能性。
请参见图12,为本发明实施例提供的服务器的查询模块的结构示意图;该查询模块202可包括:处理单元2201和查询单元2202。
处理单元2201,用于对接收到数据压缩包进行解压缩处理,获得所述环境音频数据,并提取所述环境音频数据的指纹信息;或者,用于对接收到的指纹压缩包进行解压缩处理,获得所述环境音频数据的指纹信息。
查询单元2202,用于从预置数据库中查找与所述环境音频数据的指纹信息相匹配的音频文件的指纹信息,并获取查找到的相匹配的音频文件的指纹信息所对应的音频文件的属性信息,将获取的所述音频文件的属性信息作为所述环境音频数据相对应的音频文件的属性信息。
本发明实施例的服务器在接收到客户端传输的环境音频数据时,基于预置数据库对该环境音频数据进行信息查询,获得环境音频数据对应的音频文件的属性信息并返回给客户端,查询过程在后台服务器进行,且无需用户人工输入待查询音频的基本信息,提升了信息查询的效率,同时提升信息查询的有效性和智能性。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random Access Memory,RAM)等。
以上所揭露的仅为本发明较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。
Claims (15)
1.一种信息查询方法,其特征在于,包括:
客户端监测到信息查询触发事件时,采集环境音频数据;
所述客户端将所述环境音频数据传输至服务器进行信息查询,并获取所述服务器查询到的所述环境音频数据对应的音频文件的属性信息;
所述客户端将所述音频文件的属性信息作为查询结果进行输出。
2.如权利要求1所述的方法,其特征在于,所述客户端将所述音频文件的属性信息作为查询结果进行输出之后,还包括:
所述客户端检测到分享操作时,根据所述分享操作将所述音频文件对应的属性信息分享至目标应用中。
3.如权利要求1所述的方法,其特征在于,所述信息查询触发事件包括:重力感应事件或特定按键事件;
所述音频文件的属性信息包括以下信息中的任一种:音频文件名称、音频文件对应的演唱者信息、音频文件所属的专辑信息、音频文件的链接地址、音频文件的歌词。
4.如权利要求1-3任一项所述的方法,其特征在于,所述客户端将所述环境音频数据传输至服务器进行信息查询,包括:
所述客户端对所述环境音频数据进行压缩处理,生成数据压缩包;
所述客户端将所述数据压缩包传输至服务器进行信息查询。
5.如权利要求1-3任一项所述的方法,其特征在于,所述客户端将所述环境音频数据传输至服务器进行信息查询,包括:
所述客户端提取所述环境音频数据的指纹信息;
所述客户端对提取的所述环境音频数据的指纹信息进行压缩处理,生成指纹压缩包;
所述客户端将所述指纹压缩包传输至服务器进行信息查询。
6.一种信息查询方法,其特征在于,包括:
服务器接收客户端传输的环境音频数据;
所述服务器根据所述环境音频数据,从预置数据库中查询与所述环境音频数据相对应的音频文件的属性信息;
所述服务器向所述客户端返回所述音频文件的属性信息。
7.如权利要求6所述的方法,其特征在于,所述服务器接收客户端传输的环境音频数据,包括:
所述服务器接收所述客户端传输的数据压缩包,所述数据压缩包为所述客户端对所述环境音频数据进行压缩处理后生成的压缩包;或者,
所述服务器接收所述客户端传输的指纹压缩包,所述指纹压缩包为所述客户端对所述环境音频数据的指纹信息进行压缩处理后生成的压缩包。
8.如权利要求7所述的方法,其特征在于,所述服务器根据所述环境音频数据,从预置数据库中查询与所述环境音频数据相对应的音频文件的属性信息,包括:
所述服务器对接收到的数据压缩包进行解压缩处理,获得所述环境音频数据;
所述服务器提取所述环境音频数据的指纹信息,并从预置数据库中查找与所述环境音频数据的指纹信息相匹配的音频文件的指纹信息;
所述服务器获取查找到的相匹配的音频文件的指纹信息所对应的音频文件的属性信息,将获取的所述音频文件的属性信息作为所述环境音频数据相对应的音频文件的属性信息。
9.如权利要求7所述的方法,其特征在于,所述服务器根据所述环境音频数据,从预置数据库中查询与所述环境音频数据相对应的音频文件的属性信息,包括:
所述服务器对接收到的指纹压缩包进行解压缩处理,获得所述环境音频数据的指纹信息;
所述服务器从预置数据库中查找与所述环境音频数据的指纹信息相匹配的音频文件的指纹信息;
所述服务器获取查找到的相匹配的音频文件的指纹信息所对应的音频文件的属性信息,将获取的所述音频文件的属性信息作为所述环境音频数据相对应的音频文件的属性信息。
10.一种客户端,其特征在于,包括:
采集模块,用于在监测到信息查询触发事件时,采集环境音频数据;
查询模块,用于将所述环境音频数据传输至服务器进行信息查询;
信息获取模块,用于获取所述服务器查询到的所述环境音频数据对应的音频文件的属性信息;
输出模块,用于将所述音频文件的属性信息作为查询结果进行输出。
11.如权利要求10所述的客户端,其特征在于,还包括:
分享模块,用于在检测到分享操作时,根据所述分享操作将所述音频文件的属性信息分享至目标应用中。
12.如权利要求10或11所述的客户端,其特征在于,所述查询模块包括:
处理单元,用于对所述环境音频数据进行压缩处理,生成数据压缩包;或者,用于提取所述环境音频数据的指纹信息,并对所述环境音频数据的指纹信息进行压缩处理,生成指纹压缩包;
查询单元,用于将所述数据压缩包或所述指纹压缩包传输至服务器进行信息查询。
13.一种服务器,其特征在于,包括:
接收模块,用于接收客户端传输的环境音频数据;
查询模块,用于根据所述环境音频数据,从预置数据库中查询与所述环境音频数据相对应的音频文件的属性信息;
信息返回模块,用于向所述客户端返回所述音频文件的属性信息。
14.如权利要求13所述的服务器,其特征在于,所述接收模块接收所述客户端传输的数据压缩包,所述数据压缩包为所述客户端对所述环境音频数据进行压缩处理后生成的压缩包;或者,
所述接收模块接收所述客户端传输的指纹压缩包,所述指纹压缩包为所述客户端对所述环境音频数据的指纹信息进行压缩处理后生成的压缩包。
15.如权利要求14所述的服务器,其特征在于,所述查询模块包括:
处理单元,用于对接收到数据压缩包进行解压缩处理,获得所述环境音频数据,并提取所述环境音频数据的指纹信息;或者,用于对接收到的指纹压缩包进行解压缩处理,获得所述环境音频数据的指纹信息;
查询单元,用于从预置数据库中查找与所述环境音频数据的指纹信息相匹配的音频文件的指纹信息,并获取查找到的相匹配的音频文件的指纹信息所对应的音频文件的属性信息,将获取的所述音频文件的属性信息作为所述环境音频数据相对应的音频文件的属性信息。
Priority Applications (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310042406.1A CN103970793B (zh) | 2013-02-04 | 2013-02-04 | 信息查询方法、客户端及服务器 |
SG11201504973SA SG11201504973SA (en) | 2013-02-04 | 2013-11-26 | Method and system for performing an audio information collection and query |
CA2895964A CA2895964C (en) | 2013-02-04 | 2013-11-26 | Method and system for performing an audio information collection and query |
PCT/CN2013/087827 WO2014117578A1 (en) | 2013-02-04 | 2013-11-26 | Method and system for performing an audio information collection and query |
JP2015555555A JP6228235B2 (ja) | 2013-02-04 | 2013-11-26 | オーディオ情報収集および問合せを実行するための方法およびシステム |
US14/315,250 US9348906B2 (en) | 2013-02-04 | 2014-06-25 | Method and system for performing an audio information collection and query |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310042406.1A CN103970793B (zh) | 2013-02-04 | 2013-02-04 | 信息查询方法、客户端及服务器 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103970793A true CN103970793A (zh) | 2014-08-06 |
CN103970793B CN103970793B (zh) | 2020-03-03 |
Family
ID=51240305
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310042406.1A Active CN103970793B (zh) | 2013-02-04 | 2013-02-04 | 信息查询方法、客户端及服务器 |
Country Status (6)
Country | Link |
---|---|
US (1) | US9348906B2 (zh) |
JP (1) | JP6228235B2 (zh) |
CN (1) | CN103970793B (zh) |
CA (1) | CA2895964C (zh) |
SG (1) | SG11201504973SA (zh) |
WO (1) | WO2014117578A1 (zh) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104866560A (zh) * | 2015-05-18 | 2015-08-26 | 百度在线网络技术(北京)有限公司 | 资源信息分享方法及其终端设备和服务器 |
CN104899318A (zh) * | 2015-06-18 | 2015-09-09 | 上海融视广告传媒有限公司 | 一种基于音频的媒体互动方法 |
CN104902016A (zh) * | 2015-05-19 | 2015-09-09 | 深圳创维-Rgb电子有限公司 | 数据交互的方法、终端和系统 |
CN106484736A (zh) * | 2015-09-01 | 2017-03-08 | 上海亿动信息技术有限公司 | 一种利用移动终端识别影音文件的信息发布方法、装置及系统 |
CN106598967A (zh) * | 2015-10-14 | 2017-04-26 | 北京国双科技有限公司 | 一种快速查询方法及装置 |
CN106909608A (zh) * | 2017-01-09 | 2017-06-30 | 深圳前海勇艺达机器人有限公司 | 基于智能机器人的数据处理方法及装置 |
CN107438961A (zh) * | 2015-06-24 | 2017-12-05 | 谷歌公司 | 使用可听和声传送数据 |
CN107454353A (zh) * | 2017-08-22 | 2017-12-08 | 刘惠敏 | 一种智能自动关闭电视机的方法 |
CN107798561A (zh) * | 2017-10-25 | 2018-03-13 | 网易传媒科技(北京)有限公司 | 音频播放、分享方法及装置、存储介质和电子设备 |
CN107978323A (zh) * | 2017-12-01 | 2018-05-01 | 腾讯科技(深圳)有限公司 | 音频识别方法、装置及存储介质 |
CN110070384A (zh) * | 2015-04-07 | 2019-07-30 | 东芝泰格有限公司 | 销售数据处理装置及其控制方法 |
Families Citing this family (42)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9084058B2 (en) | 2011-12-29 | 2015-07-14 | Sonos, Inc. | Sound field calibration using listener localization |
US9668049B2 (en) | 2012-06-28 | 2017-05-30 | Sonos, Inc. | Playback device calibration user interfaces |
US9106192B2 (en) | 2012-06-28 | 2015-08-11 | Sonos, Inc. | System and method for device playback calibration |
US9706323B2 (en) | 2014-09-09 | 2017-07-11 | Sonos, Inc. | Playback device calibration |
US9690539B2 (en) | 2012-06-28 | 2017-06-27 | Sonos, Inc. | Speaker calibration user interface |
US9219460B2 (en) | 2014-03-17 | 2015-12-22 | Sonos, Inc. | Audio settings based on environment |
US9690271B2 (en) | 2012-06-28 | 2017-06-27 | Sonos, Inc. | Speaker calibration |
US9264839B2 (en) | 2014-03-17 | 2016-02-16 | Sonos, Inc. | Playback device configuration based on proximity detection |
US10133924B2 (en) * | 2014-07-21 | 2018-11-20 | Politecnico Di Torino | Method for fingerprint matching and camera identification, device and system |
US9952825B2 (en) | 2014-09-09 | 2018-04-24 | Sonos, Inc. | Audio processing algorithms |
US9891881B2 (en) | 2014-09-09 | 2018-02-13 | Sonos, Inc. | Audio processing algorithm database |
US10127006B2 (en) | 2014-09-09 | 2018-11-13 | Sonos, Inc. | Facilitating calibration of an audio playback device |
US9910634B2 (en) | 2014-09-09 | 2018-03-06 | Sonos, Inc. | Microphone calibration |
US9930162B2 (en) * | 2014-12-02 | 2018-03-27 | Facebook, Inc. | Techniques for enhancing content on a mobile device |
US10534777B2 (en) * | 2015-03-10 | 2020-01-14 | Cdx Nashville, Llc | Systems and methods for continuously detecting and identifying songs in a continuous audio stream |
US20160316261A1 (en) * | 2015-04-23 | 2016-10-27 | Sorenson Media, Inc. | Automatic content recognition fingerprint sequence matching |
WO2016172593A1 (en) | 2015-04-24 | 2016-10-27 | Sonos, Inc. | Playback device calibration user interfaces |
US10664224B2 (en) | 2015-04-24 | 2020-05-26 | Sonos, Inc. | Speaker calibration user interface |
US9538305B2 (en) | 2015-07-28 | 2017-01-03 | Sonos, Inc. | Calibration error conditions |
CN111314826B (zh) | 2015-09-17 | 2021-05-14 | 搜诺思公司 | 由计算设备执行的方法及相应计算机可读介质和计算设备 |
US9693165B2 (en) | 2015-09-17 | 2017-06-27 | Sonos, Inc. | Validation of audio calibration using multi-dimensional motion check |
US9743207B1 (en) | 2016-01-18 | 2017-08-22 | Sonos, Inc. | Calibration using multiple recording devices |
US10003899B2 (en) | 2016-01-25 | 2018-06-19 | Sonos, Inc. | Calibration with particular locations |
US11106423B2 (en) | 2016-01-25 | 2021-08-31 | Sonos, Inc. | Evaluating calibration of a playback device |
US9860662B2 (en) | 2016-04-01 | 2018-01-02 | Sonos, Inc. | Updating playback device configuration information based on calibration data |
US9864574B2 (en) | 2016-04-01 | 2018-01-09 | Sonos, Inc. | Playback device calibration based on representation spectral characteristics |
US9763018B1 (en) | 2016-04-12 | 2017-09-12 | Sonos, Inc. | Calibration of audio playback devices |
US9860670B1 (en) | 2016-07-15 | 2018-01-02 | Sonos, Inc. | Spectral correction using spatial calibration |
US9794710B1 (en) | 2016-07-15 | 2017-10-17 | Sonos, Inc. | Spatial audio correction |
US10372406B2 (en) | 2016-07-22 | 2019-08-06 | Sonos, Inc. | Calibration interface |
US10459684B2 (en) | 2016-08-05 | 2019-10-29 | Sonos, Inc. | Calibration of a playback device based on an estimated frequency response |
US10440413B2 (en) * | 2017-07-31 | 2019-10-08 | The Nielsen Company (Us), Llc | Methods and apparatus to perform media device asset qualification |
US10872115B2 (en) * | 2018-03-19 | 2020-12-22 | Motorola Mobility Llc | Automatically associating an image with an audio track |
CN108763425B (zh) * | 2018-05-24 | 2021-02-26 | 广州酷狗计算机科技有限公司 | 存储和读取音频文件的方法和装置 |
US11206484B2 (en) | 2018-08-28 | 2021-12-21 | Sonos, Inc. | Passive speaker authentication |
US10299061B1 (en) | 2018-08-28 | 2019-05-21 | Sonos, Inc. | Playback device calibration |
US11126344B2 (en) * | 2019-01-22 | 2021-09-21 | Facebook, Inc. | Systems and methods for sharing content |
US11321388B2 (en) * | 2019-05-10 | 2022-05-03 | Meta Platforms, Inc. | Systems and methods for generating and sharing content |
US10734965B1 (en) | 2019-08-12 | 2020-08-04 | Sonos, Inc. | Audio calibration of a portable playback device |
US10839060B1 (en) * | 2019-08-27 | 2020-11-17 | Capital One Services, Llc | Techniques for multi-voice speech recognition commands |
US11216169B2 (en) * | 2019-10-02 | 2022-01-04 | Facebook, Inc. | Social network interactions |
US11019021B2 (en) | 2019-10-02 | 2021-05-25 | Facebook, Inc. | Social network status |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1592906A (zh) * | 2000-07-31 | 2005-03-09 | 沙扎姆娱乐有限公司 | 用于在强噪声和失真下识别声音和音乐信号的系统和方法 |
CN101271457A (zh) * | 2007-03-21 | 2008-09-24 | 中国科学院自动化研究所 | 一种基于旋律的音乐检索方法及装置 |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6834308B1 (en) | 2000-02-17 | 2004-12-21 | Audible Magic Corporation | Method and apparatus for identifying media content presented on a media playing device |
JP2002215632A (ja) * | 2001-01-18 | 2002-08-02 | Nec Corp | 携帯端末を用いた音楽検索システム、音楽検索方法、および購入方法 |
JP2002258874A (ja) * | 2001-03-01 | 2002-09-11 | Alpine Electronics Inc | 音楽試聴方法、システムおよび情報端末、音楽検索サーバ |
US20030167174A1 (en) * | 2002-03-01 | 2003-09-04 | Koninlijke Philips Electronics N.V. | Automatic audio recorder-player and operating method therefor |
JP2005107617A (ja) * | 2003-09-29 | 2005-04-21 | Sony Corp | 音声データ検索装置。 |
EP1646035B1 (en) * | 2004-10-05 | 2013-06-19 | Sony Europe Limited | Mapped meta-data sound-playback device and audio-sampling/sample processing system useable therewith |
JP4236630B2 (ja) * | 2004-11-30 | 2009-03-11 | 三洋電機株式会社 | コンテンツデータ記録媒体 |
JP4464807B2 (ja) * | 2004-12-08 | 2010-05-19 | 株式会社エクシング | 歌詞表示装置、カラオケシステム、及びコンピュータプログラム |
US7873974B2 (en) * | 2005-09-19 | 2011-01-18 | Sony Corporation | Identification of television programming using a portable wireless device |
US7344084B2 (en) * | 2005-09-19 | 2008-03-18 | Sony Corporation | Portable video programs |
JP4506748B2 (ja) * | 2006-12-13 | 2010-07-21 | ヤマハ株式会社 | コンテンツ再生装置 |
JP2008146587A (ja) * | 2006-12-13 | 2008-06-26 | Sony Corp | 表示装置、表示プログラム、表示方法、画像提供装置、画像提供プログラム、画像提供方法及び記録媒体 |
US8099446B2 (en) * | 2007-12-12 | 2012-01-17 | International Business Machines Corporation | Digital content searching tool |
US8488799B2 (en) * | 2008-09-11 | 2013-07-16 | Personics Holdings Inc. | Method and system for sound monitoring over a network |
US8121586B2 (en) * | 2008-09-16 | 2012-02-21 | Yellowpages.Com Llc | Systems and methods for voice based search |
US20110173185A1 (en) * | 2010-01-13 | 2011-07-14 | Rovi Technologies Corporation | Multi-stage lookup for rolling audio recognition |
US8694533B2 (en) * | 2010-05-19 | 2014-04-08 | Google Inc. | Presenting mobile content based on programming context |
US9124981B2 (en) * | 2012-11-14 | 2015-09-01 | Qualcomm Incorporated | Systems and methods for classification of audio environments |
-
2013
- 2013-02-04 CN CN201310042406.1A patent/CN103970793B/zh active Active
- 2013-11-26 JP JP2015555555A patent/JP6228235B2/ja active Active
- 2013-11-26 SG SG11201504973SA patent/SG11201504973SA/en unknown
- 2013-11-26 WO PCT/CN2013/087827 patent/WO2014117578A1/en active Application Filing
- 2013-11-26 CA CA2895964A patent/CA2895964C/en active Active
-
2014
- 2014-06-25 US US14/315,250 patent/US9348906B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1592906A (zh) * | 2000-07-31 | 2005-03-09 | 沙扎姆娱乐有限公司 | 用于在强噪声和失真下识别声音和音乐信号的系统和方法 |
CN101271457A (zh) * | 2007-03-21 | 2008-09-24 | 中国科学院自动化研究所 | 一种基于旋律的音乐检索方法及装置 |
Non-Patent Citations (3)
Title |
---|
张静等: "采用人声输入的网络音乐检索系统", 《微电子学与计算机》 * |
张静等: "采用人声输入的网络音乐检索系统", 《微电子学与计算机》, no. 05, 20 June 2006 (2006-06-20) * |
金毅等: "基于旋律的音乐检索研究――旋律特征的输入识别", 《现代图书情报技术》 * |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110070384B (zh) * | 2015-04-07 | 2024-03-19 | 东芝泰格有限公司 | 销售数据处理装置及其控制方法 |
CN110070384A (zh) * | 2015-04-07 | 2019-07-30 | 东芝泰格有限公司 | 销售数据处理装置及其控制方法 |
CN104866560B (zh) * | 2015-05-18 | 2018-10-23 | 百度在线网络技术(北京)有限公司 | 资源信息分享方法及其终端设备和服务器 |
CN104866560A (zh) * | 2015-05-18 | 2015-08-26 | 百度在线网络技术(北京)有限公司 | 资源信息分享方法及其终端设备和服务器 |
CN104902016A (zh) * | 2015-05-19 | 2015-09-09 | 深圳创维-Rgb电子有限公司 | 数据交互的方法、终端和系统 |
CN104899318A (zh) * | 2015-06-18 | 2015-09-09 | 上海融视广告传媒有限公司 | 一种基于音频的媒体互动方法 |
CN107438961A (zh) * | 2015-06-24 | 2017-12-05 | 谷歌公司 | 使用可听和声传送数据 |
CN106484736A (zh) * | 2015-09-01 | 2017-03-08 | 上海亿动信息技术有限公司 | 一种利用移动终端识别影音文件的信息发布方法、装置及系统 |
CN106598967B (zh) * | 2015-10-14 | 2020-06-05 | 北京国双科技有限公司 | 一种快速查询方法及装置 |
CN106598967A (zh) * | 2015-10-14 | 2017-04-26 | 北京国双科技有限公司 | 一种快速查询方法及装置 |
CN106909608A (zh) * | 2017-01-09 | 2017-06-30 | 深圳前海勇艺达机器人有限公司 | 基于智能机器人的数据处理方法及装置 |
CN107454353A (zh) * | 2017-08-22 | 2017-12-08 | 刘惠敏 | 一种智能自动关闭电视机的方法 |
CN107798561A (zh) * | 2017-10-25 | 2018-03-13 | 网易传媒科技(北京)有限公司 | 音频播放、分享方法及装置、存储介质和电子设备 |
CN107798561B (zh) * | 2017-10-25 | 2021-08-13 | 网易传媒科技(北京)有限公司 | 音频播放、分享方法及装置、存储介质和电子设备 |
CN107978323A (zh) * | 2017-12-01 | 2018-05-01 | 腾讯科技(深圳)有限公司 | 音频识别方法、装置及存储介质 |
CN107978323B (zh) * | 2017-12-01 | 2022-09-27 | 腾讯科技(深圳)有限公司 | 音频识别方法、装置及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CA2895964A1 (en) | 2014-08-07 |
CA2895964C (en) | 2018-07-10 |
US9348906B2 (en) | 2016-05-24 |
JP6228235B2 (ja) | 2017-11-08 |
US20140310269A1 (en) | 2014-10-16 |
CN103970793B (zh) | 2020-03-03 |
SG11201504973SA (en) | 2015-08-28 |
JP2016513307A (ja) | 2016-05-12 |
WO2014117578A1 (en) | 2014-08-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103970793B (zh) | 信息查询方法、客户端及服务器 | |
US10354307B2 (en) | Method, device, and system for obtaining information based on audio input | |
CN110134829B (zh) | 视频定位方法和装置、存储介质及电子装置 | |
RU2422891C2 (ru) | Система и способ для ускорения поисков в базе данных для множественных синхронизированных потоков данных | |
JP6734946B2 (ja) | 情報を生成するための方法及び装置 | |
CN109656980A (zh) | 数据处理方法、电子设备、装置及可读存储介质 | |
CN111813756B (zh) | 一种日志检索系统、方法、装置、电子设备及存储介质 | |
US9373336B2 (en) | Method and device for audio recognition | |
CN104700836A (zh) | 一种语音识别方法和系统 | |
CN104158945A (zh) | 通话信息获取方法、装置及系统 | |
US8996557B2 (en) | Query and matching for content recognition | |
JP5989781B2 (ja) | モバイル環境における漸進的パターンマッチングのための方法および装置 | |
CN110209921B (zh) | 媒体资源的推送方法和装置、以及存储介质和电子装置 | |
CN111859127A (zh) | 消费数据的订阅方法、装置及存储介质 | |
KR101719926B1 (ko) | 데이터 수집 api를 통해 저장된 이질적인 데이터 간 변환 시스템 및 방법 | |
CN104035943A (zh) | 存储数据的方法及相应服务器 | |
CN108287859B (zh) | 一种多媒体信息检索方法及装置 | |
CN107484015B (zh) | 节目处理方法及装置、终端 | |
CN111427917A (zh) | 搜索数据处理方法及相关产品 | |
CN112788090A (zh) | 一种网络资源传输方法、装置及系统 | |
CN116055762A (zh) | 视频合成方法及装置、电子设备和存储介质 | |
CN107318129B (zh) | 数据处理方法、装置及终端 | |
US20100205626A1 (en) | System and method for identifying and downloading broadcast programming content | |
CN103729441A (zh) | 媒体对象展示方法及装置 | |
CN110275989B (zh) | 多媒体数据处理方法、装置、计算机设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 1199118 Country of ref document: HK |
|
GR01 | Patent grant | ||
GR01 | Patent grant |