CN106063303A - 用于使用音频签名检测来关联移动设备的方法和装置 - Google Patents
用于使用音频签名检测来关联移动设备的方法和装置 Download PDFInfo
- Publication number
- CN106063303A CN106063303A CN201480061064.0A CN201480061064A CN106063303A CN 106063303 A CN106063303 A CN 106063303A CN 201480061064 A CN201480061064 A CN 201480061064A CN 106063303 A CN106063303 A CN 106063303A
- Authority
- CN
- China
- Prior art keywords
- mobile device
- voice data
- audio signature
- audio
- server
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 54
- 238000001514 detection method Methods 0.000 title description 10
- 230000011218 segmentation Effects 0.000 claims description 3
- 238000013459 approach Methods 0.000 description 35
- 230000008878 coupling Effects 0.000 description 28
- 238000010168 coupling process Methods 0.000 description 27
- 238000005859 coupling reaction Methods 0.000 description 27
- 230000000875 corresponding effect Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 238000003860 storage Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 230000001052 transient effect Effects 0.000 description 5
- 230000006399 behavior Effects 0.000 description 4
- 230000002596 correlated effect Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 230000002860 competitive effect Effects 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 238000011017 operating method Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 241001269238 Data Species 0.000 description 1
- 230000000712 assembly Effects 0.000 description 1
- 238000000429 assembly Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000001143 conditioned effect Effects 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000000284 resting effect Effects 0.000 description 1
- 238000009331 sowing Methods 0.000 description 1
- 210000003813 thumb Anatomy 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/50—Network services
- H04L67/51—Discovery or management thereof, e.g. service location protocol [SLP] or web services
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/20—Services signaling; Auxiliary data signalling, i.e. transmitting data via a non-traffic channel
- H04W4/21—Services signaling; Auxiliary data signalling, i.e. transmitting data via a non-traffic channel for social networking applications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Information Transfer Between Computers (AREA)
- Telephonic Communication Services (AREA)
Abstract
一种所公开的操作方法包括从多个移动设备获取音频数据,将音频数据与至少一个已存储的音频签名进行比较,以及将具有包含至少一个已存储的音频签名的音频数据的移动设备分组。所述方法可以进一步包括向已分组的移动设备发送邀请消息,以使每个移动设备都能够将自身关联到群组。所述方法还可以进一步包括向已分组的移动设备提供内容,其中所述内容与至少一个已存储的音频签名相关。存在用于基于音频签名而对移动设备进行分组的各种应用,一个这样的应用与识别社交媒体群组或社区或者移动设备的用户可能感兴趣的其他内容相关。
Description
技术领域
本公开一般地涉及移动设备,更更具体地涉及语音和音频识别,并且更具体地涉及社交网络。
背景技术
人口统计信息被用于各种目的的现代信息系统,范围包括定向市场营销或者广告、土木和市政规划、资金规划以及其他用途。当今,社交媒体平台使得人们能够基于共同的兴趣来形成群组或者团体,这在本质上定义了参与到这样的社交媒体群组或者团体的用户的人口统计。鉴于所谓“大数据”以及相关计算机化平台的出现,人口统计信息可能更具实用性,并且可能导致新的应用并且也可能取决于如何获取和采集这样的信息。
附图说明
图1是根据实施例的服务器与移动设备进行通信以获取有关各种事件的音频样本的框图。
图2是根据实施例的如图1所示的移动设备与服务器之间的消息和信息流的框图。
图3是根据一些实施例的包含在移动设备群组数据库中的示例表。
图4是根据实施例的移动设备的示意性框图。
图5是移动设备的视图,示出根据实施例的服务器基于移动设备提供包含某一音频签名的音频样本来向移动设备发送邀请消息的示例显示。
图6是根据实施例的移动设备的操作方法的流程图。
图7是根据实施例的服务器的操作方法的流程图。
图8是根据实施例的服务器的操作方法的流程图。
图9是根据实施例的服务器的操作方法的流程图。
具体实施方式
所公开的实施例提供用于识别跨时间和位置的多个移动设备的能力,这些移动设备因已接收共同的相似音频数据而被联系在一起。各种实施例包括用于监视移动设备音频输入以识别移动设备音频数据内所包含的音频签名的操作方法,所述音频签名匹配数据库中所存储的音频签名或者匹配从移动设备中的至少一个所获取的音频签名并且可以被用于识别接收相同或相似音频的其他移动设备。因此,人口统计可以基于移动设备的共同的音频配置文件来生成。本领域普通技术人员会想到人口统计信息的各种应用。在一个示例应用中,移动设备用户可以基于发现基于相似的音频签名而可能在给定的兴趣人口统计中的其他移动设备用户来使用社交媒体来进行联系,所述音频签名诸如但不限于媒体文件音频签名或者如本文所定义的其他音频相关“事件”的音频签名。在其他示例应用中,内容可以基于分组被提供给移动设备,其中所述内容与群组相关,或者更具体地与在从移动设备接收的音频数据中检测到的共同的音频签名相关。
在一个实施例中,一种操作方法包括从多个移动设备获取音频数据,将音频数据与至少一个已存储的音频签名进行比较,以及将具有包含至少一个已存储的音频签名的音频数据的移动设备分组。在一些实施例中,所述方法可以进一步包括向已分组的移动设备发送邀请消息,以使每个移动设备都能够将自身关联到群组。在一些实施例中,所述方法可以进一步包括向已分组的移动设备提供内容,所述内容与至少一个已存储的音频签名相关。
在一些实施例中,所述方法可以进一步包括从具有包含至少一个已存储的音频签名的音频数据的每个移动设备获取上下文信息,以及基于上下文信息来细分至少一个移动设备群组。获取上下文信息在一些实施例中可以通过获取来自每个移动设备的音频数据的时间戳信息或者来自提供音频数据的移动设备的位置信息中的至少一个来完成。所获取的位置信息与由相应移动设备采集音频数据的位置相关。在一些实施例中,所述方法可以进一步包括访问数据库以获取至少一个音频签名。
在一些实施例中,所述方法可以进一步包括将至少一个音频签名与事件相关联,在社交媒体平台上为该事件创建群组,以及从社交媒体平台向已分组的移动设备发送邀请消息。将至少一个音频签名与事件相关联在一些实施例中可以通过将至少一个音频签名与现场事件、现场事件的记录版本、现场事件的广播版本或者音频文件的回放中的至少一个相关联来完成。在一些实施例中,一个或多个群组可以基于事件而被细分。例如,群组可以基于来自音频数据的时间戳信息或者来自提供音频数据的移动设备的位置信息来细分,其中所述位置信息与采集音频数据的位置相关。
在另一实施例中,一种操作方法包括从多个移动设备获取音频数据,识别多个移动设备中的至少第一移动设备的音频数据内的音频签名,将多个移动设备中的至少第二移动设备的音频数据与已识别的音频签名进行比较,基于已识别的音频签名与第二移动设备的音频数据的至少一部分之间的匹配在第二移动设备的音频数据内检测已识别的音频签名,以及基于第一移动设备以及第二移动设备在各自对应的音频数据内都具有已识别的音频签名来将第一移动设备以及第二移动设备分组。
在一些实施例中,所述方法可以进一步包括向第一移动设备以及第二移动设备发送邀请消息,其中所述邀请消息将使得第一移动设备与第二移动设备能够使用社交媒体服务器来进行通信。在一些实施例中,所述方法可以进一步包括向第一移动设备以及第二移动设备提供内容,所述内容与已识别的音频签名相关。
所公开的实施例还提出一种服务器,该服务器包括至少一个处理器以及可操作地耦合至该处理器的存储器。所述存储器包括用于由处理器来执行的可执行指令,其中在执行所述可执行指令时处理器可操作为执行本文所述的与服务器相关的操作方法中的任一方法。
现转到附图,图1是服务器105的框图,其可操作为与各种移动设备进行通信以获取有关各种事件的音频样本。根据实施例,服务器105位于诸如因特网110的网络内并且通过因特网连接103而由各种类型的移动设备访问。例如,移动设备群组100具有因特网连接103并且每个能够建立到因特网110以及服务器105的连接以执行根据各种实施例的操作方法。服务器105可以进一步与各种数据库集成或者被可操作地耦合至各种数据库,所述数据库诸如事件签名数据库107、媒体签名数据库109以及移动设备群组数据库115。服务器105可以使用适当的数据库访问协议113来访问各种数据库并且与其进行通信。然而,用于访问各种数据库的数据库访问协议可以在一些实施例中不相同。服务器105也可以访问各种社交媒体或内容服务器111并且与其进行通信。
根据实施例,服务器105包括至少一个处理器106以及非易失性的非瞬态存储器108,其被可操作地耦合到至少一个处理器106。非易失性的非瞬态存储器108存储用于分组应用120的可执行指令(可执行代码)120C。处理器106可操作为访问存储器108并且执行存储在其中的可执行指令120C,以便实施分组应用120的操作方法。
根据实施例,可以访问服务器105的每个移动设备包括始终运行的音频检测系统。始终运行的音频检测系统可操作为检测语音命令并且将那些语音命令以适当的方式作为控制信息路由到移动设备的应用、组件或者因特网,以便提供各种移动设备特征和功能。根据实施例,始终运行的音频检测系统还通过移动设备的因特网连接106将音频数据发送至服务器105。在一些实施例中,移动设备将仅根据需要、周期性地与服务器105建立因特网连接,以便发送音频数据。在其他实施例中,移动设备将一直保持到服务器105的因特网连接,即便移动设备仅可以周期性将音频数据发送至服务器105。
分组应用120从各种移动设备获取音频数据并且对音频数据检查各种音频签名。这可以通过将已接收的音频样本与事件签名数据库107或者媒体签名数据库109中所存储的已知音频签名进行比较或者通过对来自各种移动设备的音频样本进行比较以检测音频签名的匹配模式来完成。移动设备群组数据库115可以由分组应用120用来跟踪主动发送音频数据的各种移动设备,并且基于检测到的音频签名来分配群组。“音频签名”可以是声学指纹,其使得能够进行音频数据库搜索以及对包含在音频数据中的音频样本的识别。用于创建这样的声学指纹以及用于数据库搜索并且与音频数据进行比较的各种技术已为本领域普通技术人员所知,由此在本文中不再对这样的技术进行详述。
移动设备群组数据库115可以被认为是人口统计数据库。也就是说,形成并且跟踪在数据库中的移动设备群组可以被用于提供对移动设备用户的活动的统计洞察。例如,已采集的音频数据可能指示移动设备用户接近无线电或者电视机、在人群中或者消费某个类型的可听媒体内容的日时间。在一个特定示例中,音频数据可能指示在音频广告的收听范围内有多少移动设备用户。本领域普通技术人员根据本公开以及本文提供的示例会想到所公开的实施例的许多其他应用。
事件签名数据库107包含对于各种类型的已知事件的音频签名,先前已针对这些已知事件采集音频数据。声学指纹由此已被生成,以促进可搜索的“事件签名”。例如,事件签名数据库107可以包含对于事件的音频签名,所述事件诸如足球赛(人群噪声或者其他特征性音频)、户外音乐会和室内音乐会、公开演讲事件或者各种其他这样的事件,可以针对这些事件采集和存储音频签名。媒体签名数据库109可以包含与事件签名数据库107的事件中通过诸如电视、无线电、因特网等媒体广播的一些相关联的已存储的音频签名。一个示例可以是在足球赛期间播放的音乐标志等。此外,媒体签名数据库109将包含对于各种媒体文件的音频签名,所述媒体文件诸如但不限于电视节目、电影、音乐会、诸如光盘专辑、MP3文件、MP4文件的歌曲文件或者可以包括音频成分的任何其他类型的媒体文件。
换言之,事件签名数据库107包含在某种程度上被归纳到给定环境的音频签名,而媒体签名数据库109包含更针对媒体内容(诸如但不限于版权所有的音频内容)的音频签名。因此,分组应用120可以检查在音频数据中所接收的音频样本,这是通过将音频样本与存储在事件签名数据库107或者媒体签名数据库109中的音频签名进行比较。
在一些实施例中,分组应用120也可以基于音频样本中所包含的共同的音频签名将来自各种移动设备以及群组移动设备的音频样本进行比较,即便是对于音频签名不存在匹配的数据库条目。此外,在一些实施例中,分组应用120也可以构建事件签名数据库107或者媒体签名数据库109,这是通过生成(从已接收的音频样本)并且存储在地理位置、时间段或者二者的组合共同的音频签名。地理坐标数据以及时间戳可以随同音频数据一起被服务器105获取或者可以基于“上下文请求”而应服务器105请求来获取。也就是说,分组应用120可以包括音频签名生成代码。然而,在一些实施例中,音频签名的生成可以由驻留于服务器105或者个人移动设备上的单独应用来执行。因此,在一些实施例中,移动设备可以在给定的时间和位置将从音频数据创建的音频签名发送至服务器105,而不是将原始的音频数据发送至服务器105。
如果分组应用120在任何移动设备的音频数据内识别已存储的音频签名中的一个,则分组应用120将在移动设备群组数据库115中为该移动设备创建数据库条目。分组应用120可以然后基于由分组应用120识别的分组而执行邀请相应移动设备的用户加入群组的动作。例如,如图1所示的移动设备可以基于移动设备中的每一个已获取包含有关“事件1”的音频签名的音频(并且为服务器105提供音频样本)来与移动设备群组100相关联。然而,在其他实施例中,分组将出于人口统计目的并且不会包括向移动设备发送任何邀请消息或者其他通知。
根据实施例,有关“事件1”的音频签名不必被移动设备在与其他移动设备相同的时间或地点获取才能与移动设备群组100相关联。例如,用户1和用户2可能曾参加现场音乐会(即事件1的现场版本),而用户3可能曾在电视上、因特网上或者通过无线电观看和收听现场音乐会的广播或者记录。也就是说,用户3的移动设备可能曾在与现场音乐会的实际时间和地点不同的时间和不同的位置采样包含事件1的音频签名的音频。根据实施例,分组应用120却仍然会将用户3的移动设备关联为有关事件1的移动设备群组100的潜在成员。分组应用120也可以向用户3的移动设备发送加入移动设备群组100的邀请。换言之,移动设备基于已接收包含类似的音频签名的音频而被分组,而不考虑音频在何地或者何时被移动设备接收。在图2中提供示例的移动设备200与服务器105之间的消息和信息流的示例。
各种音频源117可以向示例的移动设备200提供声波118。示例的音频源117包括但不限于音乐会、会议、集会、电视广播、无线电广播、因特网广播或者经由媒体文件播放器、因特网等的媒体文件回放。因此,由各种音频源117所提供的声波118可以包含有关“事件”(音乐会、电视广播、体育赛事、政治集会、电视节目、研讨会、电影、夜总会、派对、宗教仪式、教室、公共汽车旅行、婚礼等)的音频签名或者有关媒体文件的音频签名。
在一个示例中,对应于声音标志或者音乐模式的音频签名可以被存储在事件签名数据库107或者媒体签名数据库109上。例如,可以存储对应于在足球赛开始时所使用的音乐模式或片段的音频签名,诸如广播的介绍。该介绍性音乐模式可以在周日被移动设备200接收并且被可能位于全国各地的其他移动设备接收。移动设备200会经由因特网连接103将音频数据121发送至服务器105,该音频数据121包括具有对于音乐模式的音频签名的全部或者一部分的音频样本。分组应用120可以然后将移动设备的音频数据121与事件签名数据库107以及媒体签名数据库109中所包含的音频签名进行比较。在检测到匹配的音频签名后,分组应用120可以通过上下文请求123来请求上下文信息。移动设备200可以然后提供上下文信息125,该上下文信息125可以包括位置信息,诸如GPS坐标。在其他实施例中,时间戳、位置戳或者这二者可以随同音频数据121一起被提供。也就是说,在一些实施例中,上下文信息125可以被自动提供,而不需要上下文请求123。然而,在一些实施例中,移动设备200的隐私设置可以确定这样的上下文信息125是否被发送至服务器105,其中上下文信息125可以自动地或者响应于上下文请求123而被发送。
而且,在检测到匹配的音频签名之后,分组应用120可以对移动设备群组数据库115检查与音频签名有关的现有群组或者可以创建新的群组。移动设备200将被添加至分组表300,其被用于跟踪已检测到的音频签名,使得群组可以被创建并且在一些实施例中群组邀请可以被发送至适当的移动设备。因此,如果在移动设备群组数据库115中存在或者创建群组,则在一些实施例中可以从服务器105向移动设备200发送邀请消息127,使得移动设备200的用户可以加入群组。
群组可以是有关各种社交网络服务器111中的一个的“社区”或者可以与一些其他人口统计信息的确定相关。因此,在示例中,对于的粉丝或者对于已知曾在检测到音频签名匹配者的特定日进行比赛的特定足球队的粉丝,社交网络服务器上可以存在社区。在该示例中,基于由移动设备200所获取的与音频签名相关的邀请消息127因此可以被发送并且因此可以包括有关虚拟社交社区的信息。
因此,在各种实施例中,移动设备包括始终运行的音频检测系统,以监听匹配数据库中所存储的音频签名的音频签名。当由服务器105识别匹配的音频签名时,移动设备被添加至群组表300并且可以被置入现有群组或者待定群组(即等待预先指定数目的成员等)中。在一些实施例中,对于现有群组,可以向移动设备发送邀请消息,移动设备可以在低功耗模式下显示该邀请消息,而不唤醒移动设备。在这样的实施例中,基于所显示的邀请消息,移动设备的用户可以选择加入群组或者社区或者接收内容。例如,加入给定的群组或社区使得用户能够与正在收听相同的广播、媒体文件等或者对其有些兴趣的其他移动设备所有者交互。换言之,移动设备始终运行的音频检测系统被用于通过监视环境音频并且在设备之间查找音频签名匹配者来识别参与共同事件或者具有共同兴趣的用户。加入群组或社区可以要求用户在托管群组或社区或者提供相关内容的社交媒体或者内容服务器111中的一个上具有账户。
在一些实施例中,移动设备可以采样并且存储用于以预定间隔上传到服务器105的音频,诸如存储在存储器的高速缓存中。服务器105可以访问社交媒体或者内容服务器111的一个或多个社交媒体服务器以初始地使用诸如但不限于或者其他社交联络的平台来创建群组,使得移动设备的用户可以选择加入群组或“虚拟社区”并且与其共享评论、评级、图像等。上下文信息125可以包括位置数据,该位置数据可以被服务器105用来为具有某个预定接近或者物理地存在于“事件”处或存在于诸如某一国家、城市等给定地理区域内的移动设备创建分组关联。上下文信息125可以由此被用于在其与地理相关时采集人口统计信息。服务器105可以仅考虑移动设备基于正在参与相同事件的用户的所需最少数目的预定阈值来形成潜在的“群组”。一旦达到阈值,服务器105可以继续向移动设备发送加入相关社区或者访问来自内容服务器等的相关内容的邀请消息127。移动设备的用户可以然后选择加入群组或社区或者访问相关内容。因此,各种实施例的操作方法能够将在不同位置参与相同事件或者具有相同兴趣(对音乐、体育运动等的品位)的人们联系起来,而不考虑用户“听到”与群组相关的音频签名的时间或者位置。在其他实施例中,所述操作方法能够基于相关兴趣来使能内容传递。本领域普通技术人员根据本公开以及本文提供的示例可以想到实施例的其他应用。
在图3中示出存储在移动设备组数据库115中的分组表300的示例细节。服务器105可以使用分组表300以在其从每个移动设备接收到各自对应的音频数据时跟踪各种移动设备。示例分组表300包括列321,包括“移动设备ID”、“音频签名ID”、“上下文数据”以及“群组匹配者ID”。移动设备ID列提供对相应移动设备的用户的设别,使得可以最终将邀请消息发送至该移动设备。然而,在一些实施例中,音频数据可以在没有除时间戳、位置信息或者二者之外会具体识别用户的信息的情况下被采集。也就是说,出于人口统计信息目的,可能不需要对移动设备用户的特定身份。然而,一些唯一识别号可以被分配给移动设备,以便辨识移动识别,以防分组表300中的数据的重复条目。示例行323示出对于“用户1”的示例信息。可以为由分组应用120在用户1的移动设备的音频数据内检测到的特定音频签名分配音频签名ID。基于音频签名ID,如果音频签名匹配对于给定组的音频签名,则如图所示,行323将包括群组匹配者ID。示例的音频签名ID以及群组匹配者ID都出于说明目的被示为十六进制值,但能够是可以被用作识别符的任何类型的计算机可存储值。在一些实施例中,服务器105的分组应用120可以从给定的移动设备中请求上下文信息。该信息会然后作为上下文数据被存储在上下文数据字段中,如图所示,该上下文数据字段可以包括GPS坐标、对应于音频签名的日期和时间戳以及诸如来自移动设备的日程表条目的其他信息。然而,在其他实施例中,诸如时间戳、位置信息或者二者等的一些上下文信息可以被与音频数据一起包括,由此毋须由服务器105特别请求。
一些移动设备可以在分组表300中具有多个行条目。例如,用户1具有对于尚未具有群组匹配者ID的已识别音频签名的第二行325条目。例如,如果尚未发现阈值数目的用户具有匹配的音频签名ID或者出于其他原因,诸如就用户发起群组的情况下,则可能出现这一情况。在一些实施例中,用户可以定义群组并且然后提供有关对于已定义群组的“事件”的音频数据。例如,在对于用户1的行325中的音频签名ID可以是这样的音频签名。在该示例中,如果音频签名尚不存在,则可以通过驻留于移动设备或者服务器105上的应用来生成音频签名。群组匹配者ID则可以处于保持状态,直至识别出具有匹配的音频签名的至少另一个移动设备或者某个阈值数目的移动设备。分组表300的条目由此继续至对于“N”个用户移动设备的行327。在一些实施例中,移动设备的行条目可以出于各种原因被从分组表300中删除,诸如在由服务器105将邀请消息发送至该移动设备之后。
在图4中提供示出移动设备200的示例细节的示意性框图。根据实施例,移动设备200包括音频监视器227。音频监视器227可以被实现为在一个或多个处理器上执行的软件或者固件(或者软件和固件的组合),并且也可以包括或者可以被使用ASIC(专用集成电路)、DSP(数字信号处理器)、硬布线电路(逻辑电路)或其组合独立实现。也就是说,音频监视器227可以使用ASIC、DSP、在处理器上执行的可执行指令、逻辑电路或其组合来实现。
在图4的示例中,音频监视器被实现为存储在存储器203中并且可由处理器201来执行的可执行指令227C。内部连接总线205提供处理器201与其他各种移动设备200的组件之间的可操作性耦合。如本文所用,当能够在组件之间发送信息时,即便在其间或者沿连接路径可能存在一个或多个中间或中介组件,这样两个组件也可以是“可操作地耦合”。因此,连接至内部连接总线205的各种组件中的任一组件在此可以被理解成被可操作地耦合至处理器201或者在适当的情况下理解成彼此可操作地耦合。在实现为在处理器上执行的软件或者固件的模块或者组件之间也可能存在可操作地耦合,并且这样的“软件耦合”可以使用库或应用编程接口(API)或者在适当的情况下使用其他软件接口技术来实现。在图4中将这样的库或者AP I图示地示出为提供图4中的各种软件实现模块或者组件之间的可操作地耦合。
存储器203是非易失性的非瞬态存储器,并且存储对应于音频监视器227的可执行指令227C、对应于语音识别引擎229的可执行指令229C、对应于一个或多个无线协议栈231的可执行指令231C、对应于一个或多个应用233的可执行指令233C、因特网协议(IP)栈(未示出)、移动设备操作系统(未示出)、用于实现各种API的库(未示出)以及音频数据235,在将其发送至服务器105之前可以不时地存储该音频数据235。处理器201可操作为访问存储器203并且执行存储在存储器203中的已存储的可执行指令227C、229C、231C、233C,以执行本文所公开的操作方法以及执行诸如运行移动设备200的操作系统等的其他功能和操作。
移动设备200包括可操作地耦合至配置和预处理逻辑221的一个或多个麦克风225(诸如麦克风阵列)以及扬声器223。配置和预处理逻辑221可以包括模数转换器(ADC)、数模转换器(DAC)、回音消除、高通滤波器、低通滤波器、带通滤波器、可调带通滤波器、降噪滤波、自动增益控制(AGC)以及可以被应用于从使用一个或多个麦克风225接收的音频中滤除噪音的其他音频处理。配置和预处理逻辑221可以是如图4所示的单个组件或者可以被部分实现为硬件并且部分实现为由处理器201来执行的软件或固件。在一些实施例中,配置和预处理逻辑221可以使用几个硬件组件来实现,并且也可以利用以各种组合形式的一个或多个软件或固件组件。配置和预处理逻辑221可以操作为控制一个或多个麦克风225,以打开或关闭某些麦克风或者针对各种应用来调节滤波或增益。
无线收发器207可以为诸如但不限于Wi-Fi蜂窝、2G、3G或4G无线通信系统的一个或多个广域网络通信系统提供无线通信能力,并且还提供通过无线接口的因特网连接103,以与服务器105进行通信。在一些实施例中,移动设备200中也可以存在第二无线收发器209。第二无线收发器209可以是端对端收发器,并且可以提供无线连接能力,诸如但不限于BluetoothTM、无线USB、ZigBee或者其他技术等。在一些实施例中,第二无线收发器209也可以提供因特网连接103。移动设备200的一些实施例也可以包括近场通信(NFC)逻辑211,其可操作为与外部NFC设备进行通信,以提供信息或将信息读入移动设备200内。
位置检测逻辑213可以包括全球定位系统(GPS)硬件,并且可操作为将诸如但不限于GPS坐标的位置坐标数据提供至处理器201以及各种应用233。用户接口(UI)217可以包括跟踪球式鼠标、触敏元件、物理开关、陀螺仪式位置传感器等。UI 217传感器中的一些可以被包括在传感器组220内。在一些实施例中,传感器220可以被可操作地耦合至传感器中枢219,其中该传感器中枢219进一步被可操作地耦合至内部连接总线205。传感器中枢219可以操作为为由各种传感器220接收的数据提供监视和数据转换功能并且将传感器数据提供至处理器201。例如,传感器220中的一些可以由UI 217用于接收用户输入。例如,传感器220可以包括陀螺仪式位置传感器或者加速计,其被用于确定移动设备200的位置,以当用户将移动设备200移至各种位置时便于各种应用233的各种形式的用户输入。在一个示例中,显示器215可以通过感测移动设备200的位置呈水平还是竖直而被调节。传感器220也可以包括热传感器以及可以由处理器201或者各种应用233用于调节移动设备200的参数或者出于其他目的的其他传感器。显示器215可以提供触摸屏能力,其作为UI 217的一部分,并且也可以提供与移动设备操作系统相关的图形用户界面(GUI)、与一个或多个移动设备应用233相关的GUI或者二者。显示器215可以由此被认为是UI 217的一部分,原因在于其可以操作为接收命令并且直接通过触摸来控制信号。
音频监视器227可操作为从配置和预处理逻辑221获取音频样本并且不时地将音频样本发送至服务器105。音频样本可以作为音频数据235被存储于存储器203中,直至可以将音频数据235发送至服务器105的预定的时间间隔为止。音频监视器227可以在由处理器201执行的IP协议栈(未示出)的应用层处操作,以促进IP通信。API 245使得音频监视器227能够与一个或多个无线协议栈231进行通信,以使用无线收发器207或者无线收发器209通过无线接口向服务器105发送音频数据235以及自其接收请求消息。诸如API 243的其他API使得语音识别引擎229能够使用无线收发器207或者无线收发器209通过网络发送语音识别信息。诸如但不限于web浏览器、电子邮件程序等的一个或多个应用233也可以经由API 237与因特网或者其他网络进行无线通信。API 241实现由语音识别引擎229对各种应用233使能语音控制和命令,并且也可与移动设备操作系统(未示出)进行交互。在一些实施例中,音频监视器227也可以通过API 239向语音识别引擎229提供信息或者自其接收信息。即使当移动设备200被置为诸如休眠状态的低功率模式时,音频监视器227也可以运行,并且可以依照由语音识别引擎229检测的语音命令来唤醒移动设备200。音频监视器227以及语音识别引擎229在一些实施例中可以被集成于单个组件,使得无需API 239。在一些实施例中,音频监视器227可以包括音频签名生成工具,其能够从一个或多个音频样本生成音频签名。音频监视器227在该情况下可以将已生成的音频签名发送至服务器105,而不是发送全部的一个或多个音频样本。服务器105可以然后将已生成的音频签名存储在数据库中并且在其他移动设备的音频数据中搜索音频签名。下面参照图6至图9的流程图来描述音频监视器227的操作方法的示例。
移动设备200的上述组件中的任一组件可以被实现为在一个或多个处理器上执行的软件或固件(或者软件和固件的组合),或者使用ASIC、DSP、硬布线电路(逻辑电路)、FPGA(现场可编程门阵列)或其组合来实现。因此,如图4所示的移动设备200是移动设备的一个示例,而不应被理解为对可以根据各种实施例来使用的各种其他可能移动设备的实施方式作出限制。
各种实施例除存储器108或者存储器203以外还包括非易失性的非瞬态计算机可读存储器,其可以包含用于由至少一个处理器来执行的可执行指令(即可执行代码),所述指令当被执行时使得至少一个处理器根据本文所述的功能和操作方法来操作。计算机可读存储器可以是任何适合的非易失性的非瞬态存储器,诸如但不限于诸如EEPROM的可编程芯片、闪速ROM(拇指驱动器)、压缩盘(CD)、数字影音光盘(DVD)等,其可以被用于将可执行指令或者程序代码加载到其他处理设备,诸如服务器、移动设备或者其他设备,诸如可以得益于本文所述实施例的特征的那些设备。例如,可执行指令120C或者可执行指令227C可以被存储于上述形式的计算机可读存储器等中的任一存储器上。
图5的视图提供根据实施例的可以由服务器105发送至移动设备200的邀请消息的一个示例。本领域普通技术人员会理解的是,根据各种实施例,可以发送各种其他形式的通知,诸如但不限于文本消息、电子邮件消息或者其他类型的通知,并且可以使用各种其他社交媒体平台、内容服务器等。也就是说,由图5提供的示例不应被理解为对根据各种实施例可以被用于邀请移动设备的用户加入群组的特定类型的邀请消息或者邀请机制作出任何限制。
按照图5的示例,移动设备200已通过其一个或多个麦克风接收音频并且已取样音频以获取音频数据。图5中的移动设备200的示例还已经周期性地将音频数据发送至服务器105,以便分组应用120查找匹配的音频签名。由分组应用120检测匹配存储在事件签名数据库107或媒体签名数据库109内的已存储的音频签名或者匹配在给定时间位于给定位置的其他移动设备音频签名的音频签名。例如,参加“Google I/O”事件的用户可以已携带各种移动设备。在该情况下,分组应用120可以已经与已具有与Google I/O事件相关联的群组的一个或多个社交媒体或者内容服务器111交互。分组应用120可以已在从各种移动设备的音频监视器227接收到的音频数据中检测到与对于会议的事件签名相匹配的音频签名,例如基于各种移动设备音频数据中所包含的人群噪音音频签名匹配在事件签名数据库107中所包含的会议人群噪音数据签名。
基于检测到人群噪音音频签名,分组应用120可以已请求并且接收“上下文信息”,该上下文信息可以依据音频监视器227的个体移动设备隐私设置而包括移动设备约会表、位置信息或者二者。在一些实施例中,分组应用也可以连同音频数据以及时间戳信息一起从移动设备接收位置信息并且因此可以作出移动设备存在于Google I/O事件处的推断。换言之,分组应用120可以假设或推断,由于移动设备处于Google I/O事件的位置坐标处或者附近并且已发送具有在事件的已知时间或期间的时间戳的匹配的音频签名,所以这样的移动设备可能存在于Google I/O事件处。
因此,邀请消息301可以被移动设备200接收并且被显示。示例的邀请消息301是通知消息并且可以包括群组或社区名称303。在其他实施例中,邀请消息301可以提供指向与事件相关的内容的链接,所述内容诸如但不限于议程、地图、调度、优惠券、广告或者其他内容等。初始地,在一些实施例中,仅有分组查询313可以被示出,这允许用户选择分组查询313来作出响应或者获取进一步信息。也就是说,用户可以看见诸如“参见Google I/O?”的查询。用户可以然后作出对于分组查询313的选择并且可以响应“是”或“否”。如果用户响应“否”,则分组查询313会从移动设备200的显示消失。然而,如果用户回答“是”,则进一步的通知消息可以出现在移动设备200的显示上。分组查询313也可以在某个时间段之后(诸如在会议闭幕之后)期满,并且可以在那时被自动从移动设备200删除或清除。
邀请消息301可以初始地仅显示群组或社区名称303并且可以通过点击展开-收缩箭头305而可展开。展开邀请消息301可以展示群组描述307以及与群组相关联并且可以对应于与邀请消息301相关联的社交媒体平台的散列标签309。“加入”按键311也可以被显示以使用户能够加入群组或社区。如果用户不希望加入群组或社区,则用户可以关闭邀请消息301,例如通过再次选择展开-收缩箭头305,并且也可以使用本领域普通技术人员公知的操作方法来清除邀请消息301。在设置的时间段之后或者由于用户未能对邀请作出行动等,邀请消息301也可以根据已知操作方法被自动删除。
因此,根据实施例,服务器105从各种移动设备获取音频数据并且基于音频签名来确定特定用户参与特定事件的概率。这些“事件”可能在任何时间发生在许多不同位置。如前所述,事件的示例包括但不限于现场电视广播、预记录的电视广播、电影、演讲或者收听这些事件的记录媒体文件或诸如电影、音乐、视频、演讲等其他记录。可以采用各种操作方法来检查哪些设备正在“听”来自相同事件的音频。例如,在一些实施例中,已知位于事件(诸如音乐会、体育赛事、演讲、集会等)附近的移动设备可以全部被用来在同步时间以低功率模式收听音频,并且然后将音频数据上传至服务器105,以便与来自其他移动设备的那些音频数据进行比较。如果检测到匹配的音频签名,则提供匹配音频的移动设备可以被包括在新的事件组内或者被邀请到群组中。换言之,服务器105可以将命令消息发送至移动设备200中的音频监视器227,以命令音频监视器227在某个时间开始并且在某个时间段内采集音频数据。
例如,跨时区的现场电视事件可以要求移动设备全部在对于相关时区的特定时间采集音频数据并且将音频数据上传到服务器105,使得分组应用120可以检查匹配的音频签名。如上所讨论,音频数据可以与从在相同的时间记录或者采样的音频数据生成并且提供给服务器105的已知的音频签名进行比较。例如,服务器105可以知道,在给定时区的给定广播时间,电视节目包含在给定秒数内具有给定音频签名的音频。因此,可以将具有适当时间戳的移动设备音频数据与已知的音频签名进行比较,以试图找到匹配者。可以然后向在其相应音频数据中具有匹配的音频签名的移动设备发送到关于对给定电视节目感兴趣的群组的邀请消息。
在其他实施例中,如果服务器105基于显示移动设备正高速行驶的位置信息或者其他上下文信息来确定给定的移动设备位于汽车或者其他车辆内,则移动设备可以被用来收听给定音乐的音频签名。在该情况下,移动设备可以接收群组邀请,其中用户被发现正在收听相同的歌曲。
服务器105可以使用各种标准来确定何时形成移动设备群组。例如,在一些实施例中,服务器105可以仅在从某个阈值数目的移动设备获取匹配的样本时才定义并且形成移动设备群组。所形成社区的移动设备群组可以利用任何形式的社交媒体,诸如但不限于社交“社区”、社交话题分类(诸如的话题标签等)、包括诸如但不限于Hangouts的视频聊天室的聊天室或者其他社交媒体平台等。由服务器105发送的邀请消息可以是但不限于移动设备通知、电子邮件、文本消息、社交网络邀请消息等。
此外,在一些实施例中,基于用户使用移动设备在(社交媒体或内容服务器111的)社交媒体平台上设立社交群组或社区,用户可以发起音频数据采集。在该情况下,可以用来自音频监视器227的确认消息提示用户,请用户确认开始音频采集以找到并且邀请参加会议、收听某一歌曲或者参与任何其他数目的可能“事件”的其他用户。在用户确认后,用户的移动设备可以然后开始采集音频数据并且将其发送至服务器105,使得服务器105可以生成音频签名或者识别现有的音频签名并且可以基于匹配的音频签名来搜索具有相同兴趣的其他移动设备用户。
在图6至图9中提供移动设备200的音频监视器227以及服务器105上的分组应用120的示例操作方法。图6是根据实施例的移动设备200的操作方法的流程图。操作方法开始,并且在操作块601中,移动设备200开始通过音频监视器227来监视音频,该音频监视器227即使在移动设备200处于诸如休眠模式的低功率状态时也可以操作。在操作块603中,移动设备200使用无线收发器207或者无线收发器209将包含音频样本的音频数据发送至服务器105。在操作块605中,移动设备200基于监视的音频来接收通知形式的邀请消息并且可以在显示器215上显示通知。邀请消息可以使得移动设备能够加入社交媒体社区、接收内容等。然后操作方法结束。
图7是根据实施例的服务器105的操作方法的流程图。在操作块701中。服务器105从各种移动设备接收音频样本。在操作块703中,服务器105以及驻留于其上的分组应用120将已接收的音频样本与各种数据库中所包含的音频签名进行比较,所述数据库诸如但不限于事件签名数据库107或媒体签名数据库109或者包含音频签名的某个其他的数据库。如操作块705中所示,分组应用120也可以比较各种移动设备的音频样本以确定这样的移动设备是否可能存在于相同的事件处。因此,如前所讨论,服务器105可以从移动设备接收其他信息,诸如位置数据、时间戳数据或者二者,以助于基于音频签名来作出分组确定。在操作块707中,服务器105将通知发送至被认为正参与类似事件的移动设备,这通过在其相应音频数据中所包含的音频签名来确定。在操作块709中,基于推断移动设备参与相同的事件,服务器105将通知消息发送至移动设备。如图所示,然后操作方法结束。
图8是根据实施例的服务器105的操作方法的流程图。操作方法开始,并且在操作块801中,服务器105从移动设备群组获取音频样本。如所示,在操作块803中,然后对从移动设备获取的音频样本进行比较。在判定块805中,服务器105试图确定移动设备中的任一个是否在其音频数据内具有类似的音频签名,使得具有匹配的音频签名的移动设备可能存在于相同的事件处。如果不是,则操作方法返回至操作块801并且继续从移动设备获取具有音频样本的音频数据。如果在判定块805中发现类似或匹配的音频签名,则在操作块807中,服务器105可以对给定的移动设备作出请求,以在附加的上下文信息可用时获取这样的上下文信息。
在判定块809中,服务器105然后评估上下文信息以确定移动设备之间是否存在上下文信息的匹配(诸如位置匹配、时间戳匹配等)。如果不是,则服务器105可以如操作块811中所示仅基于共同的事件来分组移动设备,并且如操作块817中所示可以继续向移动设备发送邀请消息,邀请移动设备加入群组。如图所示,然后操作方法结束。否则,如果在判定块809中发现上下文信息的匹配,则操作方法继续至操作块813。在操作块813中,服务器105基于共同的事件并且也基于共同的上下文信息来分组移动设备。在操作块815中,服务器105可以根据需要针对上下文差异来进行调整。例如,一些移动设备上下文信息可以指示用户实际上正在参与现场事件,诸如音乐会。然而,其他移动设备上下文信息可以指示用户仅在收听曾在现场音乐会中播放的歌曲记录。例如,歌曲可以是在用户家内的立体声音响系统上播放的MP3文件。在该情况下,对于仅收听特定歌曲的人,而不是曾参加现场音乐会的人群,分组应用120可以设立单独的群组,或者可以设立子群组。换言之,分组应用120可以使用上下文信息来为接收到相同音频签名的移动设备创建多于一个群组。操作方法然后继续至操作块817,其中服务器105将邀请消息发送至移动设备。如图所示,然后操作方法结束。
图9提供服务器105以及分组应用120的另一示例操作方法。如前所讨论的,服务器105的分组应用120可以与各种社交媒体或者内容服务器111进行交互。在一些实施例中,服务器105可以与社交媒体或者内容服务器111进行交互,如操作块901中所示,以检测或者接收在社交媒体平台中所定义的群组或社区的通告,或者识别与事件相关联的内容。此外,在一些实施例中,移动设备用户可以在社交媒体或者内容服务器111中的一个上定义群组或社区。在该情况下,该移动设备的音频监视器227可以将已定义群组或社区或者可获得内容的通告提供至服务器105。在服务器105在操作块901中注意到已定义的群组或社区以及相关的社交媒体平台或内容服务器之后,操作方法继续至判定块903。服务器105从各种其他移动设备获取音频数据,并且如果在判定块903中存在已知的音频签名,则如操作块907中所示,服务器105会将已获取的音频样本与来自适当数据库的那个已知的音频签名进行比较。一种示例使用情况可以涉及已知的媒体文件,其中对于已知媒体文件的音频签名被包含在适当的数据库中并且能够由此被服务器105访问和获知。在该情况下,在社交媒体平台中定义的社交媒体群组或社区可以与服务器105的现有音频签名相关联。然而,在其他实施例中,如前所述,在操作块901中,移动设备用户可以定义社交媒体群组或社区。由此在判定块905中,服务器可以确定其是否正在处理移动设备发起的群组或社区。如果是,则在操作块911中,服务器105可以从发起的移动设备获取音频样本。例如,服务器105可以将消息发送至相应移动设备的音频监视器227,使得移动设备会将消息显示给移动设备用户,请求确认开始获取音频样本。在操作块911中,用户可以对查询进行响应,使得移动设备音频监视器227可以在特定时间和地点获取音频样本并且将那些音频样本发送至服务器105。在操作块915中,服务器105可以然后将从其他移动设备获取的音频样本与从发起的移动设备获取的音频样本进行比较。
然而,如果在判定块905中服务器105确定群组或社区不是移动设备发起的群组,则操作方法继续至操作块913。在操作块913中,服务器105可以基于诸如位置数据和时间的上下文信息从移动设备获取音频样本。在操作块917中,服务器105可以然后将从各种移动设备获取的音频样本相互进行比较。无论在判定块905中群组或社区是否是“移动设备发起”的,操作方法最终都继续至判定块919,其中服务器105确定移动设备音频签名是否匹配。如果没有发现音频签名匹配,则操作方法返回至判定块905并且相应地继续进行。然而,如果在判定块919中发现移动设备音频签名匹配,则操作方法继续至操作块921。
暂时回到判定块903,其中存在已知的音频签名,操作方法继续至操作块907,其中服务器105从各种移动设备获取音频样本并且将那些音频样本与数据库中所包含的已知音频签名进行比较。如果在判定块909中发现匹配数据库的音频签名,则操作方法也继续至操作块921。如果在判定块909中没有发现匹配数据库的匹配音频签名,则操作方法继续至操作块907并且继续从各种移动设备获取音频数据。
在操作块921中,服务器105会基于已定义的社交媒体群组或社区来分组移动设备。在操作块923中,服务器105可以在移动设备联系信息可用时获取该联系信息。这可以取决于个体移动设备的隐私设置。在操作块925中,在适当情况下,服务器105可以进一步基于共同的上下文信息将移动设备分组或者分成子群组。在操作块927中,服务器105根据需要可以基于移动设备之间的上下文差异来进一步进行调整。这些上下文差异的调整如前文所讨论的,并且除此之外还可以包括对于时间、位置、可以在不同位置广播媒体的不同语言或者其他考虑的调整。在操作块929中,服务器105将邀请消息发送至各种移动设备,请求移动设备用户加入社交媒体群组或社区,并且如所示,操作方法结束。上面参照图9所述的操作中的每个操作都应被理解为针对参与音频分组搜索的数个移动设备而重复进行。在一些实施例中,移动设备可以使用用户可访问的到音频监视器227的用户接口选择性加入或者选择性退出这样的音频签名分组活动。然而,在其他实施例中,在没有任何用户交互的情况下,诸如当用于采集人口统计信息时,也可以进行音频签名分组。在使用邀请消息的实施例中,所需的唯一用户交互可以是接受或者拒绝邀请消息或者根据实施例的其他消息。
第1条.一种方法,包括:从多个移动设备获取音频数据;将所述音频数据与至少一个已存储的音频签名进行比较;以及将具有包含所述至少一个已存储的音频签名的音频数据的移动设备分组。
第2条.如第1条所述的方法,进一步包括:向已分组的移动设备发送邀请消息,以使每个移动设备能够将自身关联到所述群组。
第3条.如第2条所述的方法,进一步包括:使所述至少一个音频签名与事件相关联;在社交媒体平台上为所述事件创建群组;以及从所述社交媒体平台向已分组的移动设备发送所述邀请消息。
第4条.如第3条所述的方法,其中使所述至少一个音频签名与事件相关联包括:使所述至少一个音频签名与现场事件、现场事件的记录版本、现场事件的广播版本或者音频文件的回放中的至少一个相关联。
第5条.如第4条所述的方法,进一步包括:基于所述事件,细分至少一个移动设备群组。
第6条.如第5条所述的方法,进一步包括:基于来自所述音频数据的时间戳信息或者来自提供所述音频数据的所述移动设备的位置信息中的至少一个,细分所述至少一个移动设备群组,所述位置信息与采集所述音频数据的位置相关。
第7条.如第1-6条中的任一条所述的方法,进一步包括:向已分组的移动设备提供内容,所述内容与所述至少一个已存储的音频签名相关。
第8条.如第1-7条中的任一条所述的方法,进一步包括:从具有包含所述至少一个已存储的音频签名的音频数据的每个移动设备获取上下文信息;以及基于所述上下文信息,细分至少一个移动设备群组。
第9条.如第8条所述的方法,其中,获取上下文信息包括:获取来自每个移动设备的所述音频数据的时间戳信息或者来自提供所述音频数据的所述移动设备的位置信息中的至少一个,所述位置信息与采集所述音频数据的位置相关。
第10条.如第1-9条中的任一条所述的方法,进一步包括:访问数据库以获取所述至少一个音频签名。
第11条.一种方法,包括:从多个移动设备获取音频数据;识别所述多个移动设备中的至少第一移动设备的所述音频数据内的音频签名;将所述多个移动设备中的至少第二移动设备的所述音频数据与已识别的音频签名进行比较;基于已识别的音频签名与所述第二移动设备的所述音频数据的至少一部分之间的匹配,在所述第二移动设备的所述音频数据内检测已识别的音频签名;以及基于所述第一移动设备以及所述第二移动设备在各自对应的音频数据内都具有已识别的音频签名,将所述第一移动设备以及所述第二移动设备分组。
第12条.如第11条所述的方法,进一步包括:向所述第一移动设备以及所述第二移动设备发送邀请消息,所述邀请消息使得所述第一移动设备与所述第二移动设备能够使用社交媒体服务器来进行通信。
第13条.如第11-12条中的任一条所述的方法,进一步包括:向所述第一移动设备以及所述第二移动设备提供内容,所述内容与已识别的音频签名相关。
第14条.一种服务器,包括:至少一个处理器;以及存储器,其被可操作地耦合至所述处理器,所述存储器包含用于由所述处理器来执行的可执行指令,其中在执行所述可执行指令后,所述处理器可操作为:从多个移动设备获取音频数据;将所述音频数据与至少一个已存储的音频签名进行比较;以及将具有包含所述至少一个已存储的音频签名的音频数据的移动设备分组。
第15条.如第14条所述的服务器,其中,在执行所述可执行指令后,所述处理器可进一步操作为:向已分组的移动设备发送邀请消息,以使每个移动设备都能够将自身关联到所述群组。
第16条.如第14-15条中的任一条所述的服务器,其中,在执行所述可执行指令后,所述处理器可进一步操作为:向已分组的移动设备提供内容,所述内容与所述至少一个已存储的音频签名相关。
第17条.如第14-16条中的任一条所述的服务器,其中,在执行所述可执行指令后,所述处理器可进一步操作为:从具有包含所述至少一个已存储的音频签名的音频数据的每个移动设备获取上下文信息;并且基于所述上下文信息,细分至少一个移动设备群组。
第18条.如第17条所述的服务器,其中,在执行所述可执行指令后,所述处理器可进一步操作为通过以下来获取上下文信息:获取来自每个移动设备的所述音频数据的时间戳信息或者来自提供所述音频数据的所述移动设备的位置信息中的至少一个,所述位置信息与采集所述音频数据的位置相关。
第19条.如第14-18条中的任一条所述的服务器,其中,所述处理器可进一步操作为:访问数据库以获取所述至少一个音频签名。
第20条.如第19条所述的服务器,其中,在执行所述可执行指令后,所述处理器可进一步操作为:使所述至少一个音频签名与事件相关联;在社交媒体平台上为所述事件创建群组;以及从所述社交媒体平台向已分组的移动设备发送所述邀请消息。
第21条.如第20条所述的服务器,其中,在执行所述可执行指令后,所述处理器可进一步操作为通过以下使所述至少一个音频签名与事件相关联:使所述至少一个音频签名与现场事件、现场事件的记录版本、现场事件的广播版本或者音频文件的回放中的至少一个相关联。
第22条.如第21条所述的服务器,其中,在执行所述可执行指令后,所述处理器可进一步操作为:基于所述事件,细分至少一个移动设备群组。
第23条.如第22条所述的服务器,其中,在执行所述可执行指令后,所述处理器可进一步操作为:基于来自所述音频数据的时间戳信息或者来自提供所述音频数据的所述移动设备的位置信息中的至少一个,细分所述至少一个移动设备群组,所述位置信息与采集所述音频数据的位置相关。
第24条.一种服务器,包括:至少一个处理器;以及存储器,其被可操作地耦合至所述处理器,所述存储器包含用于由所述处理器执行的可执行指令,其中在执行所述可执行指令后,所述处理器可操作为:从多个移动设备获取音频数据;识别所述多个移动设备中的至少第一移动设备的所述音频数据内的音频签名;将所述多个移动设备中的至少第二移动设备的所述音频数据与已识别的音频签名进行比较;基于已识别的音频签名与所述第二移动设备的所述音频数据的至少一部分之间的匹配,在所述第二移动设备的所述音频数据内检测已识别的音频签名;以及基于所述第一移动设备以及所述第二移动设备在各自对应的音频数据内都具有已识别的音频签名,将所述第一移动设备以及所述第二移动设备分组。
第25条.如第24条所述的服务器,其中,在执行所述可执行指令后,所述处理器可进一步操作为:向所述第一移动设备以及所述第二移动设备发送邀请消息,所述邀请消息使得所述第一移动设备与所述第二移动设备能够使用社交媒体服务器来进行通信。
第26条.如第24-25条中的任一条所述的服务器,其中,在执行所述可执行指令后,所述处理器可进一步操作为:向所述第一移动设备以及所述第二移动设备提供内容,所述内容与已识别的音频签名相关。
第28条.如第14条所述的服务器,其中,在执行所述可执行指令后,所述处理器可进一步操作为执行如第1-10条所述的方法中的任一方法。
第29条.一种包括指令的计算机可读存储器,所述指令在被执行时配置至少一个处理器来执行如第1-10条所述的方法中的任一方法。
第30条.如第24条所述的服务器,其中,在执行所述可执行指令后,所述处理器可进一步操作为执行如第11-13条所述的方法中的任一方法。
第31条.一种包括指令的计算机可读存储器,所述指令在被执行时配置至少一个处理器来执行如第11-13条所述的方法中的任一方法。
尽管已在社交媒体的群组或社区的情况下分组移动设备而言描述了各种实施例,但本领域技术人员会想到各种实施例的其他应用。换言之,基于已检测到的音频签名来分组移动设备的能力除基于社交媒体分组这样的移动设备以外还可以具有各种其他有用的应用。一种这样的应用包括广告功能,其中可以向接收共同音频签名的移动设备发送有关可能符合或者对应于已检测到的音频签名的兴趣的广告消息。其他应用包括安全系统应用,其中在某些移动设备上检测音频签名可以导致向那些移动设备发送适当的紧急消息,指令移动设备的用户在特定的紧急状况下如何去做。其他应用对本领域普通技术人员而言是显而易见的,这样的其他应用被本公开预期并且与公开的主题以及本文中所公开的各种实施例保持一致。
虽然已图示和描述了各种实施例,但应理解的是,本发明不限于此。在不脱离由所附权利要求定义的本发明范围的情况下,本领域技术人员会想到若干修改、变化、变形、替代和等同物。
Claims (15)
1.一种方法,包括:
从多个移动设备获取音频数据;
将所述音频数据与至少一个已存储的音频签名进行比较;以及
将具有包含所述至少一个已存储的音频签名的音频数据的移动设备分组。
2.如权利要求1所述的方法,进一步包括:向已分组的移动设备发送邀请消息,以使每个移动设备能够将自身关联到所述群组。
3.如权利要求2所述的方法,进一步包括:
使所述至少一个音频签名与事件相关联;
在社交媒体平台上为所述事件创建群组;以及
从所述社交媒体平台向已分组的移动设备发送所述邀请消息。
4.如权利要求3所述的方法,其中,使所述至少一个音频签名与事件相关联包括:使所述至少一个音频签名与现场事件、现场事件的记录版本、现场事件的广播版本或者音频文件的回放中的至少一个相关联。
5.如权利要求4所述的方法,进一步包括:基于所述事件,细分至少一个移动设备群组。
6.如权利要求5所述的方法,进一步包括:基于来自所述音频数据的时间戳信息或者来自提供所述音频数据的所述移动设备的位置信息中的至少一个,细分所述至少一个移动设备群组,所述位置信息与采集所述音频数据的位置相关。
7.如权利要求1-6中的任一项所述的方法,进一步包括:
向已分组的移动设备提供内容,所述内容与所述至少一个已存储的音频签名相关。
8.如权利要求1-7中的任一项所述的方法,进一步包括:
从具有包含所述至少一个已存储的音频签名的音频数据的每个移动设备获取上下文信息;以及
基于所述上下文信息,细分至少一个移动设备群组。
9.如权利要求8所述的方法,其中,获取上下文信息包括:获取来自每个移动设备的所述音频数据的时间戳信息或者来自提供所述音频数据的所述移动设备的位置信息中的至少一个,所述位置信息与采集所述音频数据的位置相关。
10.如权利要求1-9中的任一项所述的方法,进一步包括:访问数据库以获取所述至少一个音频签名。
11.一种方法,包括:
从多个移动设备获取音频数据;
识别所述多个移动设备中的至少第一移动设备的所述音频数据内的音频签名;
将所述多个移动设备中的至少第二移动设备的所述音频数据与已识别的音频签名进行比较;
基于已识别的音频签名与所述第二移动设备的所述音频数据的至少一部分之间的匹配,在所述第二移动设备的所述音频数据内检测已识别的音频签名;以及
基于所述第一移动设备以及所述第二移动设备在各自对应的音频数据内都具有已识别的音频签名,将所述第一移动设备以及所述第二移动设备分组。
12.如权利要求11所述的方法,进一步包括:
向所述第一移动设备以及所述第二移动设备发送邀请消息,所述邀请消息使得所述第一移动设备与所述第二移动设备能够使用社交媒体服务器来进行通信。
13.如权利要求11-12中的任一项所述的方法,进一步包括:
向所述第一移动设备以及所述第二移动设备提供内容,所述内容与已识别的音频签名相关。
14.一种服务器,包括:
至少一个处理器;以及
存储器,所述存储器被可操作地耦合至所述处理器,所述存储器包含用于由所述处理器执行的可执行指令,其中在执行所述可执行指令后,所述处理器可操作为:
从多个移动设备获取音频数据;
将所述音频数据与至少一个已存储的音频签名进行比较;以及
将具有包含所述至少一个已存储的音频签名的音频数据的移动设备分组。
15.如权利要求14所述的服务器,其中,在执行所述可执行指令后,所述处理器可进一步操作为执行如权利要求1-12所述的方法中的任一方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US14/073,587 | 2013-11-06 | ||
US14/073,587 US9094453B2 (en) | 2013-11-06 | 2013-11-06 | Method and apparatus for associating mobile devices using audio signature detection |
PCT/US2014/061758 WO2015069457A1 (en) | 2013-11-06 | 2014-10-22 | Method and apparatus for associating mobile devices using audio signature detection |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106063303A true CN106063303A (zh) | 2016-10-26 |
CN106063303B CN106063303B (zh) | 2019-06-21 |
Family
ID=51900518
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201480061064.0A Active CN106063303B (zh) | 2013-11-06 | 2014-10-22 | 用于使用音频签名检测来关联移动设备的方法和装置 |
Country Status (4)
Country | Link |
---|---|
US (1) | US9094453B2 (zh) |
EP (1) | EP3066854B1 (zh) |
CN (1) | CN106063303B (zh) |
WO (1) | WO2015069457A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112074900A (zh) * | 2018-05-04 | 2020-12-11 | 高通股份有限公司 | 用于自然语言处理的音频分析 |
Families Citing this family (35)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9135797B2 (en) * | 2006-12-28 | 2015-09-15 | International Business Machines Corporation | Audio detection using distributed mobile computing |
US10567444B2 (en) | 2014-02-03 | 2020-02-18 | Cogito Corporation | Tele-communication system and methods |
US20170134806A1 (en) * | 2014-04-24 | 2017-05-11 | Axwave Inc. | Selecting content based on media detected in environment |
US11481424B2 (en) * | 2014-05-16 | 2022-10-25 | RCRDCLUB Corporation | Systems and methods of media selection based on criteria thresholds |
US9590755B2 (en) | 2014-05-16 | 2017-03-07 | Alphonso Inc. | Efficient apparatus and method for audio signature generation using audio threshold |
US9397835B1 (en) | 2014-05-21 | 2016-07-19 | Amazon Technologies, Inc. | Web of trust management in a distributed system |
US10325591B1 (en) * | 2014-09-05 | 2019-06-18 | Amazon Technologies, Inc. | Identifying and suppressing interfering audio content |
US9866392B1 (en) | 2014-09-15 | 2018-01-09 | Amazon Technologies, Inc. | Distributed system web of trust provisioning |
US9684433B2 (en) * | 2014-12-30 | 2017-06-20 | Ebay Inc. | Trusted device identification and event monitoring |
JP2018506088A (ja) * | 2015-01-13 | 2018-03-01 | ヒューレット パッカード エンタープライズ デベロップメント エル ピーHewlett Packard Enterprise Development LP | 最適化シグネチャ比較およびデータレプリケーションのためのシステムおよび方法 |
GB2538935A (en) * | 2015-02-26 | 2016-12-07 | Piksel Inc | Linking devices |
US10469477B2 (en) | 2015-03-31 | 2019-11-05 | Amazon Technologies, Inc. | Key export techniques |
US10671234B2 (en) * | 2015-06-24 | 2020-06-02 | Spotify Ab | Method and an electronic device for performing playback of streamed media including related media content |
GB2558095B (en) * | 2015-08-13 | 2020-04-01 | Arris Entpr Llc | System and method for detecting advertisements in multimedia assets |
US10157333B1 (en) | 2015-09-15 | 2018-12-18 | Snap Inc. | Systems and methods for content tagging |
US9800707B2 (en) | 2015-12-01 | 2017-10-24 | Motorola Mobility Llc | Mobile device with public announcement reception while using a headset accessory |
US9591465B1 (en) * | 2015-12-07 | 2017-03-07 | Sprint Spectrum L.P. | Automatic distribution of communication to user having common subject-matter interest and served by same or adjacent base station |
CN105530257A (zh) * | 2015-12-17 | 2016-04-27 | 合肥寰景信息技术有限公司 | 具有频道监测预警装置的语音通讯系统 |
CN105515801A (zh) * | 2015-12-17 | 2016-04-20 | 合肥寰景信息技术有限公司 | 一种网络社区群体语音通信方法 |
CN105553988A (zh) * | 2015-12-17 | 2016-05-04 | 合肥寰景信息技术有限公司 | 具有频道监测预警装置的语音通讯方法 |
CN105515954A (zh) * | 2015-12-22 | 2016-04-20 | 合肥寰景信息技术有限公司 | 一种网络社区群体语音通信系统 |
US10210545B2 (en) * | 2015-12-30 | 2019-02-19 | TCL Research America Inc. | Method and system for grouping devices in a same space for cross-device marketing |
US10049670B2 (en) * | 2016-06-06 | 2018-08-14 | Google Llc | Providing voice action discoverability example for trigger term |
US20180203925A1 (en) * | 2017-01-17 | 2018-07-19 | Acoustic Protocol Inc. | Signature-based acoustic classification |
WO2019055138A1 (en) * | 2017-09-15 | 2019-03-21 | Visa International Service Association | EFFICIENT HANDS-FREE INTERACTION USING BIOMETRIC DATA |
US10510207B2 (en) | 2017-09-27 | 2019-12-17 | Bally Gaming, Inc. | Linked communications for gaming systems using acoustic signatures |
US10796520B2 (en) | 2017-09-27 | 2020-10-06 | Sg Gaming, Inc. | Presence-detecting gaming systems for maintaining gaming sessions |
EP3701528B1 (en) * | 2017-11-02 | 2023-03-15 | Huawei Technologies Co., Ltd. | Segmentation-based feature extraction for acoustic scene classification |
US11949677B2 (en) * | 2019-04-23 | 2024-04-02 | Microsoft Technology Licensing, Llc | Resource access based on audio signal |
US11316867B2 (en) | 2019-04-23 | 2022-04-26 | Microsoft Technology Licensing, Llc | Generated audio signal granting access to resource |
US11514341B2 (en) * | 2019-05-21 | 2022-11-29 | Azra Analytics, Inc. | Systems and methods for sports data crowdsourcing and analytics |
US11233979B2 (en) * | 2020-06-18 | 2022-01-25 | At&T Intellectual Property I, L.P. | Facilitation of collaborative monitoring of an event |
DE102020209048A1 (de) * | 2020-07-20 | 2022-01-20 | Sivantos Pte. Ltd. | Verfahren zur Identifikation eines Störeffekts sowie ein Hörsystem |
US11812104B2 (en) | 2021-09-21 | 2023-11-07 | The Nielsen Company (Us), Llc | Methods and apparatus to detect a presence status |
CN118120239A (zh) * | 2022-09-30 | 2024-05-31 | 谷歌有限责任公司 | 使用私有编码音频标识符的自适应内容分发 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101599836A (zh) * | 2009-07-14 | 2009-12-09 | 北京坚石诚信科技有限公司 | 一种签名方法、签名设备和系统 |
CN101882439A (zh) * | 2010-06-10 | 2010-11-10 | 复旦大学 | 一种基于Zernike矩的压缩域音频指纹方法 |
US20120224711A1 (en) * | 2011-03-04 | 2012-09-06 | Qualcomm Incorporated | Method and apparatus for grouping client devices based on context similarity |
CN103220281A (zh) * | 2013-04-03 | 2013-07-24 | 天地融科技股份有限公司 | 一种信息处理方法及系统 |
CN103327063A (zh) * | 2012-02-14 | 2013-09-25 | 谷歌公司 | 用户存在检测和事件发现 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6728341B1 (en) * | 1997-06-24 | 2004-04-27 | Royal Thoughts, Llc | Monitoring and communication system for stationary and mobile persons |
US8868914B2 (en) * | 1999-07-02 | 2014-10-21 | Steven W. Teppler | System and methods for distributing trusted time |
US8489669B2 (en) * | 2000-06-07 | 2013-07-16 | Apple Inc. | Mobile data processing system moving interest radius |
US7277766B1 (en) | 2000-10-24 | 2007-10-02 | Moodlogic, Inc. | Method and system for analyzing digital audio files |
US6879806B2 (en) * | 2001-06-01 | 2005-04-12 | Zensys A/S | System and a method for building routing tables and for routing signals in an automation system |
US7287056B2 (en) * | 2001-09-28 | 2007-10-23 | Microsoft Corporation | Dispatching notification to a device based on the current context of a user with the device |
US20120134282A1 (en) | 2010-11-30 | 2012-05-31 | Nokia Corporation | Method and apparatus for selecting devices to form a community |
US9159324B2 (en) | 2011-07-01 | 2015-10-13 | Qualcomm Incorporated | Identifying people that are proximate to a mobile device user via social graphs, speech models, and user context |
EP2747325A4 (en) * | 2011-08-15 | 2015-07-08 | Sharp Kk | WIRELESS TRANSMISSION DEVICE, WIRELESS RECEPTION DEVICE, PROGRAM, INTEGRATED CIRCUIT, AND WIRELESS COMMUNICATION SYSTEM |
US20140031018A1 (en) * | 2012-07-26 | 2014-01-30 | Go Factory, LLC | One-button formation of a proximity based instant temporary social network on mobile devices |
US9591460B2 (en) * | 2012-08-31 | 2017-03-07 | Qualcomm Incorporated | Application layer related group priority access using eMBMS and LTE priority access |
-
2013
- 2013-11-06 US US14/073,587 patent/US9094453B2/en active Active
-
2014
- 2014-10-22 EP EP14799066.7A patent/EP3066854B1/en active Active
- 2014-10-22 WO PCT/US2014/061758 patent/WO2015069457A1/en active Application Filing
- 2014-10-22 CN CN201480061064.0A patent/CN106063303B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101599836A (zh) * | 2009-07-14 | 2009-12-09 | 北京坚石诚信科技有限公司 | 一种签名方法、签名设备和系统 |
CN101882439A (zh) * | 2010-06-10 | 2010-11-10 | 复旦大学 | 一种基于Zernike矩的压缩域音频指纹方法 |
US20120224711A1 (en) * | 2011-03-04 | 2012-09-06 | Qualcomm Incorporated | Method and apparatus for grouping client devices based on context similarity |
CN103327063A (zh) * | 2012-02-14 | 2013-09-25 | 谷歌公司 | 用户存在检测和事件发现 |
CN103220281A (zh) * | 2013-04-03 | 2013-07-24 | 天地融科技股份有限公司 | 一种信息处理方法及系统 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112074900A (zh) * | 2018-05-04 | 2020-12-11 | 高通股份有限公司 | 用于自然语言处理的音频分析 |
CN112074900B (zh) * | 2018-05-04 | 2024-04-19 | 高通股份有限公司 | 用于自然语言处理的音频分析 |
Also Published As
Publication number | Publication date |
---|---|
US20150127710A1 (en) | 2015-05-07 |
WO2015069457A1 (en) | 2015-05-14 |
EP3066854B1 (en) | 2018-12-05 |
US9094453B2 (en) | 2015-07-28 |
CN106063303B (zh) | 2019-06-21 |
EP3066854A1 (en) | 2016-09-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106063303A (zh) | 用于使用音频签名检测来关联移动设备的方法和装置 | |
US11589329B1 (en) | Information processing using a population of data acquisition devices | |
US10560801B2 (en) | Beacon applications for content discovery and interaction | |
KR101351199B1 (ko) | 컨텍스트 확장 메시징을 위한 시스템 및 방법 | |
KR102436168B1 (ko) | 청취 로그 및 음악 라이브러리를 생성하기 위한 시스템 및 방법 | |
US8856375B2 (en) | System and method for distributing media related to a location | |
US8813107B2 (en) | System and method for location based media delivery | |
US8510383B2 (en) | Method for providing event based media streams | |
US8429287B2 (en) | Network audio distribution system and method | |
US20160155475A1 (en) | Method And System For Capturing Video From A Plurality Of Devices And Organizing Them For Editing, Viewing, And Dissemination Based On One Or More Criteria | |
US20050188399A1 (en) | Methods, systems, and storage mediums for providing multi-viewpoint media sharing of proximity-centric content | |
US11995377B2 (en) | Systems and methods of associating media content with contexts | |
US8806021B2 (en) | Methods, portable electronic devices, systems and computer program products for automatically creating social networking services (SNS) | |
KR20110084413A (ko) | 콘텍스트 강화 광고를 생성하는 시스템 및 방법 | |
US12035216B2 (en) | System for device-to-device media capturing | |
Casagranda et al. | Audio assisted group detection using smartphones | |
US10579672B2 (en) | Audio snippet information network | |
US20220215819A1 (en) | Methods, systems, apparatuses, and devices for facilitating the interactive creation of live music by multiple users | |
Idowu et al. | NexTrend: Context-aware music-relay corridors using NFC tags | |
EP2413254A1 (en) | System and method for accessing collaborative multimedia content | |
AU2011351935A1 (en) | Information processing using a population of data acquisition devices |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |