CN101467142A - 在车辆中从数字媒体存储设备提取元数据以用于媒体选择的系统和方法 - Google Patents
在车辆中从数字媒体存储设备提取元数据以用于媒体选择的系统和方法 Download PDFInfo
- Publication number
- CN101467142A CN101467142A CNA2007800183725A CN200780018372A CN101467142A CN 101467142 A CN101467142 A CN 101467142A CN A2007800183725 A CNA2007800183725 A CN A2007800183725A CN 200780018372 A CN200780018372 A CN 200780018372A CN 101467142 A CN101467142 A CN 101467142A
- Authority
- CN
- China
- Prior art keywords
- metadata
- storage device
- media file
- media
- digital media
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003860 storage Methods 0.000 title claims abstract description 37
- 238000000605 extraction Methods 0.000 title description 6
- 238000011093 media selection Methods 0.000 title description 2
- 238000004891 communication Methods 0.000 claims abstract description 52
- 238000000034 method Methods 0.000 claims abstract description 36
- 238000012545 processing Methods 0.000 claims description 15
- 239000000284 extract Substances 0.000 claims description 11
- 230000004044 response Effects 0.000 claims description 7
- 238000006243 chemical reaction Methods 0.000 claims 1
- 230000006870 function Effects 0.000 description 13
- 230000001755 vocal effect Effects 0.000 description 11
- 238000010586 diagram Methods 0.000 description 6
- 230000004048 modification Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 238000013479 data entry Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 241000254173 Coleoptera Species 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000012423 maintenance Methods 0.000 description 3
- 238000004088 simulation Methods 0.000 description 3
- 238000007726 management method Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 239000004606 Fillers/Extenders Substances 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000013075 data extraction Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 210000004247 hand Anatomy 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000033764 rhythmic process Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 210000003813 thumb Anatomy 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/48—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/43—Querying
- G06F16/438—Presentation of query results
- G06F16/4387—Presentation of query results by the use of playlists
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/50—Network services
- H04L67/56—Provisioning of proxy services
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/50—Network services
- H04L67/56—Provisioning of proxy services
- H04L67/568—Storing data temporarily at an intermediate stage, e.g. caching
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- General Physics & Mathematics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Library & Information Science (AREA)
- Management Or Editing Of Information On Record Carriers (AREA)
- Mobile Radio Communication Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请提供了一种通过车辆的控制模块和数字媒体存储设备之间的通信链接从车辆中的数字媒体存储设备提取元数据的方法。该方法包括在车辆的控制模块和数字媒体存储设备之间建立通信链接,识别数字媒体存储设备上的媒体文件,以及从媒体文件取得元数据,所述元数据包括多个记录项,其中多个记录项中的至少一个包括文本数据。该方法进一步包括识别媒体文件的记录项中的文本数据以及将多个记录项存储到存储器中。
Description
交叉引用
[0001]根据35 U.S.C.§119(e)(1),本申请要求于2006年4月4日提交的、标题为“System and Method for Extraction of Meta Data from a Digital MediaStorage Device for Media Selection in a Vehicle”的美国临时专利申请No.60/789176的优先权(该申请被通过引用全部并入此处)。
技术领域
[0002]本申请总体上涉及从车辆中的数字音频/视频源中提取数据的领域,尤其是涉及从可从车辆中的数字媒体存储设备(例如媒体播放器)中获得的媒体文件中提取元数据并进行处理的系统和方法。
背景技术
[0003]车辆一般包括许多电子系统,例如音频系统、移动电话系统、导航系统、视频娱乐系统等等。与这些系统一起,可将媒体播放器(即数字音频/视频播放器或者MP3播放器)安装在车辆中以便用户访问存储在媒体播放器上的数字音频或者视频内容。常规的媒体播放器包括数据存储设备(即存储器)以及内嵌的软件应用程序,所述软件应用程序允许用户向播放器传送媒体文件并且创建所选媒体文件的自定义列表,即播放列表。媒体文件可以从各种源被传送到播放器的存储器,所述源包括盘(例如CD、DVD等等)以及互联网网站。大多数播放器通过连接端口(例如USB端口、并行端口、串行端口等等)耦合于个人计算机以便传送媒体文件。媒体文件一般包括用于标识文件的内容的数据,被称为元数据。例如,对于数字音频文件,如MP3文件,元数据包括标记格式,所述标记格式包括歌曲标题、艺术家姓名、唱片标题、音轨号、流派等等。MP3(即MPEG音频层III)文件的标记格式通常称为ID3。
[0004]媒体播放器一般被配置成包括其中存储了一个或多个媒体文件的存储器。车辆中的媒体播放器可被耦合到或者集成到用于播放来自播放器的媒体文件的其他车辆电子系统中,例如音频系统。在一个已知配置中,媒体播放器可以通过媒体播放器的模拟音频输出端(例如耳机插孔)连接到车辆的音频系统的辅助输入端,以便由媒体播放器控制回放。在另一个已知配置中,除将媒体播放器的模拟音频输出端连接到车辆的音频系统的辅助输入端外,媒体播放器的控制接口还耦合于音频系统(即收音机)的前部单元的控制接口。在这种配置中,用户可以从音频系统的前部单元中控制媒体的回放。然而,在另一种配置中,音频系统可包括有关某些媒体文件的元数据的数据库。音频系统基于与该文件有关的唯一标识符确定媒体文件的元数据。
[0005]提供一种用于从车辆中的媒体播放器中提取元数据的系统是很有好处的,所述系统用于:1)建立控制模块和媒体播放器之间的通信链接;2)识别存储在媒体播放器上的媒体文件;3)当从用户处收到命令时,从媒体播放器的媒体文件中取得元数据;4)当与媒体播放器之间建立了无线通信链路时,自动地从媒体播放器的媒体文件中取得元数据;5)基于从媒体播放器提取的元数据,产生和/或更新元数据的数据库,包括将信息转换为声音基础形式(acoustic baseform)以便用户可以经由语音命令和语音识别来访问和操纵媒体文件;6)基于用户的可听命令,以可听方式列举媒体文件的元数据记录项(entry);7)利用从第二媒体播放器提取的元数据产生元数据的第二数据库,其中跨供电周期地保持第一媒体播放器的元数据,借此消除每次当媒体播放器连接至该系统时提取元数据的耗时处理;以及8)同时提供对多个数据库的使用,例如当两个或更多的媒体播放器被同时链接至控制模块时。
发明内容
[0006]根据一个实施例,提供了一种通过车辆的控制模块和车辆中的数字媒体存储设备之间的通信链接从该数字媒体存储设备中提取元数据的方法。该方法包括在车辆的控制模块和数字媒体存储设备之间建立通信链接,识别数字媒体存储设备上的媒体文件,以及从媒体文件中取得元数据,所述元数据包括多个记录项,每个记录项包括文本数据或者枚举码(enumerated code)。该方法进一步包括识别媒体文件的每个记录项中的文本数据或者代码,以及将该多个记录项存储到存储器中。
[0007]根据另一个实施例,提供了一种用于通过通信链接从数字媒体存储设备中提取元数据的车载控制系统。该系统包括:用于与该数字媒体存储设备建立通信链接的通信模块;耦合于该通信模块的处理模块,该处理模块用于通过通信模块从该数字媒体存储设备中取得与媒体文件有关的元数据,该元数据包括多个记录项,其中多个记录项中的每一个包括文本数据;以及用于存储从该数字媒体存储设备取得的多个记录项的存储模块。
附图说明
[0008]参考结合附图进行的以下说明,将更容易理解本发明,其中:
[0009]图1是根据示例性实施例的从车辆中的媒体播放器中提取元数据的控制系统的框图。
[0010]图2是根据实施例的从包括图1的控制模块的车辆中的媒体播放器中提取元数据的控制系统的框图。
[0011]图3是用于控制车辆的音频以及电话系统的集成系统的框图。
[0012]图4举例说明了根据实施例的响应于用户命令从媒体播放器中提取元数据的方法。
[0013]图5举例说明了根据实施例的处理来自媒体播放器的媒体文件数据并组织媒体文件的方法。
[0014]图6举例说明了根据实施例的对媒体文件进行支持语音的回放的方法。
[0015]图7举例说明了根据实施例的以可听方式列出媒体文件的方法。
具体实施方式
[0016]图1是根据示例性实施例的用于从车辆中的媒体播放器中提取元数据的控制系统的框图。该控制系统使得车辆乘坐者(例如驾驶员)能够从乘坐者的媒体播放器114中提取元数据,以及随后产生所提取的文本数据的音素表示(phonemic representation)。其他的车辆乘坐者(例如乘客)也可以使用该系统从他们的个人媒体播放器114中提取元数据。替代地,可以提供一种控制系统,其从大容量存储设备中提取元数据。然而,这里的说明将主要涉及一种用于从媒体播放器114种提取元数据的示例性控制系统。应当清楚的是尽管此处将参考媒体播放器114对用于提取元数据的系统进行详细的描述,但是也可以将此处的一个或多个用于提取元数据的系统和方法应用于其他类型的数字存储或者音频/视频设备并在其中获得其效用。例如,一个或多个用于提取元数据的系统可适合于与闪速驱动器、微型硬盘驱动器、USB记忆棒等一起使用,这些设备均需要某种设备特有的硬件和软件以提取元数据。
[0017]图1所示的示例性系统能够使车辆100的音频系统104和车辆乘坐者的媒体播放器114(例如具有蓝牙连接功能的媒体播放器)之间建立无线通信链接。替代地,可以提供一种控制系统,其包括与车辆乘坐者的个人媒体播放器114的有线连接。该有线连接可以包括媒体播放器114的底座(cradle)或者类似的有线适配器,如模拟音频输出连接(例如耳机插孔)。以下说明将参考在车辆音频系统和车辆乘坐者的媒体播放器114之间使用了无线通信链接的示例性控制系统,然而应当清楚的是在此所描述的从媒体播放器取得和处理元数据的方法和系统可以结合其他配置的控制系统使用,例如与车辆乘坐者的媒体播放器的有线连接等等。
[0018]在图1中,车载控制系统100包括控制模块102,其耦合于音频系统104和天线112。在一个替换实施例中,控制模块102可被并入音频系统104。与控制模块102内的通信设备140相结合,天线112能够与媒体播放器114进行双向通信。通信设备140可被配置成包括模拟和/或数字组件的通信电路,以便通信设备140能够按照若干数据传输格式中的任何一种来发送和接收短程射频(“RF”)信号,所述数据传输格式例如蓝牙通信协议、IEEE 802.11通信协议或者其他的个人局域网无线通信协议或者数据格式。媒体播放器114包括多个收发器电路,比如与通信设备140进行通信的蓝牙收发器电路。
[0019]控制模块102还耦合于用户接口110和音频输入设备108。用户接口110可用于通过如按钮、开关、小键盘、触摸屏显示器等接收来自车辆乘坐者的输入命令。替代地,对控制模块102输入的命令可包括来自车辆乘坐者的一组音频信号。例如,车辆乘坐者可以以直接向音频输入设备108讲话的方式向控制模块102提供输入命令。音频输入设备108可以包括一个或多个用于接收来自车辆乘坐者的口头命令的音频输入设备。该口头命令可以是乘坐者可以讲的、说的或者以其他方式提供的能够使控制系统或者另一个系统执行功能的任何词汇或者短语。控制模块102内的语音识别系统(或数据处理模块)122可用于处理各种数据信号,例如经由音频输入设备108接收到的音频信号(例如口头输入命令),并且识别口头命令中的词汇或者短语。现有技术中已知的语音识别技术可以被实现于语音识别系统122中。例如,语音识别系统122可以包括任何语音识别软件或者引擎,如由国际商业机器公司生产的IBM Embedded 。
[0020]控制模块102还可以耦合于显示器106。显示器106可以包括小型的阴极射线管(CRT)、液晶显示器(LCD)或者在各种照明条件下易见的各种其他类型的可视显示器。控制模块102可以包括一个或多个模拟和/或数字的电气或者电子组件,以及可以包括微处理器、微控制器、专用集成电路(ASIC)、可编程逻辑和/或其他用于执行各种输入/输出、控制、分析以及在此所描述的其他功能的模拟和/或数字电路元件。控制模块102还可以包括存储器设备124,其包括易失性及非易失性存储器,以便例如存储计算机程序、其他软件或者数据文件,以执行在此所描述的功能。图1所示的车辆100中的每个元件可以安装于或者耦合于相同或者不同的内部车辆元件,如仪表盘、头顶控制台(overhead console)、仪表面板、遮光板、后视镜或者车辆内其他适当的部位。优选的是,用户接口110、音频输入设备108以及输出显示器106安装于便于车辆乘坐者尤其是驾驶员的部位。
[0021]音频系统104可以包括例如收音机、扩音器以及至少一个用于向一个或多个车辆乘坐者提供音频信号的扬声器。所述扬声器(未示出)用于接收来自控制模块102和/或其他系统的音频输出数据(例如来自媒体播放器的数字音频文件、控制模块102提供的信息提示或者其他消息等)。扬声器可以是车辆音频系统104的一部分或者可以是仅服务于控制模块102的专用音频输出设备126。
[0022]如上所述,在图1所示的示例性系统中,控制模块102经由无线通信链接与车辆乘坐者的媒体播放器114进行链接。当允许不同的乘坐者使用该控制系统时,就与不同的媒体播放器建立通信链接。例如,通信链接可响应于经由用户接口110从用户处接收的命令或者经由音频输入设备108接收的口头命令而被建立。无线通信链接根据无线通信标准来操作,所述无线通信标准例如蓝牙通信协议、IEEE 802.11通信协议或者其他适当的无线通信标准。因此,媒体播放器114能够根据用于无线通信链接的无线通信标准进行操作或者与其进行通信。
[0023]控制模块102和媒体播放器114之间的通信链接允许从媒体播放器114上存储的媒体文件中提取元数据给控制模块102。随后,由用户接口110或者音频输入设备108控制媒体文件的回放。例如,在建立了媒体播放器114和控制模块102之间的通信链接之后,一旦建立了通信链接或者作为用户命令的结果,就可以开始提取元数据的处理。用户可以通过向用户接口110输入命令或者向音频输入设备108说出口头命令的方式提供命令。例如,通过接收来自车辆乘坐者的口头命令并经由无线通信链接将回放命令发送至媒体播放器114,就可以通过控制模块102和音频系统104播放歌曲。由控制模块102所接收到的音频信息可以经由音频系统104(例如经由扬声器,未示出)提供给用户,并且从媒体播放器114取得的数据可以被显示在显示器106上。媒体播放器114可以位于车辆100附近范围内的任何位置,例如乘坐者的口袋或者公文包里、在行李箱或者在能够与通信设备140进行通信的范围之内。
[0024]图2是用于从车辆中的媒体播放器中提取元数据的控制系统的框图,所述车辆包括图1所示的控制模块102。存储器124包括用于存储执行控制模块102的功能的计算机或者软件程序的易失性存储器136和非易失性存储器138。例如,存储器124包括可由语音识别系统122的语音识别引擎130识别的命令词汇的预定词汇表。该预定词汇表可用于操纵车辆中的系统和应用,以便于执行功能。语音识别引擎130用于识别口头命令中的词汇或者短语,并且用于将所识别的词汇与命令词汇的预定词汇表进行比较,以便确定适当的动作和/或要向其传递指令的适当系统或者应用。语音识别系统122还包括文本-语音(text-to-speech)引擎132和文本-语法(text-to-grammar)引擎134。文本-语音引擎132用于将文本(例如ASCII文本)转换为可通过音频输出设备126或者音频系统104播放的音频表示(例如PCM)。文本-语法引擎134用于将文本(例如ASCII文本)转换为可由语音识别引擎130采用以识别用户口头命令中的词汇或者文本的音素表示。文本-语音引擎132以及文本-语法引擎134可以是相同应用或者是不同应用的一部分。可以使用本领域中已知的文本-语音以及文本-语法技术,例如由国际商业机器公司生产的Embedded Text-To-Speech引擎和Text-to-Grammar引擎。
[0025]存储器124包括数据库158,其也用于存储每个唯一的媒体播放器的媒体文件的元数据,或用户在控制系统运行期间结合特定的媒体播放器使用的其他大容量存储设备的媒体文件的元数据。存储器124可包括从媒体播放器提取的每个媒体文件的元数据。每个媒体文件的元数据包括多个记录项。每个媒体文件包括音频数据和元数据,其中元数据可以包括多个记录项,表示存储器124中每个媒体文件的相关信息(context),例如歌曲标题(例如“We Belong Together”)、唱片标题(例如“Breakthrough”)、艺术家(例如John Doe)、流派(节奏和布鲁斯)、时长(例如3:10)以及音轨号(音轨5)等。在图2中,媒体播放器114包括存储在例如媒体播放器114的存储器148中的媒体文件数据128,例如歌曲标题、唱片标题、艺术家、流派、时长、音轨号等。用户可以利用已知的方法在媒体播放器114中添加、编辑或者操作媒体文件。存储器148还可以包括媒体播放器114的存储器148中的每个媒体文件的元数据。每个媒体文件可以包括多个记录项,表示存储器148中每个媒体文件的相关信息,例如歌曲标题、唱片标题、艺术家、流派、时长以及音轨号等。如上所述,控制模块102包括存储在存储器124中的数据库158。优选的是,数据库158被存储在非易失性存储器138(例如闪速EPROM)中,并因此能够跨越控制系统的供电周期而保持该数据库。
[0026]在一个实施例中,当控制模块102和媒体播放器114之间建立了无线通信链接时,控制模块102自动取得媒体文件数据128。在一个实施例中,从媒体播放器114中取得的媒体文件数据128可被存储在易失性存储器136(例如DRAM)中。因此,不能跨越控制系统的供电周期而保持存储在易失性存储器136中的媒体文件数据。在替换实施例中,媒体文件数据可被存储在非易失性存储器138(图2所示的数据库158)中,并可以被跨供电周期地保持,以及在上电初始化之后可供用户使用。当与不同的媒体播放器(例如另一个车辆乘坐者的媒体播放器)之间建立了第二无线通信链接时,可以利用来自第二媒体播放器的媒体文件数据对易失性存储器136中的数据进行覆写。替代地,每个用户都可以拥有被存储于非易失性存储器138中的、来自其相关媒体播放器的、具有元数据的媒体文件。在此实施例中,只有当特定用户的媒体播放器114经由无线通信链接被连接至控制系统时,才仅可以访问特定媒体播放器114的媒体文件数据。每个媒体播放器114可以具有唯一的标识符,其用于标识出一个用户的媒体播放器114而将其与另一个媒体播放器区别开。
[0027]图3是用于控制车辆的音频和电话系统的集成系统的框图。图3的控制系统使得用户能够连接数字媒体存储设备,例如媒体播放器,以便从该数字媒体存储设备中提取元数据。图3举例说明了用以支持图1控制系统的软件体系结构的优选实施例。
[0028]音乐管理器242包括媒体编目器(media cataloger)248,其用于从所连接的媒体设备(例如大容量存储设备、媒体播放器、移动电话等)中提取元数据。在大容量存储设备278的情况下,它可以经由通用串行总线(USB)连接而被连接。媒体编目器248搜索大容量存储设备278的文件结构,以便识别存储在该设备的存储器中的音频媒体。媒体编目器248用于分析媒体文件以定位内嵌的元数据(ID3标签)并提取他们。USB回放244在音频媒体文件的文件读取及回放期间解码该音频媒体。媒体编目器248还搜索音频媒体文件以寻找各种文件参数,包括ID3标签,其为MP3文件的标记格式。媒体编目器248可逐个文件地进行元数据提取,以便媒体编目器248创建数据库,其被示为音乐数据库252。当媒体编目器发现已经对媒体文件做出了修改或者添加时,它请求用户重新对设备上的媒体文件进行编目。应当清楚的是,大容量存储设备278可以包括媒体存储设备,例如拇指驱动器、USB棒等。
[0029]在媒体播放器274(例如媒体播放器)的情况下,它可以利用蓝牙适配器(Bluetooth dongle)通过无线连接与音乐管理器242进行连接。目前市场上出售的一种称为naviPlayTM的适配器是由TEN技术公司生产的。Impulsesoft公司也创造了一种专有协议,其能够使系统从媒体播放器提取元数据。在将蓝牙适配器与媒体播放器相连接后,iPod控制264识别出媒体播放器已被连接。媒体编目器248与蓝牙控制模块260相交互,以便通过蓝牙连接请求元数据。媒体流266包括的流模式(profile)例如高级音频分发模式(A2DP),其用于控制将音频数据从媒体播放器274或者移动电话276流向该系统。还应该清楚的是本发明的范围不局限于媒体播放器。媒体播放器274可以包括能够将媒体文件存储在存储器中的若干类型的媒体存储设备、数字音频/视频播放器等中的任一种。
[0030]另外,移动电话276被显示成通过蓝牙主栈(host stack)262耦合于蓝牙控制模块260。蓝牙控制模块260最好包括免提模式,以便与具有蓝牙HFP功能的移动电话相互操作。替代地,移动电话276可以是具有免提模式的蓝牙功能电话。在替换实施例中,移动电话276还可以包括用于通过蓝牙连接来使媒体文件流入(streaming-in)的媒体播放器。移动电话276用于经由媒体流266使音频流入。媒体编目器248进一步用于从移动电话276提取元数据,其中,所述元数据存储在音乐数据库252中。
[0031]音乐数据库252最好包括客户端应用编程接口(API)254以便媒体编目器248能够调用以请求对媒体文件进行编目。音乐数据库252还可以包括SQL数据库引擎256和音乐数据库模型258,用作关系数据库管理系统。存储模块268耦合于音乐数据库252。音乐数据库252包括易失性存储器270(例如RAM)以及非易失性存储器272(例如闪速存储器)。因此,存储在易失性存储器270中的元数据目录不能被跨系统的供电周期地保持,而媒体文件可以被存储在非易失性存储器272中并被跨供电周期地保持,并且在上电初始化之后可用。
[0032]一旦媒体设备(例如大容量存储设备278、媒体播放器274、移动电话276等)已连接,音乐管理器242就通知状态管理器222媒体设备已被定位(例如已发现蓝牙功能设备或者已经连接了大容量存储设备)。如果媒体设备的编目是必需的,那么音乐管理器242通知状态管理器222编目已完成。状态管理器222利用这些数据经由UI相关信息管理器224和集成模块225来更新图形用户接口(GUI)212和声音用户接口(VUI)232,以告知正在进行编目和/或已经完成了编目。状态管理器222、GUI 212以及VUI 232之间的接口表明了如何实现同步多模式用户接口。当同时使用多个系统时,现有的焦点管理226控制各种车辆系统。当移动电话收到呼叫时,现有的免提应用228控制所连接的移动电话及其他车辆系统的操作。例如,如果当移动电话收到呼叫时用户正在回放音乐,系统此时可暂停音乐回放。随后,用户可切断呼叫并自动使音乐回放恢复。
[0033]VUI 232包括语音识别引擎234、文本-语音引擎236以及文本-语法引擎238。麦克风240以及扬声器250优选地耦合于VUI 232以便处理各种数据信号,例如音频信号(例如口头输入命令、音频输出数据等)。当该编目处理完成时,状态管理器222通知VUI 232媒体设备已被编目。当从状态管理器222接收到编目已完成的更新时,VUI 232解析音乐数据库252中元数据的每个记录项,并将记录项转换为声音基础形式(即记录项的音素表示)。所述声音基础形式被存储在易失性存储器270中的基础形式列表内。因此,不能跨越系统的供电周期而保持该基础形式列表。在替换实施例中,
[0034]供电模块(未示出)通知音乐管理器242系统正在关闭。音乐管理器242将基于RAM的数据库写入非易失性存储器272,以便跨供电周期地保持该数据库。
[0035]另外,VUI 232包括用于将文本数据转换为声音基础形式的软件逻辑,所述文本数据包括首字母缩写词、标点符号和唯一发声名称。文本-语音引擎236用于转换若干这样的元数据记录项。例如,文本-语音引擎236识别并转换艺术家的姓名“INXS”,其在发音上听起来像“in excess”。另一个例子是艺术家的姓名“.38Special”,其在发音上听起来像“thirty-eightspecial”而不是“point three eight special”。在一个实施例中,直接将软件逻辑嵌入VUI 232,其中VUI 232最佳地按照它本身的规则转换文本数据。
在替换实施例中,该系统可以利用所连接的移动电话(例如移动电话276)来建立一个到互联网的拨号连接以访问在线音乐数据库。替代地,该系统可以访问包括语音合成标记语言(SSML)形式的语音表示的共享网络驱动器或者数据库。文本-语音引擎236可以利用SSML正确读出记录项并且创建元数据的记录项的正确声音基础形式。
[0036]音乐管理器242进一步包括USB回放244和媒体播放器回放246。使用GUI 212或者VUI 232,用户可选择一种模式以利用USB回放244或者媒体播放器回放246来回放媒体文件。当用户选择了一种回放模式时,GUI 212和/或VUI 232决定如何回放。一旦选择了要播放的艺术家(例如“播放甲壳虫乐队”),状态管理器222通知音乐管理器242,音乐管理器242通过这两个回放子组件经由客户端API 254访问音乐数据库252以找到与指定艺术家有关的全部音轨。然后可以按照预定的顺序或者随机地回放所述音轨。例如用户可以决定按字母顺序回放“甲壳虫乐队”的唱片,然后在该唱片内按照单个音轨的顺序进行回放。替代地,用户可以决定按年代顺序从甲壳虫乐队的第一张唱片开始播放唱片。
[0037]触摸式用户接口(TUI)202包括旋转输入204、通用输入/输出(GPIO)206以及无线电输入/输出(“无线电IO”)208。TUI 202耦合于GPIO 210和I2C单元214(或者I2C),其为串行总线。I2C单元214耦合于GPIO扩展器216和无线电单元218。无线电单元218最好包括AM/FM调谐器、功率放大器、均衡器、卫星广播以及辅助输入。
[0038]当系统回放所选音轨时,音乐管理器242最好提供该音轨的回放状态。媒体编目器248用于执行元数据的提取,其包括提取例如歌曲标题、唱片标题、艺术家、流派、时长、音轨号、已播放时间、录制标签、主要艺术家等的数据。
[0039]状态管理器222向GUI 212和VUI 232提供回放状态。GUI 212可以显示所选音轨的列表中当前音轨的回放状态。VUI 232还允许用户“打断”正在播放的音轨并输入所期望的命令。例如,用户可以按下按钮以启动语音识别引擎234,然后用户就可以说出适当的命令开始以另一个媒体文件的回放(例如“下一个”、“暂停”、“播放‘黄色潜水艇’”)。
[0040]图4举例说明了根据实施例的响应于用户命令从媒体播放器取得媒体文件数据的方法。响应于来自车辆中的用户的命令,取得来自媒体播放器114的媒体文件数据。该命令可经由用户接口110(例如按钮或开关)被接收或者经由音频输入设备108作为口头命令而被接收。在控制模块102和媒体播放器114之间建立了无线通信链接之后,用户可以提供命令以从媒体播放器取得媒体文件数据。在步骤302,控制模块102(如图2所示)接收到来自用户的用以从所连接的媒体播放器取得媒体文件数据的命令。如同所述,用户可以经由用户接口110(图2)提供请求,例如利用按钮或开关。替代地,用户可以提供口头命令以请求取得元数据。在步骤304,控制模块102经由无线通信链接向媒体播放器114发出请求并从媒体播放器114取得元数据。一旦媒体文件数据被传送到控制模块102,则在步骤306将数据记录(capture)在一文件中。然后,在步骤308,所取得的媒体文件在被存储到存储器124之前被处理。在经过处理之后,媒体文件被存储到存储器124(如图2所示)中。如前所述,媒体文件数据可被存储到易失性存储器136(如图2所示)中。因此,并不会跨越控制系统的供电周期而保持媒体文件数据。优选的是,该媒体文件数据可被存储到非易失性存储器138(如图2所示)中,并可以被跨供电周期地保持,在上电初始化之后可为用户所用。如上所述,当与不同媒体播放器(例如另一个车辆乘坐者的媒体播放器)之间建立了无线通信链接时,易失性存储器136中的数据被来自该新的媒体播放器的媒体文件数据所覆写。
[0041]图5举例说明用于处理来自媒体播放器的媒体文件数据的方法。在步骤402,控制模块102(如图2所示)访问媒体文件并识别元数据的各个记录项,例如歌曲标题、唱片标题、艺术家、流派、时长、音轨号、已播放时间、录制标签、主要艺术家等。可以利用文本-语法引擎134(图2所示)为媒体文件的每个记录项的文本数据产生声音基础形式。该声音基础形式是可以由语音识别引擎130(图2所示)用以识别用户的发声、从而允许针对媒体文件的每个记录项来执行语音识别的音素表示。在步骤404,基于媒体文件的文本数据产生声音基础形式。在步骤406,声音基础形式被存储在与媒体文件有关的基础形式列表中。因此,可针对媒体文件的文本数据来执行语音识别。回到图4,一旦在步骤310中将媒体文件数据存储到存储器中了,所述媒体文件就可由用户对媒体文件进行具有语音功能的操作。
[0042]如同所述,用户可以利用存储在存储器中的元数据的记录项来对媒体文件进行操作(例如播放、暂停、停止、下一个、上一个、快进、后退等)。图6举例说明了根据实施例的利用存储器124进行具有语音功能的回放的方法。在步骤502,控制模块102(图2所示)经由音频输入设备108接收来自用户的用以启动媒体文件的回放的命令。在一个实施例中,在步骤504,控制模块102提示用户指出回放哪一个媒体文件。该提示可经由音频输出设备126或者音频系统104播放。替代地,用户可使用口头命令提供(即说出)记录项名称来播放歌曲(例如“播放<音轨标题>”)。在步骤506系统收到所期望的媒体文件的音轨标题之后,在步骤508该系统识别所期望的记录项。如果在存储器124中存在类似的记录项,那么语音识别引擎130选择最佳的匹配。在步骤510,语音识别引擎判断是否存在一个以上与一个声音基础形式有关的记录项。例如,如果用户命令该系统“播放<The White Album>”,则系统可识别出一个以上与该唱片标题有关的媒体文件。控制模块102可列出(经由可听到的提示或者经由显示器106)与该唱片名相关的媒体文件(如歌曲或者音轨)。替代地,控制模块102还可以从唱片的开头或者从预先选定的音轨号开始回放该唱片的媒体文件(即音轨)。然后,在步骤512,用户可以选择媒体文件。一旦确定了媒体文件,在步骤514控制模块102提示该用户确认该媒体文件的音轨标题。在步骤516,收到确认之后,控制模块102开始回放该媒体文件。替代地,该系统可确定存在着一张以上的唱片在其唱片标题中包含特定短语(例如“精选”)。在这种情况下,基于置信度记分算法,控制模块102识别出一个以上的唱片标题包含所说出的短语。语音识别引擎130提供最佳的匹配,然后用户被提示从这些匹配中选择所期望的唱片。
[0043]控制模块102(图2)还可根据请求(例如“列举唱片”、“列举艺术家”等)向用户提供可用媒体文件的元数据的列表。图7举例说明了根据实施例的以可听方式列举媒体文件的方法。在步骤602,控制模块102经由音频输入设备108(图3)接收来自用户的用以依据元数据记录项的类型来列出数据库158的内容的命令。响应于该命令,在步骤604控制模块102以可听方式列举每个媒体文件的元数据记录项。例如,如果用户的命令是“列举唱片”,那么将列举每个唱片的标题。使用文本-语音引擎132将每个媒体文件的文本(例如唱片标题)转换为音频表示,并且可以利用音频输出设备126或者音频系统104在车辆内播放该音频。优选的是,所述记录项的文本被按照字母顺序排序逐字符显示在显示器106上。在播放每个记录项之间要经过预设的时间周期。此外,控制模块102通过允许用户“打断(barge-in)”来使得用户可以中断所选元数据的可听列举。用户可在记录项文本播放期间或者在播放记录项之后的预设时间期间内打断以便执行命令。如果在步骤606用户提供命令(即打断),那么在步骤608控制模块102识别并执行所请求的操作。例如,用户可提供命令以跳到所选元数据列表中的下一个记录项或者跳到以下一个字母开头的记录项。用户还可以提供命令以选择曾经听过的所期望的媒体文件或者重复前一记录项。如果媒体文件被选择,用户就可以启动操作(例如媒体文件的回放)。当在步骤610到达最后一个媒体文件(或者当选择了一个文件)时,处理过程结束。如果还没有到达最后一条记录项,那么处理过程回到步骤604并继续进行,直到或者选择了一条记录项或者到达了数据库158中的最后一条记录项。
[0044]尽管上述的在附图中举例说明的示例性实施例是目前优选的,但是应当清楚的是提供这些实施例仅作为示例。因此,本发明不局限于特定的实施例,而是扩展到落入所附权利要求范围内的各种变型。根据替换性实施例,任何处理或者方法步骤的顺序或次序可以被改变或重新排序。
[0045]利用附图描述本发明不应该被看作是对本发明强加附图中所呈现的任何限制。本发明设想了用于实现其操作的方法、系统和任何机器可读媒体上的程序产品。本发明的实施例可使用现有的计算机处理器来实现,或者通过为这样或那样的目的而并入适当的车辆系统的专用计算机处理器来实现,或者通过硬连线系统来实现。
[0046]如上所述,本发明范围内的实施例包括程序产品,所述程序产品包括带有或其上存储有机器可执行指令或者数据结构的机器可读媒体。这种机器可读媒体可以是通用的或者专用的计算机或者其他具有处理器的机器可访问的任何可用的媒体。举例来说,这种机器可读媒体可以包括RAM、ROM、EPROM、EEPROM、CD-ROM或者其他光盘存储装置、磁盘存储装置或者其他磁存储设备,或者可用于以机器可执行指令或者数据结构的形式携带或者存储程序代码的、并可由通用的或者专用的计算机或者具有处理器的其他机器访问的任何其他媒体。当信息通过网络或者另一通信连接(或者为硬线的、无线的,或者为硬线的或无线的组合)被发送或提供给机器时,该机器完全可以将该连接视为机器可读媒体。因而,任何这种连接当然地被称为机器可读媒体。上述的组合也包括在机器可读媒体的范畴之内。机器可执行命令包括例如使通用计算机、专用计算机或者专用处理机执行某种功能或者某些功能的命令和数据。
[0047]应当指出的是尽管本申请的附图示出了方法步骤的特定顺序,但是应当清楚的是这些步骤的顺序可以与所描述的情况不同。同样,两个或多个步骤可被并发执行或者部分并发执行。这种变化将取决于所选择的软件和硬件系统以及设计者的选择。应当清楚的是所有这些改变均包含在本发明的范围之内。同样地,可以用标准编程技术完成本发明的软件实现,利用基于规则的逻辑及其他逻辑来实现各种连接步骤、处理步骤、比较步骤以及判决步骤。
[0048]为了举例说明以及描述的目的给出了本发明实施例的上述说明。这并不意味着穷举或者是将本发明限于所公开的确定形式,按照上述的教导可以有很多变型和改变,或者可从本发明的实践中获得这些变型和改变。为说明本发明的原理及其实际应用而选择和描述了这些实施例,以使本领域的技术人员能够将本发明用于各种实施例、以及以适合于所预期的特定应用的各种变型来使用本发明。
Claims (21)
1.一种通过车辆的控制模块和该车辆中的数字媒体存储设备之间的通信链接从该数字媒体存储设备中提取元数据的方法,该方法包括:
在所述车辆的控制模块和所述数字媒体存储设备之间建立通信链接;
识别所述数字媒体存储设备上的媒体文件;
从媒体文件中取得元数据,该元数据包括多个记录项,其中所述多个记录项中至少一个包括文本数据;
识别所述媒体文件的记录项中的文本数据;以及
将所述多个记录项存储到存储器中。
2.如权利要求1所述的方法,其中,响应于在所述控制模块和所述数字媒体存储设备之间建立了通信链接而取得所述元数据。
3.如权利要求1所述的方法,其中,响应于用户的命令而取得所述元数据。
4.如权利要求3所述的方法,其中,来自所述用户的命令是经由用户接口接收的。
5.如权利要求3所述的方法,其中,所述命令为口述命令。
6.如权利要求1所述的方法,其中,所述控制模块和所述数字媒体存储设备之间的通信链接是无线的。
7.如权利要求1所述的方法,其中,所述多个记录项包括下列中的任一个:歌曲标题、唱片标题、艺术家、流派、时长、音轨号、已播放时间、录制标签、录制日期、作曲家、制作人以及主要艺术家。
8.如权利要求1所述的方法,还包括:
产生记录项的文本数据的声音基础形式;以及
将所述记录项的声音基础形式存储到基础形式列表中。
9.如权利要求1所述的方法,还包括:
识别所述数字媒体存储设备上的播放列表;以及
从所述数字媒体存储设备中取得所述播放列表,其中该播放列表包括媒体文件的自定义编排。
10.如权利要求1所述的方法,其中,所述声音基础形式用于使每个记录项能被语音识别。
11.一种车载控制系统,用于通过通信链接从数字媒体存储设备中提取元数据,该系统包括:
通信模块,用于与所述数字媒体存储设备建立通信链接;
处理模块,耦合于所述通信模块,该处理模块用于经由该通信模块从所述数字媒体存储设备中取得与媒体文件有关的元数据,该元数据包括多个记录项,其中所述多个记录项中的至少一个包括文本数据;以及
存储模块,用于存储从所述数字媒体存储设备中取得的多个记录项。
12.如权利要求11所述的系统,其中,所述处理模块用于识别记录项的文本数据并且产生该记录项的文本数据的音素表示。
13.如权利要求11所述的系统,还包括:用户接口,用于接收输入,基于媒体文件的相关元数据选择至少一个媒体文件,以及经由音频系统播放该媒体文件的音频数据。
14.如权利要求11所述的系统,其中,所述用户接口包括显示器,并且所述处理模块用于经由该显示器向用户提供元数据。
15.如权利要求11所述的系统,还包括:音频输入设备,用于从用户处接收口头输入命令。
16.如权利要求11所述的系统,还包括:语音识别模块,用于将从用户处接收到的口头输入命令与一组预定的输入命令进行比较,其中该语音识别模块基于该口头输入命令来确定适当的响应。
17.如权利要求11所述的系统,还包括:文本转换引擎,用于将记录项的文本数据转换为该文本数据的可听语音表示。
18.如权利要求11所述的系统,其中,所述存储模块包括易失性存储器。
19.如权利要求11所述的系统,其中,所述存储模块包括非易失性存储器。
20.如权利要求11所述的系统,其中,记录项的文本数据的音素表示有助于所述媒体文件的记录项的语音识别。
21.如权利要求11所述的系统,其中,该系统用于支持媒体编码/解码算法,包括以下中的任一个:MP3、MP3 Pro、Ogg Vorbis、高级音频编码(AAC)、Windows媒体音频(WMA)以及波形音频(WAV)。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US78917606P | 2006-04-04 | 2006-04-04 | |
US60/789,176 | 2006-04-04 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101467142A true CN101467142A (zh) | 2009-06-24 |
Family
ID=38474337
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA2007800182756A Pending CN101449538A (zh) | 2006-04-04 | 2007-04-03 | 媒体文件的文本-语法改进 |
CNA2007800183725A Pending CN101467142A (zh) | 2006-04-04 | 2007-04-03 | 在车辆中从数字媒体存储设备提取元数据以用于媒体选择的系统和方法 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA2007800182756A Pending CN101449538A (zh) | 2006-04-04 | 2007-04-03 | 媒体文件的文本-语法改进 |
Country Status (4)
Country | Link |
---|---|
US (1) | US9092435B2 (zh) |
EP (1) | EP2005319B1 (zh) |
CN (2) | CN101449538A (zh) |
WO (1) | WO2007123797A1 (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102843680A (zh) * | 2011-06-24 | 2012-12-26 | 福特全球技术公司 | 用于蓝牙功能验证的方法 |
CN105723325A (zh) * | 2013-11-13 | 2016-06-29 | 微软技术许可有限责任公司 | 使用因用户而异的语法的媒体项选择 |
CN112673368A (zh) * | 2018-07-31 | 2021-04-16 | 马维尔国际贸易有限公司 | 用于在存储边缘处生成描述非结构化数据对象的元数据的系统和方法 |
Families Citing this family (274)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8645137B2 (en) | 2000-03-16 | 2014-02-04 | Apple Inc. | Fast, language-independent method for user authentication by voice |
US20060235864A1 (en) * | 2005-04-14 | 2006-10-19 | Apple Computer, Inc. | Audio sampling and acquisition system |
US8677377B2 (en) | 2005-09-08 | 2014-03-18 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
US7870142B2 (en) | 2006-04-04 | 2011-01-11 | Johnson Controls Technology Company | Text to grammar enhancements for media files |
CN101449538A (zh) | 2006-04-04 | 2009-06-03 | 约翰逊控制技术公司 | 媒体文件的文本-语法改进 |
KR20080015567A (ko) * | 2006-08-16 | 2008-02-20 | 삼성전자주식회사 | 휴대 장치를 위한 음성기반 파일 정보 안내 시스템 및 방법 |
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
AU2007336816C1 (en) * | 2006-12-22 | 2011-10-06 | Apple Inc. | Tagging media assets, locations, and advertisements |
US9865240B2 (en) * | 2006-12-29 | 2018-01-09 | Harman International Industries, Incorporated | Command interface for generating personalized audio content |
JPWO2008102413A1 (ja) * | 2007-02-22 | 2010-05-27 | 富士通株式会社 | 音楽再生装置および音楽再生方法 |
US20080215169A1 (en) * | 2007-03-02 | 2008-09-04 | Lisa Debettencourt | Audio System |
US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
US8819553B2 (en) * | 2007-09-04 | 2014-08-26 | Apple Inc. | Generating a playlist using metadata tags |
US20090062944A1 (en) * | 2007-09-04 | 2009-03-05 | Apple Inc. | Modifying media files |
US9130686B2 (en) | 2007-12-20 | 2015-09-08 | Apple Inc. | Tagging of broadcast content using a portable media device controlled by an accessory |
US10002189B2 (en) | 2007-12-20 | 2018-06-19 | Apple Inc. | Method and apparatus for searching using an active ontology |
US9330720B2 (en) | 2008-01-03 | 2016-05-03 | Apple Inc. | Methods and apparatus for altering audio output signals |
US8996376B2 (en) | 2008-04-05 | 2015-03-31 | Apple Inc. | Intelligent text-to-speech conversion |
US10496753B2 (en) | 2010-01-18 | 2019-12-03 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US8527876B2 (en) * | 2008-06-12 | 2013-09-03 | Apple Inc. | System and methods for adjusting graphical representations of media files based on previous usage |
US20090313564A1 (en) * | 2008-06-12 | 2009-12-17 | Apple Inc. | Systems and methods for adjusting playback of media files based on previous usage |
US20100030549A1 (en) | 2008-07-31 | 2010-02-04 | Lee Michael M | Mobile device having human language translation capability with positional feedback |
US20100036666A1 (en) * | 2008-08-08 | 2010-02-11 | Gm Global Technology Operations, Inc. | Method and system for providing meta data for a work |
JP2010056684A (ja) * | 2008-08-26 | 2010-03-11 | Yamaha Corp | オーディオ信号処理装置、スピーカ装置、映像表示装置および制御方法 |
US8452228B2 (en) | 2008-09-24 | 2013-05-28 | Apple Inc. | Systems, methods, and devices for associating a contact identifier with a broadcast source |
US20100075695A1 (en) * | 2008-09-24 | 2010-03-25 | Apple Inc. | Systems, methods, and devices for retrieving local broadcast source presets |
US20100076576A1 (en) * | 2008-09-24 | 2010-03-25 | Apple Inc. | Systems, methods, and devices for providing broadcast media from a selected source |
US8886112B2 (en) | 2008-09-24 | 2014-11-11 | Apple Inc. | Media device with enhanced data retrieval feature |
US8676904B2 (en) | 2008-10-02 | 2014-03-18 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
CN101740089B (zh) * | 2008-11-17 | 2012-03-07 | 深圳Tcl新技术有限公司 | 在相连设备上播放便携播放器上文件的方法和相应设备 |
US9959870B2 (en) * | 2008-12-11 | 2018-05-01 | Apple Inc. | Speech recognition involving a mobile device |
US8352278B2 (en) | 2009-06-02 | 2013-01-08 | Ford Global Technologies, Llc | Methods and systems for resolving the incompatibility of media items playable from a vehicle |
US9858925B2 (en) | 2009-06-05 | 2018-01-02 | Apple Inc. | Using context information to facilitate processing of commands in a virtual assistant |
US10241644B2 (en) | 2011-06-03 | 2019-03-26 | Apple Inc. | Actionable reminder entries |
US20120309363A1 (en) | 2011-06-03 | 2012-12-06 | Apple Inc. | Triggering notifications associated with tasks items that represent tasks to perform |
US10241752B2 (en) | 2011-09-30 | 2019-03-26 | Apple Inc. | Interface for a virtual digital assistant |
US9641625B2 (en) | 2009-06-09 | 2017-05-02 | Ford Global Technologies, Llc | Method and system for executing an internet radio application within a vehicle |
US9431006B2 (en) | 2009-07-02 | 2016-08-30 | Apple Inc. | Methods and apparatuses for automatic speech recognition |
US8898170B2 (en) | 2009-07-15 | 2014-11-25 | Apple Inc. | Performance metadata for media |
JP2011043710A (ja) * | 2009-08-21 | 2011-03-03 | Sony Corp | 音声処理装置、音声処理方法及びプログラム |
US8214740B2 (en) * | 2009-10-30 | 2012-07-03 | Apple Inc. | Song flow methodology in random playback |
US10553209B2 (en) | 2010-01-18 | 2020-02-04 | Apple Inc. | Systems and methods for hands-free notification summaries |
US10276170B2 (en) | 2010-01-18 | 2019-04-30 | Apple Inc. | Intelligent automated assistant |
US10679605B2 (en) | 2010-01-18 | 2020-06-09 | Apple Inc. | Hands-free list-reading by intelligent automated assistant |
US10705794B2 (en) | 2010-01-18 | 2020-07-07 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
WO2011091402A1 (en) * | 2010-01-25 | 2011-07-28 | Justin Mason | Voice electronic listening assistant |
US8682667B2 (en) | 2010-02-25 | 2014-03-25 | Apple Inc. | User profiling for selecting user specific voice input processing information |
US8140570B2 (en) * | 2010-03-11 | 2012-03-20 | Apple Inc. | Automatic discovery of metadata |
US9915755B2 (en) | 2010-12-20 | 2018-03-13 | Ford Global Technologies, Llc | Virtual ambient weather condition sensing |
KR101828273B1 (ko) * | 2011-01-04 | 2018-02-14 | 삼성전자주식회사 | 결합기반의 음성명령 인식 장치 및 그 방법 |
US9262612B2 (en) | 2011-03-21 | 2016-02-16 | Apple Inc. | Device access using voice authentication |
US10057736B2 (en) | 2011-06-03 | 2018-08-21 | Apple Inc. | Active transport based notifications |
US20130024287A1 (en) * | 2011-07-19 | 2013-01-24 | Ford Global Technologies, Llc | Methods and Apparatus for Managing a Content Stream |
US8994660B2 (en) | 2011-08-29 | 2015-03-31 | Apple Inc. | Text correction processing |
US8872647B2 (en) | 2011-10-21 | 2014-10-28 | Ford Global Technologies, Llc | Method and apparatus for context adaptive multimedia management |
US9148741B2 (en) * | 2011-12-05 | 2015-09-29 | Microsoft Technology Licensing, Llc | Action generation based on voice data |
US8843316B2 (en) * | 2012-01-09 | 2014-09-23 | Blackberry Limited | Method to geo-tag streaming music |
US10134385B2 (en) | 2012-03-02 | 2018-11-20 | Apple Inc. | Systems and methods for name pronunciation |
US9483461B2 (en) | 2012-03-06 | 2016-11-01 | Apple Inc. | Handling speech synthesis of content for multiple languages |
US9280610B2 (en) | 2012-05-14 | 2016-03-08 | Apple Inc. | Crowd sourcing information to fulfill user requests |
US10417037B2 (en) | 2012-05-15 | 2019-09-17 | Apple Inc. | Systems and methods for integrating third party services with a digital assistant |
US9721563B2 (en) | 2012-06-08 | 2017-08-01 | Apple Inc. | Name recognition system |
US9495129B2 (en) | 2012-06-29 | 2016-11-15 | Apple Inc. | Device, method, and user interface for voice-activated navigation and browsing of a document |
US9576574B2 (en) | 2012-09-10 | 2017-02-21 | Apple Inc. | Context-sensitive handling of interruptions by intelligent digital assistant |
US9547647B2 (en) | 2012-09-19 | 2017-01-17 | Apple Inc. | Voice-based media searching |
DE112014000709B4 (de) | 2013-02-07 | 2021-12-30 | Apple Inc. | Verfahren und vorrichtung zum betrieb eines sprachtriggers für einen digitalen assistenten |
US9184777B2 (en) | 2013-02-14 | 2015-11-10 | Ford Global Technologies, Llc | Method and system for personalized dealership customer service |
US9368114B2 (en) | 2013-03-14 | 2016-06-14 | Apple Inc. | Context-sensitive handling of interruptions |
US9922642B2 (en) | 2013-03-15 | 2018-03-20 | Apple Inc. | Training an at least partial voice command system |
WO2014144579A1 (en) | 2013-03-15 | 2014-09-18 | Apple Inc. | System and method for updating an adaptive speech recognition model |
US9786102B2 (en) | 2013-03-15 | 2017-10-10 | Ford Global Technologies, Llc | System and method for wireless vehicle content determination |
JP6198432B2 (ja) * | 2013-04-09 | 2017-09-20 | 小島プレス工業株式会社 | 音声認識制御装置 |
US9582608B2 (en) | 2013-06-07 | 2017-02-28 | Apple Inc. | Unified ranking with entropy-weighted information for phrase-based semantic auto-completion |
WO2014197336A1 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for detecting errors in interactions with a voice-based digital assistant |
WO2014197334A2 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for user-specified pronunciation of words for speech synthesis and recognition |
WO2014197335A1 (en) | 2013-06-08 | 2014-12-11 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
EP3008641A1 (en) | 2013-06-09 | 2016-04-20 | Apple Inc. | Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant |
US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
WO2014200731A1 (en) | 2013-06-13 | 2014-12-18 | Apple Inc. | System and method for emergency calls initiated by voice command |
US10296160B2 (en) | 2013-12-06 | 2019-05-21 | Apple Inc. | Method for extracting salient dialog usage from live data |
US9620105B2 (en) | 2014-05-15 | 2017-04-11 | Apple Inc. | Analyzing audio input for efficient speech and music recognition |
US10592095B2 (en) | 2014-05-23 | 2020-03-17 | Apple Inc. | Instantaneous speaking of content on touch devices |
US9502031B2 (en) | 2014-05-27 | 2016-11-22 | Apple Inc. | Method for supporting dynamic grammars in WFST-based ASR |
AU2015266863B2 (en) | 2014-05-30 | 2018-03-15 | Apple Inc. | Multi-command single utterance input method |
US9734193B2 (en) | 2014-05-30 | 2017-08-15 | Apple Inc. | Determining domain salience ranking from ambiguous words in natural speech |
US10078631B2 (en) | 2014-05-30 | 2018-09-18 | Apple Inc. | Entropy-guided text prediction using combined word and character n-gram language models |
US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
US9633004B2 (en) | 2014-05-30 | 2017-04-25 | Apple Inc. | Better resolution when referencing to concepts |
US10289433B2 (en) | 2014-05-30 | 2019-05-14 | Apple Inc. | Domain specific language for encoding assistant dialog |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US9842101B2 (en) | 2014-05-30 | 2017-12-12 | Apple Inc. | Predictive conversion of language input |
US9760559B2 (en) | 2014-05-30 | 2017-09-12 | Apple Inc. | Predictive text input |
US9430463B2 (en) | 2014-05-30 | 2016-08-30 | Apple Inc. | Exemplar-based natural language processing |
US9785630B2 (en) | 2014-05-30 | 2017-10-10 | Apple Inc. | Text prediction using combined word N-gram and unigram language models |
US10659851B2 (en) | 2014-06-30 | 2020-05-19 | Apple Inc. | Real-time digital assistant knowledge updates |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US10446141B2 (en) | 2014-08-28 | 2019-10-15 | Apple Inc. | Automatic speech recognition based on user feedback |
US9818400B2 (en) | 2014-09-11 | 2017-11-14 | Apple Inc. | Method and apparatus for discovering trending terms in speech requests |
US10789041B2 (en) | 2014-09-12 | 2020-09-29 | Apple Inc. | Dynamic thresholds for always listening speech trigger |
US20160094601A1 (en) * | 2014-09-30 | 2016-03-31 | The Nielsen Company (Us), Llc | Methods and apparatus to measure exposure to streaming media |
US9646609B2 (en) | 2014-09-30 | 2017-05-09 | Apple Inc. | Caching apparatus for serving phonetic pronunciations |
US9886432B2 (en) | 2014-09-30 | 2018-02-06 | Apple Inc. | Parsimonious handling of word inflection via categorical stem + suffix N-gram language models |
US9668121B2 (en) | 2014-09-30 | 2017-05-30 | Apple Inc. | Social reminders |
US10127911B2 (en) | 2014-09-30 | 2018-11-13 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
US10074360B2 (en) | 2014-09-30 | 2018-09-11 | Apple Inc. | Providing an indication of the suitability of speech recognition |
US10552013B2 (en) | 2014-12-02 | 2020-02-04 | Apple Inc. | Data detection |
US9711141B2 (en) | 2014-12-09 | 2017-07-18 | Apple Inc. | Disambiguating heteronyms in speech synthesis |
US20160173675A1 (en) * | 2014-12-16 | 2016-06-16 | Hyundai Motor Company | In-vehicle multimedia system considering call situation and method for controlling the same |
US10152299B2 (en) | 2015-03-06 | 2018-12-11 | Apple Inc. | Reducing response latency of intelligent automated assistants |
US9865280B2 (en) | 2015-03-06 | 2018-01-09 | Apple Inc. | Structured dictation using intelligent automated assistants |
US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
US10567477B2 (en) | 2015-03-08 | 2020-02-18 | Apple Inc. | Virtual assistant continuity |
US9721566B2 (en) | 2015-03-08 | 2017-08-01 | Apple Inc. | Competing devices responding to voice triggers |
US9899019B2 (en) | 2015-03-18 | 2018-02-20 | Apple Inc. | Systems and methods for structured stem and suffix language models |
US9842105B2 (en) | 2015-04-16 | 2017-12-12 | Apple Inc. | Parsimonious continuous-space phrase representations for natural language processing |
US10460227B2 (en) | 2015-05-15 | 2019-10-29 | Apple Inc. | Virtual assistant in a communication session |
US10083688B2 (en) | 2015-05-27 | 2018-09-25 | Apple Inc. | Device voice control for selecting a displayed affordance |
US10127220B2 (en) | 2015-06-04 | 2018-11-13 | Apple Inc. | Language identification from short strings |
US10101822B2 (en) | 2015-06-05 | 2018-10-16 | Apple Inc. | Language input correction |
US9578173B2 (en) | 2015-06-05 | 2017-02-21 | Apple Inc. | Virtual assistant aided communication with 3rd party service in a communication session |
US10255907B2 (en) | 2015-06-07 | 2019-04-09 | Apple Inc. | Automatic accent detection using acoustic models |
US11025565B2 (en) | 2015-06-07 | 2021-06-01 | Apple Inc. | Personalized prediction of responses for instant messaging |
US10186254B2 (en) | 2015-06-07 | 2019-01-22 | Apple Inc. | Context-based endpoint detection |
US20160378747A1 (en) | 2015-06-29 | 2016-12-29 | Apple Inc. | Virtual assistant for media playback |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
US9697820B2 (en) | 2015-09-24 | 2017-07-04 | Apple Inc. | Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks |
US10366158B2 (en) | 2015-09-29 | 2019-07-30 | Apple Inc. | Efficient word encoding for recurrent neural network language models |
US11010550B2 (en) | 2015-09-29 | 2021-05-18 | Apple Inc. | Unified language modeling framework for word prediction, auto-completion and auto-correction |
US11587559B2 (en) | 2015-09-30 | 2023-02-21 | Apple Inc. | Intelligent device identification |
US10083685B2 (en) * | 2015-10-13 | 2018-09-25 | GM Global Technology Operations LLC | Dynamically adding or removing functionality to speech recognition systems |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10049668B2 (en) | 2015-12-02 | 2018-08-14 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition |
US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
US9965247B2 (en) | 2016-02-22 | 2018-05-08 | Sonos, Inc. | Voice controlled media playback system based on user profile |
US9947316B2 (en) | 2016-02-22 | 2018-04-17 | Sonos, Inc. | Voice control of a media playback system |
US10509626B2 (en) | 2016-02-22 | 2019-12-17 | Sonos, Inc | Handling of loss of pairing between networked devices |
US10095470B2 (en) | 2016-02-22 | 2018-10-09 | Sonos, Inc. | Audio response playback |
US9820039B2 (en) | 2016-02-22 | 2017-11-14 | Sonos, Inc. | Default playback devices |
US10097939B2 (en) | 2016-02-22 | 2018-10-09 | Sonos, Inc. | Compensation for speaker nonlinearities |
US10264030B2 (en) | 2016-02-22 | 2019-04-16 | Sonos, Inc. | Networked microphone device control |
US10446143B2 (en) | 2016-03-14 | 2019-10-15 | Apple Inc. | Identification of voice inputs providing credentials |
US9934775B2 (en) | 2016-05-26 | 2018-04-03 | Apple Inc. | Unit-selection text-to-speech synthesis based on predicted concatenation parameters |
US9972304B2 (en) | 2016-06-03 | 2018-05-15 | Apple Inc. | Privacy preserving distributed evaluation framework for embedded personalized systems |
US11227589B2 (en) | 2016-06-06 | 2022-01-18 | Apple Inc. | Intelligent list reading |
US10049663B2 (en) | 2016-06-08 | 2018-08-14 | Apple, Inc. | Intelligent automated assistant for media exploration |
DK179309B1 (en) | 2016-06-09 | 2018-04-23 | Apple Inc | Intelligent automated assistant in a home environment |
US9978390B2 (en) | 2016-06-09 | 2018-05-22 | Sonos, Inc. | Dynamic player selection for audio signal processing |
US10192552B2 (en) | 2016-06-10 | 2019-01-29 | Apple Inc. | Digital assistant providing whispered speech |
US10509862B2 (en) | 2016-06-10 | 2019-12-17 | Apple Inc. | Dynamic phrase expansion of language input |
US10067938B2 (en) | 2016-06-10 | 2018-09-04 | Apple Inc. | Multilingual word prediction |
US10490187B2 (en) | 2016-06-10 | 2019-11-26 | Apple Inc. | Digital assistant providing automated status report |
US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
DK179343B1 (en) | 2016-06-11 | 2018-05-14 | Apple Inc | Intelligent task discovery |
DK179049B1 (en) | 2016-06-11 | 2017-09-18 | Apple Inc | Data driven natural language event detection and classification |
DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
US10134399B2 (en) | 2016-07-15 | 2018-11-20 | Sonos, Inc. | Contextualization of voice inputs |
US10152969B2 (en) | 2016-07-15 | 2018-12-11 | Sonos, Inc. | Voice detection by multiple devices |
US9693164B1 (en) | 2016-08-05 | 2017-06-27 | Sonos, Inc. | Determining direction of networked microphone device relative to audio playback device |
US10115400B2 (en) | 2016-08-05 | 2018-10-30 | Sonos, Inc. | Multiple voice services |
US10474753B2 (en) | 2016-09-07 | 2019-11-12 | Apple Inc. | Language identification using recurrent neural networks |
US9794720B1 (en) | 2016-09-22 | 2017-10-17 | Sonos, Inc. | Acoustic position measurement |
US10043516B2 (en) | 2016-09-23 | 2018-08-07 | Apple Inc. | Intelligent automated assistant |
US9942678B1 (en) | 2016-09-27 | 2018-04-10 | Sonos, Inc. | Audio playback settings for voice interaction |
US9743204B1 (en) | 2016-09-30 | 2017-08-22 | Sonos, Inc. | Multi-orientation playback device microphones |
US10181323B2 (en) | 2016-10-19 | 2019-01-15 | Sonos, Inc. | Arbitration-based voice recognition |
US11281993B2 (en) | 2016-12-05 | 2022-03-22 | Apple Inc. | Model and ensemble compression for metric learning |
US10593346B2 (en) | 2016-12-22 | 2020-03-17 | Apple Inc. | Rank-reduced token representation for automatic speech recognition |
US11204787B2 (en) | 2017-01-09 | 2021-12-21 | Apple Inc. | Application integration with a digital assistant |
US11183181B2 (en) | 2017-03-27 | 2021-11-23 | Sonos, Inc. | Systems and methods of multiple voice services |
US10417266B2 (en) | 2017-05-09 | 2019-09-17 | Apple Inc. | Context-aware ranking of intelligent response suggestions |
DK201770383A1 (en) | 2017-05-09 | 2018-12-14 | Apple Inc. | USER INTERFACE FOR CORRECTING RECOGNITION ERRORS |
US10726832B2 (en) | 2017-05-11 | 2020-07-28 | Apple Inc. | Maintaining privacy of personal information |
US10395654B2 (en) | 2017-05-11 | 2019-08-27 | Apple Inc. | Text normalization based on a data-driven learning network |
DK201770439A1 (en) | 2017-05-11 | 2018-12-13 | Apple Inc. | Offline personal assistant |
US11301477B2 (en) | 2017-05-12 | 2022-04-12 | Apple Inc. | Feedback analysis of a digital assistant |
DK201770427A1 (en) | 2017-05-12 | 2018-12-20 | Apple Inc. | LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT |
DK179496B1 (en) | 2017-05-12 | 2019-01-15 | Apple Inc. | USER-SPECIFIC Acoustic Models |
DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
DK201770431A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
DK201770432A1 (en) | 2017-05-15 | 2018-12-21 | Apple Inc. | Hierarchical belief states for digital assistants |
US10311144B2 (en) | 2017-05-16 | 2019-06-04 | Apple Inc. | Emoji word sense disambiguation |
US10403278B2 (en) | 2017-05-16 | 2019-09-03 | Apple Inc. | Methods and systems for phonetic matching in digital assistant services |
DK179560B1 (en) | 2017-05-16 | 2019-02-18 | Apple Inc. | FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES |
US10303715B2 (en) | 2017-05-16 | 2019-05-28 | Apple Inc. | Intelligent automated assistant for media exploration |
US10657328B2 (en) | 2017-06-02 | 2020-05-19 | Apple Inc. | Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling |
US10475449B2 (en) | 2017-08-07 | 2019-11-12 | Sonos, Inc. | Wake-word detection suppression |
US10048930B1 (en) | 2017-09-08 | 2018-08-14 | Sonos, Inc. | Dynamic computation of system response volume |
US10445429B2 (en) | 2017-09-21 | 2019-10-15 | Apple Inc. | Natural language understanding using vocabularies with compressed serialized tries |
US10446165B2 (en) | 2017-09-27 | 2019-10-15 | Sonos, Inc. | Robust short-time fourier transform acoustic echo cancellation during audio playback |
US10051366B1 (en) | 2017-09-28 | 2018-08-14 | Sonos, Inc. | Three-dimensional beam forming with a microphone array |
US10621981B2 (en) | 2017-09-28 | 2020-04-14 | Sonos, Inc. | Tone interference cancellation |
US10482868B2 (en) | 2017-09-28 | 2019-11-19 | Sonos, Inc. | Multi-channel acoustic echo cancellation |
US10466962B2 (en) | 2017-09-29 | 2019-11-05 | Sonos, Inc. | Media playback system with voice assistance |
US10755051B2 (en) | 2017-09-29 | 2020-08-25 | Apple Inc. | Rule-based natural language processing |
CN107895016B (zh) * | 2017-11-14 | 2022-02-15 | 百度在线网络技术(北京)有限公司 | 一种播放多媒体的方法和装置 |
US10636424B2 (en) | 2017-11-30 | 2020-04-28 | Apple Inc. | Multi-turn canned dialog |
US10880650B2 (en) | 2017-12-10 | 2020-12-29 | Sonos, Inc. | Network microphone devices with automatic do not disturb actuation capabilities |
US10818290B2 (en) | 2017-12-11 | 2020-10-27 | Sonos, Inc. | Home graph |
EP3506255A1 (en) * | 2017-12-28 | 2019-07-03 | Spotify AB | Voice feedback for user interface of media playback device |
US10733982B2 (en) | 2018-01-08 | 2020-08-04 | Apple Inc. | Multi-directional dialog |
US10733375B2 (en) | 2018-01-31 | 2020-08-04 | Apple Inc. | Knowledge-based framework for improving natural language understanding |
US11343614B2 (en) | 2018-01-31 | 2022-05-24 | Sonos, Inc. | Device designation of playback and network microphone device arrangements |
US10789959B2 (en) | 2018-03-02 | 2020-09-29 | Apple Inc. | Training speaker recognition models for digital assistants |
US10592604B2 (en) | 2018-03-12 | 2020-03-17 | Apple Inc. | Inverse text normalization for automatic speech recognition |
US10818288B2 (en) | 2018-03-26 | 2020-10-27 | Apple Inc. | Natural assistant interaction |
US10909331B2 (en) | 2018-03-30 | 2021-02-02 | Apple Inc. | Implicit identification of translation payload with neural machine translation |
US10928918B2 (en) | 2018-05-07 | 2021-02-23 | Apple Inc. | Raise to speak |
US11145294B2 (en) | 2018-05-07 | 2021-10-12 | Apple Inc. | Intelligent automated assistant for delivering content from user experiences |
US11175880B2 (en) | 2018-05-10 | 2021-11-16 | Sonos, Inc. | Systems and methods for voice-assisted media content selection |
US10847178B2 (en) | 2018-05-18 | 2020-11-24 | Sonos, Inc. | Linear filtering for noise-suppressed speech detection |
US10984780B2 (en) | 2018-05-21 | 2021-04-20 | Apple Inc. | Global semantic word embeddings using bi-directional recurrent neural networks |
US10959029B2 (en) | 2018-05-25 | 2021-03-23 | Sonos, Inc. | Determining and adapting to changes in microphone performance of playback devices |
DK179822B1 (da) | 2018-06-01 | 2019-07-12 | Apple Inc. | Voice interaction at a primary device to access call functionality of a companion device |
US10892996B2 (en) | 2018-06-01 | 2021-01-12 | Apple Inc. | Variable latency device coordination |
DK201870355A1 (en) | 2018-06-01 | 2019-12-16 | Apple Inc. | VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS |
DK180639B1 (en) | 2018-06-01 | 2021-11-04 | Apple Inc | DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT |
US11386266B2 (en) | 2018-06-01 | 2022-07-12 | Apple Inc. | Text correction |
US11076039B2 (en) | 2018-06-03 | 2021-07-27 | Apple Inc. | Accelerated task performance |
US10681460B2 (en) | 2018-06-28 | 2020-06-09 | Sonos, Inc. | Systems and methods for associating playback devices with voice assistant services |
US10461710B1 (en) | 2018-08-28 | 2019-10-29 | Sonos, Inc. | Media playback system with maximum volume setting |
US11076035B2 (en) | 2018-08-28 | 2021-07-27 | Sonos, Inc. | Do not disturb feature for audio notifications |
US10878811B2 (en) | 2018-09-14 | 2020-12-29 | Sonos, Inc. | Networked devices, systems, and methods for intelligently deactivating wake-word engines |
US10587430B1 (en) | 2018-09-14 | 2020-03-10 | Sonos, Inc. | Networked devices, systems, and methods for associating playback devices based on sound codes |
US11024331B2 (en) | 2018-09-21 | 2021-06-01 | Sonos, Inc. | Voice detection optimization using sound metadata |
US10811015B2 (en) | 2018-09-25 | 2020-10-20 | Sonos, Inc. | Voice detection optimization based on selected voice assistant service |
US11010561B2 (en) | 2018-09-27 | 2021-05-18 | Apple Inc. | Sentiment prediction from textual data |
US11462215B2 (en) | 2018-09-28 | 2022-10-04 | Apple Inc. | Multi-modal inputs for voice commands |
US11170166B2 (en) | 2018-09-28 | 2021-11-09 | Apple Inc. | Neural typographical error modeling via generative adversarial networks |
US10839159B2 (en) | 2018-09-28 | 2020-11-17 | Apple Inc. | Named entity normalization in a spoken dialog system |
US11100923B2 (en) | 2018-09-28 | 2021-08-24 | Sonos, Inc. | Systems and methods for selective wake word detection using neural network models |
US10692518B2 (en) | 2018-09-29 | 2020-06-23 | Sonos, Inc. | Linear filtering for noise-suppressed speech detection via multiple network microphone devices |
US11899519B2 (en) | 2018-10-23 | 2024-02-13 | Sonos, Inc. | Multiple stage network microphone device with reduced power consumption and processing load |
US11475898B2 (en) | 2018-10-26 | 2022-10-18 | Apple Inc. | Low-latency multi-speaker speech recognition |
EP3654249A1 (en) | 2018-11-15 | 2020-05-20 | Snips | Dilated convolutions and gating for efficient keyword spotting |
US11183183B2 (en) | 2018-12-07 | 2021-11-23 | Sonos, Inc. | Systems and methods of operating media playback systems having multiple voice assistant services |
US11132989B2 (en) | 2018-12-13 | 2021-09-28 | Sonos, Inc. | Networked microphone devices, systems, and methods of localized arbitration |
US10602268B1 (en) | 2018-12-20 | 2020-03-24 | Sonos, Inc. | Optimization of network microphone devices using noise classification |
US11638059B2 (en) | 2019-01-04 | 2023-04-25 | Apple Inc. | Content playback on multiple devices |
US10867604B2 (en) | 2019-02-08 | 2020-12-15 | Sonos, Inc. | Devices, systems, and methods for distributed voice processing |
US11315556B2 (en) | 2019-02-08 | 2022-04-26 | Sonos, Inc. | Devices, systems, and methods for distributed voice processing by transmitting sound data associated with a wake word to an appropriate device for identification |
US11348573B2 (en) | 2019-03-18 | 2022-05-31 | Apple Inc. | Multimodality in digital assistant systems |
US11133004B1 (en) * | 2019-03-27 | 2021-09-28 | Amazon Technologies, Inc. | Accessory for an audio output device |
US11120794B2 (en) | 2019-05-03 | 2021-09-14 | Sonos, Inc. | Voice assistant persistence across multiple network microphone devices |
US11307752B2 (en) | 2019-05-06 | 2022-04-19 | Apple Inc. | User configurable task triggers |
US11423908B2 (en) | 2019-05-06 | 2022-08-23 | Apple Inc. | Interpreting spoken requests |
US11475884B2 (en) | 2019-05-06 | 2022-10-18 | Apple Inc. | Reducing digital assistant latency when a language is incorrectly determined |
DK201970509A1 (en) | 2019-05-06 | 2021-01-15 | Apple Inc | Spoken notifications |
US11140099B2 (en) | 2019-05-21 | 2021-10-05 | Apple Inc. | Providing message response suggestions |
US11289073B2 (en) | 2019-05-31 | 2022-03-29 | Apple Inc. | Device text to speech |
US11496600B2 (en) | 2019-05-31 | 2022-11-08 | Apple Inc. | Remote execution of machine-learned models |
DK180129B1 (en) | 2019-05-31 | 2020-06-02 | Apple Inc. | USER ACTIVITY SHORTCUT SUGGESTIONS |
US11360641B2 (en) | 2019-06-01 | 2022-06-14 | Apple Inc. | Increasing the relevance of new available information |
US11200894B2 (en) | 2019-06-12 | 2021-12-14 | Sonos, Inc. | Network microphone device with command keyword eventing |
US10586540B1 (en) | 2019-06-12 | 2020-03-10 | Sonos, Inc. | Network microphone device with command keyword conditioning |
US11361756B2 (en) | 2019-06-12 | 2022-06-14 | Sonos, Inc. | Conditional wake word eventing based on environment |
US11138975B2 (en) | 2019-07-31 | 2021-10-05 | Sonos, Inc. | Locally distributed keyword detection |
US11138969B2 (en) | 2019-07-31 | 2021-10-05 | Sonos, Inc. | Locally distributed keyword detection |
US10871943B1 (en) | 2019-07-31 | 2020-12-22 | Sonos, Inc. | Noise classification for event detection |
US11488406B2 (en) | 2019-09-25 | 2022-11-01 | Apple Inc. | Text detection using global geometry estimators |
US11189286B2 (en) | 2019-10-22 | 2021-11-30 | Sonos, Inc. | VAS toggle based on device orientation |
US11200900B2 (en) | 2019-12-20 | 2021-12-14 | Sonos, Inc. | Offline voice control |
US11562740B2 (en) | 2020-01-07 | 2023-01-24 | Sonos, Inc. | Voice verification for media playback |
US11556307B2 (en) | 2020-01-31 | 2023-01-17 | Sonos, Inc. | Local voice data processing |
US11308958B2 (en) | 2020-02-07 | 2022-04-19 | Sonos, Inc. | Localized wakeword verification |
IT202000005143A1 (it) * | 2020-03-11 | 2021-09-11 | St Microelectronics Srl | Procedimento per gestire librerie mediali, sistema e prodotto informatico corrispondenti |
US11727919B2 (en) | 2020-05-20 | 2023-08-15 | Sonos, Inc. | Memory allocation for keyword spotting engines |
US11308962B2 (en) | 2020-05-20 | 2022-04-19 | Sonos, Inc. | Input detection windowing |
US11482224B2 (en) | 2020-05-20 | 2022-10-25 | Sonos, Inc. | Command keywords with input detection windowing |
US11698771B2 (en) | 2020-08-25 | 2023-07-11 | Sonos, Inc. | Vocal guidance engines for playback devices |
US11908468B2 (en) * | 2020-09-21 | 2024-02-20 | Amazon Technologies, Inc. | Dialog management for multiple users |
US11984123B2 (en) | 2020-11-12 | 2024-05-14 | Sonos, Inc. | Network device interaction by range |
US11551700B2 (en) | 2021-01-25 | 2023-01-10 | Sonos, Inc. | Systems and methods for power-efficient keyword detection |
Family Cites Families (85)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3704345A (en) | 1971-03-19 | 1972-11-28 | Bell Telephone Labor Inc | Conversion of printed text into synthetic speech |
US4827520A (en) * | 1987-01-16 | 1989-05-02 | Prince Corporation | Voice actuated control system for use in a vehicle |
US5479155A (en) * | 1988-12-05 | 1995-12-26 | Prince Corporation | Vehicle accessory trainable transmitter |
US5475366A (en) * | 1988-12-05 | 1995-12-12 | Prince Corporation | Electrical control system for vehicle options |
US5614885A (en) * | 1988-12-05 | 1997-03-25 | Prince Corporation | Electrical control system for vehicle options |
US5479157A (en) * | 1990-01-19 | 1995-12-26 | Prince Corporation | Remote vehicle programming system |
US5717387A (en) * | 1990-01-19 | 1998-02-10 | Prince Corporation | Remote vehicle programming system |
US5113182B1 (en) * | 1990-01-19 | 1995-11-07 | Prince Corp | Vehicle door locking system detecting that all doors are closed |
US5627529A (en) * | 1994-03-11 | 1997-05-06 | Prince Corporation | Vehicle control system with trainable transceiver |
EP0472356B1 (en) | 1990-08-16 | 1994-03-30 | Fujitsu Ten Limited | Speech recognition apparatus for a vehicle, using a microphone arrangement to determine the seat from which a command is generated |
JPH05290382A (ja) | 1992-04-08 | 1993-11-05 | Matsushita Electric Ind Co Ltd | 音楽記録媒体 |
US5384893A (en) | 1992-09-23 | 1995-01-24 | Emerson & Stern Associates, Inc. | Method and apparatus for speech synthesis based on prosodic analysis |
US5903226A (en) * | 1993-03-15 | 1999-05-11 | Prince Corporation | Trainable RF system for remotely controlling household appliances |
JP2897659B2 (ja) | 1994-10-31 | 1999-05-31 | ヤマハ株式会社 | カラオケ装置 |
US5794164A (en) | 1995-11-29 | 1998-08-11 | Microsoft Corporation | Vehicle computer system |
US6028537A (en) * | 1996-06-14 | 2000-02-22 | Prince Corporation | Vehicle communication and remote control system |
US5854593A (en) * | 1996-07-26 | 1998-12-29 | Prince Corporation | Fast scan trainable transmitter |
US7058376B2 (en) | 1999-01-27 | 2006-06-06 | Logan James D | Radio receiving, recording and playback system |
US20020120925A1 (en) | 2000-03-28 | 2002-08-29 | Logan James D. | Audio and video program recording, editing and playback systems using metadata |
US7295752B1 (en) * | 1997-08-14 | 2007-11-13 | Virage, Inc. | Video cataloger system with audio track extraction |
US6584181B1 (en) * | 1997-09-19 | 2003-06-24 | Siemens Information & Communication Networks, Inc. | System and method for organizing multi-media messages folders from a displayless interface and selectively retrieving information using voice labels |
US5926087A (en) * | 1997-12-22 | 1999-07-20 | Prince Corporation | Visor parameter monitor and display |
US6154148A (en) * | 1997-12-22 | 2000-11-28 | Prince Corporation | Vehicle-to-individual paging system |
US6078885A (en) | 1998-05-08 | 2000-06-20 | At&T Corp | Verbal, fully automatic dictionary updates by end-users of speech synthesis and recognition systems |
JP4794707B2 (ja) * | 1998-11-17 | 2011-10-19 | ソニー株式会社 | 端末装置、課金システム、データ処理方法 |
US20020048224A1 (en) | 1999-01-05 | 2002-04-25 | Dygert Timothy W. | Playback device having text display and communication with remote database of titles |
US7787907B2 (en) * | 1999-05-26 | 2010-08-31 | Johnson Controls Technology Company | System and method for using speech recognition with a vehicle control system |
US7346374B2 (en) * | 1999-05-26 | 2008-03-18 | Johnson Controls Technology Company | Wireless communications system and method |
EP1852836A3 (en) * | 1999-05-26 | 2011-03-30 | Johnson Controls Technology Company | Wireless communications system and method |
US6622083B1 (en) | 1999-06-01 | 2003-09-16 | Siemens Vdo Automotive Corporation | Portable driver information device |
ATE320650T1 (de) | 1999-06-30 | 2006-04-15 | Ibm | Verfahren zur erweiterung des wortschatzes eines spracherkennungssystems |
US6526335B1 (en) | 2000-01-24 | 2003-02-25 | G. Victor Treyz | Automobile personal computer systems |
JP3959219B2 (ja) | 2000-01-31 | 2007-08-15 | クラリオン株式会社 | 車両無線データ通信システム |
US20020090596A1 (en) | 2000-02-09 | 2002-07-11 | Sosoka John R. | Apparatus, systems and methods for electronically teaching phonics |
US6389337B1 (en) | 2000-04-24 | 2002-05-14 | H. Brock Kolls | Transacting e-commerce and conducting e-business related to identifying and procuring automotive service and vehicle replacement parts |
US20020049717A1 (en) | 2000-05-10 | 2002-04-25 | Routtenberg Michael D. | Digital content distribution system and method |
US6874018B2 (en) | 2000-08-07 | 2005-03-29 | Networks Associates Technology, Inc. | Method and system for playing associated audible advertisement simultaneously with the display of requested content on handheld devices and sending a visual warning when the audio channel is off |
US20020091706A1 (en) * | 2000-09-06 | 2002-07-11 | Johnson Controls Technology Company | Vehicle history and personalization information management system and method |
WO2002022405A2 (en) * | 2000-09-18 | 2002-03-21 | Johnson Controls Technology Company | Digital memo recorder having removable memory unit for vehicle interior |
JP2002149166A (ja) | 2000-11-09 | 2002-05-24 | Yamaha Corp | 楽曲情報配信装置、方法、及び記録媒体 |
US7099946B2 (en) | 2000-11-13 | 2006-08-29 | Canon Kabushiki Kaishsa | Transferring a media browsing session from one device to a second device by transferring a session identifier and a session key to the second device |
US6973427B2 (en) | 2000-12-26 | 2005-12-06 | Microsoft Corporation | Method for adding phonetic descriptions to a speech recognition lexicon |
US20020086719A1 (en) | 2000-12-29 | 2002-07-04 | Pankaj Kedia | Low power subsystem for portable computers |
US6993532B1 (en) | 2001-05-30 | 2006-01-31 | Microsoft Corporation | Auto playlist generator |
US7251452B2 (en) | 2001-07-09 | 2007-07-31 | Sirius Satellite Radio | System and method for creating and receiving personalized broadcasts |
JP4422930B2 (ja) | 2001-08-07 | 2010-03-03 | パイオニア株式会社 | 情報処理システム、情報処理システムの情報処理方法、情報処理装置および情報処理プログラム |
US20030109218A1 (en) | 2001-10-18 | 2003-06-12 | Azalea Microelectronics Corporation | Portable wireless storage unit |
US6859803B2 (en) | 2001-11-13 | 2005-02-22 | Koninklijke Philips Electronics N.V. | Apparatus and method for program selection utilizing exclusive and inclusive metadata searches |
US7483832B2 (en) | 2001-12-10 | 2009-01-27 | At&T Intellectual Property I, L.P. | Method and system for customizing voice translation of text to speech |
US20030110079A1 (en) | 2001-12-12 | 2003-06-12 | Weisman Mitchell T. | Method and apparatus for providing items to users in a computer network |
US7069510B2 (en) | 2002-01-16 | 2006-06-27 | Microsoft Corporation | In-vehicle audio browser system having a common usability model |
US7188066B2 (en) | 2002-02-04 | 2007-03-06 | Microsoft Corporation | Speech controls for use with a speech system |
US20030158737A1 (en) | 2002-02-15 | 2003-08-21 | Csicsatka Tibor George | Method and apparatus for incorporating additional audio information into audio data file identifying information |
US8150937B2 (en) * | 2004-10-25 | 2012-04-03 | Apple Inc. | Wireless synchronization between media player and host device |
US20040203379A1 (en) * | 2002-04-23 | 2004-10-14 | Johnson Controls Technology Company | Bluetooth transmission of vehicle diagnostic information |
US20040110472A1 (en) * | 2002-04-23 | 2004-06-10 | Johnson Controls Technology Company | Wireless communication system and method |
US20040033821A1 (en) | 2002-08-16 | 2004-02-19 | Visteon Global Technologies, Inc. | In-vehicle entertainment system |
US7047039B2 (en) | 2002-09-09 | 2006-05-16 | Hewlett-Packard Development Company, L.P. | System for streaming broadcast signals from automobiles |
US7169996B2 (en) | 2002-11-12 | 2007-01-30 | Medialab Solutions Llc | Systems and methods for generating music using data/music data file transmitted/received via a network |
US20040117442A1 (en) | 2002-12-10 | 2004-06-17 | Thielen Kurt R. | Handheld portable wireless digital content player |
US20050239434A1 (en) | 2002-12-11 | 2005-10-27 | Marlowe Ira M | Multimedia device integration system |
CN1729276A (zh) * | 2002-12-19 | 2006-02-01 | 皇家飞利浦电子股份有限公司 | 用于网络下载音乐文件的方法和系统 |
US7191193B2 (en) * | 2003-01-02 | 2007-03-13 | Catch Media | Automatic digital music library builder |
JP2006523416A (ja) * | 2003-03-24 | 2006-10-12 | ジョンソン コントロールズ テクノロジー カンパニー | 車載無線通信システムを構成するシステムおよび方法 |
JP2004309795A (ja) | 2003-04-07 | 2004-11-04 | Mitsubishi Electric Corp | 音楽提供システム |
US7213036B2 (en) * | 2003-08-12 | 2007-05-01 | Aol Llc | System for incorporating information about a source and usage of a media asset into the asset itself |
WO2005042314A1 (en) * | 2003-10-21 | 2005-05-12 | Johnson Controls Technology Company | System and method for selecting a user speech profile for a device in a vehicle |
US20060034481A1 (en) | 2003-11-03 | 2006-02-16 | Farhad Barzegar | Systems, methods, and devices for processing audio signals |
US20050099547A1 (en) | 2003-11-07 | 2005-05-12 | Vitito Christopher J. | Automobile entertainment system |
US20050235327A1 (en) | 2003-11-07 | 2005-10-20 | Vitito Christopher J | Vehicle entertainment system |
US20050223406A1 (en) | 2003-11-07 | 2005-10-06 | Vitito Christopher J | Vehicle entertainment system including a detachable video system with a hard drive based video source |
US20050235326A1 (en) | 2003-11-07 | 2005-10-20 | Vitito Christopher J | Vehicle entertainment system |
US20050155068A1 (en) | 2004-01-08 | 2005-07-14 | Chang Chung L. | Multi-media player |
US7346370B2 (en) * | 2004-04-29 | 2008-03-18 | Cellport Systems, Inc. | Enabling interoperability between distributed devices using different communication link technologies |
US20050281414A1 (en) | 2004-06-18 | 2005-12-22 | Simon Gregory R | Method and apparatus for control of personal digital media devices using a vehicle audio system |
US7908141B2 (en) * | 2004-09-29 | 2011-03-15 | International Business Machines Corporation | Extracting and utilizing metadata to improve accuracy in speech to text conversions |
WO2006074110A2 (en) * | 2005-01-05 | 2006-07-13 | Divx, Inc. | System and method for a remote user interface |
US20060181963A1 (en) * | 2005-02-11 | 2006-08-17 | Clayton Richard M | Wireless adaptor for content transfer |
EP1693829B1 (en) * | 2005-02-21 | 2018-12-05 | Harman Becker Automotive Systems GmbH | Voice-controlled data system |
WO2007022533A2 (en) * | 2005-08-19 | 2007-02-22 | Gracenote, Inc. | Method and system to control operation of a playback device |
US7684991B2 (en) * | 2006-01-05 | 2010-03-23 | Alpine Electronics, Inc. | Digital audio file search method and apparatus using text-to-speech processing |
CN101449538A (zh) | 2006-04-04 | 2009-06-03 | 约翰逊控制技术公司 | 媒体文件的文本-语法改进 |
US7870142B2 (en) * | 2006-04-04 | 2011-01-11 | Johnson Controls Technology Company | Text to grammar enhancements for media files |
US20080175411A1 (en) * | 2007-01-19 | 2008-07-24 | Greve Jens | Player device with automatic settings |
US7801729B2 (en) * | 2007-03-13 | 2010-09-21 | Sensory, Inc. | Using multiple attributes to create a voice search playlist |
-
2007
- 2007-04-03 CN CNA2007800182756A patent/CN101449538A/zh active Pending
- 2007-04-03 WO PCT/US2007/008063 patent/WO2007123797A1/en active Application Filing
- 2007-04-03 US US12/296,043 patent/US9092435B2/en not_active Expired - Fee Related
- 2007-04-03 EP EP07754568.9A patent/EP2005319B1/en not_active Not-in-force
- 2007-04-03 CN CNA2007800183725A patent/CN101467142A/zh active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102843680A (zh) * | 2011-06-24 | 2012-12-26 | 福特全球技术公司 | 用于蓝牙功能验证的方法 |
CN105723325A (zh) * | 2013-11-13 | 2016-06-29 | 微软技术许可有限责任公司 | 使用因用户而异的语法的媒体项选择 |
US10430024B2 (en) | 2013-11-13 | 2019-10-01 | Microsoft Technology Licensing, Llc | Media item selection using user-specific grammar |
CN105723325B (zh) * | 2013-11-13 | 2019-11-19 | 微软技术许可有限责任公司 | 使用因用户而异的语法的媒体项选择的方法与设备 |
CN112673368A (zh) * | 2018-07-31 | 2021-04-16 | 马维尔国际贸易有限公司 | 用于在存储边缘处生成描述非结构化数据对象的元数据的系统和方法 |
Also Published As
Publication number | Publication date |
---|---|
EP2005319B1 (en) | 2017-01-11 |
US9092435B2 (en) | 2015-07-28 |
US20090326949A1 (en) | 2009-12-31 |
WO2007123797A1 (en) | 2007-11-01 |
EP2005319A1 (en) | 2008-12-24 |
CN101449538A (zh) | 2009-06-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101467142A (zh) | 在车辆中从数字媒体存储设备提取元数据以用于媒体选择的系统和方法 | |
US7870142B2 (en) | Text to grammar enhancements for media files | |
EP1693829B1 (en) | Voice-controlled data system | |
CN1967695B (zh) | 信息处理装置、再现装置、通信方法、再现方法及计算机程序 | |
US10229669B2 (en) | Apparatus, process, and program for combining speech and audio data | |
JP3662969B2 (ja) | カラオケシステム | |
US20050216257A1 (en) | Sound information reproducing apparatus and method of preparing keywords of music data | |
US20200042279A1 (en) | Platform for producing and delivering media content | |
CN107680571A (zh) | 一种歌曲伴奏方法、装置、设备和介质 | |
KR20080043358A (ko) | 재생 디바이스의 동작을 제어하는 방법 및 시스템 | |
KR20080000203A (ko) | 음성인식을 이용한 음악 파일 검색 방법 | |
CN101185115A (zh) | 语音编辑装置、语音编辑方法和语音编辑程序 | |
CN101094445A (zh) | 一种实现文本短信语音播放的系统及方法 | |
CN101908058B (zh) | 计算机实施系统 | |
CN202289477U (zh) | 一种通过无线网络进行语音播放的语音玩具终端设备 | |
US20070260590A1 (en) | Method to Query Large Compressed Audio Databases | |
JP6587459B2 (ja) | カラオケイントロにおける曲紹介システム | |
JP2009092977A (ja) | 車載装置および楽曲検索システム | |
CN109377988A (zh) | 用于智能音箱的交互方法、介质、装置和计算设备 | |
JPH1124685A (ja) | カラオケ装置 | |
US20240169962A1 (en) | Audio data processing method and apparatus | |
JP2009204872A (ja) | 音声認識用辞書生成システム | |
EP2058799B1 (en) | Method for preparing data for speech recognition and speech recognition system | |
JP2007263994A (ja) | カラオケ再生装置 | |
KR100677215B1 (ko) | 엠피3 플레이어의 음성 합성/인식 기능을 이용한 파일선택 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Open date: 20090624 |