CN101467142A - 在车辆中从数字媒体存储设备提取元数据以用于媒体选择的系统和方法 - Google Patents

在车辆中从数字媒体存储设备提取元数据以用于媒体选择的系统和方法 Download PDF

Info

Publication number
CN101467142A
CN101467142A CNA2007800183725A CN200780018372A CN101467142A CN 101467142 A CN101467142 A CN 101467142A CN A2007800183725 A CNA2007800183725 A CN A2007800183725A CN 200780018372 A CN200780018372 A CN 200780018372A CN 101467142 A CN101467142 A CN 101467142A
Authority
CN
China
Prior art keywords
metadata
storage device
media file
media
digital media
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2007800183725A
Other languages
English (en)
Inventor
B·L·杜西特
K·W·施里普塞玛
M·J·西姆斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Johnson Controls Technology Co
Original Assignee
Johnson Controls Technology Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Johnson Controls Technology Co filed Critical Johnson Controls Technology Co
Publication of CN101467142A publication Critical patent/CN101467142A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/48Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/438Presentation of query results
    • G06F16/4387Presentation of query results by the use of playlists
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/56Provisioning of proxy services
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/56Provisioning of proxy services
    • H04L67/568Storing data temporarily at an intermediate stage, e.g. caching
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Library & Information Science (AREA)
  • Management Or Editing Of Information On Record Carriers (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供了一种通过车辆的控制模块和数字媒体存储设备之间的通信链接从车辆中的数字媒体存储设备提取元数据的方法。该方法包括在车辆的控制模块和数字媒体存储设备之间建立通信链接,识别数字媒体存储设备上的媒体文件,以及从媒体文件取得元数据,所述元数据包括多个记录项,其中多个记录项中的至少一个包括文本数据。该方法进一步包括识别媒体文件的记录项中的文本数据以及将多个记录项存储到存储器中。

Description

在车辆中从数字媒体存储设备提取元数据以用于媒体选择的系统和方法
交叉引用
[0001]根据35 U.S.C.§119(e)(1),本申请要求于2006年4月4日提交的、标题为“System and Method for Extraction of Meta Data from a Digital MediaStorage Device for Media Selection in a Vehicle”的美国临时专利申请No.60/789176的优先权(该申请被通过引用全部并入此处)。
技术领域
[0002]本申请总体上涉及从车辆中的数字音频/视频源中提取数据的领域,尤其是涉及从可从车辆中的数字媒体存储设备(例如媒体播放器)中获得的媒体文件中提取元数据并进行处理的系统和方法。
背景技术
[0003]车辆一般包括许多电子系统,例如音频系统、移动电话系统、导航系统、视频娱乐系统等等。与这些系统一起,可将媒体播放器(即数字音频/视频播放器或者MP3播放器)安装在车辆中以便用户访问存储在媒体播放器上的数字音频或者视频内容。常规的媒体播放器包括数据存储设备(即存储器)以及内嵌的软件应用程序,所述软件应用程序允许用户向播放器传送媒体文件并且创建所选媒体文件的自定义列表,即播放列表。媒体文件可以从各种源被传送到播放器的存储器,所述源包括盘(例如CD、DVD等等)以及互联网网站。大多数播放器通过连接端口(例如USB端口、并行端口、串行端口等等)耦合于个人计算机以便传送媒体文件。媒体文件一般包括用于标识文件的内容的数据,被称为元数据。例如,对于数字音频文件,如MP3文件,元数据包括标记格式,所述标记格式包括歌曲标题、艺术家姓名、唱片标题、音轨号、流派等等。MP3(即MPEG音频层III)文件的标记格式通常称为ID3。
[0004]媒体播放器一般被配置成包括其中存储了一个或多个媒体文件的存储器。车辆中的媒体播放器可被耦合到或者集成到用于播放来自播放器的媒体文件的其他车辆电子系统中,例如音频系统。在一个已知配置中,媒体播放器可以通过媒体播放器的模拟音频输出端(例如耳机插孔)连接到车辆的音频系统的辅助输入端,以便由媒体播放器控制回放。在另一个已知配置中,除将媒体播放器的模拟音频输出端连接到车辆的音频系统的辅助输入端外,媒体播放器的控制接口还耦合于音频系统(即收音机)的前部单元的控制接口。在这种配置中,用户可以从音频系统的前部单元中控制媒体的回放。然而,在另一种配置中,音频系统可包括有关某些媒体文件的元数据的数据库。音频系统基于与该文件有关的唯一标识符确定媒体文件的元数据。
[0005]提供一种用于从车辆中的媒体播放器中提取元数据的系统是很有好处的,所述系统用于:1)建立控制模块和媒体播放器之间的通信链接;2)识别存储在媒体播放器上的媒体文件;3)当从用户处收到命令时,从媒体播放器的媒体文件中取得元数据;4)当与媒体播放器之间建立了无线通信链路时,自动地从媒体播放器的媒体文件中取得元数据;5)基于从媒体播放器提取的元数据,产生和/或更新元数据的数据库,包括将信息转换为声音基础形式(acoustic baseform)以便用户可以经由语音命令和语音识别来访问和操纵媒体文件;6)基于用户的可听命令,以可听方式列举媒体文件的元数据记录项(entry);7)利用从第二媒体播放器提取的元数据产生元数据的第二数据库,其中跨供电周期地保持第一媒体播放器的元数据,借此消除每次当媒体播放器连接至该系统时提取元数据的耗时处理;以及8)同时提供对多个数据库的使用,例如当两个或更多的媒体播放器被同时链接至控制模块时。
发明内容
[0006]根据一个实施例,提供了一种通过车辆的控制模块和车辆中的数字媒体存储设备之间的通信链接从该数字媒体存储设备中提取元数据的方法。该方法包括在车辆的控制模块和数字媒体存储设备之间建立通信链接,识别数字媒体存储设备上的媒体文件,以及从媒体文件中取得元数据,所述元数据包括多个记录项,每个记录项包括文本数据或者枚举码(enumerated code)。该方法进一步包括识别媒体文件的每个记录项中的文本数据或者代码,以及将该多个记录项存储到存储器中。
[0007]根据另一个实施例,提供了一种用于通过通信链接从数字媒体存储设备中提取元数据的车载控制系统。该系统包括:用于与该数字媒体存储设备建立通信链接的通信模块;耦合于该通信模块的处理模块,该处理模块用于通过通信模块从该数字媒体存储设备中取得与媒体文件有关的元数据,该元数据包括多个记录项,其中多个记录项中的每一个包括文本数据;以及用于存储从该数字媒体存储设备取得的多个记录项的存储模块。
附图说明
[0008]参考结合附图进行的以下说明,将更容易理解本发明,其中:
[0009]图1是根据示例性实施例的从车辆中的媒体播放器中提取元数据的控制系统的框图。
[0010]图2是根据实施例的从包括图1的控制模块的车辆中的媒体播放器中提取元数据的控制系统的框图。
[0011]图3是用于控制车辆的音频以及电话系统的集成系统的框图。
[0012]图4举例说明了根据实施例的响应于用户命令从媒体播放器中提取元数据的方法。
[0013]图5举例说明了根据实施例的处理来自媒体播放器的媒体文件数据并组织媒体文件的方法。
[0014]图6举例说明了根据实施例的对媒体文件进行支持语音的回放的方法。
[0015]图7举例说明了根据实施例的以可听方式列出媒体文件的方法。
具体实施方式
[0016]图1是根据示例性实施例的用于从车辆中的媒体播放器中提取元数据的控制系统的框图。该控制系统使得车辆乘坐者(例如驾驶员)能够从乘坐者的媒体播放器114中提取元数据,以及随后产生所提取的文本数据的音素表示(phonemic representation)。其他的车辆乘坐者(例如乘客)也可以使用该系统从他们的个人媒体播放器114中提取元数据。替代地,可以提供一种控制系统,其从大容量存储设备中提取元数据。然而,这里的说明将主要涉及一种用于从媒体播放器114种提取元数据的示例性控制系统。应当清楚的是尽管此处将参考媒体播放器114对用于提取元数据的系统进行详细的描述,但是也可以将此处的一个或多个用于提取元数据的系统和方法应用于其他类型的数字存储或者音频/视频设备并在其中获得其效用。例如,一个或多个用于提取元数据的系统可适合于与闪速驱动器、微型硬盘驱动器、USB记忆棒等一起使用,这些设备均需要某种设备特有的硬件和软件以提取元数据。
[0017]图1所示的示例性系统能够使车辆100的音频系统104和车辆乘坐者的媒体播放器114(例如具有蓝牙连接功能的媒体播放器)之间建立无线通信链接。替代地,可以提供一种控制系统,其包括与车辆乘坐者的个人媒体播放器114的有线连接。该有线连接可以包括媒体播放器114的底座(cradle)或者类似的有线适配器,如模拟音频输出连接(例如耳机插孔)。以下说明将参考在车辆音频系统和车辆乘坐者的媒体播放器114之间使用了无线通信链接的示例性控制系统,然而应当清楚的是在此所描述的从媒体播放器取得和处理元数据的方法和系统可以结合其他配置的控制系统使用,例如与车辆乘坐者的媒体播放器的有线连接等等。
[0018]在图1中,车载控制系统100包括控制模块102,其耦合于音频系统104和天线112。在一个替换实施例中,控制模块102可被并入音频系统104。与控制模块102内的通信设备140相结合,天线112能够与媒体播放器114进行双向通信。通信设备140可被配置成包括模拟和/或数字组件的通信电路,以便通信设备140能够按照若干数据传输格式中的任何一种来发送和接收短程射频(“RF”)信号,所述数据传输格式例如蓝牙通信协议、IEEE 802.11通信协议或者其他的个人局域网无线通信协议或者数据格式。媒体播放器114包括多个收发器电路,比如与通信设备140进行通信的蓝牙收发器电路。
[0019]控制模块102还耦合于用户接口110和音频输入设备108。用户接口110可用于通过如按钮、开关、小键盘、触摸屏显示器等接收来自车辆乘坐者的输入命令。替代地,对控制模块102输入的命令可包括来自车辆乘坐者的一组音频信号。例如,车辆乘坐者可以以直接向音频输入设备108讲话的方式向控制模块102提供输入命令。音频输入设备108可以包括一个或多个用于接收来自车辆乘坐者的口头命令的音频输入设备。该口头命令可以是乘坐者可以讲的、说的或者以其他方式提供的能够使控制系统或者另一个系统执行功能的任何词汇或者短语。控制模块102内的语音识别系统(或数据处理模块)122可用于处理各种数据信号,例如经由音频输入设备108接收到的音频信号(例如口头输入命令),并且识别口头命令中的词汇或者短语。现有技术中已知的语音识别技术可以被实现于语音识别系统122中。例如,语音识别系统122可以包括任何语音识别软件或者引擎,如由国际商业机器公司生产的IBM Embedded 
Figure A200780018372D0009115305QIETU
[0020]控制模块102还可以耦合于显示器106。显示器106可以包括小型的阴极射线管(CRT)、液晶显示器(LCD)或者在各种照明条件下易见的各种其他类型的可视显示器。控制模块102可以包括一个或多个模拟和/或数字的电气或者电子组件,以及可以包括微处理器、微控制器、专用集成电路(ASIC)、可编程逻辑和/或其他用于执行各种输入/输出、控制、分析以及在此所描述的其他功能的模拟和/或数字电路元件。控制模块102还可以包括存储器设备124,其包括易失性及非易失性存储器,以便例如存储计算机程序、其他软件或者数据文件,以执行在此所描述的功能。图1所示的车辆100中的每个元件可以安装于或者耦合于相同或者不同的内部车辆元件,如仪表盘、头顶控制台(overhead console)、仪表面板、遮光板、后视镜或者车辆内其他适当的部位。优选的是,用户接口110、音频输入设备108以及输出显示器106安装于便于车辆乘坐者尤其是驾驶员的部位。
[0021]音频系统104可以包括例如收音机、扩音器以及至少一个用于向一个或多个车辆乘坐者提供音频信号的扬声器。所述扬声器(未示出)用于接收来自控制模块102和/或其他系统的音频输出数据(例如来自媒体播放器的数字音频文件、控制模块102提供的信息提示或者其他消息等)。扬声器可以是车辆音频系统104的一部分或者可以是仅服务于控制模块102的专用音频输出设备126。
[0022]如上所述,在图1所示的示例性系统中,控制模块102经由无线通信链接与车辆乘坐者的媒体播放器114进行链接。当允许不同的乘坐者使用该控制系统时,就与不同的媒体播放器建立通信链接。例如,通信链接可响应于经由用户接口110从用户处接收的命令或者经由音频输入设备108接收的口头命令而被建立。无线通信链接根据无线通信标准来操作,所述无线通信标准例如蓝牙通信协议、IEEE 802.11通信协议或者其他适当的无线通信标准。因此,媒体播放器114能够根据用于无线通信链接的无线通信标准进行操作或者与其进行通信。
[0023]控制模块102和媒体播放器114之间的通信链接允许从媒体播放器114上存储的媒体文件中提取元数据给控制模块102。随后,由用户接口110或者音频输入设备108控制媒体文件的回放。例如,在建立了媒体播放器114和控制模块102之间的通信链接之后,一旦建立了通信链接或者作为用户命令的结果,就可以开始提取元数据的处理。用户可以通过向用户接口110输入命令或者向音频输入设备108说出口头命令的方式提供命令。例如,通过接收来自车辆乘坐者的口头命令并经由无线通信链接将回放命令发送至媒体播放器114,就可以通过控制模块102和音频系统104播放歌曲。由控制模块102所接收到的音频信息可以经由音频系统104(例如经由扬声器,未示出)提供给用户,并且从媒体播放器114取得的数据可以被显示在显示器106上。媒体播放器114可以位于车辆100附近范围内的任何位置,例如乘坐者的口袋或者公文包里、在行李箱或者在能够与通信设备140进行通信的范围之内。
[0024]图2是用于从车辆中的媒体播放器中提取元数据的控制系统的框图,所述车辆包括图1所示的控制模块102。存储器124包括用于存储执行控制模块102的功能的计算机或者软件程序的易失性存储器136和非易失性存储器138。例如,存储器124包括可由语音识别系统122的语音识别引擎130识别的命令词汇的预定词汇表。该预定词汇表可用于操纵车辆中的系统和应用,以便于执行功能。语音识别引擎130用于识别口头命令中的词汇或者短语,并且用于将所识别的词汇与命令词汇的预定词汇表进行比较,以便确定适当的动作和/或要向其传递指令的适当系统或者应用。语音识别系统122还包括文本-语音(text-to-speech)引擎132和文本-语法(text-to-grammar)引擎134。文本-语音引擎132用于将文本(例如ASCII文本)转换为可通过音频输出设备126或者音频系统104播放的音频表示(例如PCM)。文本-语法引擎134用于将文本(例如ASCII文本)转换为可由语音识别引擎130采用以识别用户口头命令中的词汇或者文本的音素表示。文本-语音引擎132以及文本-语法引擎134可以是相同应用或者是不同应用的一部分。可以使用本领域中已知的文本-语音以及文本-语法技术,例如由国际商业机器公司生产的Embedded 
Figure A200780018372D0009115305QIETU
 Text-To-Speech引擎和Text-to-Grammar引擎。
[0025]存储器124包括数据库158,其也用于存储每个唯一的媒体播放器的媒体文件的元数据,或用户在控制系统运行期间结合特定的媒体播放器使用的其他大容量存储设备的媒体文件的元数据。存储器124可包括从媒体播放器提取的每个媒体文件的元数据。每个媒体文件的元数据包括多个记录项。每个媒体文件包括音频数据和元数据,其中元数据可以包括多个记录项,表示存储器124中每个媒体文件的相关信息(context),例如歌曲标题(例如“We Belong Together”)、唱片标题(例如“Breakthrough”)、艺术家(例如John Doe)、流派(节奏和布鲁斯)、时长(例如3:10)以及音轨号(音轨5)等。在图2中,媒体播放器114包括存储在例如媒体播放器114的存储器148中的媒体文件数据128,例如歌曲标题、唱片标题、艺术家、流派、时长、音轨号等。用户可以利用已知的方法在媒体播放器114中添加、编辑或者操作媒体文件。存储器148还可以包括媒体播放器114的存储器148中的每个媒体文件的元数据。每个媒体文件可以包括多个记录项,表示存储器148中每个媒体文件的相关信息,例如歌曲标题、唱片标题、艺术家、流派、时长以及音轨号等。如上所述,控制模块102包括存储在存储器124中的数据库158。优选的是,数据库158被存储在非易失性存储器138(例如闪速EPROM)中,并因此能够跨越控制系统的供电周期而保持该数据库。
[0026]在一个实施例中,当控制模块102和媒体播放器114之间建立了无线通信链接时,控制模块102自动取得媒体文件数据128。在一个实施例中,从媒体播放器114中取得的媒体文件数据128可被存储在易失性存储器136(例如DRAM)中。因此,不能跨越控制系统的供电周期而保持存储在易失性存储器136中的媒体文件数据。在替换实施例中,媒体文件数据可被存储在非易失性存储器138(图2所示的数据库158)中,并可以被跨供电周期地保持,以及在上电初始化之后可供用户使用。当与不同的媒体播放器(例如另一个车辆乘坐者的媒体播放器)之间建立了第二无线通信链接时,可以利用来自第二媒体播放器的媒体文件数据对易失性存储器136中的数据进行覆写。替代地,每个用户都可以拥有被存储于非易失性存储器138中的、来自其相关媒体播放器的、具有元数据的媒体文件。在此实施例中,只有当特定用户的媒体播放器114经由无线通信链接被连接至控制系统时,才仅可以访问特定媒体播放器114的媒体文件数据。每个媒体播放器114可以具有唯一的标识符,其用于标识出一个用户的媒体播放器114而将其与另一个媒体播放器区别开。
[0027]图3是用于控制车辆的音频和电话系统的集成系统的框图。图3的控制系统使得用户能够连接数字媒体存储设备,例如
Figure A200780018372D0012115413QIETU
媒体播放器,以便从该数字媒体存储设备中提取元数据。图3举例说明了用以支持图1控制系统的软件体系结构的优选实施例。
[0028]音乐管理器242包括媒体编目器(media cataloger)248,其用于从所连接的媒体设备(例如大容量存储设备、媒体播放器、移动电话等)中提取元数据。在大容量存储设备278的情况下,它可以经由通用串行总线(USB)连接而被连接。媒体编目器248搜索大容量存储设备278的文件结构,以便识别存储在该设备的存储器中的音频媒体。媒体编目器248用于分析媒体文件以定位内嵌的元数据(ID3标签)并提取他们。USB回放244在音频媒体文件的文件读取及回放期间解码该音频媒体。媒体编目器248还搜索音频媒体文件以寻找各种文件参数,包括ID3标签,其为MP3文件的标记格式。媒体编目器248可逐个文件地进行元数据提取,以便媒体编目器248创建数据库,其被示为音乐数据库252。当媒体编目器发现已经对媒体文件做出了修改或者添加时,它请求用户重新对设备上的媒体文件进行编目。应当清楚的是,大容量存储设备278可以包括媒体存储设备,例如拇指驱动器、USB棒等。
[0029]在媒体播放器274(例如
Figure A200780018372D0013122830QIETU
媒体播放器)的情况下,它可以利用蓝牙适配器(Bluetooth dongle)通过无线连接与音乐管理器242进行连接。目前市场上出售的一种称为naviPlayTM的适配器是由TEN技术公司生产的。Impulsesoft公司也创造了一种专有协议,其能够使系统从
Figure A200780018372D0013122830QIETU
媒体播放器提取元数据。在将蓝牙适配器与
Figure A200780018372D0013122830QIETU
媒体播放器相连接后,iPod控制264识别出
Figure A200780018372D0013122830QIETU
媒体播放器已被连接。媒体编目器248与蓝牙控制模块260相交互,以便通过蓝牙连接请求元数据。媒体流266包括的流模式(profile)例如高级音频分发模式(A2DP),其用于控制将音频数据从媒体播放器274或者移动电话276流向该系统。还应该清楚的是本发明的范围不局限于
Figure A200780018372D0013122830QIETU
媒体播放器。媒体播放器274可以包括能够将媒体文件存储在存储器中的若干类型的媒体存储设备、数字音频/视频播放器等中的任一种。
[0030]另外,移动电话276被显示成通过蓝牙主栈(host stack)262耦合于蓝牙控制模块260。蓝牙控制模块260最好包括免提模式,以便与具有蓝牙HFP功能的移动电话相互操作。替代地,移动电话276可以是具有免提模式的蓝牙功能电话。在替换实施例中,移动电话276还可以包括用于通过蓝牙连接来使媒体文件流入(streaming-in)的媒体播放器。移动电话276用于经由媒体流266使音频流入。媒体编目器248进一步用于从移动电话276提取元数据,其中,所述元数据存储在音乐数据库252中。
[0031]音乐数据库252最好包括客户端应用编程接口(API)254以便媒体编目器248能够调用以请求对媒体文件进行编目。音乐数据库252还可以包括SQL数据库引擎256和音乐数据库模型258,用作关系数据库管理系统。存储模块268耦合于音乐数据库252。音乐数据库252包括易失性存储器270(例如RAM)以及非易失性存储器272(例如闪速存储器)。因此,存储在易失性存储器270中的元数据目录不能被跨系统的供电周期地保持,而媒体文件可以被存储在非易失性存储器272中并被跨供电周期地保持,并且在上电初始化之后可用。
[0032]一旦媒体设备(例如大容量存储设备278、媒体播放器274、移动电话276等)已连接,音乐管理器242就通知状态管理器222媒体设备已被定位(例如已发现蓝牙功能设备或者已经连接了大容量存储设备)。如果媒体设备的编目是必需的,那么音乐管理器242通知状态管理器222编目已完成。状态管理器222利用这些数据经由UI相关信息管理器224和集成模块225来更新图形用户接口(GUI)212和声音用户接口(VUI)232,以告知正在进行编目和/或已经完成了编目。状态管理器222、GUI 212以及VUI 232之间的接口表明了如何实现同步多模式用户接口。当同时使用多个系统时,现有的焦点管理226控制各种车辆系统。当移动电话收到呼叫时,现有的免提应用228控制所连接的移动电话及其他车辆系统的操作。例如,如果当移动电话收到呼叫时用户正在回放音乐,系统此时可暂停音乐回放。随后,用户可切断呼叫并自动使音乐回放恢复。
[0033]VUI 232包括语音识别引擎234、文本-语音引擎236以及文本-语法引擎238。麦克风240以及扬声器250优选地耦合于VUI 232以便处理各种数据信号,例如音频信号(例如口头输入命令、音频输出数据等)。当该编目处理完成时,状态管理器222通知VUI 232媒体设备已被编目。当从状态管理器222接收到编目已完成的更新时,VUI 232解析音乐数据库252中元数据的每个记录项,并将记录项转换为声音基础形式(即记录项的音素表示)。所述声音基础形式被存储在易失性存储器270中的基础形式列表内。因此,不能跨越系统的供电周期而保持该基础形式列表。在替换实施例中,
[0034]供电模块(未示出)通知音乐管理器242系统正在关闭。音乐管理器242将基于RAM的数据库写入非易失性存储器272,以便跨供电周期地保持该数据库。
[0035]另外,VUI 232包括用于将文本数据转换为声音基础形式的软件逻辑,所述文本数据包括首字母缩写词、标点符号和唯一发声名称。文本-语音引擎236用于转换若干这样的元数据记录项。例如,文本-语音引擎236识别并转换艺术家的姓名“INXS”,其在发音上听起来像“in excess”。另一个例子是艺术家的姓名“.38Special”,其在发音上听起来像“thirty-eightspecial”而不是“point three eight special”。在一个实施例中,直接将软件逻辑嵌入VUI 232,其中VUI 232最佳地按照它本身的规则转换文本数据。
在替换实施例中,该系统可以利用所连接的移动电话(例如移动电话276)来建立一个到互联网的拨号连接以访问在线音乐数据库。替代地,该系统可以访问包括语音合成标记语言(SSML)形式的语音表示的共享网络驱动器或者数据库。文本-语音引擎236可以利用SSML正确读出记录项并且创建元数据的记录项的正确声音基础形式。
[0036]音乐管理器242进一步包括USB回放244和
Figure A200780018372D0013122830QIETU
媒体播放器回放246。使用GUI 212或者VUI 232,用户可选择一种模式以利用USB回放244或者
Figure A200780018372D0013122830QIETU
媒体播放器回放246来回放媒体文件。当用户选择了一种回放模式时,GUI 212和/或VUI 232决定如何回放。一旦选择了要播放的艺术家(例如“播放甲壳虫乐队”),状态管理器222通知音乐管理器242,音乐管理器242通过这两个回放子组件经由客户端API 254访问音乐数据库252以找到与指定艺术家有关的全部音轨。然后可以按照预定的顺序或者随机地回放所述音轨。例如用户可以决定按字母顺序回放“甲壳虫乐队”的唱片,然后在该唱片内按照单个音轨的顺序进行回放。替代地,用户可以决定按年代顺序从甲壳虫乐队的第一张唱片开始播放唱片。
[0037]触摸式用户接口(TUI)202包括旋转输入204、通用输入/输出(GPIO)206以及无线电输入/输出(“无线电IO”)208。TUI 202耦合于GPIO 210和I2C单元214(或者I2C),其为串行总线。I2C单元214耦合于GPIO扩展器216和无线电单元218。无线电单元218最好包括AM/FM调谐器、功率放大器、均衡器、卫星广播以及辅助输入。
[0038]当系统回放所选音轨时,音乐管理器242最好提供该音轨的回放状态。媒体编目器248用于执行元数据的提取,其包括提取例如歌曲标题、唱片标题、艺术家、流派、时长、音轨号、已播放时间、录制标签、主要艺术家等的数据。
[0039]状态管理器222向GUI 212和VUI 232提供回放状态。GUI 212可以显示所选音轨的列表中当前音轨的回放状态。VUI 232还允许用户“打断”正在播放的音轨并输入所期望的命令。例如,用户可以按下按钮以启动语音识别引擎234,然后用户就可以说出适当的命令开始以另一个媒体文件的回放(例如“下一个”、“暂停”、“播放‘黄色潜水艇’”)。
[0040]图4举例说明了根据实施例的响应于用户命令从媒体播放器取得媒体文件数据的方法。响应于来自车辆中的用户的命令,取得来自媒体播放器114的媒体文件数据。该命令可经由用户接口110(例如按钮或开关)被接收或者经由音频输入设备108作为口头命令而被接收。在控制模块102和媒体播放器114之间建立了无线通信链接之后,用户可以提供命令以从媒体播放器取得媒体文件数据。在步骤302,控制模块102(如图2所示)接收到来自用户的用以从所连接的媒体播放器取得媒体文件数据的命令。如同所述,用户可以经由用户接口110(图2)提供请求,例如利用按钮或开关。替代地,用户可以提供口头命令以请求取得元数据。在步骤304,控制模块102经由无线通信链接向媒体播放器114发出请求并从媒体播放器114取得元数据。一旦媒体文件数据被传送到控制模块102,则在步骤306将数据记录(capture)在一文件中。然后,在步骤308,所取得的媒体文件在被存储到存储器124之前被处理。在经过处理之后,媒体文件被存储到存储器124(如图2所示)中。如前所述,媒体文件数据可被存储到易失性存储器136(如图2所示)中。因此,并不会跨越控制系统的供电周期而保持媒体文件数据。优选的是,该媒体文件数据可被存储到非易失性存储器138(如图2所示)中,并可以被跨供电周期地保持,在上电初始化之后可为用户所用。如上所述,当与不同媒体播放器(例如另一个车辆乘坐者的媒体播放器)之间建立了无线通信链接时,易失性存储器136中的数据被来自该新的媒体播放器的媒体文件数据所覆写。
[0041]图5举例说明用于处理来自媒体播放器的媒体文件数据的方法。在步骤402,控制模块102(如图2所示)访问媒体文件并识别元数据的各个记录项,例如歌曲标题、唱片标题、艺术家、流派、时长、音轨号、已播放时间、录制标签、主要艺术家等。可以利用文本-语法引擎134(图2所示)为媒体文件的每个记录项的文本数据产生声音基础形式。该声音基础形式是可以由语音识别引擎130(图2所示)用以识别用户的发声、从而允许针对媒体文件的每个记录项来执行语音识别的音素表示。在步骤404,基于媒体文件的文本数据产生声音基础形式。在步骤406,声音基础形式被存储在与媒体文件有关的基础形式列表中。因此,可针对媒体文件的文本数据来执行语音识别。回到图4,一旦在步骤310中将媒体文件数据存储到存储器中了,所述媒体文件就可由用户对媒体文件进行具有语音功能的操作。
[0042]如同所述,用户可以利用存储在存储器中的元数据的记录项来对媒体文件进行操作(例如播放、暂停、停止、下一个、上一个、快进、后退等)。图6举例说明了根据实施例的利用存储器124进行具有语音功能的回放的方法。在步骤502,控制模块102(图2所示)经由音频输入设备108接收来自用户的用以启动媒体文件的回放的命令。在一个实施例中,在步骤504,控制模块102提示用户指出回放哪一个媒体文件。该提示可经由音频输出设备126或者音频系统104播放。替代地,用户可使用口头命令提供(即说出)记录项名称来播放歌曲(例如“播放<音轨标题>”)。在步骤506系统收到所期望的媒体文件的音轨标题之后,在步骤508该系统识别所期望的记录项。如果在存储器124中存在类似的记录项,那么语音识别引擎130选择最佳的匹配。在步骤510,语音识别引擎判断是否存在一个以上与一个声音基础形式有关的记录项。例如,如果用户命令该系统“播放<The White Album>”,则系统可识别出一个以上与该唱片标题有关的媒体文件。控制模块102可列出(经由可听到的提示或者经由显示器106)与该唱片名相关的媒体文件(如歌曲或者音轨)。替代地,控制模块102还可以从唱片的开头或者从预先选定的音轨号开始回放该唱片的媒体文件(即音轨)。然后,在步骤512,用户可以选择媒体文件。一旦确定了媒体文件,在步骤514控制模块102提示该用户确认该媒体文件的音轨标题。在步骤516,收到确认之后,控制模块102开始回放该媒体文件。替代地,该系统可确定存在着一张以上的唱片在其唱片标题中包含特定短语(例如“精选”)。在这种情况下,基于置信度记分算法,控制模块102识别出一个以上的唱片标题包含所说出的短语。语音识别引擎130提供最佳的匹配,然后用户被提示从这些匹配中选择所期望的唱片。
[0043]控制模块102(图2)还可根据请求(例如“列举唱片”、“列举艺术家”等)向用户提供可用媒体文件的元数据的列表。图7举例说明了根据实施例的以可听方式列举媒体文件的方法。在步骤602,控制模块102经由音频输入设备108(图3)接收来自用户的用以依据元数据记录项的类型来列出数据库158的内容的命令。响应于该命令,在步骤604控制模块102以可听方式列举每个媒体文件的元数据记录项。例如,如果用户的命令是“列举唱片”,那么将列举每个唱片的标题。使用文本-语音引擎132将每个媒体文件的文本(例如唱片标题)转换为音频表示,并且可以利用音频输出设备126或者音频系统104在车辆内播放该音频。优选的是,所述记录项的文本被按照字母顺序排序逐字符显示在显示器106上。在播放每个记录项之间要经过预设的时间周期。此外,控制模块102通过允许用户“打断(barge-in)”来使得用户可以中断所选元数据的可听列举。用户可在记录项文本播放期间或者在播放记录项之后的预设时间期间内打断以便执行命令。如果在步骤606用户提供命令(即打断),那么在步骤608控制模块102识别并执行所请求的操作。例如,用户可提供命令以跳到所选元数据列表中的下一个记录项或者跳到以下一个字母开头的记录项。用户还可以提供命令以选择曾经听过的所期望的媒体文件或者重复前一记录项。如果媒体文件被选择,用户就可以启动操作(例如媒体文件的回放)。当在步骤610到达最后一个媒体文件(或者当选择了一个文件)时,处理过程结束。如果还没有到达最后一条记录项,那么处理过程回到步骤604并继续进行,直到或者选择了一条记录项或者到达了数据库158中的最后一条记录项。
[0044]尽管上述的在附图中举例说明的示例性实施例是目前优选的,但是应当清楚的是提供这些实施例仅作为示例。因此,本发明不局限于特定的实施例,而是扩展到落入所附权利要求范围内的各种变型。根据替换性实施例,任何处理或者方法步骤的顺序或次序可以被改变或重新排序。
[0045]利用附图描述本发明不应该被看作是对本发明强加附图中所呈现的任何限制。本发明设想了用于实现其操作的方法、系统和任何机器可读媒体上的程序产品。本发明的实施例可使用现有的计算机处理器来实现,或者通过为这样或那样的目的而并入适当的车辆系统的专用计算机处理器来实现,或者通过硬连线系统来实现。
[0046]如上所述,本发明范围内的实施例包括程序产品,所述程序产品包括带有或其上存储有机器可执行指令或者数据结构的机器可读媒体。这种机器可读媒体可以是通用的或者专用的计算机或者其他具有处理器的机器可访问的任何可用的媒体。举例来说,这种机器可读媒体可以包括RAM、ROM、EPROM、EEPROM、CD-ROM或者其他光盘存储装置、磁盘存储装置或者其他磁存储设备,或者可用于以机器可执行指令或者数据结构的形式携带或者存储程序代码的、并可由通用的或者专用的计算机或者具有处理器的其他机器访问的任何其他媒体。当信息通过网络或者另一通信连接(或者为硬线的、无线的,或者为硬线的或无线的组合)被发送或提供给机器时,该机器完全可以将该连接视为机器可读媒体。因而,任何这种连接当然地被称为机器可读媒体。上述的组合也包括在机器可读媒体的范畴之内。机器可执行命令包括例如使通用计算机、专用计算机或者专用处理机执行某种功能或者某些功能的命令和数据。
[0047]应当指出的是尽管本申请的附图示出了方法步骤的特定顺序,但是应当清楚的是这些步骤的顺序可以与所描述的情况不同。同样,两个或多个步骤可被并发执行或者部分并发执行。这种变化将取决于所选择的软件和硬件系统以及设计者的选择。应当清楚的是所有这些改变均包含在本发明的范围之内。同样地,可以用标准编程技术完成本发明的软件实现,利用基于规则的逻辑及其他逻辑来实现各种连接步骤、处理步骤、比较步骤以及判决步骤。
[0048]为了举例说明以及描述的目的给出了本发明实施例的上述说明。这并不意味着穷举或者是将本发明限于所公开的确定形式,按照上述的教导可以有很多变型和改变,或者可从本发明的实践中获得这些变型和改变。为说明本发明的原理及其实际应用而选择和描述了这些实施例,以使本领域的技术人员能够将本发明用于各种实施例、以及以适合于所预期的特定应用的各种变型来使用本发明。

Claims (21)

1.一种通过车辆的控制模块和该车辆中的数字媒体存储设备之间的通信链接从该数字媒体存储设备中提取元数据的方法,该方法包括:
在所述车辆的控制模块和所述数字媒体存储设备之间建立通信链接;
识别所述数字媒体存储设备上的媒体文件;
从媒体文件中取得元数据,该元数据包括多个记录项,其中所述多个记录项中至少一个包括文本数据;
识别所述媒体文件的记录项中的文本数据;以及
将所述多个记录项存储到存储器中。
2.如权利要求1所述的方法,其中,响应于在所述控制模块和所述数字媒体存储设备之间建立了通信链接而取得所述元数据。
3.如权利要求1所述的方法,其中,响应于用户的命令而取得所述元数据。
4.如权利要求3所述的方法,其中,来自所述用户的命令是经由用户接口接收的。
5.如权利要求3所述的方法,其中,所述命令为口述命令。
6.如权利要求1所述的方法,其中,所述控制模块和所述数字媒体存储设备之间的通信链接是无线的。
7.如权利要求1所述的方法,其中,所述多个记录项包括下列中的任一个:歌曲标题、唱片标题、艺术家、流派、时长、音轨号、已播放时间、录制标签、录制日期、作曲家、制作人以及主要艺术家。
8.如权利要求1所述的方法,还包括:
产生记录项的文本数据的声音基础形式;以及
将所述记录项的声音基础形式存储到基础形式列表中。
9.如权利要求1所述的方法,还包括:
识别所述数字媒体存储设备上的播放列表;以及
从所述数字媒体存储设备中取得所述播放列表,其中该播放列表包括媒体文件的自定义编排。
10.如权利要求1所述的方法,其中,所述声音基础形式用于使每个记录项能被语音识别。
11.一种车载控制系统,用于通过通信链接从数字媒体存储设备中提取元数据,该系统包括:
通信模块,用于与所述数字媒体存储设备建立通信链接;
处理模块,耦合于所述通信模块,该处理模块用于经由该通信模块从所述数字媒体存储设备中取得与媒体文件有关的元数据,该元数据包括多个记录项,其中所述多个记录项中的至少一个包括文本数据;以及
存储模块,用于存储从所述数字媒体存储设备中取得的多个记录项。
12.如权利要求11所述的系统,其中,所述处理模块用于识别记录项的文本数据并且产生该记录项的文本数据的音素表示。
13.如权利要求11所述的系统,还包括:用户接口,用于接收输入,基于媒体文件的相关元数据选择至少一个媒体文件,以及经由音频系统播放该媒体文件的音频数据。
14.如权利要求11所述的系统,其中,所述用户接口包括显示器,并且所述处理模块用于经由该显示器向用户提供元数据。
15.如权利要求11所述的系统,还包括:音频输入设备,用于从用户处接收口头输入命令。
16.如权利要求11所述的系统,还包括:语音识别模块,用于将从用户处接收到的口头输入命令与一组预定的输入命令进行比较,其中该语音识别模块基于该口头输入命令来确定适当的响应。
17.如权利要求11所述的系统,还包括:文本转换引擎,用于将记录项的文本数据转换为该文本数据的可听语音表示。
18.如权利要求11所述的系统,其中,所述存储模块包括易失性存储器。
19.如权利要求11所述的系统,其中,所述存储模块包括非易失性存储器。
20.如权利要求11所述的系统,其中,记录项的文本数据的音素表示有助于所述媒体文件的记录项的语音识别。
21.如权利要求11所述的系统,其中,该系统用于支持媒体编码/解码算法,包括以下中的任一个:MP3、MP3 Pro、Ogg Vorbis、高级音频编码(AAC)、Windows媒体音频(WMA)以及波形音频(WAV)。
CNA2007800183725A 2006-04-04 2007-04-03 在车辆中从数字媒体存储设备提取元数据以用于媒体选择的系统和方法 Pending CN101467142A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US78917606P 2006-04-04 2006-04-04
US60/789,176 2006-04-04

Publications (1)

Publication Number Publication Date
CN101467142A true CN101467142A (zh) 2009-06-24

Family

ID=38474337

Family Applications (2)

Application Number Title Priority Date Filing Date
CNA2007800182756A Pending CN101449538A (zh) 2006-04-04 2007-04-03 媒体文件的文本-语法改进
CNA2007800183725A Pending CN101467142A (zh) 2006-04-04 2007-04-03 在车辆中从数字媒体存储设备提取元数据以用于媒体选择的系统和方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CNA2007800182756A Pending CN101449538A (zh) 2006-04-04 2007-04-03 媒体文件的文本-语法改进

Country Status (4)

Country Link
US (1) US9092435B2 (zh)
EP (1) EP2005319B1 (zh)
CN (2) CN101449538A (zh)
WO (1) WO2007123797A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102843680A (zh) * 2011-06-24 2012-12-26 福特全球技术公司 用于蓝牙功能验证的方法
CN105723325A (zh) * 2013-11-13 2016-06-29 微软技术许可有限责任公司 使用因用户而异的语法的媒体项选择
CN112673368A (zh) * 2018-07-31 2021-04-16 马维尔国际贸易有限公司 用于在存储边缘处生成描述非结构化数据对象的元数据的系统和方法

Families Citing this family (274)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8645137B2 (en) 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
US20060235864A1 (en) * 2005-04-14 2006-10-19 Apple Computer, Inc. Audio sampling and acquisition system
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US7870142B2 (en) 2006-04-04 2011-01-11 Johnson Controls Technology Company Text to grammar enhancements for media files
CN101449538A (zh) 2006-04-04 2009-06-03 约翰逊控制技术公司 媒体文件的文本-语法改进
KR20080015567A (ko) * 2006-08-16 2008-02-20 삼성전자주식회사 휴대 장치를 위한 음성기반 파일 정보 안내 시스템 및 방법
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
AU2007336816C1 (en) * 2006-12-22 2011-10-06 Apple Inc. Tagging media assets, locations, and advertisements
US9865240B2 (en) * 2006-12-29 2018-01-09 Harman International Industries, Incorporated Command interface for generating personalized audio content
JPWO2008102413A1 (ja) * 2007-02-22 2010-05-27 富士通株式会社 音楽再生装置および音楽再生方法
US20080215169A1 (en) * 2007-03-02 2008-09-04 Lisa Debettencourt Audio System
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US8819553B2 (en) * 2007-09-04 2014-08-26 Apple Inc. Generating a playlist using metadata tags
US20090062944A1 (en) * 2007-09-04 2009-03-05 Apple Inc. Modifying media files
US9130686B2 (en) 2007-12-20 2015-09-08 Apple Inc. Tagging of broadcast content using a portable media device controlled by an accessory
US10002189B2 (en) 2007-12-20 2018-06-19 Apple Inc. Method and apparatus for searching using an active ontology
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US10496753B2 (en) 2010-01-18 2019-12-03 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US8527876B2 (en) * 2008-06-12 2013-09-03 Apple Inc. System and methods for adjusting graphical representations of media files based on previous usage
US20090313564A1 (en) * 2008-06-12 2009-12-17 Apple Inc. Systems and methods for adjusting playback of media files based on previous usage
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
US20100036666A1 (en) * 2008-08-08 2010-02-11 Gm Global Technology Operations, Inc. Method and system for providing meta data for a work
JP2010056684A (ja) * 2008-08-26 2010-03-11 Yamaha Corp オーディオ信号処理装置、スピーカ装置、映像表示装置および制御方法
US8452228B2 (en) 2008-09-24 2013-05-28 Apple Inc. Systems, methods, and devices for associating a contact identifier with a broadcast source
US20100075695A1 (en) * 2008-09-24 2010-03-25 Apple Inc. Systems, methods, and devices for retrieving local broadcast source presets
US20100076576A1 (en) * 2008-09-24 2010-03-25 Apple Inc. Systems, methods, and devices for providing broadcast media from a selected source
US8886112B2 (en) 2008-09-24 2014-11-11 Apple Inc. Media device with enhanced data retrieval feature
US8676904B2 (en) 2008-10-02 2014-03-18 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
CN101740089B (zh) * 2008-11-17 2012-03-07 深圳Tcl新技术有限公司 在相连设备上播放便携播放器上文件的方法和相应设备
US9959870B2 (en) * 2008-12-11 2018-05-01 Apple Inc. Speech recognition involving a mobile device
US8352278B2 (en) 2009-06-02 2013-01-08 Ford Global Technologies, Llc Methods and systems for resolving the incompatibility of media items playable from a vehicle
US9858925B2 (en) 2009-06-05 2018-01-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US20120309363A1 (en) 2011-06-03 2012-12-06 Apple Inc. Triggering notifications associated with tasks items that represent tasks to perform
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US9641625B2 (en) 2009-06-09 2017-05-02 Ford Global Technologies, Llc Method and system for executing an internet radio application within a vehicle
US9431006B2 (en) 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
US8898170B2 (en) 2009-07-15 2014-11-25 Apple Inc. Performance metadata for media
JP2011043710A (ja) * 2009-08-21 2011-03-03 Sony Corp 音声処理装置、音声処理方法及びプログラム
US8214740B2 (en) * 2009-10-30 2012-07-03 Apple Inc. Song flow methodology in random playback
US10553209B2 (en) 2010-01-18 2020-02-04 Apple Inc. Systems and methods for hands-free notification summaries
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US10679605B2 (en) 2010-01-18 2020-06-09 Apple Inc. Hands-free list-reading by intelligent automated assistant
US10705794B2 (en) 2010-01-18 2020-07-07 Apple Inc. Automatically adapting user interfaces for hands-free interaction
WO2011091402A1 (en) * 2010-01-25 2011-07-28 Justin Mason Voice electronic listening assistant
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US8140570B2 (en) * 2010-03-11 2012-03-20 Apple Inc. Automatic discovery of metadata
US9915755B2 (en) 2010-12-20 2018-03-13 Ford Global Technologies, Llc Virtual ambient weather condition sensing
KR101828273B1 (ko) * 2011-01-04 2018-02-14 삼성전자주식회사 결합기반의 음성명령 인식 장치 및 그 방법
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US20130024287A1 (en) * 2011-07-19 2013-01-24 Ford Global Technologies, Llc Methods and Apparatus for Managing a Content Stream
US8994660B2 (en) 2011-08-29 2015-03-31 Apple Inc. Text correction processing
US8872647B2 (en) 2011-10-21 2014-10-28 Ford Global Technologies, Llc Method and apparatus for context adaptive multimedia management
US9148741B2 (en) * 2011-12-05 2015-09-29 Microsoft Technology Licensing, Llc Action generation based on voice data
US8843316B2 (en) * 2012-01-09 2014-09-23 Blackberry Limited Method to geo-tag streaming music
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
US9483461B2 (en) 2012-03-06 2016-11-01 Apple Inc. Handling speech synthesis of content for multiple languages
US9280610B2 (en) 2012-05-14 2016-03-08 Apple Inc. Crowd sourcing information to fulfill user requests
US10417037B2 (en) 2012-05-15 2019-09-17 Apple Inc. Systems and methods for integrating third party services with a digital assistant
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
US9495129B2 (en) 2012-06-29 2016-11-15 Apple Inc. Device, method, and user interface for voice-activated navigation and browsing of a document
US9576574B2 (en) 2012-09-10 2017-02-21 Apple Inc. Context-sensitive handling of interruptions by intelligent digital assistant
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
DE112014000709B4 (de) 2013-02-07 2021-12-30 Apple Inc. Verfahren und vorrichtung zum betrieb eines sprachtriggers für einen digitalen assistenten
US9184777B2 (en) 2013-02-14 2015-11-10 Ford Global Technologies, Llc Method and system for personalized dealership customer service
US9368114B2 (en) 2013-03-14 2016-06-14 Apple Inc. Context-sensitive handling of interruptions
US9922642B2 (en) 2013-03-15 2018-03-20 Apple Inc. Training an at least partial voice command system
WO2014144579A1 (en) 2013-03-15 2014-09-18 Apple Inc. System and method for updating an adaptive speech recognition model
US9786102B2 (en) 2013-03-15 2017-10-10 Ford Global Technologies, Llc System and method for wireless vehicle content determination
JP6198432B2 (ja) * 2013-04-09 2017-09-20 小島プレス工業株式会社 音声認識制御装置
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
WO2014197336A1 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
EP3008641A1 (en) 2013-06-09 2016-04-20 Apple Inc. Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
WO2014200731A1 (en) 2013-06-13 2014-12-18 Apple Inc. System and method for emergency calls initiated by voice command
US10296160B2 (en) 2013-12-06 2019-05-21 Apple Inc. Method for extracting salient dialog usage from live data
US9620105B2 (en) 2014-05-15 2017-04-11 Apple Inc. Analyzing audio input for efficient speech and music recognition
US10592095B2 (en) 2014-05-23 2020-03-17 Apple Inc. Instantaneous speaking of content on touch devices
US9502031B2 (en) 2014-05-27 2016-11-22 Apple Inc. Method for supporting dynamic grammars in WFST-based ASR
AU2015266863B2 (en) 2014-05-30 2018-03-15 Apple Inc. Multi-command single utterance input method
US9734193B2 (en) 2014-05-30 2017-08-15 Apple Inc. Determining domain salience ranking from ambiguous words in natural speech
US10078631B2 (en) 2014-05-30 2018-09-18 Apple Inc. Entropy-guided text prediction using combined word and character n-gram language models
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
US10289433B2 (en) 2014-05-30 2019-05-14 Apple Inc. Domain specific language for encoding assistant dialog
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US9842101B2 (en) 2014-05-30 2017-12-12 Apple Inc. Predictive conversion of language input
US9760559B2 (en) 2014-05-30 2017-09-12 Apple Inc. Predictive text input
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US9785630B2 (en) 2014-05-30 2017-10-10 Apple Inc. Text prediction using combined word N-gram and unigram language models
US10659851B2 (en) 2014-06-30 2020-05-19 Apple Inc. Real-time digital assistant knowledge updates
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US10446141B2 (en) 2014-08-28 2019-10-15 Apple Inc. Automatic speech recognition based on user feedback
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10789041B2 (en) 2014-09-12 2020-09-29 Apple Inc. Dynamic thresholds for always listening speech trigger
US20160094601A1 (en) * 2014-09-30 2016-03-31 The Nielsen Company (Us), Llc Methods and apparatus to measure exposure to streaming media
US9646609B2 (en) 2014-09-30 2017-05-09 Apple Inc. Caching apparatus for serving phonetic pronunciations
US9886432B2 (en) 2014-09-30 2018-02-06 Apple Inc. Parsimonious handling of word inflection via categorical stem + suffix N-gram language models
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US10552013B2 (en) 2014-12-02 2020-02-04 Apple Inc. Data detection
US9711141B2 (en) 2014-12-09 2017-07-18 Apple Inc. Disambiguating heteronyms in speech synthesis
US20160173675A1 (en) * 2014-12-16 2016-06-16 Hyundai Motor Company In-vehicle multimedia system considering call situation and method for controlling the same
US10152299B2 (en) 2015-03-06 2018-12-11 Apple Inc. Reducing response latency of intelligent automated assistants
US9865280B2 (en) 2015-03-06 2018-01-09 Apple Inc. Structured dictation using intelligent automated assistants
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US9899019B2 (en) 2015-03-18 2018-02-20 Apple Inc. Systems and methods for structured stem and suffix language models
US9842105B2 (en) 2015-04-16 2017-12-12 Apple Inc. Parsimonious continuous-space phrase representations for natural language processing
US10460227B2 (en) 2015-05-15 2019-10-29 Apple Inc. Virtual assistant in a communication session
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US10127220B2 (en) 2015-06-04 2018-11-13 Apple Inc. Language identification from short strings
US10101822B2 (en) 2015-06-05 2018-10-16 Apple Inc. Language input correction
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US10255907B2 (en) 2015-06-07 2019-04-09 Apple Inc. Automatic accent detection using acoustic models
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US10186254B2 (en) 2015-06-07 2019-01-22 Apple Inc. Context-based endpoint detection
US20160378747A1 (en) 2015-06-29 2016-12-29 Apple Inc. Virtual assistant for media playback
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US9697820B2 (en) 2015-09-24 2017-07-04 Apple Inc. Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US10083685B2 (en) * 2015-10-13 2018-09-25 GM Global Technology Operations LLC Dynamically adding or removing functionality to speech recognition systems
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US9965247B2 (en) 2016-02-22 2018-05-08 Sonos, Inc. Voice controlled media playback system based on user profile
US9947316B2 (en) 2016-02-22 2018-04-17 Sonos, Inc. Voice control of a media playback system
US10509626B2 (en) 2016-02-22 2019-12-17 Sonos, Inc Handling of loss of pairing between networked devices
US10095470B2 (en) 2016-02-22 2018-10-09 Sonos, Inc. Audio response playback
US9820039B2 (en) 2016-02-22 2017-11-14 Sonos, Inc. Default playback devices
US10097939B2 (en) 2016-02-22 2018-10-09 Sonos, Inc. Compensation for speaker nonlinearities
US10264030B2 (en) 2016-02-22 2019-04-16 Sonos, Inc. Networked microphone device control
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US11227589B2 (en) 2016-06-06 2022-01-18 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179309B1 (en) 2016-06-09 2018-04-23 Apple Inc Intelligent automated assistant in a home environment
US9978390B2 (en) 2016-06-09 2018-05-22 Sonos, Inc. Dynamic player selection for audio signal processing
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
US10134399B2 (en) 2016-07-15 2018-11-20 Sonos, Inc. Contextualization of voice inputs
US10152969B2 (en) 2016-07-15 2018-12-11 Sonos, Inc. Voice detection by multiple devices
US9693164B1 (en) 2016-08-05 2017-06-27 Sonos, Inc. Determining direction of networked microphone device relative to audio playback device
US10115400B2 (en) 2016-08-05 2018-10-30 Sonos, Inc. Multiple voice services
US10474753B2 (en) 2016-09-07 2019-11-12 Apple Inc. Language identification using recurrent neural networks
US9794720B1 (en) 2016-09-22 2017-10-17 Sonos, Inc. Acoustic position measurement
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US9942678B1 (en) 2016-09-27 2018-04-10 Sonos, Inc. Audio playback settings for voice interaction
US9743204B1 (en) 2016-09-30 2017-08-22 Sonos, Inc. Multi-orientation playback device microphones
US10181323B2 (en) 2016-10-19 2019-01-15 Sonos, Inc. Arbitration-based voice recognition
US11281993B2 (en) 2016-12-05 2022-03-22 Apple Inc. Model and ensemble compression for metric learning
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
US11204787B2 (en) 2017-01-09 2021-12-21 Apple Inc. Application integration with a digital assistant
US11183181B2 (en) 2017-03-27 2021-11-23 Sonos, Inc. Systems and methods of multiple voice services
US10417266B2 (en) 2017-05-09 2019-09-17 Apple Inc. Context-aware ranking of intelligent response suggestions
DK201770383A1 (en) 2017-05-09 2018-12-14 Apple Inc. USER INTERFACE FOR CORRECTING RECOGNITION ERRORS
US10726832B2 (en) 2017-05-11 2020-07-28 Apple Inc. Maintaining privacy of personal information
US10395654B2 (en) 2017-05-11 2019-08-27 Apple Inc. Text normalization based on a data-driven learning network
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
US11301477B2 (en) 2017-05-12 2022-04-12 Apple Inc. Feedback analysis of a digital assistant
DK201770427A1 (en) 2017-05-12 2018-12-20 Apple Inc. LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
US10311144B2 (en) 2017-05-16 2019-06-04 Apple Inc. Emoji word sense disambiguation
US10403278B2 (en) 2017-05-16 2019-09-03 Apple Inc. Methods and systems for phonetic matching in digital assistant services
DK179560B1 (en) 2017-05-16 2019-02-18 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
US10303715B2 (en) 2017-05-16 2019-05-28 Apple Inc. Intelligent automated assistant for media exploration
US10657328B2 (en) 2017-06-02 2020-05-19 Apple Inc. Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling
US10475449B2 (en) 2017-08-07 2019-11-12 Sonos, Inc. Wake-word detection suppression
US10048930B1 (en) 2017-09-08 2018-08-14 Sonos, Inc. Dynamic computation of system response volume
US10445429B2 (en) 2017-09-21 2019-10-15 Apple Inc. Natural language understanding using vocabularies with compressed serialized tries
US10446165B2 (en) 2017-09-27 2019-10-15 Sonos, Inc. Robust short-time fourier transform acoustic echo cancellation during audio playback
US10051366B1 (en) 2017-09-28 2018-08-14 Sonos, Inc. Three-dimensional beam forming with a microphone array
US10621981B2 (en) 2017-09-28 2020-04-14 Sonos, Inc. Tone interference cancellation
US10482868B2 (en) 2017-09-28 2019-11-19 Sonos, Inc. Multi-channel acoustic echo cancellation
US10466962B2 (en) 2017-09-29 2019-11-05 Sonos, Inc. Media playback system with voice assistance
US10755051B2 (en) 2017-09-29 2020-08-25 Apple Inc. Rule-based natural language processing
CN107895016B (zh) * 2017-11-14 2022-02-15 百度在线网络技术(北京)有限公司 一种播放多媒体的方法和装置
US10636424B2 (en) 2017-11-30 2020-04-28 Apple Inc. Multi-turn canned dialog
US10880650B2 (en) 2017-12-10 2020-12-29 Sonos, Inc. Network microphone devices with automatic do not disturb actuation capabilities
US10818290B2 (en) 2017-12-11 2020-10-27 Sonos, Inc. Home graph
EP3506255A1 (en) * 2017-12-28 2019-07-03 Spotify AB Voice feedback for user interface of media playback device
US10733982B2 (en) 2018-01-08 2020-08-04 Apple Inc. Multi-directional dialog
US10733375B2 (en) 2018-01-31 2020-08-04 Apple Inc. Knowledge-based framework for improving natural language understanding
US11343614B2 (en) 2018-01-31 2022-05-24 Sonos, Inc. Device designation of playback and network microphone device arrangements
US10789959B2 (en) 2018-03-02 2020-09-29 Apple Inc. Training speaker recognition models for digital assistants
US10592604B2 (en) 2018-03-12 2020-03-17 Apple Inc. Inverse text normalization for automatic speech recognition
US10818288B2 (en) 2018-03-26 2020-10-27 Apple Inc. Natural assistant interaction
US10909331B2 (en) 2018-03-30 2021-02-02 Apple Inc. Implicit identification of translation payload with neural machine translation
US10928918B2 (en) 2018-05-07 2021-02-23 Apple Inc. Raise to speak
US11145294B2 (en) 2018-05-07 2021-10-12 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US11175880B2 (en) 2018-05-10 2021-11-16 Sonos, Inc. Systems and methods for voice-assisted media content selection
US10847178B2 (en) 2018-05-18 2020-11-24 Sonos, Inc. Linear filtering for noise-suppressed speech detection
US10984780B2 (en) 2018-05-21 2021-04-20 Apple Inc. Global semantic word embeddings using bi-directional recurrent neural networks
US10959029B2 (en) 2018-05-25 2021-03-23 Sonos, Inc. Determining and adapting to changes in microphone performance of playback devices
DK179822B1 (da) 2018-06-01 2019-07-12 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
US10892996B2 (en) 2018-06-01 2021-01-12 Apple Inc. Variable latency device coordination
DK201870355A1 (en) 2018-06-01 2019-12-16 Apple Inc. VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS
DK180639B1 (en) 2018-06-01 2021-11-04 Apple Inc DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT
US11386266B2 (en) 2018-06-01 2022-07-12 Apple Inc. Text correction
US11076039B2 (en) 2018-06-03 2021-07-27 Apple Inc. Accelerated task performance
US10681460B2 (en) 2018-06-28 2020-06-09 Sonos, Inc. Systems and methods for associating playback devices with voice assistant services
US10461710B1 (en) 2018-08-28 2019-10-29 Sonos, Inc. Media playback system with maximum volume setting
US11076035B2 (en) 2018-08-28 2021-07-27 Sonos, Inc. Do not disturb feature for audio notifications
US10878811B2 (en) 2018-09-14 2020-12-29 Sonos, Inc. Networked devices, systems, and methods for intelligently deactivating wake-word engines
US10587430B1 (en) 2018-09-14 2020-03-10 Sonos, Inc. Networked devices, systems, and methods for associating playback devices based on sound codes
US11024331B2 (en) 2018-09-21 2021-06-01 Sonos, Inc. Voice detection optimization using sound metadata
US10811015B2 (en) 2018-09-25 2020-10-20 Sonos, Inc. Voice detection optimization based on selected voice assistant service
US11010561B2 (en) 2018-09-27 2021-05-18 Apple Inc. Sentiment prediction from textual data
US11462215B2 (en) 2018-09-28 2022-10-04 Apple Inc. Multi-modal inputs for voice commands
US11170166B2 (en) 2018-09-28 2021-11-09 Apple Inc. Neural typographical error modeling via generative adversarial networks
US10839159B2 (en) 2018-09-28 2020-11-17 Apple Inc. Named entity normalization in a spoken dialog system
US11100923B2 (en) 2018-09-28 2021-08-24 Sonos, Inc. Systems and methods for selective wake word detection using neural network models
US10692518B2 (en) 2018-09-29 2020-06-23 Sonos, Inc. Linear filtering for noise-suppressed speech detection via multiple network microphone devices
US11899519B2 (en) 2018-10-23 2024-02-13 Sonos, Inc. Multiple stage network microphone device with reduced power consumption and processing load
US11475898B2 (en) 2018-10-26 2022-10-18 Apple Inc. Low-latency multi-speaker speech recognition
EP3654249A1 (en) 2018-11-15 2020-05-20 Snips Dilated convolutions and gating for efficient keyword spotting
US11183183B2 (en) 2018-12-07 2021-11-23 Sonos, Inc. Systems and methods of operating media playback systems having multiple voice assistant services
US11132989B2 (en) 2018-12-13 2021-09-28 Sonos, Inc. Networked microphone devices, systems, and methods of localized arbitration
US10602268B1 (en) 2018-12-20 2020-03-24 Sonos, Inc. Optimization of network microphone devices using noise classification
US11638059B2 (en) 2019-01-04 2023-04-25 Apple Inc. Content playback on multiple devices
US10867604B2 (en) 2019-02-08 2020-12-15 Sonos, Inc. Devices, systems, and methods for distributed voice processing
US11315556B2 (en) 2019-02-08 2022-04-26 Sonos, Inc. Devices, systems, and methods for distributed voice processing by transmitting sound data associated with a wake word to an appropriate device for identification
US11348573B2 (en) 2019-03-18 2022-05-31 Apple Inc. Multimodality in digital assistant systems
US11133004B1 (en) * 2019-03-27 2021-09-28 Amazon Technologies, Inc. Accessory for an audio output device
US11120794B2 (en) 2019-05-03 2021-09-14 Sonos, Inc. Voice assistant persistence across multiple network microphone devices
US11307752B2 (en) 2019-05-06 2022-04-19 Apple Inc. User configurable task triggers
US11423908B2 (en) 2019-05-06 2022-08-23 Apple Inc. Interpreting spoken requests
US11475884B2 (en) 2019-05-06 2022-10-18 Apple Inc. Reducing digital assistant latency when a language is incorrectly determined
DK201970509A1 (en) 2019-05-06 2021-01-15 Apple Inc Spoken notifications
US11140099B2 (en) 2019-05-21 2021-10-05 Apple Inc. Providing message response suggestions
US11289073B2 (en) 2019-05-31 2022-03-29 Apple Inc. Device text to speech
US11496600B2 (en) 2019-05-31 2022-11-08 Apple Inc. Remote execution of machine-learned models
DK180129B1 (en) 2019-05-31 2020-06-02 Apple Inc. USER ACTIVITY SHORTCUT SUGGESTIONS
US11360641B2 (en) 2019-06-01 2022-06-14 Apple Inc. Increasing the relevance of new available information
US11200894B2 (en) 2019-06-12 2021-12-14 Sonos, Inc. Network microphone device with command keyword eventing
US10586540B1 (en) 2019-06-12 2020-03-10 Sonos, Inc. Network microphone device with command keyword conditioning
US11361756B2 (en) 2019-06-12 2022-06-14 Sonos, Inc. Conditional wake word eventing based on environment
US11138975B2 (en) 2019-07-31 2021-10-05 Sonos, Inc. Locally distributed keyword detection
US11138969B2 (en) 2019-07-31 2021-10-05 Sonos, Inc. Locally distributed keyword detection
US10871943B1 (en) 2019-07-31 2020-12-22 Sonos, Inc. Noise classification for event detection
US11488406B2 (en) 2019-09-25 2022-11-01 Apple Inc. Text detection using global geometry estimators
US11189286B2 (en) 2019-10-22 2021-11-30 Sonos, Inc. VAS toggle based on device orientation
US11200900B2 (en) 2019-12-20 2021-12-14 Sonos, Inc. Offline voice control
US11562740B2 (en) 2020-01-07 2023-01-24 Sonos, Inc. Voice verification for media playback
US11556307B2 (en) 2020-01-31 2023-01-17 Sonos, Inc. Local voice data processing
US11308958B2 (en) 2020-02-07 2022-04-19 Sonos, Inc. Localized wakeword verification
IT202000005143A1 (it) * 2020-03-11 2021-09-11 St Microelectronics Srl Procedimento per gestire librerie mediali, sistema e prodotto informatico corrispondenti
US11727919B2 (en) 2020-05-20 2023-08-15 Sonos, Inc. Memory allocation for keyword spotting engines
US11308962B2 (en) 2020-05-20 2022-04-19 Sonos, Inc. Input detection windowing
US11482224B2 (en) 2020-05-20 2022-10-25 Sonos, Inc. Command keywords with input detection windowing
US11698771B2 (en) 2020-08-25 2023-07-11 Sonos, Inc. Vocal guidance engines for playback devices
US11908468B2 (en) * 2020-09-21 2024-02-20 Amazon Technologies, Inc. Dialog management for multiple users
US11984123B2 (en) 2020-11-12 2024-05-14 Sonos, Inc. Network device interaction by range
US11551700B2 (en) 2021-01-25 2023-01-10 Sonos, Inc. Systems and methods for power-efficient keyword detection

Family Cites Families (85)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3704345A (en) 1971-03-19 1972-11-28 Bell Telephone Labor Inc Conversion of printed text into synthetic speech
US4827520A (en) * 1987-01-16 1989-05-02 Prince Corporation Voice actuated control system for use in a vehicle
US5479155A (en) * 1988-12-05 1995-12-26 Prince Corporation Vehicle accessory trainable transmitter
US5475366A (en) * 1988-12-05 1995-12-12 Prince Corporation Electrical control system for vehicle options
US5614885A (en) * 1988-12-05 1997-03-25 Prince Corporation Electrical control system for vehicle options
US5479157A (en) * 1990-01-19 1995-12-26 Prince Corporation Remote vehicle programming system
US5717387A (en) * 1990-01-19 1998-02-10 Prince Corporation Remote vehicle programming system
US5113182B1 (en) * 1990-01-19 1995-11-07 Prince Corp Vehicle door locking system detecting that all doors are closed
US5627529A (en) * 1994-03-11 1997-05-06 Prince Corporation Vehicle control system with trainable transceiver
EP0472356B1 (en) 1990-08-16 1994-03-30 Fujitsu Ten Limited Speech recognition apparatus for a vehicle, using a microphone arrangement to determine the seat from which a command is generated
JPH05290382A (ja) 1992-04-08 1993-11-05 Matsushita Electric Ind Co Ltd 音楽記録媒体
US5384893A (en) 1992-09-23 1995-01-24 Emerson & Stern Associates, Inc. Method and apparatus for speech synthesis based on prosodic analysis
US5903226A (en) * 1993-03-15 1999-05-11 Prince Corporation Trainable RF system for remotely controlling household appliances
JP2897659B2 (ja) 1994-10-31 1999-05-31 ヤマハ株式会社 カラオケ装置
US5794164A (en) 1995-11-29 1998-08-11 Microsoft Corporation Vehicle computer system
US6028537A (en) * 1996-06-14 2000-02-22 Prince Corporation Vehicle communication and remote control system
US5854593A (en) * 1996-07-26 1998-12-29 Prince Corporation Fast scan trainable transmitter
US7058376B2 (en) 1999-01-27 2006-06-06 Logan James D Radio receiving, recording and playback system
US20020120925A1 (en) 2000-03-28 2002-08-29 Logan James D. Audio and video program recording, editing and playback systems using metadata
US7295752B1 (en) * 1997-08-14 2007-11-13 Virage, Inc. Video cataloger system with audio track extraction
US6584181B1 (en) * 1997-09-19 2003-06-24 Siemens Information & Communication Networks, Inc. System and method for organizing multi-media messages folders from a displayless interface and selectively retrieving information using voice labels
US5926087A (en) * 1997-12-22 1999-07-20 Prince Corporation Visor parameter monitor and display
US6154148A (en) * 1997-12-22 2000-11-28 Prince Corporation Vehicle-to-individual paging system
US6078885A (en) 1998-05-08 2000-06-20 At&T Corp Verbal, fully automatic dictionary updates by end-users of speech synthesis and recognition systems
JP4794707B2 (ja) * 1998-11-17 2011-10-19 ソニー株式会社 端末装置、課金システム、データ処理方法
US20020048224A1 (en) 1999-01-05 2002-04-25 Dygert Timothy W. Playback device having text display and communication with remote database of titles
US7787907B2 (en) * 1999-05-26 2010-08-31 Johnson Controls Technology Company System and method for using speech recognition with a vehicle control system
US7346374B2 (en) * 1999-05-26 2008-03-18 Johnson Controls Technology Company Wireless communications system and method
EP1852836A3 (en) * 1999-05-26 2011-03-30 Johnson Controls Technology Company Wireless communications system and method
US6622083B1 (en) 1999-06-01 2003-09-16 Siemens Vdo Automotive Corporation Portable driver information device
ATE320650T1 (de) 1999-06-30 2006-04-15 Ibm Verfahren zur erweiterung des wortschatzes eines spracherkennungssystems
US6526335B1 (en) 2000-01-24 2003-02-25 G. Victor Treyz Automobile personal computer systems
JP3959219B2 (ja) 2000-01-31 2007-08-15 クラリオン株式会社 車両無線データ通信システム
US20020090596A1 (en) 2000-02-09 2002-07-11 Sosoka John R. Apparatus, systems and methods for electronically teaching phonics
US6389337B1 (en) 2000-04-24 2002-05-14 H. Brock Kolls Transacting e-commerce and conducting e-business related to identifying and procuring automotive service and vehicle replacement parts
US20020049717A1 (en) 2000-05-10 2002-04-25 Routtenberg Michael D. Digital content distribution system and method
US6874018B2 (en) 2000-08-07 2005-03-29 Networks Associates Technology, Inc. Method and system for playing associated audible advertisement simultaneously with the display of requested content on handheld devices and sending a visual warning when the audio channel is off
US20020091706A1 (en) * 2000-09-06 2002-07-11 Johnson Controls Technology Company Vehicle history and personalization information management system and method
WO2002022405A2 (en) * 2000-09-18 2002-03-21 Johnson Controls Technology Company Digital memo recorder having removable memory unit for vehicle interior
JP2002149166A (ja) 2000-11-09 2002-05-24 Yamaha Corp 楽曲情報配信装置、方法、及び記録媒体
US7099946B2 (en) 2000-11-13 2006-08-29 Canon Kabushiki Kaishsa Transferring a media browsing session from one device to a second device by transferring a session identifier and a session key to the second device
US6973427B2 (en) 2000-12-26 2005-12-06 Microsoft Corporation Method for adding phonetic descriptions to a speech recognition lexicon
US20020086719A1 (en) 2000-12-29 2002-07-04 Pankaj Kedia Low power subsystem for portable computers
US6993532B1 (en) 2001-05-30 2006-01-31 Microsoft Corporation Auto playlist generator
US7251452B2 (en) 2001-07-09 2007-07-31 Sirius Satellite Radio System and method for creating and receiving personalized broadcasts
JP4422930B2 (ja) 2001-08-07 2010-03-03 パイオニア株式会社 情報処理システム、情報処理システムの情報処理方法、情報処理装置および情報処理プログラム
US20030109218A1 (en) 2001-10-18 2003-06-12 Azalea Microelectronics Corporation Portable wireless storage unit
US6859803B2 (en) 2001-11-13 2005-02-22 Koninklijke Philips Electronics N.V. Apparatus and method for program selection utilizing exclusive and inclusive metadata searches
US7483832B2 (en) 2001-12-10 2009-01-27 At&T Intellectual Property I, L.P. Method and system for customizing voice translation of text to speech
US20030110079A1 (en) 2001-12-12 2003-06-12 Weisman Mitchell T. Method and apparatus for providing items to users in a computer network
US7069510B2 (en) 2002-01-16 2006-06-27 Microsoft Corporation In-vehicle audio browser system having a common usability model
US7188066B2 (en) 2002-02-04 2007-03-06 Microsoft Corporation Speech controls for use with a speech system
US20030158737A1 (en) 2002-02-15 2003-08-21 Csicsatka Tibor George Method and apparatus for incorporating additional audio information into audio data file identifying information
US8150937B2 (en) * 2004-10-25 2012-04-03 Apple Inc. Wireless synchronization between media player and host device
US20040203379A1 (en) * 2002-04-23 2004-10-14 Johnson Controls Technology Company Bluetooth transmission of vehicle diagnostic information
US20040110472A1 (en) * 2002-04-23 2004-06-10 Johnson Controls Technology Company Wireless communication system and method
US20040033821A1 (en) 2002-08-16 2004-02-19 Visteon Global Technologies, Inc. In-vehicle entertainment system
US7047039B2 (en) 2002-09-09 2006-05-16 Hewlett-Packard Development Company, L.P. System for streaming broadcast signals from automobiles
US7169996B2 (en) 2002-11-12 2007-01-30 Medialab Solutions Llc Systems and methods for generating music using data/music data file transmitted/received via a network
US20040117442A1 (en) 2002-12-10 2004-06-17 Thielen Kurt R. Handheld portable wireless digital content player
US20050239434A1 (en) 2002-12-11 2005-10-27 Marlowe Ira M Multimedia device integration system
CN1729276A (zh) * 2002-12-19 2006-02-01 皇家飞利浦电子股份有限公司 用于网络下载音乐文件的方法和系统
US7191193B2 (en) * 2003-01-02 2007-03-13 Catch Media Automatic digital music library builder
JP2006523416A (ja) * 2003-03-24 2006-10-12 ジョンソン コントロールズ テクノロジー カンパニー 車載無線通信システムを構成するシステムおよび方法
JP2004309795A (ja) 2003-04-07 2004-11-04 Mitsubishi Electric Corp 音楽提供システム
US7213036B2 (en) * 2003-08-12 2007-05-01 Aol Llc System for incorporating information about a source and usage of a media asset into the asset itself
WO2005042314A1 (en) * 2003-10-21 2005-05-12 Johnson Controls Technology Company System and method for selecting a user speech profile for a device in a vehicle
US20060034481A1 (en) 2003-11-03 2006-02-16 Farhad Barzegar Systems, methods, and devices for processing audio signals
US20050099547A1 (en) 2003-11-07 2005-05-12 Vitito Christopher J. Automobile entertainment system
US20050235327A1 (en) 2003-11-07 2005-10-20 Vitito Christopher J Vehicle entertainment system
US20050223406A1 (en) 2003-11-07 2005-10-06 Vitito Christopher J Vehicle entertainment system including a detachable video system with a hard drive based video source
US20050235326A1 (en) 2003-11-07 2005-10-20 Vitito Christopher J Vehicle entertainment system
US20050155068A1 (en) 2004-01-08 2005-07-14 Chang Chung L. Multi-media player
US7346370B2 (en) * 2004-04-29 2008-03-18 Cellport Systems, Inc. Enabling interoperability between distributed devices using different communication link technologies
US20050281414A1 (en) 2004-06-18 2005-12-22 Simon Gregory R Method and apparatus for control of personal digital media devices using a vehicle audio system
US7908141B2 (en) * 2004-09-29 2011-03-15 International Business Machines Corporation Extracting and utilizing metadata to improve accuracy in speech to text conversions
WO2006074110A2 (en) * 2005-01-05 2006-07-13 Divx, Inc. System and method for a remote user interface
US20060181963A1 (en) * 2005-02-11 2006-08-17 Clayton Richard M Wireless adaptor for content transfer
EP1693829B1 (en) * 2005-02-21 2018-12-05 Harman Becker Automotive Systems GmbH Voice-controlled data system
WO2007022533A2 (en) * 2005-08-19 2007-02-22 Gracenote, Inc. Method and system to control operation of a playback device
US7684991B2 (en) * 2006-01-05 2010-03-23 Alpine Electronics, Inc. Digital audio file search method and apparatus using text-to-speech processing
CN101449538A (zh) 2006-04-04 2009-06-03 约翰逊控制技术公司 媒体文件的文本-语法改进
US7870142B2 (en) * 2006-04-04 2011-01-11 Johnson Controls Technology Company Text to grammar enhancements for media files
US20080175411A1 (en) * 2007-01-19 2008-07-24 Greve Jens Player device with automatic settings
US7801729B2 (en) * 2007-03-13 2010-09-21 Sensory, Inc. Using multiple attributes to create a voice search playlist

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102843680A (zh) * 2011-06-24 2012-12-26 福特全球技术公司 用于蓝牙功能验证的方法
CN105723325A (zh) * 2013-11-13 2016-06-29 微软技术许可有限责任公司 使用因用户而异的语法的媒体项选择
US10430024B2 (en) 2013-11-13 2019-10-01 Microsoft Technology Licensing, Llc Media item selection using user-specific grammar
CN105723325B (zh) * 2013-11-13 2019-11-19 微软技术许可有限责任公司 使用因用户而异的语法的媒体项选择的方法与设备
CN112673368A (zh) * 2018-07-31 2021-04-16 马维尔国际贸易有限公司 用于在存储边缘处生成描述非结构化数据对象的元数据的系统和方法

Also Published As

Publication number Publication date
EP2005319B1 (en) 2017-01-11
US9092435B2 (en) 2015-07-28
US20090326949A1 (en) 2009-12-31
WO2007123797A1 (en) 2007-11-01
EP2005319A1 (en) 2008-12-24
CN101449538A (zh) 2009-06-03

Similar Documents

Publication Publication Date Title
CN101467142A (zh) 在车辆中从数字媒体存储设备提取元数据以用于媒体选择的系统和方法
US7870142B2 (en) Text to grammar enhancements for media files
EP1693829B1 (en) Voice-controlled data system
CN1967695B (zh) 信息处理装置、再现装置、通信方法、再现方法及计算机程序
US10229669B2 (en) Apparatus, process, and program for combining speech and audio data
JP3662969B2 (ja) カラオケシステム
US20050216257A1 (en) Sound information reproducing apparatus and method of preparing keywords of music data
US20200042279A1 (en) Platform for producing and delivering media content
CN107680571A (zh) 一种歌曲伴奏方法、装置、设备和介质
KR20080043358A (ko) 재생 디바이스의 동작을 제어하는 방법 및 시스템
KR20080000203A (ko) 음성인식을 이용한 음악 파일 검색 방법
CN101185115A (zh) 语音编辑装置、语音编辑方法和语音编辑程序
CN101094445A (zh) 一种实现文本短信语音播放的系统及方法
CN101908058B (zh) 计算机实施系统
CN202289477U (zh) 一种通过无线网络进行语音播放的语音玩具终端设备
US20070260590A1 (en) Method to Query Large Compressed Audio Databases
JP6587459B2 (ja) カラオケイントロにおける曲紹介システム
JP2009092977A (ja) 車載装置および楽曲検索システム
CN109377988A (zh) 用于智能音箱的交互方法、介质、装置和计算设备
JPH1124685A (ja) カラオケ装置
US20240169962A1 (en) Audio data processing method and apparatus
JP2009204872A (ja) 音声認識用辞書生成システム
EP2058799B1 (en) Method for preparing data for speech recognition and speech recognition system
JP2007263994A (ja) カラオケ再生装置
KR100677215B1 (ko) 엠피3 플레이어의 음성 합성/인식 기능을 이용한 파일선택 방법

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20090624