CN101416477A - 向移动无线终端的用户通告音频和视频内容的方法和系统 - Google Patents

向移动无线终端的用户通告音频和视频内容的方法和系统 Download PDF

Info

Publication number
CN101416477A
CN101416477A CNA2006800542333A CN200680054233A CN101416477A CN 101416477 A CN101416477 A CN 101416477A CN A2006800542333 A CNA2006800542333 A CN A2006800542333A CN 200680054233 A CN200680054233 A CN 200680054233A CN 101416477 A CN101416477 A CN 101416477A
Authority
CN
China
Prior art keywords
audio
data
user
playback
electronic equipment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CNA2006800542333A
Other languages
English (en)
Inventor
爱德华·克雷格·海厄特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Mobile Communications AB
Original Assignee
Sony Ericsson Mobile Communications AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Ericsson Mobile Communications AB filed Critical Sony Ericsson Mobile Communications AB
Publication of CN101416477A publication Critical patent/CN101416477A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72403User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
    • H04M1/7243User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72403User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
    • H04M1/72442User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality for playing music files

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Human Computer Interaction (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Telephone Function (AREA)
  • Television Signal Processing For Recording (AREA)
  • Telephonic Communication Services (AREA)

Abstract

一种向用户播放视听内容并通告与该视听内容相关的信息的电子设备(10,10′)。该电子设备可包括:回放视听数据的视听数据播放器(32,38,76);合成器(80),其将与视听数据相关的文本数据转换成用于向用户可听地回放文本的文本数据的代表;以及控制器(24,62),其控制合成器和视听数据播放器以与视听内容的回放相关联地回放文本数据,从而向用户通告该视听数据。

Description

向移动无线终端的用户通告音频和视频内容的方法和系统
技术领域
本发明总体上涉及电子设备(例如,参与话音通信和/或为用户回放视听内容的电子设备)。更具体地说,本发明涉及向移动无线终端的用户通告音频和/或视频内容的方法和系统。
背景技术
移动电子设备和/或无线电子设备正变得日益普及。例如,移动电话和便携式媒体播放器现在已得到广泛应用。另外,与特定类型的电子设备相关的部件也变得日益多样化。例如,许多电子设备具有照相机、文本消息收发功能、互联网浏览功能、电子邮件功能、视频回放功能、音频回放功能、图像显示功能和免提耳机接口。
如所指出的,一些电子设备具有音频和/或视频回放功能。音频回放可以包括打开来自设备存储器的音频文件、对包含在文件内的音频数据进行解码、以及输出与解码后的音频相对应的声音以供用户收听。可以例如利用设备的扬声器或者利用听筒(例如,有线“耳机”或无线耳机组件)来输出声音。视频回放可以包括打开视频文件、解码视频数据、以及输出对应的视频信号来驱动显示器。视频回放还可以包括解码与视频数据相关的音频数据,并向用户输出对应的声音。
在其他情况中,设备可以被配置为回放接收到的音频数据。例如,移动无线兼容设备可以具有用于调谐移动广播频道或移动电视频道的接收机。移动收音服务和视频服务通常通过下行流传输(downstreaming)(例如,时间分割数据流的部分,其中在数据流的各时隙中,以突发数据的方式传送各频道的音频和/或视频数据)来传送音频数据。该设备调谐到感兴趣的特定频道,以使得所选频道的突发数据被接收、缓存、重组、解码并输出给用户。
许多音频和视频文件(包括所储存的音频和视频文件以及流式音频(streaming audio)和流式视频(streaming video)数据)包含标识关于相应内容的信息的头部。例如,音乐(或歌曲)文件头部可以标识该歌曲的标题、演唱者、专辑名以及作品录制的年份。该信息可以被用来分类文件,并且在回放期间,在可视显示器上将歌曲信息作为文本显示给用户。然而,在许多情况下,用户可能不方便观看显示器来阅读任何显示信息。此外,信息的显示限于头部包含的数据。以相同的方式可视地显示关于视频内容的信息。
发明内容
根据本发明的一方面,移动无线终端包括:无线电路,该无线电路使得移动无线终端能够完成与被叫装置或主叫装置之间的呼叫;以及文本-语音合成器,该文本-语音合成器将文本数据转换成用于向用户可听地回放文本的文本数据的代表。
根据另一方面,转换后的文本数据来自于与视听数据相关的头部。
根据另一方面,移动无线终端还包括向用户回放视听数据的视听数据播放器,并且,以视听数据的回放相关联地回放转换后的文本数据,以向用户通告该视听数据。
根据另一方面,来自头部的转换后的文本数据与填充音频合并,以模仿人类播音员。
根据本发明的另一方面,一种向用户播放视听内容并通告与该视听内容相关的信息的电子设备,该电子设备包括:回放视听数据的视听数据播放器;合成器,其将与视听数据相关的文本数据转换成用于向用户可听地回放文本的文本数据的代表;以及控制器,其控制合成器和视听数据播放器以与视听数据的回放相关地回放文本数据,从而向用户通告视听数据。
根据另一方面,将与视听数据相关的转换后的文本数据与填充音频合并,以模仿人类播音员。
根据另一方面,电子设备还包括音频混合器,该音频混合器在控制器的控制下,对处于各自音量的视听数据播放器的音频输出和合成器的输出进行组合。
根据另一方面,在从回放视听数据之前、回放视听数据之后或回放视听数据期间中的一个中选择一个时机来可听地通告文本数据。
根据另一方面,该文本数据来自于包含视听数据的视听文件的头部。
根据另一方面,电子设备还包括用于储存视听文件的存储器。
根据另一方面,回放多个视听数据单元,并针对各视听数据单元回放来回放文本数据,并且控制器随着从一个视听数据回放到下一视听数据回放而改变文本数据回放的通告风格。
根据另一方面,控制器控制合成器来对文本数据的转换应用风格。
根据另一方面,该风格与视听数据的类别相对应。
根据另一方面,该风格与一天中的时间相对应。
根据另一方面,控制器还控制合成器来转换与视听数据播放器回放的视听数据无关的附加文本数据,以向用户回放该附加文本数据。
根据另一方面,在第一视听数据单元的回放和第二视听数据单元的回放之间通告附加文本数据。
根据另一方面,附加文本数据与由电子设备的日程功能所管理的日程事件相对应。
根据另一方面,附加文本数据与由电子设备的时钟功能管理的时间相对应。
根据另一方面,从电子设备外部的来源获得附加文本数据,并且附加文本数据对应于新闻标题、天气报道、交通信息、比赛比分或股票价格中的至少一个。
根据另一方面,由服务提供商预先格式化附加文本数据以由电子设备进行回放。
根据另一方面,附加文本数据是通过由电子设备的信息检索功能执行搜索而获得的。
根据另一方面,响应于从用户接收到语音命令来回放附加文本数据。
根据另一方面,电子设备还包括收发机,该收发机接收作为下行流的视听数据以由视听数据播放器进行回放。
根据另一方面,该电子设备为移动无线终端。
根据本发明的另一方面,一种向电子设备的用户播放视听内容并通告与该视听内容相关的信息的方法,该方法包括以下步骤:向用户回放视听数据;以及将与该视听数据相关的文本数据转换成文本数据的代表,并以音频方式向用户回放该代表。
参照下面的描述和附图,将清楚本发明的这些和进一步的特征。在该描述和附图中,详细公开了本发明的特定实施方式,以示出可以采用本发明的原理的一些方式,但应当明白,本发明并不由此在范围上受到限制。相反,本发明包括落入于所附权利要求的精神和范围内的全部改变例、修改例以及等同物。
针对一个实施方式描述和/或例示的特征可以按相同方式或按相似方式用于一个或更多个其它实施方式和/或与其它实施方式的特征进行组合,或者代替其它实施方式的特征使用。
应当强调的是,在本说明书中使用术语“包括/包含”用来说明所述特征、整件、步骤或组件的存在,而不排除还存在或添加一个或更多个其它特征、整件、步骤、组件或其组合。
附图说明
图1是作为根据本发明实施方式的示例性电子设备的移动电话的示意图;
图2是根据本发明实施方式的图1的移动电话的相关部分的示意框图;
图3是图1的移动电话可以在其中工作的通信系统的原理图;
图4是根据本发明实施方式的另一示例性电子设备的示意框图;以及
图5是根据本发明的示例性视听内容通告功能的流程图。
具体实施方式
下面,参照附图对本发明进行说明,在整个附图中使用相同标号来表示相同组件。
术语“电子设备”包括便携式无线通信设备。术语“便携式无线通信设备”(在下文中,称之为“移动无线终端”)包括诸如移动电话、寻呼机、通信装置、电子记事薄、个人数字助理(PDA)、智能手机、便携式通信装置等的所有设备。其他示例性电子设备可以包括,但不限于便携式媒体播放器、媒体自动点唱机以及类似设备,这些电子设备可以具有或者不具有无线收发机。
在本申请中,主要以移动电话的情况对本发明进行说明。然而,可以理解,本发明不限于移动电话,而可以是任何类型的电子设备。此外,主要以通告音频内容的情况对本发明的实施方式进行说明。但应该意识到,本发明并不希望限于音频内容的通告,而可以扩展到通告任何信息(例如,通告任何形式的视听内容)。如这里所使用的,视听内容显然包括但不限于来自音频文件或音频数据的音频内容、来自视频文件或视频数据的视频内容(含有或者没有相关联的音频内容),以及来自图像文件或图像数据的图像内容(例如照片)。
首先参照图1,其示出了根据本发明的电子设备10。该电子设备具有视听内容通告功能,该视听内容通告功能被配置为向用户提供与相关的视听内容的回放或输出相对应的音频信息。应该理解,视听内容的回放涉及任何视听内容获取方式,并且包括但不限于从本地储存的文件读取视听数据以及通过传输(例如,音频和/或视频下行流、移动广播频道、移动电视频道、RSS馈送等)接收数据。因此,可以从播客(podcast)源、移动广播或电视频道等通过文件传送、下载来获得视听文件和/或视听数据。视听内容通告功能可以从视听文件或视听数据的头部得到通告的信息。除通告关于视听文件或视听数据的信息之外,视听内容通告功能可以向用户提供附加的音频信息(例如,比赛比分、天气信息、交通信息、新闻、日程事件、日期和/或时间等)。通告的选择和时机可以被配置为使得视听内容通告功能模仿常规广播唱片主持人(DJ:radio diskjockey),并且可以针对电子设备10的用户进行个性化。各视听文件的视听数据或接收视听数据的各段可以被称为视听数据单元。
应该意识到,视听内容通告功能可以被实施为可执行代码,这些可执行代码可以驻留在电子设备10中并由该电子设备执行。在其他实施方式中,如下面将更详细描述的,视听内容通告功能(或部分功能)可以驻留在与电子设备10分立的服务器或设备中并由该服务器或设备执行(例如,从而节省电子设备10的资源)。
图1-3的示例性实施方式中的电子设备是移动电话,并且将被称为移动电话10。移动电话10被示出为具有“直板形”或“块形”外壳12,但是可以理解,可以利用诸如翻盖外壳或滑盖外壳的其它类型的外壳。
移动电话10包括显示器14和键盘16。常规来说,显示器14向用户显示诸如工作状态、时间、电话号码、联络信息、各种导航菜单等的信息,这使得用户能够利用移动电话10的各种功能。显示器14还可以被用于可视地显示由移动电话10接收到的内容和/或从移动电话10的存储器18(图2)中提取的内容。
类似的是,键盘16常规地提供各种用户输入操作。例如,键盘16典型地包括字母数字键20,以允许键入诸如电话号码、电话列表、联络信息、注释等的字母数字信息。另外,键盘16典型地包括特定功能键,例如用于发起或应答呼叫的“呼叫发送”键,和用于结束或“挂断”呼叫的“呼叫结束”键。常规来说,特定功能键例如还可以包括菜单导航键,其浏览显示在显示器14上的菜单以选择不同电话功能、简档、设置等。与移动电话相关的其它键可以包括音量键、静音键、开机/关机键、web浏览器启动键、照相机键等。可以将键和类键功能具体实施为与显示器14相关的触摸屏。
移动电话10包括常规呼叫电路,该常规呼叫电路使得移动电话10能够与被叫/主叫装置(典型地与另一移动电话或固定电话)建立呼叫和/或交换信号。然而,被叫/主叫装置不一定是另一电话,还可以是诸如互联网web服务器、内容提供服务器等的一些其它装置。
图2示出移动电话10的功能框图。除了根据本发明的视听内容通告功能22(优选的是,其在移动电话10内被实现为应用软件或代码形式的可执行逻辑)以外,移动电话10的其它构造大体上为常规构造。移动电话10包括主控制电路24,该主控制电路24被设置成执行移动电话10的功能和操作的整体控制。控制电路24可以包括处理装置26(例如CPU、微控制器或微处理器)。处理装置26执行存储在控制电路24内的存储器(未示出)和/或单独存储器(例如,存储器18)中的代码,以执行移动电话10的常规操作。存储器18例如可以是缓存器、闪速存储器、硬盘、可移除介质、易失性存储器和/或非易失性存储器或其他适当装置中的一种或更多种。另外,处理装置26执行代码以执行视听内容通告功能22。
熟悉计算机编程(尤其是针对移动电话或其他电子设备的应用编程方面)的普通技术人员应当清楚怎样对移动电话10进行编程以操作和执行这里所述的功能。因此,为简明起见,省去了关于具体编程代码的细节。而且,虽然根据本发明的优选实施方式由处理装置26来执行视听内容通告功能22,但在不脱离本发明的范围的情况下,这种功能还可以由专用硬件、固件、软件或其组合来执行。
继续参照图1和图2,移动电话10包括耦接到无线电路30的天线28。无线电路30包括常规地经由天线28发送和接收信号的射频发射机和接收机。无线电路30可以被配置为在移动通信系统中工作,以及接收视听内容。例如,接收机可以是与提供移动通信服务和数字广播服务(例如DVB-H移动电视和/或移动广播)的混合网络结构兼容的IP数据广播兼容接收机。例如,存在与移动无线网络或广播网络交互的其他接收机,这些接收机包括GSM、CDMA、WCDMA、MBMS、WiFi、WiMax、DVB-H、ISDB-T等。
移动电话10还包括声音信号处理电路32,该声音信号处理电路对向无线电路30发射的/从无线电路30接收的音频信号进行处理。和常规情况一样,支持用户通过移动电话10接听和讲话的扬声器34和麦克风36耦接到声音处理电路32。无线电路30和声音处理电路32均耦接到控制电路24以执行整体操作。音频数据可以从控制电路24传送到声音信号处理电路32以向用户进行回放。音频数据例如可以包括来自存储器18储存并由控制电路24提取的音频文件的音频数据。声音信号处理电路32可以包括任何合适的缓存、解码器、放大器等。
移动电话10还包括耦接到控制电路24的前述显示器14和键盘16。显示器14可以由视频解码器38耦接到控制电路24,视频解码器38将视频数据转换成用来驱动显示器14的视频信号。视频数据可以由控制电路24生成、从储存在存储器18中的视频文件中提取、从无线电路30接收到的输入视频数据流得到、或者通过任何其他合适的方法获得。在馈送到解码器38之前,可以在缓存器40中缓存视频数据。
移动电话10还包括一个或更多个I/O接口42。I/O接口42可以具有典型的移动电话I/O接口的形式,并且可以包括一个或更多个电连接器。典型的是,I/O接口42可以用来将移动电话10耦接到电池充电器,以对移动电话10内的电源单元(PSU:power supply unit)的电池进行充电。此外,或者另选的是,I/O接口42可以用来将移动电话10连接到有线个人免提适配器(未示出)(例如耳机(有时称为耳塞)),来以可听见的方式向用户输出由声音信号处理电路32输出的声音信号。此外,I/O接口42可以用来经由数据缆线将移动电话10连接到个人计算机或其他设备。当移动电话10连接到车载电源适配器或电气输出电源适配器时,该移动电话可以经由I/O接口42接收工作电力。
移动电话10还可以包括执行计时功能的定时器46。这种功能可以包括对呼叫持续时间进行计时、生成时间戳和日期戳的内容等。移动电话10可以包括拍摄数字图片和/或影像的照相机48。对应于图片和/或影像的图像和/或视频文件可以被储存在存储器18中。移动电话10还可以包括位置数据接收机50(例如,全球定位系统(GPS)接收机、伽利略卫星系统接收机等)。移动电话10还可以包括本地无线接口52(例如,红外收发机和/或RF适配器(例如,蓝牙适配器)),本地无线接口52用于与附件、免提适配器(例如,耳机,该耳机可以以可听见方式输出与从移动电话10向适配器传送的音频数据相对应的声音)、另一移动无线终端、计算机或其他装置建立通信。
移动电话10可以被配置为发射、接收和处理数据(例如,文本消息(例如,短消息服务(SMS:short message service)格式消息)、电子邮件消息、多媒体消息(例如,多媒体消息服务(MMS:multimedia messagingservice)格式消息)、图像文件、视频文件、音频文件、铃音、流式音频、流式视频、数据馈送(包括播客(podcast))等)。对这些数据的处理可以包括将数据储存在存储器18中、执行应用程序以允许用户与数据交互、显示与该数据相关的视频和/或图像内容、输出与数据相关的音频声音等。
另外参照图3,移动电话10可以被配置成作为通信系统54的一部分工作。系统54可以包括具有服务器58(或多个服务器)的通信网络56,服务器58用于管理由移动电话10发出的和指向移动电话10的呼叫、将数据发送给移动电话10以及执行任何其他支持的功能。服务器经由传输介质与移动电话10通信。传输介质可以是任何合适的设备或组件,例如包括通信塔、另一移动电话、无线接入点、卫星等。网络的部分可以包括无线传输路径。尽管在图3的图示中仅示出一个移动电话10,但是网络56可以支持多个移动电话10的通信活动。
在一种实施方式中,服务器58可以相对于网络52的其他服务器以独立构造工作,或者可以被配置为执行多个通信网络58功能。可以理解,服务器58可以被配置为用来执行服务器功能的典型计算机系统,并且可以包括处理器,该处理器被配置为执行包含实施服务器58的功能的逻辑指令的软件。这些功能可以包括这里在如下实施方式中描述的视听内容通告功能的部分,并且将被统称为视听内容通告支持功能60,在该实施方式中,视听内容通告功能22不通过移动电话10或者部分通过移动电话10执行,和/或服务器功能是移动电话10的视听内容通告功能22的操作的补充。
参照图4,例示了以可听见方式通告信息的示例性电子设备10′的框图。在图4中,使用无箭头的线例示了示例性控制信号路径,而使用有箭头的线例示了示例性音频数据和/或音频信号路径。如所指出的,以下描述涉及音频内容的回放和通告与其相关的信息。然而,本发明不受此限制,并且适用于以可听见方式通告任意类型的视听内容和/或附加信息。
电子设备10′可以被实施为移动电话10,在这种情况中,可以用移动电话10的上述部件和/或用附加的部件来实现所示的部件。可以理解,在其它实施方式中,电子设备10'可以被配置为媒体内容播放器(例如,MP3播放器)、PDA或任何其他合适的设备。可以按部件的任何合适形式(包括但不限于,软件(例如由计算机可读介质储存的程序)、固件、硬件(例如电路部件、集成电路等)、存储器储存的数据等)来实现电子设备10'的所示部件。在其他实施方式中,可以在电子设备10'的外部执行与图4相关描述的一些功能。相应地,图4中所示的一些部件可以被实施为驻留在电子设备10'中的视听内容通告功能的一部分(例如,视听内容通告功能22),或者被实施为驻留在联网设备(例如,服务器58)中的视听内容通告功能的部分(例如,视听内容通告支持功能60)。
电子设备10'可以包括控制器62。控制器62可以包括执行逻辑指令的处理器(未示出)和储存实现逻辑指令的代码的存储器(未示出)。例如,在其中电子设备10'是移动电话10的实施方式中,控制器62可以是控制电路24,处理器可以是处理设备26,并且存储器可以是控制电路24的存储器和/或存储器18。
控制器62可以执行逻辑指令来执行这里描述的各种信息通告功能。这些功能可以包括但不限于视听内容通告功能22、时钟功能64、日历功能66以及信息检索功能68。视听内容通告功能22可以控制向用户回放音频内容的整体操作,并监视电子设备10'的各种其他音频功能。时钟功能64可以保存日期和时间。在其中电子设备10'是移动电话10的实施方式中,可以通过计时器46实现时钟功能66。日历功能66可以记录对于用户重要的各种事件(例如,约会、生日、纪念日等),并且可以如一般常规的电子日历或时间计划装置那样工作。
信息检索功能68可以被配置为从外部设备检索信息。例如,信息检索功能68可以负责获得天气信息、新闻、社会事件、体育信息等。在一种实施方式中,信息来源可以是与电子设备10'通信的服务器(例如,服务器58或因特网服务器)。如下面将更清楚的,通过信息检索功能68检索到的信息可以被预先格式化(例如由数据服务提供商格式化)以与视听内容通告功能22相协调,或者可以来自于答复信息检索功能22的询问所接收到的结果。在一种实施方式中,信息检索功能68可以包括与因特网服务器(例如,WAP浏览器)交互的浏览器功能。在其他实施方式中,电子设备10'接收到的供视听内容通告功能22使用的信息来自于服务提供商,并且可以例如以SMS或MMS的形式或者作为下行流的一部分被推送(push-deliver)给电子设备10'。
电子设备10'还可以包括收发机70。在其中电子设备10'为移动电话10的实施方式中,可以通过无线电路30实现收发机70。收发机30可以被配置为接收向用户回放的视听数据,例如包括下载或推送的视听文件和流式视听内容。另外,收发机70可以被配置成为信息检索功能68提供数据交换平台。
电子设备10'还可以包括用户设置72,该用户设置包含关于应该如何执行视听内容通告功能22的特定操作方面的数据。可以由存储器储存用户设置72。例如,在其中电子设备10'为移动电话10的实施方式中,可以由存储器18储存用户设置72。
电子设备10'还可以包括音频文件74,该音频文件包含向用户回放的音频数据。典型地,音频文件74可以是以诸如MP3的适当文件格式储存的歌曲。其他格式例如可以包括WAV、WMA、ACC、MP4等。可以存在其他类型的内容和文件格式。例如,音频文件可以是播客、铃音、文件或包含音乐、新闻报道、学术讲座等的其他音频数据。可以由存储器储存音频文件74。例如,在其中电子设备10'为移动电话10的实施方式中,可以由存储器18储存音频文件74。
此外,可以理解,除音频内容之外,本发明还应用于其他类型的视听内容。音频文件74和对音频内容处理的描述与图示是出于示例目的。本发明应用的内容的类型仅由所附权利要求的范围限定。
向用户回放的音频数据不需要以音频文件的形式进行储存,而是可以利用接收机70以流式音频数据的形式接收,以向用户回放。对接收到的音频数据的回放可以不包括以音频文件74形式来储存音频数据,尽管可以进行这种音频数据的临时缓存。
音频文件74和接收到的音频数据可以包括头部,该头部包含关于相应音频数据的信息。例如,对于音乐(例如,歌曲)文件来说,头部可以描述歌曲的标题、演唱者、发布该歌曲的唱片以及录制年份。表1列出了MP3文件格式阐述了ID 3v1头部。
 
字段 偏移(字节) 长度(字节) 字段内容描述
1 0 3 标签标识符串
2 3 30 歌曲名称字符串
3 33 30 演唱者字符串
4 63 30 唱片字符串
5 93 4 年份字符串
6 97 30 注解字符串
7 127 1 风格字节
电子设备10'还可以包括音频播放器76。音频播放器76可以将来自音频文件74的数字音频数据或接收到的音频数据转换成用来驱动扬声器78的模拟音频信号。音频播放器76例如可以包括缓存器和音频解码器。在其中电子设备10'为移动电话10的实施方式中,音频播放器76可以是声音信号处理电路32。在其中电子设备10'为移动电话10的实施方式中,扬声器78可以是扬声器34。
电子设备10'还可以包括文本-语音合成器(text to speech synthesizer)80。合成器80可以被用来将音频文件头部信息或其他文本数据转换成用来驱动扬声器78的模拟音频信号。该合成器可以包括通过文本-语音引擎前端和后端实施的语音合成技术,该前端将文本数据转换成文本的符号语言表达,该后端将该表达转换成声音输出信号。可以理解,可以用软件和/或硬件来实现合成器80。可以由控制器62执行部分合成器的功能。
电子设备10'还可以包括音频混合器82,该音频混合器在控制器62的控制下彼此按比例对音频播放器76和合成器80的输出进行组合。这样,混合器82可以被控制为使得用户听到的输出可以仅来自于音频文件74(或接收到的音频数据),或者仅来自于合成器80。并且,混合器可以用来使用户听到来自音频播放器76和合成器80的输出,在这种情况中,相对地控制音频文件内容(或接收到的音频数据内容)和合成器输出的相对音量。混合器82的输出可以被输入到放大器84,来控制扬声器78的输出音量。
电子设备10'还可以包括麦克风86。麦克风86可以用来接收用户对视听内容通告功能22呈现给用户的问题的语音响应,和/或接收来自用户的命令。可以由视听内容通告功能22的语音识别部件来处理用户输入,以解释该输入并执行对应动作。在其中电子设备10'为移动电话10的实施方式中,麦克风86可以是麦克风36。
可以理解,还存在电子设备10'的其他构造,并且例如包括允许利用有线或无线耳机回放来自所选的音频文件74(或接收到的音频文件)的音频内容和合成后的音频内容的构造。
另外参照图5,将对电子设备10'的示例性操作功能进行说明。继续以回放音频数据为示例,操作功能包括与音频数据的回放相结合地将文本信息转换成语音。以这种方式,可以将电子设备10'视作模仿DJ(或者更广义上说,模仿视听内容播音员)。音频文件头部数据可以用来以可听见方式通告用户与刚播放、要播放的或正在播放的音乐相关的信息。此外,还可以以可听见方式向用户提供附加信息,以向用户通告该信息。这种附加信息例如可以包括时间、日期、天气、交通、新闻、用户自己的日程事件、社会事件等。
图5例示了通过视听内容通告功能22和/或其他功能执行的逻辑框的流程图,并且可以视作描绘了一种方法的步骤。尽管图5示出了执行功能逻辑框的特定顺序,但是可以相对于所示的顺序改变这些框的执行顺序。此外,可以同时或者部分同时执行连续示出的两个或更多个框。还可以省略某些框。另外,出于增强实用性、记费、性能、测量、故障诊断等的目的,可以将任意数量的命令、状态变量、信号量或消息添加到该逻辑流程中。应该理解,所有这些变化都落在本发明范围内。
可以在框88开始该方法,在该框中加载用户设置72。用户设置72包含关于视听内容通告功能22以何种方式和何时以可听见方式向用户通告信息以及向用户通告哪些信息的数据。例如,用户设置72可以为用于通告信息的语音设置风格(persona)。示例性风格设置可以包括语音的性别(男或女)、所讲语言、语音的“特色”等。当对合成器80进行控制以将文本转换成语音时,可以通过调整视听内容通告功能22使用的音量、音调、语速、口音以及音调变化来配置语音的特色。风格可以与诸如诙谐、严肃、活泼、冷静等的特色类型相关联。可以向用户提供选择来直接改变这些参数,和/或用户能够从预定风格样式进行选择,例如“乡村”风格(例如在播放乡村音乐音频文件时)、“平和”风格(例如在播放爵士乐时)、高能量“摇滚”风格(例如对于流行或摇滚音乐)、商务型的“专家”风格(例如对于播报新闻)、“hip-hop”风格等。可以进行设置以根据回放的音频文件的内容和/或音频数据、基于一天中的时间等来自动改变风格。在一个示例中,可以结合轻快音乐和早间通告的新闻报道使用较活泼的风格,而可以结合夜间通告的舒缓音乐使用安静风格。
其他用户设置72可以控制何时通告以及通告哪些头部信息。例如,用户可以选择在音频数据回放(例如播放歌曲)之前、回放之后、在歌曲期间作为歌曲开始或歌曲结束的话外音(voice over),或者从这些选项中随机选择时机来收听头部信息。用户可以选择收听演唱者姓名、歌曲名、发布歌曲的唱片等中的一个或更多个。
用户设置72可以控制何时通告和通告何种附加信息以及信息源。例如,用户可以选择每隔一小时收听一次当地的天气报道、在用户的通常上、下班时间期间约每十分钟收听一次当地的交通报道、每三十分钟收听一次新闻标题以及播报的新闻标题的类型(例如,国际事件、当地事件、体育、政治、娱乐以及明星等)、周期性地或在股票价格波动预定量的情况下收听所选股票的股票价格、当所选的队比赛时收听该队的比赛比分等。
可以理解,单独的用户设置、单独的默认设置或者用户设置与默认设置的组合都可以用来构建个性化自动通告器,以向用户通告感兴趣的信息,该信息包括与音频文件或接收到的音频数据相关的信息(例如,头部数据)和来自信息源(例如,专用信息服务提供商或可搜索信息源)的信息。
继续参照该图,在框90中,可以打开音频文件74。注意,所示的方法涉及对储存的音频文件74的回放。然而,可以理解,该方法可以应用于未被电子设备10'本地储存的接收音频文件或接收音频数据的回放。本领域技术人员将清楚对接收音频文件和/或数据执行个性化通告功能的所示方法的任意修改。当回放接收到的音频数据时,可以不发生文件打开,而是执行接收和回放操作。
在框92中,读取已打开音频文件(或接收到的音频数据)的头部部分。头部读取可以包括从该头部提取文本信息。其后,可以在框94中确定用户设置72所确定的头部的所有或部分的通告式样。如所指出的,通告式样可以包括用来以可听见方式通告信息(何时通告该信息以及通告头部中的哪些字段)的风格。
在框96中,通过前进到下一适当的逻辑框来应用通告式样。例如,如果通告式样指示在回放相应数据之前通告与音频文件(或接收音频数据)相关的信息,则逻辑流程可以前进到框98。如果通告式样指示在回放相应数据之后通告与音频文件(或接收音频数据)相关的信息,则逻辑流程前进到框100。如果通告式样指示在回放相应数据期间作为话外音通告与音频文件(或接收音频数据)相关的信息,则逻辑流程前进到框102。通告式样可以指示关于信息通告的回放时机是一贯地使用一个时机选项、使用旋转时机(rotating timing)选项或者随机地选择时机选项。
如果时机选项将逻辑流程前进到框98,则头部信息可以从文本数据转换成以可听见方式输出给用户的语音。通告可以使用来自头部的特定信息,并在熟悉的DJ式样通告中提供该信息。例如,头部信息可以用来完成用于通告音频文件(或接收音频数据)的预定语句的变量部分。预定语句可以是储存的文本数据,该文本数据与供合成器“读取”的头部数据合并。例如,乡村歌曲的储存文本的格式可以为:“Up next,a classiccountry tune.Here′s”/artist/“s”/title/。在前面,用引号括起的部分是储存文本,而使用头部数据完成的变量部分用斜线分界。在将储存文本数据和头部数据合并后,可以构成完整的通告以可听地输出给用户。在另一实施方式中,预先储存的文本可以用音频数据替代,以使得音频内容通告由播放的音频数据和转换后的头部信息构成。在任意一种情况中,都与头部信息相结合地使用根据储存文本生成的“填充音频(filler audio)”或音频数据,从而模仿人类播音员。填充音频并不限于话语,还包括音效、播音员习惯(例如,口哨、Homer Simpson的“Doh!”等)、背景音乐等。因此,通告可以由头部信息、音频数据以及转换后的文本中的一个或更多个构成。
继续通告音频内容的示例,如果音频文件用于The Seldom Scene在唱片Scene It All上发布的歌曲“Dusty”,则视听内容通告功能22可以输出以下合成的陈述:“一首来自Seldom Scene的Scene It All专辑的歌曲‘Dusty’”。可以使用其它的措辞和/或其它的头部信息集合来通告随后的音频文件,例如:“这是一首由Asie Payton演唱的‘Nobody But You”’。在本示例中,仅提及了歌曲名称和演唱者,而省略了唱片。作为另一示例,模仿的播音员可以说:“接下来是一首由Cleveland Orchestra于1997年在Severance Hall录制的‘Antonin Dvorak Symphony No.7 in D Minor’,指挥是Christoph von Dohnany”。
可以使用适合于通告的各种通告式样参数(例如通告风格、与音频内容相关联的音乐样式等)来进行框98的通告。在框98之后,逻辑流程可以前进到框104,在这里播放来自于音频文件74的音频内容(或接收音频数据)。
返回到框96,如果计时选项将逻辑流程前进到框100,则播放来自于音频文件74(或接收音频数据)的音频内容。在完成音频文件(或接收音频数据)的回放之后,逻辑流程可以前进到框106,以通告与在框100中播放的音频文件74(或接收音频数据)相应的信息。可以与框98的通告相同或相似地进行框106的通告,因此,为了简明,将不会更详细地讨论框106通告的另外细节。
返回到框96,如果计时选项将逻辑流程前进到框102,则播放来自于音频文件74(或接收音频数据)的音频内容。在回放中的适当时刻(例如,在回放的开始或结束时),可以减小回放的音频内容的音量,并且作为音频内容的画外音播放与音频文件74(或接收音频数据)相应的信息的通告。可以与框98的通告相同或相似地进行框102的通告,因此,为了简明,将不会更详细地讨论框102通告的另外细节。在信息通告之后,可以在框108中恢复音频内容回放的音量。
在框104、框106或框108之后,逻辑流程可以前进到框110。在框110中,可以针对视听内容通告功能22是否应该向用户通告消息做出确定。例如,用户设置72可以指示允许通告例如天气报道、股票价格、新闻标题、比赛比分、当前时间和/或日期、商业广告的信息或其他信息。在一种实施方式中,信息检索功能68可以标识关于之前播放过的音频文件的演唱者的新闻条目。如果标识了当前新闻条目,则可以在框110中建立肯定结果。在一种变形中,可以标识演唱者的任何即将在用户所在地现场演出的信息并且用作消息内容。
在可听消息中通告的另一信息可以是用户已经记录在日程功能66中的即将发生的事件。例如,消息可以是明天是某人生日、假日或者用户在某个时间安排有会议的提醒。用户设置72可以指示何时以及隔多久通告一次即将到来的日程事件(例如,约六十分钟提醒一次和会议前十分钟)。可以用可听消息的形式设置其他个人提醒,例如在从工作下班回家期间停止特定条目的提醒。
如果在框110中做出肯定确定,则逻辑流程可以前进到框112,在这里向用户播放消息。在大多数情况中,把文本数据转换成语音以可听地回放给用户。然而,该消息可以是录制的音频数据,例如从呼叫者接收到的语音消息、服务提供商录制的音频数据、商业广告等。可以使用转换后的文本和音频数据(例如,如上面所讨论的音频填充)的组合来构建该消息。
在框112之后,或者如果在框110中做出否定判定,则逻辑流程可以结束。或者,逻辑流程可以返回到框88或框90,以开始回放另一音频文件(或接收音频数据)。在本实施方式和其中框110、框102或框104中音频内容的回放是针对从移动无线频道接收到的音频数据的情况中,视听内容通告功能22可以被配置为继续使用当前移动无线频道或选择另一移动无线频道。如果频道改变,则可以向用户通告该改变。选择的移动无线频道可以是随机选择的、遵从潜在频道的顺序选择的,或者是基于当前或即将到来的内容选择的。可由用户确定可选择的频道并在用户设置72中阐明。在一种实施方式中,视听内容通告功能22可以被配置为与移动无线服务提供商交互,以确定什么时候开始来自相应频道的一个或更多个音频文件并在适当时间切换到适当频道。可以用针对该内容和/或附加消息(例如,天气、新闻、体育和/或其他信息条目)的音频通告(例如,可能与填充音频组合的头部信息)来填充接收到目标内容之前的时间。
在一种实施方式中,视听内容通告功能22可以被配置为接收和响应用户的语音命令。视听内容通告功能22可以使用语音和/或话音识别软件解释来自用户的、可以使用麦克风86接收的输入。例如,用户可以口头选择要回放的下一音频文件或下一移动无线频道、请求时间、请求天气报道等。在另一示例性构造中,视听内容通告功能22可以在框112中播放消息,并询问用户接下来的问题,用户可以进行应答以通过视听内容通告功能22来进一步调用相关动作。作为一个示例,可听到的输出可以表述“今天晴,73华氏度,是否想要天气预报?”。在应答中,用户可以声明“是”来收听长期预报。否则,将不会向用户播放长期预报。
无论实施为移动电话10还是一些其他设备,电子设备10'都以可听方式向用户输出关于回放的视听文件或接收到的视听数据的信息,和/或以可听方式向用户输出消息和其他信息。该输出可以包括通过文本-语音合成器生成的合成音。这在查看显示器上的信息会令人分心或者不实际的情况下是有益的。此外,盲人用户会发现这里描述的个性化、自动通告器功能特别有用。个性化通告器功能可以愉悦用户或者向用户提供信息,并且配置自动通告器风格的功能可以增强用户体验。对何时输出通告、使用文本-语音功能的头部信息和/或何时输出其他信息的随机化,以及这些输出内容中的变化可以通过模仿现场DJ(例如,模仿常规广播台的常规人类播音员)来进一步增强用户体验。
尽管参照特定实施方式对本发明进行了例示和说明,但可以理解,本领域技术人员通过阅读和理解本说明书将想到本发明的等同物和修改例。本发明包括所有这样的等同物和修改例,并且本发明仅由权利要求的范围进行限定。

Claims (10)

1.一种移动无线终端(10,10′),该移动无线终端包括:
无线电路(30),其使得所述移动无线终端能够完成与被叫装置或主叫装置之间的呼叫;以及
文本-语音合成器(80),其将文本数据转换成用于向用户可听地回放该文本的文本数据代表。
2.根据权利要求1所述的移动无线终端,该移动无线终端还包括向用户回放视听数据的视听数据播放器(32,38,76),并且其中,转换后的文本数据来自于与视听数据相关的头部并与填充音频合并,以模仿人类播音员进行与回放所述视听数据相关的回放,从而向用户通告该视听数据。
3.一种向用户播放视听内容并通告与该视听内容相关的信息的电子设备(10,10′),该电子设备包括:
回放视听数据的视听数据播放器(32、38、76);
合成器(80),其将与所述视听数据相关的文本数据转换成用于向用户可听地回放该文本的文本数据代表;以及
控制器(24,62),其控制所述合成器和所述视听数据播放器以回放与所述视听数据的回放相关的文本数据,从而向用户通告所述视听数据。
4.如权利要求3所述的电子设备,其中将与所述视听数据相关的转换后的文本数据与填充音频合并,以模仿人类播音员。
5.如权利要求3-4中的任意一项所述的电子设备,该电子设备还包括音频混合器(82),该音频混合器在所述控制器的控制下,对处于各自音量的所述视听数据播放器的音频输出和所述合成器的输出进行组合。
6.如权利要求3-5中的任意一项所述的电子设备,其中在从回放所述视听数据之前、回放所述视听数据之后或回放所述视听数据期间中的一个中选择的一个时机中可听地通告所述文本数据。
7.如权利要求3-6中的任意一项所述的电子设备,其中所述控制器控制所述合成器来对所述文本数据的转换应用风格。
8.如权利要求3-7中的任意一项所述的电子设备,其中所述控制器还控制所述合成器来转换与由所述视听数据播放器回放的视听数据无关的附加文本数据,以向用户回放所述附加文本数据。
9.如权利要求8所述的电子设备,其中从所述电子设备外部的来源获得所述附加文本数据,并且所述附加文本数据与新闻标题、天气报道、交通信息、比赛比分或股票价格中的至少一项相应。
10.一种向电子设备(10,10′)的用户播放视听内容并通告与该视听内容相关的信息的方法,该方法包括以下步骤:
向用户回放视听数据;以及
将与所述视听数据相关的文本数据转换成所述文本数据的代表,并以可听的方式向用户回放该代表。
CNA2006800542333A 2006-05-05 2006-11-16 向移动无线终端的用户通告音频和视频内容的方法和系统 Withdrawn CN101416477A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/381,770 2006-05-05
US11/381,770 US20070260460A1 (en) 2006-05-05 2006-05-05 Method and system for announcing audio and video content to a user of a mobile radio terminal

Publications (1)

Publication Number Publication Date
CN101416477A true CN101416477A (zh) 2009-04-22

Family

ID=37831737

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2006800542333A Withdrawn CN101416477A (zh) 2006-05-05 2006-11-16 向移动无线终端的用户通告音频和视频内容的方法和系统

Country Status (5)

Country Link
US (1) US20070260460A1 (zh)
EP (1) EP2016582A1 (zh)
JP (1) JP2009536500A (zh)
CN (1) CN101416477A (zh)
WO (1) WO2007130131A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101958758A (zh) * 2010-05-17 2011-01-26 宇龙计算机通信科技(深圳)有限公司 一种基于路况信息实现数字广播的方法、装置
CN111385635A (zh) * 2013-06-05 2020-07-07 搜诺思公司 附属音量控制

Families Citing this family (150)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8645137B2 (en) 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
KR100719776B1 (ko) * 2005-02-25 2007-05-18 에이디정보통신 주식회사 휴대형 코드인식 음성 합성출력장치
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US9008598B2 (en) * 2006-06-16 2015-04-14 Core Wireless Licensing S.A.R.L Broadcast channel identification
KR20080015567A (ko) * 2006-08-16 2008-02-20 삼성전자주식회사 휴대 장치를 위한 음성기반 파일 정보 안내 시스템 및 방법
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
KR100849848B1 (ko) * 2006-11-30 2008-08-01 삼성전자주식회사 음성 출력 장치 및 방법
US20080132187A1 (en) * 2006-12-04 2008-06-05 Hanebeck Hanns-Christian Leemo Personal multi-media playing device
US20080171537A1 (en) * 2007-01-16 2008-07-17 Hung-Che Chiu Method of providing voice stock information via mobile apparatus
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US8285548B2 (en) * 2008-03-10 2012-10-09 Lg Electronics Inc. Communication device processing text message to transform it into speech
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US10496753B2 (en) 2010-01-18 2019-12-03 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US20090313023A1 (en) * 2008-06-17 2009-12-17 Ralph Jones Multilingual text-to-speech system
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
US8352268B2 (en) 2008-09-29 2013-01-08 Apple Inc. Systems and methods for selective rate of speech and speech preferences for text to speech synthesis
US8031854B2 (en) * 2008-10-20 2011-10-04 At&T Intellectual Property I, L.P. Methods, systems, and products for providing ring backs
US20100142521A1 (en) * 2008-12-08 2010-06-10 Concert Technology Just-in-time near live DJ for internet radio
WO2010067118A1 (en) 2008-12-11 2010-06-17 Novauris Technologies Limited Speech recognition involving a mobile device
JP2010160316A (ja) * 2009-01-08 2010-07-22 Alpine Electronics Inc 情報処理装置及びテキスト読み上げ方法
US8380507B2 (en) 2009-03-09 2013-02-19 Apple Inc. Systems and methods for determining the language to use for speech generated by a text to speech engine
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US9858925B2 (en) 2009-06-05 2018-01-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
US20120309363A1 (en) 2011-06-03 2012-12-06 Apple Inc. Triggering notifications associated with tasks items that represent tasks to perform
US9431006B2 (en) 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
WO2011011224A1 (en) * 2009-07-24 2011-01-27 Dynavox Systems, Llc Hand-held speech generation device
JP2011043710A (ja) * 2009-08-21 2011-03-03 Sony Corp 音声処理装置、音声処理方法及びプログラム
US9531854B1 (en) 2009-12-15 2016-12-27 Google Inc. Playing local device information over a telephone connection
US20110150191A1 (en) * 2009-12-18 2011-06-23 Mitel Networks Corporation Method and apparatus for call handling
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US10705794B2 (en) 2010-01-18 2020-07-07 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US10679605B2 (en) 2010-01-18 2020-06-09 Apple Inc. Hands-free list-reading by intelligent automated assistant
US10553209B2 (en) 2010-01-18 2020-02-04 Apple Inc. Systems and methods for hands-free notification summaries
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US10762293B2 (en) 2010-12-22 2020-09-01 Apple Inc. Using parts-of-speech tagging and named entity recognition for spelling correction
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US8566100B2 (en) * 2011-06-21 2013-10-22 Verna Ip Holdings, Llc Automated method and system for obtaining user-selected real-time information on a mobile communication device
US8994660B2 (en) 2011-08-29 2015-03-31 Apple Inc. Text correction processing
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
US9483461B2 (en) 2012-03-06 2016-11-01 Apple Inc. Handling speech synthesis of content for multiple languages
US9159313B2 (en) * 2012-04-03 2015-10-13 Sony Corporation Playback control apparatus, playback control method, and medium for playing a program including segments generated using speech synthesis and segments not generated using speech synthesis
US9280610B2 (en) 2012-05-14 2016-03-08 Apple Inc. Crowd sourcing information to fulfill user requests
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
US9495129B2 (en) 2012-06-29 2016-11-15 Apple Inc. Device, method, and user interface for voice-activated navigation and browsing of a document
GB2503878A (en) 2012-07-09 2014-01-15 Nds Ltd Generating interstitial scripts for video content, based on metadata related to the video content
US9576574B2 (en) 2012-09-10 2017-02-21 Apple Inc. Context-sensitive handling of interruptions by intelligent digital assistant
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
CN104969289B (zh) 2013-02-07 2021-05-28 苹果公司 数字助理的语音触发器
US9368114B2 (en) 2013-03-14 2016-06-14 Apple Inc. Context-sensitive handling of interruptions
WO2014144579A1 (en) 2013-03-15 2014-09-18 Apple Inc. System and method for updating an adaptive speech recognition model
US9922642B2 (en) 2013-03-15 2018-03-20 Apple Inc. Training an at least partial voice command system
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
WO2014197336A1 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
EP3937002A1 (en) 2013-06-09 2022-01-12 Apple Inc. Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant
CN105265005B (zh) 2013-06-13 2019-09-17 苹果公司 用于由语音命令发起的紧急呼叫的系统和方法
WO2015020942A1 (en) 2013-08-06 2015-02-12 Apple Inc. Auto-activating smart responses based on activities from remote devices
US9620105B2 (en) 2014-05-15 2017-04-11 Apple Inc. Analyzing audio input for efficient speech and music recognition
US10592095B2 (en) 2014-05-23 2020-03-17 Apple Inc. Instantaneous speaking of content on touch devices
US9502031B2 (en) 2014-05-27 2016-11-22 Apple Inc. Method for supporting dynamic grammars in WFST-based ASR
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
US9734193B2 (en) 2014-05-30 2017-08-15 Apple Inc. Determining domain salience ranking from ambiguous words in natural speech
WO2015184186A1 (en) 2014-05-30 2015-12-03 Apple Inc. Multi-command single utterance input method
US9785630B2 (en) 2014-05-30 2017-10-10 Apple Inc. Text prediction using combined word N-gram and unigram language models
US10078631B2 (en) 2014-05-30 2018-09-18 Apple Inc. Entropy-guided text prediction using combined word and character n-gram language models
US10289433B2 (en) 2014-05-30 2019-05-14 Apple Inc. Domain specific language for encoding assistant dialog
US9760559B2 (en) 2014-05-30 2017-09-12 Apple Inc. Predictive text input
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US9842101B2 (en) 2014-05-30 2017-12-12 Apple Inc. Predictive conversion of language input
US10659851B2 (en) 2014-06-30 2020-05-19 Apple Inc. Real-time digital assistant knowledge updates
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US9311911B2 (en) 2014-07-30 2016-04-12 Google Technology Holdings Llc. Method and apparatus for live call text-to-speech
US10446141B2 (en) 2014-08-28 2019-10-15 Apple Inc. Automatic speech recognition based on user feedback
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10789041B2 (en) 2014-09-12 2020-09-29 Apple Inc. Dynamic thresholds for always listening speech trigger
US9606986B2 (en) 2014-09-29 2017-03-28 Apple Inc. Integrated word N-gram and class M-gram language models
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US9646609B2 (en) 2014-09-30 2017-05-09 Apple Inc. Caching apparatus for serving phonetic pronunciations
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US9886432B2 (en) 2014-09-30 2018-02-06 Apple Inc. Parsimonious handling of word inflection via categorical stem + suffix N-gram language models
US10552013B2 (en) 2014-12-02 2020-02-04 Apple Inc. Data detection
US9711141B2 (en) 2014-12-09 2017-07-18 Apple Inc. Disambiguating heteronyms in speech synthesis
US9865280B2 (en) 2015-03-06 2018-01-09 Apple Inc. Structured dictation using intelligent automated assistants
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US9899019B2 (en) 2015-03-18 2018-02-20 Apple Inc. Systems and methods for structured stem and suffix language models
US9842105B2 (en) 2015-04-16 2017-12-12 Apple Inc. Parsimonious continuous-space phrase representations for natural language processing
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US10127220B2 (en) 2015-06-04 2018-11-13 Apple Inc. Language identification from short strings
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US10101822B2 (en) 2015-06-05 2018-10-16 Apple Inc. Language input correction
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US10186254B2 (en) 2015-06-07 2019-01-22 Apple Inc. Context-based endpoint detection
US10255907B2 (en) 2015-06-07 2019-04-09 Apple Inc. Automatic accent detection using acoustic models
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US9697820B2 (en) 2015-09-24 2017-07-04 Apple Inc. Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
KR102136706B1 (ko) * 2016-04-07 2020-07-22 어드밴스드 미디어, 인코포레이티드 정보 처리 시스템, 접수 서버, 정보 처리 방법 및 프로그램
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179309B1 (en) 2016-06-09 2018-04-23 Apple Inc Intelligent automated assistant in a home environment
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US11281993B2 (en) 2016-12-05 2022-03-22 Apple Inc. Model and ensemble compression for metric learning
US10387488B2 (en) * 2016-12-07 2019-08-20 At7T Intellectual Property I, L.P. User configurable radio
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
DK201770383A1 (en) 2017-05-09 2018-12-14 Apple Inc. USER INTERFACE FOR CORRECTING RECOGNITION ERRORS
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
DK201770429A1 (en) 2017-05-12 2018-12-14 Apple Inc. LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
DK179560B1 (en) 2017-05-16 2019-02-18 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
US10448762B2 (en) 2017-09-15 2019-10-22 Kohler Co. Mirror
US11093554B2 (en) 2017-09-15 2021-08-17 Kohler Co. Feedback for water consuming appliance
US11314215B2 (en) 2017-09-15 2022-04-26 Kohler Co. Apparatus controlling bathroom appliance lighting based on user identity
US10887125B2 (en) 2017-09-15 2021-01-05 Kohler Co. Bathroom speaker
US11099540B2 (en) 2017-09-15 2021-08-24 Kohler Co. User identity in household appliances
JP6904428B2 (ja) 2017-10-17 2021-07-14 ソニーグループ株式会社 情報処理装置、情報処理方法、及びプログラム
US10891939B2 (en) * 2018-11-26 2021-01-12 International Business Machines Corporation Sharing confidential information with privacy using a mobile phone
US20210104220A1 (en) * 2019-10-08 2021-04-08 Sarah MENNICKEN Voice assistant with contextually-adjusted audio output
EP4071751A4 (en) * 2019-12-02 2023-01-25 Sony Group Corporation CONTENT DELIVERY SYSTEM AND METHOD AND STORAGE MEDIA
WO2021111906A1 (ja) * 2019-12-06 2021-06-10 ソニーグループ株式会社 コンテンツ提供システム、コンテンツ提供方法、及び記憶媒体

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6931255B2 (en) * 1998-04-29 2005-08-16 Telefonaktiebolaget L M Ericsson (Publ) Mobile terminal with a text-to-speech converter
US6847334B2 (en) * 1998-06-29 2005-01-25 William Hayhurst Mobile telecommunication device for simultaneously transmitting and receiving sound and image data
US6516207B1 (en) * 1999-12-07 2003-02-04 Nortel Networks Limited Method and apparatus for performing text to speech synthesis
US6731952B2 (en) * 2000-07-27 2004-05-04 Eastman Kodak Company Mobile telephone system having a detachable camera / battery module
GB0113570D0 (en) * 2001-06-04 2001-07-25 Hewlett Packard Co Audio-form presentation of text messages
US7483834B2 (en) * 2001-07-18 2009-01-27 Panasonic Corporation Method and apparatus for audio navigation of an information appliance
US20030219708A1 (en) * 2002-05-23 2003-11-27 Koninklijke Philips Electronics N.V. Presentation synthesizer
US20040049389A1 (en) * 2002-09-10 2004-03-11 Paul Marko Method and apparatus for streaming text to speech in a radio communication system
KR100463655B1 (ko) * 2002-11-15 2004-12-29 삼성전자주식회사 부가 정보 제공 기능이 있는 텍스트/음성 변환장치 및 방법
JP2004349851A (ja) * 2003-05-20 2004-12-09 Ntt Docomo Inc 携帯端末、画像通信プログラム、及び画像通信方法
JP2005204129A (ja) * 2004-01-16 2005-07-28 Nec Corp 撮影再生機能付携帯通信端末
JP4293072B2 (ja) * 2004-07-06 2009-07-08 株式会社デンソー 楽曲再生装置
JP4634117B2 (ja) * 2004-10-26 2011-02-16 京セラ株式会社 動画再生装置、携帯端末装置、並びに携帯端末装置のデータ処理方法
US7949353B2 (en) * 2006-02-07 2011-05-24 Intervoice Limited Partnership System and method for providing messages to a mobile device

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101958758A (zh) * 2010-05-17 2011-01-26 宇龙计算机通信科技(深圳)有限公司 一种基于路况信息实现数字广播的方法、装置
CN111385635A (zh) * 2013-06-05 2020-07-07 搜诺思公司 附属音量控制

Also Published As

Publication number Publication date
US20070260460A1 (en) 2007-11-08
EP2016582A1 (en) 2009-01-21
WO2007130131A1 (en) 2007-11-15
JP2009536500A (ja) 2009-10-08

Similar Documents

Publication Publication Date Title
CN101416477A (zh) 向移动无线终端的用户通告音频和视频内容的方法和系统
US9042205B2 (en) Clock with link to the internet
US9959089B2 (en) Mobile audio player with individualized radio program
CN101404680A (zh) 电子文档中播入及播放媒体片段的方法
CN101019117A (zh) 播放内容的方法和装置
US20080037718A1 (en) Methods and apparatus for delivering ancillary information to the user of a portable audio device
JP2010530547A (ja) 音楽認識のためのシステムおよび方法
US20120059493A1 (en) Media playing apparatus and media processing method
CN104038774B (zh) 生成铃声文件的方法及装置
WO2002007414A1 (fr) Procede pour service d'information utilisant un terminal de communication portatif
US9532190B2 (en) Embedded advertising in MMS stationery
CN104038772B (zh) 生成铃声文件的方法及装置
TW201312971A (zh) 接收訊息的方法
CN101261872B (zh) 用于在媒体应用程序中提供可视指示符的系统和方法
CN202289477U (zh) 一种通过无线网络进行语音播放的语音玩具终端设备
KR101457422B1 (ko) 개인 정보를 이용한 av기기 제어 방법 및 이를 이용한av기기
WO2006064455A1 (en) Method and system for synthesizing a video message
CN100438351C (zh) 在数字电子产品上显示广播节目信息的方法
JP2007241924A (ja) 携帯端末
JP2007094751A (ja) エージェントシステム、情報提供装置、及び端末装置
JP2006317527A (ja) 楽曲データ配信システム及び楽曲データ配信装置
CN104125305A (zh) 动态推送日历信息的方法与系统
JP4653564B2 (ja) リクエスト番組制作放送システム,サーバ,方法,プログラム
CN103281682A (zh) 闹铃铃音推送方法、播放闹铃铃音的方法以及装置
JP2006012056A (ja) 携帯端末装置、電子メール読み上げ方法、制御プログラムおよび記憶媒体

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C04 Withdrawal of patent application after publication (patent law 2001)
WW01 Invention patent application withdrawn after publication

Open date: 20090422