CN1809077A - 影片播放器,移动终端和移动终端的数据处理方法 - Google Patents
影片播放器,移动终端和移动终端的数据处理方法 Download PDFInfo
- Publication number
- CN1809077A CN1809077A CNA2005100034545A CN200510003454A CN1809077A CN 1809077 A CN1809077 A CN 1809077A CN A2005100034545 A CNA2005100034545 A CN A2005100034545A CN 200510003454 A CN200510003454 A CN 200510003454A CN 1809077 A CN1809077 A CN 1809077A
- Authority
- CN
- China
- Prior art keywords
- text
- film
- video
- movie
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/72—Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
- H04M1/724—User interfaces specially adapted for cordless or mobile telephones
- H04M1/72403—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/41—Structure of client; Structure of client peripherals
- H04N21/414—Specialised client platforms, e.g. receiver in car or embedded in a mobile appliance
- H04N21/41407—Specialised client platforms, e.g. receiver in car or embedded in a mobile appliance embedded in a portable device, e.g. video client on a mobile phone, PDA, laptop
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/44—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs
- H04N21/4402—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
- H04N21/440236—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display by media transcoding, e.g. video is transformed into a slideshow of still pictures, audio is converted into text
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/443—OS processes, e.g. booting an STB, implementing a Java virtual machine in an STB or power management in an STB
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/45—Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
- H04N21/462—Content or additional data management, e.g. creating a master electronic program guide from data received from the Internet and a Head-end, controlling the complexity of a video stream by scaling the resolution or bit-rate based on the client capabilities
- H04N21/4627—Rights management associated to the content
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/478—Supplemental services, e.g. displaying phone caller identification, shopping application
- H04N21/4786—Supplemental services, e.g. displaying phone caller identification, shopping application e-mailing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/478—Supplemental services, e.g. displaying phone caller identification, shopping application
- H04N21/4788—Supplemental services, e.g. displaying phone caller identification, shopping application communicating with other users, e.g. chatting
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Computer Networks & Wireless Communication (AREA)
- Computer Security & Cryptography (AREA)
- Human Computer Interaction (AREA)
- Mobile Radio Communication Systems (AREA)
- Telephone Function (AREA)
- Telephonic Communication Services (AREA)
- Machine Translation (AREA)
Abstract
一种影片视频播放器,能够在呼入电话的时候区分数据集,从而能够在切换声音数据时避免侵犯版权,即一种影片播放器,包括用来播放包含音频和视频影片的影片播放单元、能够至少显示所播放影片和文本的显示单元、具有文本到语音转换功能能够将显示单元所显示的文本和设备的状态转换为语音的文本到语音转换单元、以及控制器,其中当在影片播放过程中发生一个预定事件而启动文本到语音转换功能时,在视频和音频数据可以分离的第一种情况下控制器只停止影片的音频输出并激活文本到语音转换功能,而在视频和音频数据不能分离的第二种情况下控制器停止影片的视频和音频数据并激活文本到语音转换功能,以及一种移动终端和一种移动终端的数据处理方法。
Description
技术领域
本发明涉及一种带有显示功能、文本到语音转换(text-to-speech)功能和影片播放功能的影片播放器,一种装备有这种影片播放器的移动电话或其它移动终端,以及这种移动终端的数据处理方法。
背景技术
近年来,作为移动终端或其它电子设备,已经提出了在操作按键时朗读该按键操作设定的功能名称等的移动电话(参见日本未审查的专利公开(Kokai)第11-252216号)。这种移动电话具有多个按键,一个用于根据电话提供的一个或多个按键的操作设置相应功能的控制器,以及一个用于语音输出与按键操作相关联的功能设置名称的语音合成器。
某些移动电话和其它移动终端可以通过指定包括视频和音频的数据(影片数据)、演示其视频并生成音频的方式来报告呼入电话或接收到的信息。此外,有的通过合成语音并朗读发送人名字的方式来报告呼入电话或接收到的信息。因此,预计即使在使用影片数据报告呼入电话或接收到的信息时合成语音并朗读发送人名字的市场需求将会增大。
然而,如果设计一个满足这种需要的移动终端,那么朗读发送人名字的语音和影片数据的音频将结束竞争。有鉴于此,影片数据制作者的意图也应予以考虑。也就是说,数据应该在保持影片数据制作者的期望格式的情况下进行播放。这样,当在播放影片数据时,应当执行一个中断过程,用来通过语音报告设备的状态,例如当有呼入或消息时通过朗读发送人的名字报告呼入电话或接收到的信息,以此方式尽可能地保持影片制作者的期望格式。
发明内容
本发明的一个目的是提供一种影片播放器,一种移动终端,以及一种移动终端的数据处理方法,即使在包括视频和音频的影片数据的播放过程中执行中断用以报告设备状态的处理时,仍尽可能地不破坏影片数据制作者的期望格式。
根据本发明的第一方面,提供了一种影片播放器,包括一个用来播放包含音频和视频影片的影片播放单元、一个用来至少显示所播放的影片和文本的显示单元、一个具有文本到语音转换功能可以将显示单元上显示的文本和设备状态转换成语音的文本到语音转换单元、以及一个控制器,其中当在影片播放过程中发生一个预定的事件以启动文本到语音转换功能时,在视频和音频数据可以分离的第一种情况下,控制器只停止影片的音频输出并激活文本到语音转换功能;在视频和音频数据不能分离的第二种情况下,控制器停止影片的视频和音频数据并激活文本到语音转换功能。
优选地,当文本到语音转换操作结束并且影片仍在播放时,控制器使影片播放单元再次播放影片。
优选地,控制器根据所播放影片中的附加信息,判断其是否包含预定的数据从而确定视频和音频数据是否可以被分离。
根据本发明的第二方面,提供了一种移动终端,包括一个用来播放包含音频和视频影片的影片播放单元、一个用来至少显示所播放影片和文本的显示单元、一个具有文本到语音转换功能可以将显示单元上显示的文本和设备的状态转换成语音的文本到语音转换单元、一个用来至少检测呼入电话和接收到的消息的通信单元、以及一个控制器,其中当通信单元检测到呼入电话或接收到的消息并且影片播放单元正在播放影片以报告来电或消息时,以及当在影片播放过程中发生一个预定的事件以启动文本到语音转换功能时,在视频和音频数据可以分离的第一种情况下,控制器只停止影片的音频输出并激活文本到语音转换功能;在视频和音频数据不能分离的第二种情况下,控制器停止影片的视频和音频数据并激活文本到语音转换功能。
优选地,当文本到语音转换操作结束并且停止呼入电话或接收到的消息的报告的处理还未进行时,控制器使影片播放单元再次播放该影片。
优选地,控制器根据所播放影片中的附加信息,判断其是否包含预定的数据从而确定视频和音频数据是否可以被分离。
优选地,文本到语音转换单元在呼入电话或接收到消息的时候具有将与接收到的电子邮件(e-mali)相关的发送人或信息转换成语音信息的功能。
优选地,文本到语音转换单元在呼入电话或接收到消息的时候响应一个预定操作而将与接收到的电子邮件相关的发送人或信息转换成语音信息。
优选地,控制器根据影片的附加信息中是否包含标识版权的数据,判断影片的视频数据和音频数据是否可以被分离。
根据本发明的第三方面,提供了一种移动终端的数据处理方法,该移动终端具有能够播放包含音频和视频影片的影片播放功能、至少能够显示所播放的影片和文本的显示功能、将显示单元上显示的文本和设备的状态转换成语音的文本到语音转换功能、以及能够至少检测呼入电话和接收到的消息的通信功能,该方法的步骤包括:当通信功能检测到呼入电话或接收到的信息并且影片播放功能播放影片以报告呼入电话或接收到的消息时,判断是否有一个预定事件发生以激活文本到语音转换功能、当事件发生时判断视频和音频数据是否可以分离、当可以分离时只停止影片的音频输出并激活文本到语音转换功能、当不能分离时停止影片的视频和音频数据并激活文本到语音转换功能。
附图说明
通过如下优选实施例并结合附图的描述,本发明的这些以及其它目的和特点将变得更加清楚,其中:
图1是显示了一个移动电话的系统配置实例的框图;
图2A到2D是显示了移动电话的外观实例的视图,其中图2A是打开状态的前部外观视图,图2B是闭合状态的后部外观视图,图2C是打开状态的侧面外观视图,以及图2D是闭合状态的侧面外观视图;
图3是显示了本实施例中的影片数据构成的视图;以及
图4是用来说明根据本实施例的文本到语音转换控制操作的流程图。
具体实施方式0
下面,将结合附图说明本发明的实施例。
图1是显示了本发明移动终端的系统配置实例的框图,表示为移动电话10。图2A到2D是显示了移动电话10的外观实例的视图。移动电话10是具有活动机构的所谓翻盖(flip-open)型移动电话。图2A是打开状态的前视图,图2B是闭合状态的前视图,图2C是打开状态的侧视图,以及图2D是闭合状态的侧视图。
除了移动电话的常见功能外,根据本实施例的移动电话10还具有能够播放包含音频和视频影片的影片播放功能、至少能够显示所播放影片和文本的显示功能、能够将显示单元上显示的文本和设备的状态转换成语音的文本到语音转换功能、以及能够至少检测呼入电话和接收到的消息的通信功能。
配置本实施例的移动电话10,使得当通信功能检测到呼入电话或接收的信息,并且影片播放功能播放影片以报告来电或消息时,判断是否有一个预定事件(例如一个预定的按键操作)已经发生以激活文本到语音转换功能、当这样一个事件发生时,判断视频和音频数据是否可以分离、当可以分离时只停止影片的音频输出并激活文本到语音转换单元的文本到语音转换功能、当不能分离时停止影片的视频和音频数据并激活文本到语音转换单元的文本到语音转换功能。通过该移动电话10,即使是在播放包含视频和音频的影片数据的过程中执行中断处理以报告设备的状态时,也可以尽可能地避免影片数据以破坏其制作者所期望的格式的方式播放。
此外,当文本到语音转换结束且停止呼入电话或接收到的消息的报告的处理还未进行时,移动电话10具有使影片播放单元再次播放该影片的功能。移动电话10根据所播放影片中的附加信息判断视频和音频数据是否可以分离。移动电话10还具有在呼入电话或接收到消息的时候将与接收到的电子邮件相关的发送人或信息转换成语音信息的功能。可选地,移动电话10具有在呼入电话或接收到消息的时候响应一个预定操作而将与接收到的电子邮件相关的发送人或信息转换成语音信息的功能。此外,在移动电话10中,控制器可以根据影片的附加信息中是否包含标识版权的数据来判断影片的视频数据和音频数据是否可以被分离。
下面,将按顺序说明根据本实施例的移动电话10的不同组件的配置和功能,以及文本到语音转换控制。
如图1所示,移动电话10包括一个包含发射/接收天线111的通信处理单元11、存储器12、按键操作单元13、拨盘输入单元14、副显示单元15、主显示单元16、包含扬声器171和麦克风172并具有文本到语音转换单元功能的语音合成处理单元17、打开/闭合开关18、文本到语音转换按键输入单元19、以及具有影片播放和语音控制功能的控制器(CPU)20。此外,控制器20包括一个影片播放单元21。此外,如图2A所示,移动电话10的主壳体100由按键输入一侧主壳体101构成的第一外壳和显示屏一侧主壳体102构成的第二外壳装配而成,通过一个图中未示出的活动机构连接从而形成可打开/可闭合的状态。
通信处理单元11经由基站进行无线通信操作,例如,拨打电话以及发送或接收电子邮件。通信处理单元11连接到发射/接收天线111。它调制经控制器20处理的音频信息和电子邮件等,并通过发射/接收天线111将它们发射到图中未示出的基站,从而利用无线信号进行无线通信。此外,通信处理单元11解调从基站无线传输并由发射/接收天线111接收到的各种信息,如电子邮件、影片和音频信息,并将它们输出到控制器20。配置通信处理单元11使其能够检测电子邮件、影片和音频信息等的接收以及消息。注意,发射/接收天线111内置安装在按键输入侧的主壳体101中或显示屏侧的主壳体102中,在图2中,它不是暴露在外的。
存储器(存储单元)12由EEPROM或其它非易失性存储器构成,并存储着用来发送和接收语音和邮件的控制程序、因特网浏览器、消息数据、以及记录了姓名和电话号码的地址本等。存储器12在控制器20的控制下存储视频数据和音频数据。存储器12存储着包括后面要解释的文本到语音转换功能所需要的文本和与文本相关的解释的文本到语音转换数据库。在该数据库中,用以转换成语音的文本上下文系统地排列以构成句子。与显示单元所显示的菜单相对应地,存储器12存储着“标准文本”、“简化文本”、“解释文本”和“控制表”。
按键操作单元13包括一个结束(挂断)/电源按键、一个开始(呼出)按键、十个数字按键等。通过用户对这些按键的操作,用户向控制器20输出输入信息。此外,通过对按键操作单元13的操作,可以通过控制器20设定是否朗读存储在存储器12中的文本到语音转换功能的控制表的条目(开/关)。
拨盘输入单元14是一个拨盘型输入单元。它被设置在显示屏一侧的主壳体102的侧面,从而当用户手持如图2C所示打开状态的移动电话10时便于用拇指进行操作,同时设置成能够向上和向下即双向操作。通过操作拨盘输入单元14,用户可以改变音频的输出音量以及在副显示单元15和主显示单元16上显示的文本的大小。此外,从图2C和图2D可以明显看出,当对比闭合状态和打开状态的拨盘输入单元14时,双向上下操作的方向实际上翻转了,但是在本实施例中,控制器20通过使用户所见的操作方向与针对操作的动作(例如,如上改变音量和显示字体的大小(所显示的文本大小))总是相符来控制该事件,使用户不会感觉到这个问题。
副显示单元15包括一个液晶显示屏(LCD)或其它显示屏,供用户在如图213所示的闭合状态下浏览。主显示单元16包括一个LCD或其它显示屏,供用户在如图2A所示的打开状态下浏览。副显示单元15和主显示单元16在控制器20的控制下,在闭合状态和打开状态中显示接收到的电子邮件的文本和存储在存储器12中的各种文本数据等。如MPEG-4标准的3g2格式的影片在控制器20的控制下主要显示在主显示单元16上。
语音合成处理单元17包括一个音频处理电路,为呼叫功能连接用来输出音频的扬声器171和用来输入音频的麦克风172。语音合成处理单元17针对麦克风172拾取的音频执行预定的处理,并将它提供给控制器20。此外,语音合成处理单元17针对控制器20提供的音频信息执行预定的处理,并使其在扬声器171上输出。也就是说,语音合成处理单元17将控制器20输出的音频数据生成音频信号,并将其输出到扬声器171。此外,语音合成处理单元17根据麦克风172输出的音频信号生成音频数据,并将其输出到控制器20。
此外,如图2A和2B所示,扬声器171包括一个语音扬声器171a和一个震铃扬声器171b,即两个音频输出单元,输出文本到语音转换功能处理后的音频。此外,语音合成处理单元17包括语音合成电路,在文本到语音转换的时候,在控制器20中将文本数据或从存储器12中读出或提取的解释转换成音频数据,并通过由语音扬声器171a或震铃扬声器171b构成的音频输出单元合成语音。
配置语音合成处理单元17使其允许选择自动文本到语音转换设定,以便当转到包含可被转换为合成语音的文本的显示屏时进行自动语音转换,或选择手动文本到语音转换设定,以便在有语音合成的请求后进行文本到语音转换。举例来说,设定是自动文本到语音转换设定还是手动文本到语音转换设定,由控制器20根据存储在存储器12中的控制表来确定。例如,控制器20判断启动文本到语音转换的原因是由文本到语音转换按键操作单元19指定的手动文本到语音转换,还是依照终端的内部状态改变的自动文本到语音转换,并把结果报告给语音合成处理单元17。
打开/闭合开关18是用来检测移动电话10的打开/闭合状态的开关。对于打开/闭合开关18的具体的构成,可以采用不同的技术。例如,可以采用如图2A所示的配置,其中在按键输入一侧的主壳体101和显示屏一侧的主壳体102上提供触点,并在闭合状态(图2B)时通过使两触点电绝缘而表现为关(OFF)状态。可选地,也可以配置设备,使其当移动电话10处于闭合状态时打开/闭合开关18变成开(ON)状态,而当移动电话10处于打开状态时打开/闭合开关18变成关(OFF)状态。控制器20可以检测打开/闭合开关的状态,从而识别移动电话10的打开/闭合状态。
如图2B所示,文本到语音转换按键操作单元19是由设置于显示屏一侧主壳体102中心的按钮19a和用于按钮的开关输入的输入电路构成的。本实施例的移动电话10具有文本到语音转换功能并由控制器20控制,从而当按钮19a被按下(被操作)时,在报告来电或消息或相关的解释的时候,在闭合状态时通过震铃扬声器171b输出所显示文本的语音,例如另一方的名字,而在打开状态时通过语音扬声器171a输出其语音。随后说明的控制器20通过打开/闭合开关18的输出识别移动电话10的打开/闭合状态,并将用于文本到语音转换的音频输出目的地报告给语音合成处理单元17。
控制器20主要由在整体上控制移动电话10的微电脑构成。例如,控制器20控制通信处理单元11中各种信息的无线发射/接收、用于语音合成处理单元17的影片和音频信息的处理、主显示单元16上信息的显示、响应按键输入单元13的输入信息的处理、对存储器12的存取等。控制器20包括影片播放单元21,并且具有显示定时控制功能,可以对如通过通信处理单元11接收到的MPEG-4标准的3g2格式的影片数据进行解码、生成用于显示的数据并将它显示在主显示单元16上。
当通信处理单元11检测到呼入电话或接收到的消息,影片播放单元21播放影片以报告来电或消息,以及发生了一个预定事件以激活语音合成处理单元17具有的文本到语音转换功能时,控制器20进行控制,当视频和音频数据可以分离时只停止到来的包含音频的影片的音频输出并激活文本到语音转换功能,而当不能分离时则停止影片的视频和音频数据的播放并激活文本到语音转换功能。
当停止影片的视频和音频数据播放的文本到语音转换结束、在呼入电话响应操作过程中切换到应答电话功能的处理还未进行、并且停止报告来电或消息的处理仍未执行时,控制器20使影片播放单元21再次播放影片。控制器20根据所播放影片中的附加信息判断视频和音频数据是否可以分离。特别地,如下文所述,控制器20根据影片的附加信息中是否包含标识版权的数据来判断影片的视频数据和音频数据是否可以被分离。
此外,控制器20控制包括语音合成处理单元17的文本到语音转换功能,从而自动地在来电或消息的时候将与接收到的电子邮件相关的发送人或信息转换成语音信息,或将在来电或消息的时候响应预定的操作而接收到的与电子邮件或发送人相关的信息转换成语音信息。
当用户操作按钮19a时,控制器20对所显示的文本执行文本到语音转换功能。此时,所使用的文本到语音转换功能不是输出文本到语音转换的音频数据的形式,而是以提取/生成文本并将文本及其解释转换成语音的形式。
此外,控制器20判断启动文本到语音转换的原因是来自文本到语音转换按键操作单元19的文本到语音转换指令,还是响应终端内部状态改变的自动文本到语音转换。例如,这种自动文本到语音转换基于电池的剩余电量或者无线电信号状态的变化。在进行这种自动文本到语音转换时,控制器20参照存储在存储器12中的文本到语音转换功能的控制表。
下面,将结合图3说明本实施例中的影片数据的结构。
如图3所示,在影片数据的前端加入一个报头。在报头之后,视频数据(Video)和音频数据(Audio)交替排列。在数据的尾端加入一个预示数据结束的终码(end code)。视频数据由各个帧构成。取决于个别设备的设计地,例如,一秒影片数据包含15帧视频数据。此外,这些帧分为两个类型:I帧和P帧。I帧是一个作为合成视频的基准的帧并通过对一个完全静止的图像进行编码而获得。P帧是通过只对刚处理过的前一I帧或P帧与实际静止图像的差值进行编码而获得的。如图3所示,视频数据包括一个I帧和紧随其后的多个P帧。例如,在影片数据每秒包含15帧的情况下,一秒的视频数据包括一个I帧和14个P帧。另一方面,音频数据则没有类似视频数据的I帧和P帧这样的概念。
视频数据的每一帧都包括一个时基和一个时间增量以指示经过的时间信息。时基和时间增量在MPEG标准中定义,并在播放影片数据的时候作为指示播放间隔的信息。时间增量在帧再现的时候指示经过的时间。时基起辅助作用并取0或1的值。
在图3所示的影片数据前端的报头中存储着包含帧信息的时间表。时间表包含着关于帧的大小(stsz)、帧识别信息(stss)和解码间隔(stts)的信息。帧的大小表示每一帧的大小。I帧和P帧之间的帧的大小是明显不同的。帧识别信息用来识别一个I帧,并包含I帧的数目信息。即,可以很容易地识别出哪一帧是存储了基准图像的I帧。这一帧识别信息用于在影片数据快进的时候只对I帧进行的闪过式(coma feed)再现。
在控制器20的影片播放单元21中对帧进行解码,然后临时性存储在控制器20的缓冲器中。当该帧的前一帧显示完成时,则被输出到如主显示单元16上。影片播放单元21中的解码间隔根据每一帧的数据大小通过分割从播放开始到播放结束的时间来获得,并分配给每一帧。也就是说,解码间隔是由此指定的帧的解码和再现的时间。在影片播放单元21中,当在指定的解码间隔内帧解码结束时,该帧的图像则被显示在显示单元16上,但是当在解码间隔内帧解码未结束时,该帧的图像则不会被显示并进行下一帧的解码。注意,对于音频数据,与帧的大小和解码间隔相关的信息也存储在报头中。
此外,影片数据的每一帧也存储着表明帧报头的帧报头信息。当参考帧数据时,控制器20可以基于帧的报头信息搜索帧的报头,然后基于帧识别信息判断该帧是I帧还是P帧,并可以基于时基/时间增量获取时间信息。
注意,上图的报头存储了包含再现所需的帧信息的时间表,并留有一个小的注释空间(空闲区)。它可以用来加入一小段文字。例如,可以加入“COPYRIGHTED”(“版权所有”)。通过参考该空闲区,可以确定是否存在版权。此外,移动电话的携带者可以限制什么样版权的影片文件可以被处理或者不允许以作者所不希望的方式播放,即使是在播放的时候,例如禁止任何改变播放速度或分开播放如只播放音频或只播放视频。
以上说明了移动电话10的各个组件。下面,将结合图4说明根据本实施例的移动电话10的文本到语音转换控制。
图4是用来说明根据本实施例的文本到语音转换控制操作的流程图。
当通信处理单元11检测到呼入电话或接收到的消息时,控制器20控制在主显示单元16和副显示单元15上的建立画面的显示,并通过语音合成处理单元17控制发出建立声音(ST1)。这时,当接收到的数据是包含音频的影片数据时,在控制报告呼入电话或接收到消息的同时,控制器20执行在影片播放单元21中播放该影片的处理。
此时,当影片播放单元21正在播放影片以报告呼入电话或接收到的信息,并且发生了一个预定事件激活包括语音合成处理单元17的文本到语音转换功能时,例如用户操作了文本到语音转换按键,控制器20切换到对文本到语音转换操作的控制(ST2)。
然后,控制器20判断所注册数据的内容是视频和音频数据分开注册的,还是注册的是包含视频和音频数据的影片数据(ST3)。当在步骤ST3中判断出视频和音频数据是分开注册的时,它使视频显示在主显示单元16上,并控制语音合成处理单元17进行文本到语音转换处理(ST4)。另一方面,当控制器在步骤ST3中判断出注册的数据内容是包含视频和音频的影片数据时,它将判断注册的影片数据是否有版权(ST5)。
当控制器在步骤ST5中判断出接收到的含有音频的影片信息是没有版权的时,它将判定视频和音频数据可以分离,只停止影片的音频输出,并将预先准备的无版权的视频数据的预置视频显示在主显示单元16上,然后激活文本到语音转换功能(ST6)。另一方面,当控制器在步骤ST5中判断出接收到的含有音频的影片信息是有版权的时,它将判定视频和音频数据不能分离,停止影片的视频和音频数据,将设置的影片视频显示在主显示单元16上,并执行预定的文本到语音转换处理(ST7)。
如上所作说明,根据本实施例,规定控制器20进行控制,从而当通信处理单元11检测到呼入电话或接收到的消息,并且影片播放单元21正在播放影片以报告呼入电话或接收到消息,如果发生一个预定的事件激活包括语音合成处理单元17的文本到语音转换功能,例如当接收到的包含音频的影片信息没有版权并且视频和音频数据可以分离时,则只停止影片的音频输出并激活文本到语音转换功能,而当其有版权并不能被分离时,则停止影片的视频和音频两部分数据并激活文本到语音转换功能,因此可以获得以下效果。
具有的优点包括在呼入电话的时候设定的数据可以被区分开,并且当切换声音数据时可以防止侵犯版权。也就是说,当有呼入电话或接收到电子邮件的时候,正在播放有版权的包含音频和视频数据的影片数据时,如果用户进行了启动文本到语音转换功能的操作,它将能够在不侵犯任何版权的情况下转换到文本到语音转换操作。因此,即使在接收影片数据时,用户也可以不用担心侵犯版权地使用文本到语音转换功能。
虽然本发明已经通过为说明目的选定的特定实施例进行了描述,但显然在不脱离本发明的基本概念和范围的情况下,本领域技术人员可以作出很多的修改。
Claims (15)
1.一种影片播放器,包括:
一个用来播放包含音频和视频影片的影片播放单元,
一个用来至少显示所播放影片和文本的显示单元,
一个文本到语音转换单元,具有文本到语音转换功能,能够将显示单元所显示的文本和设备的状态转换为语音,以及
一个控制器,其中
当在影片播放过程中发生一个预定事件而启动文本到语音转换功能时,
在视频和音频数据可以分离的第一种情况下,控制器只停止影片的音频输出并激活文本到语音转换功能,以及
在视频和音频数据不能分离的第二种情况下,控制器停止影片的视频和音频数据并激活文本到语音转换功能。
2.一种如权利要求1所述的影片播放器,其中当文本到语音转换操作结束并且影片仍在播放时,控制器使影片播放单元再次播放该影片。
3.一种如权利要求1所述的影片播放器,其中控制器根据所播放影片中的附加信息判断其是否包含预定的数据从而确定视频和音频数据是否可以分离。
4.一种移动终端,包括:
一个用来播放包含音频和视频影片的影片播放单元,
一个用来至少显示所播放影片和文本的显示单元,
一个文本到语音转换单元,具有文本到语音转换功能,能够将显示单元所显示的文本和设备的状态转换为语音,
一个用来至少检测呼入电话和接收到的消息的通信单元,以及
一个控制器,其中
当通信单元检测到呼入电话或接收到的消息并且影片播放单元正在播放影片以报告来电或消息时,以及当在影片播放过程中发生一个预定的事件以启动文本到语音转换功能时,
在视频和音频数据可以分离的第一种情况下,控制器只停止影片的音频输出并激活文本到语音转换功能,以及
在视频和音频数据不能分离的第二种情况下,控制器停止影片的视频和音频数据并激活文本到语音转换功能。
5.一种如权利要求4所述的移动终端,其中当文本到语音转换操作结束并且停止呼入电话或接收到消息的报告的处理还未进行时,控制器使影片播放单元再次播放该影片。
6.一种如权利要求4所述的移动终端,其中控制器根据所播放影片中的附加信息判断其是否包含预定的数据从而确定视频和音频数据是否可以分离。
7.一种如权利要求4所述的移动终端,其中文本到语音转换单元在呼入电话或接收到消息的时候具有将与接收到的电子邮件相关的发送人或信息转换成语音信息的功能。
8.一种如权利要求4所述的移动终端,其中文本到语音转换单元在呼入电话或接收到消息的时候响应一个预定操作而将与接收到的电子邮件相关的发送人或信息转换成语音信息。
9.一种如权利要求4所述的移动终端,其中控制器根据影片的附加信息中是否包含标识版权的数据,判断影片的视频数据和音频数据是否可以被分离。
10.一种移动终端的数据处理方法,包括:
能够播放包含音频和视频影片的影片播放功能,
能够至少显示所播放影片和文本的显示功能,
将显示单元上显示的文本和设备的状态转换成语音的文本到语音转换功能,以及
能够至少检测呼入电话和接收到的消息的通信功能,包括的步骤有:
当通信功能检测到呼入电话或接收到的消息并且影片播放功能播放影片以报告呼入电话或接收到的消息时,判断是否有一个预定事件发生以激活文本到语音转换功能,
当事件发生时判断视频和音频数据是否可以分离,
当可以分离时只停止影片的音频输出并激活文本到语音转换功能,以及
当不能分离时停止影片的视频和音频数据并激活文本到语音转换功能。
11.一种如权利要求10所述的移动终端数据处理方法,其中当文本到语音转换操作结束并且停止呼入电话或接收到消息的报告的处理还未进行时,影片播放功能再次播放该影片。
12.一种如权利要求10所述的移动终端数据处理方法,其中该方法还包括一个根据所播放影片中的附加信息判断其是否包含预定的数据、从而确定视频和音频数据是否可以分离的步骤。
13.一种如权利要求10所述的移动终端数据处理方法,其中文本到语音转换功能在呼入电话或接收到消息的时候具有将与接收到的电子邮件相关的发送人或信息转换成语音信息的功能。
14.一种如权利要求10所述的移动终端数据处理方法,其中文本到语音转换功能在呼入电话或接收到消息的时候响应一个预定操作而将与接收到的电子邮件相关的发送人或信息转换成语音信息。
15.一种如权利要求10所述的移动终端数据处理方法,其中该方法还包括一个根据影片的附加信息中是否包含标识版权的数据、判断影片的视频数据和音频数据是否可以被分离的步骤。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004310913A JP4634117B2 (ja) | 2004-10-26 | 2004-10-26 | 動画再生装置、携帯端末装置、並びに携帯端末装置のデータ処理方法 |
JP2004310913 | 2004-10-26 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1809077A true CN1809077A (zh) | 2006-07-26 |
Family
ID=36206265
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA2005100034545A Pending CN1809077A (zh) | 2004-10-26 | 2005-10-26 | 影片播放器,移动终端和移动终端的数据处理方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US8326123B2 (zh) |
JP (1) | JP4634117B2 (zh) |
CN (1) | CN1809077A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102685560A (zh) * | 2011-03-09 | 2012-09-19 | 株式会社理光 | 内容分发系统、内容分发服务器以及内容分发方法 |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8424048B1 (en) | 2006-02-18 | 2013-04-16 | Philip Scott Lyren | Portable electronic device for receiving and playing feature length movies |
US11128745B1 (en) * | 2006-03-27 | 2021-09-21 | Jeffrey D. Mullen | Systems and methods for cellular and landline text-to-audio and audio-to-text conversion |
US8521601B1 (en) | 2006-04-08 | 2013-08-27 | Philip Scott Lyren | Marketing and selling feature length movies over networks |
US20070260460A1 (en) * | 2006-05-05 | 2007-11-08 | Hyatt Edward C | Method and system for announcing audio and video content to a user of a mobile radio terminal |
KR101267062B1 (ko) * | 2006-10-31 | 2013-05-23 | 삼성전자주식회사 | 착신 대기음을 제공하는 휴대용 통신 단말기 |
JP5062669B2 (ja) * | 2007-06-26 | 2012-10-31 | 京セラ株式会社 | 電子機器及びその制御方法 |
CN101667413B (zh) * | 2008-09-03 | 2012-01-25 | 鸿富锦精密工业(深圳)有限公司 | 数码盒及其控制方法 |
CN109743442A (zh) * | 2018-12-14 | 2019-05-10 | 华为技术有限公司 | 来电提醒方法及终端 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11252216A (ja) | 1998-02-27 | 1999-09-17 | Kyocera Corp | 電話機 |
JP2001177608A (ja) | 1999-12-21 | 2001-06-29 | Yamaha Corp | 電話機 |
JP3850616B2 (ja) * | 2000-02-23 | 2006-11-29 | シャープ株式会社 | 情報処理装置および情報処理方法、ならびに情報処理プログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP2003018556A (ja) * | 2001-07-04 | 2003-01-17 | Canon Inc | データ処理装置、データ処理方法、コンピュータ可読記録媒体及びデータ処理プログラム |
DE10160673A1 (de) | 2001-12-11 | 2003-06-26 | Siemens Ag | System zur Umsetzung von Textdaten in eine Sprachausgabe |
JPWO2003081878A1 (ja) * | 2002-03-27 | 2005-07-28 | 三菱電機株式会社 | 通信装置 |
JP2004259335A (ja) * | 2003-02-25 | 2004-09-16 | Funai Electric Co Ltd | ディスク再生装置 |
US7016709B2 (en) * | 2004-03-12 | 2006-03-21 | Sbc Knowledge Ventures, L.P. | Universal mobile phone adapter method and system for vehicles |
-
2004
- 2004-10-26 JP JP2004310913A patent/JP4634117B2/ja not_active Expired - Fee Related
-
2005
- 2005-10-25 US US11/258,772 patent/US8326123B2/en not_active Expired - Fee Related
- 2005-10-26 CN CNA2005100034545A patent/CN1809077A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102685560A (zh) * | 2011-03-09 | 2012-09-19 | 株式会社理光 | 内容分发系统、内容分发服务器以及内容分发方法 |
CN102685560B (zh) * | 2011-03-09 | 2015-05-20 | 株式会社理光 | 内容分发系统、内容分发服务器以及内容分发方法 |
US9264746B2 (en) | 2011-03-09 | 2016-02-16 | Ricoh Company, Ltd. | Content distribution system, content distribution server, content distribution method, software program, and storage medium |
Also Published As
Publication number | Publication date |
---|---|
US20060088281A1 (en) | 2006-04-27 |
US8326123B2 (en) | 2012-12-04 |
JP2006126269A (ja) | 2006-05-18 |
JP4634117B2 (ja) | 2011-02-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1809077A (zh) | 影片播放器,移动终端和移动终端的数据处理方法 | |
US20080046239A1 (en) | Speech-based file guiding method and apparatus for mobile terminal | |
KR20050083086A (ko) | 휴대단말기의 데이터를 외부장치로 출력하는 장치 및 방법 | |
CN1951019A (zh) | 广播接收便携终端 | |
JP4569673B2 (ja) | 字幕付映像再生装置、字幕付映像再生方法及びプログラム | |
US7937074B2 (en) | Information terminal, and event notifying method | |
CN1722756A (zh) | 广播系统及其控制该广播系统的方法 | |
CN101150694A (zh) | 预定电视节目的提示方法、装置及系统 | |
CN1767603A (zh) | 移动终端、移动终端中广播节目记录和重放控制方法 | |
CN1549550A (zh) | 一种智能信息服务器及控制方法 | |
US20070120964A1 (en) | Method for performing recording operation in video communication mode of wireless terminal and wireless terminal implementing the same | |
CN100563334C (zh) | 在无线终端的视频电话模式中发送图像数据的方法 | |
CN1303580C (zh) | 处理语音信号的装置、方法以及传送语音的方法及其装置 | |
JP2005064592A (ja) | 携帯通信端末 | |
JP2004536506A (ja) | 情報伝達の方法及び装置 | |
CN201114207Y (zh) | 3d商务信息电话机 | |
CN1508645A (zh) | 一种与外部控制器互动的计时装置 | |
KR20080032751A (ko) | 휴대 단말기의 동영상 생성 방법 및 콘텐츠 제공 방법 | |
CN1291623C (zh) | 用于在便携式终端中显示活动图像的设备及方法 | |
CN1549561A (zh) | 一种智能信息电话及控制方法 | |
CN1741398A (zh) | 一种数字电视手机及其应用系统 | |
CN1549549A (zh) | 一种智能移动电话及控制方法 | |
CN2659039Y (zh) | 一种智能信息服务器 | |
CN2634738Y (zh) | 一种智能信息电话 | |
JP5248051B2 (ja) | 電子機器 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C12 | Rejection of a patent application after its publication | ||
RJ01 | Rejection of invention patent application after publication |