CN1818899A - Mpeg播放器的数据检索方法 - Google Patents

Mpeg播放器的数据检索方法 Download PDF

Info

Publication number
CN1818899A
CN1818899A CN 200510033167 CN200510033167A CN1818899A CN 1818899 A CN1818899 A CN 1818899A CN 200510033167 CN200510033167 CN 200510033167 CN 200510033167 A CN200510033167 A CN 200510033167A CN 1818899 A CN1818899 A CN 1818899A
Authority
CN
China
Prior art keywords
mentioned
data
voice messaging
file
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN 200510033167
Other languages
English (en)
Inventor
沈锡辅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LG Electronics Huizhou Co Ltd
Original Assignee
LG Electronics Huizhou Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LG Electronics Huizhou Co Ltd filed Critical LG Electronics Huizhou Co Ltd
Priority to CN 200510033167 priority Critical patent/CN1818899A/zh
Publication of CN1818899A publication Critical patent/CN1818899A/zh
Pending legal-status Critical Current

Links

Images

Abstract

本发明是关于对存储在存储媒介上的数据进行检索的方法的。本发明包括:将要检索的关键字以语音的方式进行输入的阶段;利用语音信息转换程序将上述输入的语音信息转换成文本信息的阶段;判断上述利用语音信息转换程序将上述输入的语音信息转换成的文本信息是否是用户输入的语音信息的阶段;将与上述转换后的文件信息相匹配存储的信息进行输出的阶段;以及利用上述输出的信息进行再现的阶段。因此,依据本发明通过STT对数据进行检索不仅可以提高速度,使检索更加快捷,而且还会更加方便。这是本发明所具有优越的检索功能。

Description

MPEG播放器的数据检索方法
技术领域
本发明是关于对存储在存储媒介上的数据进行检索的方法的。具体地说,就是随着方便携带的MP播放器的存储器的日益呈现大容量化的发展趋势,用户存储在其中的文件数量越来越多,这同时就给文件的查找带来了不便。本发明就是关于为用户提供从存储在其中的MP文件中对自己所需要的数据进行检索的方法的。
背景技术
下面,将对对文件进行存储和检索的传统的技术及其相关技术进行说明。
一般来说,对多媒体动态影像压缩的技术是于1992年以MPEG1规格的正式颁布时才开始的。这就是在当前的VCD(视频CD)中所使用的技术规格。
由于MPEG1的压缩率较低。因此,这种压缩技术还仅仅停留在提供显像度为352×288的立体音响服务的水平上。1995年公布的MPEG2方式就是现在的DVD(数字视频盘,Digital Vedio Disk)所采用的技术规格。利用这种压缩技术可以提供高显像度和杜比数字,或者是DTS(数字剧场系统,Digital Theater System)等效果良好的音响服务。
另一方面,将多媒体数据文件依据MPEG4视频格式即DivX格式、MP3音频格式以及JPEG影像压缩方式压缩后,将其存储在光盘中。这样,存储在上述光盘中的经过压缩的视频及音频数据本身就可以进行再现或者将其通过与外部设备连接的TV及扬声器进行输出。
但是,如上所述,在对上述存储的数据进行检索/再现时,如果使用对于具有导航(Navigation)功能的MP3播放器(MP3 player),在这种情况下通常是以文件夹为单位进行检索。当然,为了检索的快速和方便,也可以按照体裁进行检索、按照片套进行检索、按照音乐家进行检索等多种检索方式。
也就是说,在依据传统的技术中,在进行数据检索时直接输入要检索的关键字,然后通常都是以文件夹为单位进行检索。当然,根据需要也可以按照体裁,或者是按照音乐家进行检索。但是,如上所述,如果通过直接输入关键字进行检索,检索的速度就会延迟。同时,检索的对象(文件夹、音乐家等)也较少。这样,用户就可能对自己所需要的音乐文件进行准确、快速地检索/输出。
发明内容
本发明就为解决上述问题而研发的。依据本发明,用户可以对想要检索的数据进行快速、准确地检索。在本发明中,为了快速、准确地对将要输出的文件进行检索,就利用STT(语音转换文本,Speech ToText)解决方案(Solution),将用户的语音转换为文本(text)信息,然后对与上述转换后的文本信息相匹配的MP3的检索标签(Tag)信息进行设定并进行搜索(Searching)。
然后,对上述转换的文本信息进行确认,以判断它是否是用户输入的信息。然后就可以对所要输出的文件进行检索了。
根据需要,也可以将上述转换后的信息分类,然后以播放列表(PLAYLIST)的形式进行再现。
为了实现上述目的,MPEG播放器的数据检索方法包括:将要检索的关键字以语音的方式进行输入的阶段;利用语音信息转换程序将上述输入的语音信息转换成文本信息的阶段;判断上述利用语音信息转换程序将上述输入的语音信息转换成的文本信息是否是用户输入的语音信息的阶段;将与上述转换后的文件信息相匹配存储的信息进行输出的阶段;以及利用上述输出的信息对进行再现的阶段。
如上所述,依据本发明通过STT对数据进行检索不仅可以提高速度,使检索更加快捷,而且还会更加方便。这是本发明所具有优越的检索功能。
另外,在进行检索时可将检索对象的范围扩大,包括检索对象的文件夹名称、文件名称、目录名称、ID3标签(TAG)以及歌词文件等都可以进行检索。因此,用户也可以快速、准确地对自己所希望检索的音乐文件以播放列表(PLAYLIST)的形式进行输出/再现。
附图说明
下面,通过参照附图对依据本发明的实施例的详细说明,就可以了解本发明的另外一个目的及特征了。
图1是表示对依据本发明的数据检索及再现的MPEG播放器的构成组件图。
图2是表示对在本发明中也能应用的光盘驱动器及其辅助存储装置上的文件进行检索/选择的浏览器画面的实例图。
图3是表示依据本发明的数据检索方法的工作流程图。
附图标记说明
101  遥控装置                  102  面板
103  UART                      104  HDD
105  光盘驱动装置              106  IDE接口
107  EPROM                     108  DRAM
109  中央计算处理装置          110  PCI总线接口
120  媒体信号处理装置          121  SDRAM控制器
122  DVD解读器                 123  MPEG视频复原器
124  显示处理装置,OSD处理装置 125  音频复原器
126  SDRAM                     130  显示装置及输出装置
具体实施方式
下面,将参照附图对依据本发明的理想实施例进行详细的说明。
图1是表示对依据本发明的数据检索及再现的MPEG播放器的构成组件图。
如图所示,上述依据本发明的数据检索及再现的MPEG播放器包括以下几个部分:从光盘上将压缩的多媒体数据读取出来的光盘驱动装置105;由用户指令输入按钮及对语音信息进行输入的设备和显示窗构成的面板102;从上述光盘驱动装置105上将压缩的多媒体数据读取出来,并将其向媒体信号处理装置120传输,然后,对通过上述面板102输入的用户指令进行处理,然后,将播放器的当前状态向上述面板102及位于外部的TV画面(未图示)进行输出的中央计算处理装置109;将通过上述中央计算处理装置109传输的压缩多媒体数据进行解压缩处理,生成影像及语音信号,然后进行输出的媒体信号处理装置120;将通过上述媒体信号处理装置输出的影像及语音信号进行转换、显示并进行输出的显示装置及输出装置130。
另外,如图所示,上述依据本发明的数据检索及再现的MPEG播放器还可以包含以下几个部分:与外部计算机(未图示)相连接的通信端口;将通过上述通信端口下载接收的压缩多媒体数据和从光盘读取出来的压缩多媒体数据进行存储的辅助存储装置104。
另外,如图所示,上述依据本发明的数据检索及再现的MPEG播放器还可以包含以下几个部分:上述中央计算处理装置109使用的软件;对在本发明中用于将语音信息转换成文本信息的程序STT(Speech ToText)进行存储的EPROM107。
如上所述,利用STT技术的MP3 NAVIGATION功能就是一种软件解决方案。它是利用将语音转换成文件的技术,即利用语音打字技术(STT-Speech To Text),这样,用户通过设置在面板102上的语音输入装置(Voice Inputter)/录制装置(Recorder)(未图示),就可以自动将要输入/录音的内容转换成文字。
另外,如图所示,上述依据本发明的数据检索及再现的MPEG播放器还包含具有用户指令输入按钮的遥控装置101。这样,上述中央计算处理装置109就可以对通过上遥控装置101输入的用户指令进行处理。
下面,对依据本发明具有上述构成的MPEG播放器的运行情况进行详细的说明。
中央计算处理装置109对MPEG播放器的所有运行进行控制,其主要功能就是从光盘驱动装置105或者HDD104之类的数据存储装置中将多媒体数据读取出来。然后,将数字影像及音响数据通过PCI BUS接口向媒体信号处理装置120进行传输。然后,生成与媒体信号处理装置120相适应的处理控制信号。
另外,在与动态影像文件一起提供的信息中,当存在字幕之类的附加数据文件的情况下,就与动态影像数据的处理一样,将字幕在画面上进行显示的控制信息向媒体信号处理装置120的OSD(屏幕显示,On Screen Display)处理装置124进行传输。
除此之外,中央计算处理装置109按照根据通过面板102或者遥控装置101输入的用户指令决定的顺序,执行用户指令的动作。
除了上述结构之外的其它构成要素的运行就根据各个功能的需要进行工作。因为这也只是一种普通的技术,因此在这里就不再进行详细的说明了。不过,在这里,还要对依据本发明的利用STT技术的数据检索方法的工作流程进行一下附加说明。
将依据内置于EPROM107内的STT程序并通过面板102输入的语音信息转换为文本信息。然后,就可以对存储在光盘驱动装置105上的数据进行检索了。
执行上述检索动作的基本概念就是利用将用户的语音转换成文本信息的STT(Speech To Text)解决方案(Solution),然后利用转换成的文本信息对MP3的标签(Tag)信息进行搜索(Searching),并进行分类(Sorting)的软件解决方案(Soft Solution)。
详细地讲,存储在上述光盘驱动装置105上的数据包含MP3文件的文件夹名称、文件名称、目录名称、ID3标签(TAG)内容、歌手姓名、歌词文件等相关信息,如果用户将歌手姓名、片套名称、歌词的一部分、文件名称中的任意一个单词通过具有语音输入方式的面板102进行输入,系统就会将与之相匹配的文件进行列表,然后根据需要对其进行再次分类(SORTING),然后以播放列表的形式进行输出/再现。
如上所述,当是普通的MP3文件的情况,则称作ID3标签(TAG)信息。同时,在文件中还附加包含有文本信息。
例如:用户利用编辑器等设备可以将片套信息、歌手姓名、体裁信息、甚至是歌词等各种信息插入到MP3文件中,作为从语音信息转换成文本的检索语,它不仅可以包含在已经存在的MP3文件名称中,而且可以包含在ID3标签(TAG)信息中,或者是检索的BOUNDARY内。
例如,有这样一首MP3歌曲:“请靠近,请你不要离得太远”,实际上,在其文件的ID3标签(TAG)中可以插入李光照、李光照2集、叙事曲(ballade)等信息。在这里,用户如果通过语音方式输入“请靠近”、“你”、“李光照”、“叙事曲”等希望检索的检索语,就可以对与之相匹配的上述曲目进行检索了。
另一方面,如果考虑到用户的方便,在通过上述过程对数据进行检索时,可以使用在“环境设定”一栏中将检索列表转换成播放列表(PLAYLIST)的方法。
一般来说,通过语音方式检索的文件其检索结果一般都是按照文件名称的顺序,或者是按照文件夹的顺序进行罗列的。
例如:当对通过语音方式对“撒朗”这个单词进行检索时,假设对10个MP3音源进行了检索,就会按照文件名称的顺序对10个曲目进行分类(SORTING)。在上述10个曲目中,也可能包含用户并不怎么想听的曲目。
这时,如果用户在语音检索的选项中选择“全选”,则上述通过语音检索的曲目都会被播放列表(PLAYLIST)化并按顺序(文件名称的顺序)或者随机(RANDOM)再现(REPEAT选项调整)。
但是,如果用户要单纯地通过语音检索选项将检索结果进行罗列。在这种情况下,则在上述检索结果中利用书签(BOOKMARK)功能,只是重新制订自己的播放列表(PLAYLIST)就可以了。
另外,将上述输入的语音信息进行STT处理,然后对其进行第一次分类。分类方法用户可以进行选择。
例如:在根目录(ROOT)文件夹中包含A文件夹、B文件夹、C文件夹。假定在上述各个文件夹中满足用户检索条件的MP3文件分别是第3个,第5个和第6个曲目。在这种情况下,在进行环境设定时,如果设定为按照文件夹顺序对语音检索结果进行分类(SORTING)的方法,则检索结果就会从上位开始,按照A文件夹第3个曲目、B文件夹第5个曲目、C文件夹第6个曲目的顺序进行罗列。
但是,按照文件顺序设定分类(SORTING)方法,则总共为3+5+6+14个曲目又会以一个整体的状态再次按照文件夹名称的顺序分类(SORTING)。
另外,如果用户通过语音方式输入的单词在进行STT处理时,不能够很好地进行转换。在这种情况下,就要增加一个使用用户进行修正的过程。
例如:当要通过语音方式对“撒朗”一词进行检索时,通过单触式操作(one touch)将其转换为语音导航(NAVIGATION)模式。然后,在向设置在面板102上的语音输入设备,即向传声器输入“撒朗”一词时,经过STT处理后的结果就会被显示(DISPLAY)。
但是,如果对“撒朗”的文本信息显示(DISPLAY)的不是“撒朗”,而是“撒拉姆”或者是“丝浪”时,用户通过肉眼对其进行确认之后就可以将其取消。这时,如果在一定的时间(例如:3秒)内不输入取消的指令,系统就将通过上述转换的文本信息对数据进行检索。
另一方面,对“撒朗”一词经过STT处理之后,如果转换成文本信息,则再次按下设置在面板102上的执行输入(ENTER)语音检索导航(NAVIGATION)指令作用的按钮,在这种情况下不需要等待3秒,系统就会直接进行检索。
图2是表示对存储在光盘驱动装置105及其辅助存储装置上的文件进行检索/选择的浏览器画面的实例图。它也适用于本发明对检索结果的显示。
在“文件夹信息”部分可以显示当前选择的文件夹的名称。另外,在“文件信息”部分也可以对当前选择的文件夹内的文件夹及其文件进行显示。文件夹、DivX文件、MP3文件以及端口文件等都分别按照不同的图标进行分类,并可以进行显示。对于当前正在再现中的文件,可以通过其它的颜色进行显示。这样就可以为用户带来很大的方便。
图3是表示依据本发明的数据检索方法的工作流程图。
首先,使MP播放器开始工作(S301)。
然后,为了对数据进行检索,便通过语音识别导航(NAVIGATION)模式进行移动。必要时也可以对要检索的范围进行选择(S302)。
例如:可以将检索范围进行如下设定:即将文件夹名称、文件名称、目录名称、ID3标签(TAG)内容以及歌词文件等分别进行组合,也可以将上述信息全部包括在内进行设定。
然后,用户设置在面板上的语音输入设备将要检索的关键字输入系统(S303)。
利用语音信息转换程序,即STT将上述输入的语音信息转换成文本信息(S304)。
利用语音信息转换程序将输入的语音信息转换的文本信息是否是用户输入的语音信息进行确认(S305)。在上述转换成文本信息的信息不是用户输入的语音信息的情况下,就在预先规定的时间内输入新的语音信息并再次进行将语音信息转换为文本信息的过程;如果在预先规定的时间内没有输入新的语音信息,则就对与上述转换的文本信息相应的信息进行检索(S306)。
另一方面,根据上述阶段S305的判断结果,如果系统将上述用户输入的语音信息正确地转换成了文本信息,在这种情况下,就对与上述转换的文本信息相匹配存储的信息以列表的形式进行输出(S307)。
对于与上述转换的文本信息相匹配存储的信息的输出方法可以由用户预先进行设定(S308)。
例如:输出的列表信息与文件夹顺序或者文件名称的顺序一样,是按照一定的标准进行输出的。另外,上述文件夹顺序或者文件名称顺序的列表信息也是由用户进行分类的。因此,就可以只对必要的信息形成播放列表(PLAYLIST)。
然后,利用上述输出的信息对数据进行再现(S309)。
如上所述,在本发明中对MP3数据进行检索输出时,将输入的语信息通过STT进行转换,这样可以对数据进行快速检索。根据需要,可以对上述检索的信息进行分类(Sorting)。然后,对用户需要的数据再现出来。本发明就是关于具有上述功能的方便携带的MP3播放器的数据检索及列表显示方法的。
通过上述的说明内容,相关工作人员完全可以在不偏离本项发明技术思想的范围内,进行多样的变更以及修改。
因此,本项发明的技术性范围并不局限于说明书上的内容,必须要根据权利范围来确定其技术性范围。

Claims (8)

1、MPEG播放器的数据检索方法,用于对存储在存储媒介上的数据进行检索和/或再现的MPEG播放器,其特征在于,其包括:
将要检索的关键字以语音的方式进行输入的阶段;
利用语音信息转换程序将上述输入的语音信息转换成文本信息的阶段;
将与上述转换后的文件信息相匹配存储的信息进行输出的阶段;
以及利用上述输出的信息进行再现的阶段。
2、如权利要求1所述的MPEG播放器的数据检索方法,其特征在于,其还包括以下的阶段:判断上述利用语音信息转换程序将上述输入的语音信息转换成的文本信息是否是用户输入的语音信息的阶段。
3、如权利要求2所述的MPEG播放器的数据检索方法,其特征在于,在利用语音信息转换程序将输入的语音信息转换成文本信息的信息不是用户输入的语音信息的情况下,如果在预先规定的时间内没有输入新的语音信息,就对与上述转换的文本信息相应的信息进行检索。
4、如权利要求1所述的MPEG播放器的数据检索方法,其特征在于,为了能够将与上述转换的文本信息相匹配存储的信息进行输出,能够对与上述文本信息相匹配存储的信息的检索范围进行选择。
5、如权利要求4所述的MPEG播放器的数据检索方法,其特征在于,检索范围包括文件夹名称、文件名称、目录名称、ID3标签内容以及歌词文件的至少一个以上。
6、如权利要求1所述的MPEG播放器的数据检索方法,其特征在于,对于与上述转换的文本信息相匹配存储的信息的输出方法可以由用户预先进行设定。
7、如权利要求6所述的MPEG播放器的数据检索方法,其特征在于,对检索信息进行输出的列表信息与文件夹顺序或者文件名称的顺序一样,是按照一定的标准进行输出的。
8、如权利要求7所述的MPEG播放器的数据检索方法,其特征在于,用户可以对检索的列表信息进行分类使其能够形成播放列表。
CN 200510033167 2005-02-08 2005-02-08 Mpeg播放器的数据检索方法 Pending CN1818899A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 200510033167 CN1818899A (zh) 2005-02-08 2005-02-08 Mpeg播放器的数据检索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 200510033167 CN1818899A (zh) 2005-02-08 2005-02-08 Mpeg播放器的数据检索方法

Publications (1)

Publication Number Publication Date
CN1818899A true CN1818899A (zh) 2006-08-16

Family

ID=36918915

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 200510033167 Pending CN1818899A (zh) 2005-02-08 2005-02-08 Mpeg播放器的数据检索方法

Country Status (1)

Country Link
CN (1) CN1818899A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102111680A (zh) * 2009-12-25 2011-06-29 康佳集团股份有限公司 一种机顶盒的歌曲分类管理方法
CN103744922A (zh) * 2013-12-25 2014-04-23 惠州华阳通用电子有限公司 一种基于Android平台的碟片搜索播放方法及系统
CN103885949A (zh) * 2012-12-19 2014-06-25 中国科学院声学研究所 一种基于歌词的歌曲检索系统及其检索方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102111680A (zh) * 2009-12-25 2011-06-29 康佳集团股份有限公司 一种机顶盒的歌曲分类管理方法
CN103885949A (zh) * 2012-12-19 2014-06-25 中国科学院声学研究所 一种基于歌词的歌曲检索系统及其检索方法
CN103885949B (zh) * 2012-12-19 2017-07-07 中国科学院声学研究所 一种基于歌词的歌曲检索系统及其检索方法
CN103744922A (zh) * 2013-12-25 2014-04-23 惠州华阳通用电子有限公司 一种基于Android平台的碟片搜索播放方法及系统

Similar Documents

Publication Publication Date Title
CN1554095A (zh) 用于在数字音频数据播放器中建立带索引的播放列表的方法和装置
US20050246375A1 (en) System and method for encapsulation of representative sample of media object
KR100736480B1 (ko) 포터블 디바이스의 미디어 동기화 장치 및 방법
CN1554094A (zh) 用于支持在数字音频播放器中的用户接口和导航任务的m3u文件格式的扩展
CN1849579A (zh) 语音信息系统
JP2010078979A (ja) 音声録音装置、録音音声検索方法及びプログラム
CN1145162C (zh) 记录和/或播放装置及方法
CN1901082A (zh) 音频记录装置、音频记录方法和音频记录程序
CN1818899A (zh) Mpeg播放器的数据检索方法
CN1629932A (zh) 支持文本到语音导航的方法和使用该方法的多媒体装置
CN1877729A (zh) 显示控制方法、内容数据再现装置和程序
CN1726558A (zh) 用于在数字音频播放器中标记和显示歌曲的方法
CN213483396U (zh) 一种基于多语种的音频语种识别分类转接装置
KR101551968B1 (ko) 차량에 적용된 미디어를 통한 음원 정보 제공 방법
CN1947196A (zh) 记录再现装置、同时记录再现控制方法以及同时记录再现控制程序
CN100340999C (zh) 一种数字音乐转换装置
JP2001101832A (ja) 記録再生装置およびデータ管理方法
CN101030129A (zh) 一种文语同步记录方法及其装置
US20070091736A1 (en) System and method for storing and managing digital content
KR20050106246A (ko) 엠펙 플레이어에 있어서 데이터 검색 방법
CN1232957C (zh) 使用电脑辅助设定光盘播放机系统参数的方法
US6928405B2 (en) Method of adding audio data to an information title of a document
JP4135689B2 (ja) プログラム、電子機器、データ処理方法および再生装置
US20120130518A1 (en) Music data reproduction apparatus
CN100576336C (zh) 记录和再现系统及方法、记录装置及方法、再现装置及方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication