CN101101781A

CN101101781A - 音频信息显示语言设定装置及方法

Info

Publication number: CN101101781A
Application number: CNA2006100286127A
Authority: CN
Inventors: 李根英
Original assignee: LG Electronics Kunshan Computer Co Ltd
Current assignee: LG Electronics Kunshan Computer Co Ltd
Priority date: 2006-07-05
Filing date: 2006-07-05
Publication date: 2008-01-09

Abstract

本发明涉及音频信息显示语言设定装置及方法，在音频文件的信息显示的语言设定装置中，由以下几个部分构成：识别被输入的语音并进行文字判断的语音识别部；播放上述音频文件，上述语音识别部根据所判断的文字，执行显示音频文件信息的语言设定，根据已设定的语言对音频信息进行显示的播放显示部；分别存储上述语音识别部识别的语言信息以及音频文件信息的存储部。本发明为了显示音频文件信息设定语言时，利用语音识别，能够设定语言，从而便利性增大，利用已设定的语言信息，每个音频文件能够自动运用语言转换。

Description

音频信息显示语言设定装置及方法

技术领域

本发明涉及音频文件的信息显示的语言设定，尤其是涉及通过对类似于音频文件的ID3v1标签信息的显示的语言进行的语音识别，能够自动设定的一种音频信息显示语言设定装置及方法。

背景技术

最近，由于MP3(MPEG-1 audio layer 3)播放器功能的多样化，能够提供语音、线路输入(Line-in)、无线录音功能的播放器有激增的趋势。

MP3文件附加如ID3标签(Tag)的数据场，能够收录类似于题目、艺术家、乐谱集(Album)以及制作年度等音频文件的信息。

图1是ID3v1的标签的结构分块示意图。

参照图1，I D3v1标签包括题目(Title)、艺术家(Artist)、乐谱集(Album)、年度(Year)、备忘录(Comment)等的信息场，为了输入用户想要的信息，能够像计算机一样对标签进行识别，被识别的信息通过显示手段进行显示，所以用户能够对现在播放的音频文件信息进行确认。

现在ID3标签的第一种版本为ID3 1.0标签，第二种版本是ID3 2.0标签。

由于ID3 1.0标签在MP3文件的开始部分(语音数据之前)，所以在文件开始下载的同时能够使用，ID3 2.0标签在MP3文件的结尾部分(语音数据之后)，所以在结束全部MP3文件下载之前不能使用。

如上所述，MP3文件利用ID3标签能够补充文件的信息，所以用户在对音频文件分类或判断文件类别方面更为容易。

为了用户播放上述音频文件的ID3标签，只有播放器中具备类似于已存储的标签信息的语言设定功能，用户对信息的确认才有可能正常进行。

即，将任意一个文件假定为中国的音乐文件时，由于相应的文件的题目、艺术家等信息均为中国的歌曲题目、艺术家，所以按中文存储是很为普遍的。

所以，音频播放器利用中文字体，只有将相应的文件信息以正确的中国文字形式显示出来，用户才能对此进行识别。

上述的假设只表示一个例子，根据用户存储音频文件的ID3标签时所使用的语言，只有具备类似于相应的设定语言的设定功能，音频播放器才能凭借不同的语言字体，以各种语言方式，解决区分信息的问题。

但是，为了设定上述语言，现在，用户在播放以多种语言存储的音频文件信息时，只有通过对与各音频文件信息相适应的语言进行的播放操作安装，才有可能看到正确的信息，所以，收听以不同的语言形式存储的多个音频文件信息的情况下，在各文件的信息自行播放过程中会有许多困难。

发明内容

本发明正是为解决上述问题而提出的，其目的是提供一种通过语音识别，能够设定各音频文件的信息显示语言，另外，针对经过一次语言设定的文件，可将相应的文件和设定语言的信息以数据库的形式存储，能够自动进行语言的设定的音频信息显示语言设定装置及方法。

为了实现上述目的，本发明的音频信息显示语言设定装置包括以下几个部分：识别被输入的语音，并进行文字判断的语音识别部；播放上述音频文件，上述语音识别部根据所判断的文字，进行设定显示音频文件信息的语言，根据已设定的语言，对音频信息进行显示的播放显示部；分别存储上述语音识别部识别的语言信息以及音频文件信息的存储部。

另外，为了实现上述目的，本发明的音频信息显示语言设定方法包括以下几个步骤：(a)接收用于设定音频文件的信息显示语言的语音输入的步骤；(b)对上述所输入的语音进行判断，选择设定语言的步骤；以及(c)按上述所选择的语言设定信息显示的语言，存储相应的音频文件的语言设定信息的步骤。

如上所述，本发明的音频信息显示语言设定装置及方法，通过语音识别，可设定音频信息显示语言，存储已设定的音频信息显示语言信息，使得再次播放时能够得以运用。

本发明的效果：

如上所述的本发明的音频信息显示语言设定装置及方法，通过对语音的识别，能够设定各音频文件的信息显示语言，用户根据语言，能够使信息显示更准确，针对经过一次语言设定的文件，可将相应的文件和设定语言的信息以数据库的形式存储，从而具有能够自动运用各音频文件的语言设定转换的效果。

为进一步说明本发明的上述目的、结构特点和效果，以下将结合附图对本发明进行详细的描述。

附图说明

图1是现有的ID3v1标签的结构分块示意图；

图2是本发明实施例中语音信息显示语言设定装置的结构分块示意图；

图3是本发明实施例中语音识别方法的操作顺序图；

图4是本发明实施例中语音信息显示语言设定方法的操作顺序图。

具体实施方式

下面将参照附图对音频信息显示语言设定装置及方法的实施方式进行详细说明。

但是，在本发明的说明中，现有技术中众所周知的部分在这里将不做详细说明。

图2是本发明的实施例中，音频信息显示语言设定装置的结构分块示意图。

参照图2，通过语音识别，能够设定音频信息显示语言的装置，由以下几个部分构成：用于接收语音输入的麦克风210；识别通过上述麦克风210输入语音的语音识别部220；播放音频信息及根据上述语音识别部220识别的语言信息，执行显示语言设定和播放的播放显示部230；以及存储用于显示播放音频数据和各音频数据的音频信息的语言信息的存储部240。

此时，为了设定上述音频文件的语言，在音频播放器的信息输入的键盘输入部中，能够设定或补充定义热键，这在上述图2中并未标注。

上述语音识别部220包括：将通过麦克风210输入的语音与已存储在语音特征模式部222中的语音特征模式相比较判断的语音判断部221，和根据各语音的特征模式进行存储的语音特征模式部222。

另外，播放显示部230包括：设定显示音频信息的语言设定部231；执行音频数据播放的音频播放部232；以及根据上述语言设定部231已设定的语言，将存储在存储部240中的音频数据的音频信息显示出来的画面显示部233。

另外，存储部240包括：存储音频数据的音频数据部242，和针对已存储的音频数据，存储各被设定的语言信息的语言信息数据库(语言信息DB)241。

上述音频数据为包括ID3标签信息在内的音频文件，在语言信息DB 241中存储有音频文件的名字、ID3标签信息以及设定语言信息等，根据被存储的语言信息DB 241的内容，进行音频播放时，由于根据音频播放顺序加载使用各语言设定信息，所以在画面显示部233中能够显示正确的ID3标签的音频信息。

包括上述本发明实施例的语音信息显示语言设定装置的音频播放器，首先，音频文件存储在音频数据部242以后，音频播放部232最初播放时，在用户输入设定语言的热键的情况下，暂时中止相应音频文件的播放，用户通过麦克风210输入想输入的语言信息。

语音判断部221参照语音特征模式部222，对输入的语音信息进行识别，语言设定部231按已识别的语言设定相应的音频文件的信息显示语言。

凭借上述已设定的语言，将相应的音频文件的信息在画面显示部233上显示出来，同时，在语言信息DB241中，存储针对相应音频文件被设定的语言信息。

另外，被中止的音频播放继续进行。

上述语音识别部220对用户的语言设定的语音识别过程如下。

图3是本发明的实施例的语音识别方法的操作顺序图。

步骤301、步骤302，如图3所示，为了语言设定，用户通过麦克风210输入的是韩国语的情况下，语音判断部221提取出韩国语单词的特定的矢量，利用被提取出的特定矢量，从语音特征模式部222中查找出韩国语单词。标记

在上述语音识别中，提取特定的矢量，从事先储存在语音特征模式部222中特定矢量的单词信息中找出合适的单词，在此可以利用隐藏标记模式(HMM：HiddenMarker Model)等的语音识别方法。

步骤303，通过上述语音识别，识别结果为韩国语单词的情况下，将其传送给语言设定部231，语言设定部231按韩国语设定相应的音频文件的信息显示语言。

步骤304，另外，在设定的同时，语音判断部221将相应的识别语言信息传送到语言信息DB241，并将相应的音频文件信息一并存储起来。

步骤305，语言设定结束的情况下，音频播放继续进行，画面显示部233根据已设定的语言将音频数据的ID3标签信息在画面上显示出来。

此时，如前面所述，被识别的语言信息存储在语言信息DB 241中，此后重新播放相应音频文件的情况下，能够自动运用并显示已存储的语言设定信息，也可以根据用户的操作，对已设定的语言进行自由更改。

图4是本发明的实施例的语音信息显示语言设定方法的操作顺序图。

步骤401、步骤402，参照图4，音频播放器在播放音频文件时，为了显示包含在语音数据内的ID3标签信息，加载文件信息。

步骤403，此时，对相应音频文件以前是否有语言设定过程进行判断，这一点，通过对存储部240的语言信息DB 241中，是否有相应的音频文件的信息进行判断即可知道。

步骤406，即，在语言信息DB 241中存在相应的音频文件的语言设定信息的情况下，通过画面显示部233将文件信息按设定语言显示出来。

步骤407，然后，判断是否变换语言设定。

步骤404，同时，在语言信息DB 241中不存在相应的音频文件的语言设定信息的情况下，则按音频播放器的基本设定语言显示信息。

步骤405，然后，判断是否对相应的信息进行语言设定。

步骤408、步骤409，用户在音频播放过程中，如果上述步骤405、步骤407中想要设定语言的情况下，，输入事先设定的热键(未图示)，选择语言设定模式，由此，正在播放的音频会暂时中止。

步骤410，另外，做好了接收语言设定的语音输入准备的情况下，用户输入与想要的语言相应的语音。

上述语音输入准备的完成，通过画面显示部233，按信息的形式显示音频播放器语言设定的语音输入的可能等方式体现。

另外，用户输入的语音，为支持相应音频播放器语言范围内的、类似于韩国语或中国语的设定语言时，可直接以语音的形式通过麦克风210输入。

语音判断部221提取出被输入的语音的特征，并将其与语音特征模式部222相比较，判断出相应的语言，在将判断信息提供给语言设定部231的同时，向存储部的语言信息DB241传送。

步骤411、步骤412，上述语言设定部231根据所接收到的语言信息，设定并运用相应音频文件的信息显示语言，根据已设定的语言，在画面显示部233上将音频文件的信息显示出来。

步骤413，另外，向语言信息DB 241传送的语言信息与相应音频文件一道被存储起来，在以后播放相应音频文件时，经过步骤403利用已设定存储的语言信息，即能够显示信息。

步骤414，在语言设定以及存储结束以后，重新播放暂时停止的相应的音频文件。

另外，已经过一次设定的语言信息可根据步骤407至步骤413加以变更。

本发明的实施例中的音频信息显示语言设定装置及方法，在进行音频文件的信息显示过程中，设定语言时，利用语音识别，能够设定语言，从而便利性增大，利用已设定的语言信息，每个音频文件都具有能够自动运用语言变换的特征。

本技术领域中的普通技术人员应当认识到，以上的实施例仅是用来说明本发明，而并非用作为对本发明的限定，只要在本发明的实质精神范围内，对以上所述实施例的变化、变型都将落在本发明权利要求书的范围内。

Claims

1、一种音频信息显示语言设定装置，其特征在于包括以下几个部分：

识别被输入的语音并进行文字判断的语音识别部；

播放上述音频文件，上述语音识别部根据所判断的文字，执行显示音频文件信息的语言设定，根据已设定的语言对音频信息进行显示的播放显示部；

将上述语音识别部识别的语言信息以及音频文件信息分别存储的存储部。

2、如权利要求1所述的音频信息显示语言设定装置，其特征在于：

所述语音识别部，包括以下几个部分：

提取所输入的语音特征并将其与已存储的语音特征模式相比较判断的语音判断部；

存储用于上述语音判断部进行比较的语音特征模式的语音特征模式部。

3、如权利要求1所述的音频信息显示语言设定装置，其特征在于：

所述播放显示部，包括以下几个部分：

执行音频文件播放的音频播放部；

按上述语音识别部识别的语言设定信息显示语言的语言设定部；

根据上述语言识别部设定的语言，显示音频文件的信息的画面显示部。

4、如权利要求1所述的音频信息显示语言设定装置，其特征在于：

所述存储部，包括以下几个部分：

存储音频文件的音频数据部；

存储被执行语言设定的音频数据的各语言设定信息的语言信息数据库部。

5、一种音频信息显示语言设定方法，其特征在于包括以下几个步骤：

(a)接收用于设定音频文件的信息显示语言的语音输入的步骤；

(b)对上述所输入的语音进行判断，选择设定语言的步骤；

(c)将信息显示的语言设定为上述所选择的语言，存储相应的音频文件的语言设定信息的步骤。

6、如权利要求5所述的音频信息显示语言设定方法，其特征在于：

所述(a)步骤中，信息显示语言的设定，是在音频文件的播放中，根据已设定的热键的输入，执行语言设定。

7、如权利要求5所述的音频信息显示语言设定方法，其特征在于还包括以下步骤：

在上述(c)步骤以后还包括：

上述语言设定信息在播放已存储的音频文件的情况下，运用相应语言设定信息，变换语言设定，进行信息显示的步骤。