CN102567309A

CN102567309A - 一种语言转换装置

Info

Publication number: CN102567309A
Application number: CN2010105810882A
Authority: CN
Inventors: 蔡伟俊
Original assignee: Individual
Current assignee: Individual
Priority date: 2010-12-09
Filing date: 2010-12-09
Publication date: 2012-07-11

Abstract

本发明提供一种语言转换装置，包括处理器芯片、记忆芯片、语言接收模块、播放器、扩展接口、显示模块、选择电路和译码电路组成，所述记忆芯片、语言接收模块、播放器、扩展接口、显示模块、选择电路和译码电路均与处理器芯片连接，所述处理器芯片用以处理输入语言信号、产生输出语言信号、控制扩展接口与外接设备之间的通信、对显示模块和选择电路进行控制，所述译码电路产生所需的片选信号，所述选择电路能选择不同语言之间的转换，进而使处理器芯片控制对不同语言之间的转换，所述的译码电路通过地址线与处理器芯片连接。

Description

一种语言转换装置

技术领域

本发明涉及一种电子技术，特别是一种可以将使用者所说的某种语言转换成另一种语言、或将其他人所说的语言转换成使用者使用的语言的便携式语言转换装置，以及相应的语言互译方法。

背景技术

说话是人类进行交流最直接、最自然的方式，我们日常生活中很大一部分的信息都是通过说话来进行传递和获取的。如果由于某些原因而无法用说话来进行交流的话，人与人之间信息传递的效率将会大大降低，从而给生活带来巨大的不便。

如不同国家之间的语言的差异，对沟通带来极大的障碍。

而即便是同一国家，因方言的不同，也会带来沟通上的障碍。我国幅员辽阔，具有众多的民族，长期以来在各民族聚居的地方形成了多种独特的文化，也形成了各种各样的语言，例如仅在广东省内就存在粤语、潮汕话、客家话、雷州话等多种地区语言。这些语言虽然大多数都以中文为基础，但它们通常在发音、用词、句式等方面与常用的普通话有着较大的差别，语言与语言之间也存在着许多差异，这使得一个地区的人如不经过学习很难听懂或说另一地区的本地话。为了消除各地区语言上的差别，建国以来国家大力推广普通话教育，取得了很大的成绩。但尽管如此，在许多普通话教育还不够普及的地区，人们日常的交流仍以本地语言为主，不少人甚至还不懂得普通话的听和说。语言与普通话、语言与语言之间的差异使得来自不同地区的人常常难以正常地通过说话进行交流，种类繁多的语言也使得一般人无法一一学习。随着各地间交往的增多，语言不通日益成为人们出行中的最常遇到的不便之一。

解决出行中语言不通的问题目前主要采取两种方法，其一是大家都说普通话，但这个要求对不少人来说难度较大；或者是找一位懂得两位说话人使用语言的人作为翻译，将两人的话互译为对方的语言，但许多情况下这种翻译并是随时都能找到的，如在外出旅游时就会经常碰到语言不通但又找不到可翻译的人的情况。当然还可以通过写字、打手势等非说话的方式进行交流，但这些方法与说话相比显然要麻烦得多，使用起来极为不便。

发明内容

本发明的目的在于克服不同语言之间的差异所导致的沟通障碍，提供了一种语言转换装置。

为了达到发明目的，本发明采用的技术方案为：

一种语言转换装置，包括处理器芯片、记忆芯片、语言接收模块、播放器、扩展接口、显示模块、选择电路和译码电路组成，所述记忆芯片、语言接收模块、播放器、扩展接口、显示模块、选择电路和译码电路均与处理器芯片连接，所述处理器芯片用以处理输入语言信号、产生输出语言信号、控制扩展接口与外接设备之间的通信、对显示模块和选择电路进行控制，所述译码电路通过地址线与处理器芯片连接，并产生该语言转换装置所需的片选信号，所述选择电路能选择不同语言之间的转换，进而使处理器芯片控制对不同语言之间的转换，该语言转换装置的处理过程包括如下几个步骤：

（1）、建立语言系统

包括建立语言识别模型库、语言合成模型库和不同语言文法转换表；

（2）、记录原始语言信息

通过语言接收模块记录现场的原始语言信息；

（3）、识别原始语言信息

处理器芯片根据步骤（1）所建立的语言识别模型库识别原始语言信息的内容；

（4）、将原始语言信息转换成目标语言信息

处理器芯片根据步骤（1）所建立的语言文法转换表将原始语言信息转换成目标语言信息；

（5）、播放目标语言信息

处理器芯片根据步骤（1）所建立的语言合成模型库合成目标语言信息，并通过播放器将目标语言信息播出。

本发明的步骤（1）建立语言系统包括如下步骤：

（11）、确定需互译的语言种类，并根据实际的需要确定每种语言的词汇表和句子列表；

（12）、根据每种语言的句子列表，建立语言文法转换表，对于两种语言之间的互译，语言文法转换表具体又可分为两部分，一部分为语言C的句子到语言D的句子的映射，另一部分为语言D的句子到语言C的句子的映射，两部分均为一张多对一的列表；

（13）、根据所确定的系统词汇表，对每种语言的每个词汇采集训练数据，采用统计的方法建立语言识别模型库；

（14）、根据系统的词汇表以及所采用的合成方法不同，以语句、短语、词或音节为单位，或音节、半音节、音素为单位建立语言合成模型库，通过对样本数据的编码分析，得到语言合成所需的模型参数。

本发明的所述步骤（3）识别原始语言信息A包括如下步骤：

（31）采用端点检测技术，检测出所录制声音中所有语言段的起点和终点；

（32）采用关键词确认技术，对所有语言，分别利用其对应的语言识别模型库识别出语言段中包含的系统可识别词汇，无法识别的词汇采用特殊的符号来代替，并将每句话的识别结果按先后顺序进行排列；

（33）将不同语言识别得到的每句话的内容与该语言预定的句子内容进行比较，首先找出所有语言中与所记录语言最匹配的句子，然后将该句子和所记录语言的匹配程度与一预先设定的阈值进行比较，如果超过该阈值，则该句子为识别结果，该句子所属的语言为当前记录语言的语言，如果少于该阈值，则提示使用者无法识别该段声音。

本发明所述记忆芯片采用大容量的闪存芯片，且通过地址线、控制线、数据线与处理器芯片连接。记忆芯片为语言互译装置提供存储空间。

所述的语言接收模块由麦克风和A/D转换器组成，所述的播放器由D/A转换器和扬声器组成，所述的语言接收模块和播放器均通过数据线和控制线与处理器芯片连接。

本发明的语言互译装置的扩展接口由计算机接口控制器和计算机接口共同构成，且通过控制线和数据线与处理器芯片连接。为处理器芯片和计算机之间提供接口。

所述的扩展接口由计算机接口控制器和计算机接口共同构成，且通过控制线和数据线与处理器芯片连接。

本发明的语言互译装置的选择电路由键盘阵列和键盘控制器组成，且通过数据线和控制线与处理器芯片连接。使用者可以通过开关或按键来对语言互译装置的状态进行控制和设置。

本发明提供的语言互译装置可以中文与外文、不同外文之间、以及实现普通话与语言之间、或语言与语言之间一些常用语的互译，即可以将接收到的一段常用的普通话或某种语言的语言转换为另一种语言或普通话再进行播放，使得使用者无需通过第三者翻译即可直接与使用其他语言的人进行简单的交谈，可有效地解决出行时语言不通的问题。

本发明的有益之处包括：

1、利用本发明，两个语言不通的人无需通过第三者或写字、打手势等方式即可方便地进行一些交流，如购物、餐饮等等，有效地改善了人们出行中遇到的语言不通的问题。

2、本发明的电路体积小，重量轻，可以随身携带，方便人们使用。

3、通过合理地设计系统的词汇和句子，可以方便地设计出适用于不同场合的语言互译机，并能实现多种语言之间的互译。

4、可以通过用计算机下载更新语言识别模型库、语言合成模型库和语言文法转换表的方法，来改变系统适用的语言以及词汇。

附图说明

图1为本发明提供的语言互译装置的结构原理图。

具体实施方式

下面结合附图对本发明做进一步的说明。

本发明提供的语言转换装置的结构原理图如附图1所示，由处理器芯片、记忆芯片、语言接收模块、播放器、扩展接口、显示模块、选择电路、译码电路组成，所述的记忆芯片、语言接收模块、播放器、扩展接口、显示模块、选择电路、译码电路通过地址线、或数据线、或控制线与处理器芯片连接。

本实施例的处理器芯片由DSP或MCU芯片构成；语言输入电路由麦克风和A/D转换器共同构成；语言输出电路由D/A转换器和扬声器共同构成；记忆芯片采用大容量的闪存芯片；扩展接口由计算机接口控制器和计算机接口共同构成，使用者可以通过该接口从计算机中下载新的语言识别模型库、语言合成模型库和语言文法转换表；显示模块由LCD显示屏和LCD控制器共同构成，用以显示系统当前的一些状态信息，如时间、互译语言种类、是否正在翻译、翻译时已录入语言的长短、系统设置时的菜单等；选择电路由键盘阵列和键盘控制器共同构成，其中键盘阵列中包含一“翻译”功能按键，当需要进行语言翻译时，使用者按住“翻译”功能键并对麦克风说话，说完话后，松开“翻译”功能键，互译机即自动将使用者所说的话转换为所需的语言，通过互译机上的扬声器播放出来；键盘阵列上还设有另一些可对系统状态进行设置的按键，可通过这些按键对系统的一些参数进行设置，如在系统可以处理多种语言时，设定当前互译的语言类型。

当开机上电后，系统首先进行初始化。初始化结束后，进入主程序循环，系统不断检测计算机接口是否与计算机连接，以及按键状态。当检测到计算机接口与计算机连接后，则停止其他操作，进入联机状态。此时使用者可通过计算机下载新的语言识别模型库、语言合成模型库以及语言文法转换规则表，以更新系统适用的语言或词汇。当使用者完成下载，并将计算机与系统断开连接后，系统退出联机状态，恢复正常的操作。如果系统没有与计算机连接并有按键操作时，判断使用者是否按下“翻译”功能键，当使用者按下“翻译”键时，进行以下操作：

1、使用者按下“翻译”功能键的同时，开始在内存缓冲区中对输入的声音信号进行记录，当使用者放开“翻译”功能键时，停止声音信号的记录，启动语言识别进程。由于直接记录原始声音信号需要较大的存储空间，因此先将原始语言信号转换为识别时所需要的语言特征，再对这些语言特征进行记录，这样可以节约大量的存储空间。

2、语言识别进程中，对记录下的声音段进行检测和识别，具体又可以分为以下步骤：

（1）采用端点检测技术，检测出所录制声音中所有语言段的起点和终点。

（2）采用关键词确认技术，对系统的所有语言，分别利用其对应的语言识别模型库识别出语言段中包含的系统可识别词汇，无法识别的词汇采用特殊的符号来代替，并将每句话的识别结果按先后顺序进行排列。

（3）将不同语言识别得到的每句话的内容与该语言预定的句子内容进行比较，首先找出所有语言中与所记录语言最匹配的句子，然后将该句子和所记录语言的匹配程度与一预先设定的阈值进行比较，如果超过该阈值，则该句子为识别结果，该句子所属的语言为当前记录语言的语言，如果少于该阈值，则提示使用者无法识别该段声音。

3、根据语言识别得到的语言种类和句子内容，以及系统当前设置的互译语言种类，利用语言文法转换表，对识别结果的每个句子转换为另一种语言的句子。

4、利用语言合成模型库，将已经转换好的句子用语言合成技术进行合成，并控制播放器进行播放，具体又可以分为以下几个步骤：

（1）根据所需的语言类型和转换好的句子内容，在语言合成模型库中找出所需用到的语言合成模型，并加载这些模型。

（2）利用已加载的语言合成模型，用语言合成技术产生所需要的数字语言信号。

（3）向D/A转换器输出该语言信号。

当使用者按下其他功能键时，执行相应的功能操作，例如在系统可以处理多种语言时，对当前互译语言种类的指定等。

语言识别模型库、语言合成模型库和语言文法转换表由生产厂家以软件的形式提供给使用者，使用者可以通过互译机的计算机接口从计算机上下载不同的语言识别模型库、语言合成模型库和语言文法转换表。语言识别模型库、语言合成模型库和语言文法转换表可以通过以下方法建立：

1、确定需互译的语言种类，并根据实际的需要确定每种语言的词汇表和句子列表。

2、根据每种语言的句子列表，建立语言文法转换表。对于两种语言之间的互译，语言文法转换表具体又可分为两部分，一部分为语言A的句子到语言B的句子的映射，另一部分为语言B的句子到语言A的句子的映射，两部分均为一张多对一的列表。这是因为不少句子虽然用词不同，但其意思是一样的，例如普通话的“请问到北京路怎么走？”和“北京路怎么去？”意思都是问去北京路的方法，因此转换时可以当作一个句子来翻译。

3、根据所确定的系统词汇表，对每种语言的每个词汇采集训练数据，采用统计的方法建立语言识别模型库。目前语言识别中最常用的统计模型为HMM，可以采用EM训练方法由训练数据得到每个词汇的HMM模型，语言特征可采用MFCC、LPCC、PLP以及音调变化轨迹等。在建立系统词汇表内词汇的语言识别模型的同时，还需建立词汇表外词汇的填料模型。

4、根据系统的词汇表以及所采用的合成方法不同，以语句、短语、词或音节为单位（适用于语言的波形编码合成法），或音节、半音节、音素为单位（适用于语言的参数分析合成法和规则合成法）建立语言合成模型库，通过对样本数据的编码分析，得到语言合成所需的模型参数。

Claims

1.一种语言转换装置，包括处理器芯片、记忆芯片、语言接收模块、播放器、扩展接口、显示模块、选择电路和译码电路组成，所述记忆芯片、语言接收模块、播放器、扩展接口、显示模块、选择电路和译码电路均与处理器芯片连接，其特征在于该语言转换装置的处理过程包括如下几个步骤：

（1）、建立语言系统

包括建立语言识别模型库、语言合成模型库和不同语言文法转换表，进一步包括如下步骤：

（12）、根据每种语言的句子列表，建立语言文法转换表，对于两种语言之间的互译，语言文法转换表具体又可分为两部分，一部分为第一语言的句子到第二语言的句子的映射，另一部分为第二语言的句子到第一语言的句子的映射，两部分均为一张多对一的列表；

（14）、根据系统的词汇表以及所采用的合成方法不同，以语句、短语、词或音节为单位，或音节、半音节、音素为单位建立语言合成模型库，通过对样本数据的编码分析，得到语言合成所需的模型参数；

（2）、记录原始语言信息

通过语言接收模块记录现场的原始语言信息；

（3）、识别原始语言信息

处理器芯片根据步骤（1）所建立的语言识别模型库识别原始语言信息的内容，进一步包括如下步骤：

（33）将不同语言识别得到的每句话的内容与该语言预定的句子内容进行比较，首先找出所有语言中与所记录语言最匹配的句子，然后将该句子和所记录语言的匹配程度与一预先设定的阈值进行比较，如果超过该阈值，则该句子为识别结果，该句子所属的语言为当前记录语言的语言，如果少于该阈值，则提示使用者无法识别该段声音；

（4）、将原始语言信息转换成目标语言信息

（5）、播放目标语言信息