CN2755698Y - 口语仿真学习机 - Google Patents

口语仿真学习机 Download PDF

Info

Publication number
CN2755698Y
CN2755698Y CN 200420102510 CN200420102510U CN2755698Y CN 2755698 Y CN2755698 Y CN 2755698Y CN 200420102510 CN200420102510 CN 200420102510 CN 200420102510 U CN200420102510 U CN 200420102510U CN 2755698 Y CN2755698 Y CN 2755698Y
Authority
CN
China
Prior art keywords
microprocessor
utility
model
microphone
spoken
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN 200420102510
Other languages
English (en)
Inventor
聂鉴强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN 200420102510 priority Critical patent/CN2755698Y/zh
Application granted granted Critical
Publication of CN2755698Y publication Critical patent/CN2755698Y/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Abstract

一种口语仿真学习机,包括微处理器(1),与微处理器(1)连接的存储器(2)、液晶显示器(3)、输入键盘(4)、解码器(5)、模数转换器(6)、放大器(7)和耳机(8),其特征在于还包括与微处理器(1)连接的语音识别模块(9)和麦克风(10)。本实用新型提出的口语仿真学习机是一个模仿带有真人语音数据库的随身携带的学习工具,能够随机向学习者发问,一问一答实现人机语音对话,创造出与真人对话交流的氛围。

Description

口语仿真学习机
技术领域
本实用新型涉及一种视听语音设备,尤其指一种模仿真人对话的口语仿真学习机。
背景技术
磁带语音复读机是一种传统的学习机,它在英语学习过程中可以反复听某一个句子或某一个单词的录音,学习者跟随朗读,反复多次达到记忆的目的。这种复读机解决了反复听某一句录音而不需要“倒带”这样繁琐操作的问题,基本上可以让学习者方便地听录音。
近期市面上陆续出现一种“数码英语学习机”,这种学习机在保留磁带复读机跟读、比读等功能的基础上,重点强调超强复读,即可任意定义A、B两点进行复读。如市面上销售的“爱国者英语学习机”就属于这种学习机。还有一些产品在这种学习机的基础上设置麦克风插口,使用者可外接麦克风,将自己跟读的语音记录下来,然后放录音,学习者自己比对,调整发音。
以上两种学习机的重点是在“听”的概念上做文章,说的功能简单,听的内容只是机械的重复,使用者听几遍就没有兴趣再听下去,学习起来比较枯燥,缺乏现实语境中的听说训练。
实用新型内容
本实用新型的目的是要解决传统学习机功能单一、没有人机对话功能的技术问题,提出一种既能结合听说功能,又能模拟真人对话的口语仿真学习机。
一般英语学习的重点在于如何掌握丰富的词汇和在实际语言环境中的快速发挥训练,包括单词、语法、句型、语态、语调等的综合运用。本实用新型提出的口语仿真学习机是一个带有真人语音数据库的随身携带的学习工具,能够随机向学习者发问,一问一答实现人机语音对话,创造出与真人对话、交流的氛围,而这种氛围对词汇巩固和综合运用能力锻炼有着较好的效果。
本实用新型提出的口语仿真学习机包括:微处理器,存储器、液晶显示器、输入键盘、解码器、数模转换器、放大器、输出耳机,还包括与微处理器连接的语音识别模块和麦克风。所述的语音识别模块可以由解码器、模数转换器、微控制器组成,也可以采用语音识别引擎加模数转换器组成。
本实用新型能够模仿真人对话的场景和氛围,充分调动使用者的学习情绪,达到良好的学习效果。与传统的学习机相比,本实用新型具有如下优点:
1.人机单词对话,让学习者轻松进行词汇锤炼;
2.人机语句对话,让学习者身临其境在各种语言环境模块中游历;
3.对错误对话记录进行随机测验,更符合学习者的需要;
4.提高学习兴趣,从而带来良好的学习效果;
5.体积小,易于随身携带;
6.成本与现有的数码学习机相差不大,在价格上具有竞争优势。
附图说明
下面结合附图和具体实施例对本实用新型进行详细说明,其中:
图1是本实用新型的方框图;
图2是本实用新型第一实施例的方框图;
图3是本实用新型第一实施例的语音识别模块电路图;
图4是本实用新型第二实施例的方框图。
具体实施方式
如图1所示,本实用新型包括微处理器1,存储器2、液晶显示器3、输入键盘4、解码器5、数模转换器6、放大器7,输出耳机8,还包括与微处理器1连接的音识别模块9和输入麦克风10。存储器2可以采用大容量闪存、光盘或移动硬盘。显示器3采用LCD液晶显示器。语音识别模块9是本实用新型的重点,其作用是接受麦克风10的输入信号,并对其进行识别,微处理器1根据识别结果控制系统运行。
图2是本实用新型的一个实施例。在该实施例中,语音识别模块9由解码器11、模数转换器12、微控制器13组成。解码器11通过接口电路连接微处理器1,接受由其传来的数字语音信号,通过接口电路输出给微控制器13。而麦克风语音经模数转换器12转换后,通过接口电路输出给微控制器13。考虑成本因素,图中微控制器13可采用89C51芯片,由其对麦克风输入的语音和内存语音进行语音识别,最后将结果反馈给微处理器1,微处理器根据识别结果,控制系统运行。麦克风10的另一路语音直接送至耳机放大电路,作为输入监听。
本实用新型第一实施例的核心是对一句完整语音进行整体识别,譬如一个单词或者一句话的语音,因此需要将相关语音文件预先存入存储器2。
根据本实用新型功能需要,可以在某一时间段里通过液晶显示器3交替显示两个不同内容的文本,也可以加装另一块液晶显示器14,专门显示“提示文本”,如图2所示。
语音识别控制程序描述:在任一人机对话程序中,当某一单词或语句语音输出完毕,麦克风10的输入有效,当麦克风的语音输入出现时,微控制器13开始以一定的取样频率(调试选定)对来自麦克风10的语音信号和来自微处理器1从存储器2读取的内存语音信号进行比较,同时把总的取样次数进行计数,结果假设存于寄存器A,把取样中二者差值大于预定值(调试选定)的取样也进行计数,结果假设存于寄存器B,当麦克风的输入语音结束时,微控制器13停止取样,同时比较寄存器A和B中的数值,当比值位于预定值(调试选定)之内时,向微处理器1输出一个执行下一命令的信号,否则输出一个读取存储器中一个特定语音数据的信号,从耳机中输出,譬如“请再重复一遍!”的语音文件,同时计数器复位,寄存器清零。当麦克风的语音再次出现时,微控制器重复取样,直到能被识别的语音输入或者按键中断。
当用本实用新型第一实施例方案学习英文单词时,首先,微处理器1从外存2中随机或按照要求读出一个单词的中文(或英文)语音文件和文本文件,并分别送至解码器5和液晶器3,语音文件经处理后从耳机输出真人语音(即“问句”);语音信号输出完毕时,麦克风输入有效,系统等待麦克风的语音输入;当麦克风信号出现(信噪比调试选定)时,微控制器13同时接受微处理器1从外存中读出的该单词译文语音数据和来自麦克风语音数据,当语音输入结束时,向微处理器1反馈比较结果,根据结果,微处理器要么执行下一“提问”命令,要么读取一特定语音文件,并经耳机语音输出,譬如:“请再说一遍!”,以维持良好的对话氛围,这时微控制器13会等待再一次语音输入并执行,当然学习者可以随时按键中断;其中,在“问句”语音信号播放完毕后约三秒钟(给学习者一个思考的空间),微处理器1读出该单词译文文本文件,并送至液晶显示器14,如图2所示。液晶显示器14也可以通过微处理器1软件设计集成到液晶显示器3中。
当用本实用新型第一实施例方案学习语句对话时,首先,微处理器1从存储器2随机或按照要求读出(文件库)某语境块中某对话句组的“起始问句”的文本文件、语音文件,分别送至解码器5和液晶显示器3,语音文件经处理后从耳机中输出真人语音;语音信号输出完毕时,麦克风输入有效,系统等待麦克风的语音输入;当麦克风信号出现(信噪比调试选定)时,微控制器13同时接受微处理器1从外存中读出该语句的“回答语句”语音数据和来自麦克风语音数据,当语音输入结束时,向微处理器1反馈比较结果,根据结果,微处理器要么执行下一“提问”命令,要么读取一特定语音文件,并经耳机语音输出,譬如:“请再说一遍!”,以维持良好的对话氛围,这时微控制器13会等待再一次语音输入并执行,当然学习者可以随时按键中断;其中,在“问句”语音信号播放完毕后约三秒钟(给学习者一个思考的空间),微处理器1读出“回答语句”文本文件,并送至液晶显示器14。
图3是本实用新型第一实施例的语音识别模块电路图。该电路中微处理器1采用双口RAMCY7C133芯片、解码器11采用TMS320C32芯片、存储器2采用两片单口存储器61C256、微控制器13采用89C51芯片、模数转换器12用ADS7832。CY7C133是16位数据总线、11位地址总线的高速2K×16CMOS双端口静态RAM,解码器11通过它与微处理器1进行高速数据通信,微控制器13是模块的核心,是一片性价比较高的8位单片机。当检测到麦克风语音输入时,它通过控制总线的程序读(PSEN)信号线,控制模数转换器12的转换启动,以及控制微处理器1的“对话答句”语音文件的读取操作,位于两片两个结果61C256中的取样结果,在微控制器13的读取命令下,同时送至其PO口和P1口,并进行比较、识别,识别比较的过程如前所述的“控制程序描述”。
图4是本实用新型的第二个实施例,本方案的核心是对一句语音(一个单词或者一句话)进行关键词识别,因此,必须在存储器2中植入一个语音识别引擎,如IBM提供的语音识别引擎,即ASR(Automatic SpeechRecognization),又称语音识别系统。在该实施例中,语音识别模块9包括A/D模数转换器及相关的接口电路,麦克风的10的语音一路经模数转换器15送给微处理器1控制的语音识别引擎识别,另一路直接送至音频放大器7,作为输入监听。
语音识别程序描述:在人机对话程序中,当某一单词或语句语音输出完毕时,麦克风输入有效,系统等待麦克风语音输入;当麦克风语音输入出现时,微处理器1同时对从外存中读出该语句的“回答语句”语音数据和来自麦克风语音数据进行关键词识别,分别对识别的关键词数和不被识别的关键词数进行计数,当语音输入结束时,微控制器停止识别,同时比较两个计数结果,当比值位于预定值(调试选定)之内时,微处理器1则执行下一命令,否则输出一个读取存储器中一个特定语音数据的信号,从耳机中输出,譬如“请再重复一遍!”的语音文件,并从耳机语音输出,譬如“请再重复一遍!”的语句,同时计数器复位,寄存器清零。当麦克风的语音再次出现时,微处理器重复执行识别操作,直到识别通过或者按键中断。
本实用新型存储器2中的语音文件及文本文件库设计如下:
1、包括单词库和对话语句库,前者包含每个单词及释义的中英文文本数据和每个单词的中英文语音数据,后者包含每个语句中英文文本数据和语音数据。
2、文本数据采用PC机常用的文件系统管理,语音数据采用压缩格式的音频格式。
3、单词库和对话语句库可以针对不同水平的使用者进行等级分类,如初中水平、高中水平、大学四级水平、大学六级水平等。
4、对话语句库由若干个语言环境块组成,每个语言环境块由若干个对话语句组构成,一个定义的语言环境块可以包括若干个内容相关的对话句组,例如定义为高中英语水平的“机场接机”的语言环境块,可以包括这些对话句组:与出租车司机的对话(去机场),与咨询台小姐的对话(在机场),与客人间的对话(在出口),与客人的对话(在返程路上),与前台小姐的对话(在入住酒店)。当然,与客人间的对话,是与一个陌生人的对话,所以又可以逻辑组合到其他的语境块中;当然与出租车司机的对话句组又可以有不同的版本。
5、微处理器1会把每次按键中断的句子或单词分别记录下来,在一个小程序里,学习者可以接受机器再次反复的随机测验,每次测验时模块都给正确回答计数,当该单词或语句成功接受3次(可任意定义)回答后,系统自动将该单词或语句从错误记录里删除。
本实用新型存储器2中的本实用新型还可以集成其他功能,如复读、跟读、MP3播放器等功能,在遵循相关存储协议规范时,整个设备还可以作为个人电脑的一个大容量移动存储设备使用。

Claims (6)

1、一种口语仿真学习机,包括微处理器(1)、存储器(2)、液晶显示器(3)、按键面板(4)、解码器(5)、数模转换器(6)、放大器(7)、耳机(8),其特征在于,还包括语音识别模块(9)和麦克风(10)。
2、如权利要求1所述的口语仿真学习机,其特征在于:所述的语音识别模块(9)包括解码器(11),模数转换器(12)和微控制器(13)。
3、如权利要求1所述的口语仿真学习机,其特征在于:存储器(2)内嵌套有语音识别引擎,所述的语音识别模块(9)由与微处理(1)相连的模数转换器(15)组成。
4、如权利要求1所述的口语仿真学习机,其特征在于:麦克风(10)的信号除输出给语音识别模块(9)外,还输出给耳机监听电路。
5、如权利要求1所述的口语仿真学习机,其特征在于:还设有一个与微处理器(1)相连的,用于显示“回答提示文本”的液晶显示器(14)。
6、如权利要求1所述的口语仿真学习机,其特征在于:微处理器(1)设有一个通过通信线与个人电脑进行通信的接口。
CN 200420102510 2004-12-06 2004-12-06 口语仿真学习机 Expired - Fee Related CN2755698Y (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 200420102510 CN2755698Y (zh) 2004-12-06 2004-12-06 口语仿真学习机

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 200420102510 CN2755698Y (zh) 2004-12-06 2004-12-06 口语仿真学习机

Publications (1)

Publication Number Publication Date
CN2755698Y true CN2755698Y (zh) 2006-02-01

Family

ID=35929324

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 200420102510 Expired - Fee Related CN2755698Y (zh) 2004-12-06 2004-12-06 口语仿真学习机

Country Status (1)

Country Link
CN (1) CN2755698Y (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1952995B (zh) * 2005-10-18 2010-09-22 说宝堂信息科技(上海)有限公司 智能互动型语言练习装置及其方法
CN103310664A (zh) * 2013-05-15 2013-09-18 无锡北斗星通信息科技有限公司 多功能儿童对讲早教机
CN106898166A (zh) * 2017-03-30 2017-06-27 河南工学院 融入传统文化的外语学习系统及方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1952995B (zh) * 2005-10-18 2010-09-22 说宝堂信息科技(上海)有限公司 智能互动型语言练习装置及其方法
CN103310664A (zh) * 2013-05-15 2013-09-18 无锡北斗星通信息科技有限公司 多功能儿童对讲早教机
CN103310664B (zh) * 2013-05-15 2015-12-09 顾祥茂 多功能儿童对讲早教机
CN106898166A (zh) * 2017-03-30 2017-06-27 河南工学院 融入传统文化的外语学习系统及方法
CN106898166B (zh) * 2017-03-30 2020-06-30 河南工学院 融入传统文化的外语学习系统及方法

Similar Documents

Publication Publication Date Title
Cathcart et al. A shallow model of backchannel continuers in spoken dialogue
US8843372B1 (en) Natural conversational technology system and method
Batliner et al. Segmenting into adequate units for automatic recognition of emotion-related episodes: a speech-based approach
CN107211058A (zh) 基于会话动态的会议分段
CN107211061A (zh) 用于空间会议回放的优化虚拟场景布局
CN101577059A (zh) 支持多语种的语言学习系统
Schuppler et al. GRASS: the Graz corpus of Read And Spontaneous Speech.
CN103680262A (zh) 一种情景式词汇学习方法及其系统
CN108885869A (zh) 控制包含语音的音频数据的回放
Roy NewsComm--a hand-held device for interactive access to structured audio
CN101145283A (zh) 具有发音质量评价的嵌入式语言教学机
CN1794315A (zh) 语言学习系统
JP2003150041A (ja) ストーリー対話型文法教授システムおよび方法
CN2755698Y (zh) 口语仿真学习机
Zahner et al. Konstanz prosodically annotated infant-directed speech corpus (KIDS corpus)
CN1450446A (zh) 可携式电子装置的语言学习发音跟读系统及其方法
Viegas et al. Entheos: A multimodal dataset for studying enthusiasm
Ward et al. Data collection for the Similar Segments in Social Speech task
KR20230025708A (ko) 오디오 제시 인터렉션을 갖는 자동화된 어시스턴트
Barker A practical introduction to authoring for computer‐assisted instruction. Part 6: Interactive audio
CN1278206C (zh) 用于练习外语的方法和设备
Tsuchiya et al. Developing Corpus of Japanese Classroom Lecture Speech Contents.
CN111475708A (zh) 一种跟读内容的推送方法、介质、装置和计算设备
CN113870902B (zh) 一种语音交互毛绒玩具的情绪识别系统、装置及方法
US20110165541A1 (en) Reviewing a word in the playback of audio data

Legal Events

Date Code Title Description
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20060201

Termination date: 20100106