CN1362703A

CN1362703A - 线上语音互动系统及其实施方法

Info

Publication number: CN1362703A
Application number: CN01100608A
Authority: CN
Inventors: 郭子逢; 陈灿煜
Original assignee: SUHUO GLOBAL NETWORK CO Ltd
Current assignee: SUHUO GLOBAL NETWORK CO Ltd
Priority date: 2001-01-05
Filing date: 2001-01-05
Publication date: 2002-08-07

Abstract

本发明公开了一种线上语音互动系统及其实施方法,该线上语音互动系统利用网际网络实施语音互动模式,该线上语音互动系统包含:一远端服务系统和一用户系统,所述远端服务系统安装一服务引擎,所述用户系统设有语音界面设备,实现用户与服务系统之间的语音互动模式,该线上语音互动系统的实施方法可实现上述线上语音互动系统的运作。该线上语音互动系统及其实施方法具有利用网际网络资源使学员在线上进行语音互动学习。

Description

线上语音互动系统及其实施方法

本发明涉及一种语音互动系统，尤其涉及一种利用网际网络资源提供连线的用户系统进行语音对话的线上语音互动系统。

在传统的语言教材的学习系统中，学员是孤军奋斗的，学员的学习效果安全是决定于其自身的努力程度。学习这些语言教材的方式，不外乎听力训练、朗诵训练、播放影片等，当学员遇到学习上的问题时，也就只能自己解决或者写邮件到软件公司询问，即使可以这样，其前提也是软件公司有提供问与答(Q&A)的服务，即便如此，信件的往返时间也使学员的学习效率大打折扣。

现有的语言学习教材，为提供多样、大量的学习资料，所以一般将教材资料库烧录于光碟片中，学员必须先购买语言教学光碟片，再安装到个人电脑中，如图1所示，通过电脑10的多媒体元件，如扬声器101或麦克风102等来使语言教材提供更多样化的互动学习环境。

这类语言教材的执行需原版光碟1，而且使用方式属于单机版光碟式学习；因此，学员走到那里原版光碟片1需带到那里，其次，光碟片的安装仅将执行程序或应用软件安装(setup)到个人电脑，教材课程内容资料库是烧录于光碟片中；因此，在学习过程中，学员所学的课程仅局限于光碟中的资料库提供的课程内容，无法改变；而且过于偏重于听力及字汇的训练，沉重而单调的教学方式再加上一成不变的课程内容往往让学员很快就失去了兴趣，倘若学员需要不同的训练教材时，则需再购买课程资料库的光碟，增加费用上的负担。所以，这种语言教材的学习因这样固定内容的资料库而不具有足够弹性，让学员有选择学习课程。

现在主要语音辩识引擎(Speech Recognition Engine，SRE)有IBM语音辩识版本、Microsoft语音辩识版本、L&H语音辩识版本等。所以，语音辩识技术已实现产品化，且成为一成熟技术。在在现有的学习方式中，结合语音辩识功能的语言教材虽有提供互动式对话模式的学习环境，但教材使用的方式仍停留在单机版光碟式学习，无法提升为利用网际网络资源(InternetResource)的线上互动式学习(On-Line Interacting Learning)。随着信号网络时代的来临，网络的应用更是无穷无尽，但这一现有技术所需克服的瓶颈将是如何在即时(Real-time)环境中于网际网络上来大量传输学员的语音资料到远端的服务系统，完成语音辩识的互动对话方式。

本发明的目的是提供一线上语音互动系统及其实施方法，其具有可利用网际网络资源使学员在线上撷取学习内容，在没有时间与空间障碍的情况下进行线上语音互动学习；可支持线上语音辩识处理技术，实施线上语音互动交谈；可利用网际网络资源，而由远端服务系统提供线上资料库，配合实施语音练习/对话的语音互动环境平台。

为实现上述目的，本发明提供的技术方案为：

1、一种线上语音互动系统，其中该线上语音互动系统利用网际网络实施语音互动模式，该线上语音互动系统包含：一远端服务系统和一用户系统，所述远端服务系统安装一服务引擎，该远端服务系统具有一资料库，该服务引擎处理网际网络上提供的网页资料与所述资料库的内容；所述用户系统设有语音界面设备，并在该语音界面设备作业环境安装一信号撷取界面、一客户端引擎和一语音辩识引擎，该语音辩识引擎处理该语音界面设备接收的语音；所述语音互动模式为远端服务系统与用户系统的间的语音互动模式，由所述信号撷取界面显示所述资料库的内容并指示发音项目，而所述客户端引擎接收发音项目并传给所述语音辩识引擎，该语音辩识引擎接收到语音与发音项目后进行语音对比辩识，该语音辩识引擎将对比辩识结果回传给客户端引擎，其结果由该信号撷取界面显示，该信号撷取界面并将该对比辩识结果信号回传给服务引擎，该服务引擎接收并记录该对比辩识结果信号，完成该语音互动模式。

所述用户系统为个人电脑、PDA、WAP手机或其他类似具有连线上网的作业环境的系统。

所述作业环境可为Windows或Unix或Mac或可实施网际网络的信号撷取界面的作业系统。

所述信号撷取界面为浏览器。

所述发音项目为一个句子或一个单字。

所述语音辩识引擎包含将所述发音项目转换为与所述接收的语音可辩识对比的资料。

所述客户端引擎为通过HTML或DHTML或XML或Java Script或JavaApplet或VB Script或Virtual C++或Virtual B或ActiveX或类似的程序语言实现。

所述客户端引擎包含一流程引擎和一转换界面，所述流程引擎控制所述语音互动模式的进行；所述转换界面转换该发音项目，使该发音项目转换为该语音辩识引擎可接收的资料格式。

所述转换界面由Java Applet程序语言来实现。

所述转换界面还包含一语音辩识界面。

所述转换界面包含第一界面和第二界面，该第一界面处理所述信号撷取界面上网站应用的资料；该第二界面处理工作平台的资料。

所述语音辩识引擎可实施中文或英文语音辩识，或者其他语言的语音辩识。

所述流程引擎通过所述转换界面接收到语音与转换发音项目以及正确语音的辩识结果，该流程引擎根据该辩识结果控制所述语音互动模式的进行，并将所述语音互动模式的记录回传给所述服务引擎，该服务引擎将该语音互动模式的记录储存于所述资料库中。

所述网际网络包括有线通讯网络或无线通讯网络或包含有线与无线通讯资源所组成的网络。

2、一种实现上述线上语音互动系统的实施方法，该线上语音互动系统的实施方法控制在网际网络上实施语音互动系统的流程，该线上语音互动系统的实施方法包含：在一远端服务系统中提供一服务引擎，该服务引擎提供网页资料与发音项目的内容；在一用户系统的多媒体作业环境中提供一执行程序，该执行程序包含：信号撷取界面，该信号撷取界面从网际网络上撷取网页信号与所述发音项目的内容；语音辩识界面，该语音辩识界面辩识有关所述发音项目的资料，与多媒体的输入语音；以及客户端程序，该客户端程序提供有关所述发音项目的资料给所述语音辩识程序，并根据所述语音辩识程序的辩识结果控制所述线上语音互动系统流程的进行，且将所述线上语音互动系统流程的辩识记录回传所述远端服务系统的服务引擎。

所述客户端程序包含将所述发音项目转换为所述语音辩识程序所需的资料。

所述客户端程序包含控制所述线上语音互动系统流程进行的所述发音项目的内容。

所述在用户系统的多媒体作业环境中的执行程序还包含：设定一辩识率，所述客户端程序根据该辩识率判断辩识结果是否满足该设定的辩识率，并根据该辩识结果控制该线上语音互动系统流程的进行。

所述在用户系统的多媒体作业环境中执行的程序还包含：设定所述线上语音互动系统流程的角色扮演，所述客户端程序根据该角色扮演决定该语音辩识程序所要提供的辩识发音项目。

本发明提供的线上语音互动系统与实施方法可使连接在网际网络上的用户系统(Client system)从一远端服务系统的线上资料库中选择实施线上语音互动对话模式，该用户系统安装有信号撷取界面(InformationAccesslnterface)且提供多媒体环境，并在用户系统的作业环境中进一步安装包含流程引擎与转换界面两部分内容的客户端引擎和语音辩识引擎SRE，使得上网的学员通过该用户系统从远端服务系统所提供的网页(Web Page)上选择课程内容、角度扮演等选项(Item)，进而在本发明的线上语音互动系统的运行模式与线上责料库连结机制下，让该学员能在网际网络线上撷取学习内容就能进行即时语音辩识的互动对话。远端服务系统安装一服务引擎(ServerEngine，SE)可接收用户系统通过网际网络所提出的需求(Request)，所需信号的网页，以及其线上资料库的课程内容，并且与该用户系统配合实施线上语音互动系统的运行模式，回应学员的语音即时辩识，并做出对应的记录程序。

下面结合附图和实施例对本发明作进一步详细的描述：

图1为习知技术以教材资料库的光碟片安装在单机个人电脑上实施语言学习统的示意图；

图2为本发明提供的线上语音互动系统的系统方块图；

图3为本发明提供的线上语音互动系统的运作示意图；

图4是本发明提供的线上语音互动系统模式架构图；

图5为本发明提供的线上语音互动系统一种实施例的模式架构图；

图6为图5所示的模式架构图的实施互动模式的流程图。

下面将参阅本发明提供的附图和实施例对本发明进行充份地描述，但在具体描述之前，先对与本发明有关的背景技术进行一下延伸描述。这些内容对有娴熟经验及知识的技术人员来说可以跳过、浏览甚至不读，但这些内容对掌握本发明的的技术确有很大裨益，建议应加以详读。

①、网际网络资源：

大量的电脑与电脑网络通过通讯联结的机制互相联系组成了网际网络(Internet)，电脑间的通讯可包含无线通讯网络或有线通讯网络，而彼此间可利用各种工具来交换信号，例如电子邮件、Gopher、WWW(World Wide Web)。WWW允许服务系统(网络服务器或网站)传递文字、图形、网页等信号到终端用户电脑系统(用户端，例如：个人电脑、PDA、或WAP手机)，网际网络上的每一端(例如电脑、网页)都有一唯一的对应地址(Uniform ResourceLocator，URL)，用户端电脑系统可以通过在其作业系统中安装一信号撷取界面来撷取网际网络上所传递的信号，该信号撷取界面可指定网页地址(URL)来浏览网页信号。当所指定的网站接收到用户端的指令时，即将该网页传送到用户端电脑系统中的信号撷取界面，当用户端接受到该网页后，便可在该信号撷取界面上进行浏览。信号撷取界面一般是指浏览器软件，是一种应用程序，用以回应网页要求和显示网页，例如：Microsoft Internet Explorer或Netscape Communicator。

按一般的定义，网页必需是HTML(HyperText Markup Language)制作的。HTML提供一个网页显示的标准格式。当用户端指示浏览器显示网页时，浏览器会传递指令到服务端，服务端即会传送HTML格式的文件到用户端。当用户端系统接收到HTML文件时，浏览器会按照HTML格式显示网页。HTML文件可包含文字、图或是其它组成信号。当然HTML文件也可能包含其它服务器的地址。

WWW特别有助于电子商务的实现，产品可以通过WWW广告进行销售。网络上的产品包括通过电子形式传送方式传送到销费者手中的产品(例如，音乐)，或通过传统通路(例如，一般的货运)，传送到销费者手上的产品(例如，书)。在网际网络中，服务端可以提供电子形式，提供目录供使用者(销费者)在浏览器上浏览选购，当使用者选购完商品后，服务端电脑会提示使用者的订购信号。使用者的订购信号包括了销费者姓名、销费者信用卡卡号及商品寄送地点等。接着服务电脑会通过传送一确认网页到用户端来确认订购的商品及寄送的时间。

②物件程序语言：

Java/Java Applet

根据Sun Microsystems的说法：Java是一种简单、稳定、物件导向、跨平台、多执行线、功能强大、用途广泛的程序开发环境，也就是说，Java可用于开发应用在网际网络、企业网络(Internet)及其他复杂的分散性网络上的执行软件或applet。

JavaScript

JavaScript是由Netscape与Sun Microsystems合作开发的，用于HTML文件，JavaScript是一种容易使用、开发、并且跨平台的直述式程序语言。其最大功能在于降低网络流量，使很多工作都能尽量在用户端的电脑执行，让服务端的服务器降低工作负荷。

以下将进一步详细描述说明本发明提供的线上语音互动系统。

如图1和图2所示，利用有线通讯或无线通讯组成网际网络资源4，学员通过一连线上网的用户系统10实施线上语言练习/对话的平台，该用户系统10具有多媒体环境，安装一信号撷取界面11，使用户系统10可接收及显示网际网络上所撷取的信号，如网页信号等，而多媒体环境是指用户系统10所配备的周边设备需要包含有语音界面设备，例如：包含扬声器101或耳机以及麦克风102等，并且其信号处理的计算能力应该支援语音处理的运算。在用户系统10的作业环境中需要进一步安装一客户端引擎13以及一语音辩识引擎SRE12，以便实施线上语音互动系统的运行模式，处理语音即时辩识。在本发明提供的线上语音互动系统的实施例中，用户系统10可为个人电脑、PDA、WAP手机或其他类似的可连线上网的作业系统，其作业环境可为windows、Unix、Mac或可实施网际网络的信号撷取界面的作业系统(OperatlonSystem)。

远端服务系统20包含一服务引擎SE22、各种网页21以及一线上资料库23，该服务引擎SE22可接收用户系统10经网际网络4所提出的要求(Request)，例如以HTTP方式所执行的要求，该HTTP要求取得由URL所指定的网页21，而服务引擎SE22将该指定的网页21提供给用户系统10。该线上资料库23则储存有关各网页21所提供的资料以线上语言学习的各种课程内容。

在本发明提供的线上语音互动系统的实施例中，其运行模式为：服务引擎SE22在线上资料库23中取出含有学员所选择的课程资料的网页放在课程网页21中，该课程网页21由用户系统10的信号撷取界面11取得，再通过该信号撷取界面11的程序与客户端引擎13以及与语音辩识引挚SRE12互动联系，使学员在用户系统10的多媒体环境中，按照网页所显示的课程内容中的句子或词汇进行语音练习，客户端引擎13将学员所念的句子或单字传送到语音辩识引擎SRE12，该语音辩识引擎SRE12会将输入的句子或单字转换并做为语音辩识的对比标的，与从语音界面设备转换并存储的语音作辩识对比，将其辩识结果回传给客户端引擎13。客户端引擎13控制线上语音互动系统的运行模式的流程，必要时再将包含辩识结果的信号通过网际网络4传送出去，使远端服务系统20的服务引擎SE22得知互动结果，并在线上提供对应的讯息，例如，通过课程网页21回应信息给学员，让学员知道自己发音的正确程度，辨别自己发音是否正确，如果其辩识结果低于设定的辩识率，用户系统10将通过多媒体环境自动插放正确的发音。

在本发明提供的线上语音互动系统中实施线上语音互动系统的实施方法，该线上语音互动系统的实施方法可控制该线上语音互动系统在网际网络上的互动流程，该线上语音互动系统的实施方法包含：在一远端服务系统中提供一服务引擎，该服务引擎提供网页资料与发音项目的内容；在一用户系统的多媒体作业环境中提供一执行程序，该执行程序包含：信号撷取界面，该信号撷取界面从网际网络上撷取网页信号与所述发音项目的内容；语音辩识界面，该语音辩识界面辩识有关所述发音项目的资料，与多媒体的输入语音；以及客户端程序，该客户端程序提供有关所述发音项目的资料给所述语音辩识程序，并根据所述语音辩识程序的辩识结果控制所述线上语音互动系统流程的进行，且将所述线上语音互动系统流程的辩识记录回传所述远端服务系统的服务引擎。

如图2和图3所示：在本发明提供的线上语音互动系统的实施方法的实施例中，以个人电脑实施用户系统10，用浏览器实施信号撷取界面11，当学员在具有多媒体环境的用户系统10的浏览器11上指定远端服务系统20的课程网页21的地址时，浏览器11会将学员所提出的要求传送到网际网络4上，当该指定的远端服务系统20的服务引擎SE22接收到该学员的要求时，即回传该指定课程网页21的首页(其中的信号包括加入会员、学习精灵、谈天室、新手上路、会员登入、电子邮件及课程种类等)到用户系统10浏览器11上。学员通过浏览器11可看到课程网页21的首页，并在该首页所提供的选项上，学员可点选远端服务系统20所提供的各项课程种类(例如，英语课程、日语课程等)，每一课程种类选项下，都包含多项课程(例如英语课程种类下有每日一句、发音课程、英文小技巧、开口说、实用对话等)，学员可按照个人的喜好点选课程，则远端服务系统20便从线上资料库23提取对应的课程内容。

假设学员点选英语课程中的“实用对话”这个选项来作线上语音互动课程，用户系统10将该要求传送到远端服务系统20，远端服务系统20的服务引擎SE22接收到该要求后，即回传所对应的学习网页21以及课程内容到用户系统10，学员在浏览器11上可看到“实用对话”项下所包含的课程内容(例如，商用英文、观光英文、娱乐英交、留学生英文、紧急情况用英文等)，而这些课程内容将可由线上资料库23来提供。

例如：当学员点选“商用英文”为线上互动学习的课程后，该要求传出，对应网页21执行并回传后，学员可在浏览器11上看到该课程的详细选项，详细选项共分为三级，初级课程、中级课程及高级课程；每一等级课程分别包含多项课程，每一课程都包含一课程代码。当学员点选其中任一课程后，用户系统10将该课程代码回传到远端服务系统20，该远端服务系统20的服务引擎SE22即按照该代码到线上资料库23上找出所对应的课程内容，并回传到用户系统10。

在本发明提供的线上语音互动系统的实施方法的实施例中，对话课程教学是以角色扮演的方式来执行线上互动对话机制，学员首先选取所想扮演的角色，以便和虚拟老师进行对话，其中所谓的虚拟老师是指利用用户系统10的多媒体环境配合该用户系统10中的语音辩识引擎SER12，模拟与学员对话；接着学员再选择所要求的辩识率(辩识率越高，辩识程度越严格)。待所要扮演的角色和辩识率都选择完成后，便可开始角色扮演的课程了。角色扮演的方式是学员按照步骤和次序通过麦克风102念出课程内容的句子，而虚拟老师的声音则是通过扬声器或耳机101传到学员耳中。待学员念完一段句子后，客户端引擎13将对应的句子送入语音辩识引擎SER12，该语音辩识引擎SER12将转换句子正确存储语音与接收到的学员语音作线上语音辩识对比，如果对比辩识结果达到学员所设定的辩识率，客户端引擎13就会继续进行下一句对话。如果辩识率没有达到学员所设定的辩识率，或者学员的声音输入不太清楚(如：有杂音等)，客户端引擎13会要求学员再念一遍，学员一共有三次机会可以修正发音，超过三次辩识不过以后，客户端引擎13会自动播放该句子的正确发音，供学员参考。通过如此不断的发音及辩识纠正，学员可以收到发音练习的功效。

在本发明提供的语音互动系统的实施方法的实施例中，学员也可以会员登入的方式进入系统，当学员以会员登入方式进入系统后，系统会按照据学员的登入名称记录每次上课的内容，并存储在线上资料库23中，待下次学员再次登入该系统时，系统会根据线上资料库23的记录自动回传显示学员最后一次上课的课程，如此，学员可免去记忆上次上课的课程位置的困扰。

如图4所示：线上语音互动系统的核心为用户系统10中的客户端引擎13和语音辩识引擎SRE12。客户端引擎13包含一流程引擎131与一转换界面132，其中流程引擎131控制线上语音互动系统的进行，该线上语音互动系统通过信号撷取界面11可获得学员语音输入的发音项目内容，即句子或单字，并经过转换界面132转换成语音辩识引擎SRE12可接收的资料格式，传送到语音辩识引擎SRE12。该语音辩识引擎SRE12将接收的资料转换并存储，做为该输入语音的对比标的，再与从语音界面设备所输入的语音作辩识对比，将其辩识结果回传给流程引擎131。流程引擎131根据该辩识结果控制学员进行语音互动的对话程序，若学员输入的语音信号符合该输入语音的正确发音信号，则继续对话程序；若学员数次发音都未达该输入语音的正确发音信号的标准，即语音辩识引擎SRE12的辩识结果都低于要求的辩识率，流程引擎131便呼叫语音辩识引擎SRE12从语音界面设备播放该输入语音的正确发音信号。其次，该流程引擎131可将学员进行语音互动的对话状况进一步回传到服务引擎22，以记录在线上资料库23中，例如，学员所下载的学习课程内容有哪些与互动对话中辩识率的结果等，提供一标准，使学员得知自己的进步程度。

在本发明提供的线上语音互动系统的实施方法的实施例中，客户端引擎13可应用不同的程序语言来实施，这些程序语言包括HTML、DHTML、XML、Javascript、Java Applet、VB Script、Virtual C++、Virtual B、ActiveX或类似的程序语言等，使用户系统10的作业环境能够执行流程引擎131的程序与转换界面132的程序。

在本发明的线上语音互动系统的实施方法的实施例中，以浏览器实施信号撷取界面11为例，并以HTML、Java等程序语言来实现客户端引擎13，对于熟习Java等程序应用的人士来说，将很容易理解本发明提供的该种实施方式的运作。如图5所示：在本发明提供实施例中，浏览器11’回应网页要求并将信号显示在网页上，用户网站应用(Client web AP)111为一组应用程序集合，可从浏览器11’上取得网页的信号，例如：从服务引擎22上下载互动对话课程内容的句子或单字，或使用者在网页所输入的信号。在用户系统10的作业环境中，客户端引擎13的流程引擎131的程序由程序语言来执行，其接收学员语音输入的发音项目内容并将该项内容交给由Java Applet物件程序所实现的转换界面132进行处理，其结果与语音辩识引擎SRE12相对比，辩识结果通过用户网站应用111的显示浏览器11’进行显示，并将学员进行语音互动对话的状况回传到服务引擎22，记录在线上资料库23中。

利用Java Applet物件程序实现的Java AP界面132’包含网站应用界面(Web AP Interface)1321与跨平台界面(Cross Platform Interface)1322，分别做为网站应用的资料处理界面与工作平台的资料处理界面，由于利用Java程序语言来实现转换界面，所以客户端引擎13可进一步实现一原生码(Native Code)1323，以配合跨平台界面1322组原生码界面(Native Codelnterface)。在该实施例中，客户端引擎13的转换界面132还包含语音辩识界面1324，该语音辩识界面1324将资料转换成语音辩识引擎SRE12可接收的资料格式。而在其他实施方式中，若用Microsoft所提供的ActiveX程序语言来实现转换界面132，则语音辩识界面1324将可被整合在一起。

在本发明提供的该种线上语音互动系统的实施方法的实施例中，以Java等程序语言来实现客户端引擎13所执行的程序，可获得跨越工作平台(任何技术与平台都可使用)运行，以及网络安全性较高的优点，而且使本发明的线上语音互动系统的运行模式在不同作业环境中实现，使该线上语音互动系统降低开发成本和操作难度。

语音辩识引擘12可由先前所述的IBM语音辩识版本、L&H语音辩识版本等技术实施；当学员开始进入线上语音互动系统的运行模式后，学员可通过麦克风102念出网页中课程内容的句子或单字，流程引擎131通过转换界面132将对应的句子或单字送入语音辩识引擎12，经过语音辩识引擎12转换成语音辩识的对比标的，与学员语音输入进行辩识对比处理。其中，语音辩识引擎12可根据所应用的语言是中文、英文或其他语言而选择线上语音互动系统的运行模式，分别实施中文、英文或其他语言的语音辩识。

语音辩识引擎12通过Java Applet实现的转换界面13将辩识结果回传给流程引擎131，并由该流程引擎131控制学员在线上语音互动系统的对话程序。倘若辩识结果的辩识率未超过先前设定的辩识率，则流程引擎131会呼叫语音辩识引擎12再通过媒体环境播放正确的发音，供学员比较学习

本发明提供的该种线上语音互动系统的实施方法的实施例中，学员可从课程网页21上得知语音互动对话的结果，其中该线上语音互动系统的运行模式在用户系统10中完成语音辩识的处理且回传学员，并将语音互动对话的的结果记录到服务引擎22上，使得远端服务系统20与用户系统10之间大幅减少传递有关语音互动的资料，并使远端服务系统20的线上资料库23能够完整地记录学员的学习过程。

如图5和图6所示：图6为图5所示的模式架构图的实施互动模式的流程图。在本发明提供的该种线上语音互动系统的实施方法的实施例中，首先程序30中，学员先通过课程网页21完成课程内容选择、角色扮演以及辩识率等设置后，再完成线上语音互动系统的运行模式的设定，学员便可以开始进行线上音互动练习；程序31是在课程网页21上指示第一次对话练习的句子或单字；在紧接着程序32到37中，在客户端引擎13所实施的连结机制中，流程引擎131将发音项目所对应的句子或单字传给语音辩识引擎12，该语音辩识引擎12是由Java Applet物件程序所实现的，Java AP界面132’与语音辩识面1324，获得辩识结果，通过流程引擎131决定是否再过用户网站应用111在课程网页21在线上回应学员再发音练习或进行下一句子或单字的对话练习；倘若在预设的对话次数中，学员发音的辩识结果都未超过选择的辩识率，则程序38中流程引擎131会呼叫语音辩识引擎12通过多媒体环境播放正确的发音；而在程序39中决定对话练习是否结束；当决定为“是”时，则程序41进行到一下个课文句子或单字的第一次对话练习；当决定为“否”时，则由程序40结束角色扮演的语音互动模式。

在详细说明本发明的较佳实施例后，熟悉该项技术人士能够清楚的了解到：如果对该发明提供的技术方案进行各种变化与改变，也可实施上述技术内容，例如：以不同的程序语言来实现客户端引擎13，一样能够达到本发明的功能(Function)与功效(Result)。本发明虽己揭了本技术方案的实施方式，但并非用以限定本发明，任何熟悉该项技术的人员，在不脱离本发明的精神和范围内，如若对本发明作各种更动或修饰，仍属本发明的保护范围。

Claims

1、一种线上语音互动系统，其特征在于：该线上语音互动系统利用网际网络实施语音互动模式，该线上语音互动系统包含：一远端服务系统和一用户系统，所述远端服务系统安装一服务引擎，该远端服务系统具有一资料库，该服务引擎处理网际网络上提供的网页资料与所述资料库的内容；所述用户系统设有语音界面设备，并在该语音界面设备作业环境安装一信号撷取界面、一客户端引擎和一语音辩识引擎，该语音辩识引擎处理该语音界面设备接收的语音；所述语音互动模式为远端服务系统与用户系统的间的语音互动模式，由所述信号撷取界面显示所述资料库的内容并指示发音项目，而所述客户端引擎接收发音项目并传给所述语音辩识引擎，该语音辩识引擎接收到语音与发音项目后进行语音对比辩识，该语音辩识引擎将对比辩识结果回传给客户端引擎，其结果由该信号撷取界面显示，该信号撷取界面并将该对比辩识结果信号回传给服务引擎，该服务引擎接收并记录该对比辩识结果信号，完成该语音互动模式。

2、如权利要求1所述的线上语音互动系统，其特征在于：所述用户系统为个人电脑、PDA、WAP手机或其他类似具有连线上网的作业环境的系统。

3、如权利要求2所述的线上语音互动系统，其特征在于：所述作业环境可为Windows或Unix或Mac或可实施网际网络的信号撷取界面的作业系统。

4、如权利要求1所述的线上语音互动系统，其特征在于：所述信号撷取界面为浏览器。

5、如权利要求1所述的线上语音互动系统，其特征在于：所述发音项目为一个句子或一个单字。

6、如权利要求1所述的线上语音互动系统，其特征在于：所述语音辩识引擎包含将所述发音项目转换为与所述接收的语音可辩识对比的资料。

7、如权利要求1所述的线上语音互动系统，其特征在于：所述客户端引擎为通过HTML或DHTML或XML或Java Script或Java Applet或VB Script或Virtual C++或Virtual B或ActiveX或类似的程序语言实现。

8、如权利要求1所述的线上语音互动系统，其特征在于：所述客户端引擎包含一流程引擎和一转换界面，所述流程引擎控制所述语音互动模式的进行；所述转换界面转换该发音项目，使该发音项目转换为该语音辩识引擎可接收的资料格式。

9、如权利要求8所述的线上语音互动系统，其特征在于：所述转换界面由Java Applet程序语言来实现。

10、如权利要求8所述的线上语音互动系统，其特征在于：所述转换界面还包含一语音辩识界面。

11、如权利要求8所述的线上语音互动系统，其特征在于：所述转换界面包含第一界面和第二界面，该第一界面处理所述信号撷取界面上网站应用的资料；该第二界面处理工作平台的资料。

12、如权利要求1所述的线上语音互动系统，其特征在于：所述语音辩识引擎可实施中文或英文语音辩识，或者其他语言的语音辩识。

13、如权利要求8所述的线上语音互动系统，其特征在于：所述流程引擎通过所述转换界面接收到语音与转换发音项目以及正确语音的辩识结果，该流程引擎根据该辩识结果控制所述语音互动模式的进行，并将所述语音互动模式的记录回传给所述服务引擎，该服务引擎将该语音互动模式的记录储存于所述资料库中。

14、如权利要求1所述的线上语音互动系统，其特征在于：所述网际网络包括有线通讯网络或无线通讯网络或包含有线与无线通讯资源所组成的网络。

15、一种实现上述线上语音互动系统的实施方法，其特征在于：该线上语音互动系统的实施方法控制在网际网络上实施语音互动系统的流程，该线上语音互动系统的实施方法包含：在一远端服务系统中提供一服务引擎，该远端服务引擎提供网页资料与发音项目的内容；在一用户系统的多媒体作业环境中提供一执行程序，该执行程序包含：信号撷取界面，该信号撷取界面从网际网络上撷取网页信号与所述发音项目的内容；语音辩识界面，该语音辩识界面辩识有关所述发音项目的资料，与多媒体的输入语音；以及客户端程序，该客户端程序提供有关所述发音项目的资料给所述语音辩识程序，并根据所述语音辩识程序的辩识结果控制所述线上语音互动系统流程的进行，且将所述线上语音互动系统流程的辩识记录回传所述远端服务系统的服务引擎。

16、如权利要求15所述的线上语音互动系统，其特征在于：所述客户端程序包含将所述发音项目转换为所述语音辩识程序所需的资料。

17、如权利要求15所述的线上语音互动系统，其特征在于：所述客户端程序包含控制所述线上语音互动系统流程运行的发音项目的程序内容。

18、如权利要求15所述的线上语音互动系统，其特征在于：所述在用户系统的多媒体作业环境中的执行程序还包含：设定一辩识率，所述客户端程序根据该辩识率判断辩识结果是否满足该辩识率，并根据该辩识结果控制该线上语音互动系统流程的进行。

19、如权利要求15所述的线上语音互动系统，其特征在于：所述在用户系统的多媒体作业环境中执行的程序还包含：设定所述线上语音互动系统流程的角色扮演，所述客户端程序根据该角色扮演决定该语音辩识程序所要提供的辩识发音项目。