CN1886768A - 基于使用问答功能的语料检索系统的语言教育系统、方法和程序记录介质 - Google Patents

基于使用问答功能的语料检索系统的语言教育系统、方法和程序记录介质 Download PDF

Info

Publication number
CN1886768A
CN1886768A CNA200480030468XA CN200480030468A CN1886768A CN 1886768 A CN1886768 A CN 1886768A CN A200480030468X A CNA200480030468X A CN A200480030468XA CN 200480030468 A CN200480030468 A CN 200480030468A CN 1886768 A CN1886768 A CN 1886768A
Authority
CN
China
Prior art keywords
data
language
dialogue
subscriber unit
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA200480030468XA
Other languages
English (en)
Inventor
慎汉振
慎汉佑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Publication of CN1886768A publication Critical patent/CN1886768A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/20Education
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B19/00Teaching not covered by other main groups of this subclass
    • G09B19/06Foreign languages
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/313Selection or weighting of terms for indexing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • G06F40/35Discourse or dialogue representation
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B5/00Electrically-operated educational appliances
    • G09B5/06Electrically-operated educational appliances with both visual and audible presentation of the material to be studied

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Educational Technology (AREA)
  • Educational Administration (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Tourism & Hospitality (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Electrically Operated Instructional Devices (AREA)

Abstract

本发明公开的是一种具有问答功能的语料检索语言教育系统,其包括:信息提供单元,它将对话数据和语句数据分解为文本数据、音频数据和视频数据,存储每种分解的数据于语言数据存储部分作为语料数据,从语言数据存储部分提取对应于使用者输入的问题文本数据的语言数据并通过网络按照预先决定的教育顺序输出提取的数据;及订户单元,它通过网络发送问题文本数据到信息提供单元并通过网页浏览器或扬声器输出从信息提供单元接收的语言数据。当使用者输入有助于与说本国语的人交流的对话或短语的问题文本数据时,信息提供单元迅速地提取需要的语言数据(包括文本数据、音频数据和视频数据)作为使用者问题数据的答案。语言数据可以被存储于单独的存储设备,因此使用者可以构成一个最适合他或她的需要和能力的语言学习资源。

Description

基于使用问答功能的语料检索系统的语言教育系统、方法和程序记录 介质
技术领域
本发明涉及一种能够在互联网上即时搜索用于与说本国语的人交流该国语言的情景对话、语句或语法的语言学习系统,特别地,涉及一种能够通过互联网或多媒体为外语学习者提供所需的语言数据并使得该学习者能够使用语言学习系统按照自身能力管理和学习获得的语言数据的语言教育系统和方法,以及一种语言教育程序记录介质。
背景技术
随着无线互联网技术的迅速发展,各种实时语言学习的内容和途径可以通过互联网或无限网络而获得。
然而,大多数互联网语言教育是由教育服务提供者单向地提供给学习者,这种方式对学习语言来说并不十分有效。并且,绝大多数教科书的内容都一样或相近,不能满足学习者的即时需要。互联网语言教育和教科书在满足学习者希望在真实的交流情况下即时获得语言数据方面极其有限。
虽然对有效地学习一种外语的方法有各种建议(例如,记住整句,使用不同速度说和用准确的发音大声朗读),但是它们都不能即时解决外语口语问题。学习者也感到很难保持需要全身心投入的必不可少的动力。学习者真正需要的是能够在真实的交流情况下即时解决问题和获得最适合个人需要的语言数据。考虑到这种需要,传统的语言学习或教育方法是不成功的,甚至在激发学习者学习外语的热情方面是失败的。
发明内容
因此,本发明是用于解决上述出现在现有技术中的问题,本发明的目的是提供一种系统和方法,当使用者输入问题时,该系统和方法能基于有关的各种情景对话和语句的语言数据提供最适当的答案。
本发明的另一目的是提供一种系统和方法,其能够分别管理根据使用者个人学习环境,例如职业、学习能力、地点和学习语言的目的等,而选择的语言数据,并且提供在个人学习环境下各种个性化的语言学习工具和方法。
本发明还有一个目的是提供一种系统和方法,当使用者输入问题时,该系统和方法能通过搜索语言素材数据库和语料数据而提取适当答案,并且把答案保存在有线或无线互联网网络终端(例如PC,移动电话或PDA)和传统的记录介质(例如CD,磁带或书本)。
为完成上述目的,本发明提供了一种具有订户单元和信息提供单元的语言教育系统,其能够通过有线或无线网络终端接收和传送用于语言学习的数据,该系统包括:语言数据存储部分,其用于存储有助于与说本国语的人交流的各种情景对话和语句的文本数据和音频/视频数据;检测器,其用于分析订户单元通过网络输入的请求数据并提取对应该请求数据的语言数据;传输控制部分,其用于控制将检测器提取的语言数据通过网络传输给订户单元;及语言数据控制部分,其用于通过网络接收语言数据并控制该接收的用于各种语言学习的方法和多媒体工具的语言数据的输出。
依据本发明的另一方面,语言教育系统进一步包括会员数据存储部分,其用于存储从订户单元通过网络接收的会员信息,以及将传输已提取的语言数据给订户单元时所必需的身份识别信息提供给传输控制部分。
依据本发明的另一方面,语言教育系统进一步还包括:分别存储提取自语言数据存储部分的对话数据和语句数据的对话数据缓存器和语句数据缓存器;用于存储与对话数据和语句数据有关的音频/视频数据的AV数据缓存器;用于分别存储由订户单元的使用者输入的文本数据和音频数据的文本接收缓存器和音频接收缓存器。
依据本发明的另一方面,信息提供单元的检测器由第一比较器和第二比较器组成,其用于对基于位值(place value)、功能值(functionvalue)和/或根据使用者从对话搜索或语句搜索中选择的搜索类型自然语言的由订户单元输入的请求数据进行分类,以及从语言数据存储部分提取对应于请求数据的语言数据。
依据本发明的另一方面,信息提供单元的传输控制部分将提取的语言数据分解为文本数据,音频数据和视频数据并将这些分类后数据传输给订户单元。
依据本发明的另一方面,订户单元的语言数据控制部分包括:用于将通过网络从信息提供单元接收的语言数据分为文本数据和音频数据并分别存储这些文本数据和音频数据的文本数据缓存器和音频数据缓存器;用于选择对话数据搜索或语句数据搜索的搜索菜单选择部分;以及学习过程控制部分,其用于控制语言学习的一系列操作,包括在缓存器中存储语言数据和运行语言程序。
为达到上述本发明的目的,本发明还提供了一个具有问答功能的语料检索语言教育系统,其包括:信息提供单元,其用于将对话数据和语句数据分解为文本数据、音频数据和视频数据,将每种分解后的数据作为语料数据存储于语言数据存储部分,根据使用者输入的问题的文本数据从语言数据存储部分中提取对应的语言数据并通过网络按照预先设定的教育顺序输出该提取的数据;订户单元,其用于通过网络向信息提供单元发出问题的文本数据和通过网页浏览器或扬声器输出从信息提供单元接收的语言数据。
订户单元可以是PC,PDA和移动电话的任何一种。
为达到上述本发明的目的,本发明还提供了一个使用具有问答功能的语料检索语言教育系统的语言教育方法,其包括步骤:向信息提供单元发送由订户单元的使用者输入的问题文本数据;根据从网络接收的问题文本数据提取对应的对话数据或语句数据;通过网络向订户单元传送提取的对话数据或语句数据;根据语言程序通过订户单元的网页浏览器或扬声器输出接收的对话数据或语句数据。
语言教育方法进一步包括使学习者能够从搜索类型选择菜单中选择对话数据搜索或语句搜索的步骤。
另外,所述的根据问题文本数据提取对应的对话数据的步骤所提取的对话数据是符合从订户单元接收的问题文本数据的位值和功能值的。当问题文本数据中只出现位值时,信息提供单元要求重新输入包含功能值的问题文本数据或提取只符合该位值的对话数据。当问题文本数据中只出现功能值时,信息提供单元要求重新输入包含位值的问题文本数据或提取只符合该功能值的对话数据。
附图说明
本发明的上述和其它目的、特点和优点将通过以下结合附图的详细说明而更加清楚,其中:
图1表示的是本发明涉及的具有问答功能的语料检索语言教育系统的信息提供单元和订户单元的架构图;
图2表示的是本发明涉及的用于个性化语言学习的信息提供单元和订户单元的架构图;
图3a至3g表示的是在图1和2中使用的语言素材数据库和会员数据库的架构图;
图4表示的是本发明涉及的具有问答功能的语料检索语言教育系统的工作流程图;
图5表示的是本发明涉及的个性化语言学习方法的流程图;
图6a至6c表示的是图1中检测器的工作流程图;
图7表示的是使用图2所示的系统的个性化语言学习过程的流程图;
具体实施方式
在这里,将参照附图对本发明的优选实施方式进行说明。在以下的说明和附图中,将对相同或相近的组成部分指定相同的附图标记,因此将省略对相同或相近的组成部分的重复说明。
图1和2表示了一个能够通过语料检索对使用者从订户单元输入的问题提供答案的语言教育系统。
图1表示了一个使用语料检索技术的语言教育系统。在语言教育系统中的信息提供单元中,图1指定的语言数据存储部分的附图标记是110,111是语言素材数据库,112是语言数据提取控制部分,113是对话数据缓存器,114是语句数据缓存器,115是AV数据缓存器,120是检测器,121是第一比较器,122是第二比较器,130是传输控制部分,143是接收控制部分,141是文本接收缓存器,142是音频接收缓存器,150是会员管理部分,151是会员数据库,152是会员识别器。
参照图1,当用户通过订户单元1b提供的搜索类型选择部分201选择对话数据搜索或语句数据搜索并在搜索窗口输入问题文本数据时,输入的文本数据通过输出控制部分210传送给传输控制部分190。然后该文本数据通过网络接口160被传送给信息提供单元1a的接收控制部分143。
被传送给接收控制部分143的文本数据被存储于文本接收缓存器141(当使用者输入的是音频数据,输入的音频数据被存储于音频接收缓存器142中)并且又被输入给第一比较器121和第二比较器122。第一比较器121将输入的文本数据与存储于对话数据缓存器113中的对话数据进行比较。当任何存储的对话数据被检测到与输入的文本数据对应,第一比较器121传输检测到的对话数据给传输控制部分130。第二比较器122将输入的文本数据与存储于语句数据缓存器114中的语句数据进行比较。当任何存储的语句数据被检测到与输入的文本数据对应,第二比较器122传输检测到的语句数据给传输控制部分130。
在这里,将对包括在信息提供单元1a的语言数据存储部分110进行更详细的说明。所有的语言数据都被存储于语言数据存储部分110的语言素材数据库111中。语言素材数据库111可以包括DB服务器。存储于语言素材数据库111中的语言数据在语言数据提取控制部分112的控制下被提取并根据它们的内容被存储于缓存器。换句话说,从语言素材数据库111中提取的对话数据、语句数据和音频/视频数据被分别存储于对话数据缓存器113,语句数据缓存器114和AV数据缓存器115中。
对话数据缓存器113存储用于各种情景的对话语料数据集合。例如,对话数据缓存器113可以存储以在家做饭时可能说的对话的语料,例如饿了和准备食物和烹调时的对话。
从订户单元1b输入的问题文本数据被输入到文字接收缓存器141(或当从订户单元1b输入的问题文本数据是音频数据时被输入到音频接收缓存器142)。检测器120包含的第一比较器121或第二比较器122将前述的文本数据或音频数据与对话数据或语句数据进行比较。根据比较结果,需要的语言数据在语言数据提取控制部分112的控制下最终被提取出来。此时,累积n次的语言数据被提取出来。
提供给订户单元1b的对话数据和语句数据将与AV数据缓存器115中的音频和视频数据一起被调用并被语言数据提取控制部分112根据从传输控制部分130产生的控制信号进行提取。已提取的对话数据和语句数据,包括音频/视频数据,都被输入到传输控制部分130并通过网络接口160传输给订户单元1b。成对照地,从订户单元1b通过网络接口160输入的数据被传输到信息提供单元1a的接收控制部分143。当输入的数据是文本时,它被传输到文本接收缓存器141。当输入的是音频数据时,它被传输到音频接收缓存器142。
检测器由第一比较器121和第二比较器122组成。第一比较器121将输入的文本数据与对话数据缓存器113存储的对话数据进行比较。当任何存储的对话数据被检测到与输入的文本数据对应,第一比较器121将检测到的对话数据作为语言数据传输给传输控制部分130。第二比较器122将输入的文本数据与存储于语句数据缓存器114中的语句数据进行比较。当任何存储的语句数据被检测到与输入的文本数据对应,第二比较器122将检测到的语句数据作为语言数据传输给传输控制部分130。
传输到传输控制部分的语言数据(对话数据或语句数据)通过网络接口160被输入到订户单元1b的接收控制部分180。输入到接收控制部分180的语言数据中的文本部分被输出到订户单元1b的网页浏览器上,而输入到接收控制部分180的语言数据中的音频数据部分在输出控制部分210的控制下被输出到订户单元1b的扬声器上。根据从会员识别器152输入的识别信息,传输控制部分130决定从信息提供单元1a提取的语言数据输出到哪个订户单元1b。当收到的通过接收控制部分143输入的订户单元1a的识别信息后,会员识别器152根据存储于会员数据库151的会员信息识别订户单元1a并将识别的订户单元1a的信息发送到传输控制部分130。
以上解释了信息提供单元1a和订户单元1b之间通过互联网的数据传输。优选地,订户单元1b应为PC,移动电话或PDA中任何一种。
信息提供单元1a提供的语言数据既可以存储于无线网络终端(例如,移动电话或PDA)也可以存储于移动存储设备(例如,磁带机,CD,DVD,半导体芯片或语言播放器)用来向订户单元整体地提供语言数据。然后使用者可以整体地下载语言数据到他或她自己的无线网络终端用于语言学习。因此,本发明的语言教育系统既可用于在线也可用于离线语言教育或学习。
图2表示了本发明涉及的用于个性化语言学习的信息提供单元和订户单元的架构。对应于使用者输入的问题文本数据的语言数据被从信息提供单元2a的语言素材数据库221中提取并存储于订户单元2b的语言数据存储缓存器312中。随着存储于语言程序缓存器313中的语言程序在学习过程控制部分314的控制下被执行,存储于存储缓存器312中的语言数据通过订户单元2a的网页浏览器或扬声器被输出,用于使用者的个性化语言学习。有关信息提供单元2a,附图2指定语言数据存储部分的标记是220,检测器是230,传输控制部分是240,会员管理部分是250和接收控制部分是260。关于订户单元2b,图2指定接收控制部分的标记是290,传输控制部分是300和输出控制部分是320。
所有的语言数据都存储于语言数据存储部分220的语言素材数据库221中。语言素材数据库221可以包括DB服务器。语言数据提取控制部分222从语言素材数据库221中提取所需的语言数据。已提取的语言数据根据它们的内容被存储于对话缓存器223中。这时,从语言素材数据库221提取的语言数据中的音频数据和视频数据被分别存储于音频数据缓存器224中和视频数据缓存器225中。
当使用者输入问题文本数据时,第一比较器231将问题文本数据(在问题文本数据中的位值或功能值)与存储于对话数据缓存器223的对话数据进行比较。当任何存储的对话数据被检测到与输入的文本数据对应,第一比较器231传输检测到的对话数据给传输控制部分240。第二比较器232将输入的文本数据与存储的语句数据进行比较。当任何存储的语句数据被检测到与输入的文本数据对应,第二比较器232传输检测到的语句数据给传输控制部分240。此时,随同对话数据和语句数据一起传输到传输控制部分240的还有从音频数据缓存器224及视频数据缓存器240中提取的音频数据及视频数据。
传送到信息提供单元2a的传输控制部分240的语言数据通过网络接口270被输入到订户单元2b的接收控制部分290。随着存储于语言程序缓存器313中的程序在学习流程控制部分314的控制下被执行,输入到接收控制部分290的语言数据通过订户单元2b的网页浏览器和扬声器被输出。
在提供的语言数据中,使用者可以只选择那些对他或她个性化语言学习有用的数据并将它们存储在单独的存储部分(图中未表示)。存储在该存储部分中的数据不是对话数据或语句数据,而是与对话数据或语句数据匹配的识别代码。
为了个性化语言学习,使用者不得不访问存储的数据。因此,存储于存储部分的识别代码会通过传输控制部分300和网络接口270被发送到信息提供单元2a。
特别地,与使用者用于个性化语言学习的语言数据匹配的识别代码被输入信息提供单元2a并由第一比较器231与对话数据进行比较。当第一比较器231检测到对应于识别代码的对话数据时,它传输检测到的数据给传输控制部分240。此时,检测到的对话数据和分别从音频数据缓存器224及视频数据缓存器225中提取的音频数据及视频数据一同被传输到传输控制部分240。
传送到传输控制部分240的用于个性化语言学习的语言数据通过网络接口270被发送到订户单元2b。随着存储于语言程序缓存器313中的程序在学习流程控制部分314的控制下被执行,订户单元2b通过网页浏览器和扬声器输出接收的语言数据。
以上说明的语言教育系统使个性化语言学习的使用者可以通过互联网在信息提供单元2a和订户单元2b之间传输语言数据。优选地,订户单元2b应该是PC,移动电话或PDA中的任意一种。
信息提供单元1a提供的语言数据也可以存储于无线网络终端(例如,移动电话或PDA)和移动存储设备(例如,磁带机,CD,DVD,半导体芯片或语言播放器)用来向订户单元整体地提供语言数据。然后使用者可以整体地下载语言数据到他或她自己的无线网络终端用于语言学习。因此,本发明的语言教育系统既可用于在线也可用于离线语言教育或学习。
图3a至3g表示了语言素材数据库111或221和图1或2的会员数据库151或251的架构。
特别地,图3a,3b,3c,3d,3e和3f分别描述了多媒体对话数据库,对话级语言素材数据库,多媒体语句数据库,语句级语言素材数据库,用于个性化语言学习的多媒体数据库,用于个性化语言学习的语言素材数据库和会员数据库的文件信息。
如图3a所示,多媒体对话数据库包括语言数据代码项、对话文本数据项、对话音频数据项和多媒体控制数据项。如图3b所示,对话级语言素材数据库包含语言数据代码项、分类代码项、标题项、数据分类项、数据比较项、数据调用项、数据输出项和对话数据库项。对话数据按照位值和功能值被分类并组成语料数据。如图3c所示,多媒体语句数据库包括语言数据代码项、语句文本数据项、语句音频数据项和多媒体控制数据项。如图3d所示,语句级语言素材数据库包括语言数据代码项、分类代码项、标题项、数据分类项、数据比较项、数据调用项、数据输出项、N数据库项和语句数据库项。提供和输出到订户单元的语句数据可以是与使用者输入的文本数据匹配的一句或一组n句。如图3e所示,用于个性化语言学习的多媒体数据库包括语言数据代码项、文本语言数据项、音频语言数据项、视频语言数据项和多媒体控制数据项。如图3f所示,用于个性化语言学习的语言素材数据库包括语言数据代码项、分类代码项、标题项、数据分类项、数据比较项、数据调用项、数据输出项和语言程序数据库项。语言程序数据包括课程、授课讲稿、考试和自我测试程序。如图3g所示,会员数据库包括会员代码项、姓名项、居民注册号项、地址项、语言程序代码项、标题代码项和个人信息数据库项。标题代码项记录了上次学习的日期。
以下,本发明涉及的一种使用具有问答和语料检索功能的语言教育系统的语言教育方法将参照图4详细说明。
订户单元1b的输出控制部分210显示了一个解释如何搜索语言数据的画面(S110)。画面包括音频数据、视频数据和文本数据。使用者可以跳过或停留在这个画面。
随后,使用者需要选择用于提取对话数据或语句数据的搜索菜单(S120)。选择搜索菜单后,使用者需要在搜索窗口输入文本数据(S130)。
使用者输入的文本数据通过输出控制部分210被传输到传输控制部分190。然后传输控制部分190将接收的文本数据通过网络接口160输入到信息提供单元1a的接收控制部分143(S140)。
输入接收控制部分143的文本数据被存储于文本接收缓存器141并又被输入到第一比较器121和第二比较器122,其将搜索与输入文本数据值对应的语言数据(S150)。更特别地,如果使用者在步骤120选择对话数据搜索,文本数据将被输入到第一比较器121,或者如果使用者选择语句数据搜索,文本数据将被到输入第二比较器122。
如果任何对应的语言数据被检测到,语言数据提取控制部分112将提取检测到的语言数据(S160)。此时,提取的语言数据可以包括对话或语句文本数据和音频数据。提取的语言数据通过网络接口160被传输到订户单元1b的接收控制部分180(S170)。被传输到接收控制部分180的语言数据中的文本被存储于文本数据缓存器202,同时语言数据中的音频数据被存储于音频数据缓存器203(S180)。
存储的语言数据在学习流程控制部分204的控制下通过订户单元1b的网页浏览器或扬声器被输出,以便使用者能读或听输出的数据。语言数据通过网页浏览器还是扬声器输出是根据使用者选择的语言学习模式(例如,读模式或听模式)决定的。当然,使用者可以同时选择读模式和听模式来同时读和听语言数据。当选择一种说模式,使用者可以说和练习对话(通过对话学习语言)。
在订户单元1b的学习过程控制部分204的控制下,读、听或说模式下的语言学习可以和语言程序一起工作。
如上所说明的,当使用者使用订户单元1b输入文本数据时,文本数据被传输到信息提供单元1a。信息提供单元1a从语言素材数据库111中提取与输入文本数据对应的对话或语句数据并传输已提取的数据到订户单元1b。使用者可以在不同语言学习模式下,例如读、听和说模式,学习接收的语言数据,因此使语言学习效率最大化。
图5表示地是本发明涉及的用于个性化语言学习的语言教育方法。
图2中的订户单元2b的输出控制部分210显示的一个画面说明了怎样搜索语言数据(S310)。数据包括音频数据、视频数据和文本数据。使用者可以跳过或停留在这个画面。
当使用者选择了存储于语言数据存储缓存器312中用于个性化语言学习的菜单时(S320),语言程序在学习过程控制部分314的操作下提取存储于语言数据存储缓存器312中的语言数据(S330)。被提取的语言数据被传输到信息提供单元2a(S340)。此时,被提取的语言数据是一些与对话或语句数据匹配的识别代码。换句话说,存储于语言数据存储缓存器312中的语言数据不是对话或语句数据,而只是一组与对话或语句数据匹配的识别代码。基于收到的识别代码,信息提供单元2a提取对应的对话或语句数据并发送提取的数据至订户单元2b。
被传输到信息提供单元2a的语言数据(也就是存储于语言数据存储缓存器312中的对话或语句数据的识别代码)首先通过输出控制部分320被传输到传输控制部分300,然后通过网路接口270被输入到信息提供单元2a的接收控制部分263。
输入接收控制部分263的识别代码被存储于接收文本缓存器261。识别代码如果与对话数据对应则被输入第一比较器231或如果与语句数据对应则被输入第二比较器232。第一比较器231或第二比较器232检测与识别代码相同的语言数据(S350)。
当任何与识别代码相同的语言数据被检测到时,语言数据提取控制部分222从语言素材数据库221提取被检测到的语言数据(S360)。被提取的语言数据包括对话或语句的文本数据和音频数据。被提取的语言数据被传输到订户单元2b的接收控制部分290(S370)。并且,语言数据被存储于文本数据缓存器311(S380)。
被存储的语言数据通过订户单元2b的网页浏览器或扬声器输出,以便使用者可以在各种语言学习模式下,例如讲稿、演说或考试模式,学习语言数据(S390)。
也可以在个人信息模式下根据使用者的学习环境和能力改变输入的用于个性化语言学习的信息。多媒体功能也可以调整。目标语言数据被存储于图2中的语言数据存储缓存器312中。此时,存储于语言数据存储缓存器312中的语言数据不是真正的对话或语句数据,而是与对话或语句数据匹配的识别代码。
使用者可以使用语言程序构成最适合他或她的需要和能力的语言学习资源。使用者可以通过个性化语言学习提高他或她的语言技巧。
图6a表示了图1中的检测器120比较用户输入的文本数据并检测相应的语言数据的工作流程图。
当使用者选择搜索菜单(S511),用于对话数据搜索或语句数据搜索的初始画面通过网页浏览器被输出。使用者就可以输入文本数据(S512)。被输入的文本数据通过网络接口160被传输到信息提供单元1a的接收控制部分143(S513)。
根据使用者选择的搜索类型,信息提供单元1a的检测器120控制第一比较器121或第二比较器122搜索与输入的文本数据的值对应的语言数据(S514)。例如,如果使用者选择了对话数据搜索,第一比较器121将搜索与输入的文本数据对应的对话数据。当任何对应的对话数据被检测到时(S515),被检测到的数据将被提取(S516)并被传输到订户单元1b,以便使用者可以在选择的语言学习模式例如说或听的模式下学习对话数据。使用者可以选择重复或停止语言数据搜索和学习过程。如果没有对应于输入的文本数据的对话或语句数据被检测器120检测到,订户单元1b将返回初始文本数据输入模式。
图6b是表示搜索对话数据的更详细过程的流程图。图6c是表示搜索语句数据过程的流程图。这些过程将参照图1的语言教育系统进行说明。
参照图6b,检测器120根据输入到文本接收缓存器141的文本信息的位值和功能值对这些文本数据进行分类(S611)并将文本数据的值与存储的语言数据比较(S612)。为了更详细而精确,输入的文本数据的位值和功能值与存储于语言素材数据库111的语言数据的位值和功能值比较。如果检测器120检测到相同位值和功能值的语言数据(S613),它将提取这些语言数据(S614)。
如果只有位值相同的语言数据被检测到,检测器120将要求重新输入包括功能值的文本数据(S616)。使用者可以重新输入包括位值和功能值的文本数据作为回复或拒绝重新输入的要求。当重新输入的要求被拒绝时,检测器120将提取只有位值相同的语言数据(S617)。
另一方面,如果只有功能值相同的语言数据被检测到(S618),检测器120将要求重新输入包括位值的文本数据(S619)。使用者可以重新输入包括位值和功能值的文本数据作为回复或拒绝重新输入的要求。当重新输入的要求被拒绝时,检测器120将提取只有功能值相同的语言数据(S620)。
如果没有检测到具有相同位值或功能值的语言数据,订户单元1b将显示“数据未找到”(S621)。
在步骤614,617或620中提取的语言数据通过订户单元1b的网页浏览器或扬声器被输出,以便使用者可以学习语言数据。
参照图6c,信息提供单元1a的检测器120对使用者输入的文本数据和存储于语言素材数据库111的语言数据进行比较(S711)。
检测器120搜索语言素材数据库111以检测对应于输入的文本数据的值的语言数据(S712)。当任何对应的数据被检测到,检测器120将提取被检测的语言数据(S713)。此时,语言数据可以按照与输入文本数据匹配率的顺序n次被提取。
这些n个语言数据通过传输控制部分130被传输到订户单元1b。
如果步骤712未检测到对应的语言数据,检测器120将通知使用者未找到数据,并且如果必要,将要求单独的存储设备(图中未表示)以向订户单元1a提供期望的语言数据。
附图7表示了个性化语言学习过程的流程图。当使用者选择了所需的语言程序(S811),订户单元1b调用语言程序并输出一个语言程序理解模式画面(S812)。使用者可以跳过或继续这个画面。
订户单元1b判断使用者是否选择开始语言学习过程(S813)。如果是,语言程序将被运行使使用者进行所需的语言学习过程(S814)。在这个过程中,使用者可以在语言数据存储缓存器312中记录或存储特定的语言数据并在以后需要时使用该存储的数据。使用者可以使用多媒体工具更有效地学习语言(例如,GVA讲稿、音频演讲、信息服务、移动电话或PDA)。
当使用者选择重复学习(S815),订户单元1b显示用于选择语言程序的初始画面。
以上说明的语言学习过程是通过使用互联网传输数据并且使用存储于图2的语言存储缓存器312的语言数据完成的。使用者和第三人可以同时访问在信息提供单元的语言数据以便实时学习数据。还可以传输被使用者选择的语言数据到使用者的个人终端(订户单元),以便使用者可以提取和学习需要的数据。
另外,信息提供单元2a的语言素材数据库221可以被存储在无线网络终端(例如,移动电话或PDA)和移动存储设备(例如,磁带、CD、DVD、半导体芯片或语言播放器中)用来向订户单元整体地提供语言数据。然后使用者可以整体地下载语言数据到他或她自己的无线网络终端用于语言学习。因此,本发明涉及的通过语料检索响应使用者查询的语言教育系统和个性化语言学习方法既适用于在线也适用于离线语言教育或学习。
使用统一或相近内容的教科书的传统的语言教育方法不能满足学习者在真实交流情况下获得即时语言数据的需要和要求。因为大多数学习者重复学习和记忆在有限数量的场景下有用的表达,他们在面对未预料或不熟悉的交流情况下会很尴尬。本发明可以解决这些传统语言教育或学习方法的问题。本发明涉及的语言教育系统将对话或语句作为有助于与说本国语的人交流时的语料数据存储为目标语言。当使用者输入问题文本数据时,通过语料检索提取的语言数据(包括文本数据、音频数据和视频数据)作为问题的答案被迅速地通过互联网提供给使用者。依照本发明,通过语料检索提取的语言数据可以被存储于单独的存储设备,以便使用者可以构成最适合他或她的需要和能力的语言学习资源。使用者可以更有效地使用多媒体工具和语言程序在线或离线学习语言。
虽然以上是为达到说明目的,对本发明的优选实施方式的描述,但是可以理解,本领域的技术人员能够对本发明做出多种修改、增加和改变。但是这些修改、增加和改变都应被认为不超出本发明公开的保护范围。

Claims (15)

1、一种具有问答功能以及包括订户单元和信息提供单元的语料检索语言教育系统,其能够通过有线或无线网络终端接收和传输用于语言学习的数据,该系统包括:
语言数据存储部分,其用于存储包括有助于与说本国语的人交流的有关的各种情景对话和语句的文本数据和音频/视频数据的语言数据;
检测器,其用于分析订户单元通过网络输入的请求数据并提取对应该请求数据的语言数据;
传输控制部分,其用于控制将检测器提取的语言数据通过网络传输给订户单元;及
语言数据控制部分,其用于通过网络接收语言数据并控制该接收的用于各种语言学习的方法和多媒体工具的语言数据的输出。
2、根据权利要求1的语料检索语言教育系统,进一步包括会员数据存储部分,其用于存储通过网络从订户单元接收的会员信息,以及将已提取的语言数据传输给订户单元时所必需的身份识别信息提供给传输控制部分。
3、根据权利要求1的语料检索语言教育系统,进一步包括:分别存储从语言数据存储部分提取的对话数据和语句数据的对话数据缓存器和语句数据缓存器;
存储与对话数据和语句数据相应的音频/视频数据的AV数据缓存器;及
分别存储由订户单元输入的文本数据和音频数据的文本接收缓存器和音频接收缓存器。
4、根据权利要求1的语料检索语言教育系统,其中信息提供单元的所述检测器由第一比较器和第二比较器组成,其用于对基于位值、功能值和/或根据使用者从对话搜索和语句搜索中选择的搜索类型的自然语言,对订户单元输入的请求数据进行分类,以及从语言数据存储部分提取对应于请求数据的语言数据。
5、根据权利要求1的语料检索语言教育系统,其中信息提供单元的所述传输控制部分将提取的语言数据分成文本数据,音频数据和视频数据并将这些分开的数据传输给订户单元。
6、根据权利要求1的语料检索语言教育系统,其中订户单元的语言数据控制部分包括:
用于将通过网络从信息提供单元接收的语言数据分为文本数据和音频数据并分别存储该文本数据和音频数据的文本数据缓存器和音频数据缓存器;
用于选择对话数据搜索或语句数据搜索的搜索菜单选择部分;及
学习过程控制部分,其用于控制语言学习的一系列操作,包括在缓存器中存储语言数据和运行语言程序。
7、一种具有问答功能的语料检索语言教育系统,其包括:
信息提供单元,其用于将对话数据和语句数据分成文本数据、音频数据和视频数据,将各分开的数据作为语料数据存储于语言数据存储部分,从语言数据存储部分提取与使用者输入的问题文本数据相应的语言数据并通过网络按照预定的教育顺序输出该提取的数据;及
订户单元,其用于通过网络向信息提供单元发出问题文本数据和通过网页浏览器或扬声器输出从信息提供单元接收的语言数据。
8、根据权利要求7的语料检索语言教育系统,其中所述的订户单元可以是PC,PDA和移动电话中的任意一种。
9、一种使用具有问答功能的语料检索语言教育系统的语言教育方法,其包括如下步骤:
通过网络向信息提供单元发送由订户单元的使用者输入的问题文本数据;
根据从网络接收的问题文本数据提取对应的对话数据或语句数据;
通过网络向订户单元传送提取的对话数据或语句数据;及
根据语言程序通过订户单元的网页浏览器或扬声器输出接收的对话数据或语句数据。
10、根据权利要求9的语言教育方法,进一步包括提供搜索类型选择菜单使学习者能够选择对话数据搜索或语句数据搜索的步骤。
11、根据权利要求9的语言教育方法,其中所述的提取对话数据的步骤提取符合从订户单元接收的问题文本数据的位值和功能值的对话数据。
12、根据权利要求11的语言教育方法,其中所述的提取对话数据的步骤包括:当从订户单元接收的问题文本数据只出现位值时,要求重新输入包含功能值的问题文本数据或只提取符合该位值的对话数据。
13、根据权利要求11的语言教育方法,其中所述的提取对话数据的步骤包括:当从订户单元接收的问题文本数据只出现功能值时,要求重新输入包含位值的问题文本数据或只提取符合该功能值的对话数据。
14、根据权利要求9的语言教育方法,进一步包括步骤:
将使用者通过网络从信息提供单元接收的语言数据中选择出的语言数据的识别代码存储于由使用者指定的单独的存储部分;
通过网络将该识别代码传输到信息提供单元;
提取对应于接收的识别代码的对话或语句数据;
通过网络传输提取的对话或语句数据到订户单元;及
按照使用者可以进行个性化语言学习的语言程序通过订户单元的网页浏览器和扬声器输出接收的对话或语句数据。
15、一种计算机可读的记录介质,其用于记录语言教育程序,所述的语言教育程序将有助于与说本国语的人交流的对话或语句以文本数据、音频数据或视频数据的形式作为语料数据存储于语言素材数据库中,从语言素材数据库中提取使用者所需的语言数据并传输提取的语言数据到使用者终端,所述的被执行的语言教育程序用来控制语言学习或教育数据在信息提供单元与订户单元之间的传输,其中所述信息提供单元可用于存储对话和语句的语料数据,提取响应使用者输入的问题文本数据的语言数据以及通过网络接口输出该提取的数据;所述订户单元用于发送问题文本数据到信息提供单元,通过网页浏览器或扬声器输出从信息提供单元接收的语言数据以及选择性地存储用于个性化语言学习的该语言数据;所述的被执行的语言教育程序还可用来迅速提取使用者有关对话和语句的问题的答案并将提取的答案以文本、音频和/或视频数据形式提供,因此使用者可以根据自身需要和能力使用各种多媒体工具进行个性化语言学习。
CNA200480030468XA 2003-10-15 2004-10-14 基于使用问答功能的语料检索系统的语言教育系统、方法和程序记录介质 Pending CN1886768A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020030071966 2003-10-15
KR1020030071966A KR100586860B1 (ko) 2003-10-15 2003-10-15 질문과 답변기능을 이용한 사전검색방식의 언어교육시스템과 언어교육방법

Publications (1)

Publication Number Publication Date
CN1886768A true CN1886768A (zh) 2006-12-27

Family

ID=36913906

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA200480030468XA Pending CN1886768A (zh) 2003-10-15 2004-10-14 基于使用问答功能的语料检索系统的语言教育系统、方法和程序记录介质

Country Status (5)

Country Link
US (1) US20060190240A1 (zh)
JP (1) JP2007509365A (zh)
KR (1) KR100586860B1 (zh)
CN (1) CN1886768A (zh)
WO (1) WO2005038683A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105392028A (zh) * 2015-10-12 2016-03-09 天脉聚源(北京)传媒科技有限公司 一种数据的传输方法及装置
CN110660388A (zh) * 2018-06-29 2020-01-07 南京芝兰人工智能技术研究院有限公司 一种语音交互点读装置

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100792325B1 (ko) * 2006-05-29 2008-01-07 주식회사 케이티 대화형 다국어 학습을 위한 대화 예제 데이터베이스 구축방법 및 그를 이용한 대화형 다국어 학습 서비스 시스템 및그 방법
CN100416570C (zh) * 2006-09-22 2008-09-03 浙江大学 一种基于问答库的中文自然语言问答方法
KR100905744B1 (ko) * 2007-12-04 2009-07-01 엔에이치엔(주) 사용자 제작 문답 데이터에 기반한 회화 사전 서비스 제공방법 및 시스템
KR100978581B1 (ko) * 2008-05-08 2010-08-27 엔에이치엔(주) 웹 페이지 열람 중에 편리하게 사전 서비스를 제공하기위한 방법 및 시스템
KR101021340B1 (ko) * 2008-05-30 2011-03-14 금오공과대학교 산학협력단 어학문제의 답안추천 시스템 및 방법
KR101609910B1 (ko) * 2013-08-09 2016-04-06 (주)엔엑스씨 학습 서비스를 제공하는 방법, 서버 및 시스템
TW201519179A (zh) * 2013-11-11 2015-05-16 yu-jun Xia 語文學習系統及其方法
US9639526B2 (en) * 2014-01-10 2017-05-02 Microsoft Technology Licensing, Llc Mobile language translation of web content
CN103761314A (zh) * 2014-01-26 2014-04-30 句容云影响软件技术开发有限公司 一种多功能对话信息控制方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20010029126A (ko) * 1999-09-29 2001-04-06 장영길 국제 다국어 실시간 자동 통번역 채팅시스템
AU2001271940A1 (en) * 2000-07-28 2002-02-13 Easyask, Inc. Distributed search system and method
KR20010008391A (ko) * 2000-11-30 2001-02-05 최세현 인터넷을 통한 외국어 학습 방법 및 시스템
KR20020041784A (ko) * 2001-12-12 2002-06-03 김장수 생각단위 및 연결질문을 이용한 언어 교육 시스템 및 방법
JP4593069B2 (ja) * 2001-12-12 2010-12-08 ジーエヌビー カンパニー リミテッド 思考単位と連結質問を用いる言語教育システム
US20030154067A1 (en) * 2002-02-08 2003-08-14 Say-Ling Wen System and method of foreign language training by making sentences within limited time

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105392028A (zh) * 2015-10-12 2016-03-09 天脉聚源(北京)传媒科技有限公司 一种数据的传输方法及装置
CN105392028B (zh) * 2015-10-12 2019-05-24 天脉聚源(北京)传媒科技有限公司 一种数据的传输方法及装置
CN110660388A (zh) * 2018-06-29 2020-01-07 南京芝兰人工智能技术研究院有限公司 一种语音交互点读装置

Also Published As

Publication number Publication date
JP2007509365A (ja) 2007-04-12
WO2005038683A1 (en) 2005-04-28
US20060190240A1 (en) 2006-08-24
KR100586860B1 (ko) 2006-06-07
KR20050036328A (ko) 2005-04-20

Similar Documents

Publication Publication Date Title
KR101909807B1 (ko) 메시지 입력 방법 및 장치
US10937413B2 (en) Techniques for model training for voice features
US9530415B2 (en) System and method of providing speech processing in user interface
CN1581294B (zh) 语音识别增强的呼叫者识别
CN102842306B (zh) 语音控制方法及装置、语音响应方法及装置
EP2596492B1 (en) Efficiently reducing transcription error using hybrid voice transcription
US8909525B2 (en) Interactive voice recognition electronic device and method
US9154629B2 (en) System and method for generating personalized tag recommendations for tagging audio content
US11189267B2 (en) Intelligence-driven virtual assistant for automated idea documentation
JP6233798B2 (ja) データを変換する装置及び方法
CN1573928A (zh) 用语音应用语言标记执行的语义对象同步理解
CN1757030A (zh) 上下文可搜索的通信
CN101079301A (zh) 文本映射到音频并动画文本的设备及方法
CN101076061A (zh) 一种机器人服务器及自动聊天方法
CN108305618B (zh) 语音获取及搜索方法、智能笔、搜索终端及存储介质
US10854189B2 (en) Techniques for model training for voice features
CN1424668A (zh) 使用意思单元和相关问题的语言教学系统和方法
CN1886768A (zh) 基于使用问答功能的语料检索系统的语言教育系统、方法和程序记录介质
CN107808667A (zh) 声音识别装置以及声音识别方法
CN115136124A (zh) 用于建立交互式通信会话的系统和方法
KR102357620B1 (ko) 챗봇 채널연계 통합을 위한 챗봇 통합 에이전트 플랫폼 시스템 및 그 서비스 방법
CN1163836C (zh) 图象信息检索系统和方法
CN112765460A (zh) 会议信息查询方法、装置、存储介质、终端设备和服务器
CN116361431A (zh) 模型训练方法、对话生成方法、电子设备和相关装置
CN110491367A (zh) 智能电视的语音转换方法及设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication