CN101645190B - 一种单词查询系统及其查询方法 - Google Patents
一种单词查询系统及其查询方法 Download PDFInfo
- Publication number
- CN101645190B CN101645190B CN2009101442075A CN200910144207A CN101645190B CN 101645190 B CN101645190 B CN 101645190B CN 2009101442075 A CN2009101442075 A CN 2009101442075A CN 200910144207 A CN200910144207 A CN 200910144207A CN 101645190 B CN101645190 B CN 101645190B
- Authority
- CN
- China
- Prior art keywords
- word
- output
- speech recognition
- recognition device
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
- Electrically Operated Instructional Devices (AREA)
Abstract
本发明涉及一种单词查询系统,该系统包括:用于接收音频数据的接收模块;用于储存单词信息的单词信息数据库;用于将音频数据在单词信息数据库中的单词列表中进行识别,并得出识别结果的识别模块;根据识别结果,显示或播报输出相应单词的相关信息的输出模块。本发明还公开了一种单词查询系统的查询方法。本发明运用语音拼写朗读识别技术进行单词查询,突破了多种传统的单词查询方式的瓶颈,尤其对于阅读和朗读过程中,直接通过拼写朗读发音进行单词查询,有效的解决了阅读和朗读过程中出现的生词,用较短的时间得到了较大的学习成效。
Description
技术领域
本发明涉及语音识别领域,尤其是一种依照语音查询单词的系统及其查询方法。
背景技术
在外语学习以及运用外语进行交流的过程中,经常需要查询陌生单词,以了解单词的发音、涵义、用法等信息,例如在阅读外文文章时,遇到不认识的单词是很常见的情况,这些单词需要查询字典才能学习了解。传统的纸质词典由于用户随身携带不方便且查询速度较慢,已经几乎被教育类电子设备和计算机软件所完全替代。目前出现了品种繁多的教育类电子设备,如词典机、学习机、点读机以及计算机软件等,这些设备和软件普遍内置了电子辞典,在其中录入单词,便能查询到单词的相关信息。
然而这些教育类电子设备由于定位便携轻便,只能采用很小的键盘或触摸屏来输入,较小的键盘或屏幕虚拟键盘因为键位较小,导致用户使用不便,用户输入单词的速度低,此外广大中小学生对标准电脑键位布局不熟悉,在输入时,学生们将目光和注意力在书本和键盘屏幕之间来回移动,这样导致按键输入单词的效率较低;触摸屏上的手写输入也存在注意力来回切换导致输入单词速度慢的问题,并且由于现在手写识别技术无法达到100%的识别率,所以用户在手写每个字母后都进行选择和确认,这种输入方式增加了用户输入时的复杂程度,大大降低了用户的输入效率。计算机软件只能在计算机上运行,即使是便携式计算机也无法达到用户所希望的随身携带、随时使用、持续使用的要求,因为便携式计算机的电池续航能力远远小于学习机等普通的教育类电子设备,且便携式计算机的重量远远大于学习机。
发明内容
本发明的首要目的在于提供一种能够迅速、准确、随身随时通过语音拼写查询单词、使用便捷的单词查询系统。
为实现上述目的,本发明提供的一种单词查询系统,该系统包括:
用于接收音频数据的接收模块;
用于储存单词信息的单词信息数据库;
用于将音频数据在单词信息数据库中的单词列表中进行识别,并得出识别结果的识别模块;
根据识别结果,显示或播报输出相应单词的相关信息的输出模块。
本发明的另一目的在于提供一种单词查询系统的查询方法,包括下列顺序的步骤:
(1)接收模块接收用户以拼读的方式念出的音频数据,并对其进行存储;
(2)识别模块对接收模块接收的音频数据进行识别,确认是否能在单词信息数据库中找到匹配单词,并将识别结果输出至接收模块;
(3)若步骤(2)的识别结果为否,输出模块输出没有与录音匹配的单词的信息;否则,输出模块输出相应的匹配单词信息。
本发明运用语音拼写朗读识别技术进行单词查询,突破了多种传统的单词查询方式的瓶颈,尤其对于阅读和朗读过程中,直接通过拼写朗读发音进行单词查询,有效的解决了阅读和朗读过程中出现的生词,用较短的时间得到了较大的学习成效。
附图说明
图1是本发明的结构框图;
图2是本发明的工作流程图;
图3、4、5、6分别是本发明的工作状态示意图。
具体实施方式
一种单词查询系统,该系统包括:用于接收音频数据的接收模块10;用于储存单词信息的单词信息数据库40;用于将音频数据在单词信息数据库40中的单词列表中进行识别,并得出识别结果的识别模块20;根据比对结果,显示或播报输出相应单词的相关信息的输出模块30,如图1所示。
所述的接收模块10中还包括用于储存所接收音频数据的储存单元,所述的接收模块10的输出端与对单词信息数据库40进行访问和查询的识别模块20的输入端相连,识别模块20的输出端与输出模块30的输入端相连,所述的单词信息包括单词文本及相应的注释信息,注释信息包括单词的拼写、释义、音标、词性、用法、例句、声音的一种或几种的任意组合,如图1所示。
结合图2,所述的接收模块10接收用户以拼读的方式念出的音频数据,并对其进行存储,这里所指的拼读是指对单词进行拼写朗读,即逐个拼出字母的方式;识别模块20对接收模块10接收的音频数据进行识别,确认是否能在单词信息数据库40中找到匹配单词,并将识别结果输出至接收模块10;若识别模块20能在单词信息数据库40中找到匹配单词,输出模块30输出相应的匹配单词,同时,还输出匹配单词的注释信息,所述的注释信息包括单词的拼写、释义、音标、词性、用法、例句、声音的一种或几种的任意组合,否则,若识别模块20未能在单词信息数据库40中找到匹配单词,则输出模块30输出没有与录音匹配的单词的信息,如“不存在与录音匹配的单词”的信息。
以下结合图1、2、3、4、5对本发明作进一步的说明。
在单词信息数据库40中储存有单词信息,单词信息包括单词文本以及单词注释信息,单词注释信息包括有单词拼写、释义、音标、词性、用法、例句、声音等信息。此外,单词信息数据库40中还储存有一对照表,对照表将单词文本与注释信息联系起来,在对照表中一个单词文本可能对应于一个或多个注释信息。学习者阅读书本杂志文章时,在发现陌生单词时,可以将陌生的单词按字母逐个拼写朗读出来,接收模块10通过录音设备录制下这段语音,接收的同时将音频数据内容以时间为标准进行储存。
识别模块20在单词信息数据库40中搜索与音频数据内容匹配的单词文本,在进行匹配时,只是进行相似匹配,而非完全匹配,因为在进行单词的拼读发音时,由于地域性的差异,或是用户的发音习惯,每个用户的发音均会有一些差别,因此为兼容广大用户的拼读发音,识别模块20只能进行相似匹配。然后识别模块20判断是否查找到匹配的单词文本,如果有匹配的单词文本,则通过对照表找到相应的注释信息,输出模块30再将找到的注释信息显示出来,如果该单词文本 在单词信息数据库40中仅有一个单词与之相同,则输出模块30直接显示该单词,即可得到该单词的拼写、释义、音标、词性、用法、例句、声音等相关信息。如果没有找到匹配的单词文本,则输出模块30显示“未找到与录音匹配的单词”。
所述的识别模块20包括用于接收单词信息数据库40中单词列表的文本处理器21,文本处理器21的输出端与语音识别器22的输入端连接,语音识别器22的输出端与后处理器23的输入端相连,后处理器23的输出端与输出模块30的输入端连接,文本处理器21、后处理器23分别与单词信息数据库40双向通讯,所述的接收模块10中还包括用于储存所接收音频数据的储存单元,接收模块10的输出端与语音识别器22的输入端连接,如图1所示,具体的识别步骤如下:
在识别时,所述的文本处理器21将单词信息数据库40中的单词列表转化为语音识别器22能够识别的识别集合,即将单词列表中的每一个单词转化为与该单词拼写朗读发音所对应的字符序列,每一条字符序列可对应于一个或多个单词,字符序列中的字符可以是音标字符,也可以是语音识别器22支持的其他表达发音的字符,识别集合是由对应于单词列表中单词拼写朗读发音的多条字符序列组成,文本处理器21在转化单词为字符序列时,会对字符序列与单词的对应关系进行记录。
所述的语音识别器22在识别集合中进行识别,识别是否能够找到与音频数据具有较高似然性评分的少量字符序列,找到的少量字符序列的数量由系统设置或由用户设置,若能够找到,则语音识别器22将找到的少量字符序列配合似然性评分输出到后处理器23,后处理器23在接收到语音识别器22找到的少量与音频数据具有较高似然性评分的字符序列时,根据文本处理器21所记录的字符序列与单词的对应关系,将这些字符序列转化为字符序列相对应的单词并输出;否则,语音识别器22将输出“未在识别集合中找到与录音匹配的字符序列”信息至后处理器23,则后处理器23输出“未在词典中找到与录音匹配的单词”的信息。所述的后处理器23在输出单词时,根据单词对应的字符序列与音频数据的似然性评分的高低,对这些单词排序输出。
以下举例示意本发明的工作状态,图3所示为本发明的录音界面,图4所示为拼写识别结果,图5所示为单词“study”的查询结果,图6所示为未找到与录音匹配的拼读识别结果。
首先,学习者通过按下设备或界面上的录音按钮进入录音界面,录下学习者拼写朗读单词“study”的声音,如图3所示;录音过程结束后,按下查询按钮进行查找与录音数据匹配的单词文本,如果找到了与录音匹配的单词文本,则显示出这些单词文本,如图4所示;直接选择所显示的单词文本就可以查到相关的单词信息,例如点选单词“study”,就会显示“study”的音标、释义等单词信息,如图5所示,学习者通过这样就可以对单词的发音、释义等进行学习和了解;如果没有搜到与录音匹配的单词文本,则系统会出现提示,提示“未找到与录音匹配的单词”,如图6所示,此时学习者可以选择“重新录音”,系统将会到录音界面,学习者可以重新对单词进行拼写朗读并录音,学习者也可以选择“退出程序”,则结束发音查询,退出程序。
综上所述,本发明的核心在于运用语音拼写朗读识别技术进行单词查询,通过识别模块20对语音进行精确的识别,突破了多种传统的单词查询方式的瓶颈,尤其对于阅读和朗读过程中,直接通过拼写朗读发音进行单词查询,有效的解决了阅读过程中出现的生词,用较短的时间得到了较大的学习成效。
Claims (9)
1.一种单词查询系统,其特征在于:该系统包括:
用于接收音频数据的接收模块;
用于储存单词信息的单词信息数据库;
用于将音频数据在单词信息数据库中的单词列表中进行识别,并得出识别结果的识别模块;
根据识别结果,显示或播报输出相应单词的相关信息的输出模块;
所述的识别模块包括用于接收单词信息数据库中单词列表的文本处理器,文本处理器的输出端与语音识别器的输入端连接,语音识别器的输出端与后处理器的输入端相连,后处理器的输出端与输出模块的输入端连接,文本处理器、后处理器分别与单词信息数据库双向通讯,所述的接收模块中还包括用于储存所接收音频数据的储存单元,接收模块的输出端与语音识别器的输入端连接;
所述的文本处理器将单词信息数据库中的单词列表转化为语音识别器能够识别的识别集合,即将单词列表中的每一个单词转化为与该单词拼写朗读发音所对应的字符序列,每一条字符序列可对应于一个或多个单词,字符序列中的字符为音标字符,或为语音识别器支持的其他表达发音的字符,识别集合是由对应于单词列表中单词拼写朗读发音的多条字符序列组成,文本处理器在转化单词为字符序列时,会对字符序列与单词的对应关系进行记录;
所述的后处理器用于接收自语音识别器输出的信息,并将语音识别器输出的信息转化为识别结果输出至输出模块。
2.根据权利要求1所述的单词查询系统,其特征在于:所述的接收模块的输出端与对单词信息数据库进行访问和查询的识别模块的输入端相连,识别模块的输出端与输出模块的输入端相连。
3.根据权利要求1所述的单词查询系统,其特征在于:所述的单词信息包括单词文本及相应的注释信息,注释信息包括单词的拼写、释义、音标、词性、用法、例句、声音的一种或几种的任意组合。
4.根据权利要求1所述的单词查询系统的查询方法,包括下列顺序的步骤:
(1)接收模块接收用户以拼读的方式念出的音频数据,并对其进行存储;所述的拼读是指对单词进行拼写朗读,即逐个拼出字母的方式;
(2)识别模块对接收模块接收的音频数据进行识别,确认是否能在单词信息数据库中找到匹配单词,并将识别结果输出至接收模块;
(3)若步骤(2)的识别结果为否,输出模块输出没有与录音匹配的单词的信息;否则,输出模块输出相应的匹配单词信息。
5.根据权利要求4所述的单词查询系统的查询方法,其特征在于:所述的识别模块包括用于接收单词信息数据库中单词列表的文本处理器,文本处理器的输出端与语音识别器的输入端连接,语音识别器的输出端与后处理器的输入端相连,后处理器的输出端与输出模块的输入端连接,文本处理器、后处理器分别与单词信息数据库双向通讯,接收模块的输出端与语音识别器的输入端连接;所述的后处理器用于接收自语音识别器输出的信息,并将语音识别器输出的信息转化为识别结果输出至输出模块。
6.根据权利要求4所述的单词查询系统的查询方法,其特征在于:所述的输出模块输出所有匹配单词的同时,还输出匹配单词的注释信息,所述的注释信息包括单词的拼写、释义、音标、词性、用法、例句、声音的一种或几种的任意组合。
7.根据权利要求4或5所述的单词查询系统的查询方法,其特征在于:所述的文本处理器将单词信息数据库中的单词列表转化为语音识别器能够识别的识别集合,即将单词列表中的每一个单词转化为与该单词拼写朗读发音所对应的字符序列,每一条字符序列可对应于一个或多个单词,字符序列中的字符为音标字符,或为语音识别器支持的其他表达发音的字符,识别集合是由对应于单词列表中单词拼写朗读发音的多条字符序列组成,文本处理器在转化单词为字符序列时,会对字符序列与单词的对应关系进行记录。
8.根据权利要求4或5所述的单词查询系统的查询方法,其特征在于:所述的语音识别器在识别集合中进行识别,识别是否能够找到与音频数据具有较高似然性评分的少量字符序列,找到的少量字符序列的数量由系统设置或由用户设置,若能够找到,则语音识别器将找到的少量字符序列配合似然性评分输出到后处理器,后处理器在接收到语音识别器找到的少量与音频数据具有较高似然性评分的字符序列时,根据文本处理器所记录的字符序列与单词的对应关系,将这些字符序列转化为字符序列相对应的单词并输出;否则,语音识别器将输出“未在识别集合中找到与录音匹配的字符序列”信息至后处理器,则后处理器输出“未在词典中找到与录音匹配的单词”的信息。
9.根据权利要求8所述的单词查询系统的查询方法,其特征在于:所述的后处理器在输出单词时,根据单词对应的字符序列与音频数据的似然性评分的高低,对这些单词排序输出。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2009101442075A CN101645190B (zh) | 2009-07-22 | 2009-07-22 | 一种单词查询系统及其查询方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2009101442075A CN101645190B (zh) | 2009-07-22 | 2009-07-22 | 一种单词查询系统及其查询方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101645190A CN101645190A (zh) | 2010-02-10 |
CN101645190B true CN101645190B (zh) | 2011-03-30 |
Family
ID=41657064
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2009101442075A Active CN101645190B (zh) | 2009-07-22 | 2009-07-22 | 一种单词查询系统及其查询方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101645190B (zh) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103052979B (zh) * | 2010-07-06 | 2016-11-09 | 星火有限公司 | 用于阅读媒体的提升的系统 |
CN102346731B (zh) * | 2010-08-02 | 2014-09-03 | 联想(北京)有限公司 | 一种文件处理方法及文件处理装置 |
US20120122066A1 (en) * | 2010-11-15 | 2012-05-17 | Age Of Learning, Inc. | Online immersive and interactive educational system |
US9324240B2 (en) | 2010-12-08 | 2016-04-26 | Age Of Learning, Inc. | Vertically integrated mobile educational system |
CN103730032B (zh) * | 2012-10-12 | 2016-12-28 | 李志刚 | 多媒体数据控制方法和系统 |
CN104598464B (zh) * | 2013-10-31 | 2018-08-07 | 联想(北京)有限公司 | 一种信息处理方法及电子设备 |
CN110019667A (zh) * | 2017-10-20 | 2019-07-16 | 沪江教育科技(上海)股份有限公司 | 一种基于语音输入信息的查词方法及装置 |
CN109285396A (zh) * | 2018-07-11 | 2019-01-29 | 北京美高森教育科技有限公司 | 语音生词检测方法、学习机、教练机及其教学app系统 |
CN108959606A (zh) * | 2018-07-16 | 2018-12-07 | 商洛学院 | 一种英语单词查询系统 |
CN109740594A (zh) * | 2018-12-21 | 2019-05-10 | 惠州Tcl移动通信有限公司 | 单词查询方法、装置及存储介质 |
JP7120263B2 (ja) * | 2020-02-12 | 2022-08-17 | カシオ計算機株式会社 | 学習支援装置、学習支援方法、及び、プログラム |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1228760C (zh) * | 2003-11-07 | 2005-11-23 | 无敌科技(西安)有限公司 | 依照语音查询单词的系统及方法 |
CN1770261A (zh) * | 2004-11-01 | 2006-05-10 | 英业达股份有限公司 | 语音合成系统以及方法 |
-
2009
- 2009-07-22 CN CN2009101442075A patent/CN101645190B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1228760C (zh) * | 2003-11-07 | 2005-11-23 | 无敌科技(西安)有限公司 | 依照语音查询单词的系统及方法 |
CN1770261A (zh) * | 2004-11-01 | 2006-05-10 | 英业达股份有限公司 | 语音合成系统以及方法 |
Also Published As
Publication number | Publication date |
---|---|
CN101645190A (zh) | 2010-02-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101645190B (zh) | 一种单词查询系统及其查询方法 | |
US6864809B2 (en) | Korean language predictive mechanism for text entry by a user | |
CN101199122B (zh) | 使用语言模块扩展通配符 | |
CN101167075B (zh) | 专有表现抽取装置、方法以及程序 | |
KR101586890B1 (ko) | 입력 처리 방법 및 장치 | |
CN103268313A (zh) | 一种自然语言的语义解析方法及装置 | |
KR20070024771A (ko) | 질의어 자동변환을 이용한 자동완성 질의어 제공 시스템 및방법 | |
CN103678269A (zh) | 一种信息处理方法和装置 | |
CN101415259A (zh) | 嵌入式设备上基于双语语音查询的信息检索系统及方法 | |
CN101044494A (zh) | 用于可视文本解释的电子装置和方法 | |
CN101639734A (zh) | 中文输入方法和装置 | |
CN1758211A (zh) | 把输入提供给计算设备的有效多方式的方法 | |
CN104808806A (zh) | 根据不确定性信息实现汉字输入的方法和装置 | |
CN101341531A (zh) | 访问数字文件集合中的数字文件的方法和装置 | |
CN101377726A (zh) | 语音识别和笔划识别相结合的输入方法及其终端 | |
CN113268981B (zh) | 一种信息处理方法、装置及电子设备 | |
CN101539433A (zh) | 导航系统中拼音首字母加声调检索的方法及装置 | |
CN101655846A (zh) | 中文输入法标点关联方法及装置 | |
CN112417129A (zh) | 一种具有ai学习功能的智能快速应答方法及设备 | |
CN112148895A (zh) | 检索模型的训练方法、装置、设备和计算机存储介质 | |
CN101770328B (zh) | 多重切分的中文拼音系统及其方法 | |
CN1965349A (zh) | 多形式的非歧意性语音识别 | |
CN1924996B (zh) | 利用语音辨识以选取声音内容的系统及其方法 | |
CN110874527A (zh) | 一种基于云端的智能释义注音系统 | |
CN201946136U (zh) | 一种汉语拼音点读装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |