CN104516871A - 字词结合语境测验方法 - Google Patents

字词结合语境测验方法 Download PDF

Info

Publication number
CN104516871A
CN104516871A CN201310465523.9A CN201310465523A CN104516871A CN 104516871 A CN104516871 A CN 104516871A CN 201310465523 A CN201310465523 A CN 201310465523A CN 104516871 A CN104516871 A CN 104516871A
Authority
CN
China
Prior art keywords
words
pronunciation
individual character
vocabulary
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201310465523.9A
Other languages
English (en)
Inventor
陈淮琰
王秦秦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inventec Besta Xian Co Ltd
Inventec Besta Co Ltd
Original Assignee
Inventec Besta Xian Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inventec Besta Xian Co Ltd filed Critical Inventec Besta Xian Co Ltd
Priority to CN201310465523.9A priority Critical patent/CN104516871A/zh
Publication of CN104516871A publication Critical patent/CN104516871A/zh
Withdrawn legal-status Critical Current

Links

Landscapes

  • Electrically Operated Instructional Devices (AREA)

Abstract

本发明是一种字词结合语境测验方法,通过提供单字词库、发音词库及规则词汇表,分别对单字发音进行单字发音匹配及词汇语境处理,判断出单字发音中的单字及发音,如此可得到词句中的语境并处理单字发音,再根据语境对单字发音中的所有单字的单字发音数据进行测验。

Description

字词结合语境测验方法
技术领域
本发明涉及一种字词结合语境测验方法,尤其是一种先对单字发音进行处理再根据处理结果来测验词句发音的技术领域。
背景技术
显示方式以及语音方式是目前电子装置最普遍的两种信息表现方式。在人机互动接口中,尤以语音方式传递信息较为方便,加上人们对语言学习的需求日亦增加,所以对语音测验技术需求也日益迫切。
在习知技艺中,大部分的语言学习装置或软件通常都是内建从小学到大学不同阶段的字词表(wordlist),以提供使用者依此字词表依照字母排序顺序进行记忆。然而,使用者都不可修改这些字词表,无法在字词表上注记已经有把握的字词或是还未记忆的字词,如此造成许多已经记忆的单字还要浪费时间浏览。
然而,由于传统的语音输出方法在句子发音过程中,都是按字符串的存储形式发音,因此自然度较差,尤其是单字发音的测验发音更是明显。此外,在语音数据处理中,也需要数据处理人员将语句的发音按词组进行切分以便于为句子发音学习提供素材。利用上述手工切单字组的传统测验发音方法时,因为每个字的发音带有尾音,会使句子发音不符合自然发音原则,应该有停顿的时候无停顿,应该不停顿的时候又有停顿,造成所测验出的发音听起来像一串长长句子,造成使用者感觉枯燥,而降低学习兴趣。
发明内容
本发明为解决背景技术中存在的上述技术问题,而提出字词结合语境测验方法。
本发明的技术解决方案是:本发明为一种字词结合语境测验方法,其特殊之处在于:该方法包含下列步骤:
1)提供具有多个单字的单字词库、规则词汇表及具有多个单字发音数据的发音数据库;
2)获得单字发音取得字词,并根据单字词库对字词进行单字匹配;
3)根据规则词汇表对字词进行词汇语境处理;
4)根据单字匹配结果及发音查询结果,决定单字发音的语境;
5)从发音数据库中取得对应单字发音所包含单字的单字发音数据,并根据语境测验对应的单字发音数据。
上述词汇语境处理搜寻单字发音中是否有发音,若有,则根据规则词汇表判断出与发音匹配的字词。
上述方法包含步骤6)对单字发音进行破音处理,搜寻单字发音中是否具有破音,用来确认单字发音语境的正确性。
附图说明
图1为本发明方法步骤流程图;
具体实施方式
参见图1,字词结合语境测验方法从开始展开,包含下列步骤:步骤S11提供具有多个单字的单字词库、规则词汇表及具有多个单字发音数据的发音数据库。规则词汇表便是记录会与前后词匹配发音的发音以及此发音的破音规则。步骤S12获得单字发音取得字词,并根据单字词库对字词进行单字匹配。步骤S13根据规则词汇表对字词进行词汇语境处理。实施上,搜寻词句中的发音,若词句中有发音,则根据规则词汇表判断出与发音匹配的字词。步骤S14根据单字匹配结果及发音查询结果,以决定单字发音的语境。
步骤S15从发音数据库中取得对应词句所包含的单字的单字发音数据,并根据语境测验单字发音数据。
完成单字匹配后,可进行词汇语境处理,先搜寻词句中是否有发音,若有,则根据规则词汇表判断出与此发音匹配的字词。
步骤S16,进行完单字匹配及词汇语境处理后,视需要可再进行破音处理,搜寻单字发音中是否具有破音,用来确认单字发音的语境的正确性。

Claims (4)

1.一种字词结合语境测验方法,其特征在于:该方法包含下列步骤:
1)提供具有多个单字的单字词库、规则词汇表及具有多个单字发音数据的发音数据库;
2)获得单字发音取得字词,并根据单字词库对字词进行单字匹配;
3)根据规则词汇表对字词进行词汇语境处理;
4)根据单字匹配结果及发音查询结果,决定单字发音的语境;
5)从发音数据库中取得对应单字发音所包含单字的单字发音数据,并根据语境测验对应的单字发音数据。
2.根据权利要求1所述的字词结合语境测验方法,其特征在于:所述规则词汇表记录会与前后词匹配发音的发音以及发音的破音规则。
3.根据权利要求1所述的字词结合语境测验方法,其特征在于:所述词汇语境处理搜寻单字发音中是否有发音,若有,则根据规则词汇表判断出与发音匹配的字词。
4.根据权利要求1所述的字词结合语境测验方法,其特征在于:所述方法包含步骤6)对单字发音进行破音处理,搜寻单字发音中是否具有破音。
CN201310465523.9A 2013-09-29 2013-09-29 字词结合语境测验方法 Withdrawn CN104516871A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310465523.9A CN104516871A (zh) 2013-09-29 2013-09-29 字词结合语境测验方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310465523.9A CN104516871A (zh) 2013-09-29 2013-09-29 字词结合语境测验方法

Publications (1)

Publication Number Publication Date
CN104516871A true CN104516871A (zh) 2015-04-15

Family

ID=52792196

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310465523.9A Withdrawn CN104516871A (zh) 2013-09-29 2013-09-29 字词结合语境测验方法

Country Status (1)

Country Link
CN (1) CN104516871A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106168945A (zh) * 2015-05-13 2016-11-30 卡西欧计算机株式会社 声音输出装置以及声音输出方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106168945A (zh) * 2015-05-13 2016-11-30 卡西欧计算机株式会社 声音输出装置以及声音输出方法
CN106168945B (zh) * 2015-05-13 2021-09-28 卡西欧计算机株式会社 声音输出装置以及声音输出方法

Similar Documents

Publication Publication Date Title
AU2016269531B2 (en) Device for extracting information from a dialog
CN109256152A (zh) 语音评分方法及装置、电子设备、存储介质
US8566076B2 (en) System and method for applying bridging models for robust and efficient speech to speech translation
CN109741732A (zh) 命名实体识别方法、命名实体识别装置、设备及介质
McTear et al. Voice application development for Android
US9959270B2 (en) Method and apparatus to model and transfer the prosody of tags across languages
CN112346696B (zh) 虚拟助理的语音比较
Cardenas et al. Siminchik: A speech corpus for preservation of southern quechua
KR20150042533A (ko) 복합 문장 분석 장치, 이를 위한 기록매체
Saunders et al. Towards using prosody to scaffold lexical meaning in robots
CN104516871A (zh) 字词结合语境测验方法
CN101707020B (zh) 汉字学习系统及其方法
Rusko et al. Recent advances in the Slovak dictation system for judicial domain
Gunarso et al. An overview of bppt’s indonesian language resources
Kabra et al. Auto spell suggestion for high quality speech synthesis in hindi
Fata Is my stress right or wrong? Studying the production of stress by non-native speaking teachers of English
CN103853705A (zh) 计算机汉语语音与外语语音实时语音字幕翻译方法
Bacatan et al. Detection of intra-sentential code-switching points using word bigram and unigram frequency count
CN111814433A (zh) 一种维吾尔语实体识别的方法、装置和电子设备
Andersson et al. WikiSpeech-enabling open source text-to-speech for Wikipedia.
Ibejih et al. EDUSTT: In-domain speech recognition for Nigerian accented educational contents in English
Hernández-Mena et al. Creating a grammar-based speech recognition parser for Mexican Spanish using HTK, compatible with CMU Sphinx-III system
Kamath et al. English to Konkani Translator Using Hindi as a Pivot Language
Caelen-Haumont et al. Comparison between two models of language for the automatic phonetic labeling of an undocumented language of the South-Asia: the case of Mo Piu.
CN104517604A (zh) 将英文字句合成装置及方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C04 Withdrawal of patent application after publication (patent law 2001)
WW01 Invention patent application withdrawn after publication

Application publication date: 20150415