CN109346108B - 一种作业检查方法及系统 - Google Patents

一种作业检查方法及系统 Download PDF

Info

Publication number
CN109346108B
CN109346108B CN201811430260.7A CN201811430260A CN109346108B CN 109346108 B CN109346108 B CN 109346108B CN 201811430260 A CN201811430260 A CN 201811430260A CN 109346108 B CN109346108 B CN 109346108B
Authority
CN
China
Prior art keywords
sentence
audio information
pattern structure
word
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811430260.7A
Other languages
English (en)
Other versions
CN109346108A (zh
Inventor
崔颖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Genius Technology Co Ltd
Original Assignee
Guangdong Genius Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Genius Technology Co Ltd filed Critical Guangdong Genius Technology Co Ltd
Priority to CN201811430260.7A priority Critical patent/CN109346108B/zh
Publication of CN109346108A publication Critical patent/CN109346108A/zh
Application granted granted Critical
Publication of CN109346108B publication Critical patent/CN109346108B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/183Speech classification or search using natural language modelling using context dependencies, e.g. language models
    • G10L15/19Grammatical context, e.g. disambiguation of the recognition hypotheses based on word sequence rules
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/183Speech classification or search using natural language modelling using context dependencies, e.g. language models
    • G10L15/19Grammatical context, e.g. disambiguation of the recognition hypotheses based on word sequence rules
    • G10L15/193Formal grammars, e.g. finite state automata, context free grammars or word networks

Abstract

本发明属于数据处理领域,公开了一种作业检查方法及系统,其方法包括:采集用户看图说话时的音频信息;对所述音频信息进行处理,得到所述音频信息中的句子的句式结构;根据所述音频信息中的句子的句式结构,判断所述音频信息中的句子是否符合语法结构。本发明通过采集用户看图说话时的音频信息,然后对该音频信息进行处理,以得到音频信息中各个句子的句式结构,根据该句式结构即可判断出音频信息中的各个句子是否符合语法结构,从而实现检查用户看图说话作业是否存在语法错误的目的,无需老师亲自进行检查,使学生可进行自我学习或由家长通过该方法辅导学生进行检查学习,有利于学生的学习进步。

Description

一种作业检查方法及系统
技术领域
本发明属于语音处理技术领域,特别涉及一种作业检查方法及系统。
背景技术
看图写作文是低年级学生比较重要的一种作文类型,因为低年级学生的年纪较小,理解能力和直接表达能力不够,所以需要用图片的形式来引导低年级学生写出作文。对于一年级的学生,由于会写的字不多,所以更多的是看图说话,先引导孩子学会说,学会表达,等有一定的识字基础之后,再进行写作。
目前,对于看图说话类作文都是老师一对一的进行检查,而一个班级的学生很多,老师无法对学生所有的看图说话作文都进行检查,学生无法知晓自己的看图说话作文中是否存在语法等错误,不利于学生的自我学习和进步。
发明内容
本发明的目的是提供一种作业检查方法及系统,实现自动检查学生的看图说话作业中是否存在语法错误的目的,使学生可进行自我学习,有利于学生的学习进步。
本发明提供的技术方案如下:
一方面,提供一种作业检查方法,包括:
采集用户看图说话时的音频信息;
对所述音频信息进行处理,得到所述音频信息中的句子的句式结构;
根据所述音频信息中的句子的句式结构,判断所述音频信息中的句子是否符合语法结构。
进一步优选地,所述采集用户看图说话时的音频信息之前包括:
构建字词库,并获取所述字词库中的字词的音频波形及词性;
所述对所述音频信息进行处理,得到所述音频信息中的句子的句式结构具体包括:
将所述音频信息中的句子的音频波形与所述字词库中的字词的音频波形进行对比,在所述字词库中查找到与所述音频信息中的句子的音频波形相匹配的字词;
根据所述相匹配的字词的词性,识别出所述音频信息中的句子的句式结构。
进一步优选地,所述采集用户看图说话时的音频信息之前包括:
构建字词库,并获取所述字词库中的字词的词性;
所述对所述音频信息进行处理,得到所述音频信息中的句子的句式结构具体包括:
将所述音频信息中的句子识别为文本信息;
对所述音频信息中的句子对应的文本信息进行分词处理,得到对应的关键字词;
在所述字词库中查找到与所述关键字词相匹配的字词作为目标字词;
根据所述目标字词的词性,识别出所述音频信息中的句子的句式结构。
进一步优选地,所述根据所述音频信息中的句子的句式结构,判断所述音频信息中的句子是否符合语法结构具体包括:
将所述音频信息中的句子的句式结构与预设的句式结构库中的句式结构进行匹配;
当所述音频信息中的句子的句式结构与所述预设的句式结构库中的句式结构相匹配时,则判定所述音频信息中的句子符合语法结构;
当所述音频信息中的句子的句式结构与所述预设的句式结构库中的句式结构无法匹配时,则判定所述音频信息中的句子不符合语法结构。
进一步优选地,所述根据所述音频信息中的句子的句式结构,判断所述音频信息中的句子是否符合语法结构之后还包括:
当所述音频信息中的句子不符合语法结构时,输出所述音频信息中对应的句子的文本信息、句式结构及错误分析结果。
另一方面,还提供一种作业检查系统,包括:
音频信息采集模块,用于采集用户看图说话时的音频信息;
音频信息处理模块,用于对所述音频信息进行处理,得到所述音频信息中的句子的句式结构;
判断模块,用于根据所述音频信息中的句子的句式结构,判断所述音频信息中的句子是否符合语法结构。
进一步优选地,所述系统还包括字词库构建模块,
所述字词库构建模块,用于构建字词库,并获取所述字词库中的字词的音频波形及词性;
所述音频信息处理模块包括:
字词查找单元,用于将所述音频信息中的句子的音频波形与所述字词库中的字词的音频波形进行对比,在所述字词库中查找到与所述音频信息中的句子的音频波形相匹配的字词;
句式结构识别单元,用于根据所述相匹配的字词的词性,识别出所述音频信息中的句子的句式结构。
进一步优选地,所述系统还包括字词库构建模块,
所述字词库构建模块,用于构建字词库,并获取所述字词库中的字词的词性;
所述音频信息处理模块包括:
文本信息识别单元,用于将所述音频信息中的句子识别为文本信息;
分词处理单元,用于对所述音频信息中的句子对应的文本信息进行分词处理,得到对应的关键字词;
字词查找单元,用于在所述字词库中查找到与所述关键字词相匹配的字词作为目标字词;
句式结构识别单元,用于根据所述目标字词的词性,识别出所述音频信息中的句子的句式结构。
进一步优选地,所述判断模块包括:
匹配单元,用于将所述音频信息中的句子的句式结构与预设的句式结构库中的句式结构进行匹配;
判定单元,用于当所述音频信息中的句子的句式结构与所述预设的句式结构库中的句式结构相匹配时,则判定所述音频信息中的句子符合语法结构;
所述判定单元,还用于当所述音频信息中的句子的句式结构与所述预设的句式结构库中的句式结构无法匹配时,则判定所述音频信息中的句子不符合语法结构。
进一步优选地,所述系统还包括:
输出模块,用于当所述音频信息中的句子不符合语法结构时,输出所述音频信息中对应的句子的文本信息、句式结构及错误分析结果。
与现有技术相比,本发明提供的一种作业检查方法及系统具有以下有益效果:
1、本发明通过采集用户看图说话时的音频信息,然后对该音频信息进行处理,以得到音频信息中各个句子的句式结构,根据该句式结构即可判断出音频信息中的各个句子是否符合语法结构,从而实现检查用户看图说话作业是否存在语法错误的目的,无需老师亲自进行检查,使学生可进行自我学习或由家长通过该方法辅导学生进行检查学习,有利于学生的学习进步。
2、在本发明一优选实施例中,通过获取不同词性的各个字词的音频波形,然后将获取的用户看图说话时的音频信息与不同词性的各个字词进行比对,找到相匹配的字词,根据相匹配的字词的词性即可得到音频信息中各个句子的句式结构;直接将音频信息的波形与预先构建的字词库中的字词的波形进行对比,可快速得到音频信息中的句子的句式结构,提高音频信息的处理效率。
3、在本发明一优选实施例中,当判断音频信息中的句子不符合语法结构时,输出对应的句子的文本信息、句式结构及错误分析结果可帮助家长分析学生产生错误的地方,以便学生进行改正。
附图说明
下面将以明确易懂的方式,结合附图说明优选实施方式,对一种作业检查方法及系统的上述特性、技术特征、优点及其实现方式予以进一步说明。
图1是本发明一种作业检查方法的第一实施例的流程示意图;
图2是本发明一种作业检查方法的第二实施例的流程示意图;
图3是本发明一种作业检查方法的第三实施例的流程示意图;
图4是本发明一种作业检查方法的第四实施例的流程示意图;
图5是本发明一种作业检查方法的第五实施例的流程示意图;
图6是本发明一种作业检查方法的第六实施例的流程示意图;
图7是本发明一种作业检查方法的第七实施例的流程示意图;
图8是本发明一种作业检查系统的一个实施例的结构示意框图;
图9是本发明一种作业检查系统的另一个实施例的结构示意框图;
图10是本发明一种作业检查系统的再一个实施例的结构示意框图。
附图标号说明
10、字词库构建模块; 100、音频信息采集模块;
200、音频信息处理模块; 210、字词查找单元;
220、句式结构识别单元; 230、文本信息识别单元;
240、分词处理单元; 250、字词查找单元;
260、句式结构识别单元; 300、判断模块;
310、匹配单元; 320、判定单元;
400、输出模块。
具体实施方式
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对照附图说明本发明的具体实施方式。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图,并获得其他的实施方式。
为使图面简洁,各图中只示意性地表示出了与本发明相关的部分,它们并不代表其作为产品的实际结构。另外,以使图面简洁便于理解,在有些图中具有相同结构或功能的部件,仅示意性地绘示了其中的一个,或仅标出了其中的一个。在本文中,“一个”不仅表示“仅此一个”,也可以表示“多于一个”的情形。
根据本发明提供的第一实施例,如图1所示,一种作业检查方法,包括:
S100采集用户看图说话时的音频信息;
具体地,当用户在完成看图说话作文时,智能学习设备如家教机等通过麦克风采集用户看图说话时的音频信息,该音频信息可以是一段音频,也可以是一句音频。
S200对所述音频信息进行处理,得到所述音频信息中的句子的句式结构;
具体地,采集到用户看图说话时的音频信息后,对该音频信息进行处理,得到音频信息中的每个句子的句式结构,句式结构是指句子的结构,如基本句式结构主语+谓语+宾语,以及在基本句式结构中添加定语、状语或补语后形成的新的句式结构:定语+主语+谓语+宾语、主语+状语+谓语+宾语、主语+状语+谓语+补语+宾语、主语+谓语+定语+宾语等。
对音频信息进行处理时,可一边采集一边进行处理,即采集到用户说完一句话时,即对该句话进行处理,识别出该句话的句式结构,并根据该句式结构判断该句话是否符合语法结构;或者在采集完用户当前看图说话时的所有音频信息后再对音频信息进行处理,得到音频信息中的每个句子的句式结构。
S300根据所述音频信息中的句子的句式结构,判断所述音频信息中的句子是否符合语法结构。
具体地,得到音频信息中的每个句子的句式结构后,根据得到的每个句子的句式结构即可判断出音频信息中的哪些句子符合语法结构,哪些句子不符合语法结构。通过判断音频信息中的句子是否符合语法结构即可使学生对自己的看图说话作业进行自我检查,或者由家长根据判断结果对学生的看图说话作业进行检查,而无需老师进行一对一检查,不仅可节省老师的教学时间,而且方便学生进行练习,从而提高学生的学习效果。
本发明通过采集用户看图说话时的音频信息,然后对该音频信息进行处理,以得到音频信息中各个句子的句式结构,根据该句式结构即可判断出音频信息中的各个句子是否符合语法结构,从而实现检查用户看图说话作业是否存在语法错误的目的,无需老师亲自进行检查,使学生可进行自我学习或由家长通过该方法辅导学生进行检查学习,有利于学生的学习进步。
根据本发明提供的第二实施例,如图2所示,一种作业检查方法,包括:
S010构建字词库,并获取所述字词库中的字词的音频波形及词性;
具体地,先构建字词库,获取字词库中的字或词的词性,并根据字或词的词性进行分类,如将名词分为一类,动词分为一类,形容词分为一类,副词分为一类等;对字词库中的字词按词性进行分类后,获取字词库中的字词的音频波形。字词的音频波形可从网络下下载得到,也可从音频资料中截取得到,或者由人工语音输入得到。
S100采集用户看图说话时的音频信息;
具体地,在学习设备或服务器上构建字词库后,根据用户输入的信息唤醒学习设备(如家教机)上的检查看图说话作业功能,然后通过学习设备上的麦克风开始采集用户看图说话时的音频信息。
S210将所述音频信息中的句子的音频波形与所述字词库中的字词的音频波形进行对比,在所述字词库中查找到与所述音频信息中的句子的音频波形相匹配的字词;
具体地,采集到用户看图说话时的音频信息后,将音频信息中的句子的音频波形与构建的字词库中的字词的音频波形进行对比,以在字词库中查找到与音频信息中的句子的音频波形相匹配的字词。
在将采集到的音频信息与字词库中的字词的音频波形进行对比时,可一边采集一边对比,也可全部采集完后再进行对比。不管以哪种方式进行对比,都必须将音频信息中的完整句子的音频波形与字词库中的字词的音频波形进行对比。
S220根据所述相匹配的字词的词性,识别出所述音频信息中的句子的句式结构;
具体地,在字词库中查找出与音频信息中的句子的音频波形相匹配的字词后,根据该相匹配的字词的词性,识别出音频信息中的句子的句式结构。
在将音频信息中的句子的音频波形与字词库中的字词的音频波形进行对比时,是以完整的句子进行对比的,因此根据相匹配的字词的词性得到的句子的句式结构是该完整的句子的句式结构,即音频信息中的每个完整句子都对应有一个识别得到的句式结构。
在根据相匹配的字词的词性,识别出句子的句式结构时,由于有些字词同时具有多种词性,此时根据这些字词的所有词性分别得到一个句式结构,即可能存在某个句子得到对应的多个句式结构。
S300根据所述音频信息中的句子的句式结构,判断所述音频信息中的句子是否符合语法结构。
具体地,在根据句子的句式结构,判断该句子是否符合语法结构时,若某个句子对应有多个句式结构,则当该多个句式结构中存在一个句式结构符合语法结构时,则认为该句子符合语法结构。
在本实施例中,通过获取不同词性的各个字词的音频波形,然后将获取的用户看图说话时的音频信息与不同词性的各个字词进行比对,找到相匹配的字词,根据相匹配的字词的词性即可得到音频信息中各个句子的句式结构;直接将音频信息的波形与预先构建的字词库中的字词的波形进行对比,可快速得到音频信息中的句子的句式结构,提高音频信息的处理效率。
根据本发明提供的第三实施例,如图3所示,一种作业检查方法,包括:
S020构建字词库,并获取所述字词库中的字词的词性;
具体地,先构建字词库,获取字词库中的字或词的词性,并根据字或词的词性进行分类,如将名词分为一类,动词分为一类,形容词分为一类,副词分为一类等。
S100采集用户看图说话时的音频信息;
具体地,在学习设备或服务器上构建字词库后,根据用户输入的信息唤醒学习设备(如家教机)上的检查看图说话作业功能,然后通过学习设备上的麦克风开始采集用户看图说话时的音频信息。
S230将所述音频信息中的句子识别为文本信息;
具体地,采集到用户的音频信息后,先将该音频信息中的所有句子都识别为文本信息,在将音频信息识别为文本信息时,可全部采集完音频信息中的句子后再进行转换,也可一边采集一边转换,即采集到一个句子就进行转换,一边采集一边转换可提高音频信息的转换效率。
S240对所述音频信息中的句子对应的文本信息进行分词处理,得到对应的关键字词;
具体地,将音频信息识别为文本信息后,对每个句子对应的文本信息进行分词处理,得到句子中的关键字词。分词是指剔除不能反映内容特征的停止词,如剔除“的”、“是”、“在”等。
S250在所述字词库中查找到与所述关键字词相匹配的字词作为目标字词;
具体地,得到每个句子的关键字词后,在预先构建的字词库中查找与每个句子中的关键字词相匹配的字词作为目标字词。
S260根据所述目标字词的词性,识别出所述音频信息中的句子的句式结构;
具体地,查找到每个句子中的关键字词对应的目标字词后,即可根据目标字词的词性,识别出音频信息中每个句子的句式结构。
在根据目标字词的词性,识别出句子的句式结构时,由于有些字词同时具有多种词性,此时根据这些字词的所有词性分别得到一个句式结构,即可能存在某个句子得到对应的多个句式结构。
S300根据所述音频信息中的句子的句式结构,判断所述音频信息中的句子是否符合语法结构。
具体地,在根据句子的句式结构,判断该句子是否符合语法结构时,若某个句子对应有多个句式结构,则当该多个句式结构中存在一个句式结构符合语法结构时,则认为该句子符合语法结构。
根据本发明提供的第四实施例,如图4所示,一种作业检查方法,包括:
S100采集用户看图说话时的音频信息;
S200对所述音频信息进行处理,得到所述音频信息中的句子的句式结构;
S310将所述音频信息中的句子的句式结构与预设的句式结构库中的句式结构进行匹配;
具体地,为了方便判断音频信息中的每个句子的句式结构是否符合语法结构,可预先设置句式结构库,句式结构库中包含目前常用的句式结构,如句式结构库中包含的句式结构为:主语+谓语+宾语、定语+主语+谓语+宾语、主语+状语+谓语+宾语、主语+状语+谓语+补语+宾语、主语+谓语+定语+宾语等。
得到音频信息中每个句子的句式结构后,将每个句子的句式结构与句式结构库中的每个句式结构进行匹配。
S320当所述音频信息中的句子的句式结构与所述预设的句式结构库中的句式结构相匹配时,则判定所述音频信息中的句子符合语法结构;
具体地,当音频信息中的当前句子的句式结构与预设的句式结构库中的某一个句式结构相匹配时,则说明该当前句子符合语法结构。即将音频信息中的每个句子的句式结构分别与句式结构库中的句式结构进行匹配,当某一句子的句式结构与句式结构库中的句式结构匹配时,说明该某一句子符合语法结构。
S330当所述音频信息中的句子的句式结构与所述预设的句式结构库中的句式结构无法匹配时,则判定所述音频信息中的句子不符合语法结构。
具体地,当音频信息中的某一句子的句式结构与预设的句式结构库中的所有句式结构都无法匹配时,说明该某一句子不符合语法结构。
根据本发明提供的第五实施例,如图5所示,一种作业检查方法,包括:
S010构建字词库,并获取所述字词库中的字词的音频波形及词性;
S100采集用户看图说话时的音频信息;
S210将所述音频信息中的句子的音频波形与所述字词库中的字词的音频波形进行对比,在所述字词库中查找到与所述音频信息中的句子的音频波形相匹配的字词;
S220根据所述相匹配的字词的词性,识别出所述音频信息中的句子的句式结构;
S310将所述音频信息中的句子的句式结构与预设的句式结构库中的句式结构进行匹配;
S320当所述音频信息中的句子的句式结构与所述预设的句式结构库中的句式结构相匹配时,则判定所述音频信息中的句子符合语法结构;
S330当所述音频信息中的句子的句式结构与所述预设的句式结构库中的句式结构无法匹配时,则判定所述音频信息中的句子不符合语法结构。
本实施例中各个步骤的具体描述已在上述对应的实施例中进行了详细描述,此处将不做详细阐述说明。
根据本发明提供的第六实施例,如图6所示,一种作业检查方法,包括:
S020构建字词库,并获取所述字词库中的字词的词性;
S100采集用户看图说话时的音频信息;
S230将所述音频信息中的句子识别为文本信息;
S240对所述音频信息中的句子对应的文本信息进行分词处理,得到对应的关键字词;
S250在所述字词库中查找到与所述关键字词相匹配的字词作为目标字词;
S260根据所述目标字词的词性,识别出所述音频信息中的句子的句式结构;
S310将所述音频信息中的句子的句式结构与预设的句式结构库中的句式结构进行匹配;
S320当所述音频信息中的句子的句式结构与所述预设的句式结构库中的句式结构相匹配时,则判定所述音频信息中的句子符合语法结构;
S330当所述音频信息中的句子的句式结构与所述预设的句式结构库中的句式结构无法匹配时,则判定所述音频信息中的句子不符合语法结构。
本实施例中各个步骤的具体描述已在上述对应的实施例中进行了详细描述,此处将不做详细阐述说明。
根据本发明提供的第七实施例,如图7所示,一种作业检查方法,包括:
S100采集用户看图说话时的音频信息;
S200对所述音频信息进行处理,得到所述音频信息中的句子的句式结构;
S300根据所述音频信息中的句子的句式结构,判断所述音频信息中的句子是否符合语法结构;
S400当所述音频信息中的句子不符合语法结构时,输出所述音频信息中对应的句子的文本信息、句式结构及错误分析结果。
具体地,当判断音频信息中的某一个句子不符合语法结构时,将该句子转换为文本信息,并根据该句子的句式结构分析该句式结构错在哪里,然后将该句子的文本信息、句式结构及错误分析结果输出给用户,以便用户家长根据输出信息辅导用户对看图说话作业进行更正。
本实施例中,当判断音频信息中的句子不符合语法结构时,输出对应的句子的文本信息、句式结构及错误分析结果可帮助家长分析学生产生错误的地方,以便学生进行改正。
根据本发明提供的第八实施例,如图8所示,一种作业检查系统,包括:
音频信息采集模块100,用于采集用户看图说话时的音频信息;
具体地,当用户在完成看图说话作文时,智能学习设备如家教机等通过麦克风采集用户看图说话时的音频信息,该音频信息可以是一段音频,也可以是一句音频。
音频信息处理模块200,用于对所述音频信息进行处理,得到所述音频信息中的句子的句式结构;
具体地,采集到用户看图说话时的音频信息后,对该音频信息进行处理,得到音频信息中的每个句子的句式结构,句式结构是指句子的结构,如基本句式结构主语+谓语+宾语,以及在基本句式结构中添加定语、状语或补语后形成的新的句式结构:定语+主语+谓语+宾语、主语+状语+谓语+宾语、主语+状语+谓语+补语+宾语、主语+谓语+定语+宾语等。
对音频信息进行处理时,可一边采集一边进行处理,即采集到用户说完一句话时,即对该句话进行处理,识别出该句话的句式结构,并根据该句式结构判断该句话是否符合语法结构;或者在采集完用户当前看图说话时的所有音频信息后再对音频信息进行处理,得到音频信息中的每个句子的句式结构。
判断模块300,用于根据所述音频信息中的句子的句式结构,判断所述音频信息中的句子是否符合语法结构。
具体地,得到音频信息中的每个句子的句式结构后,根据得到的每个句子的句式结构即可判断出音频信息中的哪些句子符合语法结构,哪些句子不符合语法结构。通过判断音频信息中的句子是否符合语法结构即可使学生对自己的看图说话作业进行自我检查,或者由家长根据判断结果对学生的看图说话作业进行检查,而无需老师进行一对一检查,不仅可节省老师的教学时间,而且方便学生进行练习,从而提高学生的学习效果。
本发明通过采集用户看图说话时的音频信息,然后对该音频信息进行处理,以得到音频信息中各个句子的句式结构,根据该句式结构即可判断出音频信息中的各个句子是否符合语法结构,从而实现检查用户看图说话作业是否存在语法错误的目的,无需老师亲自进行检查,使学生可进行自我学习或由家长通过该方法辅导学生进行检查学习,有利于学生的学习进步。
根据本发明提供的第九实施例,如图9所示,一种作业检查系统,包括:
音频信息采集模块100,用于采集用户看图说话时的音频信息;
音频信息处理模块200,用于对所述音频信息进行处理,得到所述音频信息中的句子的句式结构;
判断模块300,用于根据所述音频信息中的句子的句式结构,判断所述音频信息中的句子是否符合语法结构。
具体地,在根据句子的句式结构,判断该句子是否符合语法结构时,若某个句子对应有多个句式结构,则当该多个句式结构中存在一个句式结构符合语法结构时,则认为该句子符合语法结构。
在本实施例中,通过获取不同词性的各个字词的音频波形,然后将获取的用户看图说话时的音频信息与不同词性的各个字词进行比对,找到相匹配的字词,根据相匹配的字词的词性即可得到音频信息中各个句子的句式结构;直接将音频信息的波形与预先构建的字词库中的字词的波形进行对比,可快速得到音频信息中的句子的句式结构,提高音频信息的处理效率。
优选地,所述系统还包括字词库构建模块10,
所述字词库构建模块10,用于构建字词库,并获取所述字词库中的字词的音频波形及词性;
具体地,先构建字词库,获取字词库中的字或词的词性,并根据字或词的词性进行分类,如将名词分为一类,动词分为一类,形容词分为一类,副词分为一类等;对字词库中的字词按词性进行分类后,获取字词库中的字词的音频波形。字词的音频波形可从网络下下载得到,也可从音频资料中截取得到,或者由人工语音输入得到。
所述音频信息处理模块200包括:
字词查找单元210,用于将所述音频信息中的句子的音频波形与所述字词库中的字词的音频波形进行对比,在所述字词库中查找到与所述音频信息中的句子的音频波形相匹配的字词;
具体地,采集到用户看图说话时的音频信息后,将音频信息中的句子的音频波形与构建的字词库中的字词的音频波形进行对比,以在字词库中查找到与音频信息中的句子的音频波形相匹配的字词。
在将采集到的音频信息与字词库中的字词的音频波形进行对比时,可一边采集一边对比,也可全部采集完后再进行对比。不管以哪种方式进行对比,都必须将音频信息中的完整句子的音频波形与字词库中的字词的音频波形进行对比。
句式结构识别单元220,用于根据所述相匹配的字词的词性,识别出所述音频信息中的句子的句式结构。
具体地,在字词库中查找出与音频信息中的句子的音频波形相匹配的字词后,根据该相匹配的字词的词性,识别出音频信息中的句子的句式结构。
在将音频信息中的句子的音频波形与字词库中的字词的音频波形进行对比时,是以完整的句子进行对比的,因此根据相匹配的字词的词性得到的句子的句式结构是该完整的句子的句式结构,即音频信息中的每个完整句子都对应有一个识别得到的句式结构。
在根据相匹配的字词的词性,识别出句子的句式结构时,由于有些字词同时具有多种词性,此时根据这些字词的所有词性分别得到一个句式结构,即可能存在某个句子得到对应的多个句式结构。
优选地,所述判断模块300包括:
匹配单元310,用于将所述音频信息中的句子的句式结构与预设的句式结构库中的句式结构进行匹配;
具体地,为了方便判断音频信息中的每个句子的句式结构是否符合语法结构,可预先设置句式结构库,句式结构库中包含目前常用的句式结构,如句式结构库中包含的句式结构为:主语+谓语+宾语、定语+主语+谓语+宾语、主语+状语+谓语+宾语、主语+状语+谓语+补语+宾语、主语+谓语+定语+宾语等。
得到音频信息中每个句子的句式结构后,将每个句子的句式结构与句式结构库中的每个句式结构进行匹配。
判定单元320,用于当所述音频信息中的句子的句式结构与所述预设的句式结构库中的句式结构相匹配时,则判定所述音频信息中的句子符合语法结构;
所述判定单元320,还用于当所述音频信息中的句子的句式结构与所述预设的句式结构库中的句式结构无法匹配时,则判定所述音频信息中的句子不符合语法结构。
具体地,当音频信息中的当前句子的句式结构与预设的句式结构库中的某一个句式结构相匹配时,则说明该当前句子符合语法结构。即将音频信息中的每个句子的句式结构分别与句式结构库中的句式结构进行匹配,当某一句子的句式结构与句式结构库中的句式结构匹配时,说明该某一句子符合语法结构。当音频信息中的某一句子的句式结构与预设的句式结构库中的所有句式结构都无法匹配时,说明该某一句子不符合语法结构。
优选地,所述系统还包括:
输出模块400,用于当所述音频信息中的句子不符合语法结构时,输出所述音频信息中对应的句子的文本信息、句式结构及错误分析结果。
具体地,当判断音频信息中的某一个句子不符合语法结构时,将该句子转换为文本信息,并根据该句子的句式结构分析该句式结构错在哪里,然后将该句子的文本信息、句式结构及错误分析结果输出给用户,以便用户家长根据输出信息辅导用户对看图说话作业进行更正。
本实施例中,当判断音频信息中的句子不符合语法结构时,输出对应的句子的文本信息、句式结构及错误分析结果可帮助家长分析学生产生错误的地方,以便学生进行改正。
根据本发明提供的第十实施例,一种作业检查系统,本实施例与上述第九实施例的区别在于:
所述字词库构建模块10,用于构建字词库,并获取所述字词库中的字词的词性;
具体地,先构建字词库,获取字词库中的字或词的词性,并根据字或词的词性进行分类,如将名词分为一类,动词分为一类,形容词分为一类,副词分为一类等。
如图10所示,所述音频信息处理模块200包括:
文本信息识别单元230,用于将所述音频信息中的句子识别为文本信息;
具体地,采集到用户的音频信息后,先将该音频信息中的所有句子都识别为文本信息,在将音频信息识别为文本信息时,可全部采集完音频信息中的句子后再进行转换,也可一边采集一边转换,即采集到一个句子就进行转换,一边采集一边转换可提高音频信息的转换效率。
分词处理单元240,用于对所述音频信息中的句子对应的文本信息进行分词处理,得到对应的关键字词;
具体地,将音频信息识别为文本信息后,对每个句子对应的文本信息进行分词处理,得到句子中的关键字词。分词是指剔除不能反映内容特征的停止词,如剔除“的”、“是”、“在”等。
字词查找单元250,用于在所述字词库中查找到与所述关键字词相匹配的字词作为目标字词;
具体地,得到每个句子的关键字词后,在预先构建的字词库中查找与每个句子中的关键字词相匹配的字词作为目标字词。
句式结构识别单元260,用于根据所述目标字词的词性,识别出所述音频信息中的句子的句式结构。
具体地,查找到每个句子中的关键字词对应的目标字词后,即可根据目标字词的词性,识别出音频信息中每个句子的句式结构。
在根据目标字词的词性,识别出句子的句式结构时,由于有些字词同时具有多种词性,此时根据这些字词的所有词性分别得到一个句式结构,即可能存在某个句子得到对应的多个句式结构。
应当说明的是,上述实施例均可根据需要自由组合。以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (6)

1.一种作业检查方法,其特征在于,包括:
采集用户看图说话时的音频信息;
对所述音频信息进行处理,得到所述音频信息中的句子的句式结构;
根据所述音频信息中的句子的句式结构,判断所述音频信息中的句子是否符合语法结构;
其中,所述对所述音频信息进行处理,得到所述音频信息中的句子的句式结构具体包括:
将所述音频信息中的句子的音频波形与字词库中的字词的音频波形进行对比,在所述字词库中查找到与所述音频信息中的句子的音频波形相匹配的字词;
根据所述相匹配的字词的词性,识别出所述音频信息中的句子的句式结构
所述根据所述音频信息中的句子的句式结构,判断所述音频信息中的句子是否符合语法结构具体包括:
将所述音频信息中的句子的句式结构与预设的句式结构库中的句式结构进行匹配;
当所述音频信息中的句子的句式结构与所述预设的句式结构库中的句式结构相匹配时,则判定所述音频信息中的句子符合语法结构;
当所述音频信息中的句子的句式结构与所述预设的句式结构库中的句式结构无法匹配时,则判定所述音频信息中的句子不符合语法结构。
2.根据权利要求1所述的一种作业检查方法,其特征在于,所述采集用户看图说话时的音频信息之前包括:
构建字词库,并获取所述字词库中的字词的音频波形及词性。
3.根据权利要求1所述的一种作业检查方法,其特征在于,所述根据所述音频信息中的句子的句式结构,判断所述音频信息中的句子是否符合语法结构之后还包括:
当所述音频信息中的句子不符合语法结构时,输出所述音频信息中对应的句子的文本信息、句式结构及错误分析结果。
4.一种作业检查系统,其特征在于,包括:
音频信息采集模块,用于采集用户看图说话时的音频信息;
音频信息处理模块,用于对所述音频信息进行处理,得到所述音频信息中的句子的句式结构;
判断模块,用于根据所述音频信息中的句子的句式结构,判断所述音频信息中的句子是否符合语法结构;
其中,所述音频信息处理模块包括:
字词查找单元,用于将所述音频信息中的句子的音频波形与字词库中的字词的音频波形进行对比,在所述字词库中查找到与所述音频信息中的句子的音频波形相匹配的字词;
句式结构识别单元,用于根据所述相匹配的字词的词性,识别出所述音频信息中的句子的句式结构
所述判断模块包括:
匹配单元,用于将所述音频信息中的句子的句式结构与预设的句式结构库中的句式结构进行匹配;
判定单元,用于当所述音频信息中的句子的句式结构与所述预设的句式结构库中的句式结构相匹配时,则判定所述音频信息中的句子符合语法结构;
所述判定单元,还用于当所述音频信息中的句子的句式结构与所述预设的句式结构库中的句式结构无法匹配时,则判定所述音频信息中的句子不符合语法结构。
5.根据权利要求4所述的一种作业检查系统,其特征在于,所述系统还包括字词库构建模块,
所述字词库构建模块,用于构建字词库,并获取所述字词库中的字词的音频波形及词性。
6.根据权利要求4所述的一种作业检查系统,其特征在于,所述系统还包括:
输出模块,用于当所述音频信息中的句子不符合语法结构时,输出所述音频信息中对应的句子的文本信息、句式结构及错误分析结果。
CN201811430260.7A 2018-11-28 2018-11-28 一种作业检查方法及系统 Active CN109346108B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811430260.7A CN109346108B (zh) 2018-11-28 2018-11-28 一种作业检查方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811430260.7A CN109346108B (zh) 2018-11-28 2018-11-28 一种作业检查方法及系统

Publications (2)

Publication Number Publication Date
CN109346108A CN109346108A (zh) 2019-02-15
CN109346108B true CN109346108B (zh) 2022-07-12

Family

ID=65318734

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811430260.7A Active CN109346108B (zh) 2018-11-28 2018-11-28 一种作业检查方法及系统

Country Status (1)

Country Link
CN (1) CN109346108B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110379214A (zh) * 2019-06-27 2019-10-25 武汉职业技术学院 一种基于语音识别的看图写话训练方法及装置
CN113051985A (zh) * 2019-12-26 2021-06-29 深圳云天励飞技术有限公司 信息提示方法、装置、电子设备及存储介质
CN112116839A (zh) * 2020-08-14 2020-12-22 爱语科技(广州)有限公司 基于语义特征符号的语言学习互动方法、系统和存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6988063B2 (en) * 2002-02-12 2006-01-17 Sunflare Co., Ltd. System and method for accurate grammar analysis using a part-of-speech tagged (POST) parser and learners' model
CN101635688A (zh) * 2008-07-21 2010-01-27 英业达股份有限公司 即时消息的语言验证系统及方法
CN101788992A (zh) * 2009-05-06 2010-07-28 厦门东南融通系统工程有限公司 一种数据库查询语句的转换方法和转换系统
CN104239304B (zh) * 2013-06-07 2018-08-21 华为技术有限公司 一种数据处理的方法、装置以及设备
CN108519974A (zh) * 2018-03-31 2018-09-11 华南理工大学 英语作文语法错误自动检测与分析方法

Also Published As

Publication number Publication date
CN109346108A (zh) 2019-02-15

Similar Documents

Publication Publication Date Title
CN110110585B (zh) 基于深度学习的智能阅卷实现方法及系统、计算机程序
CN105845134B (zh) 自由朗读题型的口语评测方法及系统
Jarvis Comparison-based and detection-based approaches to transfer research
CN109815491B (zh) 答题评分方法、装置、计算机设备及存储介质
CN104503998B (zh) 针对用户查询句的类型识别方法及装置
CN109346108B (zh) 一种作业检查方法及系统
KR20130128716A (ko) 어학 학습 시스템 및 학습 방법
CN108319588B (zh) 文本情感分析系统及方法、存储介质
CN110347787B (zh) 一种基于ai辅助面试场景的面试方法、装置及终端设备
CN108305618B (zh) 语音获取及搜索方法、智能笔、搜索终端及存储介质
CN111292751B (zh) 语义解析方法及装置、语音交互方法及装置、电子设备
CN108710653B (zh) 一种绘本朗读点播方法、装置及系统
JP6425493B2 (ja) 人の発言に基づいて学習項目に対する評価レベルを推定するプログラム、装置及び方法
KR101255957B1 (ko) 개체명 태깅 방법 및 장치
Sijimol et al. Handwritten short answer evaluation system (HSAES)
CN110675292A (zh) 一种基于人工智能的儿童语言能力评测方法
CN112052686B (zh) 一种用户交互式教育的语音学习资源推送方法
CN104572617A (zh) 一种口语考试偏题检测方法及装置
KR20130068624A (ko) 화자 그룹 기반 음성인식 장치 및 방법
CN110111011B (zh) 一种教学质量监管方法、装置及电子设备
US8666987B2 (en) Apparatus and method for processing documents to extract expressions and descriptions
CN113822052A (zh) 一种文本错误检测方法、装置、电子设备及存储介质
Larabi-Marie-Sainte et al. A new framework for Arabic recitation using speech recognition and the Jaro Winkler algorithm
CN112116181A (zh) 课堂质量模型的训练方法、课堂质量评价方法及装置
CN112767940B (zh) 一种语音培训识别方法、系统、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant