CN116701561B

CN116701561B - 与词典笔匹配的学习资源搜集方法及其系统

Info

Publication number: CN116701561B
Application number: CN202310683547.5A
Authority: CN
Inventors: 谢振辉; 王烈峰
Original assignee: Readboy Education Technology Co Ltd
Current assignee: Readboy Education Technology Co Ltd
Priority date: 2023-06-09
Filing date: 2023-06-09
Publication date: 2024-04-26
Anticipated expiration: 2043-06-09
Also published as: CN116701561A

Abstract

本发明涉及学习资源匹配技术领域，尤其涉及一种与词典笔匹配的学习资源搜集方法及其系统，包括数据获取模块获取若干资料完整的历史学习资料数据，数据处理模块根据历史学习资料数据中的年龄和数据评价结果对数据进行分类；中控模块提取各历史学习资料数据的特征词计算各特征词的频率，并设定特征词的级别；计算各数据单元中第一级别特征词的平均数量，对预设频率进行调节；所述语音模块针对用户的语音提问，将提问记录储存至电子档案，所述中控模块计算电子档案中的特征词与对应数据组中任一数据单元的第一级别特征词的第一匹配度S1和第二级别特征词的第二匹配度S2，并根据S1和S2匹配对应的匹配结果。本发明提高了学习资源匹配的准确性和效率。

Description

与词典笔匹配的学习资源搜集方法及其系统

技术领域

本发明涉及学习资源匹配技术领域，尤其涉及一种与词典笔匹配的学习资源搜集方法及其系统。

背景技术

随着科技和经济的不断发展，在日常学习过程中，辅助设备起到了越来越重要的作用。为了提高孩子的学习水平，家长通常会购买各种词典笔来辅助孩子学习外语。但是，由于很多家长的外语水平有限，无法对孩子的学习成果进行检查，为了孩子能够有更好的学习成果，匹配合适的学习资源尤为重要。

中国专利申请公开号：CN101882152公开了一种便携式学习机及其资源检索方法。便携式学习机的资源检索方法，包括如下步骤：关键字输入步骤：由输入单元输入关键字；逐级显示步骤：搜索出与该关键字对应的所有文件分类信息，据此，在显示单元上显示出与该文件分类信息相应的所有第一级分类属性名，并等待用户通过输入单元定位其中某一个第一级分类属性名，如用户选择打开相应的第一级分类属性名，则显示该第一级分类属性名下相应的所有第二级分类属性名，并按以上步骤逐级依次进行直至显示出末级分类属性名，并由用户通过输入单元进行选择操作，以显示出该末级分类属性名下所选文件名所对应的文件内容。

然而，学习资源不能一概而论，各学龄段的人学习情况均不相同，现有技术中便携式学习机及其资源检索方法在学习资源匹配时未对历史数据做详细分类，导致学习资源匹配的准确性和效率较低。

发明内容

为此，本发明提供一种与词典笔匹配的学习资源搜集方法及其系统，用以克服现有技术中在学习资源匹配时未对历史数据做详细分类，导致学习资源匹配的准确性和效率较低的问题。

为实现上述目的，一方面，本发明提供一种与词典笔匹配的学习资源搜集方法，包括：

步骤S1，数据获取模块获取若干资料完整的历史学习资料数据，数据处理模块根据用户学龄将所述历史学习资料数据划分为若干数据组，并根据数据评价结果分值将任一所述数据组划分为若干数据单元；

步骤S2，中控模块采用自然语言处理技术提取各所述历史学习资料数据的特征词，根据特征词的总数量和各特征词的数量计算各特征词的频率，并根据各特征词的频率与预设频率的比对结果设定特征词的级别；

步骤S3，所述中控模块统计各所述数据单元中第一级别特征词的数量以计算各数据单元中第一级别特征词的平均数量，若第一级别特征词的平均数量低于预设平均数量，则计算第一级别特征词的平均数量与预设平均数量的差值以对所述预设频率进行调节；

步骤S4，语音模块针对用户的语音提问，将提问记录储存至用户电子档案，所述中控模块提取用户电子档案中的特征词，并计算用户电子档案中的特征词与对应数据组中任一数据单元的第一级别特征词的第一匹配度S1和第二级别特征词的第二匹配度S2，并根据S1和S2匹配对应的匹配结果。

进一步地，在所述步骤S1中，所述数据处理模块根据用户学龄将所述历史学习资料数据划分为若干数据组，所述数据组包括大学数据组、高中数据组、初中数据组和幼儿数据组，数据处理模块中设有第一预设年龄L1、第二预设年龄L2和第三预设年龄L3，L1＜L2＜L3，数据处理模块将任一历史学习资料数据中的年龄L分别与L1、L2和L3进行比对，

当L≥L3时，所述数据处理模块将年龄L对应的历史学习资料数据划分为大学数据组；

当L2≤L＜L3时，所述数据处理模块将年龄L对应的历史学习资料数据划分为高中数据组；

当L1≤L＜L2时，所述数据处理模块将年龄L对应的历史学习资料数据划分为初中数据组；

当L＜L1时，所述数据处理模块将年龄L对应的历史学习资料数据划分为幼儿数据组。

进一步地，在所述步骤S1中，所述数据处理模块提取任一所述数据组中各所述历史学习资料数据的数据评价结果分值，并根据数据评价结果分值将该数据组划分为若干数据单元，所述数据单元包括第一数据单元、第二数据单元和第三数据单元，数据处理模块中设有第一预设分值F1和第二预设分值F2，F1＜F2，数据处理模块将任一所述数据组中各所述历史学习资料数据的数据评价结果分值F分别与F1和F2进行比对，

当F≥F2时，所述数据处理模块将数据评价结果分值F对应的历史学习资料数据划分为第一数据单元；

当F1≤F＜F2时，所述数据处理模块将数据评价结果分值F对应的历史学习资料数据划分为第二数据单元；

当F＜F1时，所述数据处理模块将数据评价结果分值F对应的历史学习资料数据划分为第三数据单元。

进一步地，在所述步骤S2中，所述中控模块提取各历史学习资料数据的特征词，统计任一所述数据单元中特征词的总数量N0和各特征词的数量N，中控模块根据N0和N计算该数据单元中各特征词的频率f，设定

所述中控模块中设有第一预设频率f1和第二预设频率f2，f1＜f2，中控模块将频率f分别与f1和f2进行比对，

当f≥f2时，所述中控模块将频率f对应的特征词设定为第一级别特征词；

当f1≤f＜f2时，所述中控模块将频率f对应的特征词设定为第二级别特征词；

当f＜f1时，所述中控模块将频率f对应的特征词设定为第三级别特征词。

进一步地，在所述步骤S3中，所述中控模块统计各所述数据单元中第一级别特征词的频率f1 i，计算各数据单元中第一级别特征词的平均频率f1 p，设定

其中，M为所述特征词的种类；

所述中控模块将第一级别特征词的平均频率f1 p与预设平均频率f10进行比对，

当f1 p≥f10时，所述中控模块判定第一级别特征词的平均频率符合标准；

当f1 p＜f10时，所述中控模块判定第一级别特征词的平均频率不符合标准。

进一步地，所述中控模块在判定第一级别特征词的平均频率不符合标准时，计算f1 p与f10的差值Δf并根据Δf对第一预设频率f1和第二预设频率f2进行调节，设定Δf＝f10-f1 p，其中，所述中控模块中设有第一预设差值Δf1、第二预设差值Δf2、第一预设调节系数α1、第二预设调节系数α2和第三预设调节系数α3，Δf1＜Δf2，0.9＜α1＜α2＜α3＜1，中控模块将Δf分别与Δf1和Δf2进行比对，

当Δf≥Δf2时，所述中控模块选用α1将第一预设频率调节至f1＇，设定f1＇＝f1×α1，将第二预设频率调节至f2＇，设定f2＇＝f2×α1；

当Δf1≤Δf＜Δf2时，所述中控模块选用α2将第一预设频率调节至f1＇，设定f1＇＝f1×α2，将第二预设频率调节至f2＇，设定f2＇＝f2×α2；

当Δf＜Δf1时，所述中控模块选用α3将第一预设频率调节至f1＇，设定f1＇＝f1×α3，将第二预设频率调节至f2＇，设定f2＇＝f2×α3。

进一步地，在所述步骤S4中，所述中控模块根据用户电子档案中的用户学龄调取对应数据组的数据，计算用户电子档案中的特征词与对应数据组中任一数据单元的第一级别特征词的第一匹配度S1和用户电子档案中的特征词与该数据单元的第二级别特征词的第二匹配度S2，设定S1＝用户电子档案中的特征词中存在的第一级别特征词的数量/对应数据组中任一数据单元中第一级别特征词的数量，S2＝用户电子档案中的特征词中存在的第二级别特征词的数量/该数据单元中第二级别特征词的数量。

进一步地，所述中控模块提取用户电子档案中的特征词与对应数据组中各数据单元的第一级别特征词的第一匹配度S1中的最大值Smax，并将Smax与预设标准匹配度S0进行比对，

当Smax≥S0时，所述中控模块根据Smax对应的数据单元给出匹配结果，其中，当Smax对应的数据单元为第一数据单元时，匹配结果为匹配成功，当Smax对应的数据单元为第二数据单元时，匹配结果为初步匹配成功，当Smax对应的数据单元为第三数据单元时，匹配结果为匹配不成功；

当Smax＜S0时，所述中控模块对用户的匹配结果做进一步判断。

进一步地，当Smax＜S0时，所述中控模块计算用户电子档案中的特征词与对应数据组中任一数据单元的第一级别特征词的第一匹配度S1和用户电子档案中的特征词与该数据单元的第二级别特征词的第二匹配度S2的匹配度加和Sh，设定Sh＝S1+S2，所述中控模块提取匹配度加和Sh中的最大值Shmax，并将Shmax对应的数据单元的匹配结果设为初步匹配成功。

本发明另一方面提供上述与词典笔匹配的学习资源搜集方法的系统，包括：

数据获取模块，用以获取若干资料完整的历史学习资料数据；

数据处理模块，其与所述数据获取模块相连，用以根据学龄将所述历史学习资料数据划分为若干数据组，并根据数据评价结果分值将任一所述数据组划分为若干数据单元；

语音模块，其与中控模块相连，用以针对用户的语音提问，将提问记录储存至用户电子档案；

中控模块，其分别与所述数据处理模块和所述语音模块相连，用以提取各所述历史学习资料数据的特征词并设定特征词的级别，以及根据用户电子档案中提取的特征词给出匹配结果。

与现有技术相比，本发明的有益效果在于，本发明通过获取若干历史学习资料数据，并根据年龄对历史学习资料数据进行分类，以及根据历史学习资料数据的数据评价结果分值对历史学习资料数据做进一步分类，本发明通过细化数据分类，以提高对学习资源匹配的准确性和效率。

进一步地，学习情况受学龄因素影响较大，本发明通过用户学龄对历史学习资料数据进行分类，使各数据组中的历史学习资料数据在横向之间更具有对比性，从而进一步提高了对学习资源匹配的准确性。

进一步地，本发明将各数据组中的数据按照数据评价结果进行二次分类，细化了对历史数据的分类，人工智能通过对历史数据的学习，以实现辅助匹配功能，对历史数据的分类越精细越准确，辅助匹配的结果准确性越高、效率越高，通过细化历史数据的分类，进一步提高了对学习资源匹配的准确性和效率。

进一步地，本发明中控模块通过计算任一所述数据单元中各特征词的频率f，并设定第一预设频率f1和第二预设频率f2，以选定第一级别特征词和第二级别特征词，即选定各个数据单元中的关键特征，中控模块通过各个数据单元中的关键特征给出匹配结果，通过上述技术方案，进一步提高了对学习资源匹配的准确性和效率。

进一步地，本发明通过设置预设平均频率f10以判定第一级别特征词的平均频率是否符合标准，若判定第一级别特征词的平均频率不符合标准，则对第一预设频率f1和第二预设频率f2进行调节，以保证第一级别特征词的数据量水平，使人工智能能够获取足够的关键特征进行学习，通过上述技术方案，进一步提高了对学习资源匹配的准确性和效率。

进一步地，本发明中控模块提取用户电子档案中的特征词与对应数据组中各数据单元的第一级别特征词的第一匹配度S1中的最大值Smax，当Smax大于预设标准匹配度时，中控模块根据Smax对应的数据单元给出匹配结果，进一步提高了对学习资源匹配的准确性和效率。

进一步地，本发明在Smax小于预设标准匹配度时计算用户电子档案中的特征词与对应数据组中任一数据单元的第一级别特征词的第一匹配度S1和用户电子档案中的特征词与该数据单元的第二级别特征词的第二匹配度S2的和Sh，中控模块提取Sh中的最大值Shmax并将Shmax对应的数据单元的匹配结果做为匹配结果，进一步提高了对学习资源匹配的准确性和效率。

附图说明

图1为本发明实施例与词典笔匹配的学习资源搜集方法的结构框图；

图2为本发明实施例与词典笔匹配的学习资源搜集方法的流程图。

具体实施方式

为了使本发明的目的和优点更加清楚明白，下面结合实施例对本发明作进一步描述；应当理解，此处所描述的具体实施例仅仅用于解释本发明，并不用于限定本发明。

下面参照附图来描述本发明的优选实施方式。本领域技术人员应当理解的是，这些实施方式仅仅用于解释本发明的技术原理，并非在限制本发明的保护范围。

需要说明的是，在本发明的描述中，术语“上”、“下”、“左”、“右”、“内”、“外”等指示的方向或位置关系的术语是基于附图所示的方向或位置关系，这仅仅是为了便于描述，而不是指示或暗示所述装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。

此外，还需要说明的是，在本发明的描述中，除非另有明确的规定和限定，术语“安装”、“相连”、“连接”应做广义理解，例如，可以是固定连接，也可以是可拆卸连接，或一体地连接；可以是机械连接，也可以是电连接；可以是直接相连，也可以通过中间媒介间接相连，可以是两个元件内部的连通。对于本领域技术人员而言，可根据具体情况理解上述术语在本发明中的具体含义。

请参阅图1所示，其为本发明实施例与词典笔匹配的学习资源搜集方法的结构框图，本发明所述与词典笔匹配的学习资源搜集方法包括：

请参阅图2所示，其为本发明实施例与词典笔匹配的学习资源搜集方法的流程图，本发明所述与词典笔匹配的学习资源搜集方法包括：

本发明通过获取若干历史学习资料数据，并根据年龄对历史学习资料数据进行分类，以及根据历史学习资料数据的数据评价结果分值对历史学习资料数据做进一步分类，本发明通过细化数据分类，以提高对学习资源匹配的准确性和效率。

具体而言，在所述步骤S1中，所述数据处理模块根据年龄将所述历史学习资料数据划分为若干数据组，所述数据处理模块根据用户学龄将所述历史学习资料数据划分为若干数据组，所述数据组包括大学数据组、高中数据组、初中数据组和幼儿数据组，数据处理模块中设有第一预设年龄L1、第二预设年龄L2和第三预设年龄L3，L1＜L2＜L3，数据处理模块将任一历史学习资料数据中的年龄L分别与L1、L2和L3进行比对，

本实施例中，不对第一预设年龄L1、第二预设年龄L2和第三预设年龄L3进行限定，可根据实际需要进行限定，本发明实施例优选将第一预设年龄L1设定为6，将第二预设年龄L2设定为12，将第三预设年龄L3设定为18。

学习情况受学龄因素影响较大，本发明通过用户学龄对历史学习资料数据进行分类，使各数据组中的历史学习资料数据在横向之间更具有对比性，从而进一步提高了对学习资源匹配的准确性。

具体而言，在所述步骤S1中，所述数据处理模块提取任一所述数据组中各所述历史学习资料数据的数据评价结果分值，并根据数据评价结果分值将该数据组划分为若干数据单元，所述数据单元包括第一数据单元、第二数据单元和第三数据单元，数据处理模块中设有第一预设分值F1和第二预设分值F2，F1＜F2，数据处理模块将任一所述数据组中各所述历史学习资料数据的数据评价结果分值F分别与F1和F2进行比对，

目前，本实施例的数据评价结果分值为百分制，本实施例中，60＜F1＜80＜F2＜100，优选将第一预设分值F1设置为70分，将第二预设分值F2设置为90分。

具体而言，所述数据处理模块根据以下公式计算所述数据评价结果分值F，设定

F＝[(Vz-Vt)/Vz]×100

其中，Vt为单个所述数据组中相同词汇的数据量，Vz为单个所述数据组中词汇的数据总量。

本发明将各数据组中的数据按照数据评价结果进行二次分类，细化了对历史数据的分类，人工智能通过对历史数据的学习，以实现辅助匹配功能，对历史数据的分类越精细越准确，辅助匹配的结果准确性越高、效率越高，通过细化历史数据的分类，进一步提高了对学习资源匹配的准确性和效率。

具体而言，在所述步骤S2中，所述中控模块提取各历史学习资料数据的特征词，统计任一所述数据单元中特征词的总数量N0和各特征词的数量N，中控模块根据N0和N计算该数据单元中各特征词的频率f，设定

具体而言，所述中控模块中设有第一预设频率f1和第二预设频率f2，f1＜f2，中控模块将频率f分别与f1和f2进行比对，

当f1≤f＜f2时，所述中控模块将频率f对应的特征词设定为第二级别特征词。

本实施例中，设定0.3＜f1＜0.4＜f2＜0.5，优选将第一预设频率f1设置为0.35，将第二预设频率f2设置为0.45。

本发明中控模块通过计算任一所述数据单元中各特征词的频率f，并设定第一预设频率f1和第二预设频率f2，以选定第一级别特征词和第二级别特征词，即选定各个数据单元中的关键特征，中控模块通过各个数据单元中的关键特征给出匹配结果，通过上述技术方案，进一步提高了对学习资源匹配的准确性和效率。

具体而言，在所述步骤S3中，所述中控模块统计各所述数据单元中第一级别特征词的频率f1 i，计算各数据单元中第一级别特征词的平均频率f1 p，设定

其中，M为所述特征词的种类；

本实施例中，设定f2＜0.5＜f10＜0.6，优选将预设平均频率f10设置为0.55。

本发明通过设置预设平均频率f10以判定第一级别特征词的平均频率是否符合标准，若判定第一级别特征词的平均频率不符合标准，则对第一预设频率f1和第二预设频率f2进行调节，以保证第一级别特征词的数据量水平，使人工智能能够获取足够的关键特征进行学习，通过上述技术方案，进一步提高了对学习资源匹配的准确性和效率。

具体而言，所述中控模块在判定第一级别特征词的平均频率不符合标准时，计算f1 p与f10的差值Δf并根据Δf对第一预设频率f1和第二预设频率f2进行调节，设定Δf＝f10-f1 p，其中，所述中控模块中设有第一预设差值Δf1、第二预设差值Δf2、第一预设调节系数α1、第二预设调节系数α2和第三预设调节系数α3，Δf1＜Δf2，0.9＜α1＜α2＜α3＜1，中控模块将Δf分别与Δf1和Δf2进行比对，

本实施例中，设定0.03＜Δf1＜0.05＜Δf2＜0.08，优选将Δf1设置为0.04，将Δf2设置为0.07，将α1设置为0.92，将α2设置为0.95，将α3设置为0.97。

具体而言，在所述步骤S4中，所述中控模块根据用户电子档案中的用户学龄调取对应数据组的数据，计算用户电子档案中的特征词与对应数据组中任一数据单元的第一级别特征词的第一匹配度S1和用户电子档案中的特征词与该数据单元的第二级别特征词的第二匹配度S2，设定S1＝用户电子档案中的特征词中存在的第一级别特征词的数量/对应数据组中任一数据单元中第一级别特征词的数量，S2＝用户电子档案中的特征词中存在的第二级别特征词的数量/该数据单元中第二级别特征词的数量。

本发明实施例中，用户电子档案中的特征词中存在第一级别特征词的数量为用户电子档案中的特征词与第一级别特征词中的特征词相同的词汇的数量。

具体而言，所述中控模块提取用户电子档案中的特征词与对应数据组中各数据单元的第一级别特征词的第一匹配度S1中的最大值Smax，并将Smax与预设标准匹配度S0进行比对，

当Smax≥S0时，所述中控模块根据Smax对应的数据单元给出匹配结果；

当Smax＜S0时，所述中控模块对用户的匹配结果做进一步判断；

其中，当Smax对应的数据单元为第一数据单元时，匹配结果为匹配成功；

当Smax对应的数据单元为第二数据单元时，匹配结果为初步匹配成功；

当Smax对应的数据单元为第三数据单元时，匹配结果为匹配不成功。

本实施例中，设定0.55＜S0＜0.65，优选将预设标准匹配度S0设置为0.6。

本发明中控模块提取用户电子档案中的特征词与对应数据组中各数据单元的第一级别特征词的第一匹配度S1中的最大值Smax，当Smax大于预设标准匹配度时，中控模块根据Smax对应的数据单元给出匹配结果，进一步提高了对学习资源匹配的准确性和效率。

具体而言，当Smax＜S0时，所述中控模块计算用户电子档案中的特征词与对应数据组中任一数据单元的第一级别特征词的第一匹配度S1和用户电子档案中的特征词与该数据单元的第二级别特征词的第二匹配度S2的匹配度加和Sh，设定Sh＝S1+S2，所述中控模块提取匹配度加和Sh中的最大值Shmax，并将Shmax对应的数据单元的匹配结果设为初步匹配成功。

至此，已经结合附图所示的优选实施方式描述了本发明的技术方案，但是，本领域技术人员容易理解的是，本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下，本领域技术人员可以对相关技术特征做出等同的更改或替换，这些更改或替换之后的技术方案都将落入本发明的保护范围之内。

以上所述仅为本发明的优选实施例，并不用于限制本发明；对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种与词典笔匹配的学习资源搜集方法，其特征在于，包括：

步骤S2，中控模块采用自然语言处理技术提取各所述历史学习资料数据的特征词，根据特征词的总数量和各特征词的数量计算各特征词的频率，并根据各特征词的频率与预设频率的比对结果设定特征词的级别，且该级别包括第一级别、第二级别和第三级别；

2.根据权利要求1所述的与词典笔匹配的学习资源搜集方法，其特征在于，在所述步骤S1中，所述数据处理模块根据用户学龄将所述历史学习资料数据划分为若干数据组，所述数据组包括大学数据组、高中数据组、初中数据组和幼儿数据组，数据处理模块中设有第一预设年龄L1、第二预设年龄L2和第三预设年龄L3，L1＜L2＜L3，数据处理模块将任一历史学习资料数据中的年龄L分别与L1、L2和L3进行比对，

3.根据权利要求2所述的与词典笔匹配的学习资源搜集方法，其特征在于，在所述步骤S1中，所述数据处理模块提取任一所述数据组中各所述历史学习资料数据的数据评价结果分值，并根据数据评价结果分值将该数据组划分为若干数据单元，所述数据单元包括第一数据单元、第二数据单元和第三数据单元，数据处理模块中设有第一预设分值F1和第二预设分值F2，F1＜F2，数据处理模块将任一所述数据组中各所述历史学习资料数据的数据评价结果分值F分别与F1和F2进行比对，

4.根据权利要求3所述的与词典笔匹配的学习资源搜集方法，其特征在于，在所述步骤S2中，所述中控模块提取各历史学习资料数据的特征词，统计任一所述数据单元中特征词的总数量N0和各特征词的数量N，中控模块根据N0和N计算该数据单元中各特征词的频率f，设定

5.根据权利要求4所述的与词典笔匹配的学习资源搜集方法，其特征在于，在所述步骤S3中，所述中控模块统计各所述数据单元中第一级别特征词的频率f1 i，计算各数据单元中第一级别特征词的平均频率f1 p，设定

其中，M为所述特征词的种类；

6.根据权利要求5所述的与词典笔匹配的学习资源搜集方法，其特征在于，所述中控模块在判定第一级别特征词的平均频率不符合标准时，计算f1 p与f10的差值Δf并根据Δf对第一预设频率f1和第二预设频率f2进行调节，设定Δf＝f10-f1 p，其中，所述中控模块中设有第一预设差值Δf1、第二预设差值Δf2、第一预设调节系数α1、第二预设调节系数α2和第三预设调节系数α3，Δf1＜Δf2，0.9＜α1＜α2＜α3＜1，中控模块将Δf分别与Δf1和Δf2进行比对，

7.根据权利要求6所述的与词典笔匹配的学习资源搜集方法，其特征在于，在所述步骤S4中，所述中控模块根据用户电子档案中的用户学龄调取对应数据组的数据，计算用户电子档案中的特征词与对应数据组中任一数据单元的第一级别特征词的第一匹配度S1和用户电子档案中的特征词与该数据单元的第二级别特征词的第二匹配度S2，设定S1＝用户电子档案中的特征词中存在的第一级别特征词的数量/对应数据组中任一数据单元中第一级别特征词的数量，S2＝用户电子档案中的特征词中存在的第二级别特征词的数量/该数据单元中第二级别特征词的数量。

8.根据权利要求7所述的与词典笔匹配的学习资源搜集方法，其特征在于，所述中控模块提取用户电子档案中的特征词与对应数据组中各数据单元的第一级别特征词的第一匹配度S1中的最大值Smax，并将Smax与预设标准匹配度S0进行比对，

9.根据权利要求8所述的与词典笔匹配的学习资源搜集方法，其特征在于，当Smax＜S0时，所述中控模块计算用户电子档案中的特征词与对应数据组中任一数据单元的第一级别特征词的第一匹配度S1和用户电子档案中的特征词与该数据单元的第二级别特征词的第二匹配度S2的匹配度加和Sh，设定Sh＝S1+S2，所述中控模块提取匹配度加和Sh中的最大值Shmax，并将Shmax对应的数据单元的匹配结果设为初步匹配成功。

10.一种应用权利要求1-9任一项所述与词典笔匹配的学习资源搜集方法的系统，其特征在于，包括：