CN116701561B - 与词典笔匹配的学习资源搜集方法及其系统 - Google Patents

与词典笔匹配的学习资源搜集方法及其系统 Download PDF

Info

Publication number
CN116701561B
CN116701561B CN202310683547.5A CN202310683547A CN116701561B CN 116701561 B CN116701561 B CN 116701561B CN 202310683547 A CN202310683547 A CN 202310683547A CN 116701561 B CN116701561 B CN 116701561B
Authority
CN
China
Prior art keywords
data
central control
control module
preset
level
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310683547.5A
Other languages
English (en)
Other versions
CN116701561A (zh
Inventor
谢振辉
王烈峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Readboy Education Technology Co Ltd
Original Assignee
Readboy Education Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Readboy Education Technology Co Ltd filed Critical Readboy Education Technology Co Ltd
Priority to CN202310683547.5A priority Critical patent/CN116701561B/zh
Publication of CN116701561A publication Critical patent/CN116701561A/zh
Application granted granted Critical
Publication of CN116701561B publication Critical patent/CN116701561B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及学习资源匹配技术领域,尤其涉及一种与词典笔匹配的学习资源搜集方法及其系统,包括数据获取模块获取若干资料完整的历史学习资料数据,数据处理模块根据历史学习资料数据中的年龄和数据评价结果对数据进行分类;中控模块提取各历史学习资料数据的特征词计算各特征词的频率,并设定特征词的级别;计算各数据单元中第一级别特征词的平均数量,对预设频率进行调节;所述语音模块针对用户的语音提问,将提问记录储存至电子档案,所述中控模块计算电子档案中的特征词与对应数据组中任一数据单元的第一级别特征词的第一匹配度S1和第二级别特征词的第二匹配度S2,并根据S1和S2匹配对应的匹配结果。本发明提高了学习资源匹配的准确性和效率。

Description

与词典笔匹配的学习资源搜集方法及其系统
技术领域
本发明涉及学习资源匹配技术领域,尤其涉及一种与词典笔匹配的学习资源搜集方法及其系统。
背景技术
随着科技和经济的不断发展,在日常学习过程中,辅助设备起到了越来越重要的作用。为了提高孩子的学习水平,家长通常会购买各种词典笔来辅助孩子学习外语。但是,由于很多家长的外语水平有限,无法对孩子的学习成果进行检查,为了孩子能够有更好的学习成果,匹配合适的学习资源尤为重要。
中国专利申请公开号:CN101882152公开了一种便携式学习机及其资源检索方法。便携式学习机的资源检索方法,包括如下步骤:关键字输入步骤:由输入单元输入关键字;逐级显示步骤:搜索出与该关键字对应的所有文件分类信息,据此,在显示单元上显示出与该文件分类信息相应的所有第一级分类属性名,并等待用户通过输入单元定位其中某一个第一级分类属性名,如用户选择打开相应的第一级分类属性名,则显示该第一级分类属性名下相应的所有第二级分类属性名,并按以上步骤逐级依次进行直至显示出末级分类属性名,并由用户通过输入单元进行选择操作,以显示出该末级分类属性名下所选文件名所对应的文件内容。
然而,学习资源不能一概而论,各学龄段的人学习情况均不相同,现有技术中便携式学习机及其资源检索方法在学习资源匹配时未对历史数据做详细分类,导致学习资源匹配的准确性和效率较低。
发明内容
为此,本发明提供一种与词典笔匹配的学习资源搜集方法及其系统,用以克服现有技术中在学习资源匹配时未对历史数据做详细分类,导致学习资源匹配的准确性和效率较低的问题。
为实现上述目的,一方面,本发明提供一种与词典笔匹配的学习资源搜集方法,包括:
步骤S1,数据获取模块获取若干资料完整的历史学习资料数据,数据处理模块根据用户学龄将所述历史学习资料数据划分为若干数据组,并根据数据评价结果分值将任一所述数据组划分为若干数据单元;
步骤S2,中控模块采用自然语言处理技术提取各所述历史学习资料数据的特征词,根据特征词的总数量和各特征词的数量计算各特征词的频率,并根据各特征词的频率与预设频率的比对结果设定特征词的级别;
步骤S3,所述中控模块统计各所述数据单元中第一级别特征词的数量以计算各数据单元中第一级别特征词的平均数量,若第一级别特征词的平均数量低于预设平均数量,则计算第一级别特征词的平均数量与预设平均数量的差值以对所述预设频率进行调节;
步骤S4,语音模块针对用户的语音提问,将提问记录储存至用户电子档案,所述中控模块提取用户电子档案中的特征词,并计算用户电子档案中的特征词与对应数据组中任一数据单元的第一级别特征词的第一匹配度S1和第二级别特征词的第二匹配度S2,并根据S1和S2匹配对应的匹配结果。
进一步地,在所述步骤S1中,所述数据处理模块根据用户学龄将所述历史学习资料数据划分为若干数据组,所述数据组包括大学数据组、高中数据组、初中数据组和幼儿数据组,数据处理模块中设有第一预设年龄L1、第二预设年龄L2和第三预设年龄L3,L1<L2<L3,数据处理模块将任一历史学习资料数据中的年龄L分别与L1、L2和L3进行比对,
当L≥L3时,所述数据处理模块将年龄L对应的历史学习资料数据划分为大学数据组;
当L2≤L<L3时,所述数据处理模块将年龄L对应的历史学习资料数据划分为高中数据组;
当L1≤L<L2时,所述数据处理模块将年龄L对应的历史学习资料数据划分为初中数据组;
当L<L1时,所述数据处理模块将年龄L对应的历史学习资料数据划分为幼儿数据组。
进一步地,在所述步骤S1中,所述数据处理模块提取任一所述数据组中各所述历史学习资料数据的数据评价结果分值,并根据数据评价结果分值将该数据组划分为若干数据单元,所述数据单元包括第一数据单元、第二数据单元和第三数据单元,数据处理模块中设有第一预设分值F1和第二预设分值F2,F1<F2,数据处理模块将任一所述数据组中各所述历史学习资料数据的数据评价结果分值F分别与F1和F2进行比对,
当F≥F2时,所述数据处理模块将数据评价结果分值F对应的历史学习资料数据划分为第一数据单元;
当F1≤F<F2时,所述数据处理模块将数据评价结果分值F对应的历史学习资料数据划分为第二数据单元;
当F<F1时,所述数据处理模块将数据评价结果分值F对应的历史学习资料数据划分为第三数据单元。
进一步地,在所述步骤S2中,所述中控模块提取各历史学习资料数据的特征词,统计任一所述数据单元中特征词的总数量N0和各特征词的数量N,中控模块根据N0和N计算该数据单元中各特征词的频率f,设定
所述中控模块中设有第一预设频率f1和第二预设频率f2,f1<f2,中控模块将频率f分别与f1和f2进行比对,
当f≥f2时,所述中控模块将频率f对应的特征词设定为第一级别特征词;
当f1≤f<f2时,所述中控模块将频率f对应的特征词设定为第二级别特征词;
当f<f1时,所述中控模块将频率f对应的特征词设定为第三级别特征词。
进一步地,在所述步骤S3中,所述中控模块统计各所述数据单元中第一级别特征词的频率f1 i,计算各数据单元中第一级别特征词的平均频率f1 p,设定
其中,M为所述特征词的种类;
所述中控模块将第一级别特征词的平均频率f1 p与预设平均频率f10进行比对,
当f1 p≥f10时,所述中控模块判定第一级别特征词的平均频率符合标准;
当f1 p<f10时,所述中控模块判定第一级别特征词的平均频率不符合标准。
进一步地,所述中控模块在判定第一级别特征词的平均频率不符合标准时,计算f1 p与f10的差值Δf并根据Δf对第一预设频率f1和第二预设频率f2进行调节,设定Δf=f10-f1 p,其中,所述中控模块中设有第一预设差值Δf1、第二预设差值Δf2、第一预设调节系数α1、第二预设调节系数α2和第三预设调节系数α3,Δf1<Δf2,0.9<α1<α2<α3<1,中控模块将Δf分别与Δf1和Δf2进行比对,
当Δf≥Δf2时,所述中控模块选用α1将第一预设频率调节至f1',设定f1'=f1×α1,将第二预设频率调节至f2',设定f2'=f2×α1;
当Δf1≤Δf<Δf2时,所述中控模块选用α2将第一预设频率调节至f1',设定f1'=f1×α2,将第二预设频率调节至f2',设定f2'=f2×α2;
当Δf<Δf1时,所述中控模块选用α3将第一预设频率调节至f1',设定f1'=f1×α3,将第二预设频率调节至f2',设定f2'=f2×α3。
进一步地,在所述步骤S4中,所述中控模块根据用户电子档案中的用户学龄调取对应数据组的数据,计算用户电子档案中的特征词与对应数据组中任一数据单元的第一级别特征词的第一匹配度S1和用户电子档案中的特征词与该数据单元的第二级别特征词的第二匹配度S2,设定S1=用户电子档案中的特征词中存在的第一级别特征词的数量/对应数据组中任一数据单元中第一级别特征词的数量,S2=用户电子档案中的特征词中存在的第二级别特征词的数量/该数据单元中第二级别特征词的数量。
进一步地,所述中控模块提取用户电子档案中的特征词与对应数据组中各数据单元的第一级别特征词的第一匹配度S1中的最大值Smax,并将Smax与预设标准匹配度S0进行比对,
当Smax≥S0时,所述中控模块根据Smax对应的数据单元给出匹配结果,其中,当Smax对应的数据单元为第一数据单元时,匹配结果为匹配成功,当Smax对应的数据单元为第二数据单元时,匹配结果为初步匹配成功,当Smax对应的数据单元为第三数据单元时,匹配结果为匹配不成功;
当Smax<S0时,所述中控模块对用户的匹配结果做进一步判断。
进一步地,当Smax<S0时,所述中控模块计算用户电子档案中的特征词与对应数据组中任一数据单元的第一级别特征词的第一匹配度S1和用户电子档案中的特征词与该数据单元的第二级别特征词的第二匹配度S2的匹配度加和Sh,设定Sh=S1+S2,所述中控模块提取匹配度加和Sh中的最大值Shmax,并将Shmax对应的数据单元的匹配结果设为初步匹配成功。
本发明另一方面提供上述与词典笔匹配的学习资源搜集方法的系统,包括:
数据获取模块,用以获取若干资料完整的历史学习资料数据;
数据处理模块,其与所述数据获取模块相连,用以根据学龄将所述历史学习资料数据划分为若干数据组,并根据数据评价结果分值将任一所述数据组划分为若干数据单元;
语音模块,其与中控模块相连,用以针对用户的语音提问,将提问记录储存至用户电子档案;
中控模块,其分别与所述数据处理模块和所述语音模块相连,用以提取各所述历史学习资料数据的特征词并设定特征词的级别,以及根据用户电子档案中提取的特征词给出匹配结果。
与现有技术相比,本发明的有益效果在于,本发明通过获取若干历史学习资料数据,并根据年龄对历史学习资料数据进行分类,以及根据历史学习资料数据的数据评价结果分值对历史学习资料数据做进一步分类,本发明通过细化数据分类,以提高对学习资源匹配的准确性和效率。
进一步地,学习情况受学龄因素影响较大,本发明通过用户学龄对历史学习资料数据进行分类,使各数据组中的历史学习资料数据在横向之间更具有对比性,从而进一步提高了对学习资源匹配的准确性。
进一步地,本发明将各数据组中的数据按照数据评价结果进行二次分类,细化了对历史数据的分类,人工智能通过对历史数据的学习,以实现辅助匹配功能,对历史数据的分类越精细越准确,辅助匹配的结果准确性越高、效率越高,通过细化历史数据的分类,进一步提高了对学习资源匹配的准确性和效率。
进一步地,本发明中控模块通过计算任一所述数据单元中各特征词的频率f,并设定第一预设频率f1和第二预设频率f2,以选定第一级别特征词和第二级别特征词,即选定各个数据单元中的关键特征,中控模块通过各个数据单元中的关键特征给出匹配结果,通过上述技术方案,进一步提高了对学习资源匹配的准确性和效率。
进一步地,本发明通过设置预设平均频率f10以判定第一级别特征词的平均频率是否符合标准,若判定第一级别特征词的平均频率不符合标准,则对第一预设频率f1和第二预设频率f2进行调节,以保证第一级别特征词的数据量水平,使人工智能能够获取足够的关键特征进行学习,通过上述技术方案,进一步提高了对学习资源匹配的准确性和效率。
进一步地,本发明中控模块提取用户电子档案中的特征词与对应数据组中各数据单元的第一级别特征词的第一匹配度S1中的最大值Smax,当Smax大于预设标准匹配度时,中控模块根据Smax对应的数据单元给出匹配结果,进一步提高了对学习资源匹配的准确性和效率。
进一步地,本发明在Smax小于预设标准匹配度时计算用户电子档案中的特征词与对应数据组中任一数据单元的第一级别特征词的第一匹配度S1和用户电子档案中的特征词与该数据单元的第二级别特征词的第二匹配度S2的和Sh,中控模块提取Sh中的最大值Shmax并将Shmax对应的数据单元的匹配结果做为匹配结果,进一步提高了对学习资源匹配的准确性和效率。
附图说明
图1为本发明实施例与词典笔匹配的学习资源搜集方法的结构框图;
图2为本发明实施例与词典笔匹配的学习资源搜集方法的流程图。
具体实施方式
为了使本发明的目的和优点更加清楚明白,下面结合实施例对本发明作进一步描述;应当理解,此处所描述的具体实施例仅仅用于解释本发明,并不用于限定本发明。
下面参照附图来描述本发明的优选实施方式。本领域技术人员应当理解的是,这些实施方式仅仅用于解释本发明的技术原理,并非在限制本发明的保护范围。
需要说明的是,在本发明的描述中,术语“上”、“下”、“左”、“右”、“内”、“外”等指示的方向或位置关系的术语是基于附图所示的方向或位置关系,这仅仅是为了便于描述,而不是指示或暗示所述装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
此外,还需要说明的是,在本发明的描述中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域技术人员而言,可根据具体情况理解上述术语在本发明中的具体含义。
请参阅图1所示,其为本发明实施例与词典笔匹配的学习资源搜集方法的结构框图,本发明所述与词典笔匹配的学习资源搜集方法包括:
数据获取模块,用以获取若干资料完整的历史学习资料数据;
数据处理模块,其与所述数据获取模块相连,用以根据学龄将所述历史学习资料数据划分为若干数据组,并根据数据评价结果分值将任一所述数据组划分为若干数据单元;
语音模块,其与中控模块相连,用以针对用户的语音提问,将提问记录储存至用户电子档案;
中控模块,其分别与所述数据处理模块和所述语音模块相连,用以提取各所述历史学习资料数据的特征词并设定特征词的级别,以及根据用户电子档案中提取的特征词给出匹配结果。
请参阅图2所示,其为本发明实施例与词典笔匹配的学习资源搜集方法的流程图,本发明所述与词典笔匹配的学习资源搜集方法包括:
步骤S1,数据获取模块获取若干资料完整的历史学习资料数据,数据处理模块根据用户学龄将所述历史学习资料数据划分为若干数据组,并根据数据评价结果分值将任一所述数据组划分为若干数据单元;
步骤S2,中控模块采用自然语言处理技术提取各所述历史学习资料数据的特征词,根据特征词的总数量和各特征词的数量计算各特征词的频率,并根据各特征词的频率与预设频率的比对结果设定特征词的级别;
步骤S3,所述中控模块统计各所述数据单元中第一级别特征词的数量以计算各数据单元中第一级别特征词的平均数量,若第一级别特征词的平均数量低于预设平均数量,则计算第一级别特征词的平均数量与预设平均数量的差值以对所述预设频率进行调节;
步骤S4,语音模块针对用户的语音提问,将提问记录储存至用户电子档案,所述中控模块提取用户电子档案中的特征词,并计算用户电子档案中的特征词与对应数据组中任一数据单元的第一级别特征词的第一匹配度S1和第二级别特征词的第二匹配度S2,并根据S1和S2匹配对应的匹配结果。
本发明通过获取若干历史学习资料数据,并根据年龄对历史学习资料数据进行分类,以及根据历史学习资料数据的数据评价结果分值对历史学习资料数据做进一步分类,本发明通过细化数据分类,以提高对学习资源匹配的准确性和效率。
具体而言,在所述步骤S1中,所述数据处理模块根据年龄将所述历史学习资料数据划分为若干数据组,所述数据处理模块根据用户学龄将所述历史学习资料数据划分为若干数据组,所述数据组包括大学数据组、高中数据组、初中数据组和幼儿数据组,数据处理模块中设有第一预设年龄L1、第二预设年龄L2和第三预设年龄L3,L1<L2<L3,数据处理模块将任一历史学习资料数据中的年龄L分别与L1、L2和L3进行比对,
当L≥L3时,所述数据处理模块将年龄L对应的历史学习资料数据划分为大学数据组;
当L2≤L<L3时,所述数据处理模块将年龄L对应的历史学习资料数据划分为高中数据组;
当L1≤L<L2时,所述数据处理模块将年龄L对应的历史学习资料数据划分为初中数据组;
当L<L1时,所述数据处理模块将年龄L对应的历史学习资料数据划分为幼儿数据组。
本实施例中,不对第一预设年龄L1、第二预设年龄L2和第三预设年龄L3进行限定,可根据实际需要进行限定,本发明实施例优选将第一预设年龄L1设定为6,将第二预设年龄L2设定为12,将第三预设年龄L3设定为18。
学习情况受学龄因素影响较大,本发明通过用户学龄对历史学习资料数据进行分类,使各数据组中的历史学习资料数据在横向之间更具有对比性,从而进一步提高了对学习资源匹配的准确性。
具体而言,在所述步骤S1中,所述数据处理模块提取任一所述数据组中各所述历史学习资料数据的数据评价结果分值,并根据数据评价结果分值将该数据组划分为若干数据单元,所述数据单元包括第一数据单元、第二数据单元和第三数据单元,数据处理模块中设有第一预设分值F1和第二预设分值F2,F1<F2,数据处理模块将任一所述数据组中各所述历史学习资料数据的数据评价结果分值F分别与F1和F2进行比对,
当F≥F2时,所述数据处理模块将数据评价结果分值F对应的历史学习资料数据划分为第一数据单元;
当F1≤F<F2时,所述数据处理模块将数据评价结果分值F对应的历史学习资料数据划分为第二数据单元;
当F<F1时,所述数据处理模块将数据评价结果分值F对应的历史学习资料数据划分为第三数据单元。
目前,本实施例的数据评价结果分值为百分制,本实施例中,60<F1<80<F2<100,优选将第一预设分值F1设置为70分,将第二预设分值F2设置为90分。
具体而言,所述数据处理模块根据以下公式计算所述数据评价结果分值F,设定
F=[(Vz-Vt)/Vz]×100
其中,Vt为单个所述数据组中相同词汇的数据量,Vz为单个所述数据组中词汇的数据总量。
本发明将各数据组中的数据按照数据评价结果进行二次分类,细化了对历史数据的分类,人工智能通过对历史数据的学习,以实现辅助匹配功能,对历史数据的分类越精细越准确,辅助匹配的结果准确性越高、效率越高,通过细化历史数据的分类,进一步提高了对学习资源匹配的准确性和效率。
具体而言,在所述步骤S2中,所述中控模块提取各历史学习资料数据的特征词,统计任一所述数据单元中特征词的总数量N0和各特征词的数量N,中控模块根据N0和N计算该数据单元中各特征词的频率f,设定
具体而言,所述中控模块中设有第一预设频率f1和第二预设频率f2,f1<f2,中控模块将频率f分别与f1和f2进行比对,
当f≥f2时,所述中控模块将频率f对应的特征词设定为第一级别特征词;
当f1≤f<f2时,所述中控模块将频率f对应的特征词设定为第二级别特征词。
本实施例中,设定0.3<f1<0.4<f2<0.5,优选将第一预设频率f1设置为0.35,将第二预设频率f2设置为0.45。
本发明中控模块通过计算任一所述数据单元中各特征词的频率f,并设定第一预设频率f1和第二预设频率f2,以选定第一级别特征词和第二级别特征词,即选定各个数据单元中的关键特征,中控模块通过各个数据单元中的关键特征给出匹配结果,通过上述技术方案,进一步提高了对学习资源匹配的准确性和效率。
具体而言,在所述步骤S3中,所述中控模块统计各所述数据单元中第一级别特征词的频率f1 i,计算各数据单元中第一级别特征词的平均频率f1 p,设定
其中,M为所述特征词的种类;
所述中控模块将第一级别特征词的平均频率f1 p与预设平均频率f10进行比对,
当f1 p≥f10时,所述中控模块判定第一级别特征词的平均频率符合标准;
当f1 p<f10时,所述中控模块判定第一级别特征词的平均频率不符合标准。
本实施例中,设定f2<0.5<f10<0.6,优选将预设平均频率f10设置为0.55。
本发明通过设置预设平均频率f10以判定第一级别特征词的平均频率是否符合标准,若判定第一级别特征词的平均频率不符合标准,则对第一预设频率f1和第二预设频率f2进行调节,以保证第一级别特征词的数据量水平,使人工智能能够获取足够的关键特征进行学习,通过上述技术方案,进一步提高了对学习资源匹配的准确性和效率。
具体而言,所述中控模块在判定第一级别特征词的平均频率不符合标准时,计算f1 p与f10的差值Δf并根据Δf对第一预设频率f1和第二预设频率f2进行调节,设定Δf=f10-f1 p,其中,所述中控模块中设有第一预设差值Δf1、第二预设差值Δf2、第一预设调节系数α1、第二预设调节系数α2和第三预设调节系数α3,Δf1<Δf2,0.9<α1<α2<α3<1,中控模块将Δf分别与Δf1和Δf2进行比对,
当Δf≥Δf2时,所述中控模块选用α1将第一预设频率调节至f1',设定f1'=f1×α1,将第二预设频率调节至f2',设定f2'=f2×α1;
当Δf1≤Δf<Δf2时,所述中控模块选用α2将第一预设频率调节至f1',设定f1'=f1×α2,将第二预设频率调节至f2',设定f2'=f2×α2;
当Δf<Δf1时,所述中控模块选用α3将第一预设频率调节至f1',设定f1'=f1×α3,将第二预设频率调节至f2',设定f2'=f2×α3。
本实施例中,设定0.03<Δf1<0.05<Δf2<0.08,优选将Δf1设置为0.04,将Δf2设置为0.07,将α1设置为0.92,将α2设置为0.95,将α3设置为0.97。
具体而言,在所述步骤S4中,所述中控模块根据用户电子档案中的用户学龄调取对应数据组的数据,计算用户电子档案中的特征词与对应数据组中任一数据单元的第一级别特征词的第一匹配度S1和用户电子档案中的特征词与该数据单元的第二级别特征词的第二匹配度S2,设定S1=用户电子档案中的特征词中存在的第一级别特征词的数量/对应数据组中任一数据单元中第一级别特征词的数量,S2=用户电子档案中的特征词中存在的第二级别特征词的数量/该数据单元中第二级别特征词的数量。
本发明实施例中,用户电子档案中的特征词中存在第一级别特征词的数量为用户电子档案中的特征词与第一级别特征词中的特征词相同的词汇的数量。
具体而言,所述中控模块提取用户电子档案中的特征词与对应数据组中各数据单元的第一级别特征词的第一匹配度S1中的最大值Smax,并将Smax与预设标准匹配度S0进行比对,
当Smax≥S0时,所述中控模块根据Smax对应的数据单元给出匹配结果;
当Smax<S0时,所述中控模块对用户的匹配结果做进一步判断;
其中,当Smax对应的数据单元为第一数据单元时,匹配结果为匹配成功;
当Smax对应的数据单元为第二数据单元时,匹配结果为初步匹配成功;
当Smax对应的数据单元为第三数据单元时,匹配结果为匹配不成功。
本实施例中,设定0.55<S0<0.65,优选将预设标准匹配度S0设置为0.6。
本发明中控模块提取用户电子档案中的特征词与对应数据组中各数据单元的第一级别特征词的第一匹配度S1中的最大值Smax,当Smax大于预设标准匹配度时,中控模块根据Smax对应的数据单元给出匹配结果,进一步提高了对学习资源匹配的准确性和效率。
具体而言,当Smax<S0时,所述中控模块计算用户电子档案中的特征词与对应数据组中任一数据单元的第一级别特征词的第一匹配度S1和用户电子档案中的特征词与该数据单元的第二级别特征词的第二匹配度S2的匹配度加和Sh,设定Sh=S1+S2,所述中控模块提取匹配度加和Sh中的最大值Shmax,并将Shmax对应的数据单元的匹配结果设为初步匹配成功。
至此,已经结合附图所示的优选实施方式描述了本发明的技术方案,但是,本领域技术人员容易理解的是,本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下,本领域技术人员可以对相关技术特征做出等同的更改或替换,这些更改或替换之后的技术方案都将落入本发明的保护范围之内。
以上所述仅为本发明的优选实施例,并不用于限制本发明;对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种与词典笔匹配的学习资源搜集方法,其特征在于,包括:
步骤S1,数据获取模块获取若干资料完整的历史学习资料数据,数据处理模块根据用户学龄将所述历史学习资料数据划分为若干数据组,并根据数据评价结果分值将任一所述数据组划分为若干数据单元;
步骤S2,中控模块采用自然语言处理技术提取各所述历史学习资料数据的特征词,根据特征词的总数量和各特征词的数量计算各特征词的频率,并根据各特征词的频率与预设频率的比对结果设定特征词的级别,且该级别包括第一级别、第二级别和第三级别;
步骤S3,所述中控模块统计各所述数据单元中第一级别特征词的数量以计算各数据单元中第一级别特征词的平均数量,若第一级别特征词的平均数量低于预设平均数量,则计算第一级别特征词的平均数量与预设平均数量的差值以对所述预设频率进行调节;
步骤S4,语音模块针对用户的语音提问,将提问记录储存至用户电子档案,所述中控模块提取用户电子档案中的特征词,并计算用户电子档案中的特征词与对应数据组中任一数据单元的第一级别特征词的第一匹配度S1和第二级别特征词的第二匹配度S2,并根据S1和S2匹配对应的匹配结果。
2.根据权利要求1所述的与词典笔匹配的学习资源搜集方法,其特征在于,在所述步骤S1中,所述数据处理模块根据用户学龄将所述历史学习资料数据划分为若干数据组,所述数据组包括大学数据组、高中数据组、初中数据组和幼儿数据组,数据处理模块中设有第一预设年龄L1、第二预设年龄L2和第三预设年龄L3,L1<L2<L3,数据处理模块将任一历史学习资料数据中的年龄L分别与L1、L2和L3进行比对,
当L≥L3时,所述数据处理模块将年龄L对应的历史学习资料数据划分为大学数据组;
当L2≤L<L3时,所述数据处理模块将年龄L对应的历史学习资料数据划分为高中数据组;
当L1≤L<L2时,所述数据处理模块将年龄L对应的历史学习资料数据划分为初中数据组;
当L<L1时,所述数据处理模块将年龄L对应的历史学习资料数据划分为幼儿数据组。
3.根据权利要求2所述的与词典笔匹配的学习资源搜集方法,其特征在于,在所述步骤S1中,所述数据处理模块提取任一所述数据组中各所述历史学习资料数据的数据评价结果分值,并根据数据评价结果分值将该数据组划分为若干数据单元,所述数据单元包括第一数据单元、第二数据单元和第三数据单元,数据处理模块中设有第一预设分值F1和第二预设分值F2,F1<F2,数据处理模块将任一所述数据组中各所述历史学习资料数据的数据评价结果分值F分别与F1和F2进行比对,
当F≥F2时,所述数据处理模块将数据评价结果分值F对应的历史学习资料数据划分为第一数据单元;
当F1≤F<F2时,所述数据处理模块将数据评价结果分值F对应的历史学习资料数据划分为第二数据单元;
当F<F1时,所述数据处理模块将数据评价结果分值F对应的历史学习资料数据划分为第三数据单元。
4.根据权利要求3所述的与词典笔匹配的学习资源搜集方法,其特征在于,在所述步骤S2中,所述中控模块提取各历史学习资料数据的特征词,统计任一所述数据单元中特征词的总数量N0和各特征词的数量N,中控模块根据N0和N计算该数据单元中各特征词的频率f,设定
所述中控模块中设有第一预设频率f1和第二预设频率f2,f1<f2,中控模块将频率f分别与f1和f2进行比对,
当f≥f2时,所述中控模块将频率f对应的特征词设定为第一级别特征词;
当f1≤f<f2时,所述中控模块将频率f对应的特征词设定为第二级别特征词;
当f<f1时,所述中控模块将频率f对应的特征词设定为第三级别特征词。
5.根据权利要求4所述的与词典笔匹配的学习资源搜集方法,其特征在于,在所述步骤S3中,所述中控模块统计各所述数据单元中第一级别特征词的频率f1 i,计算各数据单元中第一级别特征词的平均频率f1 p,设定
其中,M为所述特征词的种类;
所述中控模块将第一级别特征词的平均频率f1 p与预设平均频率f10进行比对,
当f1 p≥f10时,所述中控模块判定第一级别特征词的平均频率符合标准;
当f1 p<f10时,所述中控模块判定第一级别特征词的平均频率不符合标准。
6.根据权利要求5所述的与词典笔匹配的学习资源搜集方法,其特征在于,所述中控模块在判定第一级别特征词的平均频率不符合标准时,计算f1 p与f10的差值Δf并根据Δf对第一预设频率f1和第二预设频率f2进行调节,设定Δf=f10-f1 p,其中,所述中控模块中设有第一预设差值Δf1、第二预设差值Δf2、第一预设调节系数α1、第二预设调节系数α2和第三预设调节系数α3,Δf1<Δf2,0.9<α1<α2<α3<1,中控模块将Δf分别与Δf1和Δf2进行比对,
当Δf≥Δf2时,所述中控模块选用α1将第一预设频率调节至f1',设定f1'=f1×α1,将第二预设频率调节至f2',设定f2'=f2×α1;
当Δf1≤Δf<Δf2时,所述中控模块选用α2将第一预设频率调节至f1',设定f1'=f1×α2,将第二预设频率调节至f2',设定f2'=f2×α2;
当Δf<Δf1时,所述中控模块选用α3将第一预设频率调节至f1',设定f1'=f1×α3,将第二预设频率调节至f2',设定f2'=f2×α3。
7.根据权利要求6所述的与词典笔匹配的学习资源搜集方法,其特征在于,在所述步骤S4中,所述中控模块根据用户电子档案中的用户学龄调取对应数据组的数据,计算用户电子档案中的特征词与对应数据组中任一数据单元的第一级别特征词的第一匹配度S1和用户电子档案中的特征词与该数据单元的第二级别特征词的第二匹配度S2,设定S1=用户电子档案中的特征词中存在的第一级别特征词的数量/对应数据组中任一数据单元中第一级别特征词的数量,S2=用户电子档案中的特征词中存在的第二级别特征词的数量/该数据单元中第二级别特征词的数量。
8.根据权利要求7所述的与词典笔匹配的学习资源搜集方法,其特征在于,所述中控模块提取用户电子档案中的特征词与对应数据组中各数据单元的第一级别特征词的第一匹配度S1中的最大值Smax,并将Smax与预设标准匹配度S0进行比对,
当Smax≥S0时,所述中控模块根据Smax对应的数据单元给出匹配结果,其中,当Smax对应的数据单元为第一数据单元时,匹配结果为匹配成功,当Smax对应的数据单元为第二数据单元时,匹配结果为初步匹配成功,当Smax对应的数据单元为第三数据单元时,匹配结果为匹配不成功;
当Smax<S0时,所述中控模块对用户的匹配结果做进一步判断。
9.根据权利要求8所述的与词典笔匹配的学习资源搜集方法,其特征在于,当Smax<S0时,所述中控模块计算用户电子档案中的特征词与对应数据组中任一数据单元的第一级别特征词的第一匹配度S1和用户电子档案中的特征词与该数据单元的第二级别特征词的第二匹配度S2的匹配度加和Sh,设定Sh=S1+S2,所述中控模块提取匹配度加和Sh中的最大值Shmax,并将Shmax对应的数据单元的匹配结果设为初步匹配成功。
10.一种应用权利要求1-9任一项所述与词典笔匹配的学习资源搜集方法的系统,其特征在于,包括:
数据获取模块,用以获取若干资料完整的历史学习资料数据;
数据处理模块,其与所述数据获取模块相连,用以根据学龄将所述历史学习资料数据划分为若干数据组,并根据数据评价结果分值将任一所述数据组划分为若干数据单元;
语音模块,其与中控模块相连,用以针对用户的语音提问,将提问记录储存至用户电子档案;
中控模块,其分别与所述数据处理模块和所述语音模块相连,用以提取各所述历史学习资料数据的特征词并设定特征词的级别,以及根据用户电子档案中提取的特征词给出匹配结果。
CN202310683547.5A 2023-06-09 2023-06-09 与词典笔匹配的学习资源搜集方法及其系统 Active CN116701561B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310683547.5A CN116701561B (zh) 2023-06-09 2023-06-09 与词典笔匹配的学习资源搜集方法及其系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310683547.5A CN116701561B (zh) 2023-06-09 2023-06-09 与词典笔匹配的学习资源搜集方法及其系统

Publications (2)

Publication Number Publication Date
CN116701561A CN116701561A (zh) 2023-09-05
CN116701561B true CN116701561B (zh) 2024-04-26

Family

ID=87842869

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310683547.5A Active CN116701561B (zh) 2023-06-09 2023-06-09 与词典笔匹配的学习资源搜集方法及其系统

Country Status (1)

Country Link
CN (1) CN116701561B (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104615782A (zh) * 2015-03-02 2015-05-13 武汉工程大学 基于滑动窗口最大匹配算法的地址匹配方法
CN110413738A (zh) * 2019-07-31 2019-11-05 腾讯科技(深圳)有限公司 一种信息处理方法、装置、服务器及存储介质
CN110659423A (zh) * 2019-09-19 2020-01-07 辽宁工程技术大学 一种基于协同过滤的校方学习资料推荐方法
CN110853422A (zh) * 2018-08-01 2020-02-28 世学(深圳)科技有限公司 一种沉浸式语言学习系统及其学习方法
CN111506727A (zh) * 2020-04-16 2020-08-07 腾讯科技(深圳)有限公司 文本内容类别获取方法、装置、计算机设备和存储介质
CN113470644A (zh) * 2021-06-29 2021-10-01 读书郎教育科技有限公司 一种基于语音识别的智能语音学习方法及装置
CN113946654A (zh) * 2021-10-18 2022-01-18 安徽清博大数据科技有限公司 一种智能设置监测词系统及方法
WO2022041729A1 (zh) * 2020-08-31 2022-03-03 康键信息技术(深圳)有限公司 用药推荐方法、装置、设备及存储介质
CN115146161A (zh) * 2022-06-30 2022-10-04 武汉美和易思数字科技有限公司 一种基于内容推荐的个性化学习资源推荐方法及系统

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104615782A (zh) * 2015-03-02 2015-05-13 武汉工程大学 基于滑动窗口最大匹配算法的地址匹配方法
CN110853422A (zh) * 2018-08-01 2020-02-28 世学(深圳)科技有限公司 一种沉浸式语言学习系统及其学习方法
CN110413738A (zh) * 2019-07-31 2019-11-05 腾讯科技(深圳)有限公司 一种信息处理方法、装置、服务器及存储介质
CN110659423A (zh) * 2019-09-19 2020-01-07 辽宁工程技术大学 一种基于协同过滤的校方学习资料推荐方法
CN111506727A (zh) * 2020-04-16 2020-08-07 腾讯科技(深圳)有限公司 文本内容类别获取方法、装置、计算机设备和存储介质
WO2022041729A1 (zh) * 2020-08-31 2022-03-03 康键信息技术(深圳)有限公司 用药推荐方法、装置、设备及存储介质
CN113470644A (zh) * 2021-06-29 2021-10-01 读书郎教育科技有限公司 一种基于语音识别的智能语音学习方法及装置
CN113946654A (zh) * 2021-10-18 2022-01-18 安徽清博大数据科技有限公司 一种智能设置监测词系统及方法
CN115146161A (zh) * 2022-06-30 2022-10-04 武汉美和易思数字科技有限公司 一种基于内容推荐的个性化学习资源推荐方法及系统

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Personalized Recommendation Method of Innovation and Entrepreneurship Education Resources Based on Social Network Platform;Shun Li 等;Advanced Hybrid Information Processing;20230322;第 604–619页 *
基于HNC语境框架和情感词典的文本情感倾向分析;张克亮;黄金柱;曹蓉;李峰;;山东大学学报(理学版);20160519(第07期);51-58+73 *
基于组合推荐技术的个性化学习资料推荐的研究;孙立莹;中国优秀硕士学位论文全文数据库 (信息科技辑);20100815;I138-993 *
张克亮 ; 黄金柱 ; 曹蓉 ; 李峰 ; .基于HNC语境框架和情感词典的文本情感倾向分析.山东大学学报(理学版).2016,(第07期),51-58+73. *

Also Published As

Publication number Publication date
CN116701561A (zh) 2023-09-05

Similar Documents

Publication Publication Date Title
CA2470299C (en) Systems, methods, and software for classifying documents
CN106156204B (zh) 文本标签的提取方法和装置
US20050086045A1 (en) Question answering system and question answering processing method
US20070239707A1 (en) Method of searching text to find relevant content
CN109299245B (zh) 知识点召回的方法和装置
CN103729351A (zh) 查询词推荐方法及装置
CN108509461A (zh) 一种基于强化学习的排序学习方法及服务器
CN109508456B (zh) 一种文本处理方法和装置
CN114357120A (zh) 基于faq的无监督式检索方法、系统及介质
CN109933648A (zh) 一种真实用户评论的区分方法和区分装置
CN115292542A (zh) 基于试题配图的试题搜索方法、系统、存储介质及设备
Wibawa et al. Generating Javanese Stopwords List using K-means Clustering Algorithm.
US20220075804A1 (en) Method and device for providing guide information for enhancement of artist's reputation
WO2001014992A1 (en) Document classification apparatus
CN109635254A (zh) 基于朴素贝叶斯、决策树和svm混合模型的论文查重方法
CN116701561B (zh) 与词典笔匹配的学习资源搜集方法及其系统
CN116628142B (zh) 知识检索方法、装置、设备及可读存储介质
CN115936939A (zh) 基于多偏好度的项目推荐方法及系统
CN115660913A (zh) 一种为用户定制学习内容的系统及方法
Elworthy Language identification with confidence limits
US20050198059A1 (en) Database and database management system
CN109741190A (zh) 一种个股公告分类的方法、系统及设备
CN118378626B (zh) 一种基于HanLP的无纸化考试主观题自动评阅方法
CN117786134B (zh) 中文语言教学视听平台多模态语料库及智能多维检索系统
CN117828087B (zh) 基于llm的医疗器械数据分类方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant