CN116975447B

CN116975447B - 一种便携式学习机及其资源检索方法

Info

Publication number: CN116975447B
Application number: CN202310929713.5A
Authority: CN
Inventors: 张玉乐; 韩书明; 李宁
Original assignee: Shenzhen Hantong Technology Co ltd
Current assignee: Shenzhen Hantong Technology Co ltd
Priority date: 2023-07-26
Filing date: 2023-07-26
Publication date: 2024-02-02
Anticipated expiration: 2043-07-26
Also published as: CN116975447A

Abstract

本发明数据检索技术领域，尤其涉及一种便携式学习机及其资源检索方法。所述方法包括以下步骤：对原始资源数据进行缺失数据填充处理，生成初始资源数据；对初始资源数据进行数据预处理及特征提取，获得特征资源数据；对特征资源数据进行数据分类，分别生成分类资源类别与分类资源数据；基于分类资源类别进行资源数据的资源网络建立，并利用分类资源数据进行网络节点数据填充，生成初始资源网络；对初始资源网络进行关联性优化，生成关联资源网络；获取用户检索数据；利用用户检索数据对关联资源网络进行数据资源定位及相关资源关联推荐，生成资源检索数据。本发明对用户检索的资源数据进行精准推送，并推送关联性的资源检索信息。

Description

一种便携式学习机及其资源检索方法

技术领域

本发明数据检索技术领域，尤其涉及一种便携式学习机及其资源检索方法。

背景技术

在现代教育中，学习机成为一种重要的教育辅助工具，帮助学生获取知识和提升学习效果，学习机能够提供多种资源，如教材、习题、视频等，帮助学生进行自主学习和知识掌握，由于资源数量庞大且种类繁多，学生常常面临资源检索困难的问题。然而，传统的便携式学习机的资源检索方法通常采用简单的关键字搜索方法，推送的信息可能不精准，并且推送的信息内容往往单一且不够丰富，不能帮助学生进行关联性的学习，但这种方法往往难以满足学生的具体需求。

发明内容

基于此，本发明提供一种便携式学习机及其资源检索方法，以解决至少一个上述技术问题。

为实现上述目的，一种便携式学习机的资源检索方法，包括以下步骤：

步骤S1：利用网络爬虫技术对云服务器进行数据爬取，获得学习机的原始资源数据；利用深度学习算法对原始资源数据进行缺失数据填充处理，生成初始资源数据；

步骤S2：对初始资源数据进行数据预处理及特征提取，获得特征资源数据；

步骤S3：利用决策树算法对特征资源数据进行数据分类，分别生成分类资源类别与分类资源数据；

步骤S4：基于分类资源类别进行资源数据的资源网络建立，并利用分类资源数据进行网络节点数据填充，生成初始资源网络；对初始资源网络进行关联性优化，生成关联资源网络；

步骤S5：获取用户检索数据；利用用户检索数据对关联资源网络进行数据资源定位及相关资源关联推荐，生成资源检索数据。

本发明获取原始资源数据并填充缺失数据，从而生成完整的初始资源数据，通过网络爬虫技术，学习机可以自动从云服务器中获取大量的数据，这些数据可能包括文本、图像、音频等不同形式的资源。由于数据的来源和质量的多样性，可能存在缺失的情况，通过利用深度学习算法进行缺失数据填充处理，可以有效地提高数据的完整性和可用性，为后续的资源检索和分析提供更准确的基础。对初始资源数据进行数据预处理和特征提取，从而生成具有更高表示能力的特征资源数据，数据预处理包括数据清洗、去噪、标准化等操作，可以减少数据中的噪声和冗余信息，提高数据的质量。特征提取则是从原始数据中提取出具有代表性的特征，用于描述资源的关键属性，学习机可以将原始数据转化为更加紧凑和有信息量的特征表示，方便后续的资源分类和关联分析。对特征资源数据进行分类，将资源数据按照其属性或类别进行划分，通过应用决策树算法，学习机可以根据资源数据的特征，构建分类模型并进行数据分类，分类的结果包括分类资源类别和分类资源数据，使得学习机能够更好地理解和组织资源数据，为后续的资源网络建立和关联性优化提供基础。建立资源网络并优化资源之间的关联性，基于分类资源类别，学习机可以构建资源网络，将相似或相关的资源连接起来，形成初始的资源网络，利用分类资源数据对网络节点进行数据填充，使得节点具有更丰富的信息。通过关联性优化，学习机可以对初始资源网络进行分析和调整，提高资源之间的关联性和相似性，使得资源网络更加准确和完善。根据用户的检索数据，对关联资源网络进行数据资源定位和相关资源关联推荐。通过获取用户的检索数据，学习机可以理解用户的需求和兴趣，从而在关联资源网络中快速定位符合用户需求的资源数据，学习机还可以利用资源网络中的关联信息，对用户进行相关资源的推荐，提供更加个性化和精准的资源检索结果。因此，本发明的学习机资源检索方法通过构建关联资源网络，利用检索信息对关联资源网络进行信息精准定位，使得推送的信息精准，并且关联资源网络还会将一些关联性资源进行推送，使得推送的信息内容丰富，帮助学生进行关联性的拓展学习，满足学生的具体需求。

优选地，步骤S1包括以下步骤：

步骤S11：根据预设的数据范畴对云服务器进行学习机的数据资源定位，生成待获取学习机资源列表；

步骤S12：利用网络爬虫技术对待获取学习机资源列表进行数据爬取，获得学习机的原始资源数据；

步骤S13：对原始资源数据进行数据清洗处理，生成清洗资源数据；

步骤S14：对清洗资源数据进行缺失值比例计算，生成分类资源数据的数据缺失值比例；

步骤S15：根据预设的数据完整性阈值对分类资源数据进行数据校验，当数据缺失值比例小于数据完整性阈值时，则将分类资源数据标记为缺失资源数据；当数据缺失值比例不小于数据完整性阈值时，则将分类资源数据标记为达标资源数据；

步骤S16：利用深度学习算法对缺失资源数据进行数据填充，生成填充资源数据；

步骤S17：将达标资源数据与填充资源数据进行数据整合，生成初始资源数据。

本发明根据学习机需要获取的数据范畴，在云服务器中进行数据资源定位，生成待获取学习机资源列表，通过预设的数据范畴，学习机可以明确需要获取的资源类型或主题，从而减少不必要的数据获取和处理，提高资源获取的效率和准确性。利用网络爬虫技术对待获取学习机资源列表中的资源进行数据爬取，从而获得学习机的原始资源数据，通过网络爬虫技术，学习机可以自动化地访问和抓取云服务器上的资源，无需人工干预，原始资源数据可能包括文本、图像、音频等多种形式，爬取这些数据可以为后续的数据处理和分析提供丰富的素材。对原始资源数据进行数据清洗处理，从而生成清洗资源数据，数据清洗包括去除重复数据、去除噪声数据、修复错误数据等操作，以提高数据的质量和准确性，清洗资源数据可以使学习机在后续的数据处理和分析中更加可靠和准确。对清洗资源数据进行缺失值比例计算，以了解资源数据中缺失值的情况，并生成分类资源数据的数据缺失值比例，通过计算缺失值比例，学习机可以评估资源数据的完整性和可用性，为后续的数据处理和填充提供参考。根据预设的数据完整性阈值对分类资源数据进行数据校验，并将其标记为缺失资源数据或达标资源数据，通过设定数据完整性阈值，学习机可以根据资源数据的缺失值比例来判断数据是否达到预设的完整性标准，可以对资源数据进行有效的筛选和分类，以便后续的数据填充和整合。利用深度学习算法对缺失资源数据进行数据填充，从而生成填充资源数据，通过深度学习算法，学习机可以根据已有的资源数据模式和特征，预测和生成缺失的资源数据，数据填充可以提高资源数据的完整性和可用性，为后续的数据分析和应用提供更全面的数据基础。根据达标资源数据和填充资源数据进行数据整合，生成初始资源数据，达标资源数据表示已经满足预设的完整性标准的资源数据，而填充资源数据是通过深度学习算法生成的缺失资源数据，通过整合这两部分数据，学习机可以获得更完整、更全面的初始资源数据，为后续的数据处理和资源检索提供更准确和丰富的资源基础。

优选地，步骤S16包括以下步骤：

步骤S161：利用深度学习算法建立修复缺失资源数据的映射关系，生成初始修复资源数据模型；

步骤S162：利用达标资源数据对初始修复资源数据模型进行修复资源数据模型训练，生成修复资源数据模型；

步骤S163：将缺失资源数据传输至修复资源数据模型中进行缺失资源数据的数据填充值预测处理，生成填充信息；

步骤S164：利用填充信息对缺失资源数据进行数据填充，生成填充资源数据。

本发明通过深度学习算法，学习机可以学习和建模资源数据之间的内在关系和模式，从而能够预测缺失数据的可能值，该修复资源数据模型可以通过对已有的数据进行训练和优化来提高预测的准确性和可靠性。通过使用达标资源数据，学习机可以通过与已有的完整数据进行比较和学习，进一步优化修复资源数据模型，提高模型对缺失数据的预测和填充能力，使得填充的结果更加准确和可靠。通过将缺失资源数据输入到修复资源数据模型中，学习机可以利用模型学习到的关系和模式，预测缺失数据的填充值，填充信息包括预测的填充值以及相关的置信度或概率等信息，用于后续的数据填充操作。根据填充信息中的预测值和置信度，学习机可以将这些值应用于缺失的数据位置，填充缺失资源数据，填充资源数据可以提高资源数据的完整性和可用性，使得数据集更加完备，从而为后续的资源检索和分析提供更准确和全面的数据基础。

优选地，步骤S2包括以下步骤：

步骤S21：利用最小-最大归一化法对降噪资源数据进行数据归一化，生成归一化资源数据；

步骤S22：利用主成分分析法对归一化资源数据进行冗余数据降维处理，生成降维资源数据；

步骤S23：利用特征工程对降维资源数据进行特征提取处理，获得特征资源数据。

本发明最小-最大归一化是一种常用的数据预处理方法，它将数据按照最小值和最大值进行线性映射，使得数据落入指定的数值范围内，消除了数据之间的尺度差异。归一化可以提高数据的可比性和可解释性，方便后续的数据处理和特征提取。主成分分析(PCA)是一种常用的降维技术，它通过线性变换将原始数据映射到一组新的变量(主成分)上，使得新变量能够最大程度地保留原始数据的信息，通过降维减少数据的维度，去除冗余信息，提高数据的紧凑性和表达能力，同时减少后续数据处理的计算复杂性。特征工程是根据问题的需求和特定领域的知识，将原始数据转化为更具有代表性和区分性的特征表示的过程，通过特征提取，学习机可以从降维后的资源数据中提取出最具有信息量和区分性的特征，用于描述资源的关键属性，特征资源数据具有更高的表达能力，有助于提高后续数据分类、资源关联等任务的性能。

优选地，步骤S3包括以下步骤：

步骤S31：基于决策树算法建立资源类型分类的映射关系，生成初始分类资源模型；

步骤S32获取数据库中的分类资源信息；

步骤S33：利用分类资源信息对初始分类资源模型进行分类资源模型训练，生成分类资源模型；

步骤S34：将特征资源数据传输至分类资源模型中进行数据资源分类，分别生成分类资源类别与分类资源数据。

本发明决策树是一种常用的机器学习算法，通过构建树状结构，将数据按照一系列特征条件进行分割和分类，通过对已有的特征资源数据进行训练和学习，学习机可以建立起资源类型分类的映射关系，形成初始的分类资源模型。获取数据库中存储的分类资源信息，数据库中存储了已经分类的资源数据，包括资源的类别或标签等信息，通过获取数据库中的分类资源信息，学习机可以获取用于分类资源模型训练和评估的数据，为后续的分类模型建立提供数据基础。通过使用分类资源信息，学习机可以对初始分类资源模型进行优化和训练，使其能够更准确地进行资源分类，分类资源模型的训练可以包括参数调整、模型优化和性能评估等步骤，以提高模型对资源分类任务的准确性和泛化能力。通过将特征资源数据输入到训练好的分类资源模型中，学习机可以根据模型学习到的分类映射关系，将特征资源数据分配到相应的资源类别中，这样可以实现对资源数据的分类，并生成相应的分类资源类别标签和分类资源数据，为后续的资源检索和构建关联资源网络提供准确和可靠的资源分类基础。

优选地，步骤S4包括以下步骤：

步骤S41：基于分类资源类别进行资源数据的资源网络建立，并利用分类资源数据进行网络节点数据填充，生成初始资源网络；

步骤S42：利用分类资源类别关联性算法对分类资源类别进行资源类别关联性计算，生成资源类别关联权重；

步骤S43：利用资源类别关联权重对初始资源网络进行关联性优化，生成关联资源网络。

本发明根据资源的分类类别，学习机可以将相似或相关的资源连接起来，形成资源之间的网络关系，通过网络节点的数据填充，学习机可以为网络节点提供更丰富的信息，使得初始资源网络更具完整性和可用性。通过分析分类资源类别之间的关联程度，学习机可以计算出资源类别之间的关联权重，反映资源类别之间的相关程度或相似度，资源类别关联权重可以作为后续关联资源网络建立和优化的依据，有助于提高资源关联的准确性和可靠性。通过应用资源类别关联权重，学习机可以调整初始资源网络中资源之间的连接关系，增强相关资源之间的联系，减弱不相关资源之间的联系，从而提高资源网络的关联性和一致性，关联资源网络能够更准确地表示资源之间的关系和相似性。

优选地，步骤S43中的分类资源类别关联性算法如下所示：

式中，P表示为资源类别关联权重，N表示为分类资源类别的分类总类，c_i表示为根据第i个分类资源类别的资源类生成的语意信息，c_j表示为根据第j个分类资源类别的资源类生成的语意信息，x表示为定义语意信息的评判调整值，y_ij表示为第i个与第j个分类资源类别的资源类的信息熵，a表示为描述资源类别的评判调整值，b_ij表示为第i个与第j个分类资源类别的资源类别的描述相似度，τ表示为资源类别关联权重的异常调整值。

本发明利用一种分类资源类别关联性算法，该算法综合考虑了分类资源类别的分类总类N、根据第i个分类资源类别的资源类生成的语意信息c_i、根据第j个分类资源类别的资源类生成的语意信息c_j、定义语意信息的评判调整值x、第i个与第j个分类资源类别的资源类的信息熵y_ij、描述资源类别的评判调整值a、第i个与第j个分类资源类别的资源类别的描述相似度b_ij以及函数之间的相互作用关系，以形成函数关系式：

即，通过计算资源类别之间的关联度，可以量化不同类别之间的相似性或相关性，根据第i个与第j个分类资源类别的资源类生成的语意信息，以及考虑其他的参数进行计算，可以获取资源类别之间的关联性；第i个与第j个分类资源类别的资源类的信息熵，描述了这两个类别的差异性或熵值，第i个与第j个分类资源类别的资源类别的描述相似度，衡量了这两个类别之间的相似程度，通过考虑信息熵和描述相似度，可以更准确地捕捉资源类别之间的差异性和相似性，确保资源类别关联性计算的准确性和权衡；通过调整定义语意信息的评判调整值以及描述资源类别的评判调整值对语义信息和资源类别之间的权重进行灵活的调整和优化，以适应具体的应用场景和需求，更准确地捕捉资源之间的关联关系，提高关联资源网络的精度和准确性。利用资源类别关联权重的异常调整值τ对函数关系式进行调整修正，减少异常数据或误差项带来的误差影响，从而更准确地生成资源类别关联权重P，提高了对分类资源类别进行资源类别关联性计算的准确性和可靠性。同时该公式中的调整值可以根据实际情况进行调整，应用于不同的分类资源类别中，提高了算法的灵活性与适用性。

优选地，步骤S5包括以下步骤：

步骤S51：获取用户检索数据；

步骤S52：利用自然语言技术对初始检索信息进行语意分析，生成语意检索信息；

步骤S53：基于分类资源类别对关联资源网络进行数据索引设计，生成关联资源网络的数据索引；

步骤S54：利用检索信息匹配计算公式对语意检索信息与数据索引进行数据匹配计算，生成检索匹配计算结果，并选取检索匹配计算结果的最优值对应的数据索引，标记为初始检索信息；

步骤S55：利用初始检索信息对关联资源网络进行数据资源定位，生成资源定位信息；

步骤S56：根据资源定位信息与资源类别关联权重进行相关资源关联推荐，生成资源检索数据。

本发明获取用户输入的检索数据，该数据描述了用户所需资源的特征、属性或需求，用户检索数据可以是文本查询、关键词、语音指令等形式，用于指导学习机进行资源检索和推荐。通过语义分析，学习机可以理解用户检索的含义，识别关键词、实体、关系等，并将其转化为语义检索信息，语义检索信息能够更准确地表达用户的意图和需求，为后续的资源检索和推荐提供更精确的指导。通过将资源数据按照分类资源类别进行组织和索引，学习机可以快速定位和检索与特定类别相关的资源，数据索引设计可以提高资源检索的效率和准确性，缩小搜索范围，使得学习机能够更快地找到与用户需求匹配的资源。通过匹配计算，学习机可以评估资源数据与检索信息之间的相似度或相关度，并根据计算结果选取最优值对应的数据索引，将最优匹配结果标记为初始检索信息，即所选取的与用户需求最相关的资源数据索引。通过资源定位可以精确地找到与初始检索信息匹配的资源节点，确定其位置和属性，资源定位信息提供了用户需求与资源数据的精确关联，为后续的资源检索和应用提供准确的资源定位基础。通过综合考虑资源定位信息和资源类别关联权重，推荐与用户需求最相关的资源，资源检索数据提供了与用户需求高度相关的资源推荐，使得学习机能够根据用户的检索数据提供有针对性的资源选择和推荐。

优选地，步骤S54中的检索信息匹配计算公式如下所示：

式中，K表示为检索匹配计算结果，M表示为语意检索信息的信息长度，d_l表示为第l项语意信息的重要程度，f_l表示为第l项语意信息的在数据索引中出现的频率，g_l表示为第l项语意信息的权重信息，θ_l表示为第l项语意信息的在关联资源网络的方向性，β_l表示为第l项语意信息与数据索引的匹配阈值参数，表示为检索匹配计算结果的异常调整值。

本发明利用一种检索信息匹配计算公式，该公式充分考虑了语意检索信息的信息长度M、第l项语意信息的重要程度d_l、第l项语意信息的在数据索引中出现的频率f_l、第l项语意信息的权重信息g_l、第l项语意信息的在关联资源网络的方向性θ_l、第l项语意信息与数据索引的匹配阈值参数β_l以及函数之间的相互作用关系，以形成函数关系式：

即，通过对第l项语意信息的重要程度与第l项语意信息的权重信息语进行计算，可以准确评估语义信息在检索中的重要性和影响力，重要程度和权重的设定可以根据应用场景和需求进行调整，使得匹配计算结果更加准确和符合用户期望；考虑第l项语意信息的在数据索引中出现的频率与在关联资源网络的方向性，可以捕捉语义信息在数据索引和关联资源网络中的分布情况，这有助于评估语义信息在资源检索中的可靠性和相关性，从而提高匹配计算结果的准确性和精度；利用第l项语意信息与数据索引的匹配阈值参数以确定数据匹配评判标准，使得学习机能够根据具体应用场景和需求，对匹配计算结果进行合理的调整和优化。通过综合考虑多个参数和指标，可以准确评估语义信息与数据索引之间的匹配程度，提高匹配计算结果的准确性和可靠性，这有助于确定与用户需求最相关的资源数据，为后续的资源定位和推荐提供准确的基础。利用检索匹配计算结果的异常调整值/>对函数关系式进行调整修正，减少异常数据或误差项带来的误差影响，从而更准确地生成检索匹配计算结果K，提高了对语意检索信息与数据索引进行数据匹配计算的准确性和可靠性。同时该公式中的权重信息以及调整值可以根据实际情况进行调整，应用于不同的语意检索信息与数据索引中，提高了算法的灵活性与适用性。

在本说明书中，提供了一种便携式学习机，包括：

资源数据采集模块：利用网络爬虫技术对云服务器进行数据爬取，生成原始资源数据；利用深度学习算法对原始资源数据进行缺失数据填充处理，生成初始资源数据；

资源数据特征提取模块：用于对初始资源数据进行数据预处理及特征提取，获得特征资源数据；

资源数据分类模块：利用决策树算法对特征资源数据进行数据分类，分别生成分类资源类别与分类资源数据；

资源网络建立模块：基于分类资源类别进行资源数据的资源网络建立，并利用分类资源数据进行网络节点数据填充，生成初始资源网络；对初始资源网络进行关联性优化，生成关联资源网络；

资源检索模块：获取用户检索数据；利用用户检索数据对关联资源网络进行数据资源定位及相关资源关联推荐，生成资源检索数据。

本申请有益效果在于，本发明通过网络爬虫技术对云服务器进行数据爬取，并使用深度学习算法对缺失数据进行填充。这有益于生成完整、准确且可用的资源数据，提高数据的质量和可靠性，填充的数据能够增加资源数据的覆盖度，扩大学习机在资源检索中的搜索范围，使得学习机能够更全面地理解和满足用户的需求。通过数据预处理和特征提取步骤，对资源数据进行归一化、降维和特征提取处理，这有益于降低数据的冗余性和维度，减少数据处理的计算复杂度，提高学习机对数据的理解和表达能力，通过特征提取，学习机能够从资源数据中捕捉到最具代表性和区分性的特征，从而更准确地识别和推荐与用户需求相关的资源。通过决策树算法，建立资源类型分类的映射关系，并训练分类资源模型，使得学习机对资源数据进行准确的分类和标记，为后续的资源检索和推荐提供准确的基础，分类资源模型能够捕捉到不同资源类别之间的特征和差异，使得学习机能够更精准地理解和满足用户的特定需求。基于分类资源类别，建立资源网络，并利用资源类别关联权重优化网络的关联性，从而使学习机构建准确、全面且高效的资源关联网络，使得学习机能够更好地理解资源之间的关联关系和相互作用。通过资源关联网络，学习机能够实现资源的智能推荐、关联分析和交叉引用，提供更全面、多样化的资源服务，满足用户的更广泛需求。获取用户检索数据，并通过自然语言技术进行语义分析，提取语义检索信息，利用资源类别关联权重和数据索引，对语义检索信息进行匹配计算和资源定位，生成资源检索数据和推荐结果，理解用户的语义需求，精确匹配和推荐与用户需求高度相关的资源，通过个性化的资源推荐和检索，学习机能够提供更加精准、针对性和满意度高的资源服务，提升用户体验和满意度。

附图说明

图1为本发明一种便携式学习机的资源检索方法的步骤流程示意图；

图2为图1中步骤S1的详细实施步骤流程示意图；

图3为图1中步骤S5的详细实施步骤流程示意图；

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

下面结合附图对本发明专利的技术方法进行清楚、完整的描述，显然，所描述的实施例是本发明的一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域所属的技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

此外，附图仅为本发明的示意性图解，并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分，因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体，不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现功能实体，或在一个或多个硬件模块或集成电路中实现这些功能实体，或在不同网络和/或处理器方法和/或微控制器方法中实现这些功能实体。

应当理解的是，虽然在这里可能使用了术语“第一”、“第二”等等来描述各个单元，但是这些单元不应当受这些术语限制。使用这些术语仅仅是为了将一个单元与另一个单元进行区分。举例来说，在不背离示例性实施例的范围的情况下，第一单元可以被称为第二单元，并且类似地第二单元可以被称为第一单元。这里所使用的术语“和/或”包括其中一个或更多所列出的相关联项目的任意和所有组合。

为实现上述目的，请参阅图1至图3，本发明提供一种便携式学习机的资源检索方法，包括以下步骤：

本发明实施例中，参考图1所述，为本发明一种便携式学习机的资源检索方法的步骤流程示意图，在本实施例中，所述便携式学习机的资源检索方法包括以下步骤：

本发明实施例中，在学习机资源检索系统中，使用网络爬虫技术从云服务器上抓取在线教育平台上的课程数据，通过网络爬虫程序，系统访问教育平台的网页，解析网页结构，提取课程的关键信息，这样就生成了学习机的原始资源数据。从网络爬虫抓取的数据中可能存在一些缺失值，需要使用深度学习算法进行缺失数据填充处理，可以使用深度学习模型，将原始资源数据作为输入，通过训练模型来预测和填充缺失的数据，模型学习到的填充规则可以根据已有的数据来推断和填充缺失值，从而生成填充后的初始资源数据。

本发明实施例中，对初始资源数据进行数据预处理和特征提取，以便进一步处理和分析数，可以进行数据清洗、去除异常值或噪声，对数据进行归一化或标准化，使得数据具有一致的尺度和范围。从初始资源数据中提取最具代表性和区分性的特征，例如可以使用主成分分析等降维技术，将高维的初始资源数据降低到更低维度的特征空间，在降维过程中，保留了最能解释数据方差的特征，使得特征资源数据更具有可解释性和有效性。

本发明实施例中，通过决策树算法对特征资源数据进行数据分类，可以将资源数据按照特定的分类规则进行划分和标记，例如以学科领域为例，可以使用决策树算法对特征资源数据进行学科分类，将资源数据分为数学、语文、科学等不同的分类类别，决策树算法通过学习数据的特征和类别标签之间的关系，构建决策树模型，将特征资源数据映射到相应的分类资源类别，从而生成了分类资源类别和对应的分类资源数据。

本发明实施例中，根据分类资源类别，可以建立资源网络，将同一类别的资源节点连接起来，例如以学科分类为例，将同一学科的资源节点连接在一起，形成初始资源网络的结构。利用分类资源数据填充资源网络的节点数据，以丰富网络中每个节点的信息，例如对于每个资源节点，可以使用分类资源数据中的属性值填充节点的相关信息，如资源描述、关键词等。对初始资源网络进行关联性优化，以提高资源之间的关联性和相关性，通过分析资源节点之间的关系、共现频率等指标，可以调整资源网络的连接权重，使得关联资源节点之间的关系更加准确和有效，生成关联资源网络，为后续的资源检索和关联推荐提供了更可靠和全面的基础。

本发明实施例中，当用户提供检索需求时，学习机获取用户检索数据，如关键词、查询语句等，利用这些用户检索数据，学习机可以对关联资源网络进行数据资源定位，找到与用户需求最相关的资源节点。基于关联资源网络的结构和连接权重，学习机可以进行相关资源关联推荐，推荐与用户检索需求相关的其他资源节点，通过综合考虑资源节点的关联性和相关性，学习机生成资源检索数据，包括定位到的资源节点和相关资源推荐结果，从而学习机能够提供准确、全面和个性化的资源检索服务，满足用户的需求和期望。

优选地，步骤S1包括以下步骤：

作为本发明的一个实例，参考图2所示，为图1中步骤S1的详细实施步骤流程示意图，在本实例中所述步骤S1包括：

本发明实施例中，根据预设的数据范畴，我们通过学术数据库进行学术论文的数据资源定位，生成待获取学习机资源列表，这个列表包含了我们希望获取的学术论文的相关信息。

本发明实施例中，利用网络爬虫技术对待获取学习机资源列表进行数据爬取，通过编写网络爬虫程序，可以自动访问学术数据库的网页，提取每篇论文的信息，例如可以抓取论文标题、作者、摘要等数据，并将这些数据保存为学习机的原始资源数据。

本发明实施例中，对原始资源数据进行数据清洗处理。这包括去除不必要的标签、格式转换、去除噪声等操作，以确保数据的质量和一致性，例如对于文本资源，我们可以去除HTML标签和特殊字符，对音频或视频资源，可以进行噪声去除和音频/视频格式的标准化处理。

本发明实施例中，清洗资源数据进行缺失值比例计算，通过统计每个资源数据中缺失值的比例，我们可以了解数据的完整性情况，例如对于一本编程教育电子书，可以计算其中章节、图片或示例代码的缺失比例。

本发明实施例中，根据预设的数据完整性阈值，对分类资源数据进行数据校验，如果数据缺失值比例小于设定的阈值，我们将该资源数据标记为达标资源数据，表示其数据完整性良好，如果数据缺失值比例不小于阈值，我们将该资源数据标记为缺失资源数据，表示其数据存在较多缺失。

本发明实施例中，利用深度学习算法对缺失资源数据进行数据填充，通过训练深度学习模型，我们可以根据已有的达标资源数据作为训练集，预测并填充缺失资源数据的缺失部分，例如对于一段缺失的视频教学素材，我们可以利用深度学习模型预测并填充其中的缺失信息。

本发明实施例中，根据达标资源数据和填充资源数据进行数据整合，生成初始资源数据，将达标资源数据与填充资源数据进行合并，可以得到一个初始的资源数据集，其中包含了数据完整的资源以及通过填充得到的部分资源，这样就生成了初始的资源数据，为后续的数据处理和资源检索提供了基础。

优选地，步骤S16包括以下步骤：

本发明实施例中，利用深度学习算法建立修复缺失资源数据的映射关系，生成初始修复资源数据模型，假设资源数据是图像数据，而其中的某些图像存在缺失部分，可以设计一个深度学习模型，如生成对抗网络(GAN)或变分自编码器(VAE)，来学习缺失图像与完整图像之间的映射关系，通过训练这个模型，我们可以生成一个初始的修复资源数据模型。利用达标资源数据对初始修复资源数据模型进行模型训练，我们使用已经标记为完整的达标资源数据作为训练样本，通过与初始修复资源数据模型的对比，进一步优化修复资源数据模型的性能，修复资源数据模型能够更好地学习和捕捉缺失图像的特征和结构。将缺失的资源数据传输至修复资源数据模型中进行缺失资源数据的数据填充值预测处理，对于每个缺失的数据点，修复资源数据模型可以预测其可能的填充值，生成了填充信息，其中包含了对于每个缺失数据点的预测填充值。将预测的填充值应用于缺失的数据点，我们可以恢复缺失资源数据的完整性，填充资源数据中的缺失部分被合理地填充，使得数据集更加完整，从而为后续的数据处理和资源检索提供准确的基础。

优选地，步骤S2包括以下步骤：

本发明实施例中，利用最小-最大归一化法对降噪资源数据进行数据归一化，假设有一个包含数值数据的资源数据集，其中不同特征具有不同的尺度和范围，通过最小-最大归一化，我们可以将每个特征的值映射到0到1的范围内，消除了不同特征间的尺度差异，例如对于一个数值范围为0到100的特征，通过最小-最大归一化，可以将数值映射到0到1之间的比例，使得所有特征都处于相同的尺度。利用主成分分析法对归一化资源数据进行冗余数据降维处理，主成分分析是一种常用的降维技术，通过线性变换将原始数据转换为一组新的相互正交的特征，其中新特征被称为主成分，这些主成分按照方差大小排列，保留了原始数据中最具有代表性和区分性的信息，通过选择前几个主成分，我们可以实现对数据维度的降低，例如对于一个包含多个数值特征的归一化资源数据集，通过主成分分析可以将数据从高维空间降低到较低维度的空间，保留了最主要的特征。利用特征工程对降维资源数据进行特征提取处理，特征工程是一种通过对原始数据进行变换、组合和衍生来创造新的特征的技术，通过对降维资源数据应用各种特征工程方法，如多项式特征、交叉特征、统计特征等，可以从数据中提取更加丰富、有意义的特征，例如对于一个包含数值和类别特征的降维资源数据集，可以使用特征工程方法创建新的特征，如数值特征的统计摘要、类别特征的独热编码等，从而增强数据的表达能力和区分度。

优选地，步骤S3包括以下步骤：

步骤S32获取数据库中的分类资源信息；

本发明实施例中，假设我们的资源数据是电影数据集，其中包含了电影的各种特征，如导演、演员、类型、评分等，通过使用决策树算法，我们可以构建一个树状结构，根据不同特征的取值将电影分类到不同的资源类型中，例如根据电影的类型特征，我们可以将电影分为动作片、喜剧片、科幻片等不同的类型。获取数据库中的分类资源信息，这意味着我们从已有的资源数据库中获取已经分类好的资源信息作为训练数据，以电影数据库为例，获取一系列已经标记好类型的电影数据，包括电影的各种特征和对应的类型标签，这些数据将用于训练分类资源模型。利用分类资源信息对初始分类资源模型进行模型训练，使用已有的分类资源数据作为训练样本，通过训练模型来学习不同特征对于资源类型的分类规则和决策过程，例如可以训练决策树模型，通过对电影的特征进行判断和分支，最终将电影分类到正确的资源类型中。将特征资源数据传输至分类资源模型中进行数据资源分类，分别生成分类资源类别与分类资源数据。通过将待分类的特征资源数据输入已训练好的分类资源模型，模型将根据内部的决策规则对每个数据进行分类，并生成对应的分类资源类别和分类资源数据，例如对于一个待分类的电影数据，将其特征信息输入已训练好的决策树模型，模型将根据特征的取值判断该电影属于哪个资源类型，并生成对应的分类资源类别和分类资源数据。

优选地，步骤S4包括以下步骤：

本发明实施例中，基于分类资源类别进行资源数据的资源网络建立，假设资源数据是音乐数据集，其中包含了不同音乐曲目的特征，如歌手、流派、时长等，可以根据分类资源类别，例如音乐的流派，将音乐曲目构建成一个资源网络，每个音乐曲目作为网络的节点，不同的关系作为网络的边连接起来，建立一个初始的资源网络，其中节点代表音乐曲目，边代表不同曲目之间的关系。利用分类资源类别关联性算法对分类资源类别进行资源类别关联性计算，通过分析不同分类资源类别之间的关联性，我们可以得到资源类别之间的关联权重，例如对于音乐流派的分类资源类别，我们可以计算不同流派之间的关联度，如摇滚与流行之间的关联度，生成资源类别关联权重，用于后续的资源网络关联性优化。利用资源类别关联权重对初始资源网络进行关联性优化，通过结合资源类别关联权重，可以调整资源网络中节点之间的连接强度和权重，使其更加符合实际的资源关联情况，例如根据音乐流派的关联权重，可以增加或减弱不同流派之间的连接强度，从而调整资源网络的关联性，生成了关联资源网络，其中节点之间的关联程度更加准确和合理。

优选地，步骤S43中的分类资源类别关联性算法如下所示：

优选地，步骤S5包括以下步骤：

步骤S51：获取用户检索数据；

作为本发明的一个实例，参考图3所示，为图1中步骤S5的详细实施步骤流程示意图，在本实例中所述步骤S5包括：

步骤S51：获取用户检索数据；

本发明实施例中，获取用户检索数据，假设我们的学习机平台提供了用户检索功能，用户可以输入关键词或查询条件来寻找特定的学习资源，通过与用户的交互获取到用户的检索数据，这些用户检索数据将作为我们进行资源检索和关联推荐的依据。

本发明实施例中，通过自然语言处理技术，我们对用户输入的检索数据进行分析和理解，提取其中的语义信息，例如对于用户输入的关键词或查询条件，可以识别其中的实体、关键词之间的关系等，通过语意分析，可以将用户的检索信息转化为更加结构化和有意义的语意检索信息，为后续的数据处理和匹配计算提供准确的输入。

本发明实施例中，基于分类资源类别对关联资源网络进行数据索引设计，生成关联资源网络的数据索引，根据之前建立的关联资源网络和资源类别信息，设计数据索引的结构和规则，可以将资源网络中的节点和边根据分类资源类别进行组织和索引，使得资源的检索和定位更加高效和准确，例如对于音乐资源网络，我们可以将不同流派的音乐曲目索引在对应的流派节点下，以便根据用户检索信息进行快速定位。

本发明实施例中，利用检索信息匹配计算公式对语意检索信息与数据索引进行数据匹配计算，生成检索匹配计算结果，并选取检索匹配计算结果的最优值对应的数据索引，标记为初始检索信息，通过匹配计算公式，对语意检索信息与数据索引进行匹配，计算出匹配程度或相关度的评分，根据这些评分可以确定与检索信息最匹配的数据索引，并将其标记为初始检索信息，例如对于用户检索"计算机编程教程"，可以根据匹配计算公式计算出与该检索信息最相关的数据索引，如一本与计算机编程教程相关的电子书。

本发明实施例中，通过初始检索信息，我们可以在关联资源网络中定位与检索信息相关的资源节点或边。

本发明实施例中，根据资源定位信息和资源类别关联权重，我们可以进行相关资源的关联推荐，将与检索信息相关的资源呈现给用户，例如根据用户检索"计算机编程教程"，我们可以定位到与该主题相关的学习资源节点，并推荐其他与计算机编程教程相关的资源，如在线课程、编程工具等。

优选地，步骤S54中的检索信息匹配计算公式如下所示：

在本说明书中，提供了一种便携式学习机，包括：

因此，无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本发明的范围由所附权利要求而不是上述说明限定，因此旨在将落在申请文件的等同要件的含义和范围内的所有变化涵括在本发明内。

以上所述仅是本发明的具体实施方式，使本领域技术人员能够理解或实现本发明。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下，在其它实施例中实现。因此，本发明将不会被限制于本文所示的这些实施例，而是要符合与本文所发明的原理和新颖特点相一致的最宽的范围。

Claims

1.一种便携式学习机的资源检索方法，其特征在于，包括以下步骤：

步骤S4：基于分类资源类别进行资源数据的资源网络建立，并利用分类资源数据进行网络节点数据填充，生成初始资源网络；对初始资源网络进行关联性优化，生成关联资源网络；步骤S4包括以下步骤：

步骤S43：利用资源类别关联权重对初始资源网络进行关联性优化，生成关联资源网络；

步骤S43中的分类资源类别关联性算法如下所示：

；

式中，表示为资源类别关联权重，/>表示为分类资源类别的分类总类，/>表示为根据第/>个分类资源类别的资源类生成的语意信息，/>表示为根据第/>个分类资源类别的资源类生成的语意信息，/>表示为定义语意信息的评判调整值，/>表示为第/>个与第/>个分类资源类别的资源类的信息熵，/>表示为描述资源类别的评判调整值，/>表示为第/>个与第/>个分类资源类别的资源类别的描述相似度，/>表示为资源类别关联权重的异常调整值；

步骤S5：获取用户检索数据；利用用户检索数据对关联资源网络进行数据资源定位及相关资源关联推荐，生成资源检索数据；步骤S5包括以下步骤：

步骤S51：获取用户检索数据；

步骤S56：根据资源定位信息与资源类别关联权重进行相关资源关联推荐，生成资源检索数据；

步骤S54中的检索信息匹配计算公式如下所示：

；

式中，表示为检索匹配计算结果，/>表示为语意检索信息的信息长度，/>表示为第/>项语意信息的重要程度，/>表示为第/>项语意信息的在数据索引中出现的频率，/>表示为第/>项语意信息的权重信息，/>表示为第/>项语意信息的在关联资源网络的方向性，/>表示为第/>项语意信息与数据索引的匹配阈值参数，/>表示为检索匹配计算结果的异常调整值。

2.根据权利要求1所述的便携式学习机的资源检索方法，其特征在于，步骤S1包括以下步骤：

3.根据权利要求2所述的便携式学习机的资源检索方法，其特征在于，步骤S16包括以下步骤：

4.根据权利要求3所述的便携式学习机的资源检索方法，其特征在于，步骤S2包括以下步骤：

5.根据权利要求4所述的便携式学习机的资源检索方法，其特征在于，步骤S3包括以下步骤：

步骤S32获取数据库中的分类资源信息；

6.一种便携式学习机，其特征在于，用于执行如权利要求1所述的便携式学习机的资源检索方法，包括：