CN116401459A

CN116401459A - 一种互联网信息处理方法、系统及记录介质

Info

Publication number: CN116401459A
Application number: CN202310426000.7A
Authority: CN
Inventors: 王绒; 路小妮
Original assignee: Shaanxi Zhongrui Rongsheng Information Technology Co ltd
Current assignee: Shaanxi Zhongrui Rongsheng Information Technology Co ltd
Priority date: 2023-04-20
Filing date: 2023-04-20
Publication date: 2023-07-07

Abstract

本发明提出了一种互联网信息处理方法、系统及记录介质。通过调用相应网站的API接口从互联网获取数据信息；并将获取的数据信息存储到数据库中；对数据库中存储的数据信息进行预处理操作，得到预处理后的数据集；对预处理后得到的数据集按照领域进行分类，按照分类的结果建立相应的信息库；从分类的信息库中选取相应的数据信息进行推荐，实现更加个性化和精准的信息服务，并对推荐的信息进行反馈，通过反馈结果不断优化训练信息推荐模型，可以对大量数据进行快速、准确的识别、分类和汇总，从而提高了整体的信息处理效率，该系统具备智能推荐功能，可以对大量数据进行快速、准确的识别、分类和汇总，从而提高了整体的信息处理效率。

Description

一种互联网信息处理方法、系统及记录介质

技术领域

本发明提出了一种互联网信息处理方法及记录介质，属于互联网技术领域。

背景技术

随着互联网的发展，随之而来的是海量信息的爆发式增长。互联网上的信息种类繁多，内容广泛，而且更新速度非常快。这给我们在获取信息的同时也带来了很大的困扰，因为我们需要在这些海量信息中找到对自己有用的、符合自己需求和兴趣的信息，筛选过程需要耗费大量精力和时间。

传统的搜索引擎虽然可以帮助我们查找和访问相关内容，但其搜索结果往往受制于搜索关键词，很难做到精准推荐。此外，个性化推荐算法也并不完美，因为其仍然存在着推荐信息无效或不准确等问题。

因此，在这样一个信息爆炸和信息噪音共存的时代，如何提高互联网信息处理效率、减少用户花费在筛选信息上的时间，并且实现更加精准、个性化的推荐成为了当下重要的问题。针对这个问题，本发明提供了一种新型互联网信息处理方法及记录介质，能够高效地进行信息分类、筛选，并且根据用户需求和兴趣实现精准推荐，从而提高用户体验和信息利用效率。

发明内容

本发明提供了一种互联网信息处理方法及记录介质，用以解决互联网信息无法精准推荐需要花费大量精力去筛选的问题：

本发明提供一种互联网信息处理方法，所述方法包括：

S1：通过调用相应网站的API接口从互联网获取数据信息；并将获取的数据信息存储到数据库中；

S2：对数据库中存储的数据信息进行预处理操作，得到预处理后的数据集；对预处理后得到的数据集按照领域进行分类，按照分类的结果建立相应的信息库；

S3：根据用户的需求和偏好，从分类的信息库中选取相应的数据信息进行推荐，实现更加个性化和精准的信息服务，并对推荐的信息进行反馈，通过反馈结果不断优化训练信息推荐模型。

进一步的，所述通过调用相应网站的API接口从互联网获取数据信息；并将获取的数据信息存储到数据库中，包括：

根据用户的行为习惯以及用户的性质确定用户对互联网信息的需求类型；

通过用户对互联网信息的需求类型调用相应的API接口对数据进行获取；

将获取的数据存储到数据库中；

通过设置定时任务周期性的调用API接口，并将更新到的数据存入数据库中，实现对数据库信息的定时更新。

进一步的，对数据库中存储的数据信息进行预处理操作，得到预处理后的数据集；对预处理后得到的数据集按照领域进行分类，按照分类的结果建立相应的信息库，包括：

对获取到的数据进行清洗和加工处理，去除无用信息并统一格式，得到处理后的数据集；

对处理后的数据集按照领域进行分类；

确定好数据分类后，建立相应的信息库来储存每个类别下的相关数据；

接着在信息库中导入每个类别下所属的相应数据。

进一步的，根据用户的需求和偏好，从分类的信息库中选取相应的数据信息进行推荐，实现更加个性化和精准的信息服务，并对推荐的信息进行反馈，通过反馈结果不断优化训练信息推荐模型，包括：

首先获取用户的相关信息，所述相关信息包括：个人资料、搜索历史以及浏览记录；并结合推荐算法分析用户的需求和偏好；

根据用户的需求和偏好匹配数据库中符合用户需求和偏好的数据；

对查找到的符合用户需求和偏好的数据按照相关性，时效性进行排序，得到排序后的相关数据信息；

将排序后的相关数据信息推荐给用户；

用户对推荐结果进行评分，并对评分结果进行反馈，计算机系统接收反馈结果不断优化训练信息推荐模型。

本发明提供一种互联网信息处理系统，所述系统包括：

信息获取模块：通过调用相应网站的API接口从互联网获取数据信息；并将获取的数据信息存储到数据库中；

信息预处理模块：对数据库中存储的数据信息进行预处理操作，得到处理后的数据集；对处理后得到的数据集按照领域进行分类，按照分类的结果建立相应的信息库，

个性化推荐模块：根据用户的需求和偏好，从分类的信息库中选取相应的数据信息进行推荐，实现更加个性化和精准的信息服务，并对推荐的信息进行反馈，通过反馈结果不断优化训练信息推荐模型。

进一步的，所述信息获取模块包括：

需求确定模块：根据用户的行为习惯以及用户的性质确定用户对互联网信息的需求类型；

接口调用模块：通过用户对互联网信息的需求类型调用相应的API接口对数据进行获取；

数据储存模块：将获取的数据存储到数据库中；

定时更新模块：通过设置定时任务周期性的调用API接口，并将更新到的数据存入数据库中，实现对数据库信息的定时更新。

进一步的，所述信息预处理模块，包括：

数据处理模块：对获取到的数据进行清洗和加工处理，去除无用信息并统一格式，得到处理后的数据集；

数据集分类模块：对处理后的数据集按照领域进行分类；

信息库建立模块：确定好数据分类后，建立相应的信息库来储存每个类别下的相关数据；

数据导入模块：接着在信息库中导入每个类别下所属的相应数据。

进一步的，所述个性化推荐模块，包括：

相关信息获取模块：首先获取用户的相关信息，所述相关信息包括：个人资料、搜索历史以及浏览记录；并结合推荐算法分析用户的需求和偏好；

数据匹配模块：根据用户的需求和偏好匹配数据库中符合用户需求和偏好的数据；

数据信息排序模块：对查找到的符合用户需求和偏好的数据按照相关性，时效性进行排序，得到排序后的相关数据信息；

数据信息推荐模块：将排序后的相关数据信息推荐给用户；

反馈优化模块：用户对推荐结果进行评分，并对评分结果进行反馈，计算机系统接收反馈结果不断优化训练信息推荐模型。

本发明提供一种互联网信息记录介质，其特征在于，所述记录介质上存储有计算机程序，所述程序被处理器执行时实现上述任一项所述的互联网信息处理方法。

本发明有益效果：本发明提供一种互联网信息处理方法、系统及记录介质，可以对大量数据进行快速、准确的识别、分类和汇总，从而提高了整体的信息处理效率。该系统具备智能推荐功能，可以根据用户历史搜索记录和相关标签等信息，自动为用户推荐符合其兴趣爱好的内容或服务，从而提升用户使用该系统时的体验。该系统可以实时学习新信息，并将其加入到数据记录中。因此，在长期使用过程中，该系统能够不断优化自身算法和模型，并更好地适应不同用户需求。

附图说明

图1为本发明所述一种互联网信息处理方法流程图；

图2为本发明所述一种互联网信息处理系统模块图。

具体实施方式

为了能够更清楚地理解本发明的上述目的、特征和优点，下面结合附图和具体实施例对本发明进行详细描述。需要说明的是，在不冲突的情况下，本申请的实施例及实施例中的特征可以相互组合。

在下面的描述中阐述了很多具体细节以便于充分理解本发明，所描述的实施例仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

除非另有定义，本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的，不是旨在于限制本发明。

本发明的一个实施例，一种互联网信息处理方法，所述方法包括：

S1：通过调用相应网站的API接口从互联网获取数据信息；并将获取的数据信息存储到数据库中；其中相应网站包括但不限于搜索网站、社交网站、购物网站、娱乐网站、教育网站以及科研学术网站。

S2：对数据库中存储的数据信息进行预处理操作，得到处理后的数据集；对处理后得到的数据集按照领域进行分类，按照分类的结果建立相应的信息库，所述领域包括但不限于社交、购物、娱乐、教育、搜索、教育、科研学术领域。

S3：根据用户的需求和偏好，从分类的信息库中选取相应的数据信息进行推荐，实现更加个性化和精准的信息服务；并对推荐的信息进行反馈，通过反馈结果不断优化训练信息推荐模型。

本发明的工作原理为：系统通过调用相应网站的API接口从互联网获取数据信息，并将获取的数据信息存储到数据库中。对数据库中存储的数据信息进行预处理操作，得到处理后的数据集。常见的预处理操作包括去重、清洗、转换格式等。对处理后得到的数据集按照领域进行分类，按照分类的结果建立相应的信息库。每个信息库都包含了该领域内所有相关的数据信息。根据用户的需求和偏好，在分类的信息库中选取相应的数据信息进行推荐，实现更加个性化和精准的信息服务。系统可以根据用户历史行为、兴趣爱好、社交网络等多种因素来实现推荐结果。对推荐结果进行反馈，通过反馈结果不断优化训练信息推荐模型。例如，用户对某些推荐结果不满意时，系统可以记录下来，并据此调整模型参数或者重新选择样本训练新模型，以提高推荐效果。

本发明的工作效果为：本发明可以通过分类、过滤、排序等多种技术手段，让用户更快速地找到所需的信息，提高了信息检索的效率。系统利用用户历史行为、兴趣爱好等多种因素，针对不同用户提供个性化的推荐服务，让用户更容易找到感兴趣的内容。经过大量数据处理和筛选之后，可以将大量无用或重复的信息剔除，只留下真正有价值和有关联性的信息，从而提升了信息质量和准确度。通过不断收集用户反馈和评价结果，进行模型调整和改进，让推荐算法更加智能化、精准化。这样可以使得用户获取到更适合自己需求的信息，在一定程度上增强了用户体验。该信息服务系统通过智能化算法以及完善的数据处理流程等方式提高了信息服务质量，并利用人工智能技术实现了让用户得到更好的体验。

本发明的一个实施例，所述通过调用相应网站的API接口从互联网获取数据信息；并将获取的数据信息存储到数据库中，包括：

将获取的数据存储到数据库中；

本发明的工作原理为：本发明通过记录用户的行为习惯和性质，来确定用户对互联网信息的需求类型。例如，如果用户经常浏览体育新闻，则可以确定该用户对体育信息有较高的需求。基于用户对互联网信息的需求类型，该系统会调用相应的API接口，获取相关的数据。例如，如果用户对体育信息有较高需求，则可以调用体育新闻API接口。获取到的数据会被存储到数据库中，以便随时进行检索、查询和更新。为了保证数据库中的数据是最新的，并与实时信息同步，该系统会设置定时任务周期性地调用API接口，将更新到的数据存入数据库中。这样就能够实现对数据库信息的定时更新。

本发明的工作效果为：本发明通过分析用户的行为习惯和性质，可以确定用户对互联网信息的需求类型。这样就可以针对性地调用相应的API接口进行数据获取，从而提高了检索效率和准确度。通过设置定时任务来实现自动更新数据库中的信息，保证了数据库中的数据是最新的，并与实时信息同步。本发明具备机器学习能力，可以根据用户与系统交互过程中不断学习新信息，并将这些新信息存入数据库中，以便下一次检索、查询和更新。本发明提供更加细致、详尽、全面和精准的服务：可提供给用户更加细致、详尽、全面和精准的服务，因为它不仅能够根据用户兴趣区分不同的需求类型，并针对性地调用相应的API接口进行数据获取，而且还能够在不断学习新知识的基础上不断提升自身服务水平。

本发明的一个实施例，对数据库中存储的数据信息进行预处理操作，得到处理后的数据集；对处理后得到的数据集按照领域进行分类，按照分类的结果建立相应的信息库，包括：

对获取到的数据进行清洗和加工处理，去除无用信息并统一格式，得到处理后的数据集；无用信息包括但不限于缺失值、重复性、异常值、错误的格式、不相关信息以及冗余信息。

对处理后的数据集按照领域进行分类；

接着在信息库中导入每个类别下所属的相应数据。

本发明的工作原理为：首先对获取到的数据进行清洗和加工处理，这一步的目的是为了去除无用信息并统一格式，得到处理后的数据集；对处理后的数据集按照社交、购物、娱乐、教育、搜索、教育、科研学术等领域进行分类；确定好数据分类后，建立各个领域相对应的信息库来储存每个类别下的相关数据；接着在信息库中导入每个类别下所属的相应数据。

本发明的工作效果为：通过对获取到的数据进行清洗和加工处理，可以得到规范化的、易于处理和分析的数据集。将清洗后的数据集按照领域进行分类，可以帮助我们更好地组织信息和快速定位指定类型的数据。在建立相应的信息库储存每个类别下的相关数据时，可以通过数据库系统来实现。在数据库中使用合适的表结构存储不同分类下的数据，以便快速检索和查询。在导入每个类别下所属的相应数据后，可以利用数据库的查询功能来查找特定类别下的所有相关数据。这种方式可以大大提高工作效率，并且减少繁琐而重复的工作。

本发明的一个实施例，根据用户的需求和偏好，从分类的信息库中选取相应的数据信息进行推荐，实现更加个性化和精准的信息服务，包括：

根据用户的需求和偏好匹配数据库中符合用户需求和偏好的数据；可通过公式获取，对于用户需求和偏好的数据划分为多个等级i，其重要程度为z_i，所述0≥Zi≥1，

其中W为等级数，x、y为常数，

Q＝(fA-f)^-1*(A-f)，A是等级中需求与偏好数据中关键词或近义词的数量，而f是非关键词或近义词的数量，

其中po为等级中相关联的关键词或近义词的数量；

将排序后的相关数据信息推荐给用户；

其中，用户需要的相关数据信息与推荐给用户的相关数据信息之间的相似度R，计算公式为：

其中，S_j为用户需要的相关信息对j个推荐结果的评分，/>

为推荐给用户的用户给需要的数据信息的L个结果的平均评分值，v_j为推荐给用户的相关信息的第j个推进结果的评分，/>

为推荐给用户的相关度信息的第L个结果的平均评分值。

本发明的工作原理为：首先获取用户的个人资料、搜索历史和浏览记录，包括但不限于注册时填写资料、与第三方平台交互，例如社交媒体以及购物网站等，使用各种推荐算法来学习和理解用户的需求和兴趣。这些算法可能包括基于内容的推荐算法、协同过滤算法或混合算法。算法选择将取决于我们提供服务的领域，以及在实际情况下表现最佳的方法。通过将用户需求与支持服务的数据库中存储的所有数据进行比较，我们可以找到最适合他们需求和偏好的数据。为了尽可能准确地实现这一点，我们可借鉴语义分析技术、机器学习模型以及自然语言处理技术等先进技术手段。对符合用户需求和偏好的数据按相关性、时效性进行排序：一旦找到了改进匹配度最大化，我们需要对结果进行排序，并根据相关性和时效性等因素进行排序，以提供最相关、最新的信息。例如，针对一家餐厅推荐网站，我们可以优先考虑附近的餐厅，而不是更远的地方。通过将经过排序的结果展现在智能推荐系统的界面上，我们可以向用户推荐内容，还可能包括电子邮件、短信或其他通信方式。例如，一个在线购物商店可以向客户发送礼品卡或优惠券。当用户与智能推荐系统交互时，例如点击链接或浏览静态信息等，我们可以记录这些互动活动，并据此计算他们对所看内容的兴趣度。还会定期收集和处理用户反馈意见和意见反馈，并使用这些信息来优化推荐算法以及增强数据库记录库。其中，重要程度计算公式可以根据用户的需求和偏好匹配符合其要求的数据，并将数据划分为不同的等级，考虑了关键词或近义词的数量，使得匹配结果更加准确和优化。其中，Zi表示第i个等级的重要程度，其值范围在0到1之间。该公式中使用了常数x、y以及参数A、f以及等级数w作为输入参数，可以根据实际情况进行调整。Q用于计算关键词或近义词在数据中出现的频率权重，E用于计算等级中相关联的关键词或近义词的数量占总量的比例。通过对这些参数进行加权计算，该公式能够更准确地评估每个等级数据的重要性。因此，在实际应用中，该公式可以提高数据匹配的精确度并有效提高用户满意度。

本发明的工作效果为：获取用户的相关信息可以帮助更好地了解用户的性别、年龄、职业、兴趣爱好等方面，可以为后续的推荐提供更多可参考因素。通过分析用户的搜索历史，可以了解到用户关注的领域或主题，从而针对性地进行内容推荐。根据用户浏览过的页面，可以了解到用户感兴趣和关注的话题和内容，从而为后续推荐提供更多参考依据。结合机器学习等技术，根据分析出来的数据，设计和实现有效的推荐算法模型，并通过持续优化训练模型来提升算法准确性。通过将分析出来的数据与数据库中已有数据进行匹配筛选，可以找出最符合用户需求和偏好的数据。对查找到的符合用户需求和偏好的数据信息按照相关性、时效性等因素进行排序，可以得到最优结果。将排序后的相关数据信息推荐给用户，可以提高用户的浏览体验和满意度。通过接收用户反馈，系统不断优化训练信息推荐模型，并进行持续监控和调整，可以保证推荐效果达到最佳状态。通过上述重要程度计算公式对等级数的获取结合了偏好数据中关键词或近义词的数量，有效的提高了重要程度的计算值的准确性，防止非关键词或者近义词数量的变化导致最终结果的偏差。通过上述相似度计算公式可以让系统更准确的为用户推荐用户下需要的数据，提高数据客户满意度。

本发明的一个实施例，一种互联网信息处理系统，所述系统包括：

信息获取模块：通过调用相应网站的API接口从互联网获取数据信息；并将获取的数据信息存储到数据库中；其中相应网站包括但不限于搜索网站、社交网站、购物网站、娱乐网站、教育网站以及科研学术网站。

信息预处理模块：对数据库中存储的数据信息进行预处理操作，得到处理后的数据集；对处理后得到的数据集按照领域进行分类，按照分类的结果建立相应的信息库，所述领域包括但不限于社交、购物、娱乐、教育、搜索、教育、科研学术领域。

本发明的一个实施例，所述信息获取模块包括：

数据储存模块：将获取的数据存储到数据库中；

本发明的一个实施例，所述信息预处理模块，包括：

数据集分类模块：对处理后的数据集按照领域进行分类；

本发明的一个实施例，所述个性化推荐模块，包括：

数据匹配模块：根据用户的需求和偏好匹配数据库中符合用户需求和偏好的数据；可通过公式获取，对于用户需求和偏好的数据划分为多个等级i，其重要程度为z_i，所述0≥Zi≥1，

其中W为等级数，x、y为常数，

其中po为等级中相关联的关键词或近义词的数量；

数据信息推荐模块：将排序后的相关数据信息推荐给用户；

本发明的工作原理为：首先获取用户的个人资料、搜索历史和浏览记录，包括但不限于注册时填写资料、与第三方平台交互，例如社交媒体以及购物网站等，使用各种推荐算法来学习和理解用户的需求和兴趣。这些算法可能包括基于内容的推荐算法、协同过滤算法或混合算法。算法选择将取决于我们提供服务的领域，以及在实际情况下表现最佳的方法。通过将用户需求与支持服务的数据库中存储的所有数据进行比较，我们可以找到最适合他们需求和偏好的数据。为了尽可能准确地实现这一点，我们可借鉴语义分析技术、机器学习模型以及自然语言处理技术等先进技术手段。对符合用户需求和偏好的数据按相关性、时效性进行排序：一旦找到了改进匹配度最大化，我们需要对结果进行排序，并根据相关性和时效性等因素进行排序，以提供最相关、最新的信息。例如，针对一家餐厅推荐网站，我们可以优先考虑附近的餐厅，而不是更远的地方。通过将经过排序的结果展现在智能推荐系统的界面上，我们可以向用户推荐内容，还可能包括电子邮件、短信或其他通信方式。例如，一个在线购物商店可以向客户发送礼品卡或优惠券。当用户与智能推荐系统交互时，例如点击链接或浏览静态信息等，我们可以记录这些互动活动，并据此计算他们对所看内容的兴趣度。还会定期收集和处理用户反馈意见和意见反馈，并使用这些信息来优化推荐算法以及增强数据库记录库。

本发明的工作效果为：获取用户的相关信息可以帮助更好地了解用户的性别、年龄、职业、兴趣爱好等方面，可以为后续的推荐提供更多可参考因素。通过分析用户的搜索历史，可以了解到用户关注的领域或主题，从而针对性地进行内容推荐。根据用户浏览过的页面，可以了解到用户感兴趣和关注的话题和内容，从而为后续推荐提供更多参考依据。结合机器学习等技术，根据分析出来的数据，设计和实现有效的推荐算法模型，并通过持续优化训练模型来提升算法准确性。通过将分析出来的数据与数据库中已有数据进行匹配筛选，可以找出最符合用户需求和偏好的数据。对查找到的符合用户需求和偏好的数据信息按照相关性、时效性等因素进行排序，可以得到最优结果。将排序后的相关数据信息推荐给用户，可以提高用户的浏览体验和满意度。通过接收用户反馈，系统不断优化训练信息推荐模型，并进行持续监控和调整，可以保证推荐效果达到最佳状态。

本发明的一个实施例，所述记录介质上存储有计算机程序，所述程序被处理器执行时实现上述任一项所述的互联网信息处理方法。

上述方案的工作原理为：记录介质上储存计算机程序的工作原理是将程序从记录介质读取到内存在，CPU再接管处理这些程序指令来完成任务，然后将结果写回到硬盘之类记录介质上。

上述方案的工作效果为：通过将程序储存在记录介质上，可以长期保存程序内容，并且在需要时随时取用可让多台计算机都访问到该程序。这减少了维护和升级成本，并且方便追踪代码变化和问题原因。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

Claims

1.一种互联网信息处理方法，其特征在于，所述方法包括：

2.根据权利要求1所述一种互联网信息处理方法，其特征在于，所述通过调用相应网站的API接口从互联网获取数据信息；并将获取的数据信息存储到数据库中，包括：

将获取的数据存储到数据库中；

3.根据权利要求1所述一种互联网信息处理方法，其特征在于，对数据库中存储的数据信息进行预处理操作，得到预处理后的数据集；对预处理后得到的数据集按照领域进行分类，按照分类的结果建立相应的信息库，包括：

对处理后的数据集按照领域进行分类；

接着在信息库中导入每个类别下所属的相应数据。

4.根据权利要求1所述一种互联网信息处理方法，其特征在于，根据用户的需求和偏好，从分类的信息库中选取相应的数据信息进行推荐，实现更加个性化和精准的信息服务，并对推荐的信息进行反馈，通过反馈结果不断优化训练信息推荐模型，包括：

将排序后的相关数据信息推荐给用户；

5.一种互联网信息处理系统，其特征在于，所述系统包括：

6.根据权利要求5所述一种互联网信息处理系统，其特征在于，所述信息获取模块包括：

数据储存模块：将获取的数据存储到数据库中；

7.根据权利要求5所述一种互联网信息处理系统，其特征在于，所述信息预处理模块，包括：

数据集分类模块：对处理后的数据集按照领域进行分类；

8.根据权利要求6所述一种互联网信息处理系统，其特征在于，所述个性化推荐模块，包括：

数据信息推荐模块：将排序后的相关数据信息推荐给用户；

9.一种互联网信息记录介质，其特征在于，所述记录介质上存储有计算机程序，所述程序被处理器执行时实现权利要求1-4中任一项所述的互联网信息处理方法。