RU2764391C1

RU2764391C1 - Способ формирования основных и дополнительных электронных ресурсов сети интернет для изучения заданной образовательной программы

Info

Publication number: RU2764391C1
Application number: RU2020140406A
Authority: RU
Inventors: Тимур Нагимович Атнагуллов; Елена Валерьевна Вершенник; Геннадий Алексеевич Головин; Михаил Валерьевич Митрофанов; Никита Михайлович Митрофанов; Юрий Иванович Стародубцев
Original assignee: Михаил Валерьевич Митрофанов; Юрий Иванович Стародубцев
Priority date: 2020-12-09
Filing date: 2020-12-09
Publication date: 2022-01-17

Abstract

Изобретение относится к области информационных технологий. Техническим результатом является обеспечение автоматического формирования основных и дополнительных электронных ресурсов сети интернет, наиболее релевантных к заданной образовательной программе. Способ формирования основных и дополнительных электронных ресурсов сети интернет для изучения заданной образовательной программы заключается в том, что последовательно для всех элементов образовательной программы и дисциплин составляют частотный словарь образовательной программы, множество ключевых слов ранжируют на основе данных о количестве использования по степени убывания, последовательно для каждого элемента образовательной программы формируют запросы от сервера образовательной программы с элементами из словаря ключевых слов, запросы с сервера образовательной программы через узел доступа направляют в сеть интернет, в сети формируют отклик в виде множества адресов доступных ресурсов, которые запоминают на сервере образовательной программы в виде матрицы, и определяют адреса, которые включают в список основных и дополнительных ресурсов. 2 з.п. ф-лы, 5 ил.

Description

Изобретение относится к области информатики, а именно к способам отбора, ранжирования и систематизирования информации, загруженной и отобранной в сети Интернет, для сокращения времени на поиск релевантной информации обучающимися.

В настоящее время известны способы поиска в сети Интернет.

Так, известен способ поиска информации в сети интернет (патент «Способ поиска информации в сети интернет» [Текст]: пат. 2410748 Российская Федерация, МПК G06F 17/30 (2006.01) / А.И. Торовин; заявитель и обладатель Торовин А.И. №2009100244/08; заявл. 11.01.2009; опубл. 27.01.2011, Бюл. №3), характеризующийся тем, что в предлагаемом изобретении включают в выдачу результатов поиска только результаты, содержащие объект, подписанный электронной цифровой подписью, прошедшей проверку на подлинность, причем этот объект должен содержать поисковый запрос. По другому варианту при выдаче результатов поиска производится ранжирование результатов.

Недостатком данного способа является то, что в способе основной акцент делается только на получение оригинальной информации, не учитывается ее релевантность, конструктивность, степень научности и достоверности, а также не учитывается соответствие найденной информации заданной образовательной программе и вообще заданной тематике.

Известен способ отбора информации в сети интернет и использования этой информации в разделяемом веб-сайте и компьютерный сервер для реализации этого способа (патент «Способ отбора информации в сети интернет и использования этой информации в разделяемом веб-сайте и компьютерный сервер для реализации этого способа» [Текст]: пат. 2413278 Российская Федерация, МПК G06F 7/00 (2006.01); заявитель и обладатель общество с ограниченной ответственностью «МэйлАдмин». №2009121481/08; заявл. 27.05.2009; опубл. 27.02.2011, Бюл. №6) заключающийся в том, что с помощью интернет-робота осуществляют поиск информации в сети Интернет о субъектах, в средствах индивидуализации которых имеется ключевое слово, соответствующее указанному доменному имени, отправляют с помощью интернет-робота на электронные адреса найденных субъектов информацию, содержащую предложение этим субъектам о размещении информации о них на разделяемом веб-сайте, и размещают информацию о субъектах, включающую по меньшей мере средства индивидуализации найденных субъектов и их контактную информацию, на разделяемом веб-сайте при соблюдении условия, состоящего в получении в ответ на указанное предложение информации, содержащей положительный ответ.

Недостатком данного способа является то, что при размещении информации не осуществляется ее ранжирование, а только проверяется достоверность.

Наиболее близким по технической сущности и достигаемому результату к заявленному способу, принятым за прототип, является способ формирования единой информационной системы (патент «Способ формирования единой информационной системы (ЕИС)» [Текст]: пат. 2728899 Российская Федерация, МПК G06F 17/40 (2006.01), МПК G06F 16/30 (2019.01) / Ю.А. Масюк [и др.]; заявитель и обладатель Федеральное государственное бюджетное научное учреждение «Федеральный исследовательский центр картофеля имени А.Г. Лорха». №2019130962; заявл. 02.10.2019; опубл. 03.08.2020, Бюл. №22). Суть способа является заключается в ускорении поиска интересующей информации, систематизированной в единой поисковой системе. Способ включает следующие действия: сканирование источника информации, систематизирование информации с выделением отдельных авторских, выходных и тематических информационных полей, разбивку и распределение информации по соответствующим информационным полям, определение местонахождения поступающей информации в ЕИС осуществляется с помощью соответствующих слов, букво- или знакосочетаний, благодаря чему источники информации автоматически собираются в авторские, выходные и тематические информационные поля и регистрируются там с помощью временного кода, включающего время создания документа, сопровождающиеся без пробела числом используемых цифр с последующим поиском интересующей информации в системе компьютера или интернета, при этом вводятся дополнительные вспомогательные коды, с помощью которых вводятся последующие слова с совпадающими буквосочетаниями, а для вертикального прочтения и обобщения всей информации по интересующему вопросу - цифровая часть кода располагается без пробела слева.

Недостатками способа - прототипа являются большие временные затраты на сканирование источников информации, ограничение базы данных только отсканированными источниками (не используются дополнительные внешние ресурсы), отсутствие учета оригинальности найденной информации, отсутствие ее градации на основную и дополнительную информацию.

Техническим результатом, достигаемым при применении предлагаемого способа является сокращение времени, затрачиваемого обучаемыми для информационного обеспечения самостоятельной работы, дополнение информационных ресурсов образовательной программы необходимыми материалами, достижение релевантности в поиске информации у обучающихся, а также снижение нагрузки на информационно-телекоммуникационную сеть.

Технический результат достигается за счет формирования частотного словаря ключевых слов, структуризации и ранжирования образовательного контента, а также за счет копирования структурированной информации на сервер образовательной программы.

Технический результат достигается тем, что в известном способе, заключающемся в сканировании источников информации, введении обнаруженных информационных ресурсов в информационную систему, систематизации информации, дополнительно задают образовательную программу и структуру ее дисциплин с детализацией до отдельного элемента образовательной программы, а также пороговые значения частоты встречи слов в каждом единичном элементе образовательной программы и максимальные значения количества основных и дополнительных электронных ресурсов; образовательную программу загружают на сервер вуза; последовательно для всех элементов образовательной программы и дисциплин составляют частотный словарь образовательной программы, для чего производят сравнение каждого слова образовательной программы со всеми остальными, если оно отличается, то слово запоминают в частотный словарь и задают начальное значение счетчику числа использований данного слова, равное единице, в противном случае у совпавшего слова счетчик увеличивают на единицу; формируют частотный словарь ключевых слов, для чего последовательно сравнивают значения числа использований для каждого слова с заданным пороговым значением частоты встречи слов, если число повторов больше или равно пороговому значению частоты встречи слов, то слово записывают вместе с данными о числе использований в словарь ключевых слов, в противном случае переходят к очередному слову; множество ключевых слов ранжируют на основе данных о количестве использования по степени убывания; последовательно для каждого элемента образовательной программы формируют запросы от сервера образовательной программы с элементами из словаря ключевых слов, начиная с первого; запросы с сервера образовательной программы через узел доступа направляют в сеть интернет; в сети формируют отклик в виде множества адресов доступных ресурсов, которые запоминают на сервере образовательной программы в виде матрицы; определяют число повторений каждого адреса путем обработки значений элементов матрицы; адреса ранжируют по числу повторений от максимального к минимальному и запоминают в матрице адресов электронных ресурсов; адреса, с порядковыми номерами, значения которых меньше или равно заданному числу основных электронных ресурсов, включают в список основных ресурсов и доводят до обучающихся, а адреса с порядковыми номерами, значения которых больше заданного числа основных ресурсов и меньше или сумме количества заданных основных и дополнительных электронных ресурсов, включают в список дополнительных электронных ресурсов и доводят до обучающихся.

В одном из вариантов изобретения каждому запомненному адресу в матрице ключевых слов частотного словаря присваивают численное значение, полученное путем нормирования количества использования ключевых слов в элементе образовательной программы

Kj =

, где

– количество адресов электронных ресурсов сети интернет использующих j – е ключевое слово;

– количество адресов электронных ресурсов сети интернет использующих i – е ключевое слово;

L – число ключевых слов используемых при формировании запросов.

В одном из вариантов изобретения для каждого электронного ресурса сети интернет определяют его общий объем и присваивают численное значение, полученное путем нормирования количества использования ключевых слов из образовательной программы к объему электронного ресурса

Kj =

, где

L – число ключевых слов используемых при формировании запросов;

– объем информации у G – го информационного ресурса.

В одном из вариантов изобретения к выбранным в качестве основных и дополнительных ресурсов адресам направляют запрос на копирование содержащихся в них информации на сервер образовательной программы и при положительном отклике осуществляют копирование.

Из уровня техники не выявлено решений, касающихся способов отбора и ранжирования, характеризующихся заявленной совокупностью признаков, следовательно, что указывает на соответствие заявленного способа условию патентоспособности «новизна».

Результаты поиска известных решений в данной и смежной областях техники с целью выявления признаков, совпадающих с отличительными от прототипов признаками заявленного изобретения, показали, что они не следуют явным образом из уровня техники. Из определенного заявителем уровня техники не выявлена известность влияния предусматриваемых существенными признаками заявленного изобретения на достижение указанного технического результата. Следовательно, заявленное изобретение соответствует условию патентоспособности «изобретательский уровень».

«Промышленная применимость» способа обусловлена наличием элементной базы, на основе которой могут быть выполнены устройства, реализующие способ.

ОПИСАНИЕ ИЗОБРЕТЕНИЯ

Заявленный способ поясняется чертежами, на которых показано:

фиг.1 – алгоритм способа формирования основных и дополнительных электронных ресурсов сети интернет для изучения заданной образовательной программы.

фиг.2 – матрица ключевых слов частотного словаря;

фиг.3 – словарь ключевых слов;

фиг.4 – матрица множества адресов доступных ресурсов.

фиг.5 – матрица адресов электронных ресурсов.

Заявленный способ может быть реализован при помощи алгоритма, блок-схема которого представлена на фиг.1

На первом этапе заявленного способа задают образовательную программу и структуру ее дисциплин с детализацией до отдельного элемента образовательной программы, а также пороговые значения частоты встречи слов в каждом единичном элементе образовательной программы и максимальные значения количества основных К и дополнительных L электронных ресурсов (бл. 1 фиг. 1).

Образовательную программу загружают на сервер вуза (бл.2 фиг.1).

Последовательно для всех элементов образовательной программы составляют частотный словарь образовательной программы, представленный в виде матрицы ключевых слов (бл. 3, фиг. 1).

Частотный словарь (или частотный список) — набор слов данного языка (или подъязыка) вместе с информацией о частоте их встречаемости. Словарь может быть отсортирован по частоте, по алфавиту (тогда для каждого слова будет указана его частота), по группам слов (например, первая тысяча наиболее частотных слов, за ней вторая и т. п.), по типичности (слова, частотные для большинства текстов), и т. д. (Частотный словарь // Большая советская энциклопедия : [в 30 т.] / гл. ред. А. М. Прохоров. — 3-е изд. — М. : Советская энциклопедия, 1969—1978.).

Частотный словарь образовательной программы, последовательно для всех элементов образовательной программы и дисциплин, составляется следующим образом:

Производят сравнение каждого слова образовательной программы со всеми остальными. Если оно отличается, то слово запоминают в частотный словарь и задают начальное значение счетчика числа использований данного слова, равное единице, в противном случае у совпавшего слова счетчик числа использований увеличивают на единицу.

На фиг. 2 частотный словарь образовательной программы представлен в виде таблицы, в которой в столбец «ключевые слова» записаны слова по указанному выше правилу, а в столбец «число использований» - количество их использований.

Формируют частотный словарь ключевых слов (бл.4 фиг.1), для чего последовательно сравнивают значение числа использований для каждого слова с заданным пороговым значением частоты встречи слов, если число использований больше или равно пороговому значению частоты встречи слов, то слово записывают вместе с данными о числе использований в словарь ключевых слов, если число повторов меньше порогового значения частоты встречи слов , то переходят к очередному слову.

Ранжируют множество ключевых слов на основе данных о количестве их использования по степени убывания (бл.5 фиг.1).

На фиг. 3 частотный словарь ключевых слов представлен в виде таблицы, в которой ключевые слова ранжированы по количеству использований, от самого большего числа к минимальному, при этом число использований данных слов в образовательной программе превышает заданные пороговые значения частоты встречи слов.

Сканируют источники информации (бл.6 фиг.1).

Последовательно для каждого элемента образовательной программы формируют запросы от сервера образовательной программы с элементами из словаря ключевых слов, начиная с первого (бл.7 фиг.1).

Запросы с сервера образовательной программы через узел доступа направляют в сеть Интернет (бл.8 фиг.1).

Запросы задаются в стандартных поисковых системах, таких как: Yandex, Google, Rambler, Yahoo и др.

В сети формируют отклик в виде множества адресов доступных ресурсов, которые запоминают на сервере образовательной программы в виде матрицы (бл.9 фиг.1).

Матрица множества адресов доступных ресурсов формируется для каждого элемента образовательной программы (фиг. 4) и представляет собой таблицу, в которой для каждого ключевого слова отображаются наименования адресов и количество их использования.

Вводят обнаруженные информационные ресурсы в информационную систему (бл.10 фиг.1).

Определяют число повторений каждого адреса (бл.11 фиг.1) путем обработки значений элементов матрицы.

Адреса ранжируют по числу повторений от максимального к минимальному и запоминают в матрице адресов электронных ресурсов (бл.12 фиг.1).

Матрица адресов электронных ресурсов представлена на фиг. 5. Матрица представляет собой таблицу, в которой указываются адреса, в которых повторилось наибольшее количество ключевых слов. На основе заданных исходных данных по матрице определяется количество основных и дополнительных электронных ресурсов.

Адреса, с порядковыми номерами, значения которых меньше или равно заданному числу основных электронных ресурсов (от 1 до K), включают в список основных ресурсов и доводят до обучающихся, а адреса с порядковыми номерами, значения которых больше заданного числа основных ресурсов и меньше или равно сумме количества заданных основных и дополнительных электронных ресурсов (от K + 1 до К + L), включают в список дополнительных электронных ресурсов и доводят до обучающихся. (бл.13 фиг.1)

Kj =

, где

Kj =

, где

Фактически полученное численное значение Kj определяет степень концентрированности информационного ресурса ключевыми словами элемента образовательной программы, что позволит сократить время на поиск необходимой информации. Большое количество ключевых слов, найденное в малом объеме информации, дает большую степень концентрированности материала по тематике поиска.

В одном из вариантов изобретения к выбранным в качестве основных и дополнительных ресурсов адресам направляют запрос на копирование содержащихся в них информации на сервер образовательной программы и при положительном отклике осуществляется копирование. При помощи данного варианта изобретения сокращается время, затрачиваемое на поиск информации, снижается нагрузка на информационно-телекоммуникационную сеть за счет сокращения количества отправляемых запросов и принимаемых откликов, а также хранения информации в сервере образовательной программы.

Таким образом, за счет формирования частотного словаря ключевых слов, структуризации и ранжирования образовательного контента в интересах формирования и функционирования образовательного процесса, а также за счет копирования структурированной информации на сервер образовательной программы обеспечивается сокращение времени, затрачиваемого обучаемыми для информационного обеспечения самостоятельной работы, дополнение информационных ресурсов образовательной программы необходимыми материалами, достижение релевантности в поиске информации у обучающихся, а также снижение нагрузки на информационно-телекоммуникационную сеть. Технический результат достигнут.

Claims

1. Способ формирования основных и дополнительных электронных ресурсов сети интернет для изучения заданной образовательной программы, включающий сканирование источников информации, введение обнаруженных информационных ресурсов в информационную систему, систематизацию информации, отличающийся тем, что задают образовательную программу и структуру ее дисциплин с детализацией до отдельного элемента образовательной программы, а также пороговые значения частоты встречи слов в каждом единичном элементе образовательной программы и максимальные значения количества основных и дополнительных электронных ресурсов; образовательную программу загружают на сервер вуза; последовательно для всех элементов образовательной программы и дисциплин составляют частотный словарь образовательной программы, для чего производят сравнение каждого слова образовательной программы со всеми остальными, если оно отличается, то слово запоминают в частотный словарь и задают начальное значение счетчику числа использований данного слова, равное единице, в противном случае у совпавшего слова счетчик увеличивают на единицу; формируют частотный словарь ключевых слов, для чего последовательно сравнивают значения числа использований для каждого слова с заданным пороговым значением частоты встречи слов, если число повторов больше или равно пороговому значению частоты встречи слов, то слово записывают вместе с данными о числе использований в словарь ключевых слов, в противном случае переходят к очередному слову; множество ключевых слов ранжируют на основе данных о количестве использования по степени убывания; последовательно для каждого элемента образовательной программы формируют запросы от сервера образовательной программы с элементами из словаря ключевых слов, начиная с первого; запросы с сервера образовательной программы через узел доступа направляют в сеть интернет; в сети формируют отклик в виде множества адресов доступных ресурсов, которые запоминают на сервере образовательной программы в виде матрицы; определяют число повторений каждого адреса путем обработки значений элементов матрицы; адреса ранжируют по числу повторений от максимального к минимальному и запоминают в матрице адресов электронных ресурсов; адреса с порядковыми номерами, значения которых меньше или равны заданному числу основных электронных ресурсов, включают в список основных ресурсов и доводят до обучающихся, а адреса с порядковыми номерами, значения которых больше заданного числа основных ресурсов и меньше или равны сумме количества заданных основных и дополнительных электронных ресурсов, включают в список дополнительных электронных ресурсов и доводят до обучающихся.

2. Способ по п.1, отличающийся тем, что каждому запомненному адресу в матрице ключевых слов частотного словаря присваивают численное значение, полученное путем нормирования количества использования ключевых слов в элементе образовательной программы: K _j =

, где

– количество адресов электронных ресурсов сети интернет, использующих j–е ключевое слово;

– количество адресов электронных ресурсов сети интернет использующих, i–е ключевое слово; L – число ключевых слов используемых при формировании запросов.

3. Способ по п.1, отличающийся тем, что для каждого электронного ресурса сети интернет определяют его общий объем и присваивают численное значение, полученное путем нормирования количества использования ключевых слов из образовательной программы к объему электронного ресурса: K _j =

, где L – число ключевых слов, используемых при формировании запросов;

– объем информации у G–го информационного ресурса.