RU2764391C1 - Способ формирования основных и дополнительных электронных ресурсов сети интернет для изучения заданной образовательной программы - Google Patents

Способ формирования основных и дополнительных электронных ресурсов сети интернет для изучения заданной образовательной программы Download PDF

Info

Publication number
RU2764391C1
RU2764391C1 RU2020140406A RU2020140406A RU2764391C1 RU 2764391 C1 RU2764391 C1 RU 2764391C1 RU 2020140406 A RU2020140406 A RU 2020140406A RU 2020140406 A RU2020140406 A RU 2020140406A RU 2764391 C1 RU2764391 C1 RU 2764391C1
Authority
RU
Russia
Prior art keywords
educational program
keywords
resources
addresses
internet
Prior art date
Application number
RU2020140406A
Other languages
English (en)
Inventor
Тимур Нагимович Атнагуллов
Елена Валерьевна Вершенник
Геннадий Алексеевич Головин
Михаил Валерьевич Митрофанов
Никита Михайлович Митрофанов
Юрий Иванович Стародубцев
Original Assignee
Михаил Валерьевич Митрофанов
Юрий Иванович Стародубцев
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Михаил Валерьевич Митрофанов, Юрий Иванович Стародубцев filed Critical Михаил Валерьевич Митрофанов
Priority to RU2020140406A priority Critical patent/RU2764391C1/ru
Application granted granted Critical
Publication of RU2764391C1 publication Critical patent/RU2764391C1/ru

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities

Abstract

Изобретение относится к области информационных технологий. Техническим результатом является обеспечение автоматического формирования основных и дополнительных электронных ресурсов сети интернет, наиболее релевантных к заданной образовательной программе. Способ формирования основных и дополнительных электронных ресурсов сети интернет для изучения заданной образовательной программы заключается в том, что последовательно для всех элементов образовательной программы и дисциплин составляют частотный словарь образовательной программы, множество ключевых слов ранжируют на основе данных о количестве использования по степени убывания, последовательно для каждого элемента образовательной программы формируют запросы от сервера образовательной программы с элементами из словаря ключевых слов, запросы с сервера образовательной программы через узел доступа направляют в сеть интернет, в сети формируют отклик в виде множества адресов доступных ресурсов, которые запоминают на сервере образовательной программы в виде матрицы, и определяют адреса, которые включают в список основных и дополнительных ресурсов. 2 з.п. ф-лы, 5 ил.

Description

Изобретение относится к области информатики, а именно к способам отбора, ранжирования и систематизирования информации, загруженной и отобранной в сети Интернет, для сокращения времени на поиск релевантной информации обучающимися.
В настоящее время известны способы поиска в сети Интернет.
Так, известен способ поиска информации в сети интернет (патент «Способ поиска информации в сети интернет» [Текст]: пат. 2410748 Российская Федерация, МПК G06F 17/30 (2006.01) / А.И. Торовин; заявитель и обладатель Торовин А.И. №2009100244/08; заявл. 11.01.2009; опубл. 27.01.2011, Бюл. №3), характеризующийся тем, что в предлагаемом изобретении включают в выдачу результатов поиска только результаты, содержащие объект, подписанный электронной цифровой подписью, прошедшей проверку на подлинность, причем этот объект должен содержать поисковый запрос. По другому варианту при выдаче результатов поиска производится ранжирование результатов.
Недостатком данного способа является то, что в способе основной акцент делается только на получение оригинальной информации, не учитывается ее релевантность, конструктивность, степень научности и достоверности, а также не учитывается соответствие найденной информации заданной образовательной программе и вообще заданной тематике.
Известен способ отбора информации в сети интернет и использования этой информации в разделяемом веб-сайте и компьютерный сервер для реализации этого способа (патент «Способ отбора информации в сети интернет и использования этой информации в разделяемом веб-сайте и компьютерный сервер для реализации этого способа» [Текст]: пат. 2413278 Российская Федерация, МПК G06F 7/00 (2006.01); заявитель и обладатель общество с ограниченной ответственностью «МэйлАдмин». №2009121481/08; заявл. 27.05.2009; опубл. 27.02.2011, Бюл. №6) заключающийся в том, что с помощью интернет-робота осуществляют поиск информации в сети Интернет о субъектах, в средствах индивидуализации которых имеется ключевое слово, соответствующее указанному доменному имени, отправляют с помощью интернет-робота на электронные адреса найденных субъектов информацию, содержащую предложение этим субъектам о размещении информации о них на разделяемом веб-сайте, и размещают информацию о субъектах, включающую по меньшей мере средства индивидуализации найденных субъектов и их контактную информацию, на разделяемом веб-сайте при соблюдении условия, состоящего в получении в ответ на указанное предложение информации, содержащей положительный ответ.
Недостатком данного способа является то, что при размещении информации не осуществляется ее ранжирование, а только проверяется достоверность.
Наиболее близким по технической сущности и достигаемому результату к заявленному способу, принятым за прототип, является способ формирования единой информационной системы (патент «Способ формирования единой информационной системы (ЕИС)» [Текст]: пат. 2728899 Российская Федерация, МПК G06F 17/40 (2006.01), МПК G06F 16/30 (2019.01) / Ю.А. Масюк [и др.]; заявитель и обладатель Федеральное государственное бюджетное научное учреждение «Федеральный исследовательский центр картофеля имени А.Г. Лорха». №2019130962; заявл. 02.10.2019; опубл. 03.08.2020, Бюл. №22). Суть способа является заключается в ускорении поиска интересующей информации, систематизированной в единой поисковой системе. Способ включает следующие действия: сканирование источника информации, систематизирование информации с выделением отдельных авторских, выходных и тематических информационных полей, разбивку и распределение информации по соответствующим информационным полям, определение местонахождения поступающей информации в ЕИС осуществляется с помощью соответствующих слов, букво- или знакосочетаний, благодаря чему источники информации автоматически собираются в авторские, выходные и тематические информационные поля и регистрируются там с помощью временного кода, включающего время создания документа, сопровождающиеся без пробела числом используемых цифр с последующим поиском интересующей информации в системе компьютера или интернета, при этом вводятся дополнительные вспомогательные коды, с помощью которых вводятся последующие слова с совпадающими буквосочетаниями, а для вертикального прочтения и обобщения всей информации по интересующему вопросу - цифровая часть кода располагается без пробела слева.
Недостатками способа - прототипа являются большие временные затраты на сканирование источников информации, ограничение базы данных только отсканированными источниками (не используются дополнительные внешние ресурсы), отсутствие учета оригинальности найденной информации, отсутствие ее градации на основную и дополнительную информацию.
Техническим результатом, достигаемым при применении предлагаемого способа является сокращение времени, затрачиваемого обучаемыми для информационного обеспечения самостоятельной работы, дополнение информационных ресурсов образовательной программы необходимыми материалами, достижение релевантности в поиске информации у обучающихся, а также снижение нагрузки на информационно-телекоммуникационную сеть.
Технический результат достигается за счет формирования частотного словаря ключевых слов, структуризации и ранжирования образовательного контента, а также за счет копирования структурированной информации на сервер образовательной программы.
Технический результат достигается тем, что в известном способе, заключающемся в сканировании источников информации, введении обнаруженных информационных ресурсов в информационную систему, систематизации информации, дополнительно задают образовательную программу и структуру ее дисциплин с детализацией до отдельного элемента образовательной программы, а также пороговые значения частоты встречи слов в каждом единичном элементе образовательной программы и максимальные значения количества основных и дополнительных электронных ресурсов; образовательную программу загружают на сервер вуза; последовательно для всех элементов образовательной программы и дисциплин составляют частотный словарь образовательной программы, для чего производят сравнение каждого слова образовательной программы со всеми остальными, если оно отличается, то слово запоминают в частотный словарь и задают начальное значение счетчику числа использований данного слова, равное единице, в противном случае у совпавшего слова счетчик увеличивают на единицу; формируют частотный словарь ключевых слов, для чего последовательно сравнивают значения числа использований для каждого слова с заданным пороговым значением частоты встречи слов, если число повторов больше или равно пороговому значению частоты встречи слов, то слово записывают вместе с данными о числе использований в словарь ключевых слов, в противном случае переходят к очередному слову; множество ключевых слов ранжируют на основе данных о количестве использования по степени убывания; последовательно для каждого элемента образовательной программы формируют запросы от сервера образовательной программы с элементами из словаря ключевых слов, начиная с первого; запросы с сервера образовательной программы через узел доступа направляют в сеть интернет; в сети формируют отклик в виде множества адресов доступных ресурсов, которые запоминают на сервере образовательной программы в виде матрицы; определяют число повторений каждого адреса путем обработки значений элементов матрицы; адреса ранжируют по числу повторений от максимального к минимальному и запоминают в матрице адресов электронных ресурсов; адреса, с порядковыми номерами, значения которых меньше или равно заданному числу основных электронных ресурсов, включают в список основных ресурсов и доводят до обучающихся, а адреса с порядковыми номерами, значения которых больше заданного числа основных ресурсов и меньше или сумме количества заданных основных и дополнительных электронных ресурсов, включают в список дополнительных электронных ресурсов и доводят до обучающихся.
В одном из вариантов изобретения каждому запомненному адресу в матрице ключевых слов частотного словаря присваивают численное значение, полученное путем нормирования количества использования ключевых слов в элементе образовательной программы
Kj =
Figure 00000001
, где
Figure 00000002
– количество адресов электронных ресурсов сети интернет использующих j – е ключевое слово;
Figure 00000003
– количество адресов электронных ресурсов сети интернет использующих i – е ключевое слово;
L – число ключевых слов используемых при формировании запросов.
В одном из вариантов изобретения для каждого электронного ресурса сети интернет определяют его общий объем и присваивают численное значение, полученное путем нормирования количества использования ключевых слов из образовательной программы к объему электронного ресурса
Kj =
Figure 00000004
, где
L – число ключевых слов используемых при формировании запросов;
Figure 00000002
– количество адресов электронных ресурсов сети интернет использующих j – е ключевое слово;
Figure 00000005
– объем информации у G – го информационного ресурса.
В одном из вариантов изобретения к выбранным в качестве основных и дополнительных ресурсов адресам направляют запрос на копирование содержащихся в них информации на сервер образовательной программы и при положительном отклике осуществляют копирование.
Из уровня техники не выявлено решений, касающихся способов отбора и ранжирования, характеризующихся заявленной совокупностью признаков, следовательно, что указывает на соответствие заявленного способа условию патентоспособности «новизна».
Результаты поиска известных решений в данной и смежной областях техники с целью выявления признаков, совпадающих с отличительными от прототипов признаками заявленного изобретения, показали, что они не следуют явным образом из уровня техники. Из определенного заявителем уровня техники не выявлена известность влияния предусматриваемых существенными признаками заявленного изобретения на достижение указанного технического результата. Следовательно, заявленное изобретение соответствует условию патентоспособности «изобретательский уровень».
«Промышленная применимость» способа обусловлена наличием элементной базы, на основе которой могут быть выполнены устройства, реализующие способ.
ОПИСАНИЕ ИЗОБРЕТЕНИЯ
Заявленный способ поясняется чертежами, на которых показано:
фиг.1 – алгоритм способа формирования основных и дополнительных электронных ресурсов сети интернет для изучения заданной образовательной программы.
фиг.2 – матрица ключевых слов частотного словаря;
фиг.3 – словарь ключевых слов;
фиг.4 – матрица множества адресов доступных ресурсов.
фиг.5 – матрица адресов электронных ресурсов.
Заявленный способ может быть реализован при помощи алгоритма, блок-схема которого представлена на фиг.1
На первом этапе заявленного способа задают образовательную программу и структуру ее дисциплин с детализацией до отдельного элемента образовательной программы, а также пороговые значения частоты встречи слов в каждом единичном элементе образовательной программы и максимальные значения количества основных К и дополнительных L электронных ресурсов (бл. 1 фиг. 1).
Образовательную программу загружают на сервер вуза (бл.2 фиг.1).
Последовательно для всех элементов образовательной программы составляют частотный словарь образовательной программы, представленный в виде матрицы ключевых слов (бл. 3, фиг. 1).
Частотный словарь (или частотный список) — набор слов данного языка (или подъязыка) вместе с информацией о частоте их встречаемости. Словарь может быть отсортирован по частоте, по алфавиту (тогда для каждого слова будет указана его частота), по группам слов (например, первая тысяча наиболее частотных слов, за ней вторая и т. п.), по типичности (слова, частотные для большинства текстов), и т. д. (Частотный словарь // Большая советская энциклопедия : [в 30 т.] / гл. ред. А. М. Прохоров. — 3-е изд. — М. : Советская энциклопедия, 1969—1978.).
Частотный словарь образовательной программы, последовательно для всех элементов образовательной программы и дисциплин, составляется следующим образом:
Производят сравнение каждого слова образовательной программы со всеми остальными. Если оно отличается, то слово запоминают в частотный словарь и задают начальное значение счетчика числа использований данного слова, равное единице, в противном случае у совпавшего слова счетчик числа использований увеличивают на единицу.
На фиг. 2 частотный словарь образовательной программы представлен в виде таблицы, в которой в столбец «ключевые слова» записаны слова по указанному выше правилу, а в столбец «число использований» - количество их использований.
Формируют частотный словарь ключевых слов (бл.4 фиг.1), для чего последовательно сравнивают значение числа использований для каждого слова с заданным пороговым значением частоты встречи слов, если число использований больше или равно пороговому значению частоты встречи слов, то слово записывают вместе с данными о числе использований в словарь ключевых слов, если число повторов меньше порогового значения частоты встречи слов , то переходят к очередному слову.
Ранжируют множество ключевых слов на основе данных о количестве их использования по степени убывания (бл.5 фиг.1).
На фиг. 3 частотный словарь ключевых слов представлен в виде таблицы, в которой ключевые слова ранжированы по количеству использований, от самого большего числа к минимальному, при этом число использований данных слов в образовательной программе превышает заданные пороговые значения частоты встречи слов.
Сканируют источники информации (бл.6 фиг.1).
Последовательно для каждого элемента образовательной программы формируют запросы от сервера образовательной программы с элементами из словаря ключевых слов, начиная с первого (бл.7 фиг.1).
Запросы с сервера образовательной программы через узел доступа направляют в сеть Интернет (бл.8 фиг.1).
Запросы задаются в стандартных поисковых системах, таких как: Yandex, Google, Rambler, Yahoo и др.
В сети формируют отклик в виде множества адресов доступных ресурсов, которые запоминают на сервере образовательной программы в виде матрицы (бл.9 фиг.1).
Матрица множества адресов доступных ресурсов формируется для каждого элемента образовательной программы (фиг. 4) и представляет собой таблицу, в которой для каждого ключевого слова отображаются наименования адресов и количество их использования.
Вводят обнаруженные информационные ресурсы в информационную систему (бл.10 фиг.1).
Определяют число повторений каждого адреса (бл.11 фиг.1) путем обработки значений элементов матрицы.
Адреса ранжируют по числу повторений от максимального к минимальному и запоминают в матрице адресов электронных ресурсов (бл.12 фиг.1).
Матрица адресов электронных ресурсов представлена на фиг. 5. Матрица представляет собой таблицу, в которой указываются адреса, в которых повторилось наибольшее количество ключевых слов. На основе заданных исходных данных по матрице определяется количество основных и дополнительных электронных ресурсов.
Адреса, с порядковыми номерами, значения которых меньше или равно заданному числу основных электронных ресурсов (от 1 до K), включают в список основных ресурсов и доводят до обучающихся, а адреса с порядковыми номерами, значения которых больше заданного числа основных ресурсов и меньше или равно сумме количества заданных основных и дополнительных электронных ресурсов (от K + 1 до К + L), включают в список дополнительных электронных ресурсов и доводят до обучающихся. (бл.13 фиг.1)
В одном из вариантов изобретения каждому запомненному адресу в матрице ключевых слов частотного словаря присваивают численное значение, полученное путем нормирования количества использования ключевых слов в элементе образовательной программы
Kj =
Figure 00000001
, где
Figure 00000002
– количество адресов электронных ресурсов сети интернет использующих j – е ключевое слово;
Figure 00000003
– количество адресов электронных ресурсов сети интернет использующих i – е ключевое слово;
L – число ключевых слов используемых при формировании запросов.
В одном из вариантов изобретения для каждого электронного ресурса сети интернет определяют его общий объем и присваивают численное значение, полученное путем нормирования количества использования ключевых слов из образовательной программы к объему электронного ресурса
Kj =
Figure 00000004
, где
L – число ключевых слов используемых при формировании запросов;
Figure 00000002
– количество адресов электронных ресурсов сети интернет использующих j – е ключевое слово;
Figure 00000005
– объем информации у G – го информационного ресурса.
Фактически полученное численное значение Kj определяет степень концентрированности информационного ресурса ключевыми словами элемента образовательной программы, что позволит сократить время на поиск необходимой информации. Большое количество ключевых слов, найденное в малом объеме информации, дает большую степень концентрированности материала по тематике поиска.
В одном из вариантов изобретения к выбранным в качестве основных и дополнительных ресурсов адресам направляют запрос на копирование содержащихся в них информации на сервер образовательной программы и при положительном отклике осуществляется копирование. При помощи данного варианта изобретения сокращается время, затрачиваемое на поиск информации, снижается нагрузка на информационно-телекоммуникационную сеть за счет сокращения количества отправляемых запросов и принимаемых откликов, а также хранения информации в сервере образовательной программы.
Таким образом, за счет формирования частотного словаря ключевых слов, структуризации и ранжирования образовательного контента в интересах формирования и функционирования образовательного процесса, а также за счет копирования структурированной информации на сервер образовательной программы обеспечивается сокращение времени, затрачиваемого обучаемыми для информационного обеспечения самостоятельной работы, дополнение информационных ресурсов образовательной программы необходимыми материалами, достижение релевантности в поиске информации у обучающихся, а также снижение нагрузки на информационно-телекоммуникационную сеть. Технический результат достигнут.

Claims (3)

1. Способ формирования основных и дополнительных электронных ресурсов сети интернет для изучения заданной образовательной программы, включающий сканирование источников информации, введение обнаруженных информационных ресурсов в информационную систему, систематизацию информации, отличающийся тем, что задают образовательную программу и структуру ее дисциплин с детализацией до отдельного элемента образовательной программы, а также пороговые значения частоты встречи слов в каждом единичном элементе образовательной программы и максимальные значения количества основных и дополнительных электронных ресурсов; образовательную программу загружают на сервер вуза; последовательно для всех элементов образовательной программы и дисциплин составляют частотный словарь образовательной программы, для чего производят сравнение каждого слова образовательной программы со всеми остальными, если оно отличается, то слово запоминают в частотный словарь и задают начальное значение счетчику числа использований данного слова, равное единице, в противном случае у совпавшего слова счетчик увеличивают на единицу; формируют частотный словарь ключевых слов, для чего последовательно сравнивают значения числа использований для каждого слова с заданным пороговым значением частоты встречи слов, если число повторов больше или равно пороговому значению частоты встречи слов, то слово записывают вместе с данными о числе использований в словарь ключевых слов, в противном случае переходят к очередному слову; множество ключевых слов ранжируют на основе данных о количестве использования по степени убывания; последовательно для каждого элемента образовательной программы формируют запросы от сервера образовательной программы с элементами из словаря ключевых слов, начиная с первого; запросы с сервера образовательной программы через узел доступа направляют в сеть интернет; в сети формируют отклик в виде множества адресов доступных ресурсов, которые запоминают на сервере образовательной программы в виде матрицы; определяют число повторений каждого адреса путем обработки значений элементов матрицы; адреса ранжируют по числу повторений от максимального к минимальному и запоминают в матрице адресов электронных ресурсов; адреса с порядковыми номерами, значения которых меньше или равны заданному числу основных электронных ресурсов, включают в список основных ресурсов и доводят до обучающихся, а адреса с порядковыми номерами, значения которых больше заданного числа основных ресурсов и меньше или равны сумме количества заданных основных и дополнительных электронных ресурсов, включают в список дополнительных электронных ресурсов и доводят до обучающихся.
2. Способ по п.1, отличающийся тем, что каждому запомненному адресу в матрице ключевых слов частотного словаря присваивают численное значение, полученное путем нормирования количества использования ключевых слов в элементе образовательной программы: K j =
Figure 00000006
, где
Figure 00000007
– количество адресов электронных ресурсов сети интернет, использующих j–е ключевое слово;
Figure 00000008
– количество адресов электронных ресурсов сети интернет использующих, i–е ключевое слово; L – число ключевых слов используемых при формировании запросов.
3. Способ по п.1, отличающийся тем, что для каждого электронного ресурса сети интернет определяют его общий объем и присваивают численное значение, полученное путем нормирования количества использования ключевых слов из образовательной программы к объему электронного ресурса: K j =
Figure 00000009
, где L – число ключевых слов, используемых при формировании запросов;
Figure 00000010
– количество адресов электронных ресурсов сети интернет, использующих j–е ключевое слово;
Figure 00000011
объем информации у G–го информационного ресурса.
RU2020140406A 2020-12-09 2020-12-09 Способ формирования основных и дополнительных электронных ресурсов сети интернет для изучения заданной образовательной программы RU2764391C1 (ru)

Priority Applications (1)

Application Number Priority Date Filing Date Title
RU2020140406A RU2764391C1 (ru) 2020-12-09 2020-12-09 Способ формирования основных и дополнительных электронных ресурсов сети интернет для изучения заданной образовательной программы

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2020140406A RU2764391C1 (ru) 2020-12-09 2020-12-09 Способ формирования основных и дополнительных электронных ресурсов сети интернет для изучения заданной образовательной программы

Publications (1)

Publication Number Publication Date
RU2764391C1 true RU2764391C1 (ru) 2022-01-17

Family

ID=80040438

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2020140406A RU2764391C1 (ru) 2020-12-09 2020-12-09 Способ формирования основных и дополнительных электронных ресурсов сети интернет для изучения заданной образовательной программы

Country Status (1)

Country Link
RU (1) RU2764391C1 (ru)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2236699C1 (ru) * 2003-02-25 2004-09-20 Открытое акционерное общество "Телепортал. Ру" Способ поиска и выборки информации с повышенной релевантностью
US20070156748A1 (en) * 2005-12-21 2007-07-05 Ossama Emam Method and System for Automatically Generating Multilingual Electronic Content from Unstructured Data
RU2410748C2 (ru) * 2009-01-11 2011-01-27 Торовин Алексей Иванович Способ поиска информации в сети интернет
RU2413278C1 (ru) * 2009-05-27 2011-02-27 Общество с ограниченной ответственностью "МэйлАдмин" Способ отбора информации в сети интернет и использования этой информации в разделяемом веб-сайте и компьютерный сервер для реализации этого способа
US20150325133A1 (en) * 2014-05-06 2015-11-12 Knowledge Diffusion Inc. Intelligent delivery of educational resources

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2236699C1 (ru) * 2003-02-25 2004-09-20 Открытое акционерное общество "Телепортал. Ру" Способ поиска и выборки информации с повышенной релевантностью
US20070156748A1 (en) * 2005-12-21 2007-07-05 Ossama Emam Method and System for Automatically Generating Multilingual Electronic Content from Unstructured Data
RU2410748C2 (ru) * 2009-01-11 2011-01-27 Торовин Алексей Иванович Способ поиска информации в сети интернет
RU2413278C1 (ru) * 2009-05-27 2011-02-27 Общество с ограниченной ответственностью "МэйлАдмин" Способ отбора информации в сети интернет и использования этой информации в разделяемом веб-сайте и компьютерный сервер для реализации этого способа
US20150325133A1 (en) * 2014-05-06 2015-11-12 Knowledge Diffusion Inc. Intelligent delivery of educational resources

Similar Documents

Publication Publication Date Title
US9594850B2 (en) Method and system utilizing a personalized user model to develop a search request
US7225181B2 (en) Document searching apparatus, method thereof, and record medium thereof
KR20060006945A (ko) 문서 연관 함수를 기계 습득하는 방법 및 장치
KR101873873B1 (ko) 속성 정보 분석을 통한 멀티미디어 컨텐츠 검색장치 및 검색방법
WO2005083597A1 (en) Intelligent search and retrieval system and method
CN110674271A (zh) 一种问答处理方法及装置
JP4200834B2 (ja) 情報検索システム、情報検索方法及び情報検索プログラム
US9298818B1 (en) Method and apparatus for performing semantic-based data analysis
Chan et al. Automated online news classification with personalization
Fafalios et al. Web searching with entity mining at query time
US11409814B2 (en) Systems and methods for crawling web pages and parsing relevant information stored in web pages
JP2023500523A (ja) 繰り返し可能クエリの識別および発行
US10504145B2 (en) Automated classification of network-accessible content based on events
RU2764391C1 (ru) Способ формирования основных и дополнительных электронных ресурсов сети интернет для изучения заданной образовательной программы
JP2014002653A (ja) 共起語を特定する装置およびプログラム
Kim A document ranking method with query-related web context
CN113609833B (zh) 文件的动态生成方法、装置、计算机设备及存储介质
US11681732B2 (en) Tuning query generation patterns
JP2012104051A (ja) 文書インデックス作成装置
CN110717008A (zh) 基于语意识别的搜索结果排序方法及相关装置
CN111324701A (zh) 内容补充方法、装置、计算机设备和存储介质
Samah et al. TF-IDF and Data Visualization For Syafie Madhhab Hadith Scriptures Authenticity
CN115714002B (zh) 抑郁风险检测模型训练方法、抑郁症状预警方法及相关设备
Pirmann Using tags to improve findability in library OPACs: a Usability Study of LibraryThing for Libraries
EP2894592A1 (en) System and method for identifying related elements with respect to a query in a repository