RU2290690C1 - Способ поиска и разметки данных информации - Google Patents

Способ поиска и разметки данных информации Download PDF

Info

Publication number
RU2290690C1
RU2290690C1 RU2005109959/09A RU2005109959A RU2290690C1 RU 2290690 C1 RU2290690 C1 RU 2290690C1 RU 2005109959/09 A RU2005109959/09 A RU 2005109959/09A RU 2005109959 A RU2005109959 A RU 2005109959A RU 2290690 C1 RU2290690 C1 RU 2290690C1
Authority
RU
Russia
Prior art keywords
objects
data
electronic documents
information system
database
Prior art date
Application number
RU2005109959/09A
Other languages
English (en)
Other versions
RU2005109959A (ru
Inventor
Олег Александрович Серебренников (RU)
Олег Александрович Серебренников
Original Assignee
Закрытое акционерное общество "МедиаЛингва"
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Закрытое акционерное общество "МедиаЛингва" filed Critical Закрытое акционерное общество "МедиаЛингва"
Priority to RU2005109959/09A priority Critical patent/RU2290690C1/ru
Publication of RU2005109959A publication Critical patent/RU2005109959A/ru
Application granted granted Critical
Publication of RU2290690C1 publication Critical patent/RU2290690C1/ru

Links

Abstract

Изобретение относится к области обработки цифровых данных с помощью электрических устройств, в частности к средствам информационного поиска и структурам баз данных, а также к средствам обучения иностранным языкам. Технический результат - создание эффективного способа поиска и разметки данных информации, в частности, для реализации обучающей функции "повторения пройденного", основанного на индивидуальном подходе к обучению, достигается тем, что осуществляют ввод в компьютер данных электронных документов, выявление объектов электронных документов, подлежащих поиску в информационной системе, сравнение объектов электронных документов, подлежащих поиску в информационной системе, с объектами баз данных информационной системы, преобразование данных электронных документов посредством разметки объектов электронных документов, визуализацию электронных документов с размеченными объектами данных электронных документов, при этом перед вводом в компьютер данных электронных документов производят ввод объектов данных, подлежащих поиску в информационной системе, сравнение объектов данных, подлежащих поиску в информационной системе с объектами данных баз данных информационной системы и формирование буферной базы объектов данных, при этом сравнение объектов электронных документов, подлежащих поиску в информационной системе, производят с объектами данных в буферной базе объектов данных. 16 з.п. ф-лы.

Description

Изобретение относится к области обработки цифровых данных с помощью электрических устройств, в частности к средствам информационного поиска и структурам баз данных, специально предназначенным для специфических функций, а также к средствам обучения, в частности, иностранным языкам.
Известны способы поиска данных информации, включающие ввод в компьютер данных электронных документов, подлежащих поиску в информационной системе, анализ данных электронных документов с выявлением объектов данных, сравнение выявленных объектов данных с фиксированными объектами данных в базах данных информационной системы, и визуализацию фиксированных объектов данных (см., например, RU № 99115413 G 09 B 19/06, 2001 г.).
Известные способы не используют разметку электронного документа данными результата поиска, что в конечном итоге исключает их сопоставление для целей обучения.
Более совершенным и наиболее близким аналогом заявляемому техническому решению являются способ поиска и разметки данных информации, включающий ввод в компьютер данных электронных документов, выявление объектов электронных документов, подлежащих поиску в информационной системе, сравнение объектов электронных документов, подлежащих поиску в информационной системе, с объектами баз данных информационной системы, преобразование данных электронных документов посредством разметки объектов электронных документов, подлежащих поиску в информационной системе, и визуализацию электронных документов с размеченными объектами данных электронных документов (RU №2177174 G 06 F 17/30, 2001 г.).
Однако при применении известного способа для целей обучения не предусмотрено повторение пройденного материала с учетом индивидуальных особенностей усвоения, что в конечном итоге снижает эффективность учебного процесса.
Задачей, на решение которой направлено заявляемое техническое решение, является создание эффективного средства поиска и разметки данных информации, в частности, для целей обучения.
Технический результат, который может быть получен при осуществлении заявленного способа, заключается в реализации обучающей функции "повторения пройденного" основанного на индивидуальном подходе к обучению.
Указанный технический результат достигается способом поиска и разметки данных информации, включающим ввод в компьютер данных электронных документов, выявление объектов электронных документов, подлежащих поиску в информационной системе, сравнение объектов электронных документов, подлежащих поиску в информационной системе, с объектами баз данных информационной системы, преобразование данных электронных документов посредством разметки объектов электронных документов и визуализацию электронных документов с размеченными объектами данных электронных документов, за счет того, что перед вводом в компьютер данных электронных документов производят ввод объектов данных, подлежащих поиску в информационной системе, сравнение объектов данных, подлежащих поиску в информационной системе с объектами данных баз данных информационной системы и формирование буферной базы объектов данных, при этом сравнение объектов электронных документов, подлежащих поиску в информационной системе, производят с объектами данных в буферной базе объектов данных
А также за счет того, что сравнение объектов, подлежащих поиску в информационной системе, с объектами баз данных информационной системы и объектами в буферной базе объектов данных осуществляют посредством поиска объектов электронных документов, подлежащих поиску в информационной системе, в объектах баз данных информационной системы и в объектах буферной базы объектов данных.
А также за счет того, что сравнение объектов, подлежащих поиску в информационной системе, с объектами баз данных информационной системы и объектами буферной базы объектов данных осуществляют посредством поиска объектов баз данных информационной системы и буферной базы объектов данных в объектах данных электронных документов, подлежащих поиску в информационной системе.
А также за счет того, что совокупность объектов данных в буферной базе объектов данных ограничивают с возможностью изменения заданным количеством объектов данных и динамически обновляют.
А также за счет того, что объекты данных в буферной базе объектов данных сравниваемые с объектами данных электронных документов динамически обновляют методом "первым вошел - первым вышел".
А также за счет того, что совокупность объектов, сравниваемых с объектами данных электронных документов динамически обновляемых методом "первым вошел - первым вышел", ограничивают заданным количеством объектов с возможностью его изменения, отличающимся от количества объектов в буферной базе объектов данных.
А также за счет того, что объекты в буферной базе объектов данных, сравниваемые с объектами данных электронных документов, динамически обновляют методом "последним вошел - первым вышел".
А также за счет того, что совокупность объектов, сравниваемых с объектами данных электронных документов, динамически обновляемых методом "последним вошел - первым вышел", ограничивают заданным с возможностью изменения количеством объектов, отличающимся от количества объектов в буферной базе объектов данных.
А также за счет того, что объекты в указанной буферной базе объектов данных, сравниваемые с объектами данных электронных документов, динамически обновляют с чередованием метода "первым вошел - первым вышел" и метода "последним вошел - первым вышел".
А также за счет того, что указанную буферную базу объектов данных, формируют с разделением ресурса на массивы данных, обеспечивающих раздельный и идентифицированный доступ к объектам.
А также за счет того, что в базах данных объектам данных сопоставляют связанные данные, дополняемые операндами прикладных компьютерных программ и визуализируют связанные данные в качестве всплывающего контекста данных электронных документов
А также за счет того, что в качестве прикладных компьютерных программ используют программы доступа к просмотру электронных документов и данных в информационной сети, при этом упомянутые связанные данные дополняют унифицированным указателем информационного ресурса сети.
А также за счет того, что ввод в компьютер данных электронных документов, выявление объектов электронных документов, подлежащих поиску в информационной системе, сравнение объектов, подлежащих поиску в информационной системе с объектами в буферной базе объектов данных, разметку объектов электронных документов, запуск последовательности исполнения и исполнение прикладных компьютерных программ, а также визуализацию связанных данных и/или данных информационных ресурсов сети осуществляют одной процедурой.
А также за счет того, что объекты данных, подлежащих поиску в информационной системе, вводят в компьютер в отдельном окне панели задач или панели меню операционной системы независимо от наличия открытых окон операционной системы, поддержания конкретного окна в фокусе операционной системы, наличия текста в фокусном окне операционной системы; возможности ввода или выделения текста в открытом фокусном окне операционной системы.
А также за счет того, что перед преобразованием данных электронных документов посредством разметки объектов электронных документов, подлежащих поиску в информационной системе, производят переформатирование данных электронных документов из исходного формата в формат, позволяющий размещать разметку.
А также за счет того, что выявление объектов электронных документов, подлежащих поиску в информационной системе, осуществляют посредством аппаратно-программного лингвистического анализа данных электронных документов.
В данном определении сущности заявляемого технического решения подразумевается следующее толкование терминов:
данные - информация представленная в форме, воспринимаемой для формальной обработки автоматическими устройствами,
объекты - знаковые отображения элементов и/или параметров и/или атрибутов и/или отношений данных,
массив объектов данных - набор последовательно организованных на логическом уровне данных одинакового типа, предназначенный для работы с ним в памяти прямого доступа,
база данных - совокупность данных, организованных по определенным правилам, предусматривающим независимость от обрабатывающих программ, общие принципы описания, хранения и манипулирования,
буферная база объектов данных - поле памяти, предназначенное для согласования данных и событий выполнения процедур сравнения данных,
информационная система - совокупность электронно-вычислительных машин, связанных системой передачи данных и средствами связи для доступа абонентов к вычислительным ресурсам сети,
электронные документы - текстовые представления данных,
аппаратно-программный лингвистический анализ - функционирование вычислительного устройства в соответствии с алгоритмом, описанным, например, в "Development of a Stemming Algorithm" (Julie Beth Lovins, Mechanical Translation and Computational Linguistics, 11, 22-31, 1968),
разметка - языковая конструкция для обозначения доступа к информационному ресурсу, выделяется при визуализации в тексте цветом, подчеркиванием или другими известными способами, содержит всплывающий контекст (меню) со списком комментариев и/или гиперссылок, используется технология SmartTag или/и ToolTip или/и Hint операционной системы MS Windows и/или JavaScript или/и РНР или/и ASP или/и DHTML и/или другая известная технология гипертекстовой разметки электронных документов,
унифицированный указатель информационного ресурса - адрес URL (uniform resource locator), синтаксис которого определен в RFC 2396 либо как абсолютный адрес URI (absolute URI), имеющий характерный синтаксис (generic URI syntax) вида<scheme>://<authority><path>?<query>), или как относительный адрес URI (relative URI syntax), имеющий синтаксис вида (net_path|abs__path|rel_path) ["?" query], либо может соответствовать и другим аналогичным требованиям, например, описанным в RFC 3401-3406 реализации DDDS адресации;
связанные данные - данные, имеющие с объектами данных связь, устанавливающуюся при вызове программы,
программа доступа к просмотру электронных документов и данных в информационной сети - программа типа браузер, например, Microsoft Internet Explorer или Netscape Navigator,
прикладная компьютерная программа - программа для решения задачи (задач) в определенной области применения систем обработки данных,
операнд - языковая конструкция, обозначающая ссылку в машинной команде на запуск компьютерных программ,
процедура - множественная операция, реализация которой обеспечивается системой программирования, что делает ее одинаково доступной и с одинаковым смыслом.
Работа по поиску и разметке данных информации согласно заявляемому способу, например, при обучении иностранному языку и переводе текста с использованием электронного словаря, осуществляются следующим образом.
Пользователь перед вводом в компьютер данных электронных документов Ошибка! Источник ссылки не найден. производит ввод объектов данных, подлежащих поиску в информационной системе (например, требующие перевода), сравнение объектов данных, подлежащих поиску в информационной системе с объектами данных баз данных информационной системы (например, в базе данных переводов слов и словосочетаний электронного словаря МультиЛекс™) и формирование буферной базы объектов данных (например, история ввода пользователем слов и словосочетаний, требующих перевода), где совокупность объектов данных ограничивают с возможностью изменения заданным количеством объектов данных и динамически обновляют (например, путем добавления слов и словосочетаний, вновь введенных пользователем).
Примером ввода пользователем объектов данных может служить ввод слов или словосочетаний или фрагмента текста посредством мыши или клавиатуры, например:
- используя функцию "выделения текста", при этом выделяют слово или словосочетание или фрагмент в тексте документа и вызывают процедуру сравнения введенных объектов или
- вводят путем печати на клавиатуре или путем копирования и вставки (copy & paste) или "перетаскивают" (drag & drop) слово или словосочетание в фокусное окно операционной системы и вызывают процедуру сравнения введенных объектов,
- с помощью ввода в окно Tool Bar или/и Tool Band или/и Desk Band операционной системы MS Windows(или с использованием другого известного способа.
Примером вызова процедуры сравнения может служить вызов процедуры сравнения путем нажатия "горячей" клавиши перевода электронного словаря МультиЛекс™, или запуск процедуры сравнения из командной строки операционной системы, или другой известный способ запуска процедуры сравнения.
Примером буферной базы данных может служить память истории переводов словаря МультиЛекс™, а примером формирования буферной базы данных может служить запись слов и словосочетаний, переведенных пользователем в память истории переводов словаря МультиЛекс™.
В упомянутой буферной базе организацией данных может быть предусмотрено наличие, по меньшей мере, одного объекта (например, одного слова из множества слов находящихся в буфере) в виде алфавитно-цифровой последовательности символов, не являющихся словом или словосочетанием. Признаком конца такой последовательности (или слова) при вводе служат знаки препинания, пробелы или/и другие символы разделения, используемые при форматировании текстовой или/и табличной информации. Кроме того, в упомянутой буферной базе объектов данных организацией данных должно быть предусмотрено, что каждому объекту (например, слову или словосочетанию) ничто не поставлено в соответствие, или поставлена в соответствие процедура формирования данных (например, перевода), или поставлены в соответствие сами связанные данные (например, перевод), или поставлен в соответствие адрес связанных данных (например, перевода слова или словосочетания в базе данных переводов), или поставлена в соответствие процедура формирования адреса размещения связанных данных (например, адреса размещения перевода слова или словосочетания в базе данных переводов), при этом объекты размещают в хронологическом порядке поиска, или в алфавитном, или в другом порядке. Упомянутая буферная баз может быть установлена на сервере в сети информационной системы или на терминале пользователя.
После этого Пользователь единой процедурой осуществляет ввод в компьютер данных электронных документов (например, вызывает для просмотра в браузере текстовую страницу Интернет), выявление объектов данных электронного документа, подлежащих поиску в информационной системе (например слов и словосочетаний) и сравнение выявленных объектов данных электронных документов, подлежащих поиску в информационной системе, с объектами данных в буферной базе объектов данных (например, со словами и словосочетаниями размещенными в памяти истории переводов словаря МультиЛекс™, организованными как база данных информационной системы) или/и с объектами баз данных информационной системы (например, в словаре МультиЛекс™ (со словами и/или словосочетаниями, организованными как база данных информационной системы). При реализации этой единой процедуры, в частности, перед просмотром доступных пользователю электронных документов, возможно, содержащих объекты, требующие повторного толкования или перевода, выявление объектов электронных документов, подлежащих поиску в информационной системе, может быть осуществлено посредством разбиения данных на группы алфавитно-цифровых последовательностей, разделенных знаками конца последовательности (например, слова или словосочетания или другие объекты, разделенные пробелами, знаками препинания или/и другими символами разделения) или посредством аппаратно-программного лингвистического анализа данных электронных документов, в процессе которого документы разбиваются на слова и/или словосочетания, или объекты данных могут быть использованы в исходном виде, при этом поисковым запросом служит очередное слово или словосочетание или фрагмент текста или весь текст документа.
Общеизвестным является тот факт, что обучение иностранному языку, терминологии, как и обучение вообще, в значительной степени построено на повторении пройденного материала. Вместе с тем, разные люди по разному воспринимают и усваивают пройденный материал и поэтому уровень знания материала пройденного двумя разными учениками одного класса всегда отличен и индивидуален. Именно поэтому повторение одного и того же списка пройденных слов не может быть одинаково эффективным способом обучения для всех учеников одного класса. Для обеспечения реализации обучающей функции "повторения пройденного" основанного на индивидуальном подходе к обучению перед сравнением объектов электронных документов, подлежащих поиску в информационной системе с объектами баз данных информационной системы проводят сравнение упомянутых объектов с объектами данных в буферной базе объектов данных, причем совокупность объектов данных в буферной базе объектов данных, сравниваемых с объектами данных электронных документов, могут ограничивать с возможностью изменения заданным количеством объектов и динамически обновляют.
Все или часть объектов данных в буферной базе объектов данных, сравниваемых с объектами данных электронных документов, динамически обновляют методом "первым вошел - первым вышел" (метод FIFO - "очередь"), либо методом "последним вошел - первым вышел" (метод LIFO - "стек"), либо с чередованием указанных методов.
Посредством управляющей программы объектам данных, подлежащим поиску в информационной системе, сопоставляют объекты данных буферной базы объектов данных (например, слова и выражения в буферных словарях), при обнаружении доказательства истинности (совпадения полностью или частично) включают и исполняют механизм преобразования объектов данных электронных документов во взаимосвязанную совокупность данных электронных документов посредством разметки объектов данных электронных документов связанными данными объектов буферной базы данных, совпадающих полностью или частично с выявленными объектами буферной или другой базы данных информационной системы, отличной от буферной базы объектов данных. Связанные данные могут быть дополнены операндами других прикладных компьютерных программ, способных обработать поисковый запрос, и/или гиперссылками. Примером упомянутых операндов может служить, в частности, вызов прикладной компьютерной программы озвучивания выделенного разметкой слова или его перевода, а примером гиперссылок может служить размещение адреса URL (uniform resource locator) в языковой конструкции разметки. Параметр такого вызова может содержать само слово или словосочетание электронного документа, размеченное таким комментарием и подлежащее "озвучиванию".
Введенные пользователем объекты данных, подлежащие поиску в информационной системе при формировании буферной базы данных могут быть дополнены сопутствующими данными в виде совокупности данных электронного документа, включающей объект данных и данные электронного документа, характеризующие применение такого объекта данных электронного документа (например, в словарях сопутствующие объекты данных могут быть представлены примером употребления слова в контексте его перевода или примером толкований слов и/или словосочетаний, в частности и на языке исходного электронного документа).
Перед упомянутым преобразованием при необходимости производят переформатирование данных из исходного формата в формат (например DOC или HTML), позволяющий размещать в данных разметку. Еще одним полезным эффектом является то, что данная операция предусматривает возможность переформатирования потока электронных документов из "бедного" не поддерживающего гипертекстовую разметку формата в "богатый" гипертекстовый формат, с целью размещения в исходном электронном документе информации, например, о переводе и/или толковании.
Сравнение объектов, подлежащих поиску в информационной системе, с объектами баз данных информационной системы и/или объектами в буферной базе объектов данных осуществляют посредством поиска объектов электронных документов, подлежащих поиску в информационной системе, в объектах баз данных информационной системы и/или в объектах буферной базы объектов данных либо посредством поиска объектов баз данных информационной системы и/или буферной базы объектов данных в объектах данных электронных документов, подлежащих поиску в информационной системе.
При отсутствии надлежащей информации в базе данных информационной системы и/или буферной базе объектов данных или соответственно желанию пользователя или соответственно предписанию процедуры или соответственно целям обработки данных в качестве компьютерных программ используют программы доступа к просмотру электронных документов и данных в информационной системе, при этом связанные данные дополняют унифицированным указателем информационного ресурса системы или другой системы и/или базы данных другой информационной системы. Примером таких действий может служить гиперссылка на сайт Интернет, предоставляющий услуги "купить", "починить", "продать" и другие в отношении, например, объекта "мобильный телефон". Другим примером таких действий может служить поиск информации о типе товара или услуги по его наименованию (торговой марке) в информационной системе и/или базе данных конкретного производителя или товарного знака в информационной системе и/или базе данных конкретного патентного ведомства и так далее, при этом связанными данными могут служить данные, связанные с использованием такого товара или услуги, информация о правообладателе товарного знака или другие данные патентного ведомства. Еще одной реализацией является размещение в окне поиска онлайновых словарей или переводчиков, таких как, например, http://multilex.mail.ru/ или http://online.multilex.ru/, контекстной рекламы продавцов различных товаров и услуг, купивших в рекламном агентстве слово или словосочетание. Так, например, получив запрос пользователя на поиск перевода английского слова "telephone", онлайновый ресурс перевода покажет пользователю Интернет перевод, а также рекламу продавца телефонов или мастерской по их ремонту. Реклама может быть контекстной не только в отношении переводимого слова, выражения или текста, но и в отношении самого пользователя. Например, существует техника определения географической принадлежности пользователя по IP адресу и в зависимости от этого может быть размещена контекстная реклама рекламодателя, географически близко размещенного к пользователю. Такая реклама может быть размещена в виде баннеров или reach media рекламы, такой как технология flash компании Macromedia (http://www.Macromedia.com) или другая, имея размер и формат, соответствующий требованиям страницы, например, перевода, причем материалы размещаются в предварительно отведенных для этого местах страницы перевода, соответствующих размерам и поддерживающих цифровой формат рекламных материалов.
При ограниченном количестве объектов в буферной базе объектов данных и обновлении методом "очередь" вновь введенный пользователем объект данных будет помещаться в память как слово №N в конец очереди и вымещать ранее введенный объект №1 со связанными данными из начала очереди, а при обновлении методом "стек" будет меняться только последний объект со связанными данными, оставляя нетронутыми предыдущие (N-1) объектов. Изменяя число N изучаемых пользователем из всего количества объектов в буферной базе объектов данных и метод обновления с целью "углубленного повторения" пройденного, пользователь получает возможность регулировать скорость обновления изучаемых объектов и таким образом регулировать продолжительность "повторения" ранее выявленных изучаемых объектов. Для разметки будут использованы только слова или словосочетания, размещенные в буферной базе объектов данных, которые будут выделяться в тексте гиперссылками, указывающими на перевод, команду озвучить слово, примеры применения слова и так далее или комментариями, содержащими перевод, команду озвучить слово, примеры применения слова и так далее.
Для использования пользователем истории обновления ранее введенных объектов (истории перевода) с любой доступной глубиной, совокупность объектов буферной базы, сравниваемых с объектами данных электронных документов и, динамически обновляемых либо методом "первым вошел - первым вышел" либо методом "последним вошел - первым вышел", ограничивают заданным с возможностью изменения количеством объектов, отличающимся от ограниченного количества объектов в указанной буферной базе.
В результате таких действий электронный документ будет преобразован в первую очередь с разметкой выявленных объектов связанными данными объектов буферной базы объектов данных и может быть дополнительно, но не обязательно, преобразован во вторую очередь - с разметкой объектами со связанными данными из баз данных информационной системы. Аналогичный эффект может быть достигнут и при сравнении объектов буферной базы объектов данных с объектами электронных документов одновременно с их выявлением.
Разметку данных в электронном документе производят гиперссылками на источник связанных или/и сопутствующих данных объекта (например, перевода или/и примеров употребления) или размечают самими связанными данными (например, переводами) по технологии подсказок Hint, ToolTip, SmartTag или технологии DHTML или JavaScript или ASP или РНР или с помощью другой известной технологии.
Электронный документ с разметкой упомянутыми связанными данными визуализируют, например, используя средства операционной системы MS Windows™ (или/и технологии plug-in или/и add-on к офисному программному обеспечению Microsoft Office™, а также визуализируют окно поискового запроса с кнопкой "поиск" или аналогичной ей по значению кнопкой, или только кнопку (без окна), размещенную на таком средстве визуализации и функционально эквивалентную "горячей клавише" поиска, при этом связанные данные визуализируют в качестве всплывающего контекста объектов данных, размеченных цветом, подчеркиванием или специальным всплывающим символом (например, для операционной системы MS Windows™ (подчеркивание слова и показ символа 'i' в круге означает, что слово размечено SmartTag) для привлечения на себя внимания пользователя. Указанный всплывающий комментарий позволяет визуализировать меню, содержащее список гиперссылок или/и комментариев возможных переводов или/и толкований или/и меню способов обработки слова или словосочетания размеченного в электронном документе, подлежащем визуализации.
При "активизации" контекста или объекта данных, например, с помощью курсора мыши или клавиатуры, пользователь повторно воспринимает информацию связанных данных (видит или/и слышит перевод или/и толкование слова, которое еще не освоил или видит команду перевода, толкования или озвучивания слова) и таким образом получает возможность "повторения пройденного", чем и достигается индивидуальный полезный эффект обучения. Достижению этого эффекта, например, в ситуациях с разными пользователями или в ситуациях с тематическим разделением информационного ресурса, способствует также и то, что буферную базу объектов данных формируют с разделением ресурса на массивы данных, обеспечивающих раздельный и идентифицированный доступ к данным объектов соответственно для разных пользователей или для разной тематики.
Для сокращения количества действий пользователя, необходимых для обработки данных электронных документов, подлежащих поиску в информационной системе, одной процедурой осуществляют совокупность действий, таких как ввод в компьютер данных электронных документов, выявление объектов электронных документов, подлежащих поиску в информационной системе, сравнение объектов, подлежащих поиску в информационной системе с объектами в буферной базе объектов данных, разметку объектов электронных документов, запуск последовательности исполнения и исполнение прикладных компьютерных программ, а также визуализацию связанных данных и/или данных информационных ресурсов сети при этом объекты данных, подлежащих поиску в информационной системе, вводят в компьютер в отдельном окне панели задач или панели меню операционной системы независимо от наличия открытых окон операционной системы, поддержания конкретного окна в фокусе операционной системы, наличия текста в фокусном окне операционной системы; возможности ввода или выделения текста в открытом фокусном окне операционной системы. Например, после ввода поискового запроса следует нажать кнопку "поиск" чтобы найти, например, перевод введенного слова. Причем место, показанное как Tool Band (в панели инструментов конкретной программы для операционной системы MS Windows™) или Desk Band (в панели задач операционной системы MS Windows™) может выглядеть, например, как строка ввода адреса Интернет в браузере с такой же клавишей "GO" или по-другому, так, как захочет программист.
Существенность такой специфики для достижения технического результата видна на примере использования упомянутой процедуры при пользовании Электронным словарем МультиЛекс™ (версии 4.0 (www.multilex.ru), где пользователь не имеет возможности для реализации функции "всплывающего перевода" по технологии Tool Bar или/и Tool Band или/и Desk Band, если на экране нет окна с текстом, если окно не находится в фокусе работы операционной системы, или если текст в окне не доступен для "выделения" с последующим копированием в clipboard по каким-то причинам. Кроме того, пользователь словаря не может осуществить поиск выделенного объекта в сети Интернет или других базах данных, так как существующая реализация "всплывающего перевода" позволяет осуществлять поиск только в упомянутом словаре, а "всплывающий перевод" не достаточно "интеллектуален" и не способен обрабатывать вызовы на исполнение других программ.
Объединение одной процедурой нескольких действий в заявляемом способе позволяет устранить все указанные недостатки существующей технологии электронного словаря, а именно позволяет при вводе с клавиатуры и показывать вводимый текст в отдельном окне панели задач или панели меню операционной системы MS Windows™ (и таких программ как MS Internet Explorer™, MS Word™ (и других независимо от а) наличия открытых окон операционной системы, б) поддержания конкретного окна в фокусе операционной системы, в) наличия текста в фокусном окне операционной системы и г) возможности ввода или выделения текста в открытом фокусном окне операционной системы.
Объединение одной процедурой нескольких действий в заявляемом способе предоставляет возможность установить последовательность вызова компьютерных программ обработки данных. Например, если в процедуре установлено в качестве первоочередной обработка программой электронного словаря МультиЛекс введенных пользователем данных, то при нажатии "горячей клавиши" процедура будет вызывать на исполнение первой программу МультиЛекс и передавать ей введенные пользователем данные как слова для перевода, а результатом работы процедуры будет "всплывающий перевод" введенных или выделенных слов. При этом, если программа электронного словаря МультиЛекс не способна обработать запрос (например, объект не имеет перевода), то процедура будет последовательно передавать управление другим программам, пока одна из таких программ не позволит корректно обработать введенные данные. В примере с адресом Интернет такой программой будет Интернет браузер, например MS Internet Explorer™, а если введенными пользователем данными является e-mail адрес name@multilex.ru, то управление будет передано программе создания сообщения электронной почты и так далее.
Наконец еще одним преимуществом объединения одной процедурой нескольких действий является возможность реализации компьютерной программы поиска, перехвата, анализа и разметки, которая позволяет сократить количество действий пользователя, необходимых для обработки вводимой им текстовой информации, а также позволяет повысить степень "интеллектуальности" компьютерной программы перевода и/или электронных словарей и расширить их функциональные возможности. Программа может быть частью электронного словаря и обеспечивать перехват данных ввода пользователя с клавиатуры или из промежуточной памяти (clipboard), анализ и интерпретацию введенных данных, определение программы, отвечающей за обработку введенных данных, вызов на исполнение соответствующей компьютерной программы и передачу ей данных для обработки. Программа может быть установлена на сервере в сети информационной системы или на терминале пользователя.
Такая компьютерная программа будет выполнять функцию слежения за вводом с клавиатуры и функцию хранения в буфере памяти терминала ограниченного множества слов поискового запроса, извлекает из буфера, по меньшей мере, одно из находящихся в буфере слов и формирует поисковый запрос к одной или нескольким поисковым системам или/и массивам или/и базам данных. Это позволяет пользователю осуществить ввод объектов подлежащих поиску в базах данных информационной системы.
Упомянутая программа будет иметь функцию постоянной замены находящихся в буферной базе объектов данных слов вновь введенными по правилу "очередь" или "стек", а в качестве поискового запроса программа использует содержимое буферной базы объектов данных на момент нажатия "горячей клавиши" поиска. Упомянутая программа будет иметь также функцию слежения за поступлением в промежуточную память операционной системы (clipboard) данных, скопированных пользователем из доступных ему электронных документов, а также будет иметь функцию копирования скопированных пользователем данных из промежуточной памяти (clipboard) в буфер памяти поискового запроса терминала.
Указанная программа позволит интерпретировать поисковый запрос как адрес Интернет; как слово или словосочетание для перевода или/и толкования; или как имя команды для операционной системы; или как имя команды для определенной пользователем компьютерной программы; или как данные поискового запроса к одной или нескольким поисковым машинам Интернет или одной или нескольким базам данных информационной системы; или как поисковый запрос на поиск данных в локальной сети или сети экстранет или сети интранет. Обработка этого запроса будет иметь возможность настройки, которая доступна пользователю или/и администратору терминала или/и сервера, причем настройка позволит установить очередность вызова других программ для обработки поискового запроса по установленному порядку следования или/и по степени соответствия содержания поискового запроса (объекта, подлежащего поиску в базах данных информационной системы) функциональности вызываемой программы.
Алгоритм указанной программы должен быть составлен исходя из условия наполнения буферной базы объектов данных объектами (данными истории переводов) всякий раз, когда пользователь, исполняя функцию "первичного обучения", производит поиск перевода в базе данных переводов, а при просмотре электронных документов на терминале пользователя перед их визуализацией программно осуществляют следующее:
- производят перехват электронного документа перед его визуализацией пользователю;
- или производят лингвистический анализ электронного документа или не производят лингвистического анализа, разбивая электронный документ на последовательность отдельных слов и/или словосочетаний и формируют последовательные поисковые запросы поиска слова или словосочетания к буферной базе объектов данных, используя слова или словосочетания, полученные в процессе разбивки электронного документа;
- или извлекают из буферной базы объектов данных список переведенных ранее слов и/или словосочетаний и ищут в электронном документе слова и/или словосочетания, совпадающие с, по меньшей мере, одним из слов и/или словосочетаний буферной базы объектов данных,
- если найдено совпадение, по меньшей мере, одного слова и/или словосочетания электронного документа и объектов в буферной базе объектов данных, то
- либо извлекают соответствующий слову или словосочетанию перевод или адрес перевода из буферной базы объектов данных или ищут перевод в иных базах данных переводов;
- снабжают соответствующее слово или словосочетание, содержащееся в электронном документе, всплывающим комментарием, содержащим перевод слова и/или словосочетания,
- или/и размечают соответствующее слово или словосочетание электронного документа гиперссылкой, содержащей адрес базы данных переводов, или множественной гиперссылкой, содержащей список гиперссылок;
- передают размеченный всплывающими комментариями и/или гиперссылками электронный документ для визуализации пользователю;
- визуализируют размеченный электронный документ на дисплее терминала.
Если база данных переводов содержит рекламу в виде баннеров и других рекламных материалов, поставленных в соответствие по меньшей мере одному слову или/и словосочетанию буферной базы объектов данных, при поиске перевода в базе данных переводов программа должна дополнительно выполнять шаги по:
- поиску в базе данных переводов или в специализированной рекламной базе данных рекламных материалов, соответствующих введенному пользователем слову, или словосочетанию, или тексту,
- размещению найденных в базе данных рекламных материалов в окне перевода перед его визуализацией пользователю.

Claims (17)

1. Способ поиска и разметки данных информации, включающий ввод в компьютер данных электронных документов, выявление объектов электронных документов, подлежащих поиску в информационной системе, сравнение объектов электронных документов, подлежащих поиску в информационной системе, с объектами баз данных информационной системы, преобразование данных электронных документов посредством разметки объектов электронных документов и визуализацию электронных документов с размеченными объектами данных электронных документов, отличающийся тем, что перед вводом в компьютер данных электронных документов производят ввод объектов данных, подлежащих поиску в информационной системе, сравнение объектов данных, подлежащих поиску в информационной системе с объектами данных баз данных информационной системы и формирование буферной базы объектов данных, при этом сравнение объектов электронных документов, подлежащих поиску в информационной системе, производят с объектами данных в буферной базе объектов данных.
2. Способ по п.1, отличающийся тем, что сравнение объектов, подлежащих поиску в информационной системе, с объектами баз данных информационной системы и объектами в буферной базе объектов данных осуществляют посредством поиска объектов электронных документов, подлежащих поиску в информационной системе, в объектах баз данных информационной системы и в объектах буферной базы объектов данных.
3. Способ по п.1, отличающийся тем, что сравнение объектов, подлежащих поиску в информационной системе, с объектами баз данных информационной системы и объектами буферной базы объектов данных осуществляют посредством поиска объектов баз данных информационной системы и буферной базы объектов данных в объектах данных электронных документов, подлежащих поиску в информационной системе.
4. Способ по п.1, отличающийся тем, что совокупность объектов данных в буферной базе объектов данных ограничивают с возможностью изменения заданным количеством объектов данных и динамически обновляют.
5. Способ по п.1, отличающийся тем, что совокупность объектов данных в буферной базе объектов данных, сравниваемых с объектами данных электронных документов, ограничивают с возможностью изменения заданным количеством объектов и динамически обновляют.
6. Способ по п.4 или 5, отличающийся тем, что объекты данных в буферной базе объектов данных, сравниваемые с объектами данных электронных документов, динамически обновляют методом "первым вошел - первым вышел".
7. Способ по п.6, отличающийся тем, что совокупность объектов, сравниваемых с объектами данных электронных документов, динамически обновляемых методом "первым вошел - первым вышел", ограничивают заданным количеством объектов с возможностью его изменения, отличающимся от количества объектов в буферной базе объектов данных.
8. Способ по п.4, отличающийся тем, что объекты в буферной базе объектов данных, сравниваемые с объектами данных электронных документов, динамически обновляют методом "последним вошел - первым вышел".
9. Способ по п.8, отличающийся тем, что совокупность объектов, сравниваемых с объектами данных электронных документов, динамически обновляемых методом "последним вошел - первым вышел", ограничивают заданным с возможностью изменения количеством объектов, отличающимся от количества объектов в буферной базе объектов данных.
10. Способ по п.4 или 5, отличающийся тем, что объекты в указанной буферной базе объектов данных, сравниваемые с объектами данных электронных документов, динамически обновляют с чередованием метода "первым вошел - первым вышел" и метода "последним вошел - первым вышел".
11. Способ по п.1, отличающийся тем, что указанную буферную базу объектов данных формируют с разделением ресурса на массивы данных, обеспечивающих раздельный и идентифицированный доступ к объектам.
12. Способ по п.1, отличающийся тем, что в базах данных объектам данных сопоставляют связанные данные, дополняемые операндами прикладных компьютерных программ, и визуализируют связанные данные в качестве всплывающего контекста данных электронных документов.
13. Способ по п.12, отличающийся тем, что в качестве прикладных компьютерных программ используют программы доступа к просмотру электронных документов и данных в информационной системе, при этом упомянутые связанные данные дополняют унифицированным указателем информационного ресурса сети.
14. Способ по п.13, отличающийся тем, что ввод в компьютер данных электронных документов, выявление объектов электронных документов, подлежащих поиску в информационной системе, сравнение объектов, подлежащих поиску в информационной системе с объектами в буферной базе объектов данных, разметку объектов электронных документов, запуск последовательности исполнения и исполнение прикладных компьютерных программ, а также визуализацию связанных данных и/или данных информационных ресурсов сети осуществляют одной процедурой.
15. Способ по п.14, отличающийся тем, что объекты данных, подлежащих поиску в информационной системе, вводят в компьютер в отдельном окне панели задач или панели меню операционной системы независимо от наличия открытых окон операционной системы, поддержания конкретного окна в фокусе операционной системы, наличия текста в фокусном окне операционной системы; возможности ввода или выделения текста в открытом фокусном окне операционной системы.
16. Способ по п.1, отличающийся тем, что перед преобразованием данных электронных документов посредством разметки объектов электронных документов, подлежащих поиску в информационной системе, производят переформатирование данных электронных документов из исходного формата в формат, позволяющий размещать разметку.
17. Способ по п.1, отличающийся тем, что выявление объектов электронных документов, подлежащих поиску в информационной системе, осуществляют посредством аппаратно-программного лингвистического анализа данных электронных документов.
RU2005109959/09A 2005-04-06 2005-04-06 Способ поиска и разметки данных информации RU2290690C1 (ru)

Priority Applications (1)

Application Number Priority Date Filing Date Title
RU2005109959/09A RU2290690C1 (ru) 2005-04-06 2005-04-06 Способ поиска и разметки данных информации

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2005109959/09A RU2290690C1 (ru) 2005-04-06 2005-04-06 Способ поиска и разметки данных информации

Publications (2)

Publication Number Publication Date
RU2005109959A RU2005109959A (ru) 2006-10-20
RU2290690C1 true RU2290690C1 (ru) 2006-12-27

Family

ID=37437385

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2005109959/09A RU2290690C1 (ru) 2005-04-06 2005-04-06 Способ поиска и разметки данных информации

Country Status (1)

Country Link
RU (1) RU2290690C1 (ru)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2544774C2 (ru) * 2009-05-19 2015-03-20 Майкрософт Корпорейшн Навигация в приложении базы данных
RU2606585C2 (ru) * 2010-09-01 2017-01-10 Функе Диджитал Тв Гайд Гмбх Преобразование контента для не требующих вмешательства развлечений

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2544774C2 (ru) * 2009-05-19 2015-03-20 Майкрософт Корпорейшн Навигация в приложении базы данных
RU2606585C2 (ru) * 2010-09-01 2017-01-10 Функе Диджитал Тв Гайд Гмбх Преобразование контента для не требующих вмешательства развлечений

Also Published As

Publication number Publication date
RU2005109959A (ru) 2006-10-20

Similar Documents

Publication Publication Date Title
US8978033B2 (en) Automatic method and system for formulating and transforming representations of context used by information services
US9348872B2 (en) Method and system for assessing relevant properties of work contexts for use by information services
US8745051B2 (en) Resource locator suggestions from input character sequence
WO2008052239A1 (en) Email document parsing method and apparatus
JP2003529845A (ja) ネットワーク経由の多言語翻訳を提供する方法と装置
Martins et al. Extracting and exploring the geo-temporal semantics of textual resources
CN104951508A (zh) 时间信息识别方法和装置
US20200218746A1 (en) Method and apparatus for presenting information
GB2420192A (en) Formulating and refining queries on structured data
JP4934355B2 (ja) 情報検索支援プログラム、情報検索支援機能を有するコンピュータ、サーバー・コンピュータ、プログラム格納媒体
Prys et al. Cysill ar-lein: A corpus of written contemporary welsh compiled from an on-line spelling and grammar checker
Semaan et al. Toward enhancing web accessibility for blind users through the semantic web
RU2290690C1 (ru) Способ поиска и разметки данных информации
JP2016066232A (ja) 回答検索システム、データ送受信装置及び回答検索装置
Azab et al. An NLP-based reading tool for aiding non-native English readers
Jahan et al. A pronoun replacement-based special tagging system for bengali language processing (blp)
CN106776533B (zh) 用于分析一段文本的方法和系统
Elliott et al. Rationale for a multilingual corpus for machine translation evaluation
Barrick et al. Phrasing in reproducible search methodology: the consequences of straight and curly quotation marks
KR102594717B1 (ko) 검색키워드 다중 표기에 따른 우선순위 중심 선별문서 채택 시스템 및 그 구동방법
Šostaka et al. The Semi-Algorithmic Approach to Formation of Latvian Information and Communication Technology Terms.
EP1221082B1 (en) Use of english phonetics to write non-roman characters
Baranov Information-Analytical System" Manuscript": technologies and tools of creation of electronic collections of ancient and medieval documents
Kinyanjui Challenges of Competing neologisms a case of Kiswahili technical terminology
Aissing Computer-oriented bibliographic control for Cyrillic documents with or without script conversion

Legal Events

Date Code Title Description
MM4A The patent is invalid due to non-payment of fees

Effective date: 20070407

NF4A Reinstatement of patent

Effective date: 20100310

MM4A The patent is invalid due to non-payment of fees

Effective date: 20110407