RU2096825C1 - Device for information processing for information retrieval - Google Patents
Device for information processing for information retrieval Download PDFInfo
- Publication number
- RU2096825C1 RU2096825C1 RU96119820A RU96119820A RU2096825C1 RU 2096825 C1 RU2096825 C1 RU 2096825C1 RU 96119820 A RU96119820 A RU 96119820A RU 96119820 A RU96119820 A RU 96119820A RU 2096825 C1 RU2096825 C1 RU 2096825C1
- Authority
- RU
- Russia
- Prior art keywords
- block
- output
- input
- memory
- unit
- Prior art date
Links
Images
Abstract
Description
Изобретение относится к техническим средствам информатики и вычислительной техники и может быть использовано для решения задач символьной обработки текстовой информации и предварительной обработки текстовых данных для информационного поиска. The invention relates to technical means of computer science and computer technology and can be used to solve problems of symbolic processing of text information and preliminary processing of text data for information retrieval.
Известно устройство для реализации продукции, содержащее блок памяти слов и узел сравнения [1]
Указанное устройство имеет следующие недостатки: при изменении предметной области или тематической направленности обрабатываемой текстовой информации устройство требует значительных затрат ручного труда для формирования продукционных правил, составляющих содержание узла сравнения и определяющих область применимости устройства; результат обработки не может быть использован для поиска необходимой текстовой информации.A device for selling products containing a memory block of words and a comparison node [1]
The specified device has the following disadvantages: when changing the subject area or thematic focus of the processed text information, the device requires significant manual labor for the formation of production rules that make up the content of the comparison node and determine the applicability of the device; the processing result cannot be used to search for the necessary textual information.
Наиболее близким к предложенному по технической сущности является устройство для информационного поиска, содержащее блок сопряжения с памятью, память исходного массива, блок ввода-вывода, наборное поле, блок отображения, буферную память ввода-вывода, блок управления, буферную память, магистральную шину, включающую шины адресную, информационную и управляющую [2]
Указанное устройство имеет следующие недостатки: для задействования устройства исходный массив текстовой информации необходимо преобразовывать к специальному виду, используемому в устройстве; результат обработки информации не может быть использован в качестве аннотации к обработанному тексту и, кроме того, устройство не может обеспечить возможность выборки данных, а предназначено для предварительной обработки информации в поисковых системах.Closest to the proposed technical essence is a device for information retrieval, comprising a memory interface unit, a source array memory, an input-output unit, a type-setting field, a display unit, an input-output buffer memory, a control unit, a buffer memory, a trunk bus including address, information and control buses [2]
The specified device has the following disadvantages: to activate the device, the initial array of text information must be converted to a special form used in the device; the result of information processing cannot be used as an annotation to the processed text and, in addition, the device cannot provide the ability to select data, but is intended for preliminary processing of information in search engines.
Анализ существующих устройств обработки массивов текстовой информации показывает, что полностью исключить участие оператора устройства из процесса обработки неизвестной ранее текстовой информации, оформленной в виде входного потока, не представляется возможным. Однако принципиально возможна автоматизация процесса символьной обработки информации отдельных текстовых массивов, отличающихся определенной целостностью, например отдельная статья тематического сборника, отдельная глава сложного документа и т.п. Analysis of existing devices for processing arrays of textual information shows that it is not possible to completely exclude the participation of the device operator from the process of processing previously unknown textual information in the form of an input stream. However, it is fundamentally possible to automate the process of symbolic processing of information of individual text arrays that are distinguished by a certain integrity, for example, a separate article in a thematic collection, a separate chapter in a complex document, etc.
Целью изобретения является расширение области применения и функциональных возможностей устройства обработки информации за счет обеспечения возможности обработки и поиска текстовой информации различной тематической и смысловой направленности, а также автоматической адаптации устройства к изменению предметной области обрабатываемой информации на основе исключения человека из процесса первичного анализа, чтения, аннотирования и каталогизации текстовых фрагментов, являющихся составными частями входного потока текстовой информации и характеризующихся смысловой и структурной замкнутостью. The aim of the invention is to expand the scope and functionality of the information processing device by providing the ability to process and search text information of various thematic and semantic directions, as well as automatically adapt the device to change the subject area of the processed information based on the exclusion of a person from the process of primary analysis, reading, annotation and cataloging of text fragments that are components of the input stream of text information and characterized by semantic and structural insularity.
Была поставлена задача: автоматизировать процесс анализа неизвестной ранее текстовой информации с выявлением наиболее характерных для данного текста слов и словосочетаний с учетом их повторяемости, которые в совокупности могут рассматриваться как схематическое отображение тематики и смысловой направленности текста и позволяют, с одной стороны, заменить собой аннотацию к тексту, а с другой стороны, обеспечить автоматизированный поиск необходимой текстовой информации. The task was set: to automate the analysis of previously unknown textual information with the identification of the most characteristic words and phrases for a given text, taking into account their repeatability, which together can be considered as a schematic representation of the subject and semantic direction of the text and allow, on the one hand, to replace the annotation to text, and on the other hand, provide an automated search for the necessary textual information.
Поставленная цель достигается тем, что в устройство, содержащее блок сопряжения с памятью, блок ввода-вывода, буферную память ввода-вывода, блок управления, буферную память, блок отображения, входы и выходы которых соединены через магистральную шину друг с другом, память исходного массива, выход которой соединен с входом блока сопряжения с памятью, наборное поле, выход которого соединен с входом блока ввода-вывода, введены блок синтеза текстовых фрагментов, блок структурного анализа текстового фрагмента, блок символьной обработки текстового фрагмента, блок корректировки словаря словосочетаний, блок синтеза первичного словаря, блок фильтрации первичного словаря, блок синтеза вторичных словарей, блок анализа вторичных словарей, блок синтеза архивной карточки, блок архивации текстовых фрагментов, блок корректировки системных словарей, память архивной карточки, входы и выходы которых соединены через магистральную шину друг с другом, при этом вход блока отображения соединен с выходом блока ввода-вывода. This goal is achieved in that in a device containing a memory interface unit, an input-output unit, an input-output buffer memory, a control unit, a buffer memory, a display unit, the inputs and outputs of which are connected to each other via a bus, the memory of the original array whose output is connected to the input of the memory interface unit, a typesetting field, the output of which is connected to the input of the input-output unit, a block for synthesizing text fragments, a block for structural analysis of a text fragment, a block for character processing of texts of the second fragment, correlation dictionary adjustment block, primary dictionary synthesis block, primary dictionary filtering block, secondary dictionary synthesis block, secondary dictionary analysis block, archive card synthesis block, text fragment archiving block, system dictionary correction block, archive card memory, inputs and outputs which are connected via a bus to each other, while the input of the display unit is connected to the output of the input-output unit.
Блок-схема устройства обработки информации для информационного поиска представлена на фиг.1; на фиг.2 13 представлены функциональные схемы следующих блоков устройства: синтез текстовых фрагментов на фиг.2; структурного анализа текстового фрагмента на фиг.3; символьной обработки текстового фрагмента на фиг.4; корректировки словаря словосочетаний на фиг.5; синтеза первичного словаря на фиг.6; фильтрации первичного словаря - на фиг.7; синтеза вторичных словарей на фиг.8; анализа вторичных словарей - на фиг.9; синтеза архивной карточки на фиг.10; архивации текстовых фрагментов на фиг.11; корректировки системных словарей на фиг.12; память архивной карточки на фиг.13. The block diagram of the information processing device for information retrieval is presented in figure 1; figure 2 13 presents the functional diagrams of the following blocks of the device: the synthesis of text fragments in figure 2; structural analysis of the text fragment in figure 3; symbolic processing of the text fragment in figure 4; corrections dictionary collocations in figure 5; synthesis of the primary dictionary in Fig.6; filtering the primary dictionary - in Fig.7; synthesis of secondary dictionaries in Fig; analysis of secondary dictionaries - figure 9; synthesis of the archive card of figure 10; archiving text fragments in figure 11; adjusting system dictionaries in FIG. 12; memory archive card on Fig.
Идентификаторы, использованные для описания структуры указанных блоков, представлены в табл. 1. Краткое описание функционального назначения блоков устройства, представленных на схемах фиг.1 13, приведено в табл. 2. The identifiers used to describe the structure of these blocks are presented in table. 1. A brief description of the functional purpose of the blocks of the device shown in the diagrams of Fig.1 13 are given in table. 2.
Устройство содержит блок сопряжения с памятью 1, память исходного массива 2, блок ввода-вывода 3, наборное поле 4, блок отображения 5, буферную память ввода-вывода 6, блок управления 7, буферную память 8, блок синтеза текстовых фрагментов 9, блок структурного анализа текстового фрагмента 10, блок символьной обработки текстового фрагмента 11, блок корректировки словаря словосочетаний 12, блок синтеза первичного словаря 13, блок фильтрации первичного словаря 14, блок синтеза вторичных словарей 15, блок анализа вторичных словарей 16, блок синтеза архивной карточки 17, блок архивации текстовых фрагментов 18, блок корректировки системных словарей 19, память архивной карточки 20, магистральную шину 21, включающую шины адресную, информационную и управляющую. The device comprises a
Устройство работает следующим образом. The device operates as follows.
Процесс обработки информации и формирования архивной карточки работает на два этапа. На первом этапе устройство функционирует под управлением человека оператора устройства, на втором этапе проводится автоматическая обработка информации. The process of processing information and forming an archive card works in two stages. At the first stage, the device operates under the control of a human operator of the device, at the second stage, automatic processing of information is carried out.
Этап 1.
Устройство по схеме 1 работает в режиме 1 (этап 1) следующим образом. The device according to
Оператор устройства формирует в блоке 4 команду активизации (перевода в режим выполнения поступающих команд управления) устройства в режиме 1. С выхода блока 4 на вход блока 3 поступает сигнал начала работы устройства в режиме 1. Из блока 3 по магистральной шине 21 сигнал поступает на вход блока 7, где он преобразуется в последовательность команд управления устройством. Под управлением блока 7 исходная информация из блока 2 передается в блок 1, который формирует выходной информационный сигнал, поступающий по магистральной шине 21 на входы блоков 6 и 8. Блок 3 снимает сигнал с выхода блока 6 и направляет его на вход блока 5. The device operator generates in block 4 a command to activate (transfer to the execution mode of incoming control commands) the device in
Оператор устройства анализирует в блоке 5 структуру исходной информации и формирует в блоке 4 одну из двух команд: команду поиска структурных признаков текстовых фрагментов или команду формирования очередного текстового фрагмента. С выхода блока 4 сигналы указанных команд поступают на вход блока 3, с выхода которого сигнал по магистральной шине 21 поступает в блок 7. Блок 7 преобразует поступившие сигналы в команды управления устройством и передает их по магистральной шине 21 в блоки 3 и 9, одновременно подавая на вход блока 3 сигнал, устанавливающий блокировку на выполнение команд, полученных блоком 3, до получения разрешающей команды из блока 9. Блок 9 в зависимости от поступившего на его вход сигнала из блока 7 либо считывает сигнал части исходной информации из блока 8 и формирует на выходе информационный сигнал очередного текстового фрагмента, либо преобразует сигналы блока 6 и выдает на вход блока 3 по магистральной шине 21 разрешающую команду снятия блокировки. Блок 3 считывает с выхода блока 6 информационный сигнал и подает его на вход блока 5. The device operator analyzes in
После создания последнего текстового фрагмента блок 9 формирует команду завершения работы и передает ее по магистральной шине 21 на вход блока 7. Блок 7 выдает команду считывания информационных сигналов текстовых фрагментов с выхода блока 9 на вход блока 8, параллельно записывая в блок 8 сигналы адресных данных для доступа к полученным информационным сигналам, и завершает работу устройства в режиме 1. After creating the last text fragment,
При формировании в блоке 4 команд управления работой устройства в режиме 1 оператор устройства руководствуется следующими структурными признаками текстовых фрагментов:
наличие одной и более строк, содержащих символы, воспринимаемые блоком 3 при обработке информационных сигналов, поступающих с выхода блока 8 по магистральной шине 21 как печатный аналог символа "пробел";
сигнал конца цепочки символов, составляющих исходную информацию.When generating
the presence of one or more lines containing characters perceived by
a signal of the end of a string of characters constituting the source information.
Правила выделения определенной части информационного сигнала исходной информации в очередной текстовый фрагмент определяются оператором устройства и имеют тривиальный смысл: отдельная глава документа, отдельный абзац, отдельная статья сборника статей и т.п. The rules for highlighting a certain part of the information signal of the initial information in the next text fragment are determined by the device operator and have a trivial meaning: a separate chapter in a document, a separate paragraph, a separate article in a collection of articles, etc.
Этап 2.
Устройство по схеме 1 работает в режиме 2 (этап 2) следующим образом. The device according to
Оператор устройства формирует в блоке 4 команду активизации устройства в режиме 2. С выхода блока 4 на вход блока 3 поступает сигнал начала работы устройства в режиме 2. С выхода блока 3 по магистральной шине 21 сигнал передается на вход блока 7, где он преобразуется в последовательность команд управления устройством. Блок 7 последовательно активизирует блоки 10-19 путем подачи команд управления на входы указанных блоков. Сигнал результата работы устройства (архивная карточка текстового фрагмента) подается на вход блока 20, где он записывается для дальнейшего использования. The device operator generates in block 4 a command to activate the device in
На вход блока 10 по магистральной шине 21 подается сигнал информации текстового фрагмента с выхода блока 8, с выхода блока 10 на вход блока 8 поступают информационные сигналы о наличии во входных данных строк с определенным процентным содержанием цифровых символов, а также сигналы символьного информационного массива заданной длины. Сигнал структуры указанных выходных данных запоминается в блоке 10 при настройке устройства. Настройка устройства осуществляется до начала его работы. An input signal of a text fragment from the output of
На вход блока 11 с выхода блока 8 по магистральной шине 21 подается сигнал исходной информации текстового фрагмента. В блоке 11 проводится обработка входных сигналов, соответствующая декомпозиции исходной информации на отдельные слова и словосочетания (совокупность слов, ограниченных в информации исходного текста кавычками). С выхода блока 11 на вход блока 8 поступает сигнал информационного массива, структура которого позволяет считывать из блока 8 отдельное слово или словосочетание, а также различать при поиске слова и словосочетания, при этом в память блока 8 записываются сигналы данных о количестве строк и слов обработанной информации текстового фрагмента. At the input of
На вход блока 12 по магистральной шине 21 последовательно поступают сигналы словосочетаний из информационного массива блока 8, сформированного блоком 11. В блоке 12 проводится сравнение сигналов количества символов в считанной из блока 8 информации с эталонным сигналом, запоминаемым в блоке 12 при настройке устройства. При превышении сигналом количества символов эталонного значения сигнал считанной из блока 8 информации подвергается в блоке 12 обработке, соответствующей декомпозиции словосочетаний на отдельные слова. Результаты обработки информационных сигналов в блоке 12 запоминаются в его информационном массиве, структура которого позволяет проводить поиск нужного слова и хранить кроме символьной информации также числовую, привязанную с помощью адресации данных к конкретному слову. Указанный сигнал информационного массива с выхода блока 12 поступает на вход блока 8. Одновременно в блок 8 с выхода блока 12 поступает идентификационный код указанного информационного массива (информационный сигнал объемом в 1 символ), при анализе которого в блоке 7 может быть считана из памяти блока 7 последовательность команд управления, соответствующая конкретному варианту обработки указанного информационного сигнала. The input of
На вход блока 13 по магистральной шине 21 с выхода блока 8 поступает сигнал информационного массива, записанный в блок 8 с выхода блока 12. Блок 13 формирует сигнал нового информационного массива той же структуры, но не содержащий одинаковых слов и словосочетаний. Сигналы числовых данных, привязанных к каждому слову указанного информационного массива, содержат информацию о количестве таких слов в сигнале входной информации блока 13. С выхода блока 13 сигнала поступают на вход блока 8. The input of
На вход блока 14 по магистральной шине 21 поступает сигнал информационного массива с выхода блока 8, записанный в блок 8 с выхода блока 13. Блок 14 предназначен для формирования сигнала нового информационного массива той же структуры, который поступает на вход блока 8. В блоке 14 формируется сигнал, соответствующий результату операции удаления из входного информационного массива информации о тех словах, которые совпадают со словами информационного массива той же структуры, записываемого в память блока 14 при настройке устройства. Если сигнал слова из входной информации блока 14 удовлетворяет условиям сравнения со словами внутренней памяти блока, данные о нем не попадают в выходной информационный массив. Операция сравнения проводится в два этапа. На первом этапе сигналы слов сравниваются по схеме полного совпадения, на втором этапе сигналы слов из входной информации оцениваются на предмет совпадения символьной структуры слов (например, последовательности символов "работали" и "работ." совпадают по символьной структуре; здесь и далее последовательность символов "." воспринимается соответствующими блоками устройства как "последовательность любого количества любых символов"). At the input of
На вход блока 15 по магистральной шине 21 поступает сигнал информационного массива с выхода блока 8, записанный в блок 8 с выхода блока 14. В блоке 15 проводится обработка входного информационного сигнала, соответствующая разделению данных входного информационного массива на четыре независимых информационных массива той же структуры. Сигнал каждого слова из входной информации проходит в блоке 15 посимвольную обработку на предмет выяснения вида каждого символа ("строчный", "прописной", "цифровой", "алфавитный", "специальный", "значимый", "пробел"). Сигналы слов, состоящих только из цифровых и специальных символов, исключаются из дальнейшей обработки. Сигналы оставшихся слов (и данные им соответствующие) суммируются с сигналами одного из выходных информационных массивов: "имена собственные", "аббревиатуры", "кавычки", "рядовые слова". С выхода блока 15 информационный сигнал подается на вход блока 8. At the input of
На вход блока 16 по магистральной шине 21 последовательно подаются сигналы информационных массивов с выхода блока 8, записанные в блок 8 с выхода блока 15 в порядке их расположения в адресном пространстве блока 8. Блок 16 анализирует сигнал идентификационного кода информационного массива, который считывается с выхода блока 8, и выполняет в зависимости от значения идентификационного кода один из трех вариантов обработки входного информационного сигнала. Первый вариант обработки заключается в считывании входного сигнала и записи его в один из выходных информационных массивов, два остальных варианта основаны на выделении из сигнала слова последовательности символов основы слова (путем удаления символов суффиксов и окончаний и замены их последовательностью символов ".") и проведения оценки совпадения символьной структуры полученной последовательности символов с сигналами оставшихся слов текущего информационного массива. Сигналы сформированных в блоке 16 шести информационных массивов с выхода блока 16 подаются на вход блока 8. At the input of
На вход блока 17 по магистральной шине 21 с выхода блока 8 подаются следующие сигналы: шести информационных массивов, записанные в блок 8 с выхода блока 16, результатов структурного анализа текстового фрагмента, записанные в блок 8 с выхода блока 10, обобщенных данных результатов символьной обработки текстового фрагмента, записанные в блок 8 с выхода блока 11 и идентифицированной информации текстового фрагмента, записанные в блок 8 с выхода блока 9. Блок 17 формирует выходной сигнал адреса для хранения в памяти блока 20 новой архивной карточки, проводит адресацию входной информации для информационного поиска, формирует выходной информационный сигнал новой архивной карточки и сформированные выходные сигналы со своего выхода подает на вход блока 20. Параллельно с выхода блока 17 на вход блока 7 подается сигнал формирования команды записи информации в блок 20. The following signals are sent to the input of
На вход блока 18 по магистральной шине 21 с выхода блока 8 подается сигнал исходной информации текстового фрагмента, а с выхода блока 20 сигнал идентификационной информации текстового фрагмента. Блок 18 проводит обработку входных сигналов, соответствующую операциям: определения адреса архивной области блока 8 для хранения текстового фрагмента, проверки ее существования и при необходимости ее создания и идентификации, сжатия исходной информации. С выхода блока 18, кроме информационного сигнала сжатой исходной информации, который подается на вход блока 8, снимается также сигнал адреса хранения в блоке 8 сигнала сжатой исходной информации, который подается на вход блока 20. The input of
На вход блока 19 по магистральной шине 21 с выхода блока 8 подается сигнал идентификационной информации текстового фрагмента, по результатам обработки которого в блоке 19 определяется адрес доступа к последней архивной карточке, при этом выходной сигнал адреса с выхода блока 19 поступает на вход блока 7. Блок 7 формирует команду чтения архивной карточки и вместе с сигналом адреса доступа к карточке направляет ее на вход блока 20. Параллельно блок 7 подает на вход блока 8 управляющий сигнал подготовки для записи области системных словарей блока 8. С выхода блока 20 снимаются сигналы шести информационных массивов, записанных в блок 20 с выхода блока 17. Информационные сигналы с выхода блока 20 подаются на вход блока 19. Блок 19 выполняет операции обработки входных информационных сигналов, соответствующие преобразовыванию входной информации к виду списка слов без какой-либо дополнительной числовой информации, и сформированный информационный сигнал с его выхода поступает на вход блока 8. После выполнения этой операции блок 19 подает на вход блока 7 команду завершения работы устройства. Блок 7 формирует последовательность команд управления, соответствующих очистке памяти блока 8, за исключением областей памяти системных словарей и архивных областей хранения сигналов сжатой информации текстовых фрагментов, и после выполнения указанной последовательности команд завершает работу устройства. The input of
При составлении функциональных схем блоков устройства фиг.2-13 использован следующий порядок нумерации блоков устройства. Если блок имеет составной номер, то его расшифровка осуществляется следующим образом:
составной номер блока аа.bb.cc,
где аа номер типового блока из табл. 1;
bb номер фигуры;
сс порядковый номер типового блока на фигуре.When drawing up functional block diagrams of the device of FIGS. 2-13, the following order of numbering of device blocks is used. If the block has a composite number, then its decryption is carried out as follows:
composite block number aa.bb.cc,
where aa is the type block number from the table. one;
bb figure number;
ss is the serial number of the type block in the figure.
Если блок имеет простой, а не составной номер, то это означает, что данный блок не является типовым и встречается в составе устроойства только раз. If the block has a simple rather than a composite number, then this means that this block is not typical and occurs only once in the device.
Команды управления из блока 7 на схемах фиг.2 13 передаются следующим блокам устройства: 22, 23, 25-30, 32-38, 40-49, 51-59, 61, 63-65. The control commands from
Управляющие входы вышеуказанных блоков на схемах фиг.2-13 не указаны. The control inputs of the above blocks in the diagrams of Figures 2-13 are not indicated.
Наиболее важными и принципиальными с точки зрения технической сущности устройства являются блоки 15, 16, 17 и 20. Опишем подробно работу этих блоков. The most important and fundamental from the point of view of the technical essence of the device are
Блок синтеза вторичных словарей (блок 15) по схеме фиг.8 работает следующим образом. Входами блока 15 являются входы блоков 39.8.1, 38.8.1, 26.8.1, 46 и 63, 47. Выходами блока 15 являются выходы блоков 39.8.2, 39.8.3, 39.8.4 и 39.8.5. Сигнал входного информационного массива поступает на вход блока 39.8.1 и запоминается в нем. Методом прямого перебора из блока 39.8.1 на вход блока 38.8.1 последовательно подаются информационные сигналы записей (структурных единиц информации) блок памяти слов (БПС) следующей структуры: сигнал слова БПС, сигнал числового поля, сигнал типа слова. В зависимости от величины сигнала типа слова сигнал входной информации записи БПС с выхода блока 38.8.1 подается на вход блоков 39.8.2 или 31.8.1. С выхода блока 31.8.1 сигнал слова БПС поступает на вход блока 26.8.1. С выхода блока 26.8.1 сигнал слова БПС посимвольно подается на входы блоков 63 и 36.8.1. В случае успешного сравнения сигналов в блоке 63 с выхода указанного блока на вход блока 7 подается управляющий сигнал, а управление передается блоку 36.8.1 путем подачи на вход последнего специальной команды с выхода блока 7. Выходной сигнал блока 47 в зависимости от значения сигнала числового поля цифровой составляющей входного сигнала этого блока, формируемой блоком 46 на основе выходного сигнала блока 36.8.1, передается в один из следующих блоков: 39.8.3, 39.8.4, 39.8.5. Перед формированием выходного сигнала блок 47 считывает в свою внутреннюю память в качестве основы для формирования выходного сигнала информационный сигнал с выхода блока 31.8.1. После завершения работы блока 15 выходные информационные сигналы блоков 39.8.2, 39.8.3, 39.8.4 и 39.8.5 подаются на вход блока 8. Block synthesis of secondary dictionaries (block 15) according to the scheme of Fig.8 works as follows. The inputs of
Блок анализа вторичных словарей (блок 16) по схеме фиг.9 работает следующим образом. Входом блока 16 является вход блока 48. Выходами блока 16 являются объединенные выходы блоков 39.9.4, 39.9.5, 39.9.6, 39.9.7, 39.9.8 и 39.9.9. Методом прямого перебора на вход блока 48 с выхода блока 8 подаются сигналы хранимых в памяти блока 8 информационных массивов структуры БПС. В зависимости от величины сигнала идентификационного кода сигнала БПС, анализируемого в блоках 48 и 53, входной информационный сигнал блока 48 без изменений поступает на вход блоков 39.1.1, 39.9.3 или 39.9.4, что соответствует типам сигналов информационных массивов БПС соответственно "рядовые слова", "аббревиатура" и "имена собственные", "кавычки". Блок 39.9.4 является исходной точкой первой схемы обработки сигнала БПС в блоке 16, которая соответствует подаче входного информационного сигнала без изменений на выход блока 16. Блок 39.9.1. является исходной точкой второй схемы обработки сигнала БПС в блоке 16, блок 39.9.3 исходной точкой третьей схемы обработки. Block analysis of secondary dictionaries (block 16) according to the scheme of Fig.9 works as follows. The input of
Все три указанные схемы обработки сигналов БПС реализуются за счет выдачи с выхода блока 7 последовательности управляющих сигналов на входы соответствующих блоков. С выхода блока 39.9.1 сигнал записи БПС поступает на вход блока 31.9.1. С первого выхода блока 31.9.1 сигнал слова БПС поступает на вход блока 49.9.1, где он подвергается обработке, соответствующей преобразованию в сигнал шаблона для сравнения символьной структуры последовательностей символов. Сигнал шаблона с выхода блока 49.9.1 поступает на первый вход блока 45.9.1, в котором запоминается. После этого с второго выхода блока 39.9.1 методом прямого перебора снимаются сигналы записей БПС, которые подаются для сравнения символьной структуры на второй вход блока 45.9.1. Выходные сигналы блока 45.9.1 поступают на вход блоков 41.9.1 и 31.9.2. С выхода блока 31.9.2. слово БПС подается на входы блоков 40.9.1 и 64. Блок 7 подает на входы указанных блоков последовательность управляющих сигналов, соответствующих выполнению операций удаления записи из БПС блока 39.9.1 (в блоке 40.9.1) и выбора слова с минимальным количеством символов, сигнал которого запоминается в памяти блока 64. Параллельно в блоке 41.9.1 накапливается сигнал суммы числовых полей удаленных записей. После исчерпания записей блока 39.9.1 выходной сигнал блока 41.9.1 подается на вход блока 51 для сравнения с эталонным сигналом, запоминаемым в памяти блока 51 при настройке устройства. В зависимости от результатов сравнения блок 51 выдает на вход блока 7 один из двух возможных управляющих сигналов, которые, будучи обработаны в блоке 7, приводят к формированию на выходе блока 7 одной из двух возможных последовательностей команд управления, которые подаются на вход блоков соответственно 50 или 39.9.2. В первом случае блок 50 формирует на основании выходных сигналов блоков 64 и 51 сигнал записи БПС и подает его на вход блока 39.9.5. Во втором случае сигнал записи БПС формируется в блоке 39.9.2 на основе выходных сигналов блоков 31.9.1 и 51, при этом с второго выхода блока 31.9.1 снимается только сигнал слова БПС. Сформированный в блоке сигнал записи БПС записывается в память блока 39.9.2 как структурная единица информационного сигнала БПС, хранимого в данном блоке. После этого указанная выше последовательность операций первой схемы обработки БПС в блоке 16 циклически повторяется до исчерпания сигналов записей блока 39.9.1. После исчерпания сигналов записей блока 39.9.1 методом прямого перебора сигналы записей БПС блока 39.9.2 совместно с сигналом основы слова, сформированным в блоке 49.9.2 на основе выходного сигнала блока 39.9.2 со сдвоенного выхода этих блоков, подается на вход блока 52. В блоке 52 сигнал числового поля записи БПС сравнивается с эталонным сигналом, запоминаемым в блоке 52 при настройке устройства. В зависимости от результатов сравнения сигнал основы слова БПС суммируется с сигналом последовательности символов, запоминаемой в одной из областей памяти блока 52. После суммирования в блоке 52 формируется сигнал количества символов в полученной последовательности символов. При превышении величины указанного сигнала значения эталонного сигнала, запоминаемого в памяти блока 52 при настройке устройства, формируется сигнал записи БПС из указанной последовательности символов и сигнала числового поля записи БПС блока 39.9.2. Сформированный сигнал в зависимости от величины сигнала числового поля записи БПС блока 39.9.2 подается на вход блоков 39.9.6 или 39.9.7. All three of these BPS signal processing schemes are implemented by issuing from the output of block 7 a sequence of control signals to the inputs of the respective blocks. From the output of block 39.9.1, the recording signal of the BTS is fed to the input of block 31.9.1. From the first output of block 31.9.1, the word of the BTS word is fed to the input of block 49.9.1, where it is subjected to processing corresponding to conversion into a template signal for comparing the character structure of sequences of characters. The signal of the template from the output of block 49.9.1 is fed to the first input of block 45.9.1, in which it is stored. After that, from the second output of block 39.9.1, the signals of BTS records are taken by direct enumeration, which are fed to compare the character structure to the second input of block 45.9.1. The output signals of block 45.9.1 are input to blocks 41.9.1 and 31.9.2. From the output of block 31.9.2. the word BPS is fed to the inputs of blocks 40.9.1 and 64.
Вторая схема обработки сигналов записей БПС блока 16 аналогична первой с той разницей, что из цепочки взаимодействующих блоков исключены типовые блоки 50, 51 и 64, и соответственно отсутствию выходного сигнала блока 51 во второй схеме не используются блоки, аналогичные по выполняемым операциям блокам 39.92, 49.9.2, 52, 39.9.6 и 39.9.7. При этом выходной сигнал блока 41.9.2 подается на вход блока 31.9.4 и записывает сигнал числовой составляющей во все числовые поля блока, с выхода блока 31.9.4 на вход блока 40.9.2 подаются сигналы всех записей блока 31.9.4, а с выхода блока 31.9.4 на вход блоков 39.9.8 и 39.9.9 подается только сигнал первой записи блока 31.9.4. После завершения работы блока 16 выходные информационные сигналы блоков 39.9.4 39.9.9 подаются на вход блока 8. The second BPS record signal processing circuit of
Блок синтеза архивной карточки (блок 17) по схеме фиг. 10 работает следующим образом. Входами блока 17 являются входы блоков 39.10.1 39.10.6, 31.10.1, 31.10.2 и 65. Выходом блока 17 является выход блока 65. В блоке 65 формируется сигнал адреса новой архивной карточки, проводится адресация всех поступивших на вход блока 17 информационных массивов. Адресация основана на синтезе уникального кода, имеющего гарантию неповторяемости в рамках одного устройства обработки информации. Выходной информационный сигнал блока 56 подается на вход блока 20. Одновременно на вход блока 7 с выхода блока 65 подается команда записи информации в блок 20 и команда блокировки начала процесса записи информационных сигналов в блок 20 до получения разрешающего сигнала с выхода блока 7. Запись информационного сигнала в память блока 20 осуществляется под управлением блока 7. The archive card synthesis unit (block 17) according to the circuit of FIG. 10 works as follows. The inputs of
Память архивной карточки (блок 20) по схеме фиг. 13 работает следующим образом. Входами блока 20 являются входы блоков 61 и 62. Выходом блока 20 является выход блока 62, при этом в зависимости от сигнала на входе блока 61 на вход блока 62 подается либо сигнал адреса архивной карточки, либо сигнал информационного массива, формируемый на выходе блока 65 (см. фиг. 10). Информационный сигнал блока 62 аналогичен по структуре выходному сигналу блока 65. The memory of the archive card (block 20) according to the circuit of FIG. 13 works as follows. The inputs of
Пример реализации устройства. An example implementation of the device.
Решение задачи предварительной обработки исходной информации с получением архивных карточек для дальнейшего осуществления автоматизированного поиска осуществляется следующим образом. В блок 2 устройства обработки информации для информационного поиска по фиг. 1 записывается сигнал исходной информации часть информационного потока агентства экономической информации:
В Санкт-Петербурге завершился 134-й международный пушной аукцион.The solution to the problem of preliminary processing of source information with obtaining archive cards for further automated search is as follows. In
The 134th international fur auction ended in St. Petersburg.
134-й международный пушной аукцион завершился в Санкт-Петербурге. Как сообщил корреспонденту ИТАР-ТАСС заместитель директора фирмы "Союзпушнина" Павел Голота, в торгах приняли участие 129 покупателей из 18 стран мира. Наибольшую активность традиционно проявили представители итальянских и английских фирм. The 134th international fur auction ended in St. Petersburg. As Pavel Golota, deputy director of Soyuzpushnina, told an ITAR-TASS correspondent, 129 buyers from 18 countries took part in the auction. Representatives of Italian and English firms traditionally showed the greatest activity.
Впервые в качестве покупателя на аукционе была представлена российская меховая фирма из Самары "Отрада", купившая 23 тысячи шкурок норки. Ожидается, что в следующем аукционе, запланированном на июнь нынешнего года, примут участие несколько десятков российских меховых предприятий. For the first time, the buyer was represented at the auction by the Russian fur company Otrada from Samara, which bought 23 thousand mink skins. It is expected that in the next auction, scheduled for June this year, several dozen Russian fur enterprises will take part.
Как сообщил корреспонденту ИТАР-ТАСС Павел Голота, фирма "Союзпушнина" получила разрешение Центробанка РФ на проведение валютных операций с российскими резидентами в конце декабря прошлого года, уже после завершения 133-го международного пушного аукциона. И многие российские меховые фирмы просто не знали о предоставившейся им возможности покупать пушнину за валюту внутри страны. Именно этим, по мнению Павла Голоты, объясняется отсутствие российских покупателей на нынешнем аукционе. As Pavel Golota told an ITAR-TASS correspondent, Soyuzpushnina received permission from the Central Bank of the Russian Federation to conduct foreign exchange transactions with Russian residents at the end of December last year, after the completion of the 133rd international fur auction. And many Russian fur companies simply did not know about the opportunity they had to buy furs for currency in the country. This, according to Pavel Golota, explains the absence of Russian buyers at the current auction.
Всего за два дня торгов продано 96 процентов выставленной на продажу пушнины на общую сумму восемь с половиной миллионов долларов США. Специалисты отмечают, что цены на все виды пушнины по сравнению с прошлым аукционом, состоявшимся в начале декабря прошлого года, выросли на 5 10 процентов. ВА/ИТ
Мировая цена на золото поднялась до самого высокого за 2,5 года уровня.In just two days of trading, 96 percent of the furs for sale totaling eight and a half million US dollars were sold. Experts note that prices for all types of furs compared with the last auction held in early December last year, increased by 5 10 percent. VA / IT
The world price of gold rose to its highest level in 2.5 years.
Считающаяся мировой цена на золото в Лондоне впервые за последние 2,5 года превысила рубеж в 400 долларов за унцию, достигнув 407,40 долларов за унцию /1 унция равна 31,1035 г/. The considered world price of gold in London for the first time in the last 2.5 years exceeded the milestone of $ 400 per ounce, reaching $ 407.40 per ounce / 1 ounce is equal to 31.1035 g /.
По мнению французской газеты "Фигаро-Экономи", признаком дальнейшего повышения цены на этот металл является тот факт, что австрийские производители золота воздержались от продаж. Обычно они выходят на рынок сразу, как только цена начинает расти. Из этого делается вывод, что повышенная тенденция на мировом рынке золота еще не достигла своего апогея. According to the French newspaper Figaro-Economi, a sign of a further increase in the price of this metal is the fact that Austrian gold producers refrained from sales. Usually they enter the market as soon as the price begins to rise. From this it is concluded that the increased trend in the global gold market has not yet reached its peak.
В то же время специалисты выражают сомнение относительно возможности удержания в течение длительного времени цены на уровне в 420 долларов за унцию или на более высоком уровне. В случае повышения цены до 440 долларов за унцию, считают они, начинается массовый приток "инвестиционного золота" из государств Ближнего и Среднего Востока, который может достичь 300 500 т, что неизбежно собьет цену. БЗ/ЛР/ВА/ИТ
Вступило в силу торговое соглашение между европейским союзом и Россией.At the same time, experts express doubt about the possibility of keeping prices for a long time at the level of $ 420 per ounce or at a higher level. If the price rises to $ 440 per ounce, they believe, a massive influx of "investment gold" from the countries of the Near and Middle East begins, which can reach 300 500 tons, which will inevitably bring down the price. BZ / LR / VA / IT
A trade agreement between the European Union and Russia entered into force.
Вступило в силу временное соглашение по торговле между Европейским союзом и Россией. Оно будет регулировать торговые отношения между ЕС и РФ до того, как закончится процесс ратификации "большого" Соглашения о партнерстве и сотрудничестве, подписанного президентом Борисом Ельциным летом 1994 года во время европейского саммита на о. Керкира /Корфу/. An interim trade agreement between the European Union and Russia has entered into force. It will regulate trade relations between the EU and the Russian Federation before the process of ratification of the "large" Partnership and Cooperation Agreement, signed by President Boris Yeltsin in the summer of 1994 during the European Summit on Fr. Kerkyra / Corfu /.
Объявляя об этом на брифинге, официальный представитель Европейской комиссии отметил, что "большое" соглашение уже ратифицировано Европарламентом и парламентами нескольких стран ЕС, но должно еще получить одобрение федерального Собрания РФ. Пока же временное соглашение позволит пятнадцати странам союза получить лучший выход на российский рынок с целым рядом товаров, в частности автомобилями и алкогольными напитками, надежнее защитить право интеллектуальной, промышленной и торговой собственности, подчеркнул этот представитель. ЕС, по его словам, ослабит ограничение на российский импорт в страны союза и смягчит в пользу России применяемые ныне по отношению к ней процедуры антидемпинга и коммерческой защиты. Announcing this at a briefing, the official representative of the European Commission noted that the "big" agreement has already been ratified by the European Parliament and the parliaments of several EU countries, but must still receive the approval of the Federal Assembly of the Russian Federation. In the meantime, the interim agreement will allow fifteen countries of the union to get the best access to the Russian market with a number of goods, in particular automobiles and alcoholic beverages, to more reliably protect the right of intellectual, industrial and commercial property, this representative emphasized. The EU, according to him, will ease the restriction on Russian imports to the Union countries and will soften in favor of Russia the anti-dumping and commercial protection procedures currently applied to it.
"Большое" Соглашение о партнерстве и сотрудничестве идет дальше торгово-экономических отношений. Оно предусматривает регулярный политический диалог, расширение культурных связей, свободу создания предприятий на территории друг друга, свободное движение капиталов и услуг и в перспективе установление зоны свободной торговли между партнерами. ВА/ИТ
В результате работы устройства в режиме 1 сформированы три текстовых фрагмента по количеству приведенных выше информационных сообщений.The "Big" Partnership and Cooperation Agreement goes beyond trade and economic relations. It provides for regular political dialogue, the expansion of cultural ties, the freedom to create enterprises on each other’s territories, the free movement of capital and services and, in the future, the establishment of a free trade zone between partners. VA / IT
As a result of the operation of the device in
В результате автоматической обработки сформированных текстовых фрагментов в режиме 2 получены три архивные карточки, которые могут быть использованы как аннотация к исходной информации и как поле исходных данных для информационного поиска необходимой информации по контексту (фиг. 14 16). As a result of automatic processing of the generated text fragments in
Таким образом, заявляемое устройство по сравнению с известным обладает более широкими функциональными возможностями и областью применения за счет возможности автоматизированной обработки широкого класса массивов исходной информации и способности к адаптации, что существенно расширяет круг решаемых задач, позволяет автоматизировать поиск необходимой информации и, следовательно, повышает производительность. Thus, the claimed device in comparison with the known has wider functionality and scope due to the possibility of automated processing of a wide class of arrays of source information and adaptability, which significantly expands the range of tasks, allows you to automate the search for the necessary information and, therefore, improves productivity .
Claims (5)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
RU96119820A RU2096825C1 (en) | 1996-10-14 | 1996-10-14 | Device for information processing for information retrieval |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
RU96119820A RU2096825C1 (en) | 1996-10-14 | 1996-10-14 | Device for information processing for information retrieval |
Publications (2)
Publication Number | Publication Date |
---|---|
RU2096825C1 true RU2096825C1 (en) | 1997-11-20 |
RU96119820A RU96119820A (en) | 1998-04-20 |
Family
ID=20186250
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU96119820A RU2096825C1 (en) | 1996-10-14 | 1996-10-14 | Device for information processing for information retrieval |
Country Status (1)
Country | Link |
---|---|
RU (1) | RU2096825C1 (en) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2000062196A1 (en) * | 1999-04-08 | 2000-10-19 | David Evgenievich Yang | Method for using auxiliary data blocks during the conversion and/or verification process of computer codes and of their corresponding originals |
WO2000063797A1 (en) * | 1999-04-20 | 2000-10-26 | David Evgenievich Yang | Method for the oriented location of regions in an initial data block and for the successive activation and processing of convertible computer codes therein |
WO2000070498A1 (en) * | 1999-05-12 | 2000-11-23 | David Evgenievich Yang | Method using recognition integrity, recognition task-orientation and adaptability for the conversion of computer codes during the process for recognising their corresponding image fragments |
WO2008079048A1 (en) * | 2006-12-26 | 2008-07-03 | Pavel Mikhaylovich Malyshev | Computerized method for converting the sequence of conforming computer codes requested by an information user and a system for carrying out said method |
EA012559B1 (en) * | 2008-04-08 | 2009-10-30 | Владимир Геннадьевич Матусов | Method of information search and device for processing information |
-
1996
- 1996-10-14 RU RU96119820A patent/RU2096825C1/en active
Non-Patent Citations (1)
Title |
---|
1. RU, патент, 2039375, кл.G 06F 17/00, 1995. 2. RU, патент, 2039376, кл.G 06F 17/30, 1995. * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2000062196A1 (en) * | 1999-04-08 | 2000-10-19 | David Evgenievich Yang | Method for using auxiliary data blocks during the conversion and/or verification process of computer codes and of their corresponding originals |
WO2000063797A1 (en) * | 1999-04-20 | 2000-10-26 | David Evgenievich Yang | Method for the oriented location of regions in an initial data block and for the successive activation and processing of convertible computer codes therein |
WO2000070498A1 (en) * | 1999-05-12 | 2000-11-23 | David Evgenievich Yang | Method using recognition integrity, recognition task-orientation and adaptability for the conversion of computer codes during the process for recognising their corresponding image fragments |
WO2008079048A1 (en) * | 2006-12-26 | 2008-07-03 | Pavel Mikhaylovich Malyshev | Computerized method for converting the sequence of conforming computer codes requested by an information user and a system for carrying out said method |
EA012559B1 (en) * | 2008-04-08 | 2009-10-30 | Владимир Геннадьевич Матусов | Method of information search and device for processing information |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2096825C1 (en) | Device for information processing for information retrieval | |
US20050065947A1 (en) | Thesaurus maintaining system and method | |
KR100288144B1 (en) | Foreign language coding method in Korean and search method using the same | |
JP3448895B2 (en) | Transaction processing equipment | |
JPH0750486B2 (en) | Keyword extractor | |
US20050209850A1 (en) | Voice retrieval system | |
RU2386167C1 (en) | Device of information processing for information searching | |
JP3065151B2 (en) | Standard naming system | |
KR102550868B1 (en) | verification system for achievements of faculty | |
Alian et al. | Using transliteration with entity resolution for Arabic datasets | |
JP2848225B2 (en) | Quantity / time expression processing method | |
JPS60584A (en) | Word recognition system | |
JP2839515B2 (en) | Character reading system | |
JPS61114387A (en) | Recognizer of on-line handwritten character | |
JPS59117673A (en) | Postprocessing system of character recognizing device | |
JPH05324731A (en) | Retrieval processing system for data | |
JPH0355874B2 (en) | ||
JP2622004B2 (en) | Character recognition device | |
JPH032923A (en) | Automatic programming system | |
JPH09282313A (en) | Person's name chinese character processing system | |
JPS6368989A (en) | Document reader | |
JPH08221434A (en) | Corpus preparing method | |
JPS5953985A (en) | Character recognizing device | |
JPH07249034A (en) | Character string extraction processor | |
JPH11231898A (en) | Speech synthesizing device and its control method |