RU2039376C1 - Устройство для информационного поиска - Google Patents

Устройство для информационного поиска Download PDF

Info

Publication number
RU2039376C1
RU2039376C1 SU5006225A RU2039376C1 RU 2039376 C1 RU2039376 C1 RU 2039376C1 SU 5006225 A SU5006225 A SU 5006225A RU 2039376 C1 RU2039376 C1 RU 2039376C1
Authority
RU
Russia
Prior art keywords
memory
unit
array
input
information
Prior art date
Application number
Other languages
English (en)
Inventor
Сергей Станиславович Ковалевский
Андрей Николаевич Малярский
Original Assignee
Сергей Станиславович Ковалевский
Андрей Николаевич Малярский
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Сергей Станиславович Ковалевский, Андрей Николаевич Малярский filed Critical Сергей Станиславович Ковалевский
Priority to SU5006225 priority Critical patent/RU2039376C1/ru
Application granted granted Critical
Publication of RU2039376C1 publication Critical patent/RU2039376C1/ru

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

Изобретение относится к вычислительной технике и может быть использовано для обработки информации. Целью изобретения является сокращение времени обработки информации большого объема. Устройство содержит блок 1 сопряжения с памятью, блок 2 ввода-вывода, память 3 промежуточного массива, блок 4 адресации, операционный блок 5, память 6 конечного массива, блок 7 управления, буферную память 8 ввода-вывода, буферную память 9, память 10 рабочего массива, блок 11 отображения, память 12 исходного массива, наборное поле 13, магистральную шину 14, включающую шины адресную, информационную и управляющую. Изобретение позволяет значительно сократить время обработки запроса за счет преобразования исходного массива в соответствии с установленными правилами. 2 ил.

Description

Изобретение относится к вычислительной технике и может быть использовано для обработки информации в поисковых системах.
Известно устройство, содержащее блок ввода, блок отображения, память отображения, блок управления, блок сортировки, блок адресации промежуточной памяти, промежуточную память, блок сравнения [1] Устройство позволяет достаточно быстро обрабатывать малоформатную информацию. Однако для обработки информации больших и сложных форматов в него требуется ввести большое количество дополнительного оборудования, что не только усложняет схему устройства, но и поставит под сомнение принципиальную возможность использования устройства для обработки больших объемов информации.
Известно устройство, содержащее операционный блок, блок сопряжения с памятью, память, буферную память, блок ввода-вывода, блок отображения, память отображения, группу блоков памяти [2] Устройство позволяет достаточно быстро обрабатывать информацию небольшого объема. Однако при значительном увеличении объемов обрабатываемой информации это устройство требует резкого увеличения времени обработки, что значительно снижает его эффективность.
Целью изобретения является значительное сокращение времени обработки информации большого объема и сложного формата.
Изобретение позволяет обеспечить практическую независимость времени поиска нужной информации по запросу от объема исходной информации, так как преобразование массива исходной информации в форму, удобную для поиска, производится только один раз для всего массива. По мере поступления новой информации в исходный массив производятся коррекции промежуточного массива.
Достигается это тем, что согласно изобретению, в устройство, содержащее блок ввода-вывода, блок управления, операционный блок, блок сопряжения с памятью, блок отображения, буферную память ввода-вывода, буферную память, соединенные двусторонними связями с магистральной шиной, введены память промежуточного массива, память рабочего массива, память конечного массива, блок адресации, соединенный двусторонними связями с магистральной шиной.
На фиг. 1, 2 показаны варианты выполнения устройства. Оно содержит блок 1 сопряжения с памятью, блок 2 ввода-вывода, память 3 промежуточного массива, блок 4 адресации, операционный блок 5, память 6 конечного массива, блок 7 управления, буферную память 8 ввода-вывода, буферную память 9, память 10 рабочего массива, блок 11 отображения, память 12 исходного массива, наборное поле 13, магистральную шину 14, включающую шины адресную, информационную и управляющую.
Устройство для обработки информации работает следующим образом. При помощи наборного поля 13 (клавиатуры) производится формирование кодового слова согласно установленному формату, а именно производится запись данных о некотором объекте. В этой записи выделены отдельные поля для фиксации характеристик заданных признаков объекта. Каждой записи присваивается порядковый номер. Таким образом каждая запись об объекте представляет собой некоторый вектор, состоящий из набора подвекторов (полей) заданной длины и номера вектора. Для осуществления такой записи используется, клавиатура 13, блок 2, блок 1 и память 12. Пересылки информации осуществляются по шине 14 под управлением блока 7. Таким образом накопление информации в памяти 12 производится в произвольном порядке по мере поступления. Сформированный исходный массив в памяти 12 позволяет производить поиск нужного слова в этой памяти только методом прямого перебора, что при достаточно большом числе записей и с учетом заданного числа полей в слове делает процедуру поиска практически неосуществимой. Чтобы решить задачу поиска в приемлемые сроки или вообще обеспечить возможность поиска, необходимо преобразовать исходный массив.
Процедура преобразования исходной информации состоит в формировании матричной таблицы всех записей по каждому из полей слова исходного массива. Каждая запись ("внутрипольная" запись) сопровождается порядковым номером соответствующего слова в исходном массиве. Для каждого поля формируется список, представляющий собой матрицу М из I, J элементов, каждый из которых является парой "значение/внутрисистемный номер".
"Значение" значение заданного поля, выбранное из записи под номером "внутрисистемный номер".
Очевидно, что никакие две записи в такой таблице не могут иметь одинаковый внутрисистемный номер.
Эта матрица М имеет следующие свойства, приобретенные в процессе ее построения:
число столбцов J по возможности близко к числу рядов I,
значение элемента V(i, j) в любом столбце меньше либо равно значению элемента V(i+1, j) в этом столбце,
если значение элемента V(i, j) оказалось равно значению элемента V(i+1, j), то внутрисистемный номер элемента V(i, j) строго меньше внутрисистемного элемента V(i+1, j),
значение последнего элемента любого j-го столбца V(m, j) меньше либо равно значению первого элемента (j+i)-го столбца V(i, j+1),
если значение m-го элемента j-го столбца оказалось равным значению i-го элемента (j+i)-го столбца, то внутрисистемный номер элемента V(m, j) строго меньше внутрисистемного номера элемента V(i, j+i).
Процедура построения матрицы осуществляется с помощью блока 1 памяти 12 блока 5, все пересылки производятся по ширине 14 под управлением блока 7 по алгоритму, приведенному на фиг. 2. Одновременно с формированием этого промежуточного массива и записью его в память 3 производится формирование таблицы адресов этого массива и ее запись в блок 4.
Поскольку запись соответствующего массива производится в матричной форме, то число сравнений при поиске в данной таблице уменьшается примерно в
Figure 00000002
раз, где N число записей в исходном массиве. Запрос с помощью клавиатуры 13 и блока 2 поступает через шину 14 в блок 5, куда с помощью блока 4 построчно передается информация из памяти 3, в блоке 5 производится определение соответствия заданным условиям результатов сравнения содержимого полей запроса и содержимого элементом матриц соответствующих полей из памяти 3. Выделенным элементам матрицы ставится в соответствие заданный признак, который заносится в память 10. Такая процедура производится по всем полям слова. Таким образом в памяти 10 будут помечены слова с признаками, указывающими на наличие идентичной информации слова запроса и слова исходной информации.
В зависимости от требований запроса определяется либо наиболее соответствующее запросу слово (группу слов) исходного массива, либо область слов, соответствующих запросу по тому или иному признаку. Это осуществляется в памяти 10 с помощью блока 7 и блока 5.
Таким образом сформированная в блоке 10 совокупность признаковых слов указывает на адреса записей исходного массива соответствующих условий поиска по запросу.
После этого слова, сформированные в блоке 10, используются как адреса для выборки записей из памяти 12. Считывание этих записей производится в память 6. Результаты поиска и вся промежуточная информация могут быть проконтролирована визуально с помощью блока 11 и памяти 8.
Наиболее значительные временные затраты производятся только при формировании промежуточного массива, но поскольку такая операция осуществляется только один раз на весь массив, а сравнение содержимого полей запроса с матрицами соответствующих полей промежуточного массива осуществляется одновременно и без сортировки, то время поиска практически не зависит от объема анализируемой информации, то есть имеется значительный выигрыш во времени по сравнению с известными методами и устройствами.
Блоки 5 и 7 могут быть реализованы на микросхеме К1816ВМ51. Все блоки оперативной памяти могут быть выполнены на микросхемах РУ5 и РУ7 или представлять собой отдельные сегменты в дисковой памяти.
Блоки ввода-вывода могут быть построены на микросхемах серии 555 или 1818.

Claims (1)

  1. УСТРОЙСТВО ДЛЯ ИНФОРМАЦИОННОГО ПОИСКА, содержащее блок ввода-вывода, блок управления, операционный блок, блок сопряжения с памятью, блок отображения, буферную память ввода-вывода, буферную память, соединенные двусторонними связями с магистральной шиной, память, соединенную двусторонней связью с блоком сопряжения с памятью, наборное поле, выход которого соединен с входом блока ввода-вывода, отличающееся тем, что, с целью сокращения временных затрат при поиске, в него введены память промежуточного массива, память рабочего массива и блок адресации, соединенные двусторонними связями с магистральной шиной.
SU5006225 1991-11-01 1991-11-01 Устройство для информационного поиска RU2039376C1 (ru)

Priority Applications (1)

Application Number Priority Date Filing Date Title
SU5006225 RU2039376C1 (ru) 1991-11-01 1991-11-01 Устройство для информационного поиска

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
SU5006225 RU2039376C1 (ru) 1991-11-01 1991-11-01 Устройство для информационного поиска

Publications (1)

Publication Number Publication Date
RU2039376C1 true RU2039376C1 (ru) 1995-07-09

Family

ID=21587307

Family Applications (1)

Application Number Title Priority Date Filing Date
SU5006225 RU2039376C1 (ru) 1991-11-01 1991-11-01 Устройство для информационного поиска

Country Status (1)

Country Link
RU (1) RU2039376C1 (ru)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EA009313B1 (ru) * 2004-10-29 2007-12-28 Арузе Корп. Игровой автомат для игры в рулетку
US7979425B2 (en) 2006-10-25 2011-07-12 Google Inc. Server-side match
US8392453B2 (en) 2004-06-25 2013-03-05 Google Inc. Nonstandard text entry
US8706747B2 (en) 2000-07-06 2014-04-22 Google Inc. Systems and methods for searching using queries written in a different character-set and/or language from the target pages
US8972444B2 (en) 2004-06-25 2015-03-03 Google Inc. Nonstandard locality-based text entry
RU2628200C2 (ru) * 2011-09-22 2017-08-15 МАЙКРОСОФТ ТЕКНОЛОДЖИ ЛАЙСЕНСИНГ, ЭлЭлСи Обеспечение руководства тематическим поиском

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
1. Патент ЕР N 0351786, кл. G06F 15/40, G06F 15/02, опублик. 1990. *
2. Патент ЕР N 0336279, кл. G06F 15/40, опублик. 1989. *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8706747B2 (en) 2000-07-06 2014-04-22 Google Inc. Systems and methods for searching using queries written in a different character-set and/or language from the target pages
US9734197B2 (en) 2000-07-06 2017-08-15 Google Inc. Determining corresponding terms written in different formats
US8392453B2 (en) 2004-06-25 2013-03-05 Google Inc. Nonstandard text entry
US8972444B2 (en) 2004-06-25 2015-03-03 Google Inc. Nonstandard locality-based text entry
US10534802B2 (en) 2004-06-25 2020-01-14 Google Llc Nonstandard locality-based text entry
EA009313B1 (ru) * 2004-10-29 2007-12-28 Арузе Корп. Игровой автомат для игры в рулетку
US7740535B2 (en) 2004-10-29 2010-06-22 Universal Entertainment Corporation Roulette gaming machine
US7979425B2 (en) 2006-10-25 2011-07-12 Google Inc. Server-side match
RU2628200C2 (ru) * 2011-09-22 2017-08-15 МАЙКРОСОФТ ТЕКНОЛОДЖИ ЛАЙСЕНСИНГ, ЭлЭлСи Обеспечение руководства тематическим поиском

Similar Documents

Publication Publication Date Title
GB2259596A (en) Compressed language dictionary
DE19900365A1 (de) Hochgeschwindigkeits-Halbleiterspeichervorrichtung, die eine Datensequenz für eine Burst-Übertragung ändern kann
JPS5660972A (en) Recognition device for basic form of word and translator using it
RU2039376C1 (ru) Устройство для информационного поиска
US4327407A (en) Data driven processor
JP3453761B2 (ja) アドレス変換方式
JPH0752450B2 (ja) 辞書デ−タ検索装置
RU96119820A (ru) Устройство обработки информации для информационного поиска
JP3288063B2 (ja) 可変長データの格納および参照システム
JPH07101382B2 (ja) マ−ジ処理装置
CA2345422A1 (en) Method and apparatus for element selection exhausting an entire array
JPS60168233A (ja) 単語辞書装置
KR880008140A (ko) 디지탈 신호 처리용 집적 회로
JP2591362B2 (ja) データ選択処理方法
JPS61278932A (ja) デ−タ追加処理方法
JPH03118661A (ja) 単語検索装置
JPH03100997A (ja) 選択的連想記憶装置及びその制御方式
JPH0531790B2 (ru)
JPS58195927A (ja) 日本語入力装置
JPS612565A (ja) コ−ド変換処理方式
JPS58211251A (ja) 記憶装置のアドレツシング方法
JPS59189463A (ja) メモリアクセス制御方式
JPS619755A (ja) かな漢字変換方式
JPH0145648B2 (ru)
JPS5829046A (ja) メモリソーティング回路