WO2015130185A1 - Способ индексирования, сравнения и поиска изображений в компьютерной системе - Google Patents

Способ индексирования, сравнения и поиска изображений в компьютерной системе Download PDF

Info

Publication number
WO2015130185A1
WO2015130185A1 PCT/RU2014/000121 RU2014000121W WO2015130185A1 WO 2015130185 A1 WO2015130185 A1 WO 2015130185A1 RU 2014000121 W RU2014000121 W RU 2014000121W WO 2015130185 A1 WO2015130185 A1 WO 2015130185A1
Authority
WO
WIPO (PCT)
Prior art keywords
image
index
images
words
comparing
Prior art date
Application number
PCT/RU2014/000121
Other languages
English (en)
French (fr)
Inventor
Андрей Юрьевич ЩЕРБАКОВ
Олег Олегович ТИХОНЕНКО
Original Assignee
Андрей Юрьевич ЩЕРБАКОВ
Олег Олегович ТИХОНЕНКО
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Андрей Юрьевич ЩЕРБАКОВ, Олег Олегович ТИХОНЕНКО filed Critical Андрей Юрьевич ЩЕРБАКОВ
Priority to PCT/RU2014/000121 priority Critical patent/WO2015130185A1/ru
Publication of WO2015130185A1 publication Critical patent/WO2015130185A1/ru

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data

Definitions

  • the invention relates to the field of computer science, and more specifically to a method for indexing, comparing and searching for images in a computer system.
  • the present invention may find application in the creation and
  • images for search engines such as Yandex or Google, associated with the analysis of the names and properties (size, resolution) of images.
  • the basis of the present invention is the creation of a method of indexing, comparing and searching for images in a computer system, which would provide the opportunity to search for an image by its content and text description, as well as compare images.
  • human-perceived content create a description from a sequence of words of a natural and / or artificial language associated with at least a portion of the content of this image, thereby obtaining an index of the image, after which the resulting index is stored separately or together with
  • the indices are compared in a set-theoretic sense, obtaining as a result of comparison three objects of comparison: a list of words contained only in the index of the first image, a list of words contained only in the index of the second image, and a list of words contained as in index of the first and the index of the second image.
  • the reference and sought images are compared sequentially and a value is calculated equal to the quotient of dividing twice the number of words contained in both the index of the first and the index of the second image by the sum of the number of words only in the index of the first image and the number of words only in the index of the first image, and in the case that this value is not less than a given measure of similarity, the desired image is considered to be similar and include it and / or its index in the search result.
  • a method for searching for similar images to an image described as text having an index with a predetermined similarity measure ranging from zero to one inclusive which consists in comparing the text describing the image and the index of the desired image in sequence and calculating a value equal to the quotient of dividing twice the number of words contained in both the index of the first and the index of the second image by the sum of the number of words in the index only th image and the number of words in the index only the first image in the case that this value is not less than a predetermined similarity measure, according to the desired image and similarly include its and / or its index in the search result.
  • the proposed method solves the above objectives of the invention, is characterized by fundamental novelty and provides the ability to search for an image by its content and text description, as well as compare images.
  • FIGS. 1-3 The present invention will be disclosed in the following examples of figures and photographs in FIGS. 1-3.
  • the proposed method solves the above objectives of the invention, is characterized by fundamental novelty and provides the ability to search for an image by its content and text description, as well as compare images.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

Изобретение относится к области информатики, а более конкретно - к способу индексирования, сравнения и поиска изображений в компьютерной системе. Настоящее изобретение может найти применение при создании и эксплуатации систем, осуществляющих решение различных задач поиска и сравнения изображений. Предлагаемый способ решает сформулированные выше задачи изобретения, характеризуется принципиальной новизной и предоставляет возможность искать изображение по его содержанию и текстовому описанию, а также сравнивать изображения.

Description

СПОСОБ ИНДЕКСИРОВАНИЯ, СРАВНЕНИЯ И ПОИСКА
ИЗОБРАЖЕНИЙ В КОМПЬЮТЕРНОЙ СИСТЕМЕ
Описание
Изобретение относится к области информатики, а более конкретно - к способу индексирования, сравнения и поиска изображений в компьютерной системе.
Настоящее изобретение может найти применение при создании и
эксплуатации систем, осуществляющих решение различных задач поиска и сравнения изображений.
Прототипом данной системы является типовая процедура поиска
изображений для поисковых машин типа Yandex или Google, связанная с анализом названий и свойств (размер, разрешение) изображений.
Однако все процедуры поиска изображений, используемые в настоящее время, имеют следующие существенные недостатки:
1. Нет возможности искать изображение по его содержанию и текстовому описанию.
2. Нет возможности сравнивать изображения.
В основу настоящего изобретения положена задача создания способа индексирования, сравнения и поиска изображений в компьютерной системе, который предоставлял бы возможность искать изображение по его содержанию и текстовому описанию, а также сравнивать изображения.
Задачи изобретения решены и недостатки прототипа устранены в
предлагаемом способе индексирования, сравнения и поиска изображений в компьютерной системе.
Согласно данному способу для каждого изображения, имеющего
воспринимаемое человеком содержание, создают описание из последовательности слов естественного и/или искусственного языка, связанного по меньшей мере с частью содержания этого изображения, получая тем самым индекс изображения, после чего полученный индекс сохраняют отдельно или совместно с
изображением.
Для сравнения любых двух изображений, имеющих сформированный индекс, производят сравнение индексов в теоретико-множественном смысле, получая в результате сравнения три объекта сравнения: перечень слов содержащихся только в индексе первого изображения, перечень слов содержащихся только в индексе второго изображения и перечень слов содержащихся как в индексе первого, так и в индексе второго изображения.
Для поиска, похожих на эталонное, изображений, имеющих индекс, с заранее заданной мерой сходства, находящейся в интервале от нуля до единицы
включительно, заключающийся в том, что производят последовательно сравнение эталонного и искомого изображений и вычисляют величину, равную частному от деления удвоенного количества слов, содержащихся как в индексе первого, так и в индексе второго изображения на сумму количества слов только в индексе первого изображения и количества слов только в индексе первого изображения, и в случае того, что эта величина не меньше заданной меры сходства, считают искомое изображение сходным и включают его и/или его индекс в результат поиска.
Технически целесообразно реализовать способ поиска похожих изображений на описанное в виде текста изображение, имеющих индекс, с заранее заданной мерой сходства, находящейся в интервале от нуля до единицы включительно, заключающийся в том, что производят последовательно сравнение текста, описывающего изображение и индекса искомого изображений и вычисляют величину, равную частному от деления удвоенного количества слов, содержащихся как в индексе первого, так и в индексе второго изображения на сумму количества слов только в индексе первого изображения и количества слов только в индексе первого изображения, и в случае того, что эта величина не меньше заданной меры сходства, считают искомое изображение сходным и включают его и/или его индекс в результат поиска.
Не менее технически целесообразно заранее составлять набор имен объектов, которые могут иметь место на изображении и при создании индекса производить выбор из данного набора имен. Также технически целесообразно рассматривать ситуацию, когда заранее формируют графические шаблоны, описывающие графические объекты и присваивают им имена, после чего производят поиск шаблонов на изображении и при их нахождении в изображении вносят в индекс соответствующие им имена.
Предлагаемый способ решает сформулированные выше задачи изобретения, характеризуется принципиальной новизной и предоставляет возможность искать изображение по его содержанию и текстовому описанию, а также сравнивать изображения.
Настоящее изобретение будет раскрыто в нижеследующих примерах рисунков и фотографий на Фиг.1-3.
Для изображения на Фиг.1 сформировано следующее описание
Три богатыря Виктор Васнецов три человека один на белом коне второй на черном коне третий на рыжем коне стоят в степи сзади горы
Для изображения на Фиг.2 сформировано следующее описание
Три человека вицин Никулин моргунов сюжет из кавказской пленницы памятник на заднем плане здание идущая девушка в профиль справа
Для изображения на Фиг.З сформировано следующее описание
Три человека в середине девушка вместе образуют слово Google
Результат сравнения первого и второго изображений
Только в первом изображении
коне
горы
черном
один
белом
третий
Васнецов
богатыря сзади
Виктор
стоят
три
рыжем
степи
второй
Только во втором изображении
Никулин
девушка
вицин
кавказской
сюжет
из
идущая
справа
заднем
пленницы
профиль
моргунов
здание
памятник
плане
Общая часть первого и второго изображений Тр
и
чел
овека
в
на Success comparing! See onlyone,onlytwo and COMMON files
[ind01.txt] = 19 [ind02.txt] = 19 -> [one] = 15 [two] = 15 [common] = 4 mcommon (one=two) = 21 percent
Только в первом изображении коне
горы
черном
один
белом
третий
Васнецов
Богатыря
сзади
Виктор
стоят
три
рыжем
степи
на
второй
Только в третьем изображении
девушка
вместе
середине
образуют
слово
google
В первом и третьем изображении
Тр чел
овека
в
Success comparing! See onlyone,onlytwo and COMMON files
[ind01.txt] = 19 [ind03.txt] = 9 -> [one] = 16 [two] = 6 [common] = 3 mcommon (one=two) = 21 percent
Только во втором изображении
Никулин
вицин
кавказской
сюжет
из
идущая
справа
заднем
пленницы
профиль
моргунов
здание
памятник
на
плане
Только в третьем изображении
вместе
середине
образуют
слово
google
Во втором и третьем изображении Дев
ушка
р
и
чел
овека
в
Success comparing! See onlyone,onlytwo and COMMON files
[ind02.txt] = 19 [ind03.txt] = 9 -> [one] = 15 [two] = 5 [common] = 4
mcommon (one=two) = 28 percent
Легко видеть, что изображения 2 и 3 совпадают больше за счет присутствия на изображениях девушки.
Предлагаемый способ решает сформулированные выше задачи изобретения, характеризуется принципиальной новизной и предоставляет возможность искать изображение по его содержанию и текстовому описанию, а также сравнивать изображения.

Claims

ФОРМУЛА ИЗОБРЕТЕНИЯ
1. Способ индексирования изображений, хранящихся в произвольном графическом формате в компьютерной системе, заключающийся в том, что для каждого изображения, имеющего воспринимаемое человеком содержание, создают описание из последовательности слов естественного и/или искусственного языка, связанного по меньше мере с частью содержания этого изображения, получая тем самым индекс изображения, после чего полученный индекс сохраняют отдельно или совместно с изображением.
2. Способ индексирования изображений по п.1, отличающийся тем, что заранее составляют набор имен объектов, которые могут иметь место на
изображении и при создании индекса производят выбор из данного набора имен.
3. Способ индексирования изображений по п.1, отличающийся тем, что заранее формируют графические шаблоны, описывающие графические объекты и присваивают им имена, после чего производят поиск шаблонов на изображении и при их нахождении в изображении вносят в индекс соответствующие им имена.
4. Способ сравнения любых двух изображений, имеющих индекс,
сформированный по п.1, заключающийся в том, что производят сравнение индексов в теоретико-множественном смысле, получая в результате сравнения три объекта сравнения: перечень слов содержащихся только в индексе первого изображения, перечень слов содержащихся только в индексе второго изображения и перечень слов содержащихся как в индексе первого, так и в индексе второго изображения.
5. Способ поиска похожих на эталонное изображений, имеющих индекс, сформированный по п.1, с заранее заданной мерой сходства, находящейся в интервале от нуля до единицы включительно, заключающийся в том, что
производят последовательно сравнение эталонного и искомого изображений по п. 4 и вычисляют величину, равную частному от деления удвоенного количества слов, содержащихся как в индексе первого, так и в индексе второго изображения на сумму количества слов только в индексе первого изображения и количества слов только в индексе первого изображения, и в случае того, что эта величина не меньше заданной меры сходства, считают искомое изображение сходным и включают его и/или его индекс в результат поиска.
6. Способ поиска похожих изображений на описанное в виде текста
изображение, имеющих индекс, сформированный по п.1, с заранее заданной мерой сходства, находящейся в интервале от нуля до единицы включительно,
заключающийся в том, что производят последовательно сравнение текста, описывающего изображение и индекса искомого изображений и вычисляют величину, равную частному от деления удвоенного количества слов, содержащихся как в индексе первого, так и в индексе второго изображения на сумму количества слов только в индексе первого изображения и количества слов только в индексе первого изображения, и в случае того, что эта величина не меньше заданной меры сходства, считают искомое изображение сходным и включают его и/или его индекс в результат поиска.
PCT/RU2014/000121 2014-02-26 2014-02-26 Способ индексирования, сравнения и поиска изображений в компьютерной системе WO2015130185A1 (ru)

Priority Applications (1)

Application Number Priority Date Filing Date Title
PCT/RU2014/000121 WO2015130185A1 (ru) 2014-02-26 2014-02-26 Способ индексирования, сравнения и поиска изображений в компьютерной системе

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/RU2014/000121 WO2015130185A1 (ru) 2014-02-26 2014-02-26 Способ индексирования, сравнения и поиска изображений в компьютерной системе

Publications (1)

Publication Number Publication Date
WO2015130185A1 true WO2015130185A1 (ru) 2015-09-03

Family

ID=54009401

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/RU2014/000121 WO2015130185A1 (ru) 2014-02-26 2014-02-26 Способ индексирования, сравнения и поиска изображений в компьютерной системе

Country Status (1)

Country Link
WO (1) WO2015130185A1 (ru)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6292582B1 (en) * 1996-05-31 2001-09-18 Lin Youling Method and system for identifying defects in a semiconductor
US20110103699A1 (en) * 2009-11-02 2011-05-05 Microsoft Corporation Image metadata propagation
US20120177297A1 (en) * 2011-01-12 2012-07-12 Everingham James R Image Analysis System and Method Using Image Recognition and Text Search
KR101264151B1 (ko) * 2012-10-24 2013-05-14 주식회사 무하유 문서 표절률 산출 장치 및 방법, 이를 구현하기 위한 프로그램을 기록한 기록매체
US20130138636A1 (en) * 2011-11-25 2013-05-30 Alibaba Group Holding Limited Image Searching

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6292582B1 (en) * 1996-05-31 2001-09-18 Lin Youling Method and system for identifying defects in a semiconductor
US20110103699A1 (en) * 2009-11-02 2011-05-05 Microsoft Corporation Image metadata propagation
US20120177297A1 (en) * 2011-01-12 2012-07-12 Everingham James R Image Analysis System and Method Using Image Recognition and Text Search
US20130138636A1 (en) * 2011-11-25 2013-05-30 Alibaba Group Holding Limited Image Searching
KR101264151B1 (ko) * 2012-10-24 2013-05-14 주식회사 무하유 문서 표절률 산출 장치 및 방법, 이를 구현하기 위한 프로그램을 기록한 기록매체

Similar Documents

Publication Publication Date Title
US11222167B2 (en) Generating structured text summaries of digital documents using interactive collaboration
RU2656581C2 (ru) Редактирование содержимого электронного документа
CN106156082A (zh) 一种本体对齐方法及装置
Jyhne et al. Mapai: precision in building segmentation
CN103177105A (zh) 一种图像检索方法及装置
WO2015130185A1 (ru) Способ индексирования, сравнения и поиска изображений в компьютерной системе
EP3136256A3 (en) Method for comparing text files with differently arranged text sections in documents
Götze et al. “Turn Left” Versus “Walk Towards the Café”: When Relative Directions Work Better Than Landmarks
Blank et al. Geocoding place names from historic route descriptions
JP5806974B2 (ja) 近隣情報検索装置及び方法及びプログラム
JP5188290B2 (ja) アノテーション装置、アノテーション方法およびプログラム
Spence The shortlived but brilliant Latin American journal Amauta
Lin et al. Crowdsourced Explanations for humorous internet memes
KR20220026379A (ko) 연관도를 이용한 사용자 검색 시스템, 방법, 및 상기 방법을 실행시키기 위한 컴퓨터 판독 가능한 프로그램을 기록한 기록 매체
Chen et al. Intelligent human detection based on depth information
KR101663453B1 (ko) 문장 순서 및 구조 변경을 이용한 문장 유사도 산출 장치 및 그 방법
Gorard et al. Equity in education
Baeza et al. Photo recognition for in-water identification of hawksbills in a marine protected area of Honduras
CN105843926B (zh) 现实信息索引的建立方法和基于云平台的全文检索系统
Sohn Good of Recognition
Колесниченко Elena A. Kolesnichenko
Lowe Murder in the Shenandoah: Commonwealth v. John Crane and Law in Federal Virginia
Jones Neo-Ottomanism and Its Discontents: Turkish Foreign Policy toward Serbia
Harun et al. Structural Classification as Preservation Means of Malaysian Folktales
Lee At the Limits of Law: Necessity in Islamic Legal History, Second/Eighth Through Tenth/Sixteenth Centuries

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 14883891

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 14883891

Country of ref document: EP

Kind code of ref document: A1

122 Ep: pct application non-entry in european phase

Ref document number: 14883891

Country of ref document: EP

Kind code of ref document: A1

32PN Ep: public notification in the ep bulletin as address of the adressee cannot be established

Free format text: NOTING OF LOSS OF RIGHTS PURSUANT TO RULE 112(1) EPC (EPO FORM 1205A DATED 09.03.2017)

122 Ep: pct application non-entry in european phase

Ref document number: 14883891

Country of ref document: EP

Kind code of ref document: A1