KR102201390B1 - 이미지 검색 방법 및 장치 - Google Patents
이미지 검색 방법 및 장치 Download PDFInfo
- Publication number
- KR102201390B1 KR102201390B1 KR1020190114720A KR20190114720A KR102201390B1 KR 102201390 B1 KR102201390 B1 KR 102201390B1 KR 1020190114720 A KR1020190114720 A KR 1020190114720A KR 20190114720 A KR20190114720 A KR 20190114720A KR 102201390 B1 KR102201390 B1 KR 102201390B1
- Authority
- KR
- South Korea
- Prior art keywords
- image
- graph
- subgraphs
- nodes
- subgraph
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 43
- 239000013598 vector Substances 0.000 claims description 45
- 239000013604 expression vector Substances 0.000 claims description 41
- 239000011159 matrix material Substances 0.000 claims description 19
- 238000012549 training Methods 0.000 claims description 12
- 238000005070 sampling Methods 0.000 claims description 9
- 238000013528 artificial neural network Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 8
- 238000004891 communication Methods 0.000 description 7
- 238000010801 machine learning Methods 0.000 description 6
- 238000004422 calculation algorithm Methods 0.000 description 4
- 238000004590 computer program Methods 0.000 description 4
- 239000000284 extract Substances 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000013527 convolutional neural network Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 210000002569 neuron Anatomy 0.000 description 3
- 238000005295 random walk Methods 0.000 description 3
- 244000025254 Cannabis sativa Species 0.000 description 2
- 241000220225 Malus Species 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000011176 pooling Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 235000021016 apples Nutrition 0.000 description 1
- 235000015220 hamburgers Nutrition 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/56—Information retrieval; Database structures therefor; File system structures therefor of still image data having vectorial format
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/5854—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using shape and object relationship
-
- G06K9/00624—
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Library & Information Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
도 2는 본 발명의 한 실시예에 따른 이미지 검색 방법에서 이미지 그래프 생성 절차를 나타내는 흐름도이다.
도 3는 이미지 그래프 생성에 사용되는 이미지의 한 예를 나타내는 도면이다.
도 4 및 도 5은 각각 도 3에 예시한 이미지를 기초로 생성된 이미지 그래프의 예를 나타내는 도면이다.
도 6은 본 발명의 한 실시예에 따른 이미지 검색 방법에서 문장 그래프 생성 절차를 나타내는 흐름도이다.
도 7a, 도 7b 및 도 7c는 각각 도 3에 예시한 이미지를 설명하는 설명문을 기초로 생성된 문장 그래프의 예를 나타내는 도면이다.
도 8은 본 발명의 한 실시예에 따른 이미지 검색 장치를 위한 타깃 모델의 학습 방법을 나타내는 흐름도이다.
도 9는 본 발명의 한 실시예에 따른 이미지 검색 방법을 나타내는 흐름도이다.
도 10은 본 발명의 다른 실시예에 따른 이미지 검색 방법을 나타내는 흐름도이다.
도 11은 본 발명의 한 실시예에 따른 컴퓨팅 장치의 한 예를 나타내는 도면이다.
Claims (20)
- 컴퓨팅 장치의 이미지 검색 방법으로서,
질의문 또는 질의 이미지를 입력받는 단계,
상기 질의문 또는 질의 이미지를 분석하여 복수의 제1 노드를 가지는 제1 그래프를 생성하는 단계,
상기 제1 그래프로부터 복수의 제1 서브그래프를 샘플링하는 단계,
복수의 이미지를 포함하는 이미지 세트의 각 이미지에 대해서 생성된 복수의 제2 노드를 가지는 제2 그래프로부터 샘플링된 복수의 제2 서브그래프와 상기 복수의 제1 서브그래프 사이의 유사도를 계산하는 단계, 그리고
상기 복수의 이미지 중에서 상기 유사도가 가장 높은 이미지를 출력하는 단계를 포함하며,
상기 유사도를 계산하는 단계는,
상기 질의문으로부터 생성된 상기 제1 그래프와 상기 제2 그래프의 쌍을 표현하는 표현 벡터를 생성하는 단계, 그리고
상기 표현 벡터에 기초해서 상기 유사도를 계산하는 단계를 포함하고,
상기 제2 그래프에서, 각 제2 서브그래프에 포함되는 소정 개수의 제2 노드에 기초해서 각 제2 서브그래프의 의미(semantic) 벡터가 정의되며,
상기 표현 벡터를 생성하는 단계는,
상기 제1 그래프에서, 각 제1 서브그래프에 포함되는 소정 개수의 제1 노드에 기초해서 각 제1 서브그래프의 의미 벡터를 정의하는 단계, 그리고
상기 복수의 제1 서브그래프의 상기 의미 벡터의 집합, 상기 복수의 제2 서브그래프의 의미 벡터의 집합 및 가중치 행렬에 기초해서, 상기 표현 벡터를 생성하는 단계를 포함하는
이미지 검색 방법. - 제1항에서,
상기 복수의 제1 서브그래프를 샘플링하는 단계는, 상기 제1 그래프에서 소정 개수의 제1 노드를 샘플링하여 각 제1 서브그래프를 샘플링하는 단계를 포함하며,
상기 제2 그래프에서 소정 개수의 제2 노드가 샘플링되어 각 제2 서브그래프가 샘플링되는
이미지 검색 방법. - 제1항에서,
상기 제1 그래프를 생성하는 단계는,
상기 질의문을 분석하여 상기 질의문으로부터 복수의 단어 토큰과 단어 토큰 사이의 관계를 추출하는 단계, 그리고
상기 단어 토큰과 상기 관계에 기초해서 상기 단어 토큰을 상기 복수의 제1 노드로 가지는 상기 제1 그래프를 생성하는 단계
를 포함하는 이미지 검색 방법. - 제3항에서,
상기 제1 그래프에서, 두 단어 토큰 사이의 의존도에 기초해서 상기 두 단어 토큰 사이의 엣지가 정의되는 이미지 검색 방법. - 삭제
- 삭제
- 제1항에서,
상기 가중치 행렬은 학습 이미지와 상기 학습 이미지에 대한 정답인 설명문의 쌍, 그리고 상기 학습 이미지와 상기 학습 이미지에 대한 오답인 설명문의 쌍을 기초로 학습되는 이미지 검색 방법. - 제7항에서,
상기 학습 이미지와 상기 정답인 설명문의 쌍에서 계산되는 상기 유사도가 상기 학습 이미지와 상기 오답인 설명문의 쌍에서 계산되는 상기 유사도에 비해 소정 값만큼 크도록 상기 가중치 행렬이 학습되는 이미지 검색 방법. - 삭제
- 삭제
- 컴퓨팅 장치의 이미지 검색 방법으로서,
질의문 또는 질의 이미지를 입력받는 단계,
상기 질의문 또는 질의 이미지를 분석하여 복수의 제1 노드를 가지는 제1 그래프를 생성하는 단계,
상기 제1 그래프로부터 복수의 제1 서브그래프를 샘플링하는 단계,
복수의 이미지를 포함하는 이미지 세트의 각 이미지에 대해서 생성된 복수의 제2 노드를 가지는 제2 그래프로부터 샘플링된 복수의 제2 서브그래프와 상기 복수의 제1 서브그래프 사이의 유사도를 계산하는 단계, 그리고
상기 복수의 이미지 중에서 상기 유사도가 가장 높은 이미지를 출력하는 단계를 포함하며,
상기 제1 그래프를 생성하는 단계는,
상기 질의 이미지로부터 복수의 객체를 검출하는 단계,
상기 객체의 이름 및 상기 객체의 의미(semantic) 정보를 예측하는 단계,
상기 이름 및 상기 의미 정보를 상기 복수의 제1 노드로 가지는 상기 제1 그래프를 생성하는 단계를 포함하고,
상기 의미 정보는 상기 복수의 객체 중 적어도 일부 객체의 속성 및 두 객체 사이의 관계를 포함하며,
상기 예측하는 단계는,
상기 질의 이미지로부터 각 객체에 해당하는 영역을 추출하는 단계,
상기 영역에 해당하는 부이미지로부터 대응하는 객체의 이름을 예측하는 단계,
상기 부이미지의 특징과 상기 이름에 기초해서 대응하는 객체의 속성을 예측하는 단계, 그리고
두 객체의 이름 및 상기 두 객체 해당하는 영역의 위치 정보에 기초해서 상기 두 객체 사이의 관계를 예측하는 단계
를 포함하는 이미지 검색 방법. - 제11항에서,
상기 제2 그래프에서, 상기 속성과 상기 속성에 해당하는 객체의 상기 이름 사이에서 엣지가 정의되고, 제1 객체와 제2 객체 사이에 상기 관계가 예측될 때, 상기 제1 객체의 이름과 상기 관계 사이 및 상기 관계와 상기 제2 객체 사이에서 엣지가 정의되는 이미지 검색 방법. - 삭제
- 컴퓨팅 장치의 이미지 검색 방법으로서,
질의문 또는 질의 이미지를 입력받는 단계,
상기 질의문 또는 질의 이미지를 분석하여 복수의 제1 노드를 가지는 제1 그래프를 생성하는 단계,
상기 제1 그래프로부터 복수의 제1 서브그래프를 샘플링하는 단계,
복수의 이미지를 포함하는 이미지 세트의 각 이미지에 대해서 생성된 복수의 제2 노드를 가지는 제2 그래프로부터 샘플링된 복수의 제2 서브그래프와 상기 복수의 제1 서브그래프 사이의 유사도를 계산하는 단계, 그리고
상기 복수의 이미지 중에서 상기 유사도가 가장 높은 이미지를 출력하는 단계를 포함하며,
상기 유사도를 계산하는 단계는,
상기 질의 이미지로부터 생성된 상기 제1 그래프를 표현하는 제1 표현 벡터를 생성하는 단계, 그리고
상기 각 이미지에 대해서 생성된 상기 제2 그래프를 표현하는 제2 표현 벡터와 상기 제1 표현 벡터 사이의 유사도를 계산하는 단계를 포함하고,
상기 제2 그래프에서, 상기 제2 표현 벡터는 상기 복수의 제2 서브그래프의 의미 벡터에 기초해서 생성되고, 각 제2 서브그래프의 상기 의미 벡터는 각 제2 서브그래프에 포함되는 소정 개수의 제2 노드에 기초해서 정의되며,
상기 제1 표현 벡터를 생성하는 단계는,
상기 제1 그래프에서, 각 제1 서브그래프에 포함되는 소정 개수의 제1 노드에 기초해서 각 제1 서브그래프의 의미 벡터를 정의하는 단계, 그리고
상기 복수의 제1 서브그래프의 상기 의미 벡터에 기초해서 상기 제1 그래프를 표현하는 상기 제1 표현 벡터를 생성하는 단계
를 포함하는 이미지 검색 방법. - 삭제
- 삭제
- 하나 이상의 명령어를 저장하는 메모리, 그리고
프로세서를 포함하며,
상기 프로세서는 상기 명령어를 실행함으로써,
질의문을 입력받고,
상기 질의문을 분석하여 복수의 제1 노드를 가지는 제1 그래프를 생성하고,
상기 제1 그래프로부터 복수의 제1 서브그래프를 샘플링하고,
복수의 이미지를 포함하는 이미지 세트의 각 이미지에 대해서 생성된 복수의 제2 노드를 가지는 제2 그래프로부터 샘플링된 복수의 제2 서브그래프와 상기 복수의 제1 서브그래프 사이의 유사도를 계산하고,
상기 복수의 이미지 중에서 상기 유사도가 가장 높은 이미지를 출력하며,
상기 프로세서는,
상기 질의문으로부터 생성된 상기 제1 그래프와 상기 제2 그래프의 쌍을 표현하는 표현 벡터를 생성하고,
상기 표현 벡터에 기초해서 상기 유사도를 계산하며,
상기 제2 그래프에서, 각 제2 서브그래프에 포함되는 소정 개수의 제2 노드에 기초해서 각 제2 서브그래프의 의미(semantic) 벡터가 정의되며,
상기 프로세서는,
상기 제1 그래프에서, 각 제1 서브그래프에 포함되는 소정 개수의 제1 노드에 기초해서 각 제1 서브그래프의 의미 벡터를 정의하고,
상기 복수의 제1 서브그래프의 상기 의미 벡터의 집합, 상기 복수의 제2 서브그래프의 의미 벡터의 집합 및 가중치 행렬에 기초해서, 상기 표현 벡터를 생성하는
이미지 검색 장치. - 삭제
- 삭제
- 하나 이상의 명령어를 저장하는 메모리, 그리고
프로세서를 포함하며,
상기 프로세서는 상기 명령어를 실행함으로써,
질의 이미지를 입력받고,
상기 질의 이미지를 분석하여 복수의 제1 노드를 가지는 제1 그래프를 생성하고,
상기 제1 그래프로부터 복수의 제1 서브그래프를 샘플링하고,
복수의 이미지를 포함하는 이미지 세트의 각 이미지에 대해서 생성된 복수의 제2 노드를 가지는 제2 그래프로부터 샘플링된 복수의 제2 서브그래프와 상기 복수의 제1 서브그래프 사이의 유사도를 계산하고,
상기 복수의 이미지 중에서 상기 유사도가 가장 높은 이미지를 출력하며,
상기 프로세서는,
상기 질의 이미지로부터 생성된 상기 제1 그래프를 표현하는 제1 표현 벡터를 생성하고,
상기 각 이미지에 대해서 생성된 상기 제2 그래프를 표현하는 제2 표현 벡터와 상기 제1 표현 벡터 사이의 유사도를 계산하며,
상기 제2 그래프에서, 상기 제2 표현 벡터는 상기 복수의 제2 서브그래프의 의미 벡터에 기초해서 생성되고, 각 제2 서브그래프의 상기 의미 벡터는 각 제2 서브그래프에 포함되는 소정 개수의 제2 노드에 기초해서 정의되며,
상기 프로세서는,
상기 제1 그래프에서, 각 제1 서브그래프에 포함되는 소정 개수의 제1 노드에 기초해서 각 제1 서브그래프의 의미 벡터를 정의하고,
상기 복수의 제1 서브그래프의 상기 의미 벡터에 기초해서 상기 제1 그래프를 표현하는 상기 제1 표현 벡터를 생성하는
이미지 검색 장치.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020190114720A KR102201390B1 (ko) | 2019-09-18 | 2019-09-18 | 이미지 검색 방법 및 장치 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020190114720A KR102201390B1 (ko) | 2019-09-18 | 2019-09-18 | 이미지 검색 방법 및 장치 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR102201390B1 true KR102201390B1 (ko) | 2021-01-08 |
Family
ID=74127789
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020190114720A KR102201390B1 (ko) | 2019-09-18 | 2019-09-18 | 이미지 검색 방법 및 장치 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102201390B1 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113282777A (zh) * | 2021-04-20 | 2021-08-20 | 北京沃东天骏信息技术有限公司 | 一种模型训练方法、装置、电子设备及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20110085951A (ko) * | 2011-06-09 | 2011-07-27 | 인하대학교 산학협력단 | 시멘틱 기반의 이미지 검색 방법 |
KR101201093B1 (ko) * | 2004-03-02 | 2012-11-13 | 마이크로소프트 코포레이션 | 그래프-기반 랭킹을 사용하여 텍스트의 단어와 개념을 랭킹하는 방법 및 시스템 |
KR20120127408A (ko) * | 2010-01-18 | 2012-11-21 | 인터내셔널 비지네스 머신즈 코포레이션 | 개인화 태그 랭킹 |
US20140324864A1 (en) * | 2013-04-12 | 2014-10-30 | Objectvideo, Inc. | Graph matching by sub-graph grouping and indexing |
-
2019
- 2019-09-18 KR KR1020190114720A patent/KR102201390B1/ko active IP Right Grant
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101201093B1 (ko) * | 2004-03-02 | 2012-11-13 | 마이크로소프트 코포레이션 | 그래프-기반 랭킹을 사용하여 텍스트의 단어와 개념을 랭킹하는 방법 및 시스템 |
KR20120127408A (ko) * | 2010-01-18 | 2012-11-21 | 인터내셔널 비지네스 머신즈 코포레이션 | 개인화 태그 랭킹 |
KR20110085951A (ko) * | 2011-06-09 | 2011-07-27 | 인하대학교 산학협력단 | 시멘틱 기반의 이미지 검색 방법 |
US20140324864A1 (en) * | 2013-04-12 | 2014-10-30 | Objectvideo, Inc. | Graph matching by sub-graph grouping and indexing |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113282777A (zh) * | 2021-04-20 | 2021-08-20 | 北京沃东天骏信息技术有限公司 | 一种模型训练方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110147457B (zh) | 图文匹配方法、装置、存储介质及设备 | |
KR102177412B1 (ko) | 이미지와 텍스트간 유사도 매칭 시스템 및 방법 | |
WO2018196718A1 (zh) | 图像消歧方法、装置、存储介质和电子设备 | |
Mei et al. | Closing loops without places | |
US11599749B1 (en) | Method of and system for explainable knowledge-based visual question answering | |
JP2020077343A (ja) | ルール生成装置、ルール生成方法及びルール生成プログラム | |
CN111539197A (zh) | 文本匹配方法和装置以及计算机系统和可读存储介质 | |
US20220083580A1 (en) | Information processing apparatus and information processing method | |
US12056184B2 (en) | Method and apparatus for generating description information of an image, electronic device, and computer readable storage medium | |
US20210279279A1 (en) | Automated graph embedding recommendations based on extracted graph features | |
US20220164687A1 (en) | Method for providing explainable artificial intelligence | |
JP7259935B2 (ja) | 情報処理システム、情報処理方法およびプログラム | |
US12182184B2 (en) | Method and apparatus for question-answering using a database consist of query vectors | |
JP2018022496A (ja) | 自然言語処理装置に用いられるトレーニングデータを作成する方法と機器 | |
CN113761124A (zh) | 文本编码模型的训练方法、信息检索方法及设备 | |
CN113516142A (zh) | 文本图像匹配方法、装置、设备及存储介质 | |
CN115186133A (zh) | 视频生成方法、装置、电子设备及介质 | |
CN112463914B (zh) | 一种用于互联网服务的实体链接方法、装置及存储介质 | |
CN112560823A (zh) | 基于分布学习的自适应方差和权重的人脸年龄估计方法 | |
CN114972774A (zh) | 特定区域的图像描述生成方法、装置、设备及存储介质 | |
CN114490926A (zh) | 一种相似问题的确定方法、装置、存储介质及终端 | |
CN113869609A (zh) | 一种根因分析频繁子图置信度预测方法及系统 | |
CN114021541A (zh) | 演示文稿生成方法、装置、设备及存储介质 | |
KR102201390B1 (ko) | 이미지 검색 방법 및 장치 | |
CN117009599A (zh) | 数据检索方法、装置、处理器及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20190918 |
|
PA0201 | Request for examination | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20200929 Patent event code: PE09021S01D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20201214 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20210105 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20210105 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
PR1001 | Payment of annual fee |
Payment date: 20231130 Start annual number: 4 End annual number: 4 |
|
PR1001 | Payment of annual fee |
Payment date: 20241125 Start annual number: 5 End annual number: 6 |