KR101270958B1 - 전자 문서 내 이미지 검색 장치 및 방법 - Google Patents

전자 문서 내 이미지 검색 장치 및 방법 Download PDF

Info

Publication number
KR101270958B1
KR101270958B1 KR1020130000163A KR20130000163A KR101270958B1 KR 101270958 B1 KR101270958 B1 KR 101270958B1 KR 1020130000163 A KR1020130000163 A KR 1020130000163A KR 20130000163 A KR20130000163 A KR 20130000163A KR 101270958 B1 KR101270958 B1 KR 101270958B1
Authority
KR
South Korea
Prior art keywords
image
words
information
electronic document
unit
Prior art date
Application number
KR1020130000163A
Other languages
English (en)
Inventor
조찬제
Original Assignee
주식회사 한글과컴퓨터
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 한글과컴퓨터 filed Critical 주식회사 한글과컴퓨터
Priority to KR1020130000163A priority Critical patent/KR101270958B1/ko
Application granted granted Critical
Publication of KR101270958B1 publication Critical patent/KR101270958B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables

Abstract

전자 문서 내 이미지 검색 장치 및 방법이 개시된다. 본 발명의 실시예들은 전자 문서에 삽입되어 있는 단어들과 이미지들 간의 이격 거리를 연산하고, 상기 연산된 이격 거리를 기초로 상기 단어들 각각에 대해 상기 이미지들과의 연관도에 대한 정보를 할당하여 데이터베이스에 저장해 놓은 후 사용자가 소정의 검색어를 입력하면, 상기 검색어에 할당되어 있는 연관도에 대한 정보를 기초로 상기 전자 문서에 삽입되어 있는 이미지들 중 상기 검색어와 연관도가 높은 이미지를 추출하여 검색 결과로 출력함으로써, 사용자가 전자 문서 상에 삽입되어 있는 이미지들에 대한 검색을 손쉽게 수행할 수 있도록 지원할 수 있다.

Description

전자 문서 내 이미지 검색 장치 및 방법{APPARATUS AND METHOD FOR SEARCHING IMAGE IN THE ELECTRONIC DOCUMENT}
본 발명의 실시예들은 전자 문서에 삽입되어 있는 이미지 개체에 대한 검색을 가능하게 하는 기술에 대한 것이다.
최근, 데스크탑 PC나 스마트폰, 노트북 또는 태블릿 PC 등의 보급이 활발해지면서, 기업뿐만 아니라, 개인이나 가정에서도 전자 문서를 활용한 업무 처리가 증가하고 있다.
특히, 스마트폰이나 태블릿 PC 등과 같은 휴대기기의 보급이 급증함에 따라, 기존의 종이 인쇄물을 이용하는 대신, 스마트폰이나 태블릿 PC 등과 같은 휴대기기 상에서 전자 문서를 로드(load)하여 직접 전자 문서를 보면서 관련 업무를 처리하는 경우가 증가하고 있다.
이렇게, 전자 문서의 활용이 급증함에 따라, 관련 업계에서는 사용자의 편의를 위해서, 전자 문서의 활용과 연관된 다양한 부가 기능을 제공하고자 하는 연구가 활발하게 진행되고 있다.
보통, 전자 문서에 대한 작성, 편집 또는 뷰잉(viewing) 기능 등을 제공하는 오피스 프로그램들에서는 기본적으로 전자 문서로부터 사용자가 원하는 단어를 검색할 수 있도록 하는 단어 검색 기능을 제공하고 있는 경우가 많다.
하지만, 이러한 프로그램들에서는 전자 문서에 삽입되어 있는 이미지에 대한 검색 기능을 제공하지 못하고 있는 실정이다.
보통, 사용자들은 전자 문서로부터 자신이 원하는 단어를 검색하고자 하는 경우도 있을 수 있지만, 전자 문서에 삽입되어 있는 다수의 이미지들로부터 자신이 원하는 이미지를 검색하고자 하는 경우도 있을 수 있다.
따라서, 사용자에게 전자 문서에 삽입되어 있는 이미지들에 대한 검색 기능을 제공할 수 있도록 하는 기술에 대한 연구가 필요하다.
대한민국 공개특허공보 제10-2009-0063423호(2009.06.18) 대한민국 등록특허공보 제10-1027851호(2011.04.07) 대한민국 등록특허공보 제10-0824698호(2008.04.24) 미국 공개특허공보 제2012-0070073호(2012.03.22)
본 발명의 실시예들은 전자 문서에 삽입되어 있는 단어들과 이미지들 간의 이격 거리를 연산하고, 상기 연산된 이격 거리를 기초로 상기 단어들 각각에 대해 상기 이미지들과의 연관도에 대한 정보를 할당하여 데이터베이스에 저장해 놓은 후 사용자가 소정의 검색어를 입력하면, 상기 검색어에 할당되어 있는 연관도에 대한 정보를 기초로 상기 전자 문서에 삽입되어 있는 이미지들 중 상기 검색어와 연관도가 높은 이미지를 추출하여 검색 결과로 출력함으로써, 사용자가 전자 문서 상에 삽입되어 있는 이미지들에 대한 검색을 손쉽게 수행할 수 있도록 한다.
본 발명의 일실시예에 따른 전자 문서 내 이미지 검색 장치는 메모리에 저장되어 있는 전자 문서로부터 상기 전자 문서에 삽입되어 있는 복수의 단어들을 추출하는 단어 추출부, 상기 전자 문서로부터 상기 전자 문서에 삽입되어 있는 복수의 이미지 개체들을 추출하는 이미지 추출부, 상기 전자 문서로부터 상기 복수의 단어들의 상기 전자 문서 상에서의 위치와 연관된 제1 레이아웃(layout) 정보와 상기 복수의 이미지 개체들의 상기 전자 문서 상에서의 위치와 연관된 제2 레이아웃 정보를 추출하는 레이아웃 정보 추출부, 상기 제1 레이아웃 정보와 상기 제2 레이아웃 정보에 기초하여 상기 전자 문서 상에서 상기 복수의 이미지 개체들 각각으로부터 상기 복수의 단어들 각각이 이격되어 있는 거리를 연산하는 거리 연산부 및 상기 연산된 거리에 기초하여 상기 복수의 단어들 각각에 대해 상기 복수의 이미지 개체들과의 연관도에 대한 정보를 할당하고, 상기 할당된 연관도에 대한 정보를 데이터베이스에 저장하는 연관도 할당부를 포함한다.
또한, 본 발명의 일실시예에 따른 전자 문서 내 이미지 검색 방법은 메모리에 저장되어 있는 전자 문서로부터 상기 전자 문서에 삽입되어 있는 복수의 단어들을 추출하는 단계, 상기 전자 문서로부터 상기 전자 문서에 삽입되어 있는 복수의 이미지 개체들을 추출하는 단계, 상기 전자 문서로부터 상기 복수의 단어들의 상기 전자 문서 상에서의 위치와 연관된 제1 레이아웃 정보와 상기 복수의 이미지 개체들의 상기 전자 문서 상에서의 위치와 연관된 제2 레이아웃 정보를 추출하는 단계, 상기 제1 레이아웃 정보와 상기 제2 레이아웃 정보에 기초하여 상기 전자 문서 상에서 상기 복수의 이미지 개체들 각각으로부터 상기 복수의 단어들 각각이 이격되어 있는 거리를 연산하는 단계 및 상기 연산된 거리에 기초하여 상기 복수의 단어들 각각에 대해 상기 복수의 이미지 개체들과의 연관도에 대한 정보를 할당하고, 상기 할당된 연관도에 대한 정보를 데이터베이스에 저장하는 단계를 포함한다.
본 발명의 실시예들은 전자 문서에 삽입되어 있는 단어들과 이미지들 간의 이격 거리를 연산하고, 상기 연산된 이격 거리를 기초로 상기 단어들 각각에 대해 상기 이미지들과의 연관도에 대한 정보를 할당하여 데이터베이스에 저장해 놓은 후 사용자가 소정의 검색어를 입력하면, 상기 검색어에 할당되어 있는 연관도에 대한 정보를 기초로 상기 전자 문서에 삽입되어 있는 이미지들 중 상기 검색어와 연관도가 높은 이미지를 추출하여 검색 결과로 출력함으로써, 사용자가 전자 문서 상에 삽입되어 있는 이미지들에 대한 검색을 손쉽게 수행할 수 있도록 지원할 수 있다.
도 1은 본 발명의 일실시예에 따른 전자 문서 내 이미지 검색 장치의 구조를 도시한 도면이다.
도 2는 본 발명의 일실시예에 따른 전자 문서 내 이미지 검색 장치의 동작을 설명하기 위한 도면이다.
도 3은 본 발명의 일실시예에 따른 전자 문서 내 이미지 검색 방법을 도시한 순서도이다.
본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세한 설명에 상세하게 설명하고자 한다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 각 도면을 설명하면서 유사한 참조부호를 유사한 구성요소에 대해 사용하였다.
어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다.
본 출원에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥 상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.
이하에서, 본 발명에 따른 실시예들을 첨부된 도면을 참조하여 상세하게 설명한다.
도 1은 본 발명의 일실시예에 따른 전자 문서 내 이미지 검색 장치의 구조를 도시한 도면이다.
도 1을 참조하면, 본 발명의 일실시예에 따른 전자 문서 내 이미지 검색 장치(110)는 단어 추출부(111), 이미지 추출부(112), 레이아웃(layout) 정보 추출부(113), 거리 연산부(114) 및 연관도 할당부(115)를 포함한다.
여기서, 본 발명의 일실시예에 따른 전자 문서 내 이미지 검색 장치(110)는 데스크탑 PC, 모바일 단말, PDA, 노트북, 태블릿 PC 등 다양한 종류의 마이크로프로세서 기반의 장치를 기반으로 구현될 수 있다.
단어 추출부(111)는 메모리에 저장되어 있는 전자 문서로부터 상기 전자 문서에 삽입되어 있는 복수의 단어들을 추출한다.
이미지 추출부(112)는 상기 전자 문서로부터 상기 전자 문서에 삽입되어 있는 복수의 이미지 개체들을 추출한다.
레이아웃 정보 추출부(113)는 상기 전자 문서로부터 상기 복수의 단어들의 상기 전자 문서 상에서의 위치와 연관된 제1 레이아웃 정보와 상기 복수의 이미지 개체들의 상기 전자 문서 상에서의 위치와 연관된 제2 레이아웃 정보를 추출한다.
거리 연산부(114)는 상기 제1 레이아웃 정보와 상기 제2 레이아웃 정보에 기초하여 상기 전자 문서 상에서 상기 복수의 이미지 개체들 각각으로부터 상기 복수의 단어들 각각이 이격되어 있는 거리를 연산한다.
이때, 본 발명의 일실시예에 따르면, 거리 연산부(114)는 상기 제1 레이아웃 정보에 기초하여 상기 복수의 단어들 각각의 중점에 대한 좌표를 확인하고, 상기 제2 레이아웃 정보에 기초하여 상기 복수의 이미지 개체들 각각의 중점에 대한 좌표를 확인한 후 상기 복수의 단어들 각각의 중점에 대한 좌표와 상기 복수의 이미지 개체들 각각의 중점에 대한 좌표를 기초로 상기 복수의 이미지 개체들 각각의 중점과 상기 복수의 단어들 각각의 중점 간의 거리를 연산함으로써, 상기 전자 문서 상에서 상기 복수의 이미지 개체들 각각으로부터 상기 복수의 단어들 각각이 이격되어 있는 거리를 연산할 수 있다.
연관도 할당부(115)는 상기 연산된 거리에 기초하여 상기 복수의 단어들 각각에 대해 상기 복수의 이미지 개체들과의 연관도에 대한 정보를 할당하고, 상기 할당된 연관도에 대한 정보를 데이터베이스(116)에 저장한다.
본 발명의 일실시예에 따르면, 전자 문서 내 이미지 검색 장치(110)는 검색어 입력부(117), 판단부(118), 이미지 검색부(119) 및 검색 결과 출력부(120)를 더 포함할 수 있다.
검색어 입력부(117)는 사용자로부터 이미지 검색과 연관된 검색어를 입력받는다.
판단부(118)는 상기 복수의 단어들 중 상기 검색어와 일치하는 단어가 존재하는지 여부를 판단한다.
이미지 검색부(119)는 상기 복수의 단어들 중 상기 검색어와 일치하는 단어가 존재하는 것으로 판단된 경우, 데이터베이스(116)로부터 상기 검색어에 할당되어 있는 연관도에 대한 정보를 참조하여 상기 복수의 이미지 개체들 중 선정된(predetermined) 연관도 이상의 연관도를 갖는 적어도 하나의 이미지 개체를 추출한다.
검색 결과 출력부(120)는 상기 추출된 적어도 하나의 이미지 개체를 검색 결과로 출력한다.
이하에서는 도 2를 참조하여, 본 발명의 일실시예에 따른 전자 문서 내 이미지 검색 장치(110)의 동작에 대해 예를 들어 상세히 설명하기로 한다.
도 2는 본 발명의 일실시예에 따른 전자 문서 내 이미지 검색 장치(110)의 동작을 설명하기 위한 도면이다.
우선, 단어 추출부(111)는 메모리에 저장되어 있는 전자 문서(210)로부터 전자 문서(210)에 삽입되어 있는 복수의 단어들인 '컴퓨터'(221), '스마트폰'(222), '전화기'(223), '프린터'(224), '노트북'(225)을 추출할 수 있다.
그리고, 이미지 추출부(112)는 전자 문서(210)로부터 전자 문서(210)에 삽입되어 있는 복수의 이미지 개체들인 이미지 1(211), 이미지 2(212), 이미지 3(213)을 추출할 수 있다.
또한, 레이아웃 정보 추출부(113)는 전자 문서(210)로부터 '컴퓨터'(221), '스마트폰'(222), '전화기'(223), '프린터'(224), '노트북'(225)이라는 단어 각각에 대한 전자 문서(210) 상에서의 위치와 연관된 제1 레이아웃 정보를 추출할 수 있고, 이미지 1(211), 이미지 2(212), 이미지 3(213)이라는 이미지 개체 각각에 대한 전자 문서(210) 상에서의 위치와 연관된 제2 레이아웃 정보를 추출할 수 있다.
이때, 거리 연산부(114)는 상기 제1 레이아웃 정보와 상기 제2 레이아웃 정보에 기초하여 전자 문서(210) 상에서 이미지 1(211)로부터 '컴퓨터'(221), '스마트폰'(222), '전화기'(223), '프린터'(224), '노트북'(225)이라는 단어 각각이 떨어져 있는 거리를 연산할 수 있고, 이미지 2(212)로부터 '컴퓨터'(221), '스마트폰'(222), '전화기'(223), '프린터'(224), '노트북'(225)이라는 단어 각각이 떨어져있는 거리를 연산할 수 있으며, 이미지 3(213)으로부터 '컴퓨터'(221), '스마트폰'(222), '전화기'(223), '프린터'(224), '노트북'(225)이라는 단어 각각이 떨어져있는 거리를 연산할 수 있다.
이때, 본 발명의 일실시예에 따르면, 거리 연산부(114)는 상기 제1 레이아웃 정보에 기초하여 '컴퓨터'(221), '스마트폰'(222), '전화기'(223), '프린터'(224), '노트북'(225)이라는 단어 각각의 중점에 대한 좌표를 확인하고, 상기 제2 레이아웃 정보에 기초하여 이미지 1(211), 이미지 2(212), 이미지 3(213) 각각의 중점에 대한 좌표를 확인한 후 이미지 1(211)의 중점과 '컴퓨터'(221), '스마트폰'(222), '전화기'(223), '프린터'(224), '노트북'(225)이라는 단어 각각의 중점 간의 거리를 연산하고, 이미지 2(212)의 중점과 '컴퓨터'(221), '스마트폰'(222), '전화기'(223), '프린터'(224), '노트북'(225)이라는 단어 각각의 중점 간의 거리를 연산하며, 이미지 3(213)의 중점과 '컴퓨터'(221), '스마트폰'(222), '전화기'(223), '프린터'(224), '노트북'(225)이라는 단어 각각의 중점 간의 거리를 연산함으로써, 전자 문서(210) 상에서 이미지 1(211), 이미지 2(212), 이미지 3(213) 각각으로부터 '컴퓨터'(221), '스마트폰'(222), '전화기'(223), '프린터'(224), '노트북'(225)이라는 단어 각각이 이격되어 있는 거리를 연산할 수 있다.
이렇게, 거리에 대한 연산이 완료되면, 연관도 할당부(115)는 상기 연산된 거리에 기초하여 '컴퓨터'(221), '스마트폰'(222), '전화기'(223), '프린터'(224), '노트북'(225)이라는 단어 각각에 대해 이미지 1(211), 이미지 2(212), 이미지 3(213)과의 연관도에 대한 정보를 할당하고, 상기 할당된 연관도에 대한 정보를 데이터베이스(116)에 저장할 수 있다.
이때, 본 발명의 일실시예에 따르면, 연관도 할당부(115)는 상기 복수의 단어들인 '컴퓨터'(221), '스마트폰'(222), '전화기'(223), '프린터'(224), '노트북'(225) 각각에 대해 상기 복수의 이미지 개체들인 이미지 1(211), 이미지 2(212), 이미지 3(213)과의 연관도에 대한 정보로 상기 연산된 거리에 기초한 연관도 점수를 할당하되, 상기 연관도 점수를 상기 연산된 거리에 반비례하게 할당할 수 있다.
이와 관련하여, 거리 연산부(114)를 통해 전자 문서(210) 상에서 이미지 1(211), 이미지 2(212), 이미지 3(213) 각각으로부터 '컴퓨터'(221), '스마트폰'(222), '전화기'(223), '프린터'(224), '노트북'(225)이라는 단어 각각이 이격되어 있는 거리가 하기의 표 1과 같이 연산되었다고 가정하자.
이미지 개체
이미지 1(211) 이미지 2(212) 이미지 3(213)
단어 컴퓨터(221) 2cm 8cm 4cm
스마트폰(222) 4cm 6cm 3cm
전화기(223) 5cm 5cm 2cm
프린터(224) 7cm 7cm 4cm
노트북(225) 8cm 2cm 4cm
여기서, 상기 표 1의 각 셀에 표기된 숫자가 상기 복수의 이미지 개체들 각각으로부터 상기 복수의 단어들 각각이 이격되어 있는 거리를 의미한다.
이때, 연관도 할당부(115)는 '컴퓨터'(221), '스마트폰'(222), '전화기'(223), '프린터'(224), '노트북'(225)이라는 단어 각각에 대해 이미지 1(211), 이미지 2(212), 이미지 3(213)과의 연관도에 대한 정보로 상기 표 1에 나타낸 거리와 반비례하는 관계를 갖는 연관도 점수를 할당할 수 있다.
이와 관련하여, 연관도 할당부(115)는 '컴퓨터'(221), '스마트폰'(222), '전화기'(223), '프린터'(224), '노트북'(225)이라는 단어 각각에 대해 하기의 표 2와 같은 연관도 점수를 할당할 수 있다.
이미지 개체
이미지 1(211) 이미지 2(212) 이미지 3(213)
단어 컴퓨터(221) 9점 3점 7점
스마트폰(222) 7점 5점 8점
전화기(223) 6점 6점 9점
프린터(224) 4점 4점 7점
노트북(225) 3점 9점 7점
여기서, 상기 표 2의 각 셀에 표기된 숫자가 상기 복수의 단어들 각각에 대해 할당된 상기 복수의 이미지 개체들과의 연관도 점수를 의미한다.
이렇게, '컴퓨터'(221), '스마트폰'(222), '전화기'(223), '프린터'(224), '노트북'(225)이라는 단어 각각에 대해 이미지 1(211), 이미지 2(212), 이미지 3(213)과의 연관도에 대한 정보의 할당이 완료되면, 연관도 할당부(115)는 상기 할당된 연관도에 대한 정보를 데이터베이스(116)에 저장할 수 있다.
본 발명의 일실시예에 따르면, 전자 문서 내 이미지 검색 장치(110)는 전자 문서(210)에 삽입되어 있는 복수의 단어들에 대해 전자 문서(210)에 삽입되어 있는 복수의 이미지 개체들과의 연관도에 대한 정보를 할당하는 과정에서 전자 문서(210)의 각 페이지 별로 상기 복수의 단어들과 상기 복수의 이미지 개체들 간의 이격 거리를 연산한 후 상기 연산된 이격 거리를 기초로 상기 각 페이지 별로 상기 복수의 단어들 각각에 대해 상기 연관도에 대한 정보를 할당할 수 있다.
다시 말해서, 전자 문서(210)가 복수의 페이지들로 구성되어 있는 경우, 서로 다른 페이지에 위치하는 단어와 이미지 개체 간에는 거리를 연산하는 것이 곤란할 수 있기 때문에 거리 연산부(114)는 전자 문서(210)를 구성하는 각 페이지 별로 각 페이지에 삽입되어 있는 단어들과 이미지 개체들 간에 이격 거리를 연산할 수 있고, 연관도 할당부(115)는 상기 각 페이지 별로 각 페이지에 삽입되어 있는 단어들 각각에 대해 동일 페이지에 삽입되어 있는 이미지 개체들과의 연관도에 대한 정보를 할당한 후 상기 각 페이지 별로 단어들에 할당된 연관도에 대한 정보를 종합하여 데이터베이스(116)에 저장할 수 있다.
예컨대, 전자 문서(210)가 2페이지로 구성되어 있는 경우, 거리 연산부(114)는 1페이지에 삽입되어 있는 단어들과 상기 1페이지에 삽입되어 있는 이미지 개체들 간의 이격 거리를 연산하고, 연관도 할당부(115)는 상기 1페이지에 삽입되어 있는 단어들 각각에 대해 상기 1페이지에 삽입되어 있는 이미지 개체들과의 연관도에 대한 정보를 할당할 수 있다.
또한, 거리 연산부(114)는 2페이지에 삽입되어 있는 단어들과 상기 2페이지에 삽입되어 있는 이미지 개체들 간의 이격 거리를 연산하고, 연관도 할당부(115)는 상기 2페이지에 삽입되어 있는 단어들 각각에 대해 상기 2페이지에 삽입되어 있는 이미지 개체들과의 연관도에 대한 정보를 할당할 수 있다.
이렇게, 상기 1페이지와 상기 2페이지 각각에 삽입되어 있는 단어들에 대해 상기 연관도에 대한 정보의 할당이 완료되면, 연관도 할당부(115)는 상기 1페이지와 상기 2페이지 각각에 삽입되어 있는 단어들에 대해 할당된 연관도에 대한 정보를 통합하여 데이터베이스(116)에 저장할 수 있다.
또한, 본 발명의 일실시예에 따르면, 거리 연산부(114)는 전자 문서(210)로부터 추출된 복수의 단어들 중 중복되는 단어가 존재하는 경우, 중복되는 단어들을 각각 독립된 하나의 단어로 취급하여 전자 문서(210)에 삽입되어 있는 복수의 이미지 개체들 각각으로부터 상기 복수의 단어들 각각이 이격되어 있는 거리를 연산할 수 있고, 연관도 할당부(115)는 상기 중복되는 단어들을 각각 독립된 하나의 단어로 취급하여 상기 복수의 단어들 각각에 대해 상기 복수의 이미지 개체들과의 연관도 점수를 할당한 후 상기 중복되는 단어들에 대해 할당되어 있는 연관도 점수를 통합하여 데이터베이스(116)에 저장하되, 상기 중복되는 단어들에 대해 할당되어 있는 연관도 점수 중 동일한 이미지 개체에 대한 연관도 점수가 존재하는 경우, 상기 동일한 이미지 개체에 대한 연관도 점수 중 높은 연관도 점수만을 데이터베이스(116)에 저장할 수 있다.
예컨대, 전자 문서(210) 상에 '텔레비전'이라는 단어가 두 번 삽입되어 있고, '이미지 A'라는 이미지 개체가 삽입되어 있는 경우, 거리 연산부(114)는 '텔레비전'이라는 중복되는 단어를 각각 독립된 하나의 단어로 취급하여 '이미지 A'라는 이미지 개체로부터의 이격 거리를 연산할 수 있다.
본 실시예에서 '텔레비전'이라는 두 번 중복되는 단어를 편의상 '텔레비전 1', '텔레비전 2'라고 칭하기로 한다.
이때, 연관도 할당부(115)는 '이미지 A'와 '텔레비전 1' 간의 이격 거리에 기초하여 '텔레비전 1'에 대해 '이미지 A'와의 연관도와 관련된 연관도 점수를 할당할 수 있고, '이미지 A'와 '텔레비전 2' 간의 이격 거리에 기초하여 '텔레비전 2'에 대해 '이미지 A'와의 연관도와 관련된 연관도 점수를 할당할 수 있다.
그리고 나서, 연관도 할당부(115)는 '텔레비전 1'과 '텔레비전 2'의 '이미지 A'에 대한 연관도 점수를 '텔레비전'이라는 하나의 단어로 통합하여 데이터베이스(116)에 저장하기 위해, '텔레비전 1'에 대해 할당된 연관도 점수와 '텔레비전 2'에 대해 할당된 연관도 점수 중 높은 연관도 점수만을 선택한 후 선택된 연관도 점수를 '텔레비전'이라는 단어에 대해서 '이미지 A'와의 연관도와 관련된 연관도 점수로 데이터베이스(116)에 저장할 수 있다.
이렇게, 데이터베이스(116)에 '컴퓨터'(221), '스마트폰'(222), '전화기'(223), '프린터'(224), '노트북'(225)이라는 단어 각각과 이미지 1(211), 이미지 2(212), 이미지 3(213) 각각 간의 연관도에 대한 정보의 저장이 완료된 이후, 사용자가 전자 문서(210)에 삽입되어 있는 특정 이미지에 대한 검색을 수행하기 위해 소정의 검색어를 입력하면, 검색어 입력부(117)는 상기 사용자로부터 이미지 검색과 연관된 상기 검색어를 입력받을 수 있다.
관련하여, 이하에서는 상기 사용자가 상기 검색어로 '컴퓨터'라는 단어를 입력하였다고 가정하기로 한다.
이때, 판단부(118)는 전자 문서(210)에 삽입되어 있는 복수의 단어들인 '컴퓨터'(221), '스마트폰'(222), '전화기'(223), '프린터'(224), '노트북'(225) 중에서 상기 사용자가 입력한 '컴퓨터'라는 검색어와 일치하는 단어가 존재하는지 여부를 판단한다.
본 실시예에서 상기 사용자가 입력한 '컴퓨터'라는 검색어는 전자 문서(210)에 삽입되어 있는 상기 복수의 단어들인 '컴퓨터'(221), '스마트폰'(222), '전화기'(223), '프린터'(224), '노트북'(225) 중에서 '컴퓨터'(221)라는 단어와 일치하기 때문에 판단부(118)는 전자 문서(210)에 삽입되어 있는 상기 복수의 단어들 중에서 상기 사용자가 입력한 '컴퓨터'라는 검색어와 일치하는 단어가 존재하는 것으로 판단할 수 있다.
이때, 이미지 검색부(119)는 데이터베이스(116)로부터 상기 사용자가 입력한 '컴퓨터'라는 단어와 일치하는 단어인 '컴퓨터'(221)에 할당되어 있는 연관도에 대한 정보를 참조하여 이미지 1(211), 이미지 2(212), 이미지 3(213) 중 선정된 연관도 이상의 연관도를 갖는 적어도 하나의 이미지 개체를 추출할 수 있다.
이때, 본 발명의 일실시예에 따르면, 이미지 검색부(119)는 상기 복수의 단어들 중 상기 검색어와 일치하는 단어가 존재하는 것으로 판단된 경우, 데이터베이스(116)로부터 상기 검색어에 할당되어 있는 연관도 점수를 참조하여 상기 복수의 이미지 개체들 중 선정된 연관도 점수 이상의 연관도 점수를 갖는 상기 적어도 하나의 이미지 개체를 추출할 수 있다.
만약, 상기 선정된 연관도 점수를 7점이라고 하는 경우, 이미지 검색부(119)는 데이터베이스(116)로부터 상기 검색어와 일치하는 단어인 '컴퓨터'(221)에 할당되어 있는 연관도 점수를 참조하여 이미지 1(211), 이미지 2(212), 이미지 3(213) 중 상기 선정된 연관도 점수인 7점 이상의 연관도 점수를 갖는 이미지 개체인 이미지 1(211)과 이미지 3(213)을 추출할 수 있다.
이렇게, 이미지 1(211)과 이미지 3(213)에 대한 추출이 완료되면, 검색 결과 출력부(120)는 상기 추출된 이미지 1(211)과 이미지 3(213)을 상기 사용자가 입력한 '컴퓨터'라는 검색어에 대한 검색 결과로 출력할 수 있다.
이때, 본 발명의 일실시예에 따르면, 검색 결과 출력부(120)는 이미지 검색부(119)에서 적어도 하나의 이미지 개체에 대한 추출이 완료되면, 상기 추출된 적어도 하나의 이미지 개체를 사용자가 입력한 검색어에 할당되어 있는 연관도 점수가 높은 순서에 따라 선정된 방향으로 정렬하여 출력할 수 있다.
즉, 검색 결과 출력부(120)는 이미지 검색부(119)에서 추출된 이미지 1(211)과 이미지 3(213)을 상기 사용자가 입력한 '컴퓨터'라는 검색어에 대한 검색 결과로 출력하되, 상기 추출된 이미지 1(211)과 이미지 3(213)을 상기 검색어와 일치하는 단어인 '컴퓨터'(221)에 할당되어 있는 연관도 점수가 높은 순서에 따라 선정된 방향으로 정렬하여 출력할 수 있다.
예컨대, 검색 결과 출력부(120)는 이미지 1(211)과 이미지 3(213)을 썸네일(thumbnail) 형태의 미리보기 이미지로 구성한 후 상기 미리보기 이미지를 화면 상에 가로 방향 또는 세로 방향으로 이미지 1(211)과 이미지 3(213) 순으로 출력할 수 있다.
결국, 본 발명의 일실시예에 따른 전자 문서 내 이미지 검색 장치(110)는 전자 문서에 삽입되어 있는 단어들과 이미지들 간의 이격 거리를 연산하고, 상기 연산된 이격 거리를 기초로 상기 단어들 각각에 대해 상기 이미지들과의 연관도에 대한 정보를 할당하여 데이터베이스(116)에 저장해 놓은 후 사용자가 소정의 검색어를 입력하면, 상기 검색어에 할당되어 있는 연관도에 대한 정보를 기초로 상기 전자 문서에 삽입되어 있는 이미지들 중 상기 검색어와 연관도가 높은 이미지를 추출하여 검색 결과로 출력함으로써, 사용자가 전자 문서 상에 삽입되어 있는 이미지들에 대한 검색을 손쉽게 수행할 수 있도록 지원할 수 있다.
이상, 도 2를 참조하여, 본 발명의 일실시예에 따른 전자 문서 내 이미지 검색 장치(110)의 동작에 대해 예를 들어 상세히 설명하였다. 이하에서는 도 1을 참조하여, 본 발명의 일실시예에 따른 전자 문서 내 이미지 검색 장치(110)의 구조에 대해 계속 설명하기로 한다.
본 발명의 일실시예에 따르면, 전자 문서 내 이미지 검색 장치(110)는 가중치 데이터베이스(121) 및 서식 정보 추출부(122)를 더 포함할 수 있다.
가중치 데이터베이스(121)에는 복수의 서식 정보들과 상기 복수의 서식 정보들 각각에 대응되는 복수의 선정된 제1 가중치에 대한 정보들이 저장되어 있다.
서식 정보 추출부(122)는 상기 전자 문서로부터 상기 복수의 단어들에 대한 서식 정보를 추출한다.
이때, 연관도 할당부(115)는 가중치 데이터베이스(121)를 참조하여 상기 복수의 단어들 각각에 대해 상기 복수의 단어들 각각의 서식 정보와 대응되는 제1 가중치에 대한 정보를 확인한 후 상기 복수의 단어들 각각에 대한 연관도 점수에 대해 상기 복수의 단어들 각각의 서식 정보에 대응되는 상기 제1 가중치를 적용하여 상기 제1 가중치가 적용된 연관도 점수를 상기 복수의 단어들에 할당할 수 있다.
예컨대, 상기 전자 문서 상에 '컴퓨터'와 '노트북'이라는 단어가 삽입되어 있고, '이미지 1'이라는 이미지 개체가 삽입되어 있으며, '컴퓨터'라는 단어는 글자의 색상이 빨간색, '노트북'이라는 단어는 글자의 색상이 검은색이라고 가정하자.
그리고, 가중치 데이터베이스(121)에 글자의 색상이 빨간색인 단어에 대해서는 가중치 '2'가 할당되도록 하는 정보가 저장되어 있고, 글자의 색상이 검은색인 단어에 대해서는 가중치 '1'이 할당되도록 하는 정보가 저장되어 있다고 가정하자.
만약, 연관도 할당부(115)에서 '컴퓨터'와 '노트북'이라는 단어에 대해서 상기 '이미지 1'이라는 이미지 개체와의 이격 거리를 기초로 산정된 연관도 점수가 각각 '3점'과 '4점'인 경우, 연관도 할당부(115)는 상기 이격 거리를 기초로 산정된 연관도 점수인 '3점'과 '4점'에 대해 각각 가중치 '2'와 '1'을 적용하여 '컴퓨터'라는 단어에 대해 '이미지 1'과의 최종 연관도 점수로 '6점'을 할당할 수 있고, '노트북'이라는 단어에 대해 '이미지 1'과의 최종 연관도 점수로 '4점'을 할당할 수 있다.
이로 인해, 추후 검색어 입력부(117)가 사용자로부터 '컴퓨터'라는 검색어를 입력받았고, 이미지 검색부(119)가 상기 사용자로부터 입력받은 검색어에 할당되어 있는 연관도 점수 중 '6점'이상의 연관도 점수를 갖는 이미지 개체를 추출하도록 설정되어 있는 경우, 검색 결과 출력부(120)는 '이미지 1'을 검색 결과로 출력할 수 있어서, 사용자가 '이미지 1'을 '컴퓨터'라는 검색어와 연관된 이미지 개체로 확인할 수 있도록 보조할 수 있다.
또한, 본 발명의 일실시예에 따르면, 전자 문서 내 이미지 검색 장치(110)는 구조 정보 확인부(123)를 더 포함할 수 있다.
우선, 가중치 데이터베이스(121)는 복수의 문서 구조 정보들과 상기 복수의 문서 구조 정보들 각각에 대응되는 복수의 선정된 제2 가중치에 대한 정보들이 저장되어 있을 수 있다.
이때, 구조 정보 확인부(123)는 상기 전자 문서가 구조화된 문서(structured document)인 경우, 상기 전자 문서의 구조를 분석하여 상기 복수의 단어들에 지정되어 있는 문서 구조 정보를 확인할 수 있다.
이때, 연관도 할당부(115)는 가중치 데이터베이스(121)를 참조하여 상기 복수의 단어들 각각에 대해 상기 복수의 단어들 각각에 지정되어 있는 문서 구조 정보와 대응되는 제2 가중치에 대한 정보를 확인한 후 상기 복수의 단어들 각각에 대한 연관도 점수에 대해 상기 복수의 단어들 각각에 지정되어 있는 문서 구조 정보에 대응되는 상기 제2 가중치를 적용하여 상기 제2 가중치가 적용된 연관도 점수를 상기 복수의 단어들에 할당할 수 있다.
예컨대, 상기 전자 문서가 xml(eXtensible Markup Language) 문서와 같은 구조화된 문서이고, 상기 전자 문서 상에 '컴퓨터'와 '노트북'이라는 단어가 삽입되어 있음과 동시에 '이미지 1'이라는 이미지 개체가 삽입되어 있으며, '컴퓨터'라는 단어에 대해서는 상기 전자 문서 상에서 제목에 해당되는 문서 구조 정보가 지정되어 있고, '노트북'이라는 단어에 대해서는 상기 전자 문서 상에서 본문에 해당되는 문서 구조 정보가 지정되어 있다고 가정하자.
그리고, 가중치 데이터베이스(121)에 제목에 해당되는 문서 구조 정보가 지정되어 있는 단어에 대해서는 가중치 '3'이 할당되도록 하는 정보가 저장되어 있고, 본문에 해당되는 문서 구조 정보가 지정되어 있는 단어에 대해서는 가중치 '1'이 할당되도록 하는 정보가 저장되어 있다고 가정하자.
만약, 연관도 할당부(115)에서 '컴퓨터'와 '노트북'이라는 단어에 대해서 상기 '이미지 1'이라는 이미지 개체와의 이격 거리를 기초로 산정된 연관도 점수가 각각 '3점'과 '6점'인 경우, 연관도 할당부(115)는 상기 이격 거리를 기초로 산정된 연관도 점수인 '3점'과 '6점'에 대해 각각 가중치 '3'과 '1'을 적용하여 '컴퓨터'라는 단어에 대해 '이미지 1'과의 최종 연관도 점수로 '9점'을 할당할 수 있고, '노트북'이라는 단어에 대해 '이미지 1'과의 최종 연관도 점수로 '6점'을 할당할 수 있다.
이로 인해, 추후 검색어 입력부(117)가 사용자로부터 '컴퓨터'라는 검색어를 입력받았고, 이미지 검색부(119)가 상기 사용자로부터 입력받은 검색어에 할당되어 있는 연관도 점수 중 '8점'이상의 연관도 점수를 갖는 이미지 개체를 추출하도록 설정되어 있는 경우, 검색 결과 출력부(120)는 '이미지 1'을 검색 결과로 출력할 수 있어서, 사용자가 '이미지 1'을 '컴퓨터'라는 검색어와 연관된 이미지 개체로 확인할 수 도록 보조할 수 있다.
도 3은 본 발명의 일실시예에 따른 전자 문서 내 이미지 검색 방법을 도시한 순서도이다.
단계(S310)에서는 메모리에 저장되어 있는 전자 문서로부터 상기 전자 문서에 삽입되어 있는 복수의 단어들을 추출한다.
단계(S320)에서는 상기 전자 문서로부터 상기 전자 문서에 삽입되어 있는 복수의 이미지 개체들을 추출한다.
단계(S330)에서는 상기 전자 문서로부터 상기 복수의 단어들의 상기 전자 문서 상에서의 위치와 연관된 제1 레이아웃 정보와 상기 복수의 이미지 개체들의 상기 전자 문서 상에서의 위치와 연관된 제2 레이아웃 정보를 추출한다.
단계(S340)에서는 상기 제1 레이아웃 정보와 상기 제2 레이아웃 정보에 기초하여 상기 전자 문서 상에서 상기 복수의 이미지 개체들 각각으로부터 상기 복수의 단어들 각각이 이격되어 있는 거리를 연산한다.
단계(S350)에서는 상기 연산된 거리에 기초하여 상기 복수의 단어들 각각에 대해 상기 복수의 이미지 개체들과의 연관도에 대한 정보를 할당하고, 상기 할당된 연관도에 대한 정보를 데이터베이스에 저장한다.
이때, 본 발명의 일실시예에 따르면, 상기 전자 문서 내 이미지 검색 방법은 단계(S350)이후에 사용자로부터 이미지 검색과 연관된 검색어를 입력받는 단계, 상기 복수의 단어들 중 상기 검색어와 일치하는 단어가 존재하는지 여부를 판단하는 단계, 상기 복수의 단어들 중 상기 검색어와 일치하는 단어가 존재하는 것으로 판단된 경우, 상기 데이터베이스로부터 상기 검색어에 할당되어 있는 연관도에 대한 정보를 참조하여 상기 복수의 이미지 개체들 중 선정된 연관도 이상의 연관도를 갖는 적어도 하나의 이미지 개체를 추출하는 단계 및 상기 추출된 적어도 하나의 이미지 개체를 검색 결과로 출력하는 단계를 더 포함할 수 있다.
이때, 본 발명의 일실시예에 따르면, 단계(S350)에서는 상기 복수의 단어들 각각에 대해 상기 복수의 이미지 개체들과의 연관도에 대한 정보로 상기 연산된 거리에 기초한 연관도 점수를 할당하되, 상기 연관도 점수를 상기 연산된 거리에 반비례하게 할당할 수 있다.
또한, 본 발명의 일실시예에 따르면, 상기 적어도 하나의 이미지 개체를 추출하는 단계는 상기 복수의 단어들 중 상기 검색어와 일치하는 단어가 존재하는 것으로 판단된 경우, 상기 데이터베이스로부터 상기 검색어에 할당되어 있는 연관도 점수를 참조하여 상기 복수의 이미지 개체들 중 선정된 연관도 점수 이상의 연관도 점수를 갖는 상기 적어도 하나의 이미지 개체를 추출할 수 있다.
또한, 본 발명의 일실시예에 따르면, 상기 검색 결과로 출력하는 단계는 상기 추출된 적어도 하나의 이미지 개체를 상기 검색어에 할당되어 있는 연관도 점수가 높은 순서에 따라 선정된 방향으로 정렬하여 출력할 수 있다.
본 발명의 일실시예에 따르면, 상기 전자 문서 내 이미지 검색 방법은 복수의 서식 정보들과 상기 복수의 서식 정보들 각각에 대응되는 복수의 선정된 제1 가중치에 대한 정보들이 저장되어 있는 가중치 데이터베이스를 유지하는 단계 및 상기 전자 문서로부터 상기 복수의 단어들에 대한 서식 정보를 추출하는 단계를 더 포함할 수 있다.
이때, 단계(S350)에서는 상기 가중치 데이터베이스를 참조하여 상기 복수의 단어들 각각에 대해 상기 복수의 단어들 각각의 서식 정보와 대응되는 제1 가중치에 대한 정보를 확인한 후 상기 복수의 단어들 각각에 대한 연관도 점수에 대해 상기 복수의 단어들 각각의 서식 정보에 대응되는 상기 제1 가중치를 적용하여 상기 제1 가중치가 적용된 연관도 점수를 상기 복수의 단어들에 할당할 수 있다.
또한, 본 발명의 일실시예에 따르면, 상기 가중치 데이터베이스에는 복수의 문서 구조 정보들과 상기 복수의 문서 구조 정보들 각각에 대응되는 복수의 선정된 제2 가중치에 대한 정보들이 저장되어 있을 수 있다.
이때, 본 발명의 일실시예에 따르면, 상기 전자 문서 내 이미지 검색 방법은 상기 전자 문서가 구조화된 문서인 경우, 상기 전자 문서의 구조를 분석하여 상기 복수의 단어들에 지정되어 있는 문서 구조 정보를 확인하는 단계를 더 포함할 수 있다.
이때, 단계(S350)에서는 상기 가중치 데이터베이스를 참조하여 상기 복수의 단어들 각각에 대해 상기 복수의 단어들 각각에 지정되어 있는 문서 구조 정보와 대응되는 제2 가중치에 대한 정보를 확인한 후 상기 복수의 단어들 각각에 대한 연관도 점수에 대해 상기 복수의 단어들 각각에 지정되어 있는 문서 구조 정보에 대응되는 상기 제2 가중치를 적용하여 상기 제2 가중치가 적용된 연관도 점수를 상기 복수의 단어들에 할당할 수 있다.
이상, 도 3을 참조하여 본 발명의 일실시예에 따른 전자 문서 내 이미지 검색 방법에 대해 설명하였다. 여기서, 본 발명의 일실시예에 따른 전자 문서 내 이미지 검색 방법은 도 1과 도 2를 이용하여 설명한 전자 문서 내 이미지 검색 장치(110)의 동작에 대한 구성과 대응될 수 있으므로, 이에 대한 보다 상세한 설명은 생략하기로 한다.
본 발명의 일실시예에 따른 전자 문서 내 이미지 검색 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 본 발명의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
이상과 같이 본 발명에서는 구체적인 구성 요소 등과 같은 특정 사항들과 한정된 실시예 및 도면에 의해 설명되었으나 이는 본 발명의 보다 전반적인 이해를 돕기 위해서 제공된 것일 뿐, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 본 발명이 속하는 분야에서 통상적인 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다.
따라서, 본 발명의 사상은 설명된 실시예에 국한되어 정해져서는 아니되며, 후술하는 특허청구범위뿐 아니라 이 특허청구범위와 균등하거나 등가적 변형이 있는 모든 것들은 본 발명 사상의 범주에 속한다고 할 것이다.
110: 전자 문서 내 이미지 검색 장치
111: 단어 추출부 112: 이미지 추출부
113: 레이아웃(layout) 정보 추출부 114: 거리 연산부
115: 연관도 할당부 116: 데이터베이스
117: 검색어 입력부 118: 판단부
119: 이미지 검색부 120: 검색 결과 출력부
121: 가중치 데이터베이스 122: 서식 정보 추출부
123: 구조 정보 확인부

Claims (15)

  1. 메모리에 저장되어 있는 전자 문서로부터 상기 전자 문서에 삽입되어 있는 복수의 단어들을 추출하는 단어 추출부;
    상기 전자 문서로부터 상기 전자 문서에 삽입되어 있는 복수의 이미지 개체들을 추출하는 이미지 추출부;
    상기 전자 문서로부터 상기 복수의 단어들의 상기 전자 문서 상에서의 위치와 연관된 제1 레이아웃(layout) 정보와 상기 복수의 이미지 개체들의 상기 전자 문서 상에서의 위치와 연관된 제2 레이아웃 정보를 추출하는 레이아웃 정보 추출부;
    상기 제1 레이아웃 정보와 상기 제2 레이아웃 정보에 기초하여 상기 전자 문서 상에서 상기 복수의 이미지 개체들 각각으로부터 상기 복수의 단어들 각각이 이격되어 있는 거리를 연산하는 거리 연산부; 및
    상기 연산된 거리에 기초하여 상기 복수의 단어들 각각에 대해 상기 복수의 이미지 개체들과의 연관도에 대한 정보를 할당하고, 상기 할당된 연관도에 대한 정보를 데이터베이스에 저장하는 연관도 할당부
    를 포함하는 전자 문서 내 이미지 검색 장치.
  2. 제1항에 있어서,
    사용자로부터 이미지 검색과 연관된 검색어를 입력받는 검색어 입력부;
    상기 복수의 단어들 중 상기 검색어와 일치하는 단어가 존재하는지 여부를 판단하는 판단부;
    상기 복수의 단어들 중 상기 검색어와 일치하는 단어가 존재하는 것으로 판단된 경우, 상기 데이터베이스로부터 상기 검색어에 할당되어 있는 연관도에 대한 정보를 참조하여 상기 복수의 이미지 개체들 중 선정된(predetermined) 연관도 이상의 연관도를 갖는 적어도 하나의 이미지 개체를 추출하는 이미지 검색부; 및
    상기 추출된 적어도 하나의 이미지 개체를 검색 결과로 출력하는 검색 결과 출력부
    를 더 포함하는 전자 문서 내 이미지 검색 장치.
  3. 제2항에 있어서,
    상기 연관도 할당부는
    상기 복수의 단어들 각각에 대해 상기 복수의 이미지 개체들과의 연관도에 대한 정보로 상기 연산된 거리에 기초한 연관도 점수를 할당하되, 상기 연관도 점수를 상기 연산된 거리에 반비례하게 할당하는 전자 문서 내 이미지 검색 장치.
  4. 제3항에 있어서,
    상기 이미지 검색부는
    상기 복수의 단어들 중 상기 검색어와 일치하는 단어가 존재하는 것으로 판단된 경우, 상기 데이터베이스로부터 상기 검색어에 할당되어 있는 연관도 점수를 참조하여 상기 복수의 이미지 개체들 중 선정된(predetermined) 연관도 점수 이상의 연관도 점수를 갖는 상기 적어도 하나의 이미지 개체를 추출하는 전자 문서 내 이미지 검색 장치.
  5. 제4항에 있어서,
    상기 검색 결과 출력부는
    상기 추출된 적어도 하나의 이미지 개체를 상기 검색어에 할당되어 있는 연관도 점수가 높은 순서에 따라 화면 상에 가로 방향 또는 세로 방향 중 상기 사용자에 의해 기 설정된 방향으로 정렬하여 출력하는 전자 문서 내 이미지 검색 장치.
  6. 제3항에 있어서,
    복수의 서식 정보들과 상기 복수의 서식 정보들 각각에 대응되는 복수의 선정된 제1 가중치에 대한 정보들이 저장되어 있는 가중치 데이터베이스; 및
    상기 전자 문서로부터 상기 복수의 단어들에 대한 서식 정보를 추출하는 서식 정보 추출부
    를 더 포함하고,
    상기 연관도 할당부는
    상기 가중치 데이터베이스를 참조하여 상기 복수의 단어들 각각에 대해 상기 복수의 단어들 각각의 서식 정보와 대응되는 제1 가중치에 대한 정보를 확인한 후 상기 복수의 단어들 각각에 대한 연관도 점수에 대해 상기 복수의 단어들 각각의 서식 정보에 대응되는 상기 제1 가중치를 적용하여 상기 제1 가중치가 적용된 연관도 점수를 상기 복수의 단어들에 할당하는 전자 문서 내 이미지 검색 장치.
  7. 제6항에 있어서,
    상기 전자 문서가 구조화된 문서(structured document)인 경우, 상기 전자 문서의 구조를 분석하여 상기 복수의 단어들에 지정되어 있는 문서 구조 정보를 확인하는 구조 정보 확인부
    를 더 포함하고,
    상기 가중치 데이터베이스에는
    복수의 문서 구조 정보들과 상기 복수의 문서 구조 정보들 각각에 대응되는 복수의 선정된 제2 가중치에 대한 정보들이 저장되어 있으며,
    상기 연관도 할당부는
    상기 가중치 데이터베이스를 참조하여 상기 복수의 단어들 각각에 대해 상기 복수의 단어들 각각에 지정되어 있는 문서 구조 정보와 대응되는 제2 가중치에 대한 정보를 확인한 후 상기 복수의 단어들 각각에 대한 연관도 점수에 대해 상기 복수의 단어들 각각에 지정되어 있는 문서 구조 정보에 대응되는 상기 제2 가중치를 적용하여 상기 제2 가중치가 적용된 연관도 점수를 상기 복수의 단어들에 할당하는 전자 문서 내 이미지 검색 장치.
  8. 단어 추출부가 메모리에 저장되어 있는 전자 문서로부터 상기 전자 문서에 삽입되어 있는 복수의 단어들을 추출하는 단계;
    이미지 추출부가 상기 전자 문서로부터 상기 전자 문서에 삽입되어 있는 복수의 이미지 개체들을 추출하는 단계;
    레이아웃 정보 추출부가 상기 전자 문서로부터 상기 복수의 단어들의 상기 전자 문서 상에서의 위치와 연관된 제1 레이아웃(layout) 정보와 상기 복수의 이미지 개체들의 상기 전자 문서 상에서의 위치와 연관된 제2 레이아웃 정보를 추출하는 단계;
    거리 연산부가 상기 제1 레이아웃 정보와 상기 제2 레이아웃 정보에 기초하여 상기 전자 문서 상에서 상기 복수의 이미지 개체들 각각으로부터 상기 복수의 단어들 각각이 이격되어 있는 거리를 연산하는 단계; 및
    연관도 할당부가 상기 연산된 거리에 기초하여 상기 복수의 단어들 각각에 대해 상기 복수의 이미지 개체들과의 연관도에 대한 정보를 할당하고, 상기 할당된 연관도에 대한 정보를 데이터베이스에 저장하는 단계
    를 포함하는 전자 문서 내 이미지 검색 방법.
  9. 제8항에 있어서,
    검색어 입력부가 사용자로부터 이미지 검색과 연관된 검색어를 입력받는 단계;
    판단부가 상기 복수의 단어들 중 상기 검색어와 일치하는 단어가 존재하는지 여부를 판단하는 단계;
    상기 복수의 단어들 중 상기 검색어와 일치하는 단어가 존재하는 것으로 판단된 경우, 이미지 검색부가 상기 데이터베이스로부터 상기 검색어에 할당되어 있는 연관도에 대한 정보를 참조하여 상기 복수의 이미지 개체들 중 선정된(predetermined) 연관도 이상의 연관도를 갖는 적어도 하나의 이미지 개체를 추출하는 단계; 및
    검색 결과 출력부가 상기 추출된 적어도 하나의 이미지 개체를 검색 결과로 출력하는 단계
    를 더 포함하는 전자 문서 내 이미지 검색 방법.
  10. 제9항에 있어서,
    상기 데이터베이스에 저장하는 단계는
    상기 연관도 할당부가 상기 복수의 단어들 각각에 대해 상기 복수의 이미지 개체들과의 연관도에 대한 정보로 상기 연산된 거리에 기초한 연관도 점수를 할당하되, 상기 연관도 점수를 상기 연산된 거리에 반비례하게 할당하는 전자 문서 내 이미지 검색 방법.
  11. 제10항에 있어서,
    상기 적어도 하나의 이미지 개체를 추출하는 단계는
    상기 복수의 단어들 중 상기 검색어와 일치하는 단어가 존재하는 것으로 판단된 경우, 상기 이미지 검색부가 상기 데이터베이스로부터 상기 검색어에 할당되어 있는 연관도 점수를 참조하여 상기 복수의 이미지 개체들 중 선정된(predetermined) 연관도 점수 이상의 연관도 점수를 갖는 상기 적어도 하나의 이미지 개체를 추출하는 전자 문서 내 이미지 검색 방법.
  12. 제11항에 있어서,
    상기 검색 결과로 출력하는 단계는
    상기 검색 결과 출력부가 상기 추출된 적어도 하나의 이미지 개체를 상기 검색어에 할당되어 있는 연관도 점수가 높은 순서에 따라 화면 상에 가로 방향 또는 세로 방향 중 상기 사용자에 의해 기 설정된 방향으로 정렬하여 출력하는 전자 문서 내 이미지 검색 방법.
  13. 제10항에 있어서,
    가중치 데이터베이스 유지부가 복수의 서식 정보들과 상기 복수의 서식 정보들 각각에 대응되는 복수의 선정된 제1 가중치에 대한 정보들이 저장되어 있는 가중치 데이터베이스를 유지하는 단계; 및
    서식 정보 추출부가 상기 전자 문서로부터 상기 복수의 단어들에 대한 서식 정보를 추출하는 단계
    를 더 포함하고,
    상기 데이터베이스에 저장하는 단계는
    상기 연관도 할당부가 상기 가중치 데이터베이스를 참조하여 상기 복수의 단어들 각각에 대해 상기 복수의 단어들 각각의 서식 정보와 대응되는 제1 가중치에 대한 정보를 확인한 후 상기 복수의 단어들 각각에 대한 연관도 점수에 대해 상기 복수의 단어들 각각의 서식 정보에 대응되는 상기 제1 가중치를 적용하여 상기 제1 가중치가 적용된 연관도 점수를 상기 복수의 단어들에 할당하는 전자 문서 내 이미지 검색 방법.
  14. 제13항에 있어서,
    상기 전자 문서가 구조화된 문서(structured document)인 경우, 구조 정보 확인부가 상기 전자 문서의 구조를 분석하여 상기 복수의 단어들에 지정되어 있는 문서 구조 정보를 확인하는 단계
    를 더 포함하고,
    상기 가중치 데이터베이스에는
    복수의 문서 구조 정보들과 상기 복수의 문서 구조 정보들 각각에 대응되는 복수의 선정된 제2 가중치에 대한 정보들이 저장되어 있으며,
    상기 데이터베이스에 저장하는 단계는
    상기 연관도 할당부가 상기 가중치 데이터베이스를 참조하여 상기 복수의 단어들 각각에 대해 상기 복수의 단어들 각각에 지정되어 있는 문서 구조 정보와 대응되는 제2 가중치에 대한 정보를 확인한 후 상기 복수의 단어들 각각에 대한 연관도 점수에 대해 상기 복수의 단어들 각각에 지정되어 있는 문서 구조 정보에 대응되는 상기 제2 가중치를 적용하여 상기 제2 가중치가 적용된 연관도 점수를 상기 복수의 단어들에 할당하는 전자 문서 내 이미지 검색 방법.
  15. 제8항 내지 제14항 중 어느 한 항의 방법을 수행하는 프로그램을 기록한 컴퓨터 판독 가능 기록 매체.
KR1020130000163A 2013-01-02 2013-01-02 전자 문서 내 이미지 검색 장치 및 방법 KR101270958B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020130000163A KR101270958B1 (ko) 2013-01-02 2013-01-02 전자 문서 내 이미지 검색 장치 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020130000163A KR101270958B1 (ko) 2013-01-02 2013-01-02 전자 문서 내 이미지 검색 장치 및 방법

Publications (1)

Publication Number Publication Date
KR101270958B1 true KR101270958B1 (ko) 2013-06-11

Family

ID=48866149

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020130000163A KR101270958B1 (ko) 2013-01-02 2013-01-02 전자 문서 내 이미지 검색 장치 및 방법

Country Status (1)

Country Link
KR (1) KR101270958B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210115670A (ko) * 2020-03-16 2021-09-27 주식회사 한글과컴퓨터 문서에 삽입된 개체와 관련 키워드들의 매칭을 통해 문서로부터의 개체 검색을 지원하는 전자 장치 및 그 동작 방법

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000123047A (ja) 1998-10-19 2000-04-28 Nec Corp キ―ワ―ドをメディア・オブジェクトに割り当てる方法、及び装置
JP2005107931A (ja) 2003-09-30 2005-04-21 Ricoh Co Ltd 画像検索装置
KR20080031928A (ko) * 2005-08-03 2008-04-11 윙크 테크놀로지스 인코포레이티드 태그를 분석하여 관련 문서를 찾기 위한 시스템 및 방법

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000123047A (ja) 1998-10-19 2000-04-28 Nec Corp キ―ワ―ドをメディア・オブジェクトに割り当てる方法、及び装置
JP2005107931A (ja) 2003-09-30 2005-04-21 Ricoh Co Ltd 画像検索装置
KR20080031928A (ko) * 2005-08-03 2008-04-11 윙크 테크놀로지스 인코포레이티드 태그를 분석하여 관련 문서를 찾기 위한 시스템 및 방법

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210115670A (ko) * 2020-03-16 2021-09-27 주식회사 한글과컴퓨터 문서에 삽입된 개체와 관련 키워드들의 매칭을 통해 문서로부터의 개체 검색을 지원하는 전자 장치 및 그 동작 방법
KR102375507B1 (ko) * 2020-03-16 2022-03-17 주식회사 한글과컴퓨터 문서에 삽입된 개체와 관련 키워드들의 매칭을 통해 문서로부터의 개체 검색을 지원하는 전자 장치 및 그 동작 방법

Similar Documents

Publication Publication Date Title
US9514417B2 (en) Cloud-based plagiarism detection system performing predicting based on classified feature vectors
JP7289047B2 (ja) ブロックに基づく文書メタデータの抽出のための方法、コンピュータ・プログラム及びシステム
US9412043B2 (en) Systems, methods, and computer program products for searching and sorting images by aesthetic quality
JP7201299B2 (ja) コグニティブな文書イメージのデジタル化のための方法、コンピュータ・プログラム及びシステム
US8838657B1 (en) Document fingerprints using block encoding of text
US9679050B2 (en) Method and apparatus for generating thumbnails
RU2656581C2 (ru) Редактирование содержимого электронного документа
US11550995B2 (en) Extracting structured data from handwritten and audio notes
US9760795B2 (en) Method and apparatus for extracting image feature
US8750571B2 (en) Methods of object search and recognition
KR20150047950A (ko) 특징 선택 방법을 이용한 비주얼 기술자 추출 방법 및 시스템
KR101279805B1 (ko) 자동 개체 배치 기반의 전자 문서 편집 장치 및 방법
US9020212B2 (en) Automatically determining a name of a person appearing in an image
KR101270958B1 (ko) 전자 문서 내 이미지 검색 장치 및 방법
US10891463B2 (en) Signature match system and method
CN109685079B (zh) 一种特征图像类别信息的生成方法和装置
KR101477642B1 (ko) 오프라인 노트를 이용한 전자책 서비스 방법
EP3985556A1 (en) Apparatus and method for document recognition
US10565289B2 (en) Layout reconstruction using spatial and grammatical constraints
KR101459410B1 (ko) 텍스트 자동 분할 입력 기반의 스프레드시트 구동 장치 및 방법
US11893817B2 (en) Method and system for generating document field predictions
CN105279172A (zh) 视频匹配方法和装置
US20230251764A1 (en) Enhanced accessibility user interface for space assignment on a floorplan
KR102442503B1 (ko) 스프레드시트에 존재하는 테이블에 대한 자동 셀 병합 기능을 제공하는 전자 장치 및 그 동작 방법
US20200372368A1 (en) Apparatus and method for semi-supervised learning

Legal Events

Date Code Title Description
A201 Request for examination
A302 Request for accelerated examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20160428

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20170508

Year of fee payment: 5